MOGENS ODDERSHEDE LARSEN. VIDEREGÅENDE STATISTIK med Excel

Størrelse: px
Starte visningen fra side:

Download "MOGENS ODDERSHEDE LARSEN. VIDEREGÅENDE STATISTIK med Excel"

Transkript

1 MOGENS ODDERSHEDE LARSEN VIDEREGÅENDE STATISTIK med Excel. udgave 004 i

2 FORORD Denne bog er en fortsættelse af lærebogen M. Oddershede Larsen : Statistiske grundbegreber. Det forudsættes, at man har rådighed over en lommeregner med programmer indbygget, der til givne data kan beregne gennemsnit og spredning. Det kan dog være en lettelse, hvis lommeregneren også har indbygget et regressionsprogram, der kan beregne regressionskoefficienter og korrelationskoefficient. Ved de mere regneteknisk komplicerede analyser som eksempelvis tosidet variansanalyse er det imidlertid langt lettere at benytte en PC med et passende statistisk software. Regnearkprogrammet Microsoft Excel er ikke udviklet med henblik på statistik, men har den fordel, at den findes på et stort antal PC-er. Notatet bygger derfor for visse kapitlers vedkommende på, at læseren har adgang til programmet Exell, og at man der har installeret tilføjelsesprogrammet Analysis Toolpak. Ved mere avancerede statistiske problemer kan det dog anbefales at købe et egentligt statistikprogram. Der findes særdeles mange udmærkede statistikprogrammer, som kan udføre disse analyser. Forfatteren har skrevet en udvidet version af dette notat (indeholder flere statistiske metoder), hvori der benyttes statistikprogrammet Statgraphics. Der er her i en række eksempler vist, hvorledes man kan udnytte et sådant software, og hvorledes udskrifter herfra kan tolkes. Specielt er de grafiske muligheder fremhævet. Juni 003 Mogens Oddershede Larsen I udgave er der udover en række mindre ændringer foretagt en ombytning af kapitlerne og. Februar 004 ii

3 Indhold INDHOLD 0 HYPOTESETESTNING (TO STATISTISKE VARIABLE) 0. Indledning Planlægning af forsøg Test og konfidensintervaller for normalfordelte variable Test og konfidensintervaller for binomialfordelte variable Test og konfidensintervaller - Poissonfordelte variable... 3 Opgaver... 4 ENKELT REGRESSIONSANALYSE. Indledning Valg af model, der bedst mulig beskriver de fundne data Lineær model Regressionslinie og regressionskoefficienter Bestemmelse af regressionslinie ved mindste kvadraters metode Vurdering af om model beskriver data godt....3 Statistisk analyse af lineær regressionsmodel Forudsætninger for regressionsanalyse Test af om Y er uafhængig af X Enkelt regressionsanalyse med én y - observation for hver x - værdi Analyse beregnet med lommeregner med regressionsprogram Analyse beregnet ved Excel Enkelt regressionsanalyse med flere y - observationer for hver x - værdi Analyse beregnet med lommeregner med regressionsprogram Analyse beregnet ved Excel Transformation af data inden regressionsanalyse foretages... 4 Opgaver iii

4 Indhold VARIANSANALYSE. Indledning Ensidet variansanalyse Ensidet variansanalyse beregnet på lommeregner Ensidet variansanalyse beregnet ved Excel Tosidet variansanalyse Indledning Planlægning af forsøg Én faktor ad gangen Fuldstændig faktorstruktur Forudsætninger for variansanalyse Testprocedure Tosidet variansanalyse udført med lommeregner Tosidet variansanalyse udført ved Excel Model med vekselvirkning Additiv model: Model uden vekselvirkning Fuldstændigt randomiseret blokforsøg Opgaver ANTALSTABELLER 3. Indledning En -vejs tabel To -vejs tabel Opgaver APPENDIX A: Statistik med Excel a. Generelle forhold... 8 a. Inddata... 8 a3. Beregning af (statistiske) funktioner... 8 a3. Normalfordeling... 8 a3. χ - fordeling iv a3.3 t - fordeling a3.4 F - fordeling a3.5 Hypergeometrisk fordeling a3.6 Binomialfordeling a3.7 Poissonfordeling... 84

5 Indhold a4. Beregning af gennemsnit og spredning af n tal a5. Beregning af histogram a6. Konfidensintervaller for normalfordelt variabel a6. 95% konfidensinterval for middelværdi af stikprøve, idet σ er kendt a6. 95% konfidensinterval for middelværdi af stikprøve, idet σ er ukendt a6.3 95% konfidensinterval for spredning af stikprøve, idet er uendt µ a7. Hypotesetest: kontinuert variabel a7.. : µ µ, σ kendt H 0 0 a7.. : µ µ, σ kendt H 0 0 a7.3. : µ = µ, σ kendt H 0 0 a7.4 H 0 : µ µ 0, σ er ukendt a7.5 H 0 : H 0 :σ σ, µ er ukendt a8. Sandsynlighedsregning a8. Beregn fakultet n! a8. Beregn kombination K(n,p) a9. Hypotesetest: kontinuerte variable a9.. H 0 :σ = σ a9.. σ = σ: H 0 : µ µ a9.3. σ σ: H 0 : µ µ a9.4. σ σ: H 0 : µ = µ a9.5.parvise observationer a0 Regressionsanalyse a0.. Korrelationskoefficient a Variansanalyse a.. Ensidet variansanalyse a.. Tosidet variansanalyse a Antalstabeller a.. En - vejs tabel a.. To - vejs tabel Oversigt over konfidensintervaller ( variable) Oversigt over test af middelværdier µ og µ for normalfordelte variable ( σ og σ kendte) Oversigt over test af middelværdier µ og µ for normalfordelte variable ( σ og σ ikke begge kendte) v

6 Indhold 0.4. Oversigt over test af varianser σ og σ for normalfordelte variable Oversigt over test af parametre p og p for binomialfordelte variable Oversigt over test af parametre µ og µ for Poissonfordelte variable Formler til beregning af enkelt regressionsanalyse med én y - værdi for hver x - værdi 99. Formler til beregn.af enkelt regressionsanalyse med flere y - værdier for hver x - værdi 0.3 Transformation til lineær model Formler til beregning af ensidet variansanalyse Formler til beregning af tosidet variansanayse test af hypotese om multinomiale sandsynligheder.... χ 3.. χ - test af hypotese i - vejs tabel.... STATISTISKE TABELLER TABEL Fordelingsfunktionen for U - fordelingen... 5 TABEL. Fraktiler i U - fordelingen... 7 TABEL 3. Fraktiler i χ - fordelingen... 8 TABEL 4. Fraktiler i t - fordelingen... 0 TABEL 5. 95% - fraktiler i F - fordelingen... TABEL 6. 97,5 % - fraktiler i F - fordelingen... TABEL 7. Dimensioneringstabel for variable... 3 FACITLISTE... 6 STIKORD vi

7 0. Planlægning af forsøg 0 HYPOTESETESTNING (TO STATISTISKE VARIABLE) 0. Indledning Afsnit 0, giver en kort beskrivelse af hvorledes forsøg bedst planlægges ud fra et statistisk synspunkt. Hertil anvendes bl.a. den i tabel 8 angivne dimensioneringsstabel. I afsnit 0.3 sammenlignes to normalfordelte variable, mens de variable i afsnit 0.4 og 0.5 forudsættes at være henholdsvis binomial - og Poisson - fordelte. I appendix findes en række oversigter over de forskellige test. De grundlæggende begreber vedrørende konfidensintervaller og hypotesetest for én statistisk variabel, blev beskrevet i Statistiske Grundbegreber. Da det er de samme begreber og analoge udledninger der anvendes, når det drejer sig om at sammenligne statistiske variable, vil de ikke blive gentaget her. 0. Planlægning af forsøg Vi vil i dette afsnit som udgangspunkt tage følgende eksempel. Eksempel 0.. Problemstilling. En fabrik der producerer maling, har udviklet to nye additiver A og A, som bevirker en kortere tørretid. Additiv A er det dyreste, men man forventer også, at det giver den korteste tørretid. På grund af prisforskellen, skal tørretiden dog være mindst 0 minutter kortere for A, før man vil gå over til den. For at undersøge disse forhold produceres nogle liter maling, som derefter deles op i mindre portioner. Til nogle af portionerne tilsættes additiv A og til andre additiv A. Tørretiden måles derefter. Generelt gælder, at hvert delforsøg i et forsøg udføres under en række forsøgsbetingelser, De betingelser som med forsæt varieres som led i forsøgets formål, kaldes forsøgsbehandlingerne eller blot behandlingerne (engelsk: treatment). Alle andre delforsøgsbetingelser sammenfattes i et begreb, der kaldes forsøgsenheden. I eksempel 0. er additiverne = behandlingerne og forsøgsenhederne er den enkelte portion maling, anvendt apparatur og personale, tidspunkt for delforsøget og de forhold med hensyn til temperatur, luftfugtighed osv. som gælder på forsøgstidspunktet. Bemærk, at forsøgsenhederne ofte indeholder faktorer, som ikke kan gøres ensartet fra delforsøg til delforsøg. Dette bevirker, at resultatet af de enkelte delforsøg varierer. Dette giver forsøgsvariablens variation eller kort forsøgets støj.

8 0. Hypotesetestning ( statistiske variable) Randomisering. For at sikre et statistisk gyldigt forsøg foretager man en såkaldt fuldstændig randomisering. Dette betyder at man ved lodtrækning fordeler forsøgsenhederne tilfældigt på behandlingerne. Dette sker, for at man ikke ubevidst kommer til at favorisere en af de to behandlinger. Hvis man eksempelvis helt systematisk i eksempel 0. først laver alle delforsøg med additiv A, kunne dette bevirke en favorisering af A nemlig hvis forsøgsomstændighederne (apparater, personale, luftfugtighed ) er mest gunstige ved begyndelsen af forsøgsperioden. For at anskueliggøre denne randomiseringsproces antager vi, at vi i eksempel 0. skal lave 4 forsøg med hver additiv. Endvidere antages, at forsøgene skal indgå i den almindelige produktionsgang, dvs. at man af tidsmæssige, personalemæssige og på grund af begrænset mængde apparatur må lade forsøgene forløbe over flere dage. Da dage apparatur og laborant kunne tænkes at have betydning lader vi dem indgå i forsøgsenhederne. I forsøgsenhederne indgår sandsynligvis også andre forhold udenfor vor kontrol, og som tilsammen bevirker, at selv om man udfører gentagne forsøg med samme behandling, så får vi afvigende resultater. Lad os antage at der gælder følgende: Mandag er det kun muligt at lave forsøg, idet apparatur nr og laborant A er de eneste der er ledige. Tirsdag er der kapacitet ledig til 3 forsøg: Ét forsøg hvor apparatur nr og laborant A benyttes Ét forsøg hvor apparatur nr og laborant B benyttes, og Ét forsøg hvor apparatur nr 3 og laborant C benyttes. Onsdag kan der også laves 3 forsøg osv. (se det følgende skema). Forsøgsenheder Behandlinger Dag Apparatur Laborant (apparater) mandag A tirsdag A tirsdag B tirsdag 3 C onsdag 3 B onsdag 4 C onsdag A torsdag 3 B Vi foretager nu randomiseringen som kort sagt er en form for lodtrækning. Sædvanligvis vil man benytte et program der kan generere tilfældige tal (mange lommeregnere har et sådant program). For at anskueliggøre randomiseringen vil vi mere primitivt foretage lodtrækningen på følgende måde. På 4 sedler skrives A, på andre 4 sedler skrives A. Hver seddel krølles sammen til en kugle og placeres i en dåse. Sedlerne blandes ved at dåsen rystes (se figur). Hvis den første seddel der udtrækkes er A så betyder det, at det delforsøg der mandag udføres med apparatur og laborant A skal anvende additiv A. Hvis den næste seddel der udtrækkes er A så betyder det, at det delforsøg der tirsdag udføres med apparatur og råvareleverance skal anvende additiv A osv. Resultaterne kunne eksempelvis være som angivet på følgende skema:

9 0. Planlægning af forsøg Forsøgsenheder Dag Apparatur Laborant Behandlinger (apparater) mandag A A tirsdag A A tirsdag B A tirsdag 3 C A onsdag 3 B A onsdag 4 C A onsdag A A torsdag 3 B A På denne måde sikrer man sig, at vi får et så vidt muligt "statistisk gyldigt" forsøg. Hvis vi derfor efter beregninger (som ses i de følgende kapitler ) konkluderer, at der er forskel på additiverne, så er det "korrekt", idet det ville være helt tilfældigt, hvis én af additiverne har været begunstiget med særlig gode forsøgsenheder. Herved har man også sikret sig, at de to stikprøver (variable) er statistisk uafhængige. Forsøg bør udføres, så alle behandlinger får lige mange gentagelser. Ved planlægningen af forsøget er det ganske klart, at hvis man eksempelvis har ressourcer til at lave 0 delforsøg, så ville det være en meget dårlig plan, hvis man lavede 8 delforsøg med A og kun delforsøg med A. Der bør i naturligvis tilstræbes at lave 0 delforsøg med hver behandling. Forsøg kan mislykkes, så målet i praksis ikke bliver opfyldt, og i sådanne tilfælde kan de i de følgende kapitler anførte statistiske analyser stadig gennemføres. Resultaterne bliver dog mere usikre, og beregningerne mere komplicerede og vil i visse tilfælde ikke blive anført i dette notat. I stedet antages et statistikprogram benyttet. Dimensionering Analogt med forklaringen i Statistiske Grundbegreber side 57 kan man under visse forudsætninger beregne hvor mange gentagelser (portioner) der skal anvendes for hver behandling, hvis P( fejl af type I) α og P( fejl af type II) β. Man skal naturligvis angive en bagatelgrænse, men desuden kræver beregningerne, at spredningerne ved de to behandlinger er (tilnærmelsesvis) ens, og at man kan give et nogenlunde realistisk skøn for denne fælles spredning σ. Det er naturligvis en svaghed ved dimensioneringen, at man inden forsøget er udført skal give et sådant skøn. En vurdering heraf kunne baseres på erfaringer fra tilsvarende forsøg. Findes sådanne erfaringer ikke kunne man først at lave nogle få forsøg og derfra få et rimeligt gæt på spredningen σ. At spredningerne er nogenlunde ens vil i praksis ofte være tilfældet, da forsøgsenhederne jo er valgt ved randomisering. Når forsøget så er lavet, kan man (lidt sent) se, om man har skønnet rigtigt. Dimensioneringen skal jo bevirke, at man laver det rigtige antal gentagelser. Man kan fristes til at tro, at jo flere gentagelser jo bedre. Dette er imidlertid jo ikke tilfældet, idet man med for mange gentagelser kan risikere at opdage så små forskelle, at de ikke har praktisk betydning, og så er de mange forsøg jo spild af arbejdskraft og penge. Formler for dimensionering af variable findes i appendix 0. og 0.3, en tabel til dimensionering findes i tabel 7. 3

10 0. Hypotesetestning ( statistiske variable) Eksempel 0.. (fortsættelse af eksempel 0.) Dimensionering. a) Hvor mange portioner skal anvendes ved forsøget, hvis man ønsker, at P( fejl af type I ) = α 005., P( fejl af type II ) = β 00. og bagatelgrænsen =0 minutter, idet man fra mange tilsvarende forsøg ved, σ at den fælles spredning er = 5 minutter. b) Samme spørgsmål og krav som i spørgsmål a), men nu antages, at man ikke kender spredningen, men ud fra nogle få delforsøg skønner, at den er ca. 5 minutter. c) Samme spørgsmål og krav som i spørgsmål b), men nu antages P(fejl af type I) = α 0.0. LØSNING: a) Af oversigt appendix 0. fås u + u u + u + α β n = = = 38, σ 5 5 dvs. der skal udføres i alt n = 39 delforsøg af hver behandling b) Af tabel 7 fås idet, at det største tal mindre end 0.67 fås for σ 3 = 067. n Test og konfidensintervaller for normalfordelte variable. Lad os igen betragte det i eksempel 0. og 0. angivne forsøg. For hver af de additiver udføres en række delforsøg. Forsøgsresultaterne kan generelt skrives: For additiv A : Statistisk variabel X. Stikprøve : x, x, x 3,... x n. For additiv A : Statistisk variabel X. Stikprøve : x, x, x 3,... x n. Vi antager, at X og X er statistisk uafhængige normalfordelte variable med henholdsvis middelværdierne µ og µ og spredningerne σ og σ. Sædvanligvis vil både middelværdier og spredninger ikke være kendt eksakt, og må derfor estimeres ud fra forsøgsresultaterne. Generelt er man interesseret i at teste nulhypotesen H0:µ = µ + d, hvor d er en given konstant (sædvanligvis 0) Denne omskrives til H0:µ µ d = 0. Testproceduren er nu baseret på fordelingen af differensen X X d. Ifølge additionssætningen (se eventuelt Statistiske Grundbegreber side 34) er X X d normalfordelt og fra regnereglerne fås σ σ V( X X d) = V( X) + V( X) = + n n ( ) ( ) ( ) E X X d = E X E X = µ µ. Heraf følger, at hvis spredningerne er kendt (eksakt), vil U X X d = være normeret normalfor- σ σ + n n delt, og på sædvanlig måde kunne anvendes til test af nulhypotesen. og 4

11 0.3 Test og konfidensintervaller for normalfordelte variable Er spredningerne ikke kendt, vil det være naturligt at betragte teststørrelsen X X d. (0.) s s + n n Denne er imidlertid ikke normalfordelt. Man kan så benytte benytte Satterthwaite s approksimation som angivet i appendix 0-3. Har de to variable samme spredning, vil teststørrelsen (0.) være t - fordelt. Denne har større styrke end Satterwaite s approksimation, og må derfor foretrækkes. Er stikprøvestørrelserne store (over 30) er teststørrelsen (0.) med god tilnærmelse normalfordelt, og det er da ikke nødvendigt at foretage en indledende testning af, om spredningerne er ens eller forskellige. Testning af H0:µ = µ + d foretages derfor i følgende rækkefølge: ) Er stikprøvestørrelserne 30 foretages en U - test (jævnfør eksempel 0.3 og appendix 0.) ) Er stikprøvestørrelserne < 30 undersøges først om varianserne er ens (selvom det egentlige formål er at undersøge forskelle i middelværdier) Man opstiller nulhypotesen H 0 :σ = σ mod den alternative hypotese H:σ σ. = Testen bygger på, at størrelsen F s er F - fordelt (jævnfør appendix 0.4) s Får man en accept af nulhypotesen, har man naturligvis ikke hermed vist at varianserne er ens, men da testen er robust overfor mindre forskelle i varianserne, blot vi har samme antal gentagelser, er det tilladeligt i den følgende test af middelværdierne at antage dette. a) Accepteres nulhypotesen H 0 :σ = σ, beregner man et estimat for den fælles varians som et vægtet gennemsnit s 0 af de to estimater for varianserne s og s. Disse vægtes i ( n ) s + ( n ) s forhold til frihedsgraderne, dvs. s0 =. Frihedsgradstallet for n + n s 0 er f = n + n. Man siger man har foretaget en pooling af de to estimater. 0 X X d Man tester nu nulhypotesen H 0 : µ = µ på basis af teststørrelsen t = som s0 + n n er t - fordelt med frihedsgrader (jævnfør eksempel 0.4 og appendix 0.3). f 0 b) Forkastes nulhypotesen H 0 :σ = σ, benyttes Satterthwaite s approksimation (jævnfør eksempel 0.5 og appendix 0-3). Hvis spredningerne kan antages ens kan man foretage en dimensionering, dvs. vælge antal gentagelser n, så P(fejl af type II) holdes under β. Hvorledes dette kan gøres er beskrevet i eksempel 0.. En test har større styrke end en anden, hvis den med givne data og et givet signifikansniveau giver den største chance for at forkaste nulhypotesen. 5

12 0. Hypotesetestning ( statistiske variable) De følgende 3 eksempler belyser disse 3 situationer. Eksempel 0.3. Store stikprøvestørrelser ( 30 ) (fortsættelse af eksempel 0.). På basis af resultatet i eksempel 0. udførte man 40 delforsøg af hver behandling. Efter at forsøgsrækken var afsluttet, opdagede man, at et af forsøgene var mislykket og måtte kasseres. Der var følgelig kun 39 delforsøg med additiv A. Man fik følgende resultater (i minutter) A 7,0 30,7 7,4 4,4 06,8 5,7 6,5 86,7 4,7 7,9 03,0 33,4 03,6 4,4 3,0 30, 0,5 9,4 7, 5,6 6,5 94,0,7 06,0 4,0 35, 4, 07,9 3,4 6, 3,9 3,4 5,6 8,0 0,6 97, 4,4 34, 5,7 A 6,7, 33,7 08,9,6 57,6 4, 4,9 0,6 4, 58,6 36,9 7,4 7,5 38,9,7 0,5 33,,4 43,0 35,6 35,4 36,8,4 6, 35,7 8,, 3,7 07,0 38,,6 3, 57,3 6,5 30, 6,0 38,6 38,5 06,5 ) Kan man ud fra disse data bevise på mindst signifikansniveau α = 0.05, at malingen med additivet A tilsat har en mindre middeltørretid end konkurrentens? ) Hvad vil du anbefale virksomheden at gøre, når man også tager det økonomiske (bagatelgrænsen) i betragtning. LØSNING: ) X = tørringstiden for maling tilsat additiv A. X = tørringstiden for maling tilsat additiv A. X og X antages at være uafhængige normalfordelte variable, med henholdsvis middelværdierne µ og µ og spredningerne σ og σ. Nulhypotese H 0 :µ µ Alternativ hypotese: H:µ < µ Vi finder ud fra stikprøverne, at x = 8., 6 s = 3. og x = 9., s = 4.. Da stikprøvestørrelserne er over 30 anvendes en U-test (se eventuelt appendix 0.). x x u = s + n s n = = 357. Da - u = > (eller P-værdi = PU ( < 357. ) = Φ ( 357. ) = 0, < 0.00 forkastes nulhypotesen (3-stjernet) dvs. der er et stærkt statistisk bevis for at additiv A i middel har en kortere tørringstid end additiv A. ) Et 95% konfidensinterval for differensen er (se eventuelt appendix 0. nummer ) s s x x u ±. + =.. ±. + = 0. 6 ± 58. n n Konfidensintervallet er 6. 43; [ ] Da bagatelgrænsen er 0, og differensen kun er 0.6, således at næsten 50% af konfidensintervallet ligger under 0, kan det ikke anbefales at gå over til det mere kostbare additiv. Bemærk, at dimensioneringen reelt kun har betydning i en acceptsituation, hvor man så med stor sikkerhed kan konkludere, at muligvis giver additiv A en kortere størkningstid, men ikke så meget kortere, at det har praktisk betydning. Excel løsning: Man foretager analysen på samme måde, som det vises i de følgende eksempler. 6

13 0.3 Test og konfidensintervaller for normalfordelte variable Som det fremgår af det følgende eksempel er det overkommeligt ved hjælp af en lommeregner at foretage de nødvendige test i tilfældet, hvor der er samme spredning. Excel kan dog også udføre disse test. Eksempel 0.4. Små stikprøvestørrelser (< 30), accept af ens spredning. To katalysatorers indflydelse på udbyttet ved en kemisk proces skal undersøges. Den ene katalysator K er billigere end den anden katalysator K, så hvis K ikke i middel giver et udbytte, som er mindst enheder større end det udbytte K giver, vil vi vælge katalysator K. Da forsøgene er både tidskrævende og kostbare, har man kun afsat midler til 8 forsøg med hver katalysator. Resultaterne blev: K K ) Undersøg på basis af disse resultater, om det på et signifikansniveau på 5% kan påvises at K giver et udbytte der er enheder større end K ) Angiv endvidere et 95% konfidensinterval for differensen mellem de to middeludbytter. LØSNING: ) Lad X = udbyttet ved anvendelse af katalysator K og X = udbyttet ved anvendelse af katalysator K. X og X antages approksimativt normalfordelte med middelværdi og spredning henholdsvis µ, σ og µ, σ. Ved indtastning af forsøgsresultaterne i lommeregneren fås de tilsvarende estimater x = , s =. 387 og x = 94., s = 33.. H 0 :σ σ a) Først testes om varianserne er ens, dvs. = mod den alternative hypotese H:σ σ. Vi anvender formlen i appendix 0.4 storrække : s 33. Teststørrelsen F = = = 8., er F - fordelt F( f, f) = F( 77, ). s. 387 (Bemærk: Vælg tæller og nævner i F, så brøken bliver større end, så skal kun vurderes opad ). Ved opslag i tabel 6 findes F ( 77, ) = Da.8 < 4.99 ( eller P - værdi = P (X >.8) = 0.3 > 0.05) accepteres nulhypotesen, dvs. vi vil i den følgende test antage, at spredningerne er ens. Et estimat for den fælles spredning er ( n s n s ) + ( ) ( 8 ) ( 8 ) 33. s0 = = = 80. med f 0 = 4 n + n 4 b) Vi tester nu om udbyttet ved katalysator K er større end ved katalysator K, hvilket betyder, at vi opstiller nulhypotesen H 0 :µ µ + mod den alternative hypotese H:µ > µ +. x x Af appendix 0.3 fås teststørrelsen t = = = s n n 8 8 Da t = 88. > t095. ( 4) = 76. ( eller P - værdi = P(X >.88) = 0.04 < 0.05) forkastes nulhy- potesen, dvs. vi har et (svagt) statistisk bevis for at K giver et udbytte der er enheder større end K (vi er dog tæt på en accept). 7

14 0. Hypotesetestning ( statistiske variable) Excell løsning: I appendix A afsnit a9 ses, hvilke ordrer der er nødvendige. a) Først testes om varianserne er ens, dvs. H 0 :σ = σ mod den alternative hypotese H 0 :σ σ. Lad stikprøveværdierne for K og K stå i to søjler eksemplevis i cellerne A til A8 og B til B8 Inddata: 86,4 93,65 9,9 9,97 86,7 97,96 88,99 94,0 9,59 9,56 89,38 9,85 9,4 99,99 88,7 90,99 Test af nulhypotese H 0 : µ µ + (samme spredning) Indtast data fra eksempel 0.4. K's værdier placeres i cellerne A - A8. K's værdier placeres i cellerne B - B8 ) Først testes om spredningerne er ens: H 0 :σ = σ : Metode : P - værdi = FTEST(A:A8;B:B8) = Da 0.45 > 0.05 accepteres H 0. Metode : Vælg Funktioner, Dataanalyse, F-test: Dobbelt stikprøve for varians Den fremkomne tabel udfyldes: Område for variabel ": A:A8 Område for variabel ": B:B8 Outputområde : Skriv cellenummer for øverste venstre celle i det ønskede outputområde. Udskrift: F-test: Dobbelt stikprøve for varians Variabel Variabel Middelværdi 89, ,5 Varians 5, ,3305 Observationer 8 8 fg 7 7 F 0,550 P(F<=f) en-halet 0,570 H 0 accepteres, da P-værdi=0.57 < 0.05 F-kritisk en-halet 0,64058 ) Nu testes σ = σ: H 0 : µ µ + Metode : P - værdi = TTEST(B:B8;A:A8 + ;;) = 0,04034 Da < 0.05 forkastes H 0 Metode : Vælg Funktioner, Dataanalyse, t-test: to stikprøver med ens varians Den fremkomne tabel udfyldes: Område for variabel ": B:B0 Område for variabel ": A:A8 Hypotese for forskel i middelværdi : Outputområde : Skriv cellenummer for øverste venstre celle i det ønskede outputområde. Udskrift: 8

15 0.3 Test og konfidensintervaller for normalfordelte variable t-test: To stikprøver med ens varians Variabel Variabel Middelværdi 94,5 89,4575 Varians 0,3305 5, Observationer 8 8 Puljevarians 8,007 Hypotese for forskel i middelværdi fg 4 t-stat,883 P(T<=t) en-halet 0,04034 H 0 forkastes, da P- værdi= < 0.05 t-kritisk en-halet,76309 P(T<=t) to-halet 0,08068 t-kritisk to-halet,44789 Det ses, at vi får de samme resultater og konklusion som før. ) Et 95% konfidensinterval for differensen er (se eventuelt appendix oversigt 0. nummer ) x x ± t0. 975( 4) s + = ± = ± n n 8 8 [ ] Konfidensintervallet er 63. ; 77.. At konfidensintervallet indeholder skyldes, at ved ensidede test er et 95% konfidensinterval for differensen også ensidet [ g ; [ hvor den nedre grænse g er bestemt ved: g = x x t s = ( 4) + = = n n 8 8 dvs. differensen er større end.8. Excell kan ikke umiddelbart beregne konfidensintervallet, men man må opskrive formlen for konfidensradius r. Forudsættes varianserne i forrige skem placeret i P6 og Q6 osv. fås radius af formlen r = ((P6*(P7-)+Q6*(Q7-))/(P6+Q6-))^(0,5)*(/P7+/P8)^(0,5)*TINV(0,05;4) Hvis der er stor forskel på stikprøvestørrelserne, er det meget vigtigt for anvendelsen af ovenstående test, at forudsætningen om, at varianserne er ens er holdbar. Til gengæld er det også i sådanne tilfælde, man virkelig ser den store forbedring ved at benytte t - testen fremfor Satterthwaite s approksimation. Eksempel 0.5. Små stikprøvestørrelser (< 30), forskellig spredning. Lad os antage, at vi har samme problemstilling som i eksempel 0.4, men at vi denne gang anvender to andre katalysatorer A og B. Der planlægges med 0 delforsøg men desværre mislykkedes to af forsøgene med katalysator A, så der ikke er lige mange gentagelser. Vi får følgende resultater: A B Undersøg på basis af disse resultater, om det på et signifikansniveau på 5% kan påvises, at B giver et udbytte der er enheder større end A. 9

16 0. Hypotesetestning ( statistiske variable) LØSNING: ) Lad X A = udbyttet ved anvendelse af katalysator A og X B = udbyttet ved anvendelse af katalysator B. X A og X B antages approksimativt normalfordelte med middelværdi og spredning henholdsvis µ A, σ A og µ B, σ B. Ved indtastning af forsøgsresultaterne i lommeregneren eller i Exell fås de tilsvarende estimater x = , s = og x = , s = 695. A A B B a) Først testes om varianserne er ens, dvs. H mod den alternative hypotese. 0:σ A = σb H:σ A σ B s A Af appendix 0.4 storrække fås, at teststørrelsen F = = = , er F - fordelt s 695. F( f A, fb) = F( 79, ) (bemærk, at vi igen sørger for, at brøken bliver større end ) Idet F ( 79, ) = 48. ( eller P - værdi = P (X >7.938) =0,0030 < 0.05) forkastes nulhypotesen, dvs. vi kan ikke tillade os at antage, at spredningerne er ens. b) Vi tester nu om udbyttet ved katalysator B er større end ved katalysator A, hvilket betyder, at vi opstiller nulhypotesen H0: µ B µ A + mod den alternative hypotese H: µ B > µ A +. Af appendix 0.3 fås teststørrelsen t = x B s n x A = A B.. A s + n B B = 857. Frihedsgradstallet f beregnes ved Satterthwaite s metode som det nærmeste hele tal, som er større s s A B n A n + B 8 0 end g = = = s A s B n A n B n n 8 0 Da A B t = 86. < t ( 8) = 86. (eller P - værdi = 0.7 > 0.05), accepteres nulhypotesen Vi kan ikke på dette grundlag vise, at udbyttet ved katalysator B er større end ved katalysator A. Excel løsning: På grund af de omfattende regninger kan det her anbefales at benytte et statistikprogram : a) Test af om varianserne er ens: :σ σ mod den alternative hypotese :σ σ. H0 A B = H A B F-test: Dobbelt stikprøve for varians Variabel Variabel Middelværdi 83, ,693 Varians,73936, Observationer 8 0 fg 7 9 F 7,9385 P(F<=f) en-halet 0,0030 H 0 accepteres, da P-værdi=0.003 < 0.05 F-kritisk en-halet 3,974 b)vi tester nu om udbyttet ved katalysator B er enheder større end ved katalysator A. 0

17 0.4 Test og konfidensintervaller for binomialfordelte variable t-test: To stikprøøver med forskellig varians Variabel Variabel Middelvæærdi 87,693 83,4875 Varians,864579,73936 Observationer 0 8 Hypotese for forskel i middelvæærdi fg 8 t-stat,8573 P(T<=t) en-halet 0,754 H 0 accepteres, da P-værdi=0.57 < 0.05 t-kritisk en-halet, P(T<=t) to-halet 0,34508 t-kritisk to-halet, Det ses, at vi får de samme resultat som ved benyttelse af tabel. 0.4 Test og konfidensintervaller for binomialfordelte variable. Som nævnt i bind kan man ofte approksimere en binomialfordeling med en normalfordeling. Det er en sådan approksimation, som formlerne i appendix 0.5 bygger på. I praksis vil disse forudsætninger for approksimation sædvanligvis være opfyldt. Vi belyser anvendelsen af oversigten ved følgende eksempel. Eksempel 0.6. Binomialfordelingstest. Ved et forsøg der skulle afgøre om C - vitamin har en forebyggende virkning mod forkølelse, fik halvdelen af en gruppe på 80 franske skiløbere C - vitamin mens de øvrige fik kalktabletter (placebobehandling). Fordelingen skete randomiseret, og forsøgspersonerne var uvidende om gruppeinddeling og hvilket medikament de fik. Efter en passende tid optaltes hvor mange af forsøgspersonerne der var forkølede. Resultaterne kan ses af følgende skema: Forkølet Ikke forkølet Total C-vitamin 7 39 Kalktabletter Bemærk, at en enkelt forsøgsperson gled ud af forsøget, så grupperne blev ikke helt lige store. ) Kan det på et signifikansniveau på 5% vises, at C - vitamin har en forebyggende virkning? ) I bekræftende fald angiv er 95% konfidensinterval for differensen mellem parametrene.

18 0. Hypotesetestning ( statistiske variable) LØSNING: X = antal forkølede personer der har fået C-vitamin. X er binomialfordelt b(39, p ). X = antal forkølede personer der har fået Kalktabletter. X er binomialfordelt b(40, p ). Da vi ønsker at vise, at p < pbliver nulhypotesen H0: p pmod den alternative hypotese Hp : < p. Appendix 0.5 storrække anvendes : ~ x p 7, og. = = ~ x p 3 = = ~ x p + x = = = n 39 n 40 n + n Da n ~ p = = 39. [ 539 ; 5] og n ~ p = = 4. [ 540 ; 5] er forudsætningerne for at approksimere med normalfordelingen opfyldt. Vi finder af formel () 7 3 ~ p ~ p u = = = = 93. ~ p ( ~ p ) + + n n Da u 095 = 645 <.93 < u 099 = 36 (eller P - værdi = Φ( 93. ) = ) forkastes.... nulhypotesen ( enstjernet ), dvs. der er på signifikansniveau 5% vist, at C-vitamin har en vis forebyggende virkning mod forkølelse, Et 95% konfidensinterval for differensen p per ifølge appendix 0. række 8: ~ ~ ~ p ( ~ ) ~ ( ~ ) ~ ~ ~ ( ~ ) ~ ( ~ p p p p p p p ) p p u α + p p p p + u α + n n n n ( 0. ) 0. 3( 0. 3) 0. ( 0. ) 0. 3( 0. 3) + p p p p p p Excell har ikke direkte nogle programmer til beregningerne, så eneste mulighed er at beregne direkte ud fra formlerne.

19 0.5 Test og konfidensintervaller for Poissonfordelte variable 0.5 Test og konfidensintervaller for Poissonfordelte variable. Som nævnt i bind kan man ofte approksimere en Poisonfordeling med en normalfordeling. Det er en sådan approksimation, som formlerne i appendix 0.6 bygger på. I praksis vil disse forudsætninger for approksimation sædvanligvis være opfyldt. Vi belyser anvendelsen af oversigten ved følgende eksempel. Eksempel 0.7. Poissonfordelingstest. En bestemt type TV-apparat produceres på fabrikker A og B. Man har mistanke om, at der er forskel på antallet af loddefejl der findes i apparater fra de to fabrikker. For at teste dette, udtages af den løbende produktion stikprøver på 5 TV-apparater, og man optalte antallet af loddefejl i de 5 apparater. Resultaterne blev: Fabrik A: På 0 apparater fandtes i alt loddefejl Fabrik B: På 9 apparater fandtes i alt 7 loddefejl (et apparat måtte udskydes) Test på dette grundlag, om der er forskel på fejlintensiteten på de to fabrikker. LØSNING X = antal loddefejl pr. apparat på fabrik A. X antages Poissonfordelt p( µ ). X = antal loddefejl pr. apparat på fabrik B. X antages Poissonfordelt p( µ ). Da vi ønsker at vise, at µ µ bliver nulhypotesen :µ = µ mod den alternative hypotese H:µ µ. H 0 Appendix 0.6 storrække 3 anvendes : x x 7 x + x x,, og. = = x = = x = = = n 0 n 9 n + n Da n x = 0 9 = og n x = 9 9 = er forudsætningerne for at approksimere med normalfordelingen opfyldt. 7 Vi finder : x x u = = = = x + + n n Da u = 036. < u = 960. (eller P-værdi = PX ( > 036. ) = Φ ( 036. ) = 050. > 0. 05) ) accepteres nulhypotesen, dvs. man kan ikke på det grundlag vise, at der er forskel på fejlintensiteten på de to fabrikker, Excell har ikke direkte nogle programmer til beregningerne, så eneste mulighed er at beregne direkte ud fra formlerne. 3

20 0. Hypotesetestning ( statistiske variable) OPGAVER Opgave 0. T Det påstås at modstanden i en tråd af type A er større end modstanden i en tråd af type B. Til afklaring af denne påstand udtages ved et fuldstændigt randomiseret forsøg tilfældigt n tråde af hver type og deres modstande måles. Find det mindste antal n ) hvis man ønsker at P( fejl af type I ) = α 005., P( fejl af type II ) = β 005. og bagatelgrænsen er σ = 0. ohm, og man ved, at spredningen = 0. ohm. ) hvis man ønsker at P( fejl af type I ) = α 005., P( fejl af type II ) = β 005. og bagatelgrænsen er = 0. ohm, og man har en forhåndsformodning om, at spredningen er ca. =0. ohm. 3) Hvilke konklusioner vedrørende behandlingernes virkning kan gøres, såfremt man ved testning af forsøgsresultaterne finder a) signifikans b) ingen signifikans 4) Hvilke yderligere analyser af forsøgsresultaterne bør foretages, såfremt testningen a) viser signifikans b) ikke viser signifikans. Opgave 0. I et forsøg ønsker man at sammenligne udbyttet ved benyttelse af reaktortyper. Man ønsker at kunne påvise eventuelle forskelle i middeludbytte ned til ca. = 6.0. Find den mindste værdi af n = antal delforsøg med hver reaktortype, for hvilken P( fejl af type I ) = α 005., P( fejl af type II ) = β 00.. Man kender ikke spredningen eksakt, men mener, den højst er ca 7 enheder. Opgave 0.3 T Et levnedsmiddelfirma havde udviklet en diæt, som har lavt indhold af fedt, kulhydrater og kolesterol. Diæten er udviklet med henblik på patienter med hjerteproblemer, men firmaet ønsker nu at undersøge diætens virkning på folk med vægtproblemer. To stikprøver på hver 00 personer med vægtproblemer blev udtaget tilfældigt. Gruppe A fik den nye diæt, mens gruppe B fik den diæt, man normalt gav. For hver person blev registreret størrelsen af vægttabet i en 3 ugers periode. Man fandt følgende værdier for gennemsnit og spredning: Gruppe A: x A = 93. kg, s A = 467. Gruppe B: x B = 740. kg, s B = ) Undersøg om vægttabet for gruppe A er signifikant større end for gruppe B. Signifikansniveau α = 5%. ) Beregn et 95% konfidensinterval for differensen mellem de to gruppers middelværdier. Opgave 0.4 På et laboratorium undersøgtes filtreringstiden for en opløsning af et bestemt gødningsstof ved benyttelsen af to forskellige filtertyper (F ) og (F ). Følgende stikprøveværdier observeredes: (F ) (F ) Det antages, at filtrerinqstiderne X og X er normalfordelte n( µ, σ) og n( µ, σ) l) Test, om det kan antages, at σ = σ. ) Test under hensyntagen til det i l) fundne, om det kan antages, at µ = µ. σ 3) Opstil et 95% -konfidensinterval for: a) µ µ, b). σ σ 4

21 Opgaver til kapitel 0 Opgave 0.5 T Det påstås at modstanden i en tråd af type A er større end modstanden i en tråd af type B. Til afklaring af denne påstand udtages tilfældigt 6 tråde af hver type og deres modstande måles. Følgende resultater fandtes: Modstand i tråd A (i ohm) Modstand i tråd B (i ohm) Hvilke konklusioner kan drages med hensyn til påstanden? Opgave 0.6 I et laboratorium foretoges 5 uafhængige bestemmelser af furfurols kogepunkt, idet 8 af bestemmelserne foretoges af én kemiingeniør, de resterende bestemmelser af en anden kemiingeniør. Resultaterne var ( 0 C ) :. ingeniør ingeniør Undersøg, om de to ingeniørers resultater i middel er ens. Opgave 0.7 Med henblik på at sammenligne de farmakologiske virkninger af stofferne morphin og nalbuphin foretoges et fuldstændigt randomiseret forsøg, hvorved man på 0 forsøgspersoner målte ændringen i pupildiameter (millimeter) efter indsprøjtning af en standarddosis af en opløsning af morphin (M) eller nalbuphin (N). Forsøgsplan og forsøgsresultater var: M:.0 N: 0.0 M:.9 M:.0 N: 0.8 M: 0.8 M:0. N: N : 0.4 N: 0. Analyser forsøgsresultaterne og opstil et 95%-konfidensinterval for differensen µ ( M) µ ( N) mellem de to middelværdier. Opgave 0.8 En produktion af plastikvarer må omlægges på grund af bestemmelser i en ny miljølov. Ved den fremtidige produktion kan inden for miljølovens rammer vælges mellem pro- duktionsmetoder I og II. Metode I er den dyreste, og fabrikanten har regnet ud, at det (kun) kan betale sig at benytte metode I, såfremt den giver et middeludbytte, som er mindst 0 måleenheder (udbytteprocenter) større end udbyttet ved benyttelse af metode II. Ved et fuldstændigt randomiseret forsøg fandtes følgende måleresultater: Metode I Metode II Fabrikanten valgte herefter at benytte metode I. Foretag en undersøgelse af, om valget var statistisk velmotiveret. Opstil et 95% - konfidensinterval for differensen mellem middeludbytterne ved benyttelse af metoderne l og II. 5

22 0. Hypotesetestning ( statistiske variable) Opgave 0.9 T To sjællandske fabrikker producerer begge en bestemt type kvægfoder, for hvilken det ønskes, at proteinindholdet i færdigvaren skal være 6%. På de fabrikkers driftslaboratorier foretoges følgende målinger af proteinindholdet i en uges produktion: Fabrik Fabrik Foretag en statistisk vurdering af, om de to produktioner kan antages i middel at give kvægfoder med samme proteinindhold. Opgave 0.0 Måling af intelligenskvotient på 6 tilfældigt udvalgte studerende ved en diplom-retning (med mere end 00 studerende) viste et gennemsnit på = 07 og en empirisk varians på =00, medens en x s tilsvarende måling på 4 tilfældigt udvalgte studerende fra en anden diplomretning viste et gennemsnit på = og en empirisk varians på = 64. x s Tyder disse tal på en forskel på studentermaterialet på de to retninger? Opgave 0. l) 00 studerende, 5 piger og 48 drenge, indstillede sig til en prøve, ved hvilken 39 piger og 7 drenge bestod. Undersøg. om det anførte tyder på, at resultatet ved den pågældende prøve afhænger af deltagerens køn. ) Det oplyses supplerende, at pigerne ved ovennævnte prøve opnåede et gennemsnit på 64% med en empirisk spredning på 0%, medens drengenes gennemsnit var 59% med en empirisk spredning på 8%. Undersøg, om det anførte kan tages som vidnesbyrd om, at piger i almindelighed klarer sig bedre end drenge ved den omhandlede prøve. Opgave 0. T To sjællandske fabrikker producerer begge en bestemt type kvægfoder, for hvilken det ønskes, at proteinindholdet i færdigvaren skal være 6%. For den omhandlede produktion er der fastsat en øvre og en nedre tolerancegrænse for proteinindholdet. Partier med et proteinindhold uden for toleranceintervallet klassificeres som "dumpere". I en 3-måneders periode havde fabrik af en produktion på 60 foderstofpartier 5 dumpere, medens fabrik af en produktion på 00 foderstofpartier havde dumpere. Kan det heraf statistisk konkluderes, at dumpeprocenten i middel har været størst for fabrik? 6

23 Opgaver til kapitel 0 Opgave 0.3 To virksomheder A og B fremstiller dåser med nominelt 00 g rejeost. 0 tilfældigt udtagne dåser fra A's produktion og 0 tilfældigt udtagne dåser fra B's produktion viste føgende resultater: Virksomhed A B Totalt antal rejer 8 6 Gennemsnittet x af nettoindhold 0. g 98.3 g Empirisk spredning s af nettoinshold.0 g.7 g ) Test, om det gennemsnitlige antal rejer pr. dåse kan antages at være det samme for virksomhedernes produktion. ) Test, om det gennemsnitlige nettoindhold i en dåse kan antages at være det samme for virksomhedernes produktion. Opgave 0.4 ) Mange forbrugere tror, at såkaldte "mandagsbiler", dvs. biler produceret om mandagen, har flere alvorlige fejl end biler produceret på ugens øvrige arbejdsdage. For at undersøge, om der er noget grundlag for denne tro, udtog man på en bilfabrik tilfældigt 00 "mandagsbiler" og undersøgte dem for fejl. Man fandt at 8 biler havde alvorlige fejl. Tilsvarende udtog man tilfældigt 00 biler, der var produceret på ugens øvrige arbejdsdage, og man fandt biler, der havde alvorlige fejl. Giver denne undersøgelse støtte til formodningen om, at "mandagsbiler" er af dårligere kvalitet end andre biler. ) De 00 ovennævnte "mandagsbiler" havde i alt 030 konstaterede større eller mindre enkeltfejl, medens de 00 ovennævnte andre biler i alt havde 899 konstaterede fejl. Tyder dette på, at der er forskel i fejlintensiteten på bilerne i de to grupper? Opgave 0.5 Ved en undersøgelse af en eventuel sammenhæng mellem luftforurening og forekomsten af lungecancer sammenlignedes bl.a. sygdommens forekomst i byen X - købing inden for den gamle bygrænse (i nærheden af byens industrivirksomheder) med dens forekomst i samme bys forstadsområde (villakvarter): Antal tilfælde af lungecancer Samlet indbyggerantal Indre by Forstadsområde ) Det ses. at den relative hyppighed af cancertilfælde i den indre by afviger fra den relative hyppighed i forstadsområdet. Kan dette forklares som et tilfældigt udsving? Den opstillede nulhypotese. som testes, ønskes specificeret med angivelse af den alternative hypotese. ) Diskuter muligheden for at drage årsagsmæssige konklusioner ud fra det fundne testresultat. 7

24 . Regressionsanalyse ENKELT REGRESSIONSANALYSE. Indledning I dette kapitel betragtes forsøg, hvor man har målt sammenhørende værdier af to variable x og y. Det følgende eksempel demonstrerer et sådant tilfælde. Eksempel. I et spinderi udtrykkes garnets kvalitet bl.a. ved en norm for den forventede trækstyrke. Kvaliteten anses således for at være i orden, hvis middeltrækstyrken mindst er lig med 0 måleenheder (me). Ved uldgarn opfylder garnets naturlige trækstyrke ikke det nævnte kvalitetskrav, hvorfor der tilsættes en vis mængde kunstfibre, hvilket forøger trækstyrken. Herved sker der dog det, at andre kvalitetsegenskaber, såsom elasticitet og isoleringsevne, forringes. Man har eksperimenteret med forskellige tilsatte mængder kunstfibre x og registreret garnets trækstyrke y ved disse forskellige mængder. Herved fremkom følgende observationsmateriale: Mængde x (i gram) af kunstfibre pr kg uld Trækstyrke (me): Y Mængden af kunstfibre x er blevet bestemt på forhånd (har fået ganske bestemte værdier), så den er ikke en statistisk variabel. Trækstyrken Y synes derimod udover mængden af kunstfibre også at være påvirket af andre ukendte og ukontrollable støjfaktorer. Y må derfor opfattes som en statistisk variabel. I andre situationer er både X og Y statistiske variable. Dette gælder eksempelvis, hvis man ønsker at undersøge om der er en sammenhæng mellem personers højde Y og vægt X, og derfor for en række personer måler sammenhørende værdier af højde og vægt. Er den ene variabel som i eksempel. en (kontrolleret) ikke statistisk variabel, så har man mulighed for hver x- værdi, at foretage gentagne målinger af den statistiske variabel Y (randomiseret). Dette giver mulighed for at beregne et estimat for den spredning der skyldes støjen, hvilket (som det vises i afsnit.3.6) kan udnyttes i regressionsanalysen... Valg af model, der bedst mulig beskriver de fundne data. Betragtes igen eksempel. ville man umiddelbart sige, at da man har 5 punktpar, så vil et polynomium af fjortende grad gå igennem alle punkter, og det må derfor være en god model. Dette er imidlertid ikke tilfældet, da Y - værdierne jo er resultater af forsøg der er påvirket af ukontrollable støjkilder. Polynomiets koefficienter vil derfor afspejle disse tilfældige udsving, og det giver derfor en ganske meningsløs model. Endvidere er modellen alt for matematisk kompliceret til at kunne bruges i praksis. Vi søger derfor en enklere model. 8

25 . Valg af model, der bedst mulig beskriver de fundne data...lineær model. Ved en lineær model forstås her en model der er lineær med hensyn til parametrene. Et polynomium af. grad y = a + bx + cx er således lineær i de 3 parametre a, b og c (selv om grafen naturligvis ikke er en ret linie). Et andet eksempel er y = a + b P + c T, hvor den afhængige variable afhænger af to uafhæn- gige variable temperatur T og tryk P. Vi har så en såkaldt multipel regressionsanalyse. Som et eksempel på en model der ikke er lineær i parametrene kan nævnes y = a + bx c. Ved en regressionsanalyse søger man at finde den lineære model, som indeholder det færreste antal koefficienter (parametre), og som samtidig beskriver dataene tilstrækkelig godt. Vi vil i dette kapitel betragte det ved anvendelserne meget ofte forekomne tilfælde, som kaldes enkelt regressionsanalyse, og hvor modellen er lineær i parametre. Som eksempler herpå kan nævnes y = a + bxog ln y = a + b ln x. Benyttes et egentligt statistikprogram (som eksempelvis Statgraphics) til beregningsarbejdet, kan metoderne herfra nemt overføres til mere komplicerede regressionsmodeller som: 3 p Y = α + β x+ β x + β x β x og Y = α + β x + β x + β x + β x. 0,5 3 p Regressionslinie og regressionskoefficienter. Lad os antage, at der foreligger en række målinger af sammenhørende værdier af to størrelser x og y. Som eksempel herpå betragter vi igen dataene i eksempel.. Afsættes de målte punktpar ( x, y i ) i et koordinatsystem for at få et overblik over forløbet, fås følgende tegning: Plot of styrke vs kunstfibre 0,5 styrke 8,5 6,5 4, kunstfibre Punkterne ligger ikke eksakt på en ret linie, men det synes rimeligt at antage, at afvigelserne fra en ret linie kan forklares ved den tilfældige variation (støjen). Derfor er det nærliggende at antage, at middelværdien af den statistiske variable Y er en lineær funktion af x af formen EYx ( )= β + β x. () 0 9

26 . Regressionsanalyse EYx ( ) skal læses middelværdien af Y for fastholdt x. Vi vil i det følgende ofte i ligningen () kort skrive Y eller µ fremfor EYx ( ). koefficienten β kaldes regressionskoefficienterne. Mens middelværdien af Y ligger på regressionslinien, kan den aktuelle observerede værdi af Y ikke forventes at ligge på den. For et punktpar ( x, y i ) gælder derfor, at y = β + β x + ε, hvor kaldes den i te residual. i 0 i i ε i..3.bestemmelse af regressionslinien ved mindste kvadraters metode. ~ ~ På basis af en række sammenhørende værdier af x og y bestemmes estimatorer β 0 og β for regressionskoefficienterne ved mindste kvadraters metode. Det følgende eksempel viser metoden anvendt på et så (urealistisk) lille taleksempel, at regningerne kan gennemføres uden anvendelse af et egentligt regressionsprogram.. De angivne metoder kan imidlertid umiddelbart generaliseres til mere komplicerede eksempler. Eksempel.. Bestemmelse af regressionskoefficienter ved mindste kvadraters metode. I et medicinsk forsøg måles på en forsøgsperson sammenhørende værdier af en bestemt medicin i blodet (i %) og reaktionstiden. Resultaterne var: x y Bestem ved mindste kvadraters metode et estimat for regressionslinien. Ligning () kaldes regressionsligningen (eller den teoretiske regressionsligning), grafen kaldes for regressionslinien (eller den teoretiske regressionslinie), og konstantledet og hældningsβ 0 Residual. Ved et punkts residual til en linie forstås den lodrette afstand fra punktet til linien (se tegningen). På figur. er afsat de 5 punkter, og indtegnet en ret linie. Figur. Residualer 0

27 . Valg af model, der bedst mulig beskriver de fundne data Mindste Kvadraters metode. Regressionslinien ~ ~ ~ y = β + β x bestemmes som den af alle 0 mulige rette linier, for hvilket summen af kvadratet af residualerne til linien er mindst. I eksempel. er kvadratsummen r + r + r3 + r4 + r5. Løsningen af dette optimeringsproblem er angivet nedenfor (med petit). Bestemmelse af regressionsligningen ved mindste kvadraters metode LØSNING: I vort tilfælde hvor vi har 5 punkter, indsættes vi disse i ligningen y = ~ β + ~ 0 βx. Dette giver: ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ = β0 + β, = β0 + β, 4 = β0 + β 3, 9 = β0 + β 6, 7 = β0 + β 8. ~ ~ De 5 ligninger med ubekendte β og β kan i matrixnotation skrives: 0 Y = X B hvor Y = X = og B = ~ β 0 4, 3 ~ β ~ ~ De søgte værdier af β0 og β findes som den løsning til dette overbestemte ligningssystem som giver den mindste RMS - fejl. Løsningen er (se evt. Matematik for ingeniører bind 3) bestemt ved T T normalligningssystemet X X B = X Y. Da matricen X T X er en kvadratisk symmetrisk matrix, som sædvanligvis ved regressionsanalyse har en invers matrix ( X T X), så er løsningen B X T T = ( X) X Y. I vort taleksempel er B = = Regressionsligningen bliver følgelig y = x. = = = I praksis vil man benytte et færdigt program til bestemmelse af regressionskoefficienterne. Dataene indtastes enten i en lommeregner med regressionsprogram (som TI83) eller i et statistikprogram. I Statistiske Grundbegreber er der i appendix A for en række lommeregnere angivet, hvorledes man kan finde et estimat for korrelationskoefficienten r. Samtidig hermed beregner programmerne regressionskoefficienterne. ~ ~ I ovenstående tilfælde vil man således af disse programmer finde, at β 0 = 06. og β = 0. Liniens ligning bliver altså ~ ~ ~ y = β0 + βx = x

Note til styrkefunktionen

Note til styrkefunktionen Teoretisk Statistik. årsprøve Note til styrkefunktionen Først er det vigtigt at gøre sig klart, at når man laver statistiske test, så kan man begå to forskellige typer af fejl: Type fejl: At forkaste H

Læs mere

MOGENS ODDERSHEDE LARSEN. VIDEREGÅENDE STATISTIK I Sammenligning af to eller flere kvalitative variable (TI 89 og Statgraphics)

MOGENS ODDERSHEDE LARSEN. VIDEREGÅENDE STATISTIK I Sammenligning af to eller flere kvalitative variable (TI 89 og Statgraphics) MOGENS ODDERSHEDE LARSEN VIDEREGÅENDE STATISTIK I Sammenligning af to eller flere kvalitative variable (TI 89 og Statgraphics) DANMARKS TEKNISKE UNIVERSITET 6. udgave 005 FORORD Dette notat kan læses på

Læs mere

02402 Løsning til testquiz02402f (Test VI)

02402 Løsning til testquiz02402f (Test VI) 02402 Løsning til testquiz02402f (Test VI) Spørgsmål 4. En ejendomsmægler ønsker at undersøge om hans kunder får mindre end hvad de har forlangt, når de sælger deres bolig. Han har regisreret følgende:

Læs mere

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks

Læs mere

Vi kalder nu antal prøverør blandt de 20, hvor der ikke ses vækst for X.

Vi kalder nu antal prøverør blandt de 20, hvor der ikke ses vækst for X. Opgave I I en undersøgelse af et potentielt antibiotikum har man dyrket en kultur af en bestemt mikroorganisme og tilført prøver af organismen til 20 prøverør med et vækstmedium og samtidig har man tilført

Læs mere

MOGENS ODDERSHEDE LARSEN. VIDEREGÅENDE STATISTIK II Regressionsanalyse (TI-89 og Statgraphics)

MOGENS ODDERSHEDE LARSEN. VIDEREGÅENDE STATISTIK II Regressionsanalyse (TI-89 og Statgraphics) MOGENS ODDERSHEDE LARSEN VIDEREGÅENDE STATISTIK II Regressionsanalyse (TI-89 og Statgraphics) DANMARKS TEKNISKE UNIVERSITET 6 udgave 005 FORORD Dette notat kan læses på baggrund af en statistisk viden

Læs mere

Eksempler fra bogen Statistiske Grundbegreber løst ved anvendelse af Excel.

Eksempler fra bogen Statistiske Grundbegreber løst ved anvendelse af Excel. Eksempler fra bogen Statistiske Grundbegreber løst ved anvendelse af Excel. Kapitel Deskriptiv statistik Indhold 1. Generelle forhold... 1 Kapitel : Deskriptiv Statistik... 1 Kapitel 4: Normalfordelingen...

Læs mere

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006 PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006 I dag: To stikprøver fra en normalfordeling, ikke-parametriske metoder og beregning af stikprøvestørrelse Eksempel: Fiskeolie

Læs mere

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på

Læs mere

Hypotese test. Repetition fra sidst Hypoteser Test af middelværdi Test af andel Test af varians Type 1 og type 2 fejl Signifikansniveau

Hypotese test. Repetition fra sidst Hypoteser Test af middelværdi Test af andel Test af varians Type 1 og type 2 fejl Signifikansniveau ypotese test Repetition fra sidst ypoteser Test af middelværdi Test af andel Test af varians Type 1 og type fejl Signifikansniveau Konfidens intervaller Et konfidens interval er et interval, der estimerer

Læs mere

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0 Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt

Læs mere

Statistik vejledende læreplan og læringsmål, efteråret 2013 SmartLearning

Statistik vejledende læreplan og læringsmål, efteråret 2013 SmartLearning Side 1 af 6 Statistik vejledende læreplan og læringsmål, efteråret 2013 SmartLearning Litteratur: Kenneth Hansen & Charlotte Koldsø: Statistik I økonomisk perspektiv, Hans Reitzels Forlag 2012, 2. udgave,

Læs mere

VIDEREGÅENDE STATISTIK

VIDEREGÅENDE STATISTIK MOGENS ODDERSHEDE LARSEN VIDEREGÅENDE STATISTIK (med TI-Nspire og TI 89 ) 7. udgave 013 FORORD Denne lærebog kan læses på baggrund af en statistisk viden svarende til lærebogen M. Oddershede Larsen : Statistiske

Læs mere

VIDEREGÅENDE STATISTIK

VIDEREGÅENDE STATISTIK MOGENS ODDERSHEDE LARSEN VIDEREGÅENDE STATISTIK herunder kvalitetskontrol Udgave 10.b 015 FORORD Denne lærebog kan læses på baggrund af en statistisk viden svarende til lærebogen M. Oddershede Larsen :

Læs mere

Rygtespredning: Et logistisk eksperiment

Rygtespredning: Et logistisk eksperiment Rygtespredning: Et logistisk eksperiment For at det nu ikke skal ende i en omgang teoretisk tørsvømning er det vist på tide vi kigger på et konkret logistisk eksperiment. Der er selvfølgelig flere muligheder,

Læs mere

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration Faculty of Life Sciences Program Modelkontrol og prædiktion Claus Ekstrøm E-mail: ekstrom@life.ku.dk Test af hypotese i ensidet variansanalyse F -tests og F -fordelingen. Multiple sammenligninger. Bonferroni-korrektion

Læs mere

Forelæsning 8: Inferens for varianser (kap 9)

Forelæsning 8: Inferens for varianser (kap 9) Kursus 02402 Introduktion til Statistik Forelæsning 8: Inferens for varianser (kap 9) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby

Læs mere

a) Har måleresultaterne for de 2 laboranter samme varians? b) Tyder resultaterne på, at nogen af laboranterne måler med en systematisk fejl?

a) Har måleresultaterne for de 2 laboranter samme varians? b) Tyder resultaterne på, at nogen af laboranterne måler med en systematisk fejl? Module 6: Exercises 6.1 To laboranter....................... 2 6.2 Nicotamid i piller..................... 3 6.3 Karakterer......................... 5 6.4 Blodtryk hos kvinder................... 6 6.5

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium Deskriptiv (beskrivende) statistik er den disciplin, der trækker de væsentligste oplysninger ud af et ofte uoverskueligt materiale. Det sker f.eks. ved at konstruere forskellige deskriptorer, d.v.s. regnestørrelser,

Læs mere

Konfidensinterval for µ (σ kendt)

Konfidensinterval for µ (σ kendt) Program 1. Repetition: konfidens-intervaller. 2. Hypotese test 3. Type I og type II fejl, p-værdi 4. En og to-sidede tests 5. Test for middelværdi (kendt varians) 6. Test for middelværdi (ukendt varians)

Læs mere

4. september 2003. π B = Lungefunktions data fra tirsdags Gennemsnit l/min

4. september 2003. π B = Lungefunktions data fra tirsdags Gennemsnit l/min Epidemiologi og biostatistik Uge, torsdag 28. august 2003 Morten Frydenberg, Institut for Biostatistik. og hoste estimation sikkerhedsintervaller antagelr Normalfordelingen Prædiktion Statistisk test (udfra

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

VIDEREGÅENDE STATISTIK

VIDEREGÅENDE STATISTIK MOGENS ODDERSHEDE LARSEN VIDEREGÅENDE STATISTIK herunder kvalitetskontrol Udgave 10a 015 FORORD Denne lærebog kan læses på baggrund af en statistisk viden svarende til lærebogen M. Oddershede Larsen :

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination

Læs mere

Modelkontrol i Faktor Modeller

Modelkontrol i Faktor Modeller Modelkontrol i Faktor Modeller Julie Lyng Forman Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for Biokemikere 2003 For at konklusionerne på en ensidet, flersidet eller hierarkisk

Læs mere

Statistik viden eller tilfældighed

Statistik viden eller tilfældighed MATEMATIK i perspektiv Side 1 af 9 DNA-analyser 1 Sandsynligheden for at en uskyldig anklages Følgende histogram viser, hvordan fragmentlængden for et DNA-område varierer inden for befolkningen. Der indgår

Læs mere

Algebra INTRO. I kapitlet arbejdes med følgende centrale matematiske begreber:

Algebra INTRO. I kapitlet arbejdes med følgende centrale matematiske begreber: INTRO Kapitlet sætter fokus på algebra, som er den del af matematikkens sprog, hvor vi anvender variable. Algebra indgår i flere af bogens kapitler, men hensigten med dette kapitel er, at eleverne udvikler

Læs mere

Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning

Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning Side 1 af 6 Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning Litteratur: Kenneth Hansen & Charlotte Koldsø: Statistik I økonomisk perspektiv, Hans Reitzels Forlag 2012, 2. udgave,

Læs mere

Statistik i basketball

Statistik i basketball En note til opgaveskrivning jerome@falconbasket.dk 4. marts 200 Indledning I Falcon og andre klubber er der en del gymnasieelever, der på et tidspunkt i løbet af deres gymnasietid skal skrive en større

Læs mere

Kvantitative Metoder 1 - Forår 2007. Dagens program

Kvantitative Metoder 1 - Forår 2007. Dagens program Dagens program Hypoteser: kap: 10.1-10.2 Eksempler på Maximum likelihood analyser kap 9.10 Test Hypoteser kap. 10.1 Testprocedure kap 10.2 Teststørrelsen Testsandsynlighed 1 Estimationsmetoder Kvantitative

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Fagplan for statistik, efteråret 2015

Fagplan for statistik, efteråret 2015 Side 1 af 7 M Fagplan for statistik, efteråret 20 Litteratur Kenneth Hansen & Charlotte Koldsø (HK): Statistik I økonomisk perspektiv, Hans Reitzels Forlag 2012, 2. udgave, ISBN 9788741256047 HypoStat

Læs mere

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14 Module 5: Exercises 5.1 ph i blod.......................... 1 5.2 Medikamenters effektivitet............... 2 5.3 Reaktionstid........................ 3 5.4 Alkohol i blodet...................... 3 5.5

Læs mere

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model Reminder: Hypotesetest for én parameter Antag vi har model Økonometri: Lektion 4 F -test Justeret R 2 Aymptotiske resultater y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi ønsker at teste hypotesen H

Læs mere

Kombinatorik. Eksempel 2: En mand har 7 par bukser og 10 skjorter. Skal han både vælge en skjorte og et par bukser, så har han 10. 7=70 mulige valg.

Kombinatorik. Eksempel 2: En mand har 7 par bukser og 10 skjorter. Skal han både vælge en skjorte og et par bukser, så har han 10. 7=70 mulige valg. Noter til Biomat, 005. Kombinatorik. - eller kunsten at tælle. Alle tal i kombinatorik-afsnittet er hele og ikke-negative. Additionsprincippet enten - eller : Antag vi enten skal lave et valg med m muligheder

Læs mere

Modul 7: Eksempler. 7.1 Beskrivende dataanalyse. 7.1.1 Diagrammer. Bent Jørgensen. Forskningsenheden for Statistik ST501: Science Statistik

Modul 7: Eksempler. 7.1 Beskrivende dataanalyse. 7.1.1 Diagrammer. Bent Jørgensen. Forskningsenheden for Statistik ST501: Science Statistik Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 7: Eksempler 7.1 Beskrivende dataanalyse............................... 1 7.1.1 Diagrammer.................................

Læs mere

for gymnasiet og hf 2016 Karsten Juul

for gymnasiet og hf 2016 Karsten Juul for gymnasiet og hf 75 50 5 016 Karsten Juul Statistik for gymnasiet og hf Ä 016 Karsten Juul 4/1-016 Nyeste version af dette håfte kan downloades fra http://mat1.dk/noter.htm HÅftet mç benyttes i undervisningen

Læs mere

En intro til radiologisk statistik

En intro til radiologisk statistik En intro til radiologisk statistik Erik Morre Pedersen Hypoteser og testning Statistisk signifikans 2 x 2 tabellen og lidt om ROC Inter- og intraobserver statistik Styrkeberegning Konklusion Litteratur

Læs mere

for matematik pä B-niveau i hf

for matematik pä B-niveau i hf for matematik pä B-niveau i hf 014 Karsten Juul TEST 1 StikprÅver... 1 1.1 Hvad er populationen?... 1 1. Hvad er stikpråven?... 1 1.3 Systematiske fejl ved valg af stikpråven.... 1 1.4 TilfÇldige fejl

Læs mere

Værktøjshjælp for TI-Nspire CAS Struktur for appendiks:

Værktøjshjælp for TI-Nspire CAS Struktur for appendiks: Værktøjshjælp for TI-Nspire CAS Struktur for appendiks: Til hvert af de gennemgåede værktøjer findes der 5 afsnit. De enkelte afsnit kan læses uafhængigt af hinanden. Der forudsættes et elementært kendskab

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Undervisningsbeskrivelse

Undervisningsbeskrivelse Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Sommer 2015 Institution Campus Vejle Uddannelse HHX Fag og niveau Matematik B ( Valghold ) Lærer(e) Hold LTN

Læs mere

Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne

Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne Statistik og Sandsynlighedsregning 1 Indledning til statistik, kap 2 i STAT Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne 5. undervisningsuge, onsdag

Læs mere

VIDEREGÅENDE STATISTIK

VIDEREGÅENDE STATISTIK MOGENS ODDERSHEDE LARSEN VIDEREGÅENDE STATISTIK (med TI 89 og SAS - JMP) 5. udgave 011 FORORD Denne lærebog kan læses på baggrund af en statistisk viden svarende til lærebogen M. Oddershede Larsen : Statistiske

Læs mere

Modul 5: Test for én stikprøve

Modul 5: Test for én stikprøve Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 5: Test for én stikprøve 5.1 Test for middelværdi................................. 1 5.1.1 t-fordelingen.................................

Læs mere

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm. Multiple choice opgaver Der gøres opmærksom på, at ideen med opgaverne er, at der er ét og kun ét rigtigt svar på de enkelte spørgsmål. Endvidere er det ikke givet, at alle de anførte alternative svarmuligheder

Læs mere

Maple 11 - Chi-i-anden test

Maple 11 - Chi-i-anden test Maple 11 - Chi-i-anden test Erik Vestergaard 2014 Indledning I dette dokument skal vi se hvordan Maple kan bruges til at løse opgaver indenfor χ 2 tests: χ 2 - Goodness of fit test samt χ 2 -uafhængighedstest.

Læs mere

Statistik Lektion 17 Multipel Lineær Regression

Statistik Lektion 17 Multipel Lineær Regression Statistik Lektion 7 Multipel Lineær Regression Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test Multipel lineær regression x,x,,x

Læs mere

Produkt og marked - matematiske og statistiske metoder

Produkt og marked - matematiske og statistiske metoder Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring

Læs mere

Teoretisk Statistik, 2. december 2003. Sammenligning af poissonfordelinger

Teoretisk Statistik, 2. december 2003. Sammenligning af poissonfordelinger Uge 49 I Teoretisk Statistik, 2. december 2003 Sammenligning af poissonfordelinger o Generel teori o Sammenligning af to poissonfordelinger o Eksempel Opsummering om multinomialfordelinger Fishers eksakte

Læs mere

i x-aksens retning, så fås ). Forskriften for g fås altså ved i forskriften for f at udskifte alle forekomster af x med x x 0

i x-aksens retning, så fås ). Forskriften for g fås altså ved i forskriften for f at udskifte alle forekomster af x med x x 0 BAndengradspolynomier Et polynomium er en funktion på formen f ( ) = an + an + a+ a, hvor ai R kaldes polynomiets koefficienter. Graden af et polynomium er lig med den højeste potens af, for hvilket den

Læs mere

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Kursus 02402: Besvarelser til øvelsesopgaver i uge 9 Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Som model benyttes en binomialfordeling, som beskriver antallet, X, blandt

Læs mere

Undervisningsbeskrivelse

Undervisningsbeskrivelse Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Maj-juni, 2015/16 Institution Vid Gymnasier Uddannelse Fag og niveau Lærer(e) Hold hhx Matematik B Hasse Rasmussen

Læs mere

Generelt er korrelationen mellem elevens samlede vurdering i forsøg 1 og forsøg 2 på 0,79.

Generelt er korrelationen mellem elevens samlede vurdering i forsøg 1 og forsøg 2 på 0,79. Olof Palmes Allé 38 8200 Aarhus N Tlf.nr.: 35 87 88 89 E-mail: stil@stil.dk www.stil.dk CVR-nr.: 13223459 Undersøgelse af de nationale tests reliabilitet 26.02.2016 Sammenfatning I efteråret 2014 blev

Læs mere

Program. 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test.

Program. 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test. Program 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test. 1/19 Konfidensinterval for µ (σ kendt) Estimat ˆµ = X bedste bud

Læs mere

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele Anvendt Statistik Lektion 4 Hypotesetest generelt Test for middelværdi Test for andele Hypoteser og Test Hypotese I statistik er en hypotese en påstand om en populationsparameter. Typisk en påstand om

Læs mere

Undervisningsbeskrivelse

Undervisningsbeskrivelse Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Maj 2013 Institution Roskilde Handelsskole Uddannelse Fag og niveau Lærer(e) Hold Hhx Matematik B Henrik Laursen

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Opgaver til kapitel 3

Opgaver til kapitel 3 Opgaver til kapitel 3 3.1 En løber er interesseret i at undersøge om hendes løbeur er kalibreret korrekt. Hun udmåler derfor en strækning på præcis 1000 m og løber den 16 gange. For hver løbetur noterer

Læs mere

Fig. 1 Billede af de 60 terninger på mit skrivebord

Fig. 1 Billede af de 60 terninger på mit skrivebord Simulation af χ 2 - fordeling John Andersen Introduktion En dag kastede jeg 60 terninger Fig. 1 Billede af de 60 terninger på mit skrivebord For at danne mig et billede af hyppighederne flyttede jeg rundt

Læs mere

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 3: Kontinuerte fordelinger. Per Bruun Brockhoff

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 3: Kontinuerte fordelinger. Per Bruun Brockhoff Course 242/2323 Introducerende Statistik Forelæsning 3: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 22 Danmarks Tekniske Universitet 28 Lyngby Danmark

Læs mere

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x) Formelsamlingen 1 Regneregler for middelværdier M(a + bx) a + bm X M(X+Y) M X +M Y Spredning varians og standardafvigelse VAR(X) 1 n n i1 ( X i - M x ) 2 Y a + bx VAR(Y) VAR(a+bX) b²var(x) 2 Kovariansen

Læs mere

Test nr. 6 af centrale elementer 02402

Test nr. 6 af centrale elementer 02402 QuizComposer 2001- Olaf Kayser & Gunnar Mohr Contact: admin@quizcomposer.dk Main site: www.quizcomposer.dk Test nr. 6 af centrale elementer 02402 Denne quiz angår forståelse af centrale elementer i kursus

Læs mere

Uge 48 II Teoretisk Statistik 27. november 2003. Numerisk modelkontrol af diskrete fordelinger: intro

Uge 48 II Teoretisk Statistik 27. november 2003. Numerisk modelkontrol af diskrete fordelinger: intro Uge 48 II Teoretisk Statistik 7. november 003 Numerisk modelkontrol af diskrete fordelinger: intro Eksempel: kvalitetskontrol Goodness-of-fit test: generel teori Endeligt udfaldsrum Udfaldsrum uden øvre

Læs mere

2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900.

2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900. 2 -fordeling og 2 -test Generelt om 2 -fordelingen 2 -fordelingen er en kontinuert fordeling, modsat binomialfordelingen som er en diskret fordeling. Fordelingen er særdeles kompleks at beskrive med matematiske

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større

Læs mere

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M. Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet March 1, 2013 Sandsynlighedsregning og lagerstyring Normalfordelingen

Læs mere

c) For, er, hvorefter. Forklar.

c) For, er, hvorefter. Forklar. 1 af 13 MATEMATIK B hhx Udskriv siden FACITLISTE TIL KAPITEL 7 ØVELSER ØVELSE 1 c) ØVELSE 2 og. Forklar. c) For, er, hvorefter. Forklar. ØVELSE 3 c) ØVELSE 4 90 % konfidensinterval: 99 % konfidensinterval:

Læs mere

Allan C. Malmberg. Terningkast

Allan C. Malmberg. Terningkast Allan C. Malmberg Terningkast INFA 2008 Programmet Terning Terning er et INFA-program tilrettelagt med henblik på elever i 8. - 10. klasse som har særlig interesse i at arbejde med situationer af chancemæssig

Læs mere

OPLÆG TIL STUDIERETNINGSPROJEKTER I MATEMATIK-KEMI OM KVANTITATIV KEMISK ANALYSE OG STATISTISKE MODELLER

OPLÆG TIL STUDIERETNINGSPROJEKTER I MATEMATIK-KEMI OM KVANTITATIV KEMISK ANALYSE OG STATISTISKE MODELLER OPLÆG TIL STUDIERETNINGSPROJEKTER I MATEMATIK-KEMI OM KVANTITATIV KEMISK ANALYSE OG STATISTISKE MODELLER Indledning Ved en kvantitativ kemisk analyse forstår man en tilbundsgående undersøgelse af et kemisk

Læs mere

Eksempel på logistisk vækst med TI-Nspire CAS

Eksempel på logistisk vækst med TI-Nspire CAS Eksempel på logistisk vækst med TI-Nspire CAS Tabellen herunder viser udviklingen af USA's befolkning fra 1850-1910 hvor befolkningstallet er angivet i millioner: Vi har tidligere redegjort for at antallet

Læs mere

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller Opsamling Modeltyper: Tabelanalyse Logistisk regression Binær respons og kategorisk eller kontinuerte forklarende variable. Generaliserede lineære modeller Normalfordelt respons og kategoriske forklarende

Læs mere

qwertyuiopåasdfghjklæøzxcvbnmqw ertyuiopåasdfghjklæøzxcvbnmqwert yuiopåasdfghjklæøzxcvbnmqwertyui Polynomier opåasdfghjklæøzxcvbnmqwertyuiopå

qwertyuiopåasdfghjklæøzxcvbnmqw ertyuiopåasdfghjklæøzxcvbnmqwert yuiopåasdfghjklæøzxcvbnmqwertyui Polynomier opåasdfghjklæøzxcvbnmqwertyuiopå qwertyuiopåasdfghjklæøzxcvbnmqw ertyuiopåasdfghjklæøzxcvbnmqwert yuiopåasdfghjklæøzxcvbnmqwertyui Polynomier opåasdfghjklæøzxcvbnmqwertyuiopå Kort gennemgang af polynomier og deres egenskaber. asdfghjklæøzxcvbnmqwertyuiopåasd

Læs mere

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet Matematik A Studentereksamen Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet stx11-matn/a-080501 Tirsdag den 8. maj 01 Forberedelsesmateriale til stx A Net MATEMATIK Der

Læs mere

Module 12: Mere om variansanalyse

Module 12: Mere om variansanalyse Mathematical Statistics ST06: Linear Models Bent Jørgensen og Pia Larsen Module 2: Mere om variansanalyse 2. Parreded observationer................................ 2.2 Faktor med 2 niveauer (0- variabel)........................

Læs mere

Schweynoch, 2003. Se eventuelt http://www.mathematik.uni-kassel.de/~fathom/projekt.htm.

Schweynoch, 2003. Se eventuelt http://www.mathematik.uni-kassel.de/~fathom/projekt.htm. Projekt 8.5 Hypotesetest med anvendelse af t-test (Dette materiale har været anvendt som forberedelsesmateriale til den skriftlige prøve 01 for netforsøget) Indhold Indledning... 1 χ -test... Numeriske

Læs mere

Kapitel 3 Centraltendens og spredning

Kapitel 3 Centraltendens og spredning Kapitel 3 Centraltendens og spredning Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 25 Indledning I kapitel 2 omsatte vi de rå data til en tabel, der bedre viste materialets fordeling

Læs mere

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok Opgave 1 Vejledende besvarelse af eksamen i Statistik for biokemikere, blok 2 2006 Inge Henningsen og Niels Richard Hansen Analysevariablen i denne opgave er variablen forskel, der for hver af 10 kvinder

Læs mere

Undervisningsbeskrivelse

Undervisningsbeskrivelse Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Juni, 2014 Institution Vid Gymnasier, Rønde Uddannelse Fag og niveau Lærer(e) Hold hhx Matematik B Ann Risvang

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser

Læs mere

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 13: Summary Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Optimale konstruktioner - når naturen former. Opgaver. Opgaver og links, der knytter sig til artiklen om topologioptimering

Optimale konstruktioner - når naturen former. Opgaver. Opgaver og links, der knytter sig til artiklen om topologioptimering Opgaver Opgaver og links, der knytter sig til artiklen om solsikke Opgave 1 Opgave 2 Opgaver og links, der knytter sig til artiklen om bobler Opgave 3 Opgave 4 Opgaver og links, der knytter sig til artiklen

Læs mere

Valgkampens og valgets matematik

Valgkampens og valgets matematik Ungdommens Naturvidenskabelige Forening: Valgkampens og valgets matematik Rune Stubager, ph.d., lektor, Institut for Statskundskab, Aarhus Universitet Disposition Meningsmålinger Hvorfor kan vi stole på

Læs mere

Nanostatistik: Opgavebesvarelser

Nanostatistik: Opgavebesvarelser Nanostatistik: Opgavebesvarelser JLJ Nanostatistik: Opgavebesvarelser p. 1/16 Pakkemaskine En producent hævder at poserne indeholder i gennemsnit 16 ounces sukker. Data: 10 pakker sukker: 16.1, 15.8, 15.8,

Læs mere

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Microsoft Excel har en del standard anvendelsesmuligheder i forhold til den beskrivende statistik og statistisk

Læs mere

Analyse af bivirkninger på besætningsniveau efter vaccination med inaktiveret BlueTongue Virus (BTV) serotype 8 i danske malkekvægsbesætninger

Analyse af bivirkninger på besætningsniveau efter vaccination med inaktiveret BlueTongue Virus (BTV) serotype 8 i danske malkekvægsbesætninger Analyse af bivirkninger på besætningsniveau efter vaccination med inaktiveret BlueTongue Virus (BTV) serotype 8 i danske malkekvægsbesætninger Af Karen Helle Sloth og Flemming Skjøth, AgroTech Sammendrag

Læs mere

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 12: Variansanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1)

Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1) ; C ED 6 > Billedbehandling og mønstergenkendelse Lidt elementær statistik (version 1) Klaus Hansen 24 september 2003 1 Elementære empiriske mål Hvis vi har observationer kan vi udregne gennemsnit og varians

Læs mere

T A L K U N N E N. Datasæt i samspil. Krydstabeller Grafer Mærketal. INFA Matematik - 1999. Allan C

T A L K U N N E N. Datasæt i samspil. Krydstabeller Grafer Mærketal. INFA Matematik - 1999. Allan C T A L K U N N E N 3 Allan C Allan C.. Malmberg Datasæt i samspil Krydstabeller Grafer Mærketal INFA-Matematik: Informatik i matematikundervisningen Et delprojekt under INFA: Informatik i skolens fag Et

Læs mere

Installa on af Analysis Toolpak og KeHaTools

Installa on af Analysis Toolpak og KeHaTools Installa on af Analysis Toolpak og KeHaTools Installa on af Analysis Toolpak Denne er nødvendig for at kunne lave optællinger, variansanalyse (kap. 12) og regressionsanalyser (kap. 15 pg 16). Analysis

Læs mere

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier

Læs mere

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Introduktion Kasper K. Berthelsen, Inst f. Matematiske Fag Omfang: 8 Kursusgang I fremtiden

Læs mere

Kapitlet indledes med en beskrivelse af - og opgaver med - de tre former for sandsynlighed, som er omtalt i læseplanen for 7.- 9.

Kapitlet indledes med en beskrivelse af - og opgaver med - de tre former for sandsynlighed, som er omtalt i læseplanen for 7.- 9. Kapitlet indledes med en beskrivelse af - og opgaver med - de tre former for sandsynlighed, som er omtalt i læseplanen for 7.- 9. klassetrin: statistisk sandsynlighed, kombinatorisk sandsynlighed og personlig

Læs mere

Sandsynlighedsregning 2. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 2. forelæsning Bo Friis Nielsen Vigtigste nye emner i.,. og.5 Sandsynlighedsregning. forelæsning Bo Friis Nielsen Anvendt Matematik og Computer Siene Danmarks Tekniske Universitet 800 Kgs. Lyngby Danmark Email: bfni@dtu.dk Binomialfordelingen

Læs mere

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset 02402 Vejledende løsninger til Splus-opgaverne fra hele kurset Vejledende løsning SPL3.3.1 Der er tale om en binomialfordeling med n =10ogp=0.6, og den angivne sandsynlighed er P (X =4) som i bogen også

Læs mere

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i. Repetition af vektor-regning Økonometri: Lektion 3 Matrix-formulering Fordelingsantagelse Hypotesetest Antag vi har to n-dimensionelle (søjle)vektorer a 1 b 1 a 2 a =. og b = b 2. a n b n Tænk på a og

Læs mere