Statistik Formelsamling. HA Almen, 1. semester

Størrelse: px
Starte visningen fra side:

Download "Statistik Formelsamling. HA Almen, 1. semester"

Transkript

1 Statistik Formelsamling HA Almen, 1. semester

2 Statistik - Formelsamling Indholdsfortegnelse Hvordan kan formelsamlingen bruges?... 5 Værd at vide... 5 Oversigt Mest brugte symboler... 5 Disclaimer... 5 Konfidensintervaller... 6 Generel fremgangmåde... 6 Populationsmiddelværdi, med kendt... 6 Difference mellem 2 populationsmiddelværdier med kendt... 6 Populationsmiddelværdien,, med ukendt... 6 Differencen mellem 2 populationsmiddelværdier med samme, men ukendt... 7 S-pooled beregner en fælles varians... 7 Populationsvarians,... 7 Differencen mellem 2 populationsvarianser... 8 Populationsandel, P... 8 Differencen mellem to populationsandele,... 8 Hypotesetest... 9 Fremgangsmåde... 9 Fortolkninger... 9 P-værdi... 9 Type I og type II fejl... 9 Populationsmiddelværdi, med kendt Difference mellem 2 populationsmiddelværdier med kendt Populationsmiddelværdien,, med ukendt Differencen mellem 2 populationsmiddelværdier med ukendt Populationsvarians, /28

3 Forholdet mellem 2 populationsvarianser, Populationsandel, P Differencen mellem to populationsandele, Sandsynlighedsregning Stokastisk uafhængighed Additionsreglen (Probability that event A or event B occurs) Betinget sandsynlighed (når, givet, hvis) Multiplikationsreglen (og) Bayes sætning Marginal sandsynlighed Kobling til binomialfordeling Regressionsanalyse Grundlæggende formler/forklaringer Parameterestimater, Simpel regression (side 419) Fortolkning Variationsstørrelser Antagelser og kontrol af disse Multikolinaritet (multipel regression) Jaque Bera-test Test for homoskedasticitet (Whites test) Test for simpel regression Test Test Test for multipel regression Test Test Test Prediktionsinterval (PI) Konfidensinterval (KI) Konfidensinterval for Ikke-parametrisk statistik Goodness of fit 1 faktor /28

4 1 faktor faktorer (kontingenstabeller) Variansanalyse Et-sidet variansanalyse ANOVA-tabel To-sidet variansanalyse Hypotesetest ANOVA-tabel Fordelinger Binomialfordeling Standardiseret normalfordeling /28

5 Hvordan kan formelsamlingen bruges? Ud fra den enkelte opgave til eksamen kan man slå op i denne formelsamling for at finde fremgangsmåden til at løse opgaven. Dette gøres således: 1) Find overemnet som opgaven omhandler - fx Hypotesetest 2) Find den specifikke opgavebeskrivelse - fx Difference mellem 2 populationsmiddelværdier med kendt σ 2. 3) Følg den generelle fremgangsmåde for overemnet. 4) Benyt formlerne for den specifikke opgavebeskrivelse. Værd at vide NCT henviser til grundbogen i statistik: Statistics for Business and Economics (af Paul Newbold, William Carlson & Betty Thorne) Oversigt Mest brugte symboler Størrelse Population Stikprøve Antal observationer N n Gennemsnit μ x Varians σ2 s2 Standardafvigelse σ s Variationskoefficienten CV CV Kovarians Cov(X,Y) = σxy Cov(X,Y) = sxy Korrelationskoefficient p r Disclaimer For at få udbytte af denne formelsamling kræver det et grundlæggende kendskab til faget statistik og forståelse for, hvordan man løser generelle problemstillinger. Er dét på plads, fungerer denne formelsamling som et godt værktøj til at spare tid til eksamen. Uni Bazaar IVS tager forbehold for tastefejl og ændringer i pensum. Desuden skal det bemærkes, at den præcise brug af symboler kan variere i forhold til den enkelte underviser. 5/28

6 Konfidensintervaller Generel fremgangmåde 1) Find formel, evt. ved hjælp af træet (bilag i fællesnoter) 2) Gør relevante antagelser 3) Konkluder at den sande populationsvariabel med sikkerhed er givet i intervallet. 4) Kommentér evt. på om 0 ligger i intervallet ME (marginal error) er alt der efter i formlerne og bredden Populationsmiddelværdi, med kendt Formel: findes i NCT på side 738 (eller i den lille tabel på side 294) Antagelser: - Kendt populationsvarians - Normalfordelt population - Tilfældig udvalgt stikprøve Difference mellem 2 populationsmiddelværdier med kendt Formel: findes i NCT på side 738 (eller i den lille tabel på side 294) Antagelser - Kendte populationsvarianser - Normalfordelt population - Tilfældig udvalgt stikprøve Populationsmiddelværdien,, med ukendt Formel: 6/28

7 Antagelser: findes i NCT på side Ukendt populationsvarians - Normalfordelt population - Tilfældig udvalgt stikprøve Differencen mellem 2 populationsmiddelværdier med samme, men ukendt S-pooled beregner en fælles varians Formel: Antagelser findes i NCT på side Ukendte men ens varianser - Normalfordelte populationer - Tilfældigt udvalgte stikprøver Populationsvarians, Formel: -fordelingerne findes i NCT på side 768 og 769 Antagelser - Normalfordelt population - Populationsvarians der følger -fordeling - Tilfældigt udvalgte stikprøver 7/28

8 Differencen mellem 2 populationsvarianser Ikke en del af pensum Populationsandel, P Formel: findes i NCT på side 738 (eller i den lille tabel på side 294) Antagelser - Population er binomialfordelt : to mulige udfald, konstant P og stokastisk uafhængighed - Den kan approksimeres til en normalfordeling, når (variansen skal være større end 5) - Tilfældigt udvalgte stikprøver Differencen mellem to populationsandele, Formel: findes i NCT på side 738 (eller i den lille tabel på side 294) Antagelser - Population er binomialfordelt og : to mulige udfald for X og Y, konstant P og stokastisk uafhængighed - Den kan approksimeres til en normalfordeling, når og - Tilfældigt udvalgte stikprøver 8/28

9 Hypotesetest Altid stærkere at lave en nulhypotese, der kan forkastes Fremgangsmåde - Opstil passende og For den højresidede test vil For den venstresidede test vil For den dobbeltsidede test vil og og og benyttes ved den dobbeltsidede test. - Vælg sikkerhedsniveau. Hvis intet er givet, brug 5 %. - Find den passende formel, evt. ud fra brug af træet - Gør de relevante antagelser - Sæt teststørrelsen, T, overfor den kritiske værdi, K. Hvis T er mindre ekstrem end K medfører det, at vi ikke forkaster Det betyder desuden, at hvis T er mere ekstrem end K, skal vi forkaste Fortolkninger Hvis vi beviser betyder det blot, at vi ikke kan forkaste den. Det betyder IKKE, at den er sand. Hvis vi modbeviser, kan vi forkaste med sikkerhed P-værdi Kræves ikke medmindre, der direkte bliver spurgt om det. P-værdien er sandsynligheden for at observere en mere ekstrem værdi end teststørrelsen, når Er P-værdien mindre end α, så forkaster vi. er sand. P-værdien kan især bruges ved grænsesignifikans, da sikkerhedsniveauet kan være afgørende i de tilfælde for om vi forkaster eller ej. Type I og type II fejl - Type 1 (α): risikoen for at forkaste en sand - Type 2 (β): risikoen for ikke at forkaste en falsk 9/28

10 Der er risiko for fejl især ved grænsesignifikans. Populationsmiddelværdi, med kendt Kritisk værdi: findes i NCT på side 738 (eller i den lille tabel på side 294) Antagelser: - Kendt populationsvarians - Normalfordelt population - Tilfældig udvalgt stikprøve Difference mellem 2 populationsmiddelværdier med kendt er det vi tester om differencen er Kritisk værdi: findes i NCT på side 738 (eller i den lille tabel på side 294) Antagelser: - Kendte populationsvarianser - Normalfordelt population - Tilfældig udvalgt stikprøve Populationsmiddelværdien,, med ukendt Kritisk værdi: findes i NCT på side 770 Antagelser: - Ukendt populationsvarians - Normalfordelt population - Tilfældig udvalgt stikprøve 10/28

11 Differencen mellem 2 populationsmiddelværdier med ukendt er det vi tester om differencen er Kritisk værdi: findes i NCT på side 770 Antagelser: - Ukendte men ens varianser - Normalfordelte populationer - Tilfældigt udvalgte stikprøver Populationsvarians, Kritisk værdi (øvre): Kritisk værdi (nedre): De kritiske værdier findes i NCT på side 768 og 769 Antagelser: - Normalfordelt population - Populationsvarians der følger -fordeling - Tilfældigt udvalgte stikprøver Forholdet mellem 2 populationsvarianser,, hvor 11/28

12 Deler man to fordelinger med hinanden, så får man et F-test i stedet. Kritisk værdi: som findes i NCT på side Antagelser: - Ukendte populationsvarianser - Normalfordelte populationer - Tilfældigt udvalgte stikprøver Populationsandel, P Formel: hvor Kritisk værdi: findes i NCT på side 738 (eller i den lille tabel på side 294) Antagelser - Population er binomialfordelt : to mulige udfald, konstant P og stokastisk uafhængighed - Den kan approksimeres til en normalfordeling, når (variansen skal være større end 5) - Tilfældigt udvalgte stikprøver Differencen mellem to populationsandele, Kritisk værdi: findes i NCT på side 738 (eller i den lille tabel på side 294) Antagelser: - Population er binomialfordelt og : to mulige udfald for X og Y, konstante P er og stokastisk uafhængighed - Den kan approksimeres til en normalfordeling, når og. CLT er opfyldt når de to foregående formler er korrekte. 12/28

13 - Tilfældigt udvalgte stikprøver 13/28

14 Sandsynlighedsregning TJEK OM DER ER ANTAGET UAFHÆNGIGHED det ændrer det hele. Uafhængighed er ikke det samme som disjoint events. Uafhængige events kan godt have fællesmængde. Stokastisk uafhængighed Uafhængighed når: og Additionsreglen (Probability that event A or event B occurs) Er de to events disjoint (ingen fællesmængde) så kan man nøjes med addere P(A) og P(B) for at finde den forenede mængde. = forenet (union of events). Se side 112 for illustration. = fælles (intersection) Betinget sandsynlighed (når, givet, hvis) (siges som A givet B. sandsynligheden for at være statistiklærer (A) givet man er kvinde (B) ). Multiplikationsreglen (og) Ved uafhængighed, da er de betingede sandsynligheder lig den oprindelige sandsynlighed: hvorfor multiplikationsreglen i stedet bliver. Bayes sætning Også en givet sandsynlighed (når, givet, hvis). Multiplikationsregel i tælleren for betinget sandsynlighed 14/28

15 Marginal sandsynlighed Kobling til binomialfordeling A, B, osv. Kunne være 15/28

16 Regressionsanalyse Grundlæggende formler/forklaringer Y = responsvariabel X = kovariater/forklarende variabler = intercept (skæring med y-aksen) = hældning = fejlled/residualer Parameterestimater, Simpel regression (side 419) Fortolkning Simpel eller lineær regression? : Y har en forventet værdi på enheder(y). Det sker når alle kovariater (ved simpel bare den ene kovariat) er lig 0. Værdien for giver ikke altid mening i sig selv så er det vigtigt at nævne! Fx hvis vi har negative værdier for noget, der ikke bør kunne være negativt. : Y har en forventet stigning/fald på enheder(y), når vi siger med en enhed( ). : Findes kun ved multipel lineær regression. Y har en forventet stigning/fald på enheder(y), når enheder, hvis man holder de andre kovariater konstant. Variationsstørrelser SSR: Den del af variationen, som modellen forklarer. SSE: Den del af variationen, som modellen ikke forklarer SST: Den totale variation 16/28

17 SSR: SST: MSR: MSE: F-teststørrelse (ratio): Parameterestimater: Det vil sige, at regressionslinjen går gennem punktet Determinationskoefficienten: Vigtigt at bemærke at formlen også kan skrives som. Formlen viser, at forklaringskraften vokser med variabiliteten af kovariaterne om deres gennemsnit. Dvs. at er større når er større. Man skal derfor forsøge at rbuge kovariater med så stor varians som muligt for på den måde at opnå den størst mulige forklaringskraft i regressionsmodellen. Justeret determinationskoefficient: 17/28

18 Fejlleddenes varians: Std. Error på den enkelte : kan øges kunstigt, hvis man tilfører flere kovariater selv hvis de ingen forklaringskraft har. R^2 adj. Er justeret for dette. Antagelser og kontrol af disse Antagelse om lineæritet Der skal være lineær sammenhæng mellem responsvariablen og alle kovariater. Kontrol: Lav en graf, der viser Y mod X erne: Led efter lineære sammenhænge. Finder man en eksponentiel, kvadratisk eller anden sammenhæng, så kan der anbefales en transformation til en lineær sammenhæng. Vi kommer ikke selv til at skulle lave transformationen, men vi kan foreslå at gøre det. Antagelse om normalfordelte og uafhængige fejlled Residualerne er uafhængige af kovariaterne for alle og de er normalfordelte med middelværdien 0. Vi antager at middelværdien er 0. Kontrol: Lav e graf med de rå eller studentiserede fejlled mod X erne. Der må ikke være nogen mønstre og de skal ligge omkring 0. Normalfordelingsplot af de rå eller studentiserede residualer. Punkterne må ikke ligge uden for båndende ved 95 %. Ligger der enkelte punkter udenfor båndene er det ok, hvis er stor. Test for normalfordelte residualer på de studentiserede eller de rå (Jaque Bera testet). Forkastes nulhypotesen, betyder det, at fejlleddene ikke er normalfordelte. Homoskedasticitet Residualerne er homoskedastiske, hvilket vil sige, at de har konstant varians: for alle. Kontrol: Lav en graf med de studentiserede residualer mod hhv. row eller predicted Y. Der skal være ens varians (spredning) over hele x-aksen Test for homoskedasticitet. Forkastes nulhypotesen, betyder det at vi har heteroskedastiske fejlled. 18/28

19 Parvis uafhængighed Residualerne er parvis uafhængige, dvs. at ved at have observeret en næste. Der må ikke være systematik i fejlene. kan vi ikke sige noget om den Kontrol: - Lav en graf med studentiserede residualer mod row eller predicted Y. Se efter mønstre i plottet. Multikolinaritet (multipel regression) En kovariat må ikke være en linearkombination af en anden kovariat, dvs. de ikke må forklare det samme om Y. Kontrol: - Lav et korrelationsmatrix med alle de numeriske kovariater - Ingen må overstige 0,7 numerisk set (dvs. større end 0,7 og mindre end -0,7) Der findes eksempler plots (uafhængighed og homoskedasticitet) tegnet på papir. Jaque Bera-test : Normalfordelte residualer Ikke normalfordelte residualer (komplement til ) OBS: JMP har allerede trukket de 3 fra. Kritisk værdi: som findes i NCT på side 612. Forkast hvis teststørrelsen er større end den kritiske værdi. Når testet har stort nok n kan den approksimeres til en -fordeling. Test for homoskedasticitet (Whites test) : Homoskedasticitet Heteroskedasticitet (hvis der denne lineære sammenhæng: ) Kritisk værdi: Forkast hvis teststørrelsen er større end den kritiske værdi. 19/28

20 Test for simpel regression Test af ingen lineær sammenhæng, hvor Test 1 og Kritisk værdi: Test 2 Kristik værdi: Test for multipel regression Test 1 Test af ingen marginaleffekt af den j te kovariat og Kritisk værdi: Test 2 Test af ingen simultaneffekt af K antal kovariater og Kristik værdi: 20/28

21 Test 3 og Test af ingen simultaneffekt af delmængden R ud af K kovariater. Findes der kun én ny kovariat (R=1) er det ikke simultan- men marginaleffekt. Vigtigt at notere. Hvor SSE(R) er fra den gamle model SSE er fra den nye model K er antal kovariater i den model med færrest kovariater R er antal tilføjede kovariater Kritisk værdi: Prediktionsinterval (PI) Nævneren kan også skrives som Nogle gange må antage samme værdi som, hvorved hele det sidste led bortfalder. Dette interval indeholder med sikkerhed værdien af en ny observation, når X antager værdien. Konfidensinterval (KI) Dette interval indeholder med sikkerhed værdien af, når X antager værdien. Konfidensintervallet er altid mindre bredt end prediktionsintervallet og derved mere sikkert. 21/28

22 Konfidensinterval for Ikke-parametrisk statistik Goodness of fit 1 faktor 1 faktor Parametre: : antal observationer i kategori Sandsynligheden for at ende i kategori forventet antal i kategori der er Goodness of fit. Det kan også skrives som er korrekt specificeret. er specificeret forkert. Kritisk værdi: som findes i NCT på side 768. K angiver antallet af kategoier. Fokast hvis teststørrelsen er større end den kritiske værdi. Antagelse - er tilstrækkelig stor, sp for hver 2 faktorer (kontingenstabeller) Faktor A/Faktor B 1 2 c Total 1 2 r Total n 22/28

23 Faktor A har r kategorier (rækker) hvilket vil sige at til Faktor B har c kategorier (kolonner) hvilket vil sige at til uafhængig mellem faktor A og B Afhængighed Kritisk værdi: Vi forkaster, hvis teststørrelsen er større end den kritiske værdi. Antagelse: - og er tilstrækkeligt støre, så for hver og Variansanalyse Et-sidet variansanalyse Antal populationer, hvor vi vil teste ens/forskellig middelværdi, men med ens varians. Kategoriske variable. Hvor K er antallet af grupper N er antallet af observationer SSG er variationen mellem grupper 23/28

24 SSW er variationen indenfor grupperne Kritisk værdi: som findes i NCT på side Forkast når teststørrelsen er større end den kritiske værdi. Antagelser: - Normalfordelte populationer - Uafhængige stikprøver - Varianshomogenitet ANOVA-tabel To-sidet variansanalyse BLOK / GRUPPE 1 2 K 1 2 H K er antallet af grupper i gruppefaktoren H er antallet af grupper i blokfaktoren M er antal observationer indenfor hvert niveau. Hypotesetest Forkaster man en af nedenstående hypoteser, så er der altså en effekt af en af faktorerne. For alle test gælder det, at vi forkaster, hvis teststørrelsen er større end den kritiske værdi. 24/28

25 Test 1 ingen gruppeeffekt Kritisk værdi: Test 2 ingen blokeffekt Kritisk værdi: Test 3 ingen vekselvirkningseffekt Kritisk værdi: Antagelser: - Normalfordelte populationer - Uafhængige stikprøver - Varianshomogenitet 25/28

26 ANOVA-tabel 26/28

27 Fordelinger Binomialfordeling To mulige udfald: Succes eller fiasko hvor succes er det, vi leder efter. Succes-sandsynligheden fiasko-sandsynligheden : antal uafhængige forsøg SSH. For at få bestemt x: og variansen af bestemt x: fordi sandsynligheden altid summer som 1 Standardiseret normalfordeling Middelværdien er 0 og variansen og standardafvigelsen er 1 Der kan transformeres til standardnormalfordelingen: giver en værdi i Z-fordelingen som svarer til en SSH. DETTE ER SVARET. Hvis: Z er negativ Approksimation af binomialfordeling til normalfordeling Fra kategorisk til numerisk. Har man mange observationer, så ligner binomialfordelingen næsten en kontinuert linje. Vi approksimerer, fordi binomialfordelingen fordi den er meget regnetung. 27/28

28 Må anvendes når (tommelfingerregel). (altså: variansen skal være større end 5). Det gælder fra ca. Udføres vha. transformation: Sandsynlighederne findes ved: 28/28

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

Forelæsning 11: Kapitel 11: Regressionsanalyse

Forelæsning 11: Kapitel 11: Regressionsanalyse Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Lineær regression. Simpel regression. Model. ofte bruges følgende notation: Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm Kon densintervaller og vurdering af estimaters usikkerhed Claus Thorn Ekstrøm KU Biostatistik ekstrom@sund.ku.dk Marts 18, 2019 Slides @ biostatistics.dk/talks/ 1 Population og stikprøve 2 Stikprøvevariation

Læs mere

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som MLR antagelserne Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + u, hvor β 0, β 1, β 2,...,β k er ukendte parametere,

Læs mere

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Anvendt Statistik Lektion 7. Simpel Lineær Regression Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot

Læs mere

Fagplan for statistik, efteråret 2015

Fagplan for statistik, efteråret 2015 Side 1 af 7 M Fagplan for statistik, efteråret 20 Litteratur Kenneth Hansen & Charlotte Koldsø (HK): Statistik I økonomisk perspektiv, Hans Reitzels Forlag 2012, 2. udgave, ISBN 9788741256047 HypoStat

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)

Læs mere

Modul 11: Simpel lineær regression

Modul 11: Simpel lineær regression Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 11: Simpel lineær regression 11.1 Regression uden gentagelser............................. 1 11.1.1 Oversigt....................................

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning

Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning Side 1 af 6 Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning Litteratur: Kenneth Hansen & Charlotte Koldsø: Statistik I økonomisk perspektiv, Hans Reitzels Forlag 2012, 2. udgave,

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke

Læs mere

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller

Læs mere

Statistik Lektion 16 Multipel Lineær Regression

Statistik Lektion 16 Multipel Lineær Regression Statistik Lektion 6 Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk

Læs mere

Statistik vejledende læreplan og læringsmål, efteråret 2013 SmartLearning

Statistik vejledende læreplan og læringsmål, efteråret 2013 SmartLearning Side 1 af 6 Statistik vejledende læreplan og læringsmål, efteråret 2013 SmartLearning Litteratur: Kenneth Hansen & Charlotte Koldsø: Statistik I økonomisk perspektiv, Hans Reitzels Forlag 2012, 2. udgave,

Læs mere

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større

Læs mere

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Multipel Lineær Regression

Multipel Lineær Regression Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer

Læs mere

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen Statistik Lektion 3 Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen Repetition En stokastisk variabel er en funktion defineret på S (udfaldsrummet, der antager

Læs mere

Løsning til eksaminen d. 29. maj 2009

Løsning til eksaminen d. 29. maj 2009 DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Løsning til eksamen d.27 Maj 2010

Løsning til eksamen d.27 Maj 2010 DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1

Læs mere

Multipel regression. Data fra opgave 3 side 453: Multipel regressionsmodel: Y = α + β 1 x 1 + β 2 x 2 + ǫ. hvor ǫ N(0, σ 2 ).

Multipel regression. Data fra opgave 3 side 453: Multipel regressionsmodel: Y = α + β 1 x 1 + β 2 x 2 + ǫ. hvor ǫ N(0, σ 2 ). Program 1. multipel regression 2. polynomiel regression (og andre kurver) 3. kategoriske variable 4. Determinationkoefficient og justeret determinationskoefficient 5. ANOVA-tabel 1/13 Multipel regression

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan

Læs mere

Økonometri Lektion 1 Simpel Lineær Regression 1/31

Økonometri Lektion 1 Simpel Lineær Regression 1/31 Økonometri Lektion 1 Simpel Lineær Regression 1/31 Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Statistisk model: Vi antager at sammenhængen

Læs mere

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05 Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =

Læs mere

Nanostatistik: Opgavebesvarelser

Nanostatistik: Opgavebesvarelser Nanostatistik: Opgavebesvarelser JLJ Nanostatistik: Opgavebesvarelser p. 1/16 Pakkemaskine En producent hævder at poserne indeholder i gennemsnit 16 ounces sukker. Data: 10 pakker sukker: 16.1, 15.8, 15.8,

Læs mere

Økonometri lektion 5 Multipel Lineær Regression. Inferens Modelkontrol Prædiktion

Økonometri lektion 5 Multipel Lineær Regression. Inferens Modelkontrol Prædiktion Økonometri lektion 5 Multipel Lineær Regression Inferens Modelkontrol Prædiktion Multipel Lineær Regression Data: Sæt af oservationer (x i, x i,, x ki, y i, i,,n y i er den afhængige variael x i, x i,,

Læs mere

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala 3 5% 5% 5% 0 3 4 5 6 7 8 9 0 Statistik for biologer 005-6, modul 5: Normalfordelingen opstår når mange forskellige faktorer uafhængigt af hinanden bidrager med additiv variation til. F.eks. Højde af rekrutter

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 Indledning 2 Ensidet variansanalyse 3 Blokforsøg 4 Vekselvirkning 1 Indledning 2 Ensidet

Læs mere

Skriftlig eksamen Science statistik- ST501

Skriftlig eksamen Science statistik- ST501 SYDDANSK UNIVERSITET INSTITUT FOR MATEMATIK OG DATALOGI Skriftlig eksamen Science statistik- ST501 Torsdag den 21. januar Opgavesættet består af 5 opgaver, med i alt 13 delspørgsmål, som vægtes ligeligt.

Læs mere

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i. Repetition af vektor-regning Økonometri: Lektion 3 Matrix-formulering Fordelingsantagelse Hypotesetest Antag vi har to n-dimensionelle (søjle)vektorer a 1 b 1 a 2 a =. og b = b 2. a n b n Tænk på a og

Læs mere

To samhørende variable

To samhørende variable To samhørende variable Statistik er tal brugt som argumenter. - Leonard Louis Levinsen Antagatviharn observationspar x 1, y 1,, x n,y n. Betragt de to tilsvarende variable x og y. Hvordan måles sammenhængen

Læs mere

Kvantitative Metoder 1 - Forår 2007

Kvantitative Metoder 1 - Forår 2007 Dagens program Kapitel 8.7, 8.8 og 8.10 Momenter af gennemsnit og andele kap. 8.7 Eksempel med simulationer Den centrale grænseværdisætning (Central Limit Theorem) kap. 8.8 Simulationer Normalfordelte

Læs mere

Simpel Lineær Regression

Simpel Lineær Regression Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Vi antager at sammenhængen mellem y og x er beskrevet ved y = β 0 + β 1 x + u. y: Afhængige

Læs mere

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at Likelihood teori Lineær regression (intro) Dagens Emner Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 1 ) = ( 2πσ 2)n/2 e 1 2 P n (xi µ)2 er tætheden som funktion af

Læs mere

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede fordelinger (kap. 4) Middelværdi og varians (kap. 3-4) Fordelingsresultater

Læs mere

Modul 12: Regression og korrelation

Modul 12: Regression og korrelation Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 12: Regression og korrelation 12.1 Sammenligning af to regressionslinier........................ 1 12.1.1 Test for ens hældning............................

Læs mere

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater Økonometri: Lektion 4 Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater 1 / 35 Hypotesetest for én parameter Antag vi har model y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

To-sidet varians analyse

To-sidet varians analyse To-sidet varians analyse Repetition En-sidet ANOVA Parvise sammenligninger, Tukey s test Model begrebet To-sidet ANOVA Tre-sidet ANOVA Blok design SPSS ANOVA - definition ANOVA (ANalysis Of VAriance),

Læs mere

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele Anvendt Statistik Lektion 4 Hypotesetest generelt Test for middelværdi Test for andele Hypoteser og Test Hypotese I statistik er en hypotese en påstand om en populationsparameter. Typisk en påstand om

Læs mere

Økonometri: Lektion 2 Multipel Lineær Regression 1/27

Økonometri: Lektion 2 Multipel Lineær Regression 1/27 Økonometri: Lektion 2 Multipel Lineær Regression 1/27 Multipel Lineær Regression Sidst så vi på simpel lineær regression, hvor y er forklaret af én variabel. Der er intet, der forhindre os i at have mere

Læs mere

Statistik Lektion 4. Variansanalyse Modelkontrol

Statistik Lektion 4. Variansanalyse Modelkontrol Statistik Lektion 4 Variansanalyse Modelkontrol Eksempel Spørgsmål: Er der sammenhæng mellem udetemperaturen og forbruget af gas? Y : Forbrug af gas (gas) X : Udetemperatur (temp) Scatterplot SPSS: Estimerede

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af

Læs mere

Modul 7: Eksempler. 7.1 Beskrivende dataanalyse. 7.1.1 Diagrammer. Bent Jørgensen. Forskningsenheden for Statistik ST501: Science Statistik

Modul 7: Eksempler. 7.1 Beskrivende dataanalyse. 7.1.1 Diagrammer. Bent Jørgensen. Forskningsenheden for Statistik ST501: Science Statistik Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 7: Eksempler 7.1 Beskrivende dataanalyse............................... 1 7.1.1 Diagrammer.................................

Læs mere

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning 1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion

Læs mere

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x) Formelsamlingen 1 Regneregler for middelværdier M(a + bx) a + bm X M(X+Y) M X +M Y Spredning varians og standardafvigelse VAR(X) 1 n n i1 ( X i - M x ) 2 Y a + bx VAR(Y) VAR(a+bX) b²var(x) 2 Kovariansen

Læs mere

Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Dagens tema: Indfør centrale statistiske begreber. Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i

Læs mere

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2

Læs mere

Statistik II 4. Lektion. Logistisk regression

Statistik II 4. Lektion. Logistisk regression Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:

Læs mere

Statistik Lektion 2. Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var.

Statistik Lektion 2. Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var. Statistik Lektion Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var. Repetition Stikprøve Stikprøvestørrelse n Stikprøvemiddelværdi Stikprøvevarians s Population

Læs mere

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test Ikkeparametriske metoder Repetition Wilcoxon SignedRank Test KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd I dag Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik SaSt) Helle Sørensen Først lidt om de sidste uger af SaSt. Derefter statistisk analyse af en enkelt

Læs mere

Forsøgsplanlægning Stikprøvestørrelse

Forsøgsplanlægning Stikprøvestørrelse Basal statistik Esben Budtz-Jørgensen 6. november 2007 Forsøgsplanlægning Stikprøvestørrelse 1 41 Planlægning af et studie Videnskabelig hypotese Endpoints Instrumentelle/eksponerings variable Variationskilder

Læs mere

Kvantitative metoder 2

Kvantitative metoder 2 Kvantitative metoder Heteroskedasticitet 11. april 007 KM: F18 1 Oversigt: Heteroskedasticitet OLS estimation under heteroskedasticitet (W.8.1-): Konsekvenser af heteroskedasticitet for OLS Gyldige test

Læs mere

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling.

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling. Eksempel: dæktyper og brændstofforbrug (opgave 25 side 319) Program: cars 1 2 3 4 5... radial 4.2 4.7 6.6 7.0 6.7... belt 4.1 4.9 6.2 6.9 6.8... Muligheder: 1. vi starter med at gennemgå opgave 7 side

Læs mere

Kapitel 7 Forskelle mellem centraltendenser

Kapitel 7 Forskelle mellem centraltendenser Kapitel 7 Forskelle mellem centraltendenser Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 29 Indledning 1. z-test for ukorrelerede data 2. t-test for ukorrelerede data med ens

Læs mere

Simpel Lineær Regression: Model

Simpel Lineær Regression: Model Simpel Lineær Regression: Model Sidst så vi på simpel lineære regression. Det er en statisisk model på formen y = β 0 + β 1 x + u, hvor fejlledet u, har egenskaben E[u x] = 0. Dette betyder bl.a. E[y x]

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22 Dagens Emner Likelihood teori Lineær regression (intro) p. 1/22 Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 ) = ( 1 2πσ 2)n/2 e 1 2σ 2 P n (x i µ) 2 er tætheden som

Læs mere

2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900.

2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900. 2 -fordeling og 2 -test Generelt om 2 -fordelingen 2 -fordelingen er en kontinuert fordeling, modsat binomialfordelingen som er en diskret fordeling. Fordelingen er særdeles kompleks at beskrive med matematiske

Læs mere

Elementær sandsynlighedsregning

Elementær sandsynlighedsregning Elementær sandsynlighedsregning Sandsynlighedsbegrebet Et udfaldsrum S er mængden af alle de mulige udfald af et eksperiment. En hændelse A er en delmængde af udfaldsrummet S. Et sandsynlighedsmål er en

Læs mere

Statistik og Sandsynlighedsregning 2

Statistik og Sandsynlighedsregning 2 Statistik og Sandsynlighedsregning 2 Lineære transformationer, middelværdi og varians Helle Sørensen Uge 8, onsdag SaSt2 (Uge 8, onsdag) Lineære transf. og middelværdi 1 / 15 Program I formiddag: Fordeling

Læs mere

Motivation. Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser

Motivation. Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser Motivation Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser Rasmus Waagepetersen October 26, 2018 Eksempel: En landmåler får til opgave at måle længden λ fra A til B. Entreprenøren

Læs mere

Module 3: Statistiske modeller

Module 3: Statistiske modeller Department of Statistics ST502: Statistisk modellering Pia Veldt Larsen Module 3: Statistiske modeller 31 ANOVA 1 32 Variabelselektion 4 321 Multipel determinationskoefficient 5 322 Variabelselektion med

Læs mere

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok Opgave 1 Vejledende besvarelse af eksamen i Statistik for biokemikere, blok 2 2006 Inge Henningsen og Niels Richard Hansen Analysevariablen i denne opgave er variablen forskel, der for hver af 10 kvinder

Læs mere

Vejledende besvarelser til opgaver i kapitel 14

Vejledende besvarelser til opgaver i kapitel 14 Vejledende besvarelser til opgaver i kapitel 14 Opgave 1 a) Det første trin i opstillingen af en hypotesetest er at formulere to hypoteser, hvoraf den ene støtter den teori vi vil teste, mens den anden

Læs mere

4 Oversigt over kapitel 4

4 Oversigt over kapitel 4 IMM, 2002-09-14 Poul Thyregod 4 Oversigt over kapitel 4 Introduktion Hidtil har vi beskæftiget os med data. Når data repræsenterer gentagne observationer (i bred forstand) af et fænomen, kan det være bekvemt

Læs mere

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model Reminder: Hypotesetest for én parameter Antag vi har model Økonometri: Lektion 4 F -test Justeret R 2 Aymptotiske resultater y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi ønsker at teste hypotesen H

Læs mere

Note om Monte Carlo metoden

Note om Monte Carlo metoden Note om Monte Carlo metoden Kasper K. Berthelsen Version 1.2 25. marts 2014 1 Introduktion Betegnelsen Monte Carlo dækker over en lang række metoder. Fælles for disse metoder er, at de anvendes til at

Læs mere

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9 Indhold 1 Ensidet variansanalyse 2 1.1 Estimation af middelværdier............................... 3 1.2 Estimation af standardafvigelse............................. 3 1.3 F-test for ens middelværdier...............................

Læs mere

Et eksempel på en todimensional normalfordeling Anders Milhøj September 2006

Et eksempel på en todimensional normalfordeling Anders Milhøj September 2006 Et eksempel på en todimensional normalfordeling Anders Milhøj September 006 I dette notat gennemgås et eksempel, der illustrerer den todimensionale normalfordelings egenskaber. Notatet lægger sig op af

Læs mere

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1 Økonometri 1 Inferens i den lineære regressionsmodel 2. oktober 2006 Økonometri 1: F8 1 Dagens program Opsamling om asymptotiske egenskaber: Asymptotisk normalitet Asymptotisk efficiens Test af flere lineære

Læs mere

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 13: Summary Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Statistisk Model

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Statistisk Model Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Statistisk Model Indhold Binomialfordeling Sandsynlighedsfunktion Middelværdi og spredning 1 Aalen: Innføring i statistik med medisinske eksempler

Læs mere

Økonometri: Lektion 6 Emne: Heteroskedasticitet

Økonometri: Lektion 6 Emne: Heteroskedasticitet Økonometri: Lektion 6 Emne: Heteroskedasticitet 1 / 32 Konsekvenser af Heteroskedasticitet Antag her (og i resten) at MLR.1 til MLR.4 er opfyldt. Antag MLR.5 ikke er opfyldt, dvs. vi har heteroskedastiske

Læs mere

Modul 6: Regression og kalibrering

Modul 6: Regression og kalibrering Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 6: Regression og kalibrering 6.1 Årsag og virkning................................... 1 6.2 Kovarians og korrelation...............................

Læs mere

Appendiks Økonometrisk teori... II

Appendiks Økonometrisk teori... II Appendiks Økonometrisk teori... II De klassiske SLR-antagelser... II Hypotesetest... VII Regressioner... VIII Inflation:... VIII Test for SLR antagelser... IX Reset-test... IX Plots... X Breusch-Pagan

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination

Læs mere

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se Epidemiologi og biostatistik. Uge, torsdag 5. februar 00 Morten Frydenberg, Institut for Biostatistik. Type og type fejl Statistisk styrke Nogle speciale metoder: Normalfordelte data : t-test eksakte sikkerhedsintervaller

Læs mere

Normalfordelingen og Stikprøvefordelinger

Normalfordelingen og Stikprøvefordelinger Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 14. december 2009 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede

Læs mere

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset 02402 Vejledende løsninger til Splus-opgaverne fra hele kurset Vejledende løsning SPL3.3.1 Der er tale om en binomialfordeling med n =10ogp=0.6, og den angivne sandsynlighed er P (X =4) som i bogen også

Læs mere

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136 Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 36 Det er besværligt at regne med binomialfordelingen, og man vælger derfor ofte at bruge en approksimation med normalfordeling. Man

Læs mere

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. 1/23 Opsummering af fordelinger X 1. Kendt σ: Z = X µ σ/ n N(0,1)

Læs mere

Lagrange multiplier test. Økonometri: Lektion 6 Håndtering ad heteroskedasticitet. Konsekvenser af Heteroskedasticitet

Lagrange multiplier test. Økonometri: Lektion 6 Håndtering ad heteroskedasticitet. Konsekvenser af Heteroskedasticitet Lagrange multiplier test Et alternativ til F -testet af en eller flere parametre. Økonometri: Lektion 6 Håndtering ad heteroskedasticitet Antag vi har model: y = β 0 + β 1 x 2 + + β k x k + u. Vi ønsker

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Kursus 242 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik Bygning 35/324 Danmarks Tekniske Universitet 28 Lyngby Danmark e-mail:

Læs mere