Modul 7: Forsøgsplanlægning

Størrelse: px
Starte visningen fra side:

Download "Modul 7: Forsøgsplanlægning"

Transkript

1 Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 7: Forsøgsplanlægning 7.1 Lidt om forsøgsplanlægning Sammenligning af grupper Valg af antal grupper og antal observationer Randomisering Parring og blokning Sammenligning af varianser Sammenligning af middelværdier Problemstilling Model og kontrol af modellen Variationen inden for gupper Variation mellem grupper Total variation ANOVA-tabel F-test Eksempel: prostatabehandling Vigtige begreber i forsøgsplanlægning Variation, replikation og stikprøver Udvælgelse af forsøgsenheder Forskellige typer af forsøgsplaner Kontrollerede forsøg Observationsstudier Oversigt Eksempler på forsøgsplanlægning Kantinebenyttelse Forsøgsplan: latinsk kvadrat Eksempel: Proteomics Nogle problematiske cases Lidt om forsøgsplanlægning Yvonne: Where were you last night? Rick: That s so long ago, I don t remember. Yvonne: Will I see you tonight? Rick: I never make plans that far ahead. [Casablanca, 1942]

2 7.1 Lidt om forsøgsplanlægning Sammenligning af grupper Vi ønsker at sammenligne forskellige grupper, baseret på data fra grupperne. Vi ønsker at teste mod H 0 : grupperne er ens H a : nogen afgrupperne er forskellige samt i givet fald at vurdere hvor store forskellene er mellem grupperne. Eksempler: 1. Sammenligning af forskellige algoritmer med hensyn til hastighed. 2. Sammenligning af holdbarheden for madvarer med forskellige typer konserveringsmiddel. 3. Sammenligning af forskellige befolkningsgrupper. Ordet faktor bruges som generel betegnelse for grupper eller behandlinger Valg af antal grupper og antal observationer Simpleste tilfælde: to grupper, f.eks.sammenlig ny og gammel metode (modul 5). Generelt: sammenligning af tre eller flere grupper, f.eks. alle produkter på markedet. Metode: Énvejs variansanalyse, se afsnit 7.3. Antallet af grupper bør holdes under 10. Hver gruppe bør have mindst 2 eller 3 observationer. Balanceret design: hvis alle grupper har samme antal observationer Randomisering Behandlingerne bør tildeles ved randomisering (tilfældigt). Dette kaldes et fuldstændigt randomiseret forsøg. Eksempel: To typer hardware skal sammenlignes med hensyn til holdbarhed. 1. Der er 20 PC-er af ret forskellig slags til rådighed. 2. Disse deles tilfældigt i to grupper på hver Den ene gruppe bruger den første type hardware og den anden gruppe bruger den anden type hardware. 4. Holbarheden gøres op for hver type hardware. Randomiseringen sikrer, at eventuelle forskelle i holdbarhed må tilskrives hardwaren.

3 7.2 Sammenligning af varianser Parring og blokning Eksempel: To algoritmer til primtalsfaktorisering skal sammenlignes. Der er 100 test cases til rådighed, i form af forskellige tal, som skal faktoriseres. Begge algoritmer bruges på hver testcase (parret forsøgsplan), hvorefter de to algoritmer sammenlignes ved hjælp af et parret t-test. Man taler om blokning, hvis forsøgsmaterialet er til rådighed i form af blokke af homogent materiale, mens blokkene er indbyrdes forskellige. Man bør sammenligne behandlinger inden for blokke, for at fremhæve forskelle mellem behandlingerne. 7.2 Sammenligning af varianser Vi ønsker at sammenligne varinaserne fra to grupper ud fra to sæt af observationer: 1. x 1,...,x n1 fra gruppe y 1,...,y n2 fra gruppe 2. Nøglestørrelser: x, ȳ, s 2 x og s 2 y. Model: X 1,...,X n1 og Y 1,...,Y n2 uafhængige stokastiske variable så Vi ønsker at teste hypotesen Gruppe 1 : X i = µ 1 + ɛ 1i med ɛ 1i N ( 0,σ 2 1). Gruppe 2 : Y i = µ 2 + ɛ 2i med ɛ 2i N ( 0,σ 2 2). H 0 : σ 2 1 = σ2 2 mod den alternative hypotese H a at σ 2 1 σ2 2. Teststørrelse F = S2 x S 2 y Hvis H 0 er sand gælder F F f1,f 2, altså at F følger en F-fordeling med frihedsgrader f 1 = n 1 1 og f 2 = n 2 1. Bemærk at 1 F = S2 y Sx 2 F f2,f 1,

4 7.3 Sammenligning af middelværdier 4 På grund af asymmetrien er acceptområdet A for denne test (niveau α) givet ved 1 F f2,f 1 ;1 α/2 = F f1,f 2 ;α/2 < F < F f1,f 2 ;1 α/2 Eksempel 4.5: Fusion af vand, Teststørrelse: Estimater: n ˆµ i s Elektrisk Blandet F(x,y) = = Tabelopslag (tabel A.6) baseret på α = 10%: Da F 12,7;0.95 F 10,7;0.95 = = F 7,12; = < < ligger F(x,y) i acceptområdet. Dermed kan vi acceptere hypotesen H 0, at de to varianser er ens. Tommelfingerregel: Værdier F > 5 eller F < 0.2 er signifikante (α = 0.05) hvis f 1 +f 2 > 15. Sammenligning af flere varianser: se nedenfor. 7.3 Sammenligning af middelværdier Problemstilling Envejs variansanalyse = analyse af effekten af én faktor. Formål: at sammenligne k populationer. Design: Et fuldstændigt randomiseret forsøg. Enten: 1. Der udtrækkes k uafhængige stikprøver, én fra hver af de k populationer. Eller: 2. Der udtrækkes k uafhængige stikprøver fra en population. De k stikprøver tildeles tilfældigt de k forskellige behandlinger.

5 7.3 Sammenligning af middelværdier 5 Eksempel 7.1: Prostatabehandling: Nøglestørrelser: Behandling Forøgelse af urinflow (ml/sec) ȳ i s i Medicin 1.1, 1.4, 1.3, 1.9, Mikrobølge 2.9, 3.7, 3.4, 3.4, 2.8, Kirurgi 4.0, 5.2, 5.0, Gennemsnit i gruppe i: 2. Gennemsnit over alle observationer: n i Y i = j=1 Y ij Y = k n i i=1 j=1 Y ij 3. Variansestimat i gruppe i: S 2 i = 1 n i Model og kontrol af modellen n i j=1 (Y ij Y i ) 2 Normalfordelt variation i hver stikprøve (lav k QQ-plots). Middelværdier betegnes µ 1, µ 2,...,µ k. Varianser betegnes σ 2 1, σ2 2,...,σ2 k Model: For hvert i: Y ij = µ i + ɛ ij, ɛ ij N(0,σ 2 i ), j = 1,2,...,n i Samlet antal observationer: n = Alle n observationer antages uafhængige. k i=1 n i Sammenligning af varianser: Udregn kvotienten mellem den største og den mindste varians: F(x,y) = s2 max s 2 min = = Nu er F ikke længere F-fordelt. Meget grov vurdering: F må ikke være større end 5 (OK i eksemplet).

6 7.3 Sammenligning af middelværdier 6 Vi antager dermed varianshomogenitet: σ1 2 = σ2 2 = = σ2 k Den fælles varians betegnes σ Variationen inden for gupper SSE måler variationen inden for grupper: SSE = k n i (Y ij Y i ) 2 i=1 j=1 med n k frihedsgrader. Varians inden for grupper (estimat for σ 2 ): MSE = SSE n k Svarer til poolet varians baseret på de k variansestimater s 2 1,...,s2 k Variation mellem grupper SSM måler variationen mellem grupper: med k 1 frihedsgrader. k SSM = n i (Y i Y ) 2 i=1 Varians mellem grupper: Måler forskellen mellem grupperne. MSM = SSM k Total variation SSTO måler den totale variation: med n 1 frihedsgrader. Total varians: SSTO = k n i (Y ij Y ) 2 i=1 j=1 MSTO = SSTO n 1 Estimator for σ 2 når alle µ i er ens (men det er de måske ikke).

7 7.3 Sammenligning af middelværdier ANOVA-tabel Resultater samles i ANOVA-tabel (variansanalysetabel): Variationskilde DF SS MS F p-værdi Grupper k 1 SSM MSM MSM MSE p Fejl n k SSE MSE Total n 1 SSTO Man kan vise at kvadratsummerne opfylder: SSTO = SSM + SSE Dermed angiver linien Total i tabellen summen af de to kvadratsummer i søjlen. Tilsvarende er n 1 det totale antal frihedsgrader F-test Nulhypotese Alternativ hypotese H 0 : µ 1 = µ 2 = = µ k. H a : ikke alle µ i er ens. Teststørrelse: F = MSM MSE Fordeling: F F-fordelt med k 1, n k frihedsgrader (se tabel A.6). Man kan vise at de to variansestimatorer MSM og MSE er indbyrdes uafhængige. Ensidet test: forkast hvis F er større end tabelopslaget. Beslutningsregel: Forkast H 0, hvis F > F k 1,n k;1 α Konklusion: 1. Hvis H 0 accepteres: Udregn total MS MSTO = SSTO n 1 og lav 1 α konfidensinterval for det fælles µ: Y ± t n 1,1 α/2 MSTO n 2. Hvis H 0 forkastes: Lav konfidensintervaller for hvert µ i : Y i ± t n k,1 α/2 MSE n i

8 7.4 Vigtige begreber i forsøgsplanlægning Eksempel: prostatabehandling ANOVA-tabel for prostatabehandling Variationskilde DF SS MS F p-værdi Behandling Fejl Total Den lave p-værdi viser, at vi må forkaste H 0. Så mindst to af behandlingerne må være forskellige fra hinanden. Vi går videre som under 2. og laver konfidensintervaller for de tre µ i -er. Tabeloplsag: t 12,0.975 = Variansestimat: MSE = Medicin: 1.46 ± /5 2. Mikrobølge: 3.07 ± /6 (1.00, 1.92) 3. Kirurgi: 4.73 ± /4 (2.65, 3.49) (4.22, 5.24) At dømme efter konfidensintervallerne er der en klar forskel mellem de tre metoder, og kirurgi fremstår som den bedste metode. 7.4 Vigtige begreber i forsøgsplanlægning Her er nogle vigtige begreber i forsøgsplanlægning: Responsvariabel Y : det udfald som skal måles. Forsøgsenhed: den enkelte eksperimentelle enhed, hvorpå der skal måles. Enkeltforsøg: Når Y måles på en forsøgsenhed. Eksperimentel usikkerhed: tilfældig variation i responsvariablen. Replikation: når der laves flere uafhængige enkeltforsøg under identiske betingelser. Piloteksperiment: lille indledende forsøg. Faktorer og kovariable (forklarende variable): ting som kan have indflydelse på udfaldet.

9 7.5 Variation, replikation og stikprøver 9 Behandling: faktor(er) af særlig interesse. Confounders: alle andre vigtige faktorer (observeret eller ej). Blok: sæt of enheder som er ens, f.eks. fra samme batch af forsøgsmateriale. Blokningsfaktor: en faktor som skelner mellem blokke. Blindforsøg: når behandlingen holdes skjult for observatøren. Hovedstrategi: Kontrollér hvad du kan, og lav randomisering for resten. Kontrollere: at tage en faktor i betragtning. Formindsker den eksperimentelle fejl. Randomisering: tildel behandlingerne tilfældigt til forsøgsenhederne. Ukontrollerede confoundere vil forøge den eksperimentells fejl. TAG RANDOMISERING ALVORLIGT! Randomisering: når ethvert medlem af populationen har samme sandsynlighed for at komme med i stikprøven. 7.5 Variation, replikation og stikprøver Replikation er afgørende for at kunne estimere størrelsen af den experimentelle fejl. Den eksperimentelle fejl måles ved s, også kaldet SD (standard deviation). Lav tilfældig stikprøve Y 1,...,Y n og udregn Ȳ og SD. SD måler den grundlæggende variation. Nøjagtighed af Ȳ som estimator for middelværdi µ er givet ved standard error: SE = SD n Lille SE kræver lille SD, stort n, elle begge dele. Er du i tvivl, så begynd med n = 3.

10 7.5 Variation, replikation og stikprøver 10 Hvor mange replikationer? Figure 1: SE som funktion af n. Lav foreløbigt estimat for SD ved pilotforsøg. Hvor mange replikationer? Nok til at få SE ned! Type I og type II fejl når to behandliger sammenlignes: Eksperiment: Ingen forskel Forskel Verden: Ingen forskel Korrekt Type I fejl Forskel Type II fejl Korrekt

11 7.6 Udvælgelse af forsøgsenheder 11 Hold sandsynligheden for type I fejl fast på lille værdi (α = 5%). Gør sandsynligheden for type II fejl mindre ved at forøge antallet af replikationer. 7.6 Udvælgelse af forsøgsenheder Stikprøver, strata og blokke Population: gruppe der ønskes information om. Stikprøve: gruppe der skal undersøges. Sampling error: Usikkerhed ved at drage konklusioner om populationen ud fra stikprøven. Påvirkes af eksperimentel usikkerhed og antal replikationer. Forsøgsplan: skal repræsentere populationen bedst muligt. skal være økonomisk/ logistisk/ tidsmæssigt muligt. skal formindske sampling error mest muligt. Klyngeudvalg: Populationen opdelt i disjunkte grupper (relevante) for eksempel mænd/kvinder, ny/ældre model, 5 ens maskiner,... Lav evt. stratificeret sampling. Eksempel: Der skal udtrækkes en tilfældig stikprøve på 1000 danskere, som skal interviewes. Det er meget tidkrævende at gennemføre 1000 interviews alle mulige steder i landet. I stedet udvælges tilfældigt 10 kommuner (klynger), hvorefter der udtrækkes 100 personer tilfældigt i hver kommune. Dette er mindre tidkrævende.

12 7.7 Forskellige typer af forsøgsplaner 12 Clusters: Kun muligt at få stikprøve fra en vis gruppe af populationen for eksempel spørg folk på gågaden i Odense/Århus/Kbh Husk på det, når konklusioner skal drages! Blokke: Blokke er strata af homogene enheder, hvor forskellen mellem blokke er tilfældige. Formålet med blokke er at formindske sampling error. Dette opnås ved at sammenligne behandlinger inden for hver blok. eksempel: del en vævsprøve i to, og tildel behandling A til den ene og B til den anden. eksempel: paneldata: spørg det samme panel af vælgere gentagne gange, for at få et sikrere estimat for bevægelser i vælgertilslutningen til et parti. 7.7 Forskellige typer af forsøgsplaner Kontrollerede forsøg Forsøgsenhed: element udvalgt til stikprøven Respons: resultat fra forsøgsenheden Faktor: opdeling af/ påvirkning af forsøgsenhederne faktorniveau og faktoreffekt Behandling/ treatment: systematisk ændring af en faktors niveauer replikation: gentagelse af behandling på flere forsøgsenheder Randomiseret forsøgsplan: tilfældig fordeling af behandlinger på forsøgsenhederne. Kontrolleret forsøg: Alle faktorer kan styres. Eksempler: Forsøgspersoner opdeles i behandlingsgruppe og placebogruppe

13 7.8 Oversigt 13 Reaktionshastighed måles ved 5 forskellige temperaturer Lufttryk måles i 200 gange ved forskellige højder over havoverfladen Usikkerhed: eksperimentel fejl Variation i respons fra forsøgsenheder på samme faktorniveau. Målefejl Variation i forsøgsenhederne Konfundering: To eller flere faktorer Hvis faktoreffekterne ikke kan adskilles (umuligt at vide hvilken faktor, der giver påvirkningen) for eksempel respons: antal børnefødsler i rumænsk by; F1: antal storke nær byen; F2: årstid Observationsstudier Forsøgsenhederne påvirkes ikke i forsøget. Responsen måles direkte på den valgte enhed for eksempel trafiktæthed på forskellige motorveje længden af regnorme forskellige steder forskel på rygere og ikke-rygere - hvilken gruppe får oftest kræft? database over diabetesfælde: gør behandlingseffekt op. 7.8 Oversigt Nogle grunde til at planlægge sit forsøg Tænk før du handler! Lidt planlægning kan spare en masse (laboratorie-) tid. Information bør indsamles så effektivt og så omhyggeligt som muligt. Lav en omhyggelig plan, og følg den omhyggeligt.

14 7.8 Oversigt 14 Overvej alle tænkelige kilder til fejl og variation. Statistik kan ikke redde et dårligt planlagt forsøg. Dårligt indsamlede data giver dårligt funderede konklusioner. Hvis du bryder reglerne, så gør det med åbne øjne. Før du starter Nogle overvejelser, som kan hjælpe dig i gang: Begynd med en klar hypotese. Lav et pilotforsøg, og tag eksisterende data i betragtning. Vær sikker på, at din forsøgsteknik er i orden. Observationsstudium eller kontrolleret forsøg? Feltarbejde, fabrik eller laboratorieforsøg? Udfør forsøget under varierende betingelser. Overvej årsag/virkning og confounders. Overvej stikprøvestørrelse versus præcision. Husk, at videnskab handler mere om at stille de rigtige spørgsmål end at besvare dem. Checkliste Overvej forsøgets formål. Lav et resumé af gældende viden og usikkerhed. Beslut dig for en strategi. Lav et pilotforsøg. Planlæg en enkelt forsøgsenhed. Planlæg hele forsøget. Etiske overvejelser. Udfør forsøget. Opdatér viden og usikkerhed. Genovervej forsøgets formål.

15 7.9 Eksempler på forsøgsplanlægning Eksempler på forsøgsplanlægning Kantinebenyttelse Formål: Undersøg, hvor stor en forskel, der er i antallet af kantinekunder mellem forelæsnigstid (15 over til 00) og pauser (00 to 15 over). Forhåndsviden: Der er langt færre kunder i forelæsningstiden. Usikkerheder: Antallet af kunder varierer som funktion af tid på dagen, ugedag, og måned. Strategi: Gå ind og tæl altallet af kunder i forelæsningstid og pauser, og sammenlign. Pilotforsøg: Foretag en tælling på en enkelt dag. Forsøgsenhed: Tælling på en bestemt dag og tid på dagen. Planlæg forsøget: Tæl i 5 uger, som er spredt ud over et semester. Tæl hver dag igennem ugen. Tæl formiddag, middag og eftermiddag hver dag. Etiske overvejelser: Kunderne må ikke forstyrres! Data indsamles: Kræver nok teamwork. Opdatér viden og usikkerhed. Genovervej forsøgets formål Forsøgsplan: latinsk kvadrat Kvadratisk tabel med to faktorer og én behandlingsfaktor. Eksempel: 5 5 latinsk kvadrat for ugerne A, B, C, D, E. Man Tir Ons Tor Fre 8 A B C D E 10 B C D E A 12 C D E A B 14 D E A B C 16 E A B C D Hver uge forekommer én gang for hver dag og for hvert tidspunkt. Bemærk at der opnås 80% reduktion af arbejdet!

16 7.9 Eksempler på forsøgsplanlægning Eksempel: Proteomics Responsvariabel Y : proteinekspression (højden af peak). Enheder: Patienter (40) Faktorer, som påvirker responsvariablen: Vævsprøver fra samme patient (2) Spektre fra samme vævsprøve (3) Køn (2) Malign (ja/nej) (2) Kontinuerte variable: alder, BMI, kolesterol, Nogle problematiske cases Case I: En studerende ønsker at måle bakterietilvæksten i en sø over sommeren. Han har målinger fra forår og efterår. Begge gange på tre forskellige dybder. Men ikke de samme tre dybder. Case II: En gruppe studerende skal undersøge hvilke typer legetøj grise helst vil lege med. (De har ingen indflydelse på forsøgsplanen.) 8 grise lukkes ind i et rum med 4-5 forskellige typer legetøj. Det noteres hvor mange, der leger med hvad. Forsøget gentages flere gange i træk med forskelligt legetøj. Nogle af de sidste forsøg skilte sig ud fra resten: de fleste grise lagde sig til at sove og legede slet ikke. Case III: En brandingeniør skal analysere 10 forsøg om brandsikkerhed i et ældrebofællelskab. Der ønskes max. grænse (99%) for hvor lang tid det tager at rømme huset. 2 plejere skal redde 8 mobilitetshæmmede beboere ud af brændende hus.

17 7.9 Eksempler på forsøgsplanlægning 17 Forsøget gentages to gange lige efter hinanden med de samme personer. De sidste forsøg tager længere tid end de første. Case IV: En biologistuderende sætter et videokamera op ved abegrotten i zoo. Efter 150 timer sætter han sig ned og ser videoerne igennem. Der dukker jo nok noget interessant op.

Program. 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12

Program. 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12 Program 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12 Ensidet variansanalyse: analyse af grupperede data Nedbrydningsrate for tre typer af opløsningsmidler (opgave 13.8 side 523) Sorption

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 12: Variansanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Dagens tema: Indfør centrale statistiske begreber. Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff. Envejs variansanalyse - eksempel

Oversigt. Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff. Envejs variansanalyse - eksempel Kursus 02402 Introduktion til Statistik Forelæsning 12: Variansanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 Indledning 2 Ensidet variansanalyse 3 Blokforsøg 4 Vekselvirkning 1 Indledning 2 Ensidet

Læs mere

To-sidet varians analyse

To-sidet varians analyse To-sidet varians analyse Repetition En-sidet ANOVA Parvise sammenligninger, Tukey s test Model begrebet To-sidet ANOVA Tre-sidet ANOVA Blok design SPSS ANOVA - definition ANOVA (ANalysis Of VAriance),

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Modul 12: Regression og korrelation

Modul 12: Regression og korrelation Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 12: Regression og korrelation 12.1 Sammenligning af to regressionslinier........................ 1 12.1.1 Test for ens hældning............................

Læs mere

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller

Læs mere

Program. Tosidet variansanalyse og forsøgsplanlægning. Repetition: ensidet variansanalyse. Eksempel: data fra Collinge et al

Program. Tosidet variansanalyse og forsøgsplanlægning. Repetition: ensidet variansanalyse. Eksempel: data fra Collinge et al Program Tosidet variansanalyse og forsøgsplanlægning Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Ensidet ANOVA: repetition og Collinge eksempel. Additiv tosidet ANOVA (blokforsøg) Tosidet ANOVA

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9 Indhold 1 Ensidet variansanalyse 2 1.1 Estimation af middelværdier............................... 3 1.2 Estimation af standardafvigelse............................. 3 1.3 F-test for ens middelværdier...............................

Læs mere

Normalfordelingen og Stikprøvefordelinger

Normalfordelingen og Stikprøvefordelinger Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger

Læs mere

Modul 11: Simpel lineær regression

Modul 11: Simpel lineær regression Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 11: Simpel lineær regression 11.1 Regression uden gentagelser............................. 1 11.1.1 Oversigt....................................

Læs mere

Module 4: Ensidig variansanalyse

Module 4: Ensidig variansanalyse Module 4: Ensidig variansanalyse 4.1 Analyse af én stikprøve................. 1 4.1.1 Estimation.................... 3 4.1.2 Modelkontrol................... 4 4.1.3 Hypotesetest................... 6 4.2

Læs mere

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Læs mere

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok Opgave 1 Vejledende besvarelse af eksamen i Statistik for biokemikere, blok 2 2006 Inge Henningsen og Niels Richard Hansen Analysevariablen i denne opgave er variablen forskel, der for hver af 10 kvinder

Læs mere

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

2 X 2 = Antal mygstik på enpersoniløbetaf1minut

2 X 2 = Antal mygstik på enpersoniløbetaf1minut Opgave I I mange statistiske undersøgelser bygger man analysen på anvendelse af normalfordelingen til (eventuelt tilnærmelsesvist) at beskrive den tilfældige variation. Spørgsmål I.1 (1): Forén af følgende

Læs mere

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske

Læs mere

Program. Forsøgsplanlægning og tosidet variansanalyse. Eksempel: fuldstændigt randomiseret forsøg. Forsøgstyper

Program. Forsøgsplanlægning og tosidet variansanalyse. Eksempel: fuldstændigt randomiseret forsøg. Forsøgstyper Program Forsøgsplanlægning og tosidet variansanalyse Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Forsøgstyper og forsøgsplanlægning Analyse af data fra fuldstændigt randomiseret blokforsøg: tosidet

Læs mere

Forsøgsplanlægning Stikprøvestørrelse

Forsøgsplanlægning Stikprøvestørrelse Basal statistik Esben Budtz-Jørgensen 6. november 2007 Forsøgsplanlægning Stikprøvestørrelse 1 41 Planlægning af et studie Videnskabelig hypotese Endpoints Instrumentelle/eksponerings variable Variationskilder

Læs mere

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =

Læs mere

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Lineær regression. Simpel regression. Model. ofte bruges følgende notation: Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til

Læs mere

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. 1/23 Opsummering af fordelinger X 1. Kendt σ: Z = X µ σ/ n N(0,1)

Læs mere

Nanostatistik: Test af hypotese

Nanostatistik: Test af hypotese Nanostatistik: Test af hypotese JLJ Nanostatistik: Test af hypotese p. 1/50 Repetition n uafhængige gentagne målinger: Fordelingsundersøgelse: Pindediagram / Histogram qq-plot Parameter: egenskab ved fordeling

Læs mere

Sidste gang: One-way(ensidet)/one-factor ANOVA I dag: Two-factor ANOVA (Analysis of variance) Two-factor ANOVA med interaktion

Sidste gang: One-way(ensidet)/one-factor ANOVA I dag: Two-factor ANOVA (Analysis of variance) Two-factor ANOVA med interaktion VARIANSANALYSE 2 Sidste gang: One-way(ensidet)/one-factor ANOVA I dag: (Analysis of variance) med interaktion Problem: Hvordan håndterer vi forsøg, hvor effekten er forårsaget af to faktorer og en evt.

Læs mere

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Anvendt Statistik Lektion 7. Simpel Lineær Regression Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot

Læs mere

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0 Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt

Læs mere

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05 Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j Hypoteser om mere end to stikprøver ANOVA k stikprøver: (ikke ordinale eller højere) H 0 : 1 2... k gælder også for k 2! H 0ij : i j H 0ij : i j simpelt forslag: k k 1 2 t-tests: i j DUER IKKE! Bonferroni!!

Læs mere

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større

Læs mere

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Stikprøver og stikprøve fordelinger Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Statistik Statistisk Inferens: Prediktere og forekaste værdier af

Læs mere

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet

Læs mere

Forelæsning 11: Envejs variansanalyse, ANOVA

Forelæsning 11: Envejs variansanalyse, ANOVA Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalyse, ANOVA Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling.

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling. Eksempel: dæktyper og brændstofforbrug (opgave 25 side 319) Program: cars 1 2 3 4 5... radial 4.2 4.7 6.6 7.0 6.7... belt 4.1 4.9 6.2 6.9 6.8... Muligheder: 1. vi starter med at gennemgå opgave 7 side

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 14. december 2009 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala 3 5% 5% 5% 0 3 4 5 6 7 8 9 0 Statistik for biologer 005-6, modul 5: Normalfordelingen opstår når mange forskellige faktorer uafhængigt af hinanden bidrager med additiv variation til. F.eks. Højde af rekrutter

Læs mere

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau... Indhold 1 Statistisk inferens: Hypotese og test 2 1.1 Nulhypotese - alternativ.................................. 2 1.2 Teststatistik........................................ 3 1.3 P-værdi..........................................

Læs mere

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse Basal statistik Esben Budtz-Jørgensen 4. november 2008 Forsøgsplanlægning Stikprøvestørrelse 1 46 Planlægning af et studie Videnskabelig hypotese Endpoints Instrumentelle/eksponerings variable Variationskilder

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd I dag Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik SaSt) Helle Sørensen Først lidt om de sidste uger af SaSt. Derefter statistisk analyse af en enkelt

Læs mere

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t. t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program (8.15-10): 1. repetition: fordeling af observatorer X, S 2 og t. 2. konfidens-intervaller, hypotese test, type I og type II fejl, styrke,

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af

Læs mere

Kapitel 11 Lineær regression

Kapitel 11 Lineær regression Kapitel 11 Lineær regression Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 1 Indledning Vi modellerer en afhængig variabel (responset) på baggrund af en uafhængig variabel (stimulus),

Læs mere

Forsøgsplanlægning Stikprøvestørrelse

Forsøgsplanlægning Stikprøvestørrelse Basal statistik Esben Budtz-Jørgensen 8. november 2011 Videnskabelig hypotese Planlægning af et studie Endpoints Forsøgsplanlægning Stikprøvestørrelse 1 51 Instrumentelle/eksponerings variable Variationskilder

Læs mere

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning

Læs mere

Opgaver til kapitel 3

Opgaver til kapitel 3 Opgaver til kapitel 3 3.1 En løber er interesseret i at undersøge om hendes løbeur er kalibreret korrekt. Hun udmåler derfor en strækning på præcis 1000 m og løber den 16 gange. For hver løbetur noterer

Læs mere

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau Hvad skal vi lave? 1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ. Teststatistik P-værdi Signifikansniveau 2 t-test for middelværdi Tosidet t-test for middelværdi Ensidet t-test for middelværdi

Læs mere

Løsning til eksaminen d. 29. maj 2009

Løsning til eksaminen d. 29. maj 2009 DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

k UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test)

k UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test) Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalse, ANOVA Peder Bacher DTU Compute, Dnamiske Sstemer Bgning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lngb Danmark e-mail:

Læs mere

Module 12: Mere om variansanalyse

Module 12: Mere om variansanalyse Module 12: Mere om variansanalyse 12.1 Parreded observationer.................. 1 12.2 Faktor med 2 niveauer (0-1 variabel)......... 3 12.3 Tosidig variansanalyse med tilfældig virkning..... 9 12.3.1 Uafhængighedsbetragtninger..........

Læs mere

Eksempel , opg. 2

Eksempel , opg. 2 Faktorer En faktor er en gruppering/inddeling af målinger/observationer pga. Tilsigtede variationer i en eller flere forsøgsparametre Nødvendige (potentielle) blok-effekter såsom gentagne målinger på samme

Læs mere

Nanostatistik: Opgavebesvarelser

Nanostatistik: Opgavebesvarelser Nanostatistik: Opgavebesvarelser JLJ Nanostatistik: Opgavebesvarelser p. 1/16 Pakkemaskine En producent hævder at poserne indeholder i gennemsnit 16 ounces sukker. Data: 10 pakker sukker: 16.1, 15.8, 15.8,

Læs mere

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning

Læs mere

StatDataN: Test af hypotese

StatDataN: Test af hypotese StatDataN: Test af hypotese JLJ StatDataN: Test af hypotese p. 1/69 Repetition n uafhængige gentagne målinger: Fordelingsundersøgelse: Pindediagram / Histogram qq-plot Parameter: egenskab ved fordeling

Læs mere

Model. k = 3 grupper: hvor ǫ ij uafhængige og normalfordelte med middelværdi nul og varians σi 2, i = 1,2,3.

Model. k = 3 grupper: hvor ǫ ij uafhængige og normalfordelte med middelværdi nul og varians σi 2, i = 1,2,3. Model Program (8.15-10): 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. Bruger nu to indices: i = 1,...,k for gruppenr. og j = 1,...,n i for observation indenfor gruppe. k = 3 grupper: µ 1

Læs mere

Vejledende besvarelser til opgaver i kapitel 14

Vejledende besvarelser til opgaver i kapitel 14 Vejledende besvarelser til opgaver i kapitel 14 Opgave 1 a) Det første trin i opstillingen af en hypotesetest er at formulere to hypoteser, hvoraf den ene støtter den teori vi vil teste, mens den anden

Læs mere

Tovejs-ANOVA (Faktoriel) Regler og problemer kan generaliseres til mere end to hovedfaktorer med tilhørende interaktioner

Tovejs-ANOVA (Faktoriel) Regler og problemer kan generaliseres til mere end to hovedfaktorer med tilhørende interaktioner Tovejs-ANOVA (Faktoriel) Regler og problemer kan generaliseres til mere end to hovedfaktorer med tilhørende interaktioner I modsætning til envejs-anova kan flervejs-anova udføres selv om der er kun én

Læs mere

1 Regressionsproblemet 2

1 Regressionsproblemet 2 Indhold 1 Regressionsproblemet 2 2 Simpel lineær regression 3 2.1 Mindste kvadraters tilpasning.............................. 3 2.2 Prædiktion og residualer................................. 5 2.3 Estimation

Læs mere

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3

Læs mere

Forelæsning 11: Kapitel 11: Regressionsanalyse

Forelæsning 11: Kapitel 11: Regressionsanalyse Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Løsning til eksamen d.27 Maj 2010

Løsning til eksamen d.27 Maj 2010 DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1

Læs mere

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier

Læs mere

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test Ikkeparametriske metoder Repetition Wilcoxon SignedRank Test KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Kapitel 13 Reliabilitet og enighed

Kapitel 13 Reliabilitet og enighed Kapitel 13 Reliabilitet og enighed Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 Version 11. april 2011 1 / 23 Indledning En observation er sammensat af en sand værdi og en målefejl

Læs mere

Skriftlig eksamen Science statistik- ST501

Skriftlig eksamen Science statistik- ST501 SYDDANSK UNIVERSITET INSTITUT FOR MATEMATIK OG DATALOGI Skriftlig eksamen Science statistik- ST501 Torsdag den 21. januar Opgavesættet består af 5 opgaver, med i alt 13 delspørgsmål, som vægtes ligeligt.

Læs mere

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning 1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion

Læs mere

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14 Module 5: Exercises 5.1 ph i blod.......................... 1 5.2 Medikamenters effektivitet............... 2 5.3 Reaktionstid........................ 3 5.4 Alkohol i blodet...................... 3 5.5

Læs mere

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

Nanostatistik: Konfidensinterval

Nanostatistik: Konfidensinterval Nanostatistik: Konfidensinterval JLJ Nanostatistik: Konfidensinterval p. 1/37 Fraktilpåmindelse u p : Φ(u p ) = p, Φ( z ) = 1 Φ( z ) t p [f] : F t[f] (t p [f]) = p, F t[f] ( t ) = 1 F t[f] ( t ) F-fordeling:

Læs mere

1 Sammenligning af 2 grupper Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver... 2

1 Sammenligning af 2 grupper Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver... 2 Indhold 1 Sammenligning af 2 grupper 2 1.1 Responsvariabel og forklarende variabel......................... 2 1.2 Afhængige/uafhængige stikprøver............................ 2 2 Sammenligning af 2 middelværdier

Læs mere

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. Eksamen i Statistik 1TS Teoretisk statistik Den skriftlige prøve Sommer 2005 3 timer - alle hjælpemidler tilladt Det er tilladt at skrive

Læs mere

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se Epidemiologi og biostatistik. Uge, torsdag 5. februar 00 Morten Frydenberg, Institut for Biostatistik. Type og type fejl Statistisk styrke Nogle speciale metoder: Normalfordelte data : t-test eksakte sikkerhedsintervaller

Læs mere

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Hvad skal vi lave? Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver

Hvad skal vi lave? Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver Hvad skal vi lave? 1 Sammenligning af 2 grupper Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver 2 Sammenligning af 2 middelværdier Uafhængige stikprøver Uafhængige stikprøver -

Læs mere

Statistik II 4. Lektion. Logistisk regression

Statistik II 4. Lektion. Logistisk regression Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:

Læs mere

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. Eksamen i Statistik 1TS Teoretisk statistik Den skriftlige prøve Sommer 2002 3 timer - alle hjælpemidler tilladt Det er tilladt at skrive

Læs mere

Kapitel 7 Forskelle mellem centraltendenser

Kapitel 7 Forskelle mellem centraltendenser Kapitel 7 Forskelle mellem centraltendenser Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 29 Indledning 1. z-test for ukorrelerede data 2. t-test for ukorrelerede data med ens

Læs mere

Note om Monte Carlo metoden

Note om Monte Carlo metoden Note om Monte Carlo metoden Kasper K. Berthelsen Version 1.2 25. marts 2014 1 Introduktion Betegnelsen Monte Carlo dækker over en lang række metoder. Fælles for disse metoder er, at de anvendes til at

Læs mere

Mikro-kursus i statistik 1. del. 24-11-2002 Mikrokursus i biostatistik 1

Mikro-kursus i statistik 1. del. 24-11-2002 Mikrokursus i biostatistik 1 Mikro-kursus i statistik 1. del 24-11-2002 Mikrokursus i biostatistik 1 Hvad er statistik? Det systematiske studium af tilfældighedernes spil!dyrkes af biostatistikere Anvendes som redskab til vurdering

Læs mere

Multipel regression. Data fra opgave 3 side 453: Multipel regressionsmodel: Y = α + β 1 x 1 + β 2 x 2 + ǫ. hvor ǫ N(0, σ 2 ).

Multipel regression. Data fra opgave 3 side 453: Multipel regressionsmodel: Y = α + β 1 x 1 + β 2 x 2 + ǫ. hvor ǫ N(0, σ 2 ). Program 1. multipel regression 2. polynomiel regression (og andre kurver) 3. kategoriske variable 4. Determinationkoefficient og justeret determinationskoefficient 5. ANOVA-tabel 1/13 Multipel regression

Læs mere

Module 3: Statistiske modeller

Module 3: Statistiske modeller Department of Statistics ST502: Statistisk modellering Pia Veldt Larsen Module 3: Statistiske modeller 31 ANOVA 1 32 Variabelselektion 4 321 Multipel determinationskoefficient 5 322 Variabelselektion med

Læs mere

Landmålingens fejlteori - Repetition - Fordeling af slutfejl - Lektion 8

Landmålingens fejlteori - Repetition - Fordeling af slutfejl - Lektion 8 Landmålingens fejlteori Repetition - Fordeling af slutfejl Lektion 8 - tvede@math.aau.dk http://www.math.aau.dk/ tvede/teaching/l4 Institut for Matematiske Fag Aalborg Universitet 15. maj 2008 1/13 Fordeling

Læs mere

Produkt og marked - matematiske og statistiske metoder

Produkt og marked - matematiske og statistiske metoder Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

13.1 Substrat Polynomiel regression Biomasse Kreatinin Læsefærdighed Protein og højde...

13.1 Substrat Polynomiel regression Biomasse Kreatinin Læsefærdighed Protein og højde... Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 13: Exercises 13.1 Substrat........................................ 1 13.2 Polynomiel regression................................

Læs mere

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede fordelinger (kap. 4) Middelværdi og varians (kap. 3-4) Fordelingsresultater

Læs mere

Modul 6: Regression og kalibrering

Modul 6: Regression og kalibrering Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 6: Regression og kalibrering 6.1 Årsag og virkning................................... 1 6.2 Kovarians og korrelation...............................

Læs mere

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen Landmålingens fejlteori Lektion Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet En stokastisk variabel er en variabel,

Læs mere