Forsøgsplanlægning Stikprøvestørrelse

Størrelse: px
Starte visningen fra side:

Download "Forsøgsplanlægning Stikprøvestørrelse"

Transkript

1 Basal statistik Esben Budtz-Jørgensen 8. november 2011 Videnskabelig hypotese Planlægning af et studie Endpoints Forsøgsplanlægning Stikprøvestørrelse 1 51 Instrumentelle/eksponerings variable Variationskilder Design af studie Eksperimentelt eller observationelt Tværsnits- eller longitudinel undersøgelse Prospektivt eller retrospektivt 1 Variationskilder Observatørvariation Instrumentvariation Målefejl Dag-til-dag variation indenfor individer Biologisk variation mellem individer Tilfældig variation Stikprøvestørrelse Hvor mange observationer skal vi bruge? Det kommer an på Forsøgsplanen Hvor store effekter man leder efter Hvor sikker man vil være på at finde dem 2 3

2 Repetition: Sammenligning af to grupper To uafhængige stikprøver: x 1,1,..., x 1,n1 og x 2,1,..., x 2,n2 Model: x 1,1,..., x 1,n1 N(µ 1, σ 2 ) og x 2,1,..., x 2,n2 N(µ 2, σ 2 ) dnorm(x) En normalfordeling i hver gruppe, men middelværdien kan være forskellig x Estimation µ 1 og µ 2 angiver populationsmiddelværdier. Disse parametre er ukendte, men på baggrund af data kan vi give et skøn (estimat) over deres værdi: µ 1 = x 1 = (x 1,1 + + x 1,n1 )/n 1, µ 2 = x 2 = (x 2,1 + + x 2,n2 )/n 2 dnorm(x, sd = sqrt(1/20)) x 4 5 Teststørrelsen t-testet x 2 x 1 t = s hvor s 2 er et poolet varians estimat: s 2 = σ 2 = n 1 1 n 1 +n 2 2 s2 1 + n 2 1 n 1 +n 2 2 s2 2 1 n n 2 Hvis hypotesen er sand følger teststørrelsen en t-fordeling med n 1 + n 2 2 frihedsgrader. H 0 forkastes når t er større end ca dt(t, 38) t-testet: p-værdien Hvis der ingen gruppeforskel er, så er der lille sandsynlighed for at få en t-værdi som er mindre end eller større end t 6 7

3 Type I og Type II fejl Et hypotesetest kan give forkert udslag på to måder: Type I fejl: Forkaste nulhypotesen selv om den er sand Type II fejl: Acceptere nulhypotesen selv om den er forkert Sandsynlighed for fejl: α resp. β α: ssh for type I fejl, Signifikansniveau (0.05, fx.) β: ssh for type II fejl 1 β: Styrke - sandsynlighed for at finde forskellen Bemærk. Styrken afhænger af hvor stor den faktiske forskel er. Hvis forskellen er stor, er der en stor chance for at vi forkaster hypotesen. Simulationsstudie I SAS simuleres observationer fra model uden forskel, dvs Model: x 1,1,..., x 1,25 N(0, 1) og x 2,1,..., x 2,25 N(0, 1) Der laves 1000 datasæt. I hvert beregnes t og gemmes. Bemærk, at middelværdien i begge grupper er 0, så her er hypotesen sand. 8 9 Simulationsstudie Model: x 1,1,..., x 1,25 N(0, 1) og x 2,1,..., x 2,25 N(0, 1) Fordeling af t: Hvad sker der hvis observationsantallet fordobles? Model: x 1,1,..., x 1,50 N(0, 1) og x 2,1,..., x 2,50 N(0, 1) Sandsynlighed for forkast: = Sandsynlighed for forkast: = Fordelingen er (stort set) uændret: Risiko for type 1 fejl afhænger ikke af observationsantallet. Den er konstant 5% (signifikansniveau)

4 Nu introduceres en niveauforskel Model: x 1,1,..., x 1,25 N(0, 1) og x 2,1,..., x 2,25 N(0.5, 1) n fordobles Model: x 1,1,..., x 1,50 N(0, 1) og x 2,1,..., x 2,50 N(0.5, 1) Bemærk: fordelingen er flyttet til højre Sandsynlighed for forkast: = dvs styrken er ca. 44% Bemærk: fordelingen er flyttet endnu mere til højre Sandsynlighed for forkast: = Styrken afhænger af observationsantallet Styrken som funktion af observationsantal og effekt Hvor mange observationer skal man bruge? Styrken vokser som funktion af den sande forskel mellem grupperne og antallet af observationer Styrken (1 β) og effekten (δ) fastsættes. Herefter kan man beregne hvor mange observationer der er nødvendige. Det svarer til at finde den kurve der går gennem skæringspunktet på tegningen - dvs et sted mellem 25 og 50 (i hver gruppe)

5 Matematisk formel for n (NB: Disse antager at spredningen er kendt. Pas på med meget små n) Generel formel for vilkårlige α og 1 β: n = 2 (z 1 α/2 + z 1 β ) 2 (σ/δ) 2 = 2 f(α, 1 β) (σ/δ) 2 næste side jo større gruppe-forskellen er jo mindre er det nødvendige antal observationer jo større variation indenfor grupper jo større er det nødvendige antal observationer En nyttig tabel Power: 1 β α f(α, 1 β) = (z 1 α/2 + z 1 β ) 2 (Fraktiler i normalfordelingen z p = Φ 1 (p), z = 1.96, osv.) Eksempel Antag vil finde finde en forskel på 5 (δ = 5) Vi være 90% procent sikre på at finde forskellen (1 β = 0.90) når vi tester på et 5% s niveau (α = 0.05) Spredning inden for grupper er 10 (σ = 10) Indsæt i formel n = 2 f(0.05, 0.9) (σ/δ) 2 = (10/5) 2 = 84.1 Det vil sige 85 i hver gruppe. I SAS Analyst Statistics Sample Size Two-Sample t-test I vinduet specificeres herefter: Calculate: N per group (alternativt bestemmes styrken for fast N) Group 1 mean: 0, Group 2 mean: 5 (eller 95 og 100, kun forskellen betyder noget) Standard deviation: 10, Alpha: 0.05 Power: From: 0.8 To: 0.95 By: 0.05 Tails: 2-sided 18 19

6 Output Two-Sample t-test Group 1 Mean = 0 Group 2 Mean = 5 Standard Deviation = 10 Alpha = Sided Test Power N per Group Bemærk at det nødvendige antal observationer (n) vokser som funktion af den ønskede styrke. For Power= 90% ses n=86. Før fik vi 85? Forskellen skyldes den at vores formel ser bort fra estimationsusikkerheden for spredningen σ. Herved bliver n lidt for lille. Opsummering Skal specificere Klinisk relevant forskel δ Standardafvigelsen indenfor grupper (σ) Signifikansniveau α (ofte 5%) Styrke 1 β (ofte 80% eller 90%) Hvordan fastsættes standardafvigelsen? Lignende undersøgelser Pilotforsøg Start forsøget og se på de første observationer Specificer standardiseret forskel δ/σ Eksempel Påvirker mælkeindtaget børns højde? 5-års børn i to grupper: Ekstra mælk i et år Kontrolgruppe Børn på 5 år vokser ca. 6 cm/år med en SD på 2 cm. Vil kunne opdage en forskel på 0.5 cm. Signifikansniveau 1%, styrke 90%. n = 2 (2cm/0.5cm) 2 f(0.01, 0.9) = = 476 pr. gruppe Parret t-test Niveauet i to grupper sammenlignes ved at teste om differenserne indenfor par (D i = X 1i X 2i ) har middelværdi 0. n kan beregnes ved men bemærk at n angiver antallet af par n = f(α, 1 β) (σ/δ) 2 σ angiver standard deviationen for differenser 22 23

7 n ved sammenligning af hyppigheder p 1 hyppighed i gruppe 1 p 2 hyppighed i gruppe 2 p = (p 1 + p 2 )/2 n antal i hver gruppe n = 2 f(α, 1 β) p(1 p) (p 2 p 1 ) 2 Baseret på normalfordelingsapproksimation, og p 1 ikke alt for langt fra p 2. Pas især på hvis n beregnes til at være så lille at der er forventede antal under 5. Beregning i SAS se side 26 To måder til afvænning af rygere Nyt tyggegummi Sædv. kontrolgruppe Eksempel Normalt holder 15% op efter 6 måneder. Håber på at komme op på 30%. Ønsker at kunne finde forskellen med en styrke på 80% ved signifikansniveau 5% Dvs. p 1 = 0.30, p 2 = 0.15, p = 0.225, α = 0.05, 1 β = 0.8 n = dvs. 122 obs. i hver gruppe = Sammenligning af hyppigheder: power i SAS SAS Analyst har menuer til power-beregninger Mere præcise formler... men kun for kontinuerte data For sammenligning af hyppigheder kan man snyde ved at benytte t-test proceduren for normalfordelte data. Her indsættes p 1 og p 2 som means og som spredning bruges p(1 p). Begrundelse: sammenligning af hyppigheder er jo sammenligning af middelværdier af 0/1-variable. Middelværdien i grupperne er hhv p 1 og p 2. Så mangler vi bare variationen indenfor grupper. For 0/1-variable variable er variansen p(1 p). Som p bruger vi gennemsnittet p = (p 1 + p 2 )/2 Simpel regression Model: Y i = a + bx i + ǫ i, ǫ i N(0, σ 2 ), i = 1,..., n b: er regressionskoefficienten Stikprøveberegning for testet H 0 : b = 0 n = f(α, 1 β) ( σ bσ x ) 2, hvor σ x er standardafvigelsen for kovariaten (x). Dvs jo større spredning der er i kovariaten jo mindre er det nødvendige antal observationer

8 Bogen, s. 456 Nomogram Tegn linje mellem Standardized difference og Power, aflæs N der hvor den midterste linje skæres for det valgte signifikansniveau Kontinuert skema, kan nemt bede om fx. en styrke på Nemt at vende om og finde fx. differens for valgt N og power MEN Svært at aflæse nøjagtigt Meget let at løbe sur i hvornår der skal ganges med 2 og om det nu er antal personer eller antal par osv. Strukturerede forsøg Minimere effekt af variationskilder Variation indenfor/mellem personer Sin egen kontrol Store styrkegevinster Men pas på: Kræver tilpassede analysemetoder f.eks parret t-test, flersidede variansanalyser Standardmetoder kan være vildt forkerte Foretrækker formler eller computer programmer Parrede data Dobbelt bestemmelser Two sample: t = / 11 = 2.62, Paired: t = / 11 = Note, the Two-sample test will give a p-value which is too high 30 31

9 Crossover design Ny behandling Sammenligne med placebo/standard behandling Give personen begge behandlinger Sammenligninger indenfor individer Men der kan være en tidseffekt (spontan bedring) Bytte rundt på rækkefølgen tilfældigt/systematisk Eksempel Patienter med Raynaud s fænomen. Test af Nicardipine (Ca-kanal blokker). Nicardipine i 2 uger. Tælle antal episoder. 1 uges washout Placebo i 2 uger. Tælle antal episoder. eller omvendt 10 personer i hver gruppe Nicardipine først Per. 1 Per. 2 (2) (1) (1) + (2) (N) (P) N P Gr.I Mean SD Placebo først Per. 1 Per. 2 (2) (1) (1) + (2) (N) (P) P N Gr.II Mean SD

10 Statistisk analyse? Hvorfor ikke parret t-test? Et parret t-test er baseret på behandlingsdifferensen: Nicardipine - Placebo. Hvis der er en periodeeffekt vil disse differenser give et forkert billede af effekten af behandling. Antag f.eks at responsen falder i periode 2. I gruppe I undervurderes behandlingseffekten fordi Placebo gives i periode 2 hvor der er et lavere antal anfald. I gruppe II vil behandlingseffekten tilgengæld blive overvurderet. Det samlede estimat for behandlingseffekten fås ved at tage gennemsnit over alle personer. Hvis der ikke er lige mange personer i hver gruppe er denne analyse biased. I vores eksempel er der faktisk lige mange i hver gruppe, men det parrede t-test er in-efficient fordi modellen ikke tager højde for periode. En anden ide Vi vil afgøre om der er en behandlingseffekt og vi er bekymrede for om der også kunne være en periodeeffekt. Smart design: de to grupper har fået behandlingen i forskellige perioder. hvis der kun er en periode-effekt, må periodeudviklingen i de to grupper være ens. Omvendt, hvis der en behandlingseffekt, så bliver periodeudviklingerne forskellige fordi den ene gruppe starter med behandling mens den anden slutter med behandling. Vi kan undersøge behandlingseffekten ved at se om periode-udviklingen er den samme i de to grupper I gruppe 2 ser der ud til at være en stræk behandlingseffekt. eller får patienterne det bare bedre som tiden går? Underliggende additiv model E(Y i,j ) = α i + βbeh i,j + δper i,j, i: person, j=periode hvor beh i,j er en kovariat der er 1 hvis behandling=nicardipine, 0 ellers og per i,j er en kovariat der er 1 hvis periode=2, 0 ellers α i : person s i responsniveau med placebo i periode 1. β: behandlingseffekt (nicardipine-placebo), δ: periodeeffekt (periode2-periode1) Hvordan kan vi bestemme β udfra data? 3-sidet variansanalyse (husk at inddrage person), men vi kan klare os med t-test

11 Test af behandlingseffekten baseres på periodedifferenserne P D g : måling 2 minus måling 1 i gruppe g = 1, 2 (periode-differens) E(P D 1 ) = (α i δ) (α i + β + 0) (1) = δ β (2) E(P D 2 ) = (α i + β + δ) (α i ) (3) = δ + β (4) De to differens-niveauer er kun ens hvis behandlingseffekten er nul (β = 0). Ide: vi kan teste nulhypotesen ingen behandlingseffekt ved et to-stikprøve t-test på periode-forskellene. Et forkast betyder at der er en signifikant behandlingseffekt. Eksempel Antag at behandlingen nedsætter responsen med 6 (β = 6) og periode 2 nedsætter responsen med 3 (δ = 3). P D g : måling 2 minus måling 1 i gruppe j = 1, 2 E(P D 1 ) = (α i + 0 3) (α i 6 + 0) (5) = (6) E(P D 2 ) = (α i 6 3) (α i ) (7) = 3 6 (8) hvis vi trækker de to niveauer fra hinanden forsvinder periodeeffekt E(D 2 ) E(D 1 ) = ( 6 6) = 12 = 2 β og derfor: β = [E(D 2 ) E(D 1 )]/2 dvs behandlingseffekten kan estimeres ved gruppe-forskellen i periodedifferensniveau delt med Sig det lige en gang til! Vi vil afgøre om der er en behandlingseffekt og vi er bekymrede for om der også kunne være en periodeeffekt. Smart design: de to grupper har fået behandlingen i forskellige perioder. To ting ændres når vi bevæger os fra periode 1 til periode 2: tiden går og behandlingen ændres. Hvis behandlingen ikke har nogen effekt vil personerne udvikle sig ens i de to grupper. Vi kan derfor teste om der er en behandlingseffekt ved at testes om personerne udvikler sig ens i det to grupper. Dvs t-test på periode-differenser. Dette test er robust overfor en periode-effekt, der er det naive parrede t-test ikke. 42 I gruppe 2 ses en forberedring i responsen. Hvis dette alene skulle skyldes en periodeeffekt ville vi forvente at se den samme udvikling i gruppe 1. Men her er niveauet blevet dårligere over tid. Det at patienterne udvikler sig forskelligt i de to grupper er en indikation af at behandlingen har en effekt. 43

12 Sammenligning af grupperne Per. 1 Per. 2 (2) (1) (1) + (2) (N) (P) N P Mean SD P N Mean SD Periodedifferenser: Behandlingseffekt i eksemplet P D 1 = 1.0 og P D 2 = 12.0 I gruppe 1 har man fået flere anfald fra periode 1 til 2. I gruppe 2 er antallet gået ned. Det tyder på en behandlingseffekt. I gruppe 2 sluttede man med aktiv behandling. Estimeret effekt β = [ P D 2 P D 1 ]/2 = ( )/2 = 6.5 Er effekten signifikant? (t-test på periodedifferenser) (10 1) 9.87 Fælles SD: s = 2 +(10 1) = se( P D 1 P D 2 ) = = t = 13.0 = DF = 18 P = Uden korrektion for periodeeffekt: parret t-test Hvis vi ignorerer en mulig periodeeffekt kan behandlingseffekten analyseres i et parret t-test Gennemsnit af N-P = 6.5, t = 2.03, p = I dette tilfælde bliver behandlingseffekten det samme uanset om der korrigeres for periode eller ej. Det er fordi fordelingen af (behandling er den samme i de to perioder (behandling og periode er uafhængige). Er det ikke opfyldt vil det parrede t-test være biased. Bemærk dog at behandlingseffekten ikke er signifikant i den ukorrigerede analyse. Endnu et eksempel på at man kan vinde styrke ved at inddrage kovariater. E(Y i,j ) = α i + βbeh i,j + δper i,j, Periodeeffekt BD g : Nicardipine - Placebo i gruppe g = 1, 2 E(BD 1 ) = E( P D 1 ) = (α i + β + 0) (α i δ) (9) = β δ (10) E(BD 2 ) = E(P D 2 ) = (α i + β + δ) (α i ) (11) = β + δ (12) De to differens-niveauer er kun ens hvis periode-effekten er nul (δ = 0). Vi kan teste nulhypotesen ingen periodeeffekt ved et to-stikprøve t-test på behandlings-forskellene. Periodeeffekt: δ = [E(BD 2 ) E(BD 1 )]/

13 Behandlingsdifferenser (N-P): Periodeeffekt, beregning BD 1 = 1.0 og BP 2 = 12.0 I gruppe 1 fik man lidt færre anfald med behandling end placebo. I gruppe 2 fik man en del færre anfald med behandling. Det tyder på en periodeeffekt. I gruppe 2 sluttede man med behandling, dvs antallet af anfald falder i periode 2. Estimeret effekt b δ = [E(BD 2 ) E(BD 1 )]/2 = ( 12.0 ( 1.0))/2 = 5.5 Er effekten signifikant? (t-test på behandlingsdifferenser) q (10 1) 9.87 Fælles SD: s = 2 +(10 1) = Carry-over effekten En svaghed i dette design er at en gavnlig effekt af behandlingen i periode 1 måske kan opretholdes og gøre placebo-værdien for god. Dette kaldes carry-over effekten. Om denne effekt er tilstede kan testes ved for hver patient at begrene summen at de to målinger og derefter sammenligne de to grupper. se( BD 1 BD 2 ) = r = t = 11.0 = DF = 18 P = Under modellen gælder: Model for sum E(Y 1 + Y 2 ) = 2α i + β + δ Carry-over effekten (µ) påvirker niveauet i gruppe I Gr I: E[Y 1 + Y 2 ] = 2α i + β + δ + µ Gr II: E[Y 1 + Y 2 ] = 2α i + β + δ Hvis µ = 0 er der ikke carry-over. Testet udføres som et uparret t-test, men det kræver at personniveauerne α i antages normalfordelt. t-test for (1)+(2): Test for carryover-effekt Fælles SD: (10 1) (10 1) Forskel på gennemsnit = S 1 S 2 = = se( S 1 S 2 ) = = t = 7.6 = DF = 18 P = Dvs. carry-over effekten er ikke statistisk signifikant, men bemærk at testet er svagt fordi variationen mellem personer indgår i summerne

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse Basal statistik Esben Budtz-Jørgensen 4. november 2008 Forsøgsplanlægning Stikprøvestørrelse 1 46 Planlægning af et studie Videnskabelig hypotese Endpoints Instrumentelle/eksponerings variable Variationskilder

Læs mere

Forsøgsplanlægning Stikprøvestørrelse

Forsøgsplanlægning Stikprøvestørrelse Basal statistik Esben Budtz-Jørgensen 6. november 2007 Forsøgsplanlægning Stikprøvestørrelse 1 41 Planlægning af et studie Videnskabelig hypotese Endpoints Instrumentelle/eksponerings variable Variationskilder

Læs mere

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet

Læs mere

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05 Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger Program Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Analyse af ikke-parrede stikprøver: repetition of rettelse af fejl! Lidt

Læs mere

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller

Læs mere

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning

Læs mere

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher

Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher Kursus 02323: Introducerende Statistik Forelæsning 12: Forsøgsplanlægning Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

Program. 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12

Program. 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12 Program 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12 Ensidet variansanalyse: analyse af grupperede data Nedbrydningsrate for tre typer af opløsningsmidler (opgave 13.8 side 523) Sorption

Læs mere

Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Dagens tema: Indfør centrale statistiske begreber. Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan

Læs mere

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større

Læs mere

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 Indledning 2 Ensidet variansanalyse 3 Blokforsøg 4 Vekselvirkning 1 Indledning 2 Ensidet

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala 3 5% 5% 5% 0 3 4 5 6 7 8 9 0 Statistik for biologer 005-6, modul 5: Normalfordelingen opstår når mange forskellige faktorer uafhængigt af hinanden bidrager med additiv variation til. F.eks. Højde af rekrutter

Læs mere

Løsning til eksaminen d. 29. maj 2009

Løsning til eksaminen d. 29. maj 2009 DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)

Læs mere

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset 02402 Vejledende løsninger til Splus-opgaverne fra hele kurset Vejledende løsning SPL3.3.1 Der er tale om en binomialfordeling med n =10ogp=0.6, og den angivne sandsynlighed er P (X =4) som i bogen også

Læs mere

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π

Læs mere

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. 1/23 Opsummering af fordelinger X 1. Kendt σ: Z = X µ σ/ n N(0,1)

Læs mere

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling.

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling. Eksempel: dæktyper og brændstofforbrug (opgave 25 side 319) Program: cars 1 2 3 4 5... radial 4.2 4.7 6.6 7.0 6.7... belt 4.1 4.9 6.2 6.9 6.8... Muligheder: 1. vi starter med at gennemgå opgave 7 side

Læs mere

Modul 12: Regression og korrelation

Modul 12: Regression og korrelation Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 12: Regression og korrelation 12.1 Sammenligning af to regressionslinier........................ 1 12.1.1 Test for ens hældning............................

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 14. december 2009 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t. t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program (8.15-10): 1. repetition: fordeling af observatorer X, S 2 og t. 2. konfidens-intervaller, hypotese test, type I og type II fejl, styrke,

Læs mere

Kvantitative metoder 2

Kvantitative metoder 2 Kvantitative metoder Heteroskedasticitet 11. april 007 KM: F18 1 Oversigt: Heteroskedasticitet OLS estimation under heteroskedasticitet (W.8.1-): Konsekvenser af heteroskedasticitet for OLS Gyldige test

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression: Definitioner For en binær (0/) variabel Y antager vi P(Y)p P(Y0)-p Eksempel: Bil til arbejde vs alder

Læs mere

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se Epidemiologi og biostatistik. Uge, torsdag 5. februar 00 Morten Frydenberg, Institut for Biostatistik. Type og type fejl Statistisk styrke Nogle speciale metoder: Normalfordelte data : t-test eksakte sikkerhedsintervaller

Læs mere

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau... Indhold 1 Statistisk inferens: Hypotese og test 2 1.1 Nulhypotese - alternativ.................................. 2 1.2 Teststatistik........................................ 3 1.3 P-værdi..........................................

Læs mere

Module 4: Ensidig variansanalyse

Module 4: Ensidig variansanalyse Module 4: Ensidig variansanalyse 4.1 Analyse af én stikprøve................. 1 4.1.1 Estimation.................... 3 4.1.2 Modelkontrol................... 4 4.1.3 Hypotesetest................... 6 4.2

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Uafhængighedstestet Eksempel: Bissau data Data kommer fra Guinea-Bissau i Vestafrika: 5273 børn blev undersøgt da de var yngre end 7 mdr og blev

Læs mere

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test Ikkeparametriske metoder Repetition Wilcoxon SignedRank Test KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 12: Variansanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Forelæsning 11: Kapitel 11: Regressionsanalyse

Forelæsning 11: Kapitel 11: Regressionsanalyse Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Kapitel 7 Forskelle mellem centraltendenser

Kapitel 7 Forskelle mellem centraltendenser Kapitel 7 Forskelle mellem centraltendenser Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 29 Indledning 1. z-test for ukorrelerede data 2. t-test for ukorrelerede data med ens

Læs mere

Normalfordelingen og Stikprøvefordelinger

Normalfordelingen og Stikprøvefordelinger Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger

Læs mere

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau Hvad skal vi lave? 1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ. Teststatistik P-værdi Signifikansniveau 2 t-test for middelværdi Tosidet t-test for middelværdi Ensidet t-test for middelværdi

Læs mere

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange

Læs mere

Forelæsning 9: Inferens for andele (kapitel 10)

Forelæsning 9: Inferens for andele (kapitel 10) Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Estimation og usikkerhed

Estimation og usikkerhed Estimation og usikkerhed = estimat af en eller anden ukendt størrelse, τ. ypiske ukendte størrelser Sandsynligheder eoretisk middelværdi eoretisk varians Parametre i statistiske modeller 1 Krav til gode

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af

Læs mere

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Kursus 02402: Besvarelser til øvelsesopgaver i uge 9 Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Som model benyttes en binomialfordeling, som beskriver antallet, X, blandt

Læs mere

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok Opgave 1 Vejledende besvarelse af eksamen i Statistik for biokemikere, blok 2 2006 Inge Henningsen og Niels Richard Hansen Analysevariablen i denne opgave er variablen forskel, der for hver af 10 kvinder

Læs mere

Opgaver til kapitel 3

Opgaver til kapitel 3 Opgaver til kapitel 3 3.1 En løber er interesseret i at undersøge om hendes løbeur er kalibreret korrekt. Hun udmåler derfor en strækning på præcis 1000 m og løber den 16 gange. For hver løbetur noterer

Læs mere

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke

Læs mere

Løsning til eksamen d.27 Maj 2010

Løsning til eksamen d.27 Maj 2010 DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1

Læs mere

Vejledende besvarelser til opgaver i kapitel 14

Vejledende besvarelser til opgaver i kapitel 14 Vejledende besvarelser til opgaver i kapitel 14 Opgave 1 a) Det første trin i opstillingen af en hypotesetest er at formulere to hypoteser, hvoraf den ene støtter den teori vi vil teste, mens den anden

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff. Envejs variansanalyse - eksempel

Oversigt. Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff. Envejs variansanalyse - eksempel Kursus 02402 Introduktion til Statistik Forelæsning 12: Variansanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Program 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Fordeling af X Stikprøve X 1,X 2,...,X n stokastisk X stokastisk. Ex (normalfordelt stikprøve)

Læs mere

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Læs mere

Nanostatistik: Opgavebesvarelser

Nanostatistik: Opgavebesvarelser Nanostatistik: Opgavebesvarelser JLJ Nanostatistik: Opgavebesvarelser p. 1/16 Pakkemaskine En producent hævder at poserne indeholder i gennemsnit 16 ounces sukker. Data: 10 pakker sukker: 16.1, 15.8, 15.8,

Læs mere

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9 Indhold 1 Ensidet variansanalyse 2 1.1 Estimation af middelværdier............................... 3 1.2 Estimation af standardafvigelse............................. 3 1.3 F-test for ens middelværdier...............................

Læs mere

Note om Monte Carlo metoden

Note om Monte Carlo metoden Note om Monte Carlo metoden Kasper K. Berthelsen Version 1.2 25. marts 2014 1 Introduktion Betegnelsen Monte Carlo dækker over en lang række metoder. Fælles for disse metoder er, at de anvendes til at

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Kvantitative Metoder 1 - Forår 2007

Kvantitative Metoder 1 - Forår 2007 Dagens program Kapitel 8.7, 8.8 og 8.10 Momenter af gennemsnit og andele kap. 8.7 Eksempel med simulationer Den centrale grænseværdisætning (Central Limit Theorem) kap. 8.8 Simulationer Normalfordelte

Læs mere

En Introduktion til SAS. Kapitel 5.

En Introduktion til SAS. Kapitel 5. En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel

Læs mere

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved Matematisk Modellering 1 (reeksamen) Side 1 Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved { 1 hvis x {1, 2, 3}, p X (x) = 3 0 ellers,

Læs mere

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1 Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen

Læs mere

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Kursus 242 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik Bygning 35/324 Danmarks Tekniske Universitet 28 Lyngby Danmark e-mail:

Læs mere

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006 PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006 I dag: To stikprøver fra en normalfordeling, ikke-parametriske metoder og beregning af stikprøvestørrelse Eksempel: Fiskeolie

Læs mere

Vejledende løsninger kapitel 8 opgaver

Vejledende løsninger kapitel 8 opgaver KAPITEL 8 OPGAVE 1 Nej den kan også være over 1 OPGAVE 2 Stikprøvestørrelse 10 Stikprøvegennemsnit 1,18 Stikprøvespredning 0,388158 Konfidensniveau 0,95 Nedre grænse 0,902328 Øvre grænse 1,457672 Stikprøvestørrelse

Læs mere

1 Sammenligning af 2 grupper Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver... 2

1 Sammenligning af 2 grupper Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver... 2 Indhold 1 Sammenligning af 2 grupper 2 1.1 Responsvariabel og forklarende variabel......................... 2 1.2 Afhængige/uafhængige stikprøver............................ 2 2 Sammenligning af 2 middelværdier

Læs mere

6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag)

6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag) Institut for Epidemiologi og Socialmedicin Institut for Biostatistik. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag) Opgave 1 Læs afsnit.1 i An Introduction to Medical Statistics, specielt

Læs mere

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som MLR antagelserne Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + u, hvor β 0, β 1, β 2,...,β k er ukendte parametere,

Læs mere

Hvad skal vi lave? Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver

Hvad skal vi lave? Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver Hvad skal vi lave? 1 Sammenligning af 2 grupper Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver 2 Sammenligning af 2 middelværdier Uafhængige stikprøver Uafhængige stikprøver -

Læs mere

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens Oversigt Oversigt over emner 1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens 2 Konfidensinterval Konfidensinterval for andel Konfidensinterval - normalfordelt stikprøve

Læs mere

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning 1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion

Læs mere

Forelæsning 11: Envejs variansanalyse, ANOVA

Forelæsning 11: Envejs variansanalyse, ANOVA Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalyse, ANOVA Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6 Institut for Matematiske Fag Matematisk Modellering 1 Aarhus Universitet Eva B. Vedel Jensen 25. februar 2008 UGESEDDEL 6 Forelæsningerne torsdag den 21. februar og tirsdag den 26. februar. Jeg har gennemgået

Læs mere

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl Eksamen 2018 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 20-02-2018 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Produkt og marked - matematiske og statistiske metoder

Produkt og marked - matematiske og statistiske metoder Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser

Læs mere

To-sidet varians analyse

To-sidet varians analyse To-sidet varians analyse Repetition En-sidet ANOVA Parvise sammenligninger, Tukey s test Model begrebet To-sidet ANOVA Tre-sidet ANOVA Blok design SPSS ANOVA - definition ANOVA (ANalysis Of VAriance),

Læs mere

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Matematisk Modellering 1 Cheat Sheet

Matematisk Modellering 1 Cheat Sheet By a team of brave computer scientists: Mads P. Buch, Tobias Brixen, Troels Thorsen, Peder Detlefsen, Mark Gottenborg, Peter Krogshede - 1 Contents 1 Basalt 3 1.1 Varianser...............................

Læs mere

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 33B, Rum 9 Danmarks Tekniske Universitet 28 Lyngby Danmark e-mail: pbac@dtu.dk Efterår

Læs mere

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt) I dag Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt) Helle Sørensen Repetition vha eksempel om dagligvarepriser Analyse med R: ttest

Læs mere

Model. k = 3 grupper: hvor ǫ ij uafhængige og normalfordelte med middelværdi nul og varians σi 2, i = 1,2,3.

Model. k = 3 grupper: hvor ǫ ij uafhængige og normalfordelte med middelværdi nul og varians σi 2, i = 1,2,3. Model Program (8.15-10): 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. Bruger nu to indices: i = 1,...,k for gruppenr. og j = 1,...,n i for observation indenfor gruppe. k = 3 grupper: µ 1

Læs mere

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier

Læs mere

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd I dag Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik SaSt) Helle Sørensen Først lidt om de sidste uger af SaSt. Derefter statistisk analyse af en enkelt

Læs mere

Multipel Lineær Regression

Multipel Lineær Regression Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer

Læs mere

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Lineær regression. Simpel regression. Model. ofte bruges følgende notation: Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til

Læs mere