Et statistisk test er en konfrontation af virkelighenden (data) med en teori (model).
|
|
- Simon Jepsen
- 4 år siden
- Visninger:
Transkript
1 Hypotesetests, fejltyper og p-værdier og er den nu også det? Søren Højsgaard Institut for Matematiske Fag, Aalborg Universitet (updated: ) 1 / 40
2 Statistisk test Et statistisk test er en konfrontation af virkelighenden (data) med en teori (model). Laves med det formål at forsøge at falsificere modellen. Alternativt: Man bruger data til at "bevise" at man ikke har ret. NB: I statistik hedder det ET test; ikke EN test! 2 / 40
3 Karl Popper ( ) Passer ind Karl Poppers ( ) videnskabsteori: Man kan ikke empirisk verificere videnskabelige teorier; kun falsificere dem. Videnskabelige fremskridt sker ved at "man har en teori indtil den bliver falsificeret" Se "Conjectures and Refutations" og "The Logic of Scientific Discovery" 3 / 40
4 Statistikkens tolkningsregel I statistikken anlægger man følgende tolkningsregel: Det usandsynlige sker ikke Altså, hvis man observerer data der, hvis modellen er rigtig, er meget usandsynlige, så forkaster man modellen. Nødvendigt med sådan en tolkningsregel, for ellers kan man aldrig ad statistisk vej erkende noget som helst! Man vil jo altid kunne hævde, at det foreliggende datasæt blot er et uheldigt udfalg, som ganske vist er usandsynligt men dog muligt Eksempel: At slå gange "krone" i kast med en fair mønt sker med ssh 10 6 ; dvs. ca.\ 1 ud af gange. 20 gange krone er et muligt udfald, men det er ikke videre sandsynligt. Så derfor har vi mere fidus til at mønten ikke er fair -- altså at modellen er forkert. 4 / 40
5 Fødes der lige mange drenge og piger? Over en årrække blev disse data indsamlet (på et hospital i London) - det STORE datasæt: drenge piger total antal andel 0,51 0,49 1,00 Vi skal senere bruge et mindre datasæt, datasæt: 10% drenge piger total antal andel 0,51 0,49 1,00 af det store datasæt - det LILLE 5 / 40
6 drenge piger total antal andel 0,51 0,49 1,00 Er der chance for en dreng og en pige? Tydeligvis ikke -- i dette datasæt. Men hvad med populationen? 51\% er ikke langt fra 50\% og afvigelsen kunne jo skyldes en tilfældighed. Spørgsmålet er: Er afvigelsen så stor, at den ikke -- med rimelighed -- kan tilskrives en tilfældighed? 6 / 40
7 Model for data: For at komme videre skal vi have en model -- en mekanisme, der kunne have genereret data: Uden antagelser, ingen konklusioner. Vi antager Alle kvinder har samme sandsynlighed θ for at føde en dreng. Udkommet af alle graviditeter er uafhængige -- også forskellige graviditeter for samme kvinde og også for forskellige graviditeter for samme mand. Er disse antagelser rimelige? Tjoh -- måske -- i hvert fald: uden antagelser, ingen konklusioner. Fører til at antal drengefødsler X er binomialfordelt X bin(n, θ), N = Dvs ssh for at observere x drenge i N fødsler hvor der hver gang er ssh θ for en dreng er P r(x = x; θ) = ( )θ x (1 θ) N x N x 7 / 40
8 Tætheder for binomialfordelingen 8 / 40
9 Man kan antage at ssh er 50\% og så se på hvordan data kunne have set ud drenge piger total drenge piger total Sammenlign med de observerede data drenge piger total NB: Der er eet simuleret datasæt, der ligeså mange eller flere drenge som vi har observeret. 9 / 40
10 Det LILLE datasæt drenge piger total drenge piger total Sammenlign med de observerede data drenge piger total NB: Der er to simulerede datasæt, der ligeså mange eller flere drenge som vi har observeret. 10 / 40
11 Hypotesetest Et "fagligt" spørgsmål: Fødes der lige mange drenge og piger? Oversættes til statistisk spørgsmål: "Er (ssh for en dreng) lig med "? Plejer at formulere det som hypotese: Tester null-hypotesen:, hvor mod den Alternative hypotese:. Taler om at forkaste eller acceptere hypotesen. θ 1/2 H0 : θ = θ0 θ0 = 1/2 H A : θ θ 0 Måske burde man erstatte "acceptere" med "ikke forkaste" -- men det lader sig næppe ændre. Poppers tankegang: At forkaste hypotesen er den stærke konklusion 11 / 40
12 Klassisk fremgangsmåde: Lad x betegne data. Vælg en funktion, der har den egenskab, at er (numerisk) stor, hvis data ikke passer på modellen og lille ellers. Kalder t(x) Kunne f.eks. tage t(x) en teststørrelse (eng: test statistic). t(x) t(x) = x/n θ 0 = x/n 1/2 t obs = t(x) = t(6389) = Vi får den observerede teststørrelse Er t obs et stort eller lille tal? Svaret ligger i at spørge: Hvad er sandsynligheden for i fremtiden at se værdier af der er større end hvis? t(x) t obs θ = θ 0 12 / 40
13 Tankegangen er nu: Lad os nu antage, at der findes en afkrog et sted på jorden, hvor vi (af en eller anden grund) ved, at i denne afkrog er hypotesen sand, dvs.. θ = θ 0 = 1/2 I denne afkrog gentager vi studiet M gange, hvor studiet består i: N = venter på, at børn er født og 2. noterer os antal drenge for. x j j = 1,, M t(x j ) x j t(x j ) Beregn for hvert og tegn et histogram af 'erne. Vi behøver ikke lede efter denne afkrog på jorden; computeren er opfundet og vi kan lave studiet ved simulation (et "in silico trial"): 13 / 40
14 Tænk på, at vi skal tage en beslutning: Acceptere H 0 eller forkaste H 0. Laver en beslutningsregel: Forkast H 0 hvis er "stor"; mere konkret: t(x) forkast H 0 hvis t(x) c Tallet c kaldes den kritiske værdi. Indtil videre har vi ingen idé om hvordan denne kritiske værdi c vælges; kommer senere. 14 / 40
15 Der er to typer fejl vi kan begå: Forkaste H 0 selvom H 0 er sand; kaldes type-i fejl Acceptere H 0 selvom H 0 er falsk; kaldes type-ii fejl Man fastlægger ofte at ssh for at begå en type-i fejl skal være mindre end et lille tal ; f.eks.. α α = 0.05 P r θ0 (Forkaste H 0 ) α P r θ0 () θ = θ 0 hvor indikerer, at ssh er beregnet for. H 0 t(x) c c Hvis beslutningsreglen er "Forkast hvis så kan vi finde fra: P r θ0 (t(x) c) α t(x) c Beslutningsreglen bliver så: Forkast H 0 hvis. t(x) c Hvis siger man, at testet er signifikant på niveau α. 15 / 40
16 For hvert α kan finde den kritiske værdi : ## ## t obs Sammenholder med = c α 16 / 40
17 Vi siger at testet er signifikant på niveau ). 1% (men ikke signifikant på niveau Ofte bruger man signifikansniveauerne,, og -- men der er altså intet "guddommeligt" over disse tal; de har alene historiske grunde. 5% / 40
18 p-værdien En lidt anden tilgang er: Beregn p-værdien (også kaldet testsandsynligheden) der er defineret som p = P r θ 0(t(X) t obs ) -- altså ssh for at observere en værdi at teststørrelsen der er større end den vi aktuelt står med. Vi får p-værdien er t() 18 / 40
19 Dermed kan man sige, at p-værdien er et mål for "graden af evidens mod en hypotese". Giver i nogle sammenhænge langt mere mening end at gøre problemet til et beslutningsproblem. 19 / 40
20 Fejltyper: type-1 fejl og type-2 fejl Verdens sande tilstand - og de beslutninger vi træffer. H0 hypotese accepteres H0 hypotese forkastes H0 H0 hypotese er sand hypotese er falsk type-ii fejl type-i fejl At forkaste H0 selvom H0 er sand kaldes en type-1 fejl At acceptere H0 selvom H0 er falsk kaldes en type-2 fejl 20 / 40
21 Som ved retssag: H 0 H 0 anklagede uskyldig anklagede skyldig H 0 uskyld accepteres H 0 uskyld forkastes "justitsmord" en "fejl" vi lever med Man lader tvivlen komme den anklagede til gode: "Man er uskyldig til noget andet er bevist". Med mindre der er stærk evidens (data) mod H 0 så accepterer man H / 40
22 Fortolkning af p-værdier Tilbage til det oprindelige spørgsmål: Er der chance for en dreng og en pige? En p-værdi kan opfattes som et mål for evidencen MOD en hypotese: En lille p-værdi indikerer stor evidens mod hypotesen. Her er p-værdien lille så det får os til at tvivle på hypotesen. Kan vi deraf konkludere, at null-hypotesen Har vi "bevist", at. θ 1/2 H 0 : θ = θ 0 = 1/2 θ = 1/ er falsk? Nej. Hvis, så er sandsynligheden for at observere drenge i graviditeter er eller knapt 1 ud af 2000 gange. Det er en lille sandsynlighed, bevares, men det er afgjort muligt selv hvis hypotesen er sand. Der er dog mange studier, der peger på, at der fødes flere drenge end piger. 22 / 40
23 Some tider fortolkes en p--værdi fejlagtigt som noget i retningen af p--værdien er sandsynligheden for at hypotesen er sand. Dette er forkert: Sandsynligheder er noget vi knytter til fænomener, hvor der er usikkerhed om udkommet (kast med en mønt eller en terning). Der er ingen usikker om hypotesen: Hypotsen er enten sand eller falsk (vi ved bare ikke hvad den er, for vi har ingen guddommelig indsigt). 23 / 40
24 E ekten af stikprøvestørrelsen Det LILLE datasæt: drenge piger total antal andel 0,51 0,49 1,00 Dvs vi har kun 10\% of data, men andelen af drenge er stadig / 40
25 25 / 40
26 Hvad kan vi så konkludere? t obs er som før (på nær nogle decimaler): 0.01 men Med børn og drenge er der stærk evidens mod hypotesen θ = 1 2 : Vi får at p--værdien er 2% Med børn og drenge er der meget lidt evidens mod hypotesen: Vi får at p-værdien er I begge tilfælde er andelen af drenge Hvad skal vi mene om dette? 26 / 40
27 Vi formulerer en hypotese om "verdens sande tilstand", og dernæst "spørger vi data" om der er evidens mod denne hypotese. Hvis der ikke er evidens mod hypotesen, kan det være fordi hypotesen er sand, eller fordi der ikke er tilstrækkeligt data (information) til at komme med denne evidens (altså til at "påvise" at hypotesen er forkert) Igen: tænk på p-værdien som mål for evidens mod hypotesen p-værdien afspejler "afstand" mellem data og model (mellem ^θ = 0.51 θ0 = 0.5) p-værdien afspejler OGSÅ mængden af data. Mere poetisk: "Absence of evidence (of an effect) is NOT the same as evidence of absence (of an effect)." og 27 / 40
28 Test og kon densinterval -- to sider af samme sag θ = θ0 θ0 = 1/2 Vi testede ovenfor hypotesen hvor. Vi kunne teste samme hypotese for mange andre værdier af θ0. For hver værdi af θ 0 beregner vi p-værdien og plotter mod θ 0 Husk: Små p-værdier er evidens mod hyptesen. 28 / 40
29 p Indlæg intervaller hvor -værdien er større end, og. Disse intervaller er præcist, og konfidensintervaller: 99% 95% 90% 99% 95% 90% konfidensinterval: [ 0.499; ] konfidensinterval: [ 0.502; ] konfidensinterval: [ 0.504; ] 29 / 40
30 Disse intervaller er præcist, og konfidensintervaller: 99% 95% 90% 99% 95% 90% konfidensinterval: [ 0.475; ] konfidensinterval: [ 0.483; ] konfidensinterval: [ 0.487; ] 30 / 40
31 Tekstbogsudgaven af test i binomialfordelingen Tekstbogsudgaven af test i binomialfordelingen er ofte baseret på at man - på baggrundt af CLT - laver en test-størrelse, der har en kendt fordeling: En normal-fordeling eller en χ 2 fordeling. Dette var vigtigt i "gamle dage" hvor man ikke havde computere til at gøre som ovenfor. Her een udgave af sådan et test. X bin(n, θ) Lad. E(X) = Nθ var(x) = Nθ(1 θ) sd(x) = Nθ(1 θ) Så er, og. Ydermere, X er - pga. CLT - approximativt normal (sum af N uafhængige -variable). 0/1 E(X/N) = θ var(x/n) = θ(1 θ)/n sd(x/n) = θ(1 θ)/n. Derfor er og og 31 / 40
32 Definer X/N E(X/N) t(x) = = var(x/n) X/N θ θ(1 θ)/n ` E(t(X)) = 0 var(t(x)) = 1 Så er og. Ydermere, så er approximativt -fordelt. t(x) t(x) N(0, 1) NB "måler", hvor mange standardafvigelser X/N er fra sin middelværdi. H0 : θ = θ0 θ0 t(x) N(0, 1) Vi vil teste hypotesen. Hvis hypotesen er sand så kan vi indsætte i udtrykket ovenfor og vil stadig have en fordeling. t(x) 0 Vi kan så vurdere om er ekstremt langt væk fra i en normalfordeling. Stort datasæt: t(x) = , lille datasæt: t(x) = / 40
33 Både store og små værdier er kritiske nu. α = 5% H 0 Vi tester på niveau. Beslutningsregel: Undlad at forkaste hvis c < t(x) < c. Vi kan finde c udfra c = P r θ0 ( c < t(x) < c) α Vi finder så at. Derfor forkastes hypotesen i det store datasæt og accepteres i det lille datasæt - helt som før. 33 / 40
34 Statistisk signi kans, praktisk signi kans, klinisk signi kans... Oprindelsen er det latinske significantia, der betyder betydning Når man finder en statistisk signifikant "effekt" så betyder det, at den effekt man ser er for stor til -- med rimelighed -- at kunne tilskrives tilfældigheder. 50.5% 49.5% Mange studier, der viser, at der fødes ca. drenge og piger. Men når man venter et barn så tænker man, at der er chance for hvert køn. Den statistiske signifikans betyder altså ikke nødvendigvis så meget i praksis... Man finder det samme fænomen i sundhedsverdenen: En statistisk signifikant effekt kan sagtes være så svag, at den ikke er klinisk relevant for patienten. 34 / 40
35 Estimation (by request) 35 / 40
36 Estimation af θ i binomialfordelingen Det er ikke helt oplagt at bruge mindste kvadraters metode. Alternativ: Maximum Likelihood Metoden: Model: X bin(n, θ) Binomial tæthed N P r(x = x; θ) = ( )θ x (1 θ) N x x x = 6389 N = Når data er observeret med så bliver ovenstående en funktion af θ alene. Man kalder så funktionen for likelihood funktionen L(θ) = P r(x = x; θ) 36 / 40
37 Plot L(θ) mod forskellige værdier af θ Den værdi af θ der maximerer L kaldes maximum likelihood estimatet (MLE). Det er oftest lettere at maximere l(θ) = log L(θ) og MLE bliver ^θ = x/n MLE er på mange måder det bedst tænkelige estimat man kan opnå. 37 / 40
38 For det lille datasæt får vi Samme maximum, men likelihood funktionen er mindre peaked -- svarende til at der er større usikkerhed på estimatet fordi datasættet er mindre. 38 / 40
39 Mindste kvadrater og MLE Hvad så med regressionsmodellen og mindste kvadrater? Model: y i = β0 + β1x i + e i Samme som at sige Normalfordelingstæthed bliver y i N(β 0 + β 1 x i, σ 2 ) 1 1 f(y i ) = exp( (y i (β 0 + β 1 x i )) 2 ) σ 2π 2σ 2 Hvis y1,, y N er uafhængige så er f(y 1,, y N ) = N f(y i ) i=1 39 / 40
40 Bliver helt konkret 1 f(y1,, y N ) = ( σ 2π ) N exp( 1 2σ 2 N (y i (β0 + β1x i )) 2 ) i=1 Antag nu at σ er kendt. Så er likelihood funktionen L(β1, β2) exp( 1 2σ 2 N (y i (β0 + β1x i )) 2 ) i=1 Pga af minus i eksponenten så maximeres L ved at minimere N (y i (β0 + β1x i )) 2 i=1 Dvs i regressionsmodellen er mindste kvadrater og MLE det samme. 40 / 40
Hypotesetests, fejltyper og p-værdier
Hypotesetests, fejltyper og p-værdier Søren Højsgaard Institut for Matematiske Fag, Aalborg Universitet October 25, 2018 Søren Højsgaard Institut for Matematiske Fag, Aalborg Hypotesetests, Universitet
Læs mereHøjde af kvinder 2 / 18
Hvorfor er normalfordelingen så normal? og er den nu også det? Søren Højsgaard (updated: 2019-03-17) 1 / 18 Højde af kvinder 2 / 18 Inddeler man i mindre grupper kan man forestille sig at histogrammet
Læs mereTrin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse
Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ
Læs meret-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.
t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program (8.15-10): 1. repetition: fordeling af observatorer X, S 2 og t. 2. konfidens-intervaller, hypotese test, type I og type II fejl, styrke,
Læs mereSusanne Ditlevsen Institut for Matematiske Fag susanne
Statistik og Sandsynlighedsregning 1 STAT kapitel 4.4 Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne 7. undervisningsuge, mandag 1 Estimation og konfidensintervaller
Læs mereProdukt og marked - matematiske og statistiske metoder
Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring
Læs mereEstimation og konfidensintervaller
Statistik og Sandsynlighedsregning STAT kapitel 4.4 Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne Estimation og konfidensintervaller Antag X Bin(n,
Læs mereKursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte
Læs mere3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve
Læs mereKursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte
Læs mereHvorfor er normalfordelingen så normal?
Hvorfor er normalfordelingen så normal? Søren Højsgaard Institut for Matematiske Fag, Aalborg Universitet October 24, 2018 normalfordelingen så normal? October 24, 2018 1 / 13 Højde af kvinder Histogram
Læs mereHvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05
Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ
Læs mereTema. Dagens tema: Indfør centrale statistiske begreber.
Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i
Læs mereProgram: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.
Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. 1/23 Opsummering af fordelinger X 1. Kendt σ: Z = X µ σ/ n N(0,1)
Læs mere1 Hb SS Hb Sβ Hb SC = , (s = )
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.
Læs mereAnvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele
Anvendt Statistik Lektion 4 Hypotesetest generelt Test for middelværdi Test for andele Hypoteser og Test Hypotese I statistik er en hypotese en påstand om en populationsparameter. Typisk en påstand om
Læs mereProgram: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19
Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større
Læs mere1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...
Indhold 1 Statistisk inferens: Hypotese og test 2 1.1 Nulhypotese - alternativ.................................. 2 1.2 Teststatistik........................................ 3 1.3 P-værdi..........................................
Læs mereTema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.
Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller
Læs mereHypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0
Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt
Læs mereNote om Monte Carlo metoden
Note om Monte Carlo metoden Kasper K. Berthelsen Version 1.2 25. marts 2014 1 Introduktion Betegnelsen Monte Carlo dækker over en lang række metoder. Fælles for disse metoder er, at de anvendes til at
Læs mereHvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau
Hvad skal vi lave? 1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ. Teststatistik P-værdi Signifikansniveau 2 t-test for middelværdi Tosidet t-test for middelværdi Ensidet t-test for middelværdi
Læs mereKursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet March 1, 2013 Sandsynlighedsregning og lagerstyring Normalfordelingen
Læs mereHvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm
Kon densintervaller og vurdering af estimaters usikkerhed Claus Thorn Ekstrøm KU Biostatistik ekstrom@sund.ku.dk Marts 18, 2019 Slides @ biostatistics.dk/talks/ 1 Population og stikprøve 2 Stikprøvevariation
Læs mereEnsidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese
Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet
Læs mereResumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se
Epidemiologi og biostatistik. Uge, torsdag 5. februar 00 Morten Frydenberg, Institut for Biostatistik. Type og type fejl Statistisk styrke Nogle speciale metoder: Normalfordelte data : t-test eksakte sikkerhedsintervaller
Læs mereKvantitative Metoder 1 - Efterår Dagens program
Dagens program Estimation: Kapitel 9.7-9.10 Estimationsmetoder kap 9.10 Momentestimation Maximum likelihood estimation Test Hypoteser kap. 10.1 Testprocedure kap 10.2 Teststørrelsen Testsandsynlighed 1
Læs mereAnvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af
Læs mereStatistik II 4. Lektion. Logistisk regression
Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Uafhængighedstestet Eksempel: Bissau data Data kommer fra Guinea-Bissau i Vestafrika: 5273 børn blev undersøgt da de var yngre end 7 mdr og blev
Læs mereI dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd
I dag Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik SaSt) Helle Sørensen Først lidt om de sidste uger af SaSt. Derefter statistisk analyse af en enkelt
Læs mereVejledende besvarelser til opgaver i kapitel 14
Vejledende besvarelser til opgaver i kapitel 14 Opgave 1 a) Det første trin i opstillingen af en hypotesetest er at formulere to hypoteser, hvoraf den ene støtter den teori vi vil teste, mens den anden
Læs mereKvantitative Metoder 1 - Forår 2007. Dagens program
Dagens program Hypoteser: kap: 10.1-10.2 Eksempler på Maximum likelihood analyser kap 9.10 Test Hypoteser kap. 10.1 Testprocedure kap 10.2 Teststørrelsen Testsandsynlighed 1 Estimationsmetoder Kvantitative
Læs mereStatistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller
Statistik II 1. Lektion Sandsynlighedsregning Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller
Læs mereStatikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression
Statikstik II 2. Lektion Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Sandsynlighedsregningsrepetition Antag at Svar kan være Ja og Nej. Sandsynligheden for at Svar Ja skrives
Læs mereKonfidensintervaller og Hypotesetest
Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller
Læs meremen nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller
Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =
Læs mereProgram. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter
Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede
Læs mereStatDataN: Test af hypotese
StatDataN: Test af hypotese JLJ StatDataN: Test af hypotese p. 1/69 Repetition n uafhængige gentagne målinger: Fordelingsundersøgelse: Pindediagram / Histogram qq-plot Parameter: egenskab ved fordeling
Læs mereOverheads til forelæsninger, mandag 5. uge På E har vi en mængde af mulige sandsynlighedsfordelinger for X, (P θ ) θ Θ.
Statistiske modeller (Definitioner) Statistik og Sandsynlighedsregning 2 IH kapitel 0 og En observation er en vektor af tal x (x,..., x n ) E, der repræsenterer udfaldet af et (eller flere) eksperimenter.
Læs mereLandmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen
Landmålingens fejlteori Lektion Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet En stokastisk variabel er en variabel,
Læs mereStatistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
Statistik II Lektion 3 Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Setup: To binære variable X og Y. Statistisk model: Konsekvens: Logistisk regression: 2 binære var. e e X Y P
Læs mereStatistiske principper
Statistiske principper 1) Likelihood princippet - Maximum likelihood estimater - Likelihood ratio tests - Deviance 2) Modelbegrebet - Modelkontrol 3) Sufficient datareduktion 4) Likelihood inferens i praksis
Læs mereLøsning eksamen d. 15. december 2008
Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Læs mereRettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007
Rettevejledning til eksamen i Kvantitative metoder 1,. årsprøve. januar 007 I rettevejledningen henvises der til Berry and Lindgren "Statistics Theory and methods"(b&l) hvis ikke andet er nævnt. Opgave
Læs mereNanostatistik: Test af hypotese
Nanostatistik: Test af hypotese JLJ Nanostatistik: Test af hypotese p. 1/50 Repetition n uafhængige gentagne målinger: Fordelingsundersøgelse: Pindediagram / Histogram qq-plot Parameter: egenskab ved fordeling
Læs mereOversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff
Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Indledende om Signifikanstest Boldøvelser
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Indledende om Signifikanstest Boldøvelser 1 Påstand: Et nyt præparat M virker mod migræne. Inden præparatet kan markedsføres, skal denne påstand
Læs mereLøsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)
Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up
Læs mereLogistisk Regression - fortsat
Logistisk Regression - fortsat Likelihood Ratio test Generel hypotese test Modelanalyse Indtil nu har vi set på to slags modeller: 1) Generelle Lineære Modeller Kvantitav afhængig variabel. Kvantitative
Læs mereStatistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge
Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2
Læs mereAnvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger
Anvendt Statistik Lektion 2 Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Sandsynlighed: Opvarmning Udfald Resultatet af et eksperiment kaldes et udfald. Eksempler:
Læs mereStatistik viden eller tilfældighed
MATEMATIK i perspektiv Side 1 af 9 DNA-analyser 1 Sandsynligheden for at en uskyldig anklages Følgende histogram viser, hvordan fragmentlængden for et DNA-område varierer inden for befolkningen. Der indgår
Læs mereEksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning
1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion
Læs mereAgenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede
Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede fordelinger (kap. 4) Middelværdi og varians (kap. 3-4) Fordelingsresultater
Læs mereAnvendt Statistik Lektion 8. Multipel Lineær Regression
Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke
Læs mereVejledende løsninger kapitel 8 opgaver
KAPITEL 8 OPGAVE 1 Nej den kan også være over 1 OPGAVE 2 Stikprøvestørrelse 10 Stikprøvegennemsnit 1,18 Stikprøvespredning 0,388158 Konfidensniveau 0,95 Nedre grænse 0,902328 Øvre grænse 1,457672 Stikprøvestørrelse
Læs mereProgram. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18
Program 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Fordeling af X Stikprøve X 1,X 2,...,X n stokastisk X stokastisk. Ex (normalfordelt stikprøve)
Læs mere1. februar Lungefunktions data fra tirsdags Gennemsnit l/min
Epidemiologi og biostatistik Uge, torsdag 3. februar 005 Morten Frydenberg, Afdeling for Biostatistik. og hoste estimation sikkerhedsintervaller antagelr Normalfordelingen Prædiktion Statistisk test (ud
Læs mereAnvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger
Anvendt Statistik Lektion 2 Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Sandsynlighed: Opvarmning Udfald Resultatet af et eksperiment kaldes et udfald. Eksempler:
Læs mereProdukt og marked - matematiske og statistiske metoder
Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 11, 2016 1/22 Kursusindhold: Sandsynlighedsregning og lagerstyring
Læs mereBinomialfordelingen. X ~ bin(n,p): X = antal "succeser" i n uafhængige forsøg, der alle har samme sandsynlighed p for at ende med succes.
Uge 9 Teoretisk Statistik 23. februar 24 1. Binomialfordelingen 2. Den hypergeometriske fordeling 3. Poissonfordelingen 4. Den negative binomialfordeling 5. Gammafordelingen Binomialfordelingen X ~ bin(n,p):
Læs mereOvenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.
Multiple choice opgaver Der gøres opmærksom på, at ideen med opgaverne er, at der er ét og kun ét rigtigt svar på de enkelte spørgsmål. Endvidere er det ikke givet, at alle de anførte alternative svarmuligheder
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs mereKursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher
Kursus 02323: Introducerende Statistik Forelæsning 12: Forsøgsplanlægning Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk
Læs mereStatistik II 1. Lektion. Analyse af kontingenstabeller
Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression
Læs mereBasal statistik. 6. februar 2007
Basal statistik 6. februar 2007 Statistisk inferens Sandsynligheder Fordelinger Modeller Statistisk analyse Lene Theil Skovgaard, Biostatistisk Afdeling Institut for Folkesundhedsvidenskab, Københavns
Læs mereForelæsning 11: Kapitel 11: Regressionsanalyse
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs mere1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable
Landmålingens fejlteori - lidt om kurset Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet Kursusholder
Læs mereSandsynlighedsregning
Mogens Bladt www2.imm.dtu.dk/courses/02405 21. September, 2007 Lidt om binomialkoefficienter n størrelsen af en mængde/population. Vi ønsker at udtage en sub population af størrelse r. To sub populationer
Læs mereTest nr. 6 af centrale elementer 02402
QuizComposer 2001- Olaf Kayser & Gunnar Mohr Contact: admin@quizcomposer.dk Main site: www.quizcomposer.dk Test nr. 6 af centrale elementer 02402 Denne quiz angår forståelse af centrale elementer i kursus
Læs mereMotivation. Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser
Motivation Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser Rasmus Waagepetersen October 26, 2018 Eksempel: En landmåler får til opgave at måle længden λ fra A til B. Entreprenøren
Læs mereNormalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ
Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet
Læs mereKursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 9, 2015 Sandsynlighedsregning og lagerstyring Normalfordelingen
Læs mereForelæsning 9: Inferens for andele (kapitel 10)
Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs mereLøsning til eksaminen d. 29. maj 2009
DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Læs mereOversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse
Læs mereLogistisk Regression. Repetition Fortolkning af odds Test i logistisk regression
Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π
Læs mereJ E T T E V E S T E R G A A R D
BINOMIALT EST J E T T E V E S T E R G A A R D F I P B I O L O G I M A R S E L I S B O R G G Y M N A S I U M D. 1 3. M A R T S 2 0 1 9 K A L U N D B O R G G Y M N A S I U M D. 1 4. M A R T S 2 0 1 9 HVEM
Læs mere02402 Løsning til testquiz02402f (Test VI)
02402 Løsning til testquiz02402f (Test VI) Spørgsmål 4. En ejendomsmægler ønsker at undersøge om hans kunder får mindre end hvad de har forlangt, når de sælger deres bolig. Han har regisreret følgende:
Læs mereEksamen i Statistik for biokemikere. Blok
Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)
Læs mereStatistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge
Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange
Læs mereRegneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)
Formelsamlingen 1 Regneregler for middelværdier M(a + bx) a + bm X M(X+Y) M X +M Y Spredning varians og standardafvigelse VAR(X) 1 n n i1 ( X i - M x ) 2 Y a + bx VAR(Y) VAR(a+bX) b²var(x) 2 Kovariansen
Læs mereStatistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test
Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,
Læs mereOm hypoteseprøvning (1)
E6 efterår 1999 Notat 16 Jørgen Larsen 11. november 1999 Om hypoteseprøvning 1) Det grundlæggende problem kan generelt formuleres sådan: Man har en statistisk model parametriseret med en parameter θ Ω;
Læs mereBasal statistik. 11.september 2007
Basal statistik 11.september 2007 Statistisk inferens Sandsynligheder Fordelinger og modeller Statistisk analyse Type 1 og 2 fejl, styrke Lene Theil Skovgaard, Biostatistisk Afdeling Institut for Folkesundhedsvidenskab,
Læs mereIkke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test
Ikkeparametriske metoder Repetition Wilcoxon SignedRank Test KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,
Læs mereBinomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/
Program: 1. Repetition af vigtige sandsynlighedsfordelinger: binomial, (Poisson,) normal (og χ 2 ). 2. Populationer og stikprøver 3. Opsummering af data vha. deskriptive størrelser og grafer. 1/29 Binomial
Læs mereModul 12: Regression og korrelation
Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 12: Regression og korrelation 12.1 Sammenligning af to regressionslinier........................ 1 12.1.1 Test for ens hældning............................
Læs merePraktiske ting og sager: Forelæsninger tirsdag og torsdag kl i Kirkesalen, Studiestræde 38 Øvelser
Uge 36 Velkommen tilbage Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl. -2 i Kirkesalen, Studiestræde 38 Øvelser Hold -4 og 6: mandag og onsdag kl. 8-; start 3. september Hold 5: tirsdag
Læs mereLogistisk Regression. Repetition Fortolkning af odds Test i logistisk regression
Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression: Definitioner For en binær (0/) variabel Y antager vi P(Y)p P(Y0)-p Eksempel: Bil til arbejde vs alder
Læs mereForsøgsplanlægning Stikprøvestørrelse
Basal statistik Esben Budtz-Jørgensen 6. november 2007 Forsøgsplanlægning Stikprøvestørrelse 1 41 Planlægning af et studie Videnskabelig hypotese Endpoints Instrumentelle/eksponerings variable Variationskilder
Læs mereKursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff
Kursus 02402 Introduktion til Statistik Forelæsning 13: Summary Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:
Læs mere1 Regressionsproblemet 2
Indhold 1 Regressionsproblemet 2 2 Simpel lineær regression 3 2.1 Mindste kvadraters tilpasning.............................. 3 2.2 Prædiktion og residualer................................. 5 2.3 Estimation
Læs mereMindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning
1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3
Læs mereFor nemheds skyld: m = 2, dvs. interesseret i fordeling af X 1 og X 2. Nemt at generalisere til vilkårligt m.
1 Uge 11 Teoretisk Statistik 8. marts 2004 Kapitel 3: Fordeling af en stokastisk variabel, X Kapitel 4: Fordeling af flere stokastiske variable, X 1,,X m (på en gang). NB: X 1,,X m kan være gentagne observationer
Læs mereBasal statistik. 6. februar 2007
Basal statistik 6. februar 2007 Statistisk inferens Sandsynligheder Fordelinger Modeller Statistisk analyse Lene Theil Skovgaard, Biostatistisk Afdeling Institut for Folkesundhedsvidenskab, Københavns
Læs mereMikro-kursus i statistik 2. del Mikrokursus i biostatistik 1
Mikro-kursus i statistik 2. del 24-11-2002 Mikrokursus i biostatistik 1 Hvad er hypotesetestning? I sundhedsvidenskab:! Hypotesetestning = Test af nulhypotesen Hypotese-testning anvendes til at vurdere,
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Estimation
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Estimation Eksempel: Bissau data Data kommer fra Guinea-Bissau i Vestafrika: 5273 børn blev undersøgt da de var yngre end 7 mdr og blev herefter
Læs mere