Overdispersion, dispersionsparameter: Dagens program, Mandag den 4. april :
|
|
- Georg Andreasen
- 5 år siden
- Visninger:
Transkript
1 Overdispersion, dispersionsparameter: Dagens program, Mandag den 4. april : udvidelse til modeller med overdispersion, quasi-likelihood, dvs alle knapperne i Metode menuen Hierarkiske normalfordelingsmodeller Generaliserede lineære modeller, afslutning Ordnet kategorisk respons, Data buscum, busmult Overdispersion, Data beetles Quasi-likelihood Hierarkiske normalfordelingsmodeller Model Varians- kovariansforhold Fordeling af gruppegennemsnit Test af homogenitetshypotese, variansanalyseskema Maksimum-likelihood estimation Estimation af tilfældige effekter Fortolkning af estimater, empiriske Bayes Eksempel Datasæt Beetles indeholder data fra et eksperiment, der havde til formål at vurdere sammenhængen mellem indblæst koncentration af ethylenoxid og andel døde biller i et prøvemedium. konc angiver koncentrationen, ekspon antallet af eksponerede, doede antallet af døde, og andel angiver andelen af døde. Grafisk vurdering: Scatterplot af andel mod koncentration, ser logistisk ud 3 Billedødelighed: Test for modeltilpasning i generaliserede lineære modeller Størrelsen Error Deviance i Analysis of Deviance bruges til at teste goodness of fit før evt reduktion af modellen. Model: dod = sta myaar sta myaar Fit menu: doede Y konc X Method: Response Dist: Binomial ekspon Binomial Link: Logit Hvis data viser stærk uoverensstemmelse med modellen, dvs hvis Error deviansen er signifikant i χ 2 -fordelingen, må man finde flere forklarende variable - eller bruge en model med overdispersion Teststørrelsen for Goodness of fit er stærkt signifikant, så vi må afvise antagelsen om binomialfordeling og logistisk dosis-respons. Der er ingen systematik i residualerne, så vi vælger at fastholde den logistiske model, men der er åbenbart større varians, end forklaret ved binomialfordelingen (fx pga klumpning). 2 4
2 Dispersionsparameter: Vi vælger at indføre en dispersionsparameter σ 2 ved λ i = w i /σ 2 (jvf fremstillingen (4.5) side 06) som en fast faktor, σ 2, til variansen µ i ( µ i )/w i på en observeret binomial andel Z i = Y i /n i. V[Z i ]=σ 2 µ i( µ i ) n i idet w i = n i. Tastetryk ved estimation af dispersionsparameter : Ved Fit menu: I Method menuen vælges Scale: Deviance endvidere vælges Quasi-likelihood Bemærk, at her indgår Enhedsvariansfunktionen V (µ) =µ( µ) Den kendte vægt w i = n i ( indføres i proceduren via angivelse af nbinomial). dispersionsparameteren σ 2 Det bevirker, at der estimeres en Scale ved σ = D( y; µ( β) ) k m men iøvrigt får man de samme størrelser som før (dog ændres standardiserede deviansresidualer mv). 5 7 Estimation af dispersionsparameter: Vi ved ikke, hvordan tætheden ser ud for en binomialfordeling med påhæftet dispersionsparameter. Dispersionsparameteren indgår i normeringskonstanten på en eller anden måde. Så vi kan ikke uden videre lave en maximum-likelihood estimation. Men vi ved, at residualdeviansen D ( y; µ( β) ) σ 2 χ 2,også kan vi da i lighed med normalfordelingssituationen estimere σ 2 ved σ 2 = D( y; µ( β) ) k m eller vi kunne have brugt Pearson-størrelsen på tilsvarende måde. I SAS kaldes kvadratroden, σ, af dispersionsparameteren σ 2 for Scale. [Dette gælder for Normal, Invers Gauss, Binomial og Poisson-fordeling. For gammafordelingen er Scale netop dispersionsparameteren.] Tastetryk ved estimation af dispersionsparameter : Ved PROC GENMOD: PROC GENMOD data = beetles; model doede/ekspon = konc /DIST = Bin SCALE=D OBSTATS Type ; RUN; QUIT; Scale = D (DEVIANCE) bevirker at scale estimeres som kvadratroden af devians divideret med frihedsgrader. Bemærk, at nu kan vi ikke teste goodness of fit - og vi kan ikke umiddelbart bruge teststørrelser D(µ( β); µ( γ))/df i type og type 3 tests, men at de skal divideres med kvadratet på scale parameteren resulterende i et approksimativt F-test (i lighed med normalfordelingssituationen). I PROC GENMOD foretages denne skalering automatisk. 6 8
3 Pseudo-likelihood : I princippet er estimaterne for middelværdiparametrene ikke maksimum-likelihood estimater, for likelihoodfunktionen indeholder også normeringskonstantens afhængighed af σ. Den funktion D (y; µ) = k w 2σ 2 i d(y i,µ i ) i= som vi har maksimeret, kaldes en quasi-loglikelihood (quasi= som om). Estimationsligningen (estimation equation) til bestemmelse af middelværdiparametrene fås netop ved at sætte quasi-scoren lig med nul. Hvad angår middelværdiparametrene opfører den sig jo som den rigtige likelihood. Estimationen af middelværdiparametrene ændres ikke ved at indføre denne overdispersion. Overdispersion: Overdispersion kan manifesteres på to forskellige måder: Heterogenitetsfaktor: Konstant faktor, σ 2 til variansfunktionen V (µ) V[Y] =σ 2 V(µ) Resultat af random effects Det kan ske, at µ varierer tilfældigt inden for et forsøg fx kan det forekomme ved musefosterforsøgene, at der er en tilfældig variation af dødssandsynligheden p fra kuld til kuld. Vi vil senere (kap 7) vende tilbage til modellering af sådanne tilfældige effekter. 9 Tilbage til normalfordelingsmodeller PROC GENMOD, Scale option Noscale Scale= talværdi markeret markeret scale fastholdt på talværdi markeret ej markeret scale fastholdt på værdien ej markeret ej markeret scale estimeres ved ML ej markeret markeret iteration starter ved talværdi NOSCALE holder skalaparameteren fast. ML-estimation kan udføres for normal, invers gauss, negativ binomialfordeling og gamma. SCALE = DEVIANCE eller SCALE = PEARSON bruges til estimation af overdispersion. Eksempel, uldballer Renhed i % ren uld af 4 prøver fra hver af 7 baller uruguyansk uld Balle nr. Prøve Balle gennemsnit Formål at beskrive variation med henblik på tilrettelæggelse af stikprøveudtagning fra tilsvarende sendinger. 0 2
4 Hierarkisk model Først udtages en balle tilfældigt. Derefter udtages fire prøver tilfældigt fra denne balle. Y ij j te prøve fra i te balle. ɛ ij N(0,σ 2 ) uafhængige Alternativ formulering: Y ij = µ 0 + A i + ɛ ij, For fastholdt balle, uafhængige gentagelser. A i N(0,σb 2 ) uafhængige, og uafhængige af ɛ Ballerenheden µ i varierer fra balle til balle: Y ij µ i N(µ i,σ 2 ), Y i µ i N(µ i,σ 2 I 4 ) µ i N(µ 0,σ 2 b ) indbyrdes uafhængige 3 5 Modellens parametre Marginale fordelinger Den marginale fordeling af Y ij er en normal fordeling Modellen har parametrene µ 0,σ 2,σ 2 b. E[Y ij ]=µ 0 Vi sætter (Signal støj- forhold) γ = σ 2 b/σ 2 σb 2+σ2 for (i, j) =(h, l) COV[Y ij, Y hl ]= σb 2 for i = h, j l 0 for i h 4 6
5 Vi husker nemlig E[X] = E Y [ E[X Y]] D[X] = E Y [ D [X Y]]+ D Y [E[X Y]] Fordeling af i te sæt Lad Y i angiver observationer fra i te udtagne balle. Y, Y 2,...,Y q er uafhængige observationssæt Y i N ni (µ,σ 2 I ni +σbj 2 ni ) hvor J n angiver en n n matrix med ettaller. Dispersionsmatricen for Y i er V i = D [Y i ]=E[(Y i µ)(y i µ) T ] σb 2 + σ2 σb 2... σb 2 σb = σb 2... σb σb 2 σb 2... σb 2 +σ2 7 9 Egenskaber ved modellen Observationer fra samme balle er korrelerede Fordeling af hele observationssættet Y består af q uafhængige gentagelser med fordeling som Y i Korrelationskoefficienten kaldes intraklassekorrelationen ρ = σ2 b σb 2 + = γ σ2 +γ D [Y] =V= Blok diag{v i } 8 20
6 Fordeling af gruppegennemsnit { σ 2 COV[Y i, Y h ] = b +σ 2 /n i for i = h 0 ellers Gruppegennemsnit Y i, i=,2,...,q er indbyrdes uafhængige. V[Y i ] =σb+σ 2 2 /n i =σ 2 (γ+/n i ) omfatter bidrag fra variansen på den tilfældige komponent, γ i, og residualvariansen på gennemsnittet. Test af homogenitetshypotese Ingen forskel på baller, svarer til H II : σb 2 =0. Hypotesen testes ved at sammenligne varianskvotienten Z = SAK 2/(k ) SAK /(N k) med fraktilerne i en F(k,N k)-fordeling Som vanligt: sak = y = i n k i (y ij y i )) 2 i= j= n i y i /N (0.) sak 2 = k n i (y i y) 2 i= 2 23 Forøgelse af stikprøvestørrelse Konfidensinterval for varianskvotienten γ I balanceret tilfælde, n = n 2 =...=n k =n En forøgelse af stikprøvestørrelsen i de enkelte grupper vil således forøge præcisionen ved bestemmelse af gruppeforventningsværdien µ i, men variationen mellem de enkelte gruppeforventningsværdier formindskes naturligvis ikke ved denne gennemsnitsdannelse. fås ved at benytte Resultatet er eksakt γ L = ( n og γ U = ( n P[γ L <γ<γ U ]= α Z F(k,N k) α/2 Z F(k,N k) α/2 ) ) 22 24
7 Forventningsværdi af SAK er Maksimum- likelihood estimation Estimation af µ 0 : E[SAK /(N k)] = σ 2 og I balanceret tilfælde bare det fælles gennemsnit E[SAK 2 /(k )] = σ 2 + n 0 σ 2 0 hvor n 0 = k n i ( k n2 i / k n ( i) = N k i n2 i N )/ (k ) er den vægtede gennemsnitlige gruppestørrelse (i balanceret tilfælde er n 0 = n). I ubalanceret tilfælde løsning til hvor µ = k n i w i ( γ)y i /W ( γ) i= w i (γ) = +n i γ k W(γ)= n i w i (γ) i= Forventningsværdi af SAK er Kan fås af PROC GLM ved at skrive en sætning RANDOM balle; Variation SAK f s 2 = SAK/f E[S 2 ] Mellem baller σ 2 +4σ 2 b Indenfor baller σ 2 Estimation af σ 2 og σ 2 0 Maksimum- likelihood estimation Sædvanligvis benyttes REML-estimation (residual maximum likelihood), baseret på residualerne, - og som tager hensyn til at man har estimeret µ
8 PROC MIXED Proceduren MIXED er specielt rettet mod modeller med tilfældige effekter Estimation (prædiktion) af enkelte ballemiddelværdier PROC MIXED METHOD=REML ASYCOV ; CLASS balle prove; MODEL renh = ; RANDOM balle ; RUN; Løsningen tilfredsstiller dvs n i γ + µ i = n iγy i + µ 0 γσ 2 γσ 2 µ i =( w i (γ))y i + w i (γ)µ 0 et vejet gennemsnit mellem de individuelle gennemsnit y i og det fælles gennemsnit µ 0 med vægtene ( w i (γ)) og w i (γ), hvor w i (γ)= +n i γ Løsningen kaldes BLUP-estimatet (best linear unbiased predictor) se fx (0.2) 29 3 Estimation (prædiktion) af enkelte ballemiddelværdier L(µ 0,σ 2,γ,µ)=f(y µ)f(µ) log-likelihood en l(µ 0,σ 2,γ,µ)= (N/2) log(σ 2 ) sak + i (y i µ i ) 2 i (k/2) log(γσ 2 ) (µ i µ 0 ) 2 2σ 2 2γσ 2 Differentieres med hensyn til µ i finder vi l(µ 0,σ 2,γ,µ)= n i(y i µ i µ i σ 2 der er nul for (µ i µ γσ 2 ( ni µ i σ + ) = n i 2 γσ 2 σ 2y i + γσ 2µ 0 BLUP estimat som empirisk Bayes estimat Indskud om betingede og marginale fordelinger Vi starter med marginal fordeling af Y (baller), f Y (y) og betinget fordeling af X (målinger) for givet Y = y, g(x y). Simultan tæthed for X og Y, f xy (x, y) =f Y (y)g(x y) Marginal fordeling af X f X (x) = g(x y)f Y (y)dy y= Den betingede fordeling af Y givet X = x har tætheden h(y x) = f xy(x, y) = g(x y)f Y (y) f X (x) f X (x) f Y (y) kaldes apriorifordeling, g(x y) for stikprøvefordeling, og h(y x) aposteriorifordeling 30 32
9 Apriori, aposteriori for normalfordeling µ i N(µ 0,σb 2) og Y ij µ i N(µ i,σ 2 ) Da er aposteriorifordeling af µ i efter observation af ȳ i en normalfordeling med: E[µ i Y i = ȳ i ]= µ 0/σb 2 + n iȳ i /σ 2 /σb 2 + n i/σ 2 og V[µ i Y i = ȳ i ]= + n = i σ 2 σ 2 b Empirisk Bayes Hvis vi indsætter estimater for apriorifordelingens parametre, µ 0, σ 2 og σb 2 kaldes løsningen en Empirisk Bayes løsning. Den svarer altså til BLUP-løsningen I PROC MIXED Apriori, aposteriori for normalfordeling E[µ i Y i = ȳ i ]= µ 0/γ + n i ȳ i = w n µ 0 +( w n )ȳ i /γ + n i med w =/( + nγ). σapost 2 = σb 2 + n i σ 2 Kodeordet OUTP i modelsætningen angiver, at man får udskrevet estimaterne (prædikterede værdier) for de enkelte baller i det valgte datasæt. PROC MIXED DATA = DROP METHOD=REML ASYCOV ; CLASS balle prove; MODEL renh = / OUTP = pred ; RANDOM balle ; RUN; aposterioripræcision er summen af aprioripræcision og stikprøvepræcision = + n i γ aposteriori γ apriori 34 36
Vi sætter. (Signal støj- forhold) Poul Thyregod, 25. april Specialkursus vid.stat. foraar Lad Y i angiver observationer fra i te udtagne balle.
Modellens parametre Mandag den 25 april Hierarkiske normalfordelingsmodeller Dagens program: Resume af ensidet variansanalysemodel med tilfældig effekt estimation af tilfældige effekter, fortolkning som
Læs mere2 Opgave i hierarkiske normalfordelingsmodeller
IMM, 2005-04-04 Poul Thyregod Flere rotter Datasættet Metal indeholder resultaterne fra en forsøgsserie, der havde til formål at bestemme toxiteten af et metalsalt (Nikkel). Ved forsøget benyttede man
Læs mereNoter til Specialkursus i videregående statistik
Noter til Specialkursus i videregående statistik Poul Thyregod IMM, februar 2005 Indhold Forord 6 1 Momenter og flerdimensionale stokastiske variable 7 1.0 Indledning............................. 7 1.1
Læs mereNormalfordelingsmodeller med hierarkisk variation
Kapitel 5 Normalfordelingsmodeller med hierarkisk variation Hidtil har vi hovedsageligt kun betragtet modeller med ét niveau af tilfældig variation (gentagelsesvariation). I mange af de situationer, man
Læs mereDagens program: Andel døde musefostre som fkt af indgivet konc.: Eksponentielle familier af fordelinger: Toxitetsvurdering for kølevæske:
Dagens program: Mandag den 8. februar Generaliserede lineære modeller Motiverende eksempel, logistisk regression Eksponentielle dispersionsfamilier Generaliseret lineær model Estimation, fordeling af residualer
Læs merePoul Thyregod, 2. maj Specialkursus vid.stat. foraar exp µ β/(1 + β), som netop er kernen i en Gammafordeling med formparameteren
Hierarkisk model for Poisson fordeling med overdispersion Dagens program: Mandag den 2. maj Hierarkiske generaliserede lineære modeller Eksempel: hierarkisk Poissonfordelingsmodel Eksempel: hierarkisk
Læs mereµ = κ (θ); Kanonisk link, θ = g(µ) Poul Thyregod, 9. maj Specialkursus vid.stat. foraar 2005
Hierarkiske generaliserede lineære modeller Lee og Nelder, Biometrika (21) 88, pp 987-16 Dagens program: Mandag den 2. maj Hierarkiske generaliserede lineære modeller - Afslutning Hierarkisk generaliseret
Læs mereGenerelle lineære mixede modeller
Kapitel 6 Generelle lineære mixede modeller 6.0 Introduktion De hierarkiske lineære normalfordelingsmodeller, vi betragtede i det foregående afsnit, er specialtilfælde af en generel klasse af modeller,
Læs mereIntroduktion til GLIMMIX
Introduktion til GLIMMIX Af Jens Dick-Nielsen jens.dick-nielsen@haxholdt-company.com 21.08.2008 Proc GLIMMIX GLIMMIX kan bruges til modeller, hvor de enkelte observationer ikke nødvendigvis er uafhængige.
Læs mereDagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at
Likelihood teori Lineær regression (intro) Dagens Emner Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 1 ) = ( 2πσ 2)n/2 e 1 2 P n (xi µ)2 er tætheden som funktion af
Læs mereØkonometri: Lektion 2 Multipel Lineær Regression 1/27
Økonometri: Lektion 2 Multipel Lineær Regression 1/27 Multipel Lineær Regression Sidst så vi på simpel lineær regression, hvor y er forklaret af én variabel. Der er intet, der forhindre os i at have mere
Læs merePoul Thyregod, introslide.tex Specialkursus vid.stat. foraar Lad θ = θ(β) R k for β B R m med m k
Dagens program: Likelihoodfunktion, begreber : Mandag den 4. februar Den generelle lineære model score-funktion: første afledede af log-likelihood har middelværdien nul observeret information: anden afledede
Læs mereI dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd
I dag Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik SaSt) Helle Sørensen Først lidt om de sidste uger af SaSt. Derefter statistisk analyse af en enkelt
Læs mereStatistiske Modeller 1: Kontingenstabeller i SAS
Statistiske Modeller 1: Kontingenstabeller i SAS Jens Ledet Jensen October 31, 2005 1 Indledning Som vist i Notat 1 afsnit 13 er 2 log Q for et test i en multinomialmodel ækvivalent med et test i en poissonmodel.
Læs mereSimpel Lineær Regression: Model
Simpel Lineær Regression: Model Sidst så vi på simpel lineære regression. Det er en statisisk model på formen y = β 0 + β 1 x + u, hvor fejlledet u, har egenskaben E[u x] = 0. Dette betyder bl.a. E[y x]
Læs mereTema. Dagens tema: Indfør centrale statistiske begreber.
Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i
Læs mereMuligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling.
Eksempel: dæktyper og brændstofforbrug (opgave 25 side 319) Program: cars 1 2 3 4 5... radial 4.2 4.7 6.6 7.0 6.7... belt 4.1 4.9 6.2 6.9 6.8... Muligheder: 1. vi starter med at gennemgå opgave 7 side
Læs mere1 Regressionsproblemet 2
Indhold 1 Regressionsproblemet 2 2 Simpel lineær regression 3 2.1 Mindste kvadraters tilpasning.............................. 3 2.2 Prædiktion og residualer................................. 5 2.3 Estimation
Læs mereKvantitative Metoder 1 - Forår Dagens program
Dagens program Afsnit 6.1 Den standardiserede normalfordeling Normalfordelingen Beskrivelse af normalfordelinger: - Tæthed og fordelingsfunktion - Middelværdi, varians og fraktiler Lineære transformationer
Læs mereMindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning
1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3
Læs mereMLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som
MLR antagelserne Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + u, hvor β 0, β 1, β 2,...,β k er ukendte parametere,
Læs mereDagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22
Dagens Emner Likelihood teori Lineær regression (intro) p. 1/22 Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 ) = ( 1 2πσ 2)n/2 e 1 2σ 2 P n (x i µ) 2 er tætheden som
Læs mereModul 6: Regression og kalibrering
Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 6: Regression og kalibrering 6.1 Årsag og virkning................................... 1 6.2 Kovarians og korrelation...............................
Læs merePoul Thyregod, 14. marts Specialkursus vid.stat. foraar 2005. side 182
Dagens program: Mandag den 14 marts Eksempler på generaliserede lineære modeller Regressions- og faktormodeller, forskellige responsfordelinger Resume Poisson regression (brug af offset). Data nematod
Læs mereLidt om fordelinger, afledt af normalfordelingen
IMM, 2002-10-10 Poul Thyregod Lidt om fordelinger, afledt af normalfordelingen 1 Introduktion I forbindelse med inferens i normalfordelinger optræder forskellige fordelinger, der er afledt af normalfordelingen,
Læs mereKvantitative Metoder 1 - Efterår Dagens program
Dagens program Afsnit 6.1. Ligefordelinger, fra sidst Den standardiserede normalfordeling Normalfordelingen Beskrivelse af normalfordelinger: - Tæthed og fordelingsfunktion - Middelværdi, varians og fraktiler
Læs mereAnvendt Statistik Lektion 8. Multipel Lineær Regression
Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke
Læs mereAgenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede
Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede fordelinger (kap. 4) Middelværdi og varians (kap. 3-4) Fordelingsresultater
Læs mereProgram. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen)
Faculty of Life Sciences Program Logistisk regression Claus Ekstrøm E-mail: ekstrom@life.ku.dk Odds og odds-ratios igen Logistisk regression Estimation og inferens Modelkontrol Slide 2 Statistisk Dataanalyse
Læs mereKvantitative metoder 2
Kvantitative metoder 2 Den multiple regressionsmodel 5. marts 2007 regressionsmodel 1 Dagens program Emnet for denne forelæsning er stadig den multiple regressionsmodel (Wooldridge kap. 3.4-3.5, E.2) Variansen
Læs mereProgram. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18
Program 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Fordeling af X Stikprøve X 1,X 2,...,X n stokastisk X stokastisk. Ex (normalfordelt stikprøve)
Læs mereTema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.
Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller
Læs mereSandsynlighed og Statistik
36 Sandsynlighed og Statistik 6.1 Indledning Denne note beskriver de statistiske begreber og formler som man med rimelig sandsynlighed kan komme ud for i eksperimentelle øvelser. Alt er yderst korfattet,
Læs mereOverheads til forelæsninger, mandag 5. uge På E har vi en mængde af mulige sandsynlighedsfordelinger for X, (P θ ) θ Θ.
Statistiske modeller (Definitioner) Statistik og Sandsynlighedsregning 2 IH kapitel 0 og En observation er en vektor af tal x (x,..., x n ) E, der repræsenterer udfaldet af et (eller flere) eksperimenter.
Læs mereStatistik og Sandsynlighedsregning 2
Statistik og Sandsynlighedsregning 2 Normalfordelingens venner og bekendte Helle Sørensen Uge 9, onsdag SaSt2 (Uge 9, onsdag) Normalfordelingens venner 1 / 20 Program Resultaterne fra denne uge skal bruges
Læs mereElementær sandsynlighedsregning
Elementær sandsynlighedsregning Sandsynlighedsbegrebet Et udfaldsrum S er mængden af alle de mulige udfald af et eksperiment. En hændelse A er en delmængde af udfaldsrummet S. Den hændelse, der ikke indeholder
Læs mereØkonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1
Økonometri 1 Inferens i den lineære regressionsmodel 2. oktober 2006 Økonometri 1: F8 1 Dagens program Opsamling om asymptotiske egenskaber: Asymptotisk normalitet Asymptotisk efficiens Test af flere lineære
Læs mereLogistisk Regression. Repetition Fortolkning af odds Test i logistisk regression
Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π
Læs mere1 Hb SS Hb Sβ Hb SC = , (s = )
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.
Læs mereEksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning
1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion
Læs mereLandmålingens fejlteori - Repetition - Fordeling af slutfejl - Lektion 8
Landmålingens fejlteori Repetition - Fordeling af slutfejl Lektion 8 - tvede@math.aau.dk http://www.math.aau.dk/ tvede/teaching/l4 Institut for Matematiske Fag Aalborg Universitet 15. maj 2008 1/13 Fordeling
Læs mereMotivation. Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser
Motivation Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser Rasmus Waagepetersen October 26, 2018 Eksempel: En landmåler får til opgave at måle længden λ fra A til B. Entreprenøren
Læs mereØkonometri: Lektion 2 Multipel Lineær Regression 1/33
Økonometri: Lektion 2 Multipel Lineær Regression 1/33 Simpel Lineær Regression: Model Sidst så vi på simpel lineære regression. Det er en statisisk model på formen y = β 0 +β 1 x +u, hvor fejlledet u,
Læs mereNanostatistik: Lineær regression
Nanostatistik: Lineær regression JLJ Nanostatistik: Lineær regression p. 1/41 Sammenhænge Funktionssammenhæng: y er en funktion af x. Ex: Hvis jeg kender afstanden mellem to galakser så kender jeg også
Læs mere3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve
Læs mereForelæsning 11: Kapitel 11: Regressionsanalyse
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs mereLogistisk Regression. Repetition Fortolkning af odds Test i logistisk regression
Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression: Definitioner For en binær (0/) variabel Y antager vi P(Y)p P(Y0)-p Eksempel: Bil til arbejde vs alder
Læs mereStatistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge
Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2
Læs mereLøsning eksamen d. 15. december 2008
Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Læs merePraktiske ting og sager: Forelæsninger tirsdag og torsdag kl i Kirkesalen, Studiestræde 38 Øvelser
Uge 36 Velkommen tilbage Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl. -2 i Kirkesalen, Studiestræde 38 Øvelser Hold -4 og 6: mandag og onsdag kl. 8-; start 3. september Hold 5: tirsdag
Læs mereProgram. 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12
Program 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12 Ensidet variansanalyse: analyse af grupperede data Nedbrydningsrate for tre typer af opløsningsmidler (opgave 13.8 side 523) Sorption
Læs mereFortolkning. Foldning af sandsynlighedsmål. Foldning af tætheder. Foldning af Γ-fordelinger Eksempel: Hvis X og Y er uafhængige og. Sætning (EH 20.
Foldning af sandsnlighedsmål Lad µ og ν være to sandsnlighedsmål på (R, B). Fortolkning Lad φ : R R være φ(, ) = + for (, ) R. Lad X og Y være to reelle stokastiske variable defineret på (Ω, F, P). Definition
Læs mereDemo af PROC GLIMMIX: Analyse af gentagne observationer
Demo af PROC GLIMMIX: Analyse af gentagne observationer Kristina Birch, seniorkonsulent, PS Banking Agenda Uafhængige vs. afhængige observationer Analyse af uafhængige vs. afhængige observationer Lille
Læs mere1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ
Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen
Læs mereEksamen i Statistik for biokemikere. Blok
Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)
Læs mereAnvendt Statistik Lektion 7. Simpel Lineær Regression
Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot
Læs meremen nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller
Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =
Læs mereElementær sandsynlighedsregning
Elementær sandsynlighedsregning Sandsynlighedsbegrebet Et udfaldsrum S er mængden af alle de mulige udfald af et eksperiment. En hændelse A er en delmængde af udfaldsrummet S. Et sandsynlighedsmål er en
Læs mereHvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm
Kon densintervaller og vurdering af estimaters usikkerhed Claus Thorn Ekstrøm KU Biostatistik ekstrom@sund.ku.dk Marts 18, 2019 Slides @ biostatistics.dk/talks/ 1 Population og stikprøve 2 Stikprøvevariation
Læs meregrupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
Læs mere02402 Vejledende løsninger til Splus-opgaverne fra hele kurset
02402 Vejledende løsninger til Splus-opgaverne fra hele kurset Vejledende løsning SPL3.3.1 Der er tale om en binomialfordeling med n =10ogp=0.6, og den angivne sandsynlighed er P (X =4) som i bogen også
Læs mereØkonometri lektion 5 Multipel Lineær Regression. Inferens Modelkontrol Prædiktion
Økonometri lektion 5 Multipel Lineær Regression Inferens Modelkontrol Prædiktion Multipel Lineær Regression Data: Sæt af oservationer (x i, x i,, x ki, y i, i,,n y i er den afhængige variael x i, x i,,
Læs mereBetingning med en uafhængig variabel
Betingning med en uafhængig variabel Sætning Hvis X er en reel stokastisk variabel med første moment og Y er en stokastisk variabel uafhængig af X, så er E(X Y ) = EX. Bevis: Observer at D σ(y ) har formen
Læs merek normalfordelte observationsrækker (ensidet variansanalyse)
k normalfordelte observationsrækker (ensidet variansanalyse) Lad x ij, i = 1,...,k, j = 1,..., n i, være udfald af stokastiske variable X ij og betragt modellen M 1 : X ij N(µ i, σ 2 ). Estimaterne er
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs mereForelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)
Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske
Læs mereØkonometri: Lektion 6 Emne: Heteroskedasticitet
Økonometri: Lektion 6 Emne: Heteroskedasticitet 1 / 32 Konsekvenser af Heteroskedasticitet Antag her (og i resten) at MLR.1 til MLR.4 er opfyldt. Antag MLR.5 ikke er opfyldt, dvs. vi har heteroskedastiske
Læs mereModule 12: Mere om variansanalyse
Module 12: Mere om variansanalyse 12.1 Parreded observationer.................. 1 12.2 Faktor med 2 niveauer (0-1 variabel)......... 3 12.3 Tosidig variansanalyse med tilfældig virkning..... 9 12.3.1 Uafhængighedsbetragtninger..........
Læs mereOversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse
Læs mereKvantitative Metoder 1 - Forår Dagens program
Dagens program Kontinuerte fordelinger Simultane fordelinger Kovarians og korrelation Uafhængighed Betingede fordelinger - Middelværdi og varians - Sammenhæng med uafhængighed 1 Figur 1: En tæthedsfunktion
Læs mereProgram: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19
Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større
Læs mereModul 11: Simpel lineær regression
Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 11: Simpel lineær regression 11.1 Regression uden gentagelser............................. 1 11.1.1 Oversigt....................................
Læs mereSide 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402
Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)
Læs mereStatistiske principper
Statistiske principper 1) Likelihood princippet - Maximum likelihood estimater - Likelihood ratio tests - Deviance 2) Modelbegrebet - Modelkontrol 3) Sufficient datareduktion 4) Likelihood inferens i praksis
Læs mereStatistik og Sandsynlighedsregning 2
Statistik og Sandsynlighedsregning 2 Lineære transformationer, middelværdi og varians Helle Sørensen Uge 8, onsdag SaSt2 (Uge 8, onsdag) Lineære transf. og middelværdi 1 / 15 Program I formiddag: Fordeling
Læs mereØkonometri Lektion 1 Simpel Lineær Regression 1/31
Økonometri Lektion 1 Simpel Lineær Regression 1/31 Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Statistisk model: Vi antager at sammenhængen
Læs mereKapitel 11 Lineær regression
Kapitel 11 Lineær regression Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 1 Indledning Vi modellerer en afhængig variabel (responset) på baggrund af en uafhængig variabel (stimulus),
Læs mereTænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.
Repetition af vektor-regning Økonometri: Lektion 3 Matrix-formulering Fordelingsantagelse Hypotesetest Antag vi har to n-dimensionelle (søjle)vektorer a 1 b 1 a 2 a =. og b = b 2. a n b n Tænk på a og
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs merehvor a og b er konstanter. Ved middelværdidannelse fås videre
Uge 3 Teoretisk Statistik. marts 004. Korrelation og uafhængighed, repetition. Eksempel fra sidste gang (uge ) 3. Middelværdivektor, kovarians- og korrelationsmatrix 4. Summer af stokastiske variable 5.Den
Læs mereKapitel 12 Variansanalyse
Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan
Læs mereMultipel Lineær Regression
Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer
Læs mereKvantitative Metoder 1 - Forår 2007
Dagens program Kapitel 8.7, 8.8 og 8.10 Momenter af gennemsnit og andele kap. 8.7 Eksempel med simulationer Den centrale grænseværdisætning (Central Limit Theorem) kap. 8.8 Simulationer Normalfordelte
Læs mereStatistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge
Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange
Læs mereUge 10 Teoretisk Statistik 1. marts 2004
1 Uge 10 Teoretisk Statistik 1. marts 004 1. u-fordelingen. Normalfordelingen 3. Middelværdi og varians 4. Mere normalfordelingsteori 5. Grafisk kontrol af normalfordelingsantagelse 6. Eksempler 7. Oversigt
Læs meren r x rs x r = 1 n r s=1 (x rs x r ) 2, s=1
(a) Denne opgave bygger på resultaterne fra 2 forsøg med epo-behandling af for tidligt fødte børn, idet gruppe 1 og 3 stammer fra første forsøg, mens gruppe 2 og 4 stammer fra det andet. Det må antages,
Læs mereKapitel 12 Variansanalyse
Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 Indledning 2 Ensidet variansanalyse 3 Blokforsøg 4 Vekselvirkning 1 Indledning 2 Ensidet
Læs mereIkke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test
Ikkeparametriske metoder Repetition Wilcoxon SignedRank Test KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,
Læs mereLineær regression. Simpel regression. Model. ofte bruges følgende notation:
Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til
Læs mereLandmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen
Landmålingens fejlteori Lektion Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet En stokastisk variabel er en variabel,
Læs mereUge 43 I Teoretisk Statistik, 21. oktober Forudsigelser
Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier
Læs mereNaturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1
Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen
Læs mere! Variansen på OLS estimatoren. ! Multikollinaritet. ! Variansen i misspecificerede modeller. ! Estimat af variansen på fejlleddet
Dagens program Økonometri Den multiple regressionsmodel 4. februar 003 regressionsmodel Emnet for denne forelæsning er stadig den multiple regressionsmodel (Wooldridge kap. 3.4-3.5)! Opsamling fra sidst
Læs mereINSTITUT FOR MATEMATISKE FAG c
INSTITUT FOR MATEMATISKE FAG c AALBORG UNIVERSITET FREDRIK BAJERS VEJ 7 G 9220 AALBORG ØST Tlf.: 96 35 89 27 URL: www.math.aau.dk Fax: 98 15 81 29 E-mail: bjh@math.aau.dk Dataanalyse Sandsynlighed og stokastiske
Læs mereLøsning til eksaminen d. 29. maj 2009
DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Læs mereModule 4: Ensidig variansanalyse
Module 4: Ensidig variansanalyse 4.1 Analyse af én stikprøve................. 1 4.1.1 Estimation.................... 3 4.1.2 Modelkontrol................... 4 4.1.3 Hypotesetest................... 6 4.2
Læs mereInstitut for Matematiske Fag Aalborg Universitet Specielt: Var(aX) = a 2 VarX 1/40. Lad X α, X β og X γ være stokastiske variable (vinkelmålinger) med
Repetition: Varians af linear kombination Landmålingens fejlteori Lektion 5 Fejlforplantning - rw@math.aau.dk Antag X 1, X,..., X n er uafhængige stokastiske variable, og Y er en linearkombination af X
Læs mereMultipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression
Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende
Læs mereProgram. Longitudinale data. Vægtudvikling af geder. Individuelle profiler og gennemsnitsprofiler
Program Longitudinale data eller gentagne målinger Helle Sørensen Anvendt Statistik, 4. marts 2009 Intro om data og tegninger: vægtudvikling for 28 afrikanske geder Lidt generelt om longitudinala data
Læs mereNormalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ
Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet
Læs mere