Program. Statistik og Sandsynlighedsregning 2 Normalfordelingens venner og bekendte. χ 2 -fordelingen

Relaterede dokumenter
Statistik og Sandsynlighedsregning 2

Program. Konfidensinterval og hypotesetest en enkelt normalfordelt stikprøve. Eksempel: hjerneceller hos marsvin. Eksempel: hjerneceller hos marsvin

I dag. Binomialfordelingen Sandsynlighedsregning og statistik. Eksempel: cornflakessmagning. Binomialfordelingen

Statistik og Sandsynlighedsregning 2

Kursus Introduktion til Statistik. Oversigt, Inferens for gennemsnit (One-sample setup)

6.7 Capital Asset Pricing Modellen

Statistik og Sandsynlighedsregning 2

Lidt om fordelinger, afledt af normalfordelingen

Program. Statistik og Sandsynlighedsregning 2 Middelværdi og varians. Eksempler fra sidst. Sandsynlighedstæthed og sandsynlighedsmål

Statistik og Sandsynlighedsregning 2

Statistik og Sandsynlighedsregning 2

Program. Statistisk inferens En enkelt stikprøve og lineær regression Stat. modeller, estimation og konfidensintervaller. Fordeling af gennemsnit

Program. Statistik og Sandsynlighedsregning. Eksempler. Sandsynlighedstæthed og sandsynlighedsmål

Statistik og Sandsynlighedsregning 2

Fortolkning. Foldning af sandsynlighedsmål. Foldning af tætheder. Foldning af Γ-fordelinger Eksempel: Hvis X og Y er uafhængige og. Sætning (EH 20.

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)

Momenter som deskriptive størrelser. Hvad vi mangler fra onsdag. Momenter for sandsynlighedsmål

Hvad vi mangler fra onsdag. Vi starter med at gennemgå slides fra onsdag.

Tema. Dagens tema: Indfør centrale statistiske begreber.

Landmålingens fejlteori - Repetition - Kontinuerte stokastiske variable - Lektion 3

Statistik Lektion 8. Test for ens varians

Hypotesetest. Hypotesetest og kritiske værdier Type 1 og Type 2 fejl Styrken af en test Sammenligning af to populationer

Sandsynlighedsregning Oversigt over begreber og fordelinger

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Matematisk modellering og numeriske metoder

Betingning med en uafhængig variabel

Geometrisk nivellement. Landmålingens fejlteori - Lektion 7 - Repetition - Fejlforplantning ved geometrisk nivellement. Modellen.

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Statistisk hypotese. Lad P være en statistisk model på (X, E). (P er altså en familie af sandsynlighedsmål på (X, E).)

Sandsynlighedsteori

Nanostatistik: Konfidensinterval

Binomialfordelingen. X ~ bin(n,p): X = antal "succeser" i n uafhængige forsøg, der alle har samme sandsynlighed p for at ende med succes.

hvor a og b er konstanter. Ved middelværdidannelse fås videre

Elementær sandsynlighedsregning

Uge 10 Teoretisk Statistik 1. marts 2004

Integration m.h.t. mål med tæthed

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions

Kvantitative Metoder 1 - Efterår Dagens program

Kvantitative Metoder 1 - Forår Dagens program

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

Elementær sandsynlighedsregning

Integration m.h.t. mål med tæthed

Områdeestimator. X x. P θ. ν θ. Θ C(x) En områdeestimator er en afbildning C : X P(Θ). . p.1/30

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Kvantitative Metoder 1 - Forår Dagens program

Løsning eksamen d. 15. december 2008

Statistik og Sandsynlighedsregning 2

standard normalfordelingen på R 2.

Sandsynlighedsregning 7. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 7. forelæsning Bo Friis Nielsen

Nanostatistik: Test af hypotese

Sandsynlighedsregning 9. forelæsning Bo Friis Nielsen

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

χ 2 -fordelte variable

Sandsynlighedsregning 7. forelæsning Bo Friis Nielsen

Reeksamen 2014/2015 Mål- og integralteori

Sandsynlighedsregning

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

StatDataN: Test af hypotese

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Kvantitative Metoder 1 - Forår Dagens program

Lineære normale modeller (1) udkast. 1 Flerdimensionale stokastiske variable

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

Den lineære normale model

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

For nemheds skyld: m = 2, dvs. interesseret i fordeling af X 1 og X 2. Nemt at generalisere til vilkårligt m.

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Landmålingens fejlteori - Repetition - Fordeling af slutfejl - Lektion 8

Eksamen 2014/2015 Mål- og integralteori

Fag: Fysik - Matematik - IT Elever: Andreas Bergström, Mads Paludan, Jakob Poulsgærd & Mathias Elmhauge Petersen. Det skrå kast

Den lineære normale model

Nanostatistik: Lineær regression

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens

Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl

INSTITUT FOR MATEMATISKE FAG c

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

Estimation og test i normalfordelingen

Differentialregning i R k

Antag at. 1) f : R k R m er differentiabel i x, 2) g : R m R p er differentiabel i y = f(x), . p.1/18

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Hjemmeopgave 1 Makroøkonomi, 1. årsprøve, foråret 2005 Vejledende besvarelse

Betingede sandsynligheder Aase D. Madsen

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

Termodynamik - Statistisk fysik - Termodynamiske relationer - Fri energi - Entropi

Note om Monte Carlo metoden

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data

EKSAMEN Flerdimensional Analyse Sommer sider

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Produkt og marked - matematiske og statistiske metoder

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

Transkript:

Program Statitik og Sandynlighedregning 2 Normalfordelingen venner og bekendte Helle Sørenen Uge 9, ondag Reultaterne fra denne uge kal bruge om arbejdhete i projekt 1. I formiddag: χ 2 -fordelingen, t-fordelingen, F -fordelingen (vennerne) Γ-fordelingen og tæthed for χ 2 -fordelingen Måke lidt om den centrale græneværdiætning I eftermiddag Lidt mere om R med Suanne SaSt2 (Uge 9, ondag) Normalfordelingen venner 1 / 20 SaSt2 (Uge 9, ondag) Normalfordelingen venner 2 / 20 χ 2 -fordelingen χ 2 -fordelingen For k = 1 kan vi finde tætheden om tætheden via fordelingfunktionen: Definition 8.1.1 Hvi U 1,...,U k er iid. N(0,1)-fordelte å kalde fordelingen af X = U 2 1 + + U2 k for χ2 -fordelingen med k frihedgrader. Vi kriver ommetider: X χ 2 k eller X χ 2 (k) χ 2 (k)-fordelingen har middelværdi for alle k: Hvorfor? Hvad er middelværdien? p(x) = x 1/2 e x/2 2π, x > 0 Sætning 8.1.2 Tætheden for χ 2 -fordelingen med k frihedgrader er hvor p(x) = x k/2 1 e x/2 c k 2 k/2, x > 0 π, k = 1 c k = (k/2 1)!, k = 2,4,6... (k/2 1)(k/2 2) 1/2 π, k = 3,5,7... Det vier vi lidt enere... SaSt2 (Uge 9, ondag) Normalfordelingen venner 3 / 20 SaSt2 (Uge 9, ondag) Normalfordelingen venner 4 / 20

Tæthed for χ 2 -fordelingen Tæthed for χ 2 -fordelingen med hhv. 1, 3, 5, 8 frihedgrader. 0.0 0.1 0.2 0.3 0.4 0.5 0 2 4 6 8 10 t-fordelingen Definition Hvi U og Z er uafhængige, U N(0,1) og Z χ 2 (f ), å kalde fordelingen af T = U Z/f for t-fordelingen med f frihedgrader. Vi kriver T t f eller T t(f ). Tætheden kan finde vha. ætning 6.3.4: p(t) = kont ( 1 + t2 f 1 ) (f +1)/2, t R Normeringkontanten er grim og involverer Γ-funktionen tår på. 227. Sætning 6.3.4 (X,Y ) kontinuert med tæthed p og X koncentreret på mængde M. Givet funktion f : R R med f > 0 på M. Så er Z = Y /f (X ) kontinuert og har tæthed q(z) = p(x,f (x)z)f (x)dx, z R SaSt2 (Uge 9, ondag) Normalfordelingen venner 5 / 20 SaSt2 (Uge 9, ondag) Normalfordelingen venner 6 / 20 Tæthed for t-fordelingen Tæthed for t-ford. med hhv. 1, 3, 8 frihedgrader, amt tæthed for N(0,1). t-fordelingen 0.0 0.1 0.2 0.3 0.4 4 2 0 2 4 Bemærk: Tætheden er ymmetrik om nul: p( t) = p(t) Tungere haler end normalfordelingen T har middelværdi hvi og kun hvi f > 1. Hvad er å ET? T har varian hvi og kun hvi f > 2. t(f )-fordelingen ligner N(0, 1) når f er tor T -tettørreler optræder ved åkaldt imple hypoteer, fx. tet for en pecifik middelværdi for en enkelt tikprøve eller ammenligning af to grupper. SaSt2 (Uge 9, ondag) Normalfordelingen venner 7 / 20 SaSt2 (Uge 9, ondag) Normalfordelingen venner 8 / 20

F -fordelingen Definition Hvi Z 1 og Z 2 er uafhængige, og Z 1 χ 2 (f 1 ), Z 2 χ 2 (f 2 ) å kalde fordelingen af X = Z 1/f 1 Z 2 /f 2 for F -fordelingen med (f 1,f 2 ) frihedgrader. Tætheden finde vha. ætning 6.3.4: Huk T = p(x) = kont U. Hvad er fordelingen af T 2? Z/f x f 1/2 1 (f 2 + f 1 x) (f 1+f 2 )/2, x > 0 Bruge ved tet for en varianer (SaSt2) og iær ved tet af åkaldt ammenatte hyoteer, fx. ved ammenligning af tre eller flere grupper. Tæthed for F -fordelingen Tæthed for F -fordelingen med hhv. (6,10), (6,4), (6,2), (2,2) frihedgrader. 0.0 0.2 0.4 0.6 0.8 1.0 0 1 2 3 4 5 SaSt2 (Uge 9, ondag) Normalfordelingen venner 9 / 20 SaSt2 (Uge 9, ondag) Normalfordelingen venner 10 / 20 Fordeling af ( X,SSD) og T Ekempel 1: hormonkoncentration ho køer Sætning 8.3.3 X 1,...,X n iid. N(µ,σ 2 )-fordelte. Definer X = 1 n (X 1 + + x n ), SSD = T = å er X og SSD uafhængige X N(µ,σ 2 /n) n( X µ) SSD/(n 1) = SSD σ 2 χ 2 (n 1), dv. SSD/σ 2 χ 2 (n 1) T t(n 1) hvorfor? n i=1 (X i X ) 2 n( X µ) Specielt: E(SSD) = σ 2 (n 1) å E( 2 ) = E ( SSD/(n 1) ) = σ 2. Cow 1 2 3 4 5 6 7 8 9 Initial (µg/ml) 207 196 217 210 202 201 214 223 190 Final (µg/ml) 216 199 256 234 203 214 225 255 182 Diff. (µg/ml) 9 3 39 24 1 13 11 32-8 Antag: D 1,...,D 9 iid. N(µ,σ 2 ). Etimater: ˆµ = d = 13.78, ˆσ = = 15.25 Hvi vi vil underøge om µ er nul, virker det rimeligt at vurdere om d ligger tæt på 0 eller langt fra nul. Forkellen kal normere: 9( d 0) t = = 2.71 Hvi µ faktik er 0, hvor andynligt er det å at obervere en værdi af T der er mindt lige å langt fra nul om de 2.71? Beregn i t(8)-fordelingen! SaSt2 (Uge 9, ondag) Normalfordelingen venner 11 / 20 SaSt2 (Uge 9, ondag) Normalfordelingen venner 12 / 20

Ekempel 2: Antallet af punkter i en en punktky Skål Det ande antal punkter er 161. Peron 1 2 3 4 5 6 7 Average gue 146 182 152.5 165 139.5 132 155 Antag: Y 1,...,Y 7 iid. N(µ,σ 2 ). Etimater: ȳ = 153.14, ˆσ = = 16.64 Hvi vi vil underøge om µ er 161, virker det rimeligt at vurdere om ȳ ligger tæt på eller langt fra 161. Forkellen kal normere: 7(ȳ 161) t = = 1.24. Hvi µ faktik er 161, hvor andynligt er det å at obervere en værdi af T der er mindt lige å langt fra 0 om de 1.24? Beregn i t(6)-fordelingen! Øl Goet = Student SaSt2 (Uge 9, ondag) Normalfordelingen venner 13 / 20 SaSt2 (Uge 9, ondag) Normalfordelingen venner 14 / 20 Γ-fordelingen Parametre α > 0 og β > 0 givet. Betragt funktionen p(x) = xα 1 e x/β β α kont, x > 0 Specialtilfældet α = 1: hvilken fordeling er der tale om? Er f overhovedet integrabel? Hvordan kal kontanten definere for at p er en tæthed? Fordelingen på (0, ) der har tætheden p kalde Γ-fordelingen med formparameter α og kalaparameter β. Skalaparameter β: hvi X er Γ-fordelt med formpar. α og kalapar. 1, å er βx Γ-fordelt med formpar. α og kalapar. β. Opgave 8.1 i næte uge. χ 2 (1)-fordelingen er et pecialtilfælde: α = 1/2, β = 2. Tæthed for F -fordelingen Tæthed for F -fordelingen med (α, β) lig (0.5,6), (1,3), (3,1), (12,0.25). 0.0 0.2 0.4 0.6 0.8 1.0 0 2 4 6 8 10 SaSt2 (Uge 9, ondag) Normalfordelingen venner 15 / 20 SaSt2 (Uge 9, ondag) Normalfordelingen venner 16 / 20

Γ-funktionen Foldning af Γ-fordelinger Altå: Afhænger kun af α (ikke af β)! Så er tætheden Γ evalueret i heltal og halvtal : Regn på Γ(α + 1). Hvad er Γ(1)? kont = y α 1 e y dy =: Γ(α) 0 p(x) = xα 1 e x/β β α Γ(α), x > 0 Hvad er altå Γ(n) for n heltallig (og poitiv)? Hvad er Γ(1/2)? Hvad er Γ(k/2) for k ulige? Sætning 8.1.3 X 1,...,X n uafhængige og Γ-fordelte med formparametre α 1,...,α n og amme kalaparameter β. Så er Z = X 1 + + X n Γ-fordelt med formparameter α 1 + + α n og kalaparameter β. Bevie ved induktion efter n. For n = 2: Brug korrollar 6.3.2: Indæt Γ-tæthederne og regn... q(z) = p 1 (x)p 2 (z x)dx Genkend afhængigheden af z fra den ønkede Γ-tæthed. Normeringkontanten paer automatik. SaSt2 (Uge 9, ondag) Normalfordelingen venner 17 / 20 SaSt2 (Uge 9, ondag) Normalfordelingen venner 18 / 20 Tæthed for χ 2 -fordelingen Reume Sætning 8.1.2 Tætheden for χ 2 -fordelingen med k frihedgrader er hvor Bevi: p(x) = x k/2 1 e x/2 c k 2 k/2, x > 0 π, k = 1 c k = (k/2 1)!, k = 2,4,6... (k/2 1)(k/2 2) 1/2 π, k = 3,5,7... χ 2 (k)-fordelingen er foldningen af k χ 2 (1)-fordelinger. Dv. foldningen af k Γ-fordelinger med formparameter 1/2 og kala 2. χ 2 (k) er altå Γ-fordelingen med formparameter k/2 og kala 2. Indæt i Γ-tætheden. Reume fra andynlighedregning: Tætheder og fordelingfunktioner og dere ammenhæng Middelværdier og varianer Tranformationer Normalfordelingen og den venner Både endimenionalt og flerdimenionalt SaSt2 (Uge 9, ondag) Normalfordelingen venner 19 / 20 SaSt2 (Uge 9, ondag) Normalfordelingen venner 20 / 20