Statistik for biologer 005-6, modul 5: Sadsylighedsfordeliger for kotiuerte data på iterval/ratioskala M6, slide Gægse matematiske sadsylighedsfordeliger: Diskrete data: De positive biomialfordelig Poisso-fordelige De egative biomialfordelig p() 30% 5% 0% 5% 0% 5% 0% 0 3 4 5 6 7 8 9 0 Kotiuerte data: Normalfordelige/z-fordelige t-fordeligere χ -fordeligere, F-fordeligere M6, slide
Normalfordelige P(X) Kotiuert sadsylighedsfordelig Opstår år mage forskellige faktorer uafhægigt af hiade bidrager med additiv variatio til. M6, slide 3 (ormalfordelige) Normalfordelige opstår år mage forskellige faktorer uafhægigt af hiade bidrager med additiv variatio til. F.eks. Højde af rekrutter på sessio: Ifluerede faktorer: Geer Miljø uder opvækst: Eergi Proteier vitamier Sygdomme Stress P(X) M6, slide 4 (ormalfordelige)
Normalfordelige opstår år mage forskellige faktorer uafhægigt af hiade bidrager med additiv variatio til. F.eks. Kropsvægte af duehøge-huer: Ifluerede faktorer: Geer Miljø: Eergi Proteier vitamier Sygdomme Stress I realitete er biologiske fordeliger ku tilærmelsesvist ormalfordelte, da ogle faktorer er vigtigere ed adre. M6, slide 5 (ormalfordelige) Normalfordelige opstår år mage forskellige faktorer uafhægigt af hiade bidrager med additiv variatio til. - Derfor tilærmes biomialfordelige og Poisso-fordelige sig også ormalfordelige, år σ >9. 0. 0.5 P() 0. 0.05 0 0 3 6 9 5 8 M6, slide 6 (ormalfordelige)
Normalfordeliges parametre: P( ) e σ π µ σ P(X) Ehver ormalfordelig ka beskrives ud fra parametree µ og σ µ: Fordeliges middelværdi σ: Fordeliges stadardafvigelse M6, slide 7 (ormalfordelige) P(). Kummuleret P(z). -4-3 - - 0 3 4 z ( - µ)/σ 00% 90% 80% 70% 60% 50% 40% 30% 0% 0% 0% -3 - - 0 3 Gælder altid for ormalfordeliger: 68.6% af arealet ligger i itervallet µ±σ 95.44% af arealet ligger i itervallet µ±σ 99.74% af arealet ligger i itervallet µ±3σ 95.00% af arealet ligger i itervallet µ±.96σ M6, slide 8 (ormalfordelige) z (-µ)/σ
P(z). De stadardiserede ormalfordelig, z -fordelige -4-3 - - 0 3 4 z ( - µ)/σ P( ) e σ π µ σ Da sadsylighedsfuktioe af e ehver ormalfordelig er de samme for ( - µ)/σ, re-skaleres ormalfordelte data til dee størrelse, z. z z M6, slide 9 (z-fordelige) Tabel af de kumulerede værdier af de stadardiserede ormalfordelig, z -fordelige z Σ P(z) -3,0 0,003 -,5 0,006 -,0 0,08 -,9 0,088 -,8 0,0360 -,7 0,0447 -,6 0,0549 -,5 0,0669 -,4 0,0809 -,3 0,0970 -, 0,5 -, 0,358 -,0 0,588-0,9 0,84-0,8 0,0-0,7 0,4-0,6 0,744-0,5 0,3087-0,4 0,3447-0,3 0,38-0, 0,408-0, 0,460 0,0 0,5000 M6, slide 0 (z-fordelige) z Σ P(z) 0, 0,5398 0, 0,579 0,3 0,678 0,4 0,6553 0,5 0,693 0,6 0,756 0,7 0,7578 0,8 0,7879 0,9 0,857 0,84, 0,864, 0,8847,3 0,9030,4 0,990,5 0,9330,6 0,9450,7 0,9553,8 0,9639,9 0,97 0,977,5 0,9937 3 0,9986 Kummuleret P(z). 00% 90% 80% 70% 60% 50% 40% 30% 0% 0% 0% -3 - - 0 3 z (-µ)/σ P(). -4-3 - - 0 3 4 z ( - µ)/σ
Fra ΣP(z) ka ma estimere sadsylighede for at et stokastisk udfald afviger fra e ormalfordelig med e kedt middelværdi og stadardafvigelse: -tailed: hvad er sadsylighede for at et udfald vil atage e værdi afvigede fra µ i é bestemt retig? Kummuleret P(z). 00% 90% 80% 70% 60% 50% 40% 30% 0% 0% 0% -4-3 - - 0 3 4 z (-µ)/σ -tailed : Hvad er sadsylighede for at et udfald vil atage e værdi afvigede fra µ i de ee eller ade retig? P(). -4-3 - - 0 3 4 z ( - µ)/σ M6, slide (z-fordelige) Eksempel: z µ σ Lægde af -årige sild følger e ormalfordelig med parametree: µ.5 cm, σ.3 cm Hvor sadsyligt vil det være at é - årig sild vil være midst 5. cm lag? z (5..5)/.3.0 M6, slide (z-fordelige)
Z (5..5)/.3.0 Kummuleret P(z). 00% 90% 80% 70% 60% 50% 40% 30% 0% 0% 0% -3 - - 0 3 z z Σ P()......,8 0,964,9 0,97 0,977, 0,98, 0,986,3 0,989,4 0,99...... µ σ z (-µ)/σ P(z.0) 0.977 0.03 M6, slide 3 (z-fordelige) Z (5..5)/.3.0 Kummuleret P(z). 00% 90% 80% 70% 60% 50% 40% 30% 0% 0% 0% -3 - - 0 3 z (-µ)/σ 0.04 0.03 P(). 0.0 0.0 P(z.0) 0.977 0.03 -der er.3% chace for at e -årig sild vil være 5. cm lag eller lægere M6, slide 4 (z-fordelige) 0 z -4-3 - - 0 3 4 z ( - µ)/σ µ σ
Z (5..5)/.3.0 Kummuleret P(z). 00% 90% 80% 70% 60% 50% 40% 30% 0% 0% 0% -3 - - 0 3 z (-µ)/σ 0.04 0.03 P(). 0.0 0.0 P(z.0 z -.0 ) ( 0.977) 0.046 - der er 4.6% chace for at e -årig sild afviger.6 cm eller mere fra populatioes M6, slide 5 (z-fordelige) middelværd (two-tailed) 0 z µ σ -4-3 - - 0 3 4 z ( - µ)/σ Sikkerhedsiterval for ekeltobservatioer af ormalfordelte data: Nu isolerer vi i ligige: µ ± zα µ ± zα σ σ µ zα σ < < µ + zα σ P ( z σ < < µ + z σ ) α µ α α α sigifikasiveauet α agiver sadsylighede for at (værdie af e y observatio) afviger fra populatioes middelværdi med mere ed z gage populatioes stadardafvigelse M6, slide 6 (z-fordelige)
Sikkerhedsiterval for ekeltobservatioer af ormalfordelte data: P( z σ < < µ + z σ ) α µ α α Sikkerhedsitervallet omkrig µ agiver det iterval, hvori værdie af de stokastiske variabel ka forvetes at befide sig med e give sadsylighed: 0.045 0.04 0.035 0.03 0.05 P(). 0.0 0.05 0.0 0.005 0-4 -3 - - 0 3 4 z ( - µ)/σ 95% sikkerhedsitervallet agiver det iterval, som ideholder 95% af alle ekelt-observatioer. 95% sikkerhedsitervallet agiver det iterval, som e y observatio med 95% sikkerhed vil befide sig ide for. M6, slide 7 (z-fordelige) Eksempel : µ.5cm, σ.3cm Hvilke maksimum- og miimumværdier for kropslægde vil 95% og 99% af populatioe befider sig ide for? P( z.960) 95%; P(lzl.576) 99% 0.04 0.0 0 95%-græser: ±z (.5cm)/.3 cm ±.960.5 ±.96.3 cm.5 ±.55 cm {9.95 cm; 5.05 cm} 95% af observatioere vil være lægere ed 9.95 cm, me kortere ed 5.05 cm 99%-græser: ±z (.5)/.3 ±.576.5 ±.59.3 cm.5 ± 3.35 cm {9.5 cm; 5.85 cm} 99% af observatioere vil være lægere ed 9.5 cm, me kortere ed 5.85 cm M6, slide 8 (z-fordelige) P(). -4-3 - - 0 3 4 z ( - µ)/σ µ ± z σ c µ ± zσ
Hvorda ka vi vide om e fordelig er ormalfordelt? Se på data: Ser fordelige ogelude ormalfordelt ud? Ligger ca. 70% af observatioere ide for ±s? Div. grafiske metoder (qq-plot, f-papir) Goodess-of-fit test: Uavedelig ved små stikprøvestørrelser straffer meget store stikprøvestørrelser. M6, slide 9 Vi skal om lidt se at det sjældet er så vigtigt at e fordelig af observatioer er ormalfordelt, blot geemsittet er ormalfordelt mere herom seere.. t-fordelige Hvis vores middelværdi og stadardafvigelse er estimeret fra e stikprøve, erstattes z-fordelige med t-fordelige: z µ σ t ν µ s t z for (i praksis for > 00) M6, slide 0 (t-fordelige)
t-fordeligere er fladere ed z-fordelige. M6, slide (t-fordelige) t-fordelige Der eksisterer e t-fordelig for hver værdi af ν. (ν df. {,,3... }) z-fordelige er et særtilfælde af t- fordelige, hvor ν I praksis er der miimal forskel på de to fordeliger år ν > 00. Sigifikasiveauer af t ν er tabellagt i Appedi i F, C& J M6, slide (t-fordelige)
Sikkerhedsgræser omkrig e middelværdi M6, slide 3 (sikkerhedsgræser omkrig e middelværdi) Et geemsit af e stikprøve er også e stokastisk variabel Udfaldsrummet vil være det samme som for populatioe som helhed Me hvad med spredige på geemsittet (usikkerhede på estimatet af µ)? M6, slide 4 (sikkerhedsgræser omkrig e middelværdi)
Eksempel: Kropsvægte af 37 duehøgehuer dræbt i kollisioer: Fordelig af ekeltobservatioer: M6, slide 5 (sikkerhedsgræser omkrig e middelværdi) Eksempel: Kropsvægt af 37 duehøgehuer dræbt i kolisioer: Fordelig af 00 geemsitsværdier, baseret på hver 5 ekeltobservatioer: M6, slide 6 (sikkerhedsgræser omkrig e middelværdi)
Geemsittee er ormalfordelte! Fordelig af ekeltobservatioer: Fordelig af 00 geemsit, hver baseret på 5 ekeltobservatioer: M6, slide 7 (sikkerhedsgræser omkrig e middelværdi) Eksempel: 00 tilfældige tal 0-00: Fordelig af ekeltobservatioer: M6, slide 8 (sikkerhedsgræser omkrig e middelværdi)
Eksempel: tilfældige tal 0-00: Fordelig af geemsitsværdier (5) M6, slide 9 (sikkerhedsgræser omkrig e middelværdi) Eksempel: tilfældige tal 0-00: Fordelig af geemsitsværdier (0) M6, slide 30 (sikkerhedsgræser omkrig e middelværdi)
Eksempel: tilfældige tal 0-00: Fordelig af geemsitsværdier (30) M6, slide 3 (sikkerhedsgræser omkrig e middelværdi) Eksempel: tilfældige tal 0-00: Fordelig af geemsitsværdier (30) M6, slide 3 (sikkerhedsgræser omkrig e middelværdi) Udsit af -akse forstørret
De cetrale græseværdisætig! Geemsittee af et stort atal stikprøver vil være ormalfordelt med de samme µ som de opridelige populatio. Dette gælder uaset hvilke type fordelig ekeltobservatioere følger! M6, slide 33 (sikkerhedsgræser omkrig e middelværdi) Spredige på et geemsit: s ( ) s ( ) s( ) s ( ) s( ) s () variase af ekeltobservatioer s ( ) variase af geemsittee atal observatioer, som idgår i beregig af M6, slide 34 (sikkerhedsgræser omkrig e middelværdi)
Spredige af ekeltobservatioer omkrig middelværdie (µ) stadard deviatio of the observatios,stadard deviatio s( ) SD( ) SD s ( ) Spredige af geemsittee omkrig middelværdie (µ) Stadard deviatio of the meas, stadard error of the mea s( ) s ( ) SD( ) SE( ) SE SD M6, slide 35 (sikkerhedsgræser omkrig e middelværdi) Spredige på geemsittet bliver midre, år atallet af observatioer øger! Duehøges vægt Tal 0-00 s( ) s( ) 086 93 5 9 s( ) s( ) 5 089 3 5 4 0 085 89 5 9 0 089 6 5 6 30 088 48 50 5 086 0 50 0 M6, slide 36 (sikkerhedsgræser omkrig e middelværdi)
Kovetioelle forkortelser SD ( stadard deviatio ) stadardafvigelse af ekeltobservatioer SE ( stadard error ) stadardafvigelse af et parameterestimat (her: geemsittet) M6, slide 37 (sikkerhedsgræser omkrig e middelværdi) Sikkerhedsgræser for de sade middelværdi: Spredig af ekeltobservatioer: µ tν s Spredig af geemsitsværdiere: t ν µ s µ SE() M6, slide 38 (sikkerhedsgræser omkrig e middelværdi)
P Sikkerhedsgræser for de sade middelværdi: t ν µ s µ SE() ( µ P tν, α < < tν α ) α SE( ), ( ν, α µ ν, α t SE( ) < < + t SE( )) α M6, slide 39 (sikkerhedsgræser omkrig e middelværdi) Eksempel: Kropsvægte af 37 duehøge-huer. 087g SD 93g 37 Hvad er 95%-sikkerhedsitervallet omkrig de sade middelværdi (µ) af duehøge-huers vægt? M6, slide 40 (sikkerhedsgræser omkrig e middelværdi)
087g, SD 93g, 37 95%-sikkerhedsitervallet omkrig de sade middelværdi (µ): P ( ν, α µ ν, α t SE( ) < < + t SE( )) α SE( ) SD/() ½ 93/(37) ½ 5.0g t (37-), α0.05 z α0.05.960 P(087-.96 5.0 g< µ< 087+.96 5.0 g) 0.95 De sade middelværdi for kropsvægte af duehøgehuer P(038 ligger g< med µ<36 95% sadsylighed g) 0.95 mellem 038 og 36 g! M6, slide 4 (sikkerhedsgræser omkrig e middelværdi) P 087g, SD 93g, 37, SE( ) 5.0g 99% og 99.9%-sikkerhedsitervallet omkrig de sade middelværdi (µ)? ( ν, α µ ν, α t SE( ) < < + t SE( )) α t (37-), α 0.0 z α0.0.576 t (37-), α 0.00 z α0.00 3.9 M6, slide 4 (sikkerhedsgræser omkrig e middelværdi) P(087-.576 5.0< µ< 087+.576 5.0) 0.99 P(03<µ<5) 0.99
Sikkerhedsgræser omkrig de sade middelværdi for vægte af duehøge-huer: -α α P(038 g< µ<36 g) 0.95 0.05 P(03 g <µ<5g ) 0.99 0.0 P(005 g<µ<69 g) 0.999 0.00 P(990 g<µ<84 g) 0.9999 0.000 M6, slide 43 (sikkerhedsgræser omkrig e middelværdi) Hvorda får vi sikkerhedsgræsere om µ så smalle som muligt? P ( t SE( ) < µ < + t SE( ) ) ν, α P t ν, α ν, α s < µ < + t ν, α Sæke kofidesiveauet (-α) Midske spredige på ekeltobservatioere (s, SD) Øge stikprøvestørrelse () α s α M6, slide 44 (sikkerhedsgræser omkrig e middelværdi)
Sikkerhedsgræser for e differece mellem to middelværdier: M6, slide 45 (sikkerhedsgræser for e differece mellem to middelværdier) Sikkerhedsgræser for e differece mellem to middelværdier: Eksempel: Skiebeslægde målt i to græshoppe-populatioer: 7.43 mm, s 0.055, 7.64 mm, s 0.005, 8 Hvor meget afviger de to populatioers middelværdi: Ka de betragtes som forskellige? Differece: - 7.64-7.43 mm 0. mm Hvad er usikkerhede på dette estimat? M6, slide 46 (sikkerhedsgræser for e differece mellem to middelværdier)
Hvis σ σ σ, er sikkerhedsgræsere omkrig de sade differece givet ved: -Hvor: α µ µ α ν α ν + < < ]) [ ] [ ] [ ] ([,, SE t SE t P + + + ) ( ) ( ).(. s s E S Sikkerhedsgræser for e differece mellem to middelværdier: M6, slide 47 (sikkerhedsgræser for e differece mellem to middelværdier) S.E. for differece ml. middelværdier: ).(. s s E S + + ) ( ) ( hvor : + + s s s + + + ) ( ) ( ).(. s s E S M6, slide 48 (sikkerhedsgræser for e differece mellem to middelværdier)
Græshopper: 95% sikkerhedsgræser omkrig forskel i middelværdi µ µ : 7.43 mm, s 0.055, 7.64 mm, s 0.005, 8 ( - 0.) S. E.( ) ( ) s + ( ) s + + S.E. ) 0.05 + 7 0.005 + 8 + 8 8 ( 0.0544 P([ ] tν, α SE[ ] < µ µ < [ ] + tν, α SE[ ]) α df. +8-8, t 8, α0.05.048 P(0.-0.048 0.0544< µ -µ < 0.+0.048 0.0544)0.95 P(0.0mm< µ -µ < 0.35) 0.95 M6, slide 49 (sikkerhedsgræser for e differece mellem to middelværdier) Test for variashomogeitet F-test Det er e forudsætig for pålidelig beregig af forskel i µ, at de forskellige stikprøver har es varias H 0 : De to stikprøver har es varias (σ σ σ ). H : De to stikprøver har forskellig varias (σ σ ). F ν ν S S ma mi ν atal frihedsgrader for S ma og ν atal frihedsgrader for S mi. (Appedi 8 i F,C & J 998) (NB! Der er flere forskellige slags F-tests. Mere herom seere. M6, slide 50 (sikkerhedsgræser for e differece mellem to middelværdier)
Græshopper: Tjek for variashomogeitet 7.43 mm, s 0.055, 7.64 mm, s 0.005, 8 H 0 : De to stikprøver har es varias (σ σ σ ). H : De to stikprøver har forskellig varias (σ σ ). F ν ν S S ma mi F, 7 0.055/0.005.44 Appedi 8: p > 0.05 (kritisk værdi.87) H 0 : accepteres: σ og σ ka betragtes som es: Vi ka stole på de beregede sikkerhedsgræser omkrig differece i middelværdier M6, slide 5 (sikkerhedsgræser for e differece mellem to middelværdier) Sikkerhedsgræser omkrig e hyppighed M6, slide 5 (sikkerhedsgræser for e hyppighed)
Sikkerhedsgræser omkrig e hyppighed Stadard error for usikkerhed omkrig estimatet af e hyppighed: S. E.( pˆ) pˆ qˆ pˆ ( pˆ) -hvor ^p, er et estimat af de sade hyppighed, p. Sikkerhedsgræser omkrig e hyppighed: P pˆ t SE[ pˆ] < p < pˆ + t SE[ ˆ]) α ( ν, α ν, α p -hvor ν df. - (NB! Ku pålidelig hvis s [ ^p ^q] > 9) M6, slide 53 (sikkerhedsgræser for e hyppighed) Eksempel: Byttedyr i 38 maveprøver af Europæisk los (Ly ly): f() P()Hyppighed Rådyr: 57.9% Småvildt: 6 4.% I alt: 38 00% Hvad er 95%-sikkerhedsgræsere omkrig de sade hyppighed af rådyr i diæte? ^p 0.579, k 38 M6, slide 54 (sikkerhedsgræser for e hyppighed)
95%-sikkerhedsgræsere omkrig de sade hyppighed af rådyr i diæte:^p0.579, k38 P pˆ t SE( pˆ) < p < pˆ + t SE( ˆ)) α ( ν, α ν, α p S ^p ^q 38 0.579 0.4 9.3 OK! S.E.(^p) (0.579 0.4/[38-]) ½ 0.08 t 37,0.05.06 P(0.579.06 0.08<p< 0.579+.06 0.08) 0.95 P(0.45<p<0.743)0.95 Koklusio: Rådyr udgør med 95% sikkerhed mellem 4% og 74% af de edlagte byttedyr M6, slide 55 (sikkerhedsgræser for e hyppighed) Rådyr udgør med 95% sikkerhed mellem 4% og 74% af de edlagte byttedyr Diætadel 80% 70% 60% 50% 40% 30% 0% 0% 0% rådyr småvildt Småvildt udgør med 95% sikkerhed mellem 6% (-0.743) og 59% (-0.45) af de edlagte byttedyr. M6, slide 56 (sikkerhedsgræser for e hyppighed)
Tjekliste, Modul 6 (uge 49): * ormalfordelig, µ, σ * z-, t-fordelig * Tjek for ormalfordelig af data * SD, SE * De cetrale græseværdisætig * Sikkerhedsiterval omkrig middelværdi * Sikkerhedsiterval omkrig differece ml. middelværdier *F-fordelig, Variashomogeitets-test * Sikkerhedsiterval omkrig hyppighed (Læs også gere på trasformatio af data) M6, slide 57 (tjekliste)