AARHUS UNIVERSITET Maja Tarp AARHUS UNIVERSITET
HVEM ER JEG? Maja Tarp, 4 år Folkeskole i Ulsted i Nordjyllad Studet år 005 fra Droiglud Gymasium Efter gymasiet: Militæret Australie Startede på matematik på Aarhus Uiversitet i 007 Sommere 00: BSc i matematik Nu: Stud.cad.sciet i statistik
STUDIERNES OPBYGNING Her er jeg
HVORDAN SER EN UGE UD?
JOBMULIGHEDER Private erhvervsliv et hav af muligheder: Hadel Baker Kosulet- og rådgivigsvirksomhed Medicialidustri Sudhed Forskig: Uiversiteter Iteresseorgaisatioer Private virksomheder Udervisig: Gymasier Hadelsskoler Semiarer Ikke Gallup!
Hvorfor statistik? Ka forudsige fremtide Ka bruges som beslutigsgrudlag: Politik Aktiekurser Mediciske forsøg Risikovurderig Spilteori
Statistik og virkelighede I periode 960-970 faldt atallet af fødsler samtidig med at atallet af storkepar i Damark faldt. Drukeulykker og issalg hæger samme: Når der sælges mage is, er der mage der druker! Bør der ivesteres mere i rykecreme? Der er e overdødelighed bladt folk med ryker!
Normalfordelig
Normalfordelig Måske de vigtigste fordelig overhovedet. Har toppukt i si middelværdi, og er symmetrisk fordelt her omkrig. Model for hvorda et stort atal statistiske elemeter fordeler sig omkrig deres middelværdi.
Eksempler Højde, vægt Kvalitetstest Blodtryksædrig IQ
E ormalfordelt observatio Vi vil u betragte e ormalfordelt stokastisk variabel: X ~ N( µ ; σ Hvor µ er middelværdie og σ er stadardafvigelse. Gælder der: X ~N(0; siges X at være stadardormalfordelt.
E ormalfordelt observatio Vi betragter altså X ~ N( µ ; σ x Vi bereger ofte som er det bedste gæt på de sade værdi af. µ Og som er det bedste gæt ma ka komme på de sade værdi af. s σ
Normalfordelige, grafisk De ormerede ormalfordelig, dvs. X ~N(0; Grafe viser tæthedsfuktioe. Areal
Normalfordelige, grafisk E tilsvarede graf ka laves for ehver ormalfordelig X Samme form som før, blot ade placerig. Arealet stadig. ~ N( µ ; σ
Fordeligsfuktioe Lad X være e stadardormalfordelt stokastisk variabel. Fordeligsfuktioe Φ(x agiver sadsylighede for, at X er midre ed et tal x, dvs Φ(x Sadsylighed for X x Dvs. at Φ(x er e voksede fuktio, med værdier mellem 0 og.
Eksempler: Fordeligsfuktioe Vi betragter X ~N(30;4 altså hvor middelværdie er 30 og spredige 4. Bestem fordeligsfuktie. Dvs. fid sadsylighede for at x To metoder: Atag x33. Bestem sadsylighede som arealet uder grafe for tæthedsfuktioe fra - til 33. Bestem fordeligsfuktioes værdi i 33.
Eksempel: Fluer og gift 6 fluer udsættes for ervegift, der måles hvor lag tid der går, før fluere besvimer.
6 5 4 3 0 9 8 7 6 5 4 3 Flue ummer i.86 4.9 40.3 4. 58.0 3.8 46 0.78 3.8 43 0.58 3.5 34 0.40 3. 4 0.4 3. 4 0.08 3.0 0-0.08.5-0.4.3 0-0.40. 9-0.58. 9-0.78.9 7 -.0.6 5 -.3.6 5 -.86. 3 Φ^(- ((i-0.5/6 L(tid Tid
N(0,-fraktil - - 0 0 0 40 60 80 00 0 40 tid Hvis vores måliger er ormalfordelte forveter vi at kue idtege dem som e ret lije i fraktilplottet. Dette er ikke tilfældet, me måligere ser ud til at de kue være logaritme fordelt. Derfor tages logaritme til tide og vi idteger ige.
N(0,-fraktil - - 0 3 4 5 Måligere ligger om e pæ ret lije, hvorfor vi ka atage, at logaritme til tide er ormalfordelt. Dvs. vi betragter modelle: X ltid ~ N( µ ; σ
Vi bereger efterfølgede skø for stadardafvigelse og middelværdie vha. formlere: S x USS s i S x i i (..6... 4.9 6 x i 44.9. ( USS.8.6 S... 4.9 5 44.9 (4.6 4.6 44.9 6.05
E lille gåde 4 mexicaere har stjålet e ged, og er derfor blevet dømt til døde, og skal skydes. De får dog e chace for at redde deres liv. De er hver blevet udstyret med e mexicaer hat, og der er hvide og sorte hatte. De skal u blot besvare følgede spørgsmål: Hvilke farve hat har du selv på? Hvilke( af de 4 mexicaere ka fortælle hvilke farve hat ha selv har på???
Gåde Situatioer:.. 3.
Eksempel: Læseever Der betragtes to 3. klasser. De ee klasse modtager ekstra læsetræig, mes de ade klasse er e kotrolklasse med almidelig læseudervisig. Efter 8 uger får elevere e læsetest. Klasse Træig Testresultat 4 43 7 58 43 49 6 44 67 49 53 56 59 5 6 54 57 33 46 43 57 Kotrol 4 43 55 6 6 37 33 4 9 54 0 85 46 0 7 60 53 4 37 4 55 8 48
Fraktilplots viser at måliger i hver klasse ka beskrives med e ormalfordelig, dvs: X træig ~ N ( µ træig ; σ træig. X kotrol ~ N ( µ kotrol ; σ kotrol Vi øsker u at fide estimater for middelværdi og stadardafvigelse i hver af de to klasser.
Først bereges: 463 48... 43 4 58069 57... 43 4 955 48... 43 (4 08 57... 43 (4 i i kotrol i i træig i i kotrol i i træig x USS x USS x S x S
463 955 3 Kotrol 58069 08 Træig USS S Klasse 7. 3 955 (463 (.0 08 (58069 0 ( 4.5 955 3 5.5 08 S USS s S USS s S x S x kotrol træig kotrol træig
Vi øsker u at teste hypotese H :σ σ træig kotrol altså et test for samme stadardafvigelse i de to klasser. Dette gøres ved teststørrelse: F s s træig kotrol.0 7. 0.4~ F( f, f F(,3 F(0, P obs ( x ( F F( f, ( ( (0,(0.4 f F F F 0.057
Da p-værdie er større ed 5 % accepterer vi hypotese, dvs vi har modelle: X X træig kotrol ~ ~ N( µ N( µ træig kotrol ; σ ; σ De fælles stadardafvigelse ka estimeres ved: s f træig s f træig træig f f kotrol kotrol s kotrol 0 0 0 7. 4.6
Vi øsker u at teste hypotese H : µ µ træig kotrol altså et test for samme middelværdi i de to klasser. Dvs. et test for om de ekstra læsetræig har e effekt.
Dette gøres ved teststørrelse: 0.07 (.7 ( ( ( ( ( (4 ( ( ~.7 3 ( 4.6 4.5 5.5 ( ( (4 ( t f t obs kotrol træig kotrol træig kotrol træig F x t F x P t t f t s x x x t
Da p-værdie er midre ed 5 % forkaster vi hypotese om es middelværdier. Dvs de ekstra læsetræig har e effekt. Da vi ku lige øjagtig fik accept af hypotese om es stadardafvigelser, øsker vi også at teste hypotese om es middelværdier i modelle med forskellige stadardafvigelser: X X træig kotrol ~ ~ N( µ N( µ træig kotrol ; σ ; σ træig kotrol
37.9 /(3 3 7. ( /( 0 ( 3 7. 0 ( /( ( /( ( ( ~ ~ (.3~ 3 7. 0 4.5 5.5 ( : kotrol kotrol kotrol træig træig træig kotrol kotrol træig træig kotrol kotrol træig træig kotrol træig kotrol træig s s s s f f t s s x x x t H µ µ Dvs. vi tester hypotese:
P obs ( x ( F ~ ( t( x ( F (37.9(.3 t( f t 0.06 Dvs. vi også får forkastelse af hypotese om es middelværdier i dee model. Koklusioe bliver altså i dette tilfælde det samme, me vi bemærker at idet vi får to forskellige testværdier, kue vi godt have fået accept i de ee model frem for de ade.
Eksempel: Allergiske reaktioer Der betragtes 50 persoer med polleallergi. 3 behadles med e modgift ma vil teste effekte af, mes de resterede 7 får et medikamet, ma ved ikke har oge effekt (placebo. Vi betragter modelle: Xmodgift~ N( µ modgift; σmodgift X placebo ~ N( µ placebo ; σ placebo Det oplyses at: Gruppe x s Modgift 3 9.5 7.3 Placebo 7 5.4 7.
Vi vil først teste hypotese om es stadardafvigelse: H : σ F ~ F( P obs s s ( x ( modgift modgift f placebo, f F σ 7.3 7..54 F(3,7 ( F F(,6 placebo F( f, f ( F (.54 0.04 F(,6 Dvs vi får forkastelse af hypotese om es stadardafvigelse.
Havde vi fået accept af hypotese om es stadardafvigelser ville vi et 95% kofidesiterval for forskelle mellem middelværdiere være: x x s ( t0.975( f µ µ x x s ( t0. 975( f Når stadardafvigelsere ikke er es bliver kofidesitervallet i stedet: x modgift smodgift splacebo x t ( ~ placebo 0.975 f µ modgift µ modgift placebo placebo x modgift x placebo s modgift modgift s placebo placebo t 0.975 ( ~ f
35.8 /(7 7 7. ( /(3 3 7.3 ( 7 7. 3 7.3 ( /( ( /( ( ( ~ mod mod mod mod mod placebo placebo placebo gift gift gift placebo placebo gift gift s s s s f Vi bestemmer først:
Hvormed et 95% kofidesiterval for forskelle mellem middelværdiere er givet ved: 7.3 7. 7.3 3 7. 7.03 µ modgift µ placebo 7.3 7. 7.3 3 7. 7.03 0.77 µ modgift µ placebo 7.5 Vi bemærker, at 0 ikke ligger i kofidesitervallet.
Vi øsker til slut at teste om de to middelværdier ka atages at være es: H : µ µ modgift xmodgift x t( x smodgift s modgift ~ t( ~ f t(35.8 P obs ( x ( F placebo t( ~ f placebo placebo placebo ( t( x 9.5 5.4.4 7.3 7. 3 7 ( F (.4 0.038 t(35.8 Det vil sige vi forkaster hypotese. Det er i overesstemmelse med 0 ikke er i kofidesitervallet fra før og betyder behadlige har e effekt.
Hvorfor er det godt at kue si statistik???
TV-quiz Atag, at du medvirker i et tv-program, og du får givet mulighede for at vælge mellem tre døre: Bag e af døree er der e bil; bag de to adre e ged. Du vælger e dør, lad os sige r., og tv-værte, som ved, hvad der er bag døree, åber e ade dør, lad os sige r. 3, bag hvilke der befider sig e ged. Ha spørger dig u: "Vil du hellere vælge dør r.?" Er det u e fordel af vælge om?
Sadsylighede for at ma vælger døre med bile ved det første valg er /3, hvilket også vil være chace for at vide bile, hvis ma holder fast på sit første valg. På de ade side er sadsylighede for at vælge e dør, som skjuler e ged /3, og e spiller, som oprideligt har valgt e ged, vider bile ved at vælge om.
Vi har altså 3 mulige udfald.. 3.
I to ud af tre tilfælde ka det betale sig at skifte dør, og i et ud af tre tilfælde ka det ikke betale sig. Es chace for at vide fordobles altså ved at vælge om, år spilstyrere tilbyder det. Løsige ville være aderledes, hvis tv-værte ikke vidste, hvad der var gemt bag de forskellige døre, eller hvis tv-værte havde mulighede for ikke at tilbyde spillere at vælge om.
Er mæd klogere ed kvider?
Professor i psykologi ved Aarhus Uiversitet, Helmuth Nyborg påstod at have opdaget mæd geemsitligt er 7 % klogere ed kvider. Seere opdagede ha e regefejl, så forskelle ku var 5 %... Me ka dette resultat være rigtigt?
Problemer med Nyborgs resultat: - Lille datamateriale (5 persoer - Hvorda er disse udvalgt - Hvorda måles itelligese? - Statistisk metode
Nyborg modellerede hvert køs itelliges ved e ormalfordelig. Ha avedte et test, der ikke gav mulighed for kvider kue være klogere ed mæd. Havde ha i stedet avedt et gaske almideligt t-test for at middelværdie var de samme i de to grupper (de to kø, ville ha have fået accept. Me der er flere problemer
Nyborg hævdede: for hver kvide med e IQ på over 45 vil der være mæd Er Nyborgs 5 testpersoer repræsetative (og ellers giver udersøgelse ige meig! må de fleste ligge ær middelværdie. Et så lille datasæt ka derfor ikke sige oget om hvorda fordelige er i de mere ekstreme tilfælde.
Statistiker på prøve Asat ved Kliisk Epidemiologisk Afdelig (KEA Udersøge patiet-populatioers progose Adgag til: CPR-registret Receptdatabase Operatiosdatabase Cacerregister Fødsels- og dødsregister
Statistiker på prøve Immuforsvarets rolle i forbidelse med brystkræft-recidiv Herpes Zoster og kræft?
Spørgsmål og kommetarer Tak for i dag