Maja Tarp AARHUS UNIVERSITET

Relaterede dokumenter
Maja Tarp AARHUS UNIVERSITET

hvor i er observationsnummeret, som løber fra 1 til stikprøvestørrelsen n, X i

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Meningsmålinger KLADDE. Thomas Heide-Jørgensen, Rosborg Gymnasium & HF, 2017

Praktisk info. Statistisk analyse af en enkelt stikprøve: kendt eller ukendt varians Sandsynlighedsregning og Statistik (SaSt) I tirsdags.

Anvendt Statistik Lektion 3. Punkt- og intervalestimater Konfidensintervaller Valg af stikprøvestørrelse

9. Binomialfordelingen

Løsninger til kapitel 7

Statistik Lektion 8. Parrede test Test for forskel i andele Test for ens varians Gensyn med flyskræk!

1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens... 2

Statistik 8. gang 1 KONFIDENSINTERVALLER. Konfidensintervaller: kapitel 11. Valg og test af fordelingsfunktion

Spørgsmål 3 (5 %) Bestem sandsynligheden for at et tilfældigt valgt vindue har en fejl ved listerne, når man ved at der er fejl i glasset.

Program. Ensidet variansanalyse Normalfordelingen. Antibiotika og nedbrydning af organisk materiale. Tegninger

Vejledende besvarelser til opgaver i kapitel 15

Estimation ved momentmetoden. Estimation af middelværdiparameter

Sætning: Middelværdi og varians for linearkombinationer. Lad X 1,X 2,...,X n være stokastiske variable. Da gælder. Var ( a 0 + a 1 X a n X n

Matematik A. Højere handelseksamen. Tirsdag den 26. maj 2015 kl hhx151-mat/a

Mikroøkonomi, matematik og statistik Eksamenshjemmeopgave december 2007

Program. Middelværdi af Y = t(x ) Transformationssætningen

Sammenligning af to grupper

Renteformlen. Erik Vestergaard

STATISTIK x-klasserne Gammel Hellerup Gymnasium

Simpel Lineær Regression. Opsplitning af variationen Determinations koefficient Variansanalyse F-test Model-kontrol

Løsningsforslag til skriftlig eksamen i Kombinatorik, sandsynlighed og randomiserede algoritmer (DM528)

Formelskrivning i Word 2. Sådan kommer du i gang 4. Eksempel med skrivning af brøker 5. Brøker skrevet med småt 6. Hævet og sænket skrift 6

Stikprøvefordelinger og konfidensintervaller

Projekt 9.10 St. Petersborg paradokset

(VIDENSKABSTEORI) STATISTIK (EKSPERIMENTELT ARBEJDE)

Teoretisk Statistik, 9. februar Beskrivende statistik

Indholdsfortegnelse Generelt Diskrete stokastiske variable: Kontinuerte stokastiske variable: Regneregler for stokastiske variable

Sandsynlighedsregning i biologi

Økonometri 1. Inferens i den lineære regressionsmodel 29. september Økonometri 1: F7 1

Elementær Matematik. Polynomier

STATISTIKNOTER Simple normalfordelingsmodeller

Den flerdimensionale normalfordeling

Modul 14: Goodness-of-fit test og krydstabelanalyse

Matematisk Modellering 1 Hjælpeark

Motivation. En tegning

x-klasserne Gammel Hellerup Gymnasium

Konfidens intervaller

Projekt 1.3 Brydningsloven

STATISTISKE GRUNDBEGREBER

HASTIGHEDSKORT FOR DANMARK VHA. GPS

STATISTISKE GRUNDBEGREBER

Estimation og test i normalfordelingen

Noter om kombinatorik, Kirsten Rosenkilde, februar Kombinatorik

Dårligt arbejdsmiljø koster dyrt

Hvordan hjælper trøster vi hinanden, når livet er svært?

Vejledende opgavebesvarelser

Gamle eksamensopgaver. Diskret Matematik med Anvendelser (DM72) & Diskrete Strukturer(DM504)

Claus Munk. kap. 1-3

Dagens forelæsning. Claus Munk. kap Obligationer Grundlæggende Intro. Obligationer Grundlæggende Intro. Obligationer Grundlæggende Intro

Du skal redegøre for løsning af ligninger og herunder behandle omformningsreglerne for ligninger.

Projekt 9.1 Regneregler for stokastiske variable middelværdi, varians og spredning

Branchevejledning. ulykker indenfor. lager. området. Branchearbejdsmiljørådet for transport og engros

Projekt 4.8 De reelle tal og 1. hovedsætning om kontinuerte funktioner

STATISTISKE GRUNDBEGREBER

Morten Frydenberg version dato:

STATISTISKE GRUNDBEGREBER

Matematik A. Studentereksamen. Forberedelsesmateriale. Forsøg med digitale eksamensopgaver med adgang til internettet.

Hypotesetest. Hypotesetest og kritiske værdier Type 1 og Type 2 fejl Styrken af en test Sammenligning af to populationer

Blisterpakninger i det daglige arbejde

Begreber og definitioner

Kapitel 10 KALIBRERING AF STRØMNINGSMODEL

Noter om kombinatorik, Kirsten Rosenkilde, februar Kombinatorik

6 Populære fordelinger

Forslag til besvarelser af opgaver m.m. i ε-bogen, Matematik for lærerstuderende

Branchevejledning. ulykker indenfor. godschauffør. området. Branchearbejdsmiljørådet for transport og engros

Transkript:

AARHUS UNIVERSITET Maja Tarp AARHUS UNIVERSITET

HVEM ER JEG? Maja Tarp, 4 år Folkeskole i Ulsted i Nordjyllad Studet år 005 fra Droiglud Gymasium Efter gymasiet: Militæret Australie Startede på matematik på Aarhus Uiversitet i 007 Sommere 00: BSc i matematik Nu: Stud.cad.sciet i statistik

STUDIERNES OPBYGNING Her er jeg

HVORDAN SER EN UGE UD?

JOBMULIGHEDER Private erhvervsliv et hav af muligheder: Hadel Baker Kosulet- og rådgivigsvirksomhed Medicialidustri Sudhed Forskig: Uiversiteter Iteresseorgaisatioer Private virksomheder Udervisig: Gymasier Hadelsskoler Semiarer Ikke Gallup!

Hvorfor statistik? Ka forudsige fremtide Ka bruges som beslutigsgrudlag: Politik Aktiekurser Mediciske forsøg Risikovurderig Spilteori

Statistik og virkelighede I periode 960-970 faldt atallet af fødsler samtidig med at atallet af storkepar i Damark faldt. Drukeulykker og issalg hæger samme: Når der sælges mage is, er der mage der druker! Bør der ivesteres mere i rykecreme? Der er e overdødelighed bladt folk med ryker!

Normalfordelig

Normalfordelig Måske de vigtigste fordelig overhovedet. Har toppukt i si middelværdi, og er symmetrisk fordelt her omkrig. Model for hvorda et stort atal statistiske elemeter fordeler sig omkrig deres middelværdi.

Eksempler Højde, vægt Kvalitetstest Blodtryksædrig IQ

E ormalfordelt observatio Vi vil u betragte e ormalfordelt stokastisk variabel: X ~ N( µ ; σ Hvor µ er middelværdie og σ er stadardafvigelse. Gælder der: X ~N(0; siges X at være stadardormalfordelt.

E ormalfordelt observatio Vi betragter altså X ~ N( µ ; σ x Vi bereger ofte som er det bedste gæt på de sade værdi af. µ Og som er det bedste gæt ma ka komme på de sade værdi af. s σ

Normalfordelige, grafisk De ormerede ormalfordelig, dvs. X ~N(0; Grafe viser tæthedsfuktioe. Areal

Normalfordelige, grafisk E tilsvarede graf ka laves for ehver ormalfordelig X Samme form som før, blot ade placerig. Arealet stadig. ~ N( µ ; σ

Fordeligsfuktioe Lad X være e stadardormalfordelt stokastisk variabel. Fordeligsfuktioe Φ(x agiver sadsylighede for, at X er midre ed et tal x, dvs Φ(x Sadsylighed for X x Dvs. at Φ(x er e voksede fuktio, med værdier mellem 0 og.

Eksempler: Fordeligsfuktioe Vi betragter X ~N(30;4 altså hvor middelværdie er 30 og spredige 4. Bestem fordeligsfuktie. Dvs. fid sadsylighede for at x To metoder: Atag x33. Bestem sadsylighede som arealet uder grafe for tæthedsfuktioe fra - til 33. Bestem fordeligsfuktioes værdi i 33.

Eksempel: Fluer og gift 6 fluer udsættes for ervegift, der måles hvor lag tid der går, før fluere besvimer.

6 5 4 3 0 9 8 7 6 5 4 3 Flue ummer i.86 4.9 40.3 4. 58.0 3.8 46 0.78 3.8 43 0.58 3.5 34 0.40 3. 4 0.4 3. 4 0.08 3.0 0-0.08.5-0.4.3 0-0.40. 9-0.58. 9-0.78.9 7 -.0.6 5 -.3.6 5 -.86. 3 Φ^(- ((i-0.5/6 L(tid Tid

N(0,-fraktil - - 0 0 0 40 60 80 00 0 40 tid Hvis vores måliger er ormalfordelte forveter vi at kue idtege dem som e ret lije i fraktilplottet. Dette er ikke tilfældet, me måligere ser ud til at de kue være logaritme fordelt. Derfor tages logaritme til tide og vi idteger ige.

N(0,-fraktil - - 0 3 4 5 Måligere ligger om e pæ ret lije, hvorfor vi ka atage, at logaritme til tide er ormalfordelt. Dvs. vi betragter modelle: X ltid ~ N( µ ; σ

Vi bereger efterfølgede skø for stadardafvigelse og middelværdie vha. formlere: S x USS s i S x i i (..6... 4.9 6 x i 44.9. ( USS.8.6 S... 4.9 5 44.9 (4.6 4.6 44.9 6.05

E lille gåde 4 mexicaere har stjålet e ged, og er derfor blevet dømt til døde, og skal skydes. De får dog e chace for at redde deres liv. De er hver blevet udstyret med e mexicaer hat, og der er hvide og sorte hatte. De skal u blot besvare følgede spørgsmål: Hvilke farve hat har du selv på? Hvilke( af de 4 mexicaere ka fortælle hvilke farve hat ha selv har på???

Gåde Situatioer:.. 3.

Eksempel: Læseever Der betragtes to 3. klasser. De ee klasse modtager ekstra læsetræig, mes de ade klasse er e kotrolklasse med almidelig læseudervisig. Efter 8 uger får elevere e læsetest. Klasse Træig Testresultat 4 43 7 58 43 49 6 44 67 49 53 56 59 5 6 54 57 33 46 43 57 Kotrol 4 43 55 6 6 37 33 4 9 54 0 85 46 0 7 60 53 4 37 4 55 8 48

Fraktilplots viser at måliger i hver klasse ka beskrives med e ormalfordelig, dvs: X træig ~ N ( µ træig ; σ træig. X kotrol ~ N ( µ kotrol ; σ kotrol Vi øsker u at fide estimater for middelværdi og stadardafvigelse i hver af de to klasser.

Først bereges: 463 48... 43 4 58069 57... 43 4 955 48... 43 (4 08 57... 43 (4 i i kotrol i i træig i i kotrol i i træig x USS x USS x S x S

463 955 3 Kotrol 58069 08 Træig USS S Klasse 7. 3 955 (463 (.0 08 (58069 0 ( 4.5 955 3 5.5 08 S USS s S USS s S x S x kotrol træig kotrol træig

Vi øsker u at teste hypotese H :σ σ træig kotrol altså et test for samme stadardafvigelse i de to klasser. Dette gøres ved teststørrelse: F s s træig kotrol.0 7. 0.4~ F( f, f F(,3 F(0, P obs ( x ( F F( f, ( ( (0,(0.4 f F F F 0.057

Da p-værdie er større ed 5 % accepterer vi hypotese, dvs vi har modelle: X X træig kotrol ~ ~ N( µ N( µ træig kotrol ; σ ; σ De fælles stadardafvigelse ka estimeres ved: s f træig s f træig træig f f kotrol kotrol s kotrol 0 0 0 7. 4.6

Vi øsker u at teste hypotese H : µ µ træig kotrol altså et test for samme middelværdi i de to klasser. Dvs. et test for om de ekstra læsetræig har e effekt.

Dette gøres ved teststørrelse: 0.07 (.7 ( ( ( ( ( (4 ( ( ~.7 3 ( 4.6 4.5 5.5 ( ( (4 ( t f t obs kotrol træig kotrol træig kotrol træig F x t F x P t t f t s x x x t

Da p-værdie er midre ed 5 % forkaster vi hypotese om es middelværdier. Dvs de ekstra læsetræig har e effekt. Da vi ku lige øjagtig fik accept af hypotese om es stadardafvigelser, øsker vi også at teste hypotese om es middelværdier i modelle med forskellige stadardafvigelser: X X træig kotrol ~ ~ N( µ N( µ træig kotrol ; σ ; σ træig kotrol

37.9 /(3 3 7. ( /( 0 ( 3 7. 0 ( /( ( /( ( ( ~ ~ (.3~ 3 7. 0 4.5 5.5 ( : kotrol kotrol kotrol træig træig træig kotrol kotrol træig træig kotrol kotrol træig træig kotrol træig kotrol træig s s s s f f t s s x x x t H µ µ Dvs. vi tester hypotese:

P obs ( x ( F ~ ( t( x ( F (37.9(.3 t( f t 0.06 Dvs. vi også får forkastelse af hypotese om es middelværdier i dee model. Koklusioe bliver altså i dette tilfælde det samme, me vi bemærker at idet vi får to forskellige testværdier, kue vi godt have fået accept i de ee model frem for de ade.

Eksempel: Allergiske reaktioer Der betragtes 50 persoer med polleallergi. 3 behadles med e modgift ma vil teste effekte af, mes de resterede 7 får et medikamet, ma ved ikke har oge effekt (placebo. Vi betragter modelle: Xmodgift~ N( µ modgift; σmodgift X placebo ~ N( µ placebo ; σ placebo Det oplyses at: Gruppe x s Modgift 3 9.5 7.3 Placebo 7 5.4 7.

Vi vil først teste hypotese om es stadardafvigelse: H : σ F ~ F( P obs s s ( x ( modgift modgift f placebo, f F σ 7.3 7..54 F(3,7 ( F F(,6 placebo F( f, f ( F (.54 0.04 F(,6 Dvs vi får forkastelse af hypotese om es stadardafvigelse.

Havde vi fået accept af hypotese om es stadardafvigelser ville vi et 95% kofidesiterval for forskelle mellem middelværdiere være: x x s ( t0.975( f µ µ x x s ( t0. 975( f Når stadardafvigelsere ikke er es bliver kofidesitervallet i stedet: x modgift smodgift splacebo x t ( ~ placebo 0.975 f µ modgift µ modgift placebo placebo x modgift x placebo s modgift modgift s placebo placebo t 0.975 ( ~ f

35.8 /(7 7 7. ( /(3 3 7.3 ( 7 7. 3 7.3 ( /( ( /( ( ( ~ mod mod mod mod mod placebo placebo placebo gift gift gift placebo placebo gift gift s s s s f Vi bestemmer først:

Hvormed et 95% kofidesiterval for forskelle mellem middelværdiere er givet ved: 7.3 7. 7.3 3 7. 7.03 µ modgift µ placebo 7.3 7. 7.3 3 7. 7.03 0.77 µ modgift µ placebo 7.5 Vi bemærker, at 0 ikke ligger i kofidesitervallet.

Vi øsker til slut at teste om de to middelværdier ka atages at være es: H : µ µ modgift xmodgift x t( x smodgift s modgift ~ t( ~ f t(35.8 P obs ( x ( F placebo t( ~ f placebo placebo placebo ( t( x 9.5 5.4.4 7.3 7. 3 7 ( F (.4 0.038 t(35.8 Det vil sige vi forkaster hypotese. Det er i overesstemmelse med 0 ikke er i kofidesitervallet fra før og betyder behadlige har e effekt.

Hvorfor er det godt at kue si statistik???

TV-quiz Atag, at du medvirker i et tv-program, og du får givet mulighede for at vælge mellem tre døre: Bag e af døree er der e bil; bag de to adre e ged. Du vælger e dør, lad os sige r., og tv-værte, som ved, hvad der er bag døree, åber e ade dør, lad os sige r. 3, bag hvilke der befider sig e ged. Ha spørger dig u: "Vil du hellere vælge dør r.?" Er det u e fordel af vælge om?

Sadsylighede for at ma vælger døre med bile ved det første valg er /3, hvilket også vil være chace for at vide bile, hvis ma holder fast på sit første valg. På de ade side er sadsylighede for at vælge e dør, som skjuler e ged /3, og e spiller, som oprideligt har valgt e ged, vider bile ved at vælge om.

Vi har altså 3 mulige udfald.. 3.

I to ud af tre tilfælde ka det betale sig at skifte dør, og i et ud af tre tilfælde ka det ikke betale sig. Es chace for at vide fordobles altså ved at vælge om, år spilstyrere tilbyder det. Løsige ville være aderledes, hvis tv-værte ikke vidste, hvad der var gemt bag de forskellige døre, eller hvis tv-værte havde mulighede for ikke at tilbyde spillere at vælge om.

Er mæd klogere ed kvider?

Professor i psykologi ved Aarhus Uiversitet, Helmuth Nyborg påstod at have opdaget mæd geemsitligt er 7 % klogere ed kvider. Seere opdagede ha e regefejl, så forskelle ku var 5 %... Me ka dette resultat være rigtigt?

Problemer med Nyborgs resultat: - Lille datamateriale (5 persoer - Hvorda er disse udvalgt - Hvorda måles itelligese? - Statistisk metode

Nyborg modellerede hvert køs itelliges ved e ormalfordelig. Ha avedte et test, der ikke gav mulighed for kvider kue være klogere ed mæd. Havde ha i stedet avedt et gaske almideligt t-test for at middelværdie var de samme i de to grupper (de to kø, ville ha have fået accept. Me der er flere problemer

Nyborg hævdede: for hver kvide med e IQ på over 45 vil der være mæd Er Nyborgs 5 testpersoer repræsetative (og ellers giver udersøgelse ige meig! må de fleste ligge ær middelværdie. Et så lille datasæt ka derfor ikke sige oget om hvorda fordelige er i de mere ekstreme tilfælde.

Statistiker på prøve Asat ved Kliisk Epidemiologisk Afdelig (KEA Udersøge patiet-populatioers progose Adgag til: CPR-registret Receptdatabase Operatiosdatabase Cacerregister Fødsels- og dødsregister

Statistiker på prøve Immuforsvarets rolle i forbidelse med brystkræft-recidiv Herpes Zoster og kræft?

Spørgsmål og kommetarer Tak for i dag