At træffe sine valg i en usikker verden - eller den statistiske modellerings rolle.

Størrelse: px
Starte visningen fra side:

Download "At træffe sine valg i en usikker verden - eller den statistiske modellerings rolle."

Transkript

1 At træffe sine valg i en usikker verden - eller den statistiske modellerings rolle. Af E. Susanne Christensen. Lektor i statistik. Institut for Matematiske Fag. Aalborg Universitet. I mange tilfælde og i mange forskellige faglige sammenhænge må man træffe en afgørelse eller basere en overbevisning på et ikke fuldstændigt informationsgrundlag. Dette er fx tilfældet, når man ønsker at forudsige udfaldet af et kommende folketingsvalg og kun har en opinionsundersøgelse til rådighed, eller når man ønsker at vide, om antallet af rygere er stigende blandt unge mennesker, men ikke har mulighed for at spørge alle unge, om de ryger eller ej. Resultaterne vil i sådanne tilfælde bære præg af, hvilken stikprøve 1 man lægger til grund for til sin undersøgelse. Eksempel: Vi vil undersøge, om holdningen til skattelettelser i Danmark er den samme for gymnasieelever som for gymnasielærere. For at finde ud af det, må vi indsamle nogle data, som vi kan basere vores konklusioner på: Vi skal lave en stikprøve! Hvis vi vidste, det var så heldigt, at alle gymnasieelever i landet var enige med hinanden, og at også alle gymnasielærere var indbyrdes enige i spørgsmålet om skattelettelser, så kunne vi hurtigt blive færdige. Vi skulle bare spørge én person fra hver gruppe, hvad de mente om sagen, og så fastslå, om de to grupper også var enige; Og vi ville således være helt sikre på, at vi havde draget den rigtige konklusion. Men så nemt går det sjældent. Der kan være ret stor forskel på meningerne inden for en gruppe personer. Og selvom det faktisk skulle forholde sig sådan, at de fleste gymnasieelever går ind for skattelettelser, så kan vi jo godt være uheldige til vores stikprøve - at udvælge de elever, der er imod og lige så uheldige kunne vi være med vores udvælgelse blandt lærerne. Hvis det er tilfældet, så vil vi ende op med den forkerte konklusion om gruppernes mening om spørgsmålet. Det, vi kan gøre for at mindske risikoen for at lave forkerte konklusioner, er at tage fornuftige stikprøver, der er store nok til, at risikoen for at komme frem til en forkert konklusion bliver ac- 1 Ord markeret med rød farve indikerer, at der findes en specifik matematisk definition af ordet. Når det ikke defineres her skyldes det, at den almindelige brug og opfattelse af ordet normalt får en til at agere i overensstemmelse med den korrekte matematiske definition. I dette tilfælde kan finde den korrekte definition i [] (stikprøve=sample).

2 ceptabel. Statistik går (blandt andet) ud på at præcisere alle de begreber, der her står i anførselstegn. Hvad sandsynligheden er for at drage en forkert konklusion, kan beregnes. I hvert tilfælde hvis man følger nogle enkle regler, når man indsamler data. Hvilke udvælgelsesmåder man kan bruge i praksis, er beskrevet nærmere i [] og [3]. I denne note skal vi se på, hvordan man kan sætte tal på ens usikkerhed i et par specifikke tilfælde. Statistisk test for uafhængighed mellem to inddelingskriterier. Hvis vi vil undersøge, om det at bruge mange penge på tøj er lige udbredt blandt unge kvinder og unge mænd, er den mest objektive måde at forholde sig på at lave en empirisk undersøgelse. Dvs. man indsamler data og drager sine slutninger på baggrund af dem. Allerførst er der et par ting, der skal præciseres! Hvad er det for nogle unge, vi interesserer os for? I den statistiske terminologi hedder det at fastlægge populationen. Lad os sige, at det er unge mellem 15-0 år og bosiddende i Danmark, vi er interesseret i. Så skal vi have præciseret, hvad vi egentligt forstår ved at bruge mange penge på tøj. I den statistiske terminologi siger man, at vi skal have formuleret modellen og hypoteserne. Modellen kan hér være, at andelen af kvinder, der bruger mere end 1500 kr. om måneden på tøj er p k og den tilsvarende for mændene er p m. (Andelen p k svarer til sandsynligheden for at en kvinde tilfældigt udvalgt 3 fra populationen bruger mere end 1500 kr. på tøj om måneden ). Grænsen for, hvornår man bruger mange penge på tøj, er jo hér sat subjektivt og kan selvfølgelig gøres til genstand for diskussion. Vi kommer tilbage til hvilke matematiske krav, der skal stilles til denne grænse. Hypotesen er, at p m = p k, eller sagt i ord: Andelen af unge mænd, der bruger mange penge på tøj, er den samme som den tilsvarende andel for unge kvinder. For at undersøge vores hypotese kan vi fx gennemføre følgende forsøg: Vi udvælger et antal unge mellem 15 og 0 år tilfældigt og spørger dem om, hvor mange penge, de bruger på tøj om måneden. Så tæller vi op, hvor mange kvinder, der bruger mere end 1500 kr., og hvor mange mænd. (En anden statistisk undersøgelse kunne foretages med udgangspunkt i svarene om størrelsen af de bruge beløb og fx undersøge, om det gennemsnitlige forbrug for kvinder er større end det gennemsnitlige forbrug for mænd. I så fald skulle man bruge den statistiske metode, der hedder sammenligning af to middelværdier. Det kan man læse mere om i fx []) For en introduktion til basal sandsynlighedsregning se fx [1] eller []. 3 Tilfældigt udvalgt betyder, at alle individer i populationen har samme sandsynlighed for at blive udvalgt. Vore beregninger forudsætter, at stikprøven er udvalgt på denne måde.

3 Vores resultat af undersøgelsen kan vi organisere i en tabel som nedenfor: (Tallene er rent gætværk - ikke resultat af en virkelig undersøgelse. Sådan én kan I jo lave!). <1500 kr./måned 1500 kr./måned Ialt Kvinder Mænd Ialt Vi kan eventuelt fremstille tallene fra stikprøven grafisk som nedenfor: Vi kan nu gætte på andelen af unge kvinder, der bruger mange penge på tøj, simpelthen ved at regne ud, hvor stor andelen er i stikprøven. Vi siger, vi estimerer p k. I dette tilfælde får vi et estimat på 10/00= 0.51, hvilket vil sige, at vi tror, at 51 % af de unge kvinder bruger mange penge på tøj. Tilsvarende estimerer vi andelen af mænd til 100/160=0.65. Vi tror altså, at der var 6.5 % af de unge mænd, der bruger mange penge på tøj. I den stikprøve vi har, er andelen af kvinder, der bruger mange penge på tøj, altså mindre end den tilsvarende andel for mænd. Umiddelbart kan det altså se ud som om, at vores hypotese om samme andel for de to køn af personer, der bruger mange penge på tøj, IKKE holder stik. Resten af øvelsen går ud på at afgøre, om dette blot er en tilfældig følge af en uheldig stikprøve, ELLER om det vi har set, er så markant, at vi

4 tør tage det som udtryk for en forskel mellem de to køn generelt, altså noget vi tror, der gælder for hele populationen. For at kunne regne på sagen og lave et statistisk test er det matematisk set vigtigt, at de enkelte svar på, hvor mange penge man bruger, er uafhængige 4 af hinanden. Hvis man fx i sin stikprøve har valgt en gruppe venner med stor indbyrdes påvirkning, så vil denne gruppe sagtens kunne have en adfærd, som er atypisk for populationen som helhed, og derved påvirke undersøgelsens resultat uhensigtsmæssigt. Statistisk hypotesetest minder logisk set om det, du måske kender fra din matematikundervisning som et modstridsargument. Man antager en ting, gennemfører en række logiske argumenter og ender op med en konklusion, der klart er forkert. Heraf slutter man, at den oprindelige antagelse IKKE kan være rigtig. I statistik tager man hensyn til, at verden ikke er deterministisk, så hér kan man ikke konkludere, at udgangsantagelsen ikke er sand, men man kan eventuelt slutte, at det, man har set i sit forsøg vil være USANDSYNLIGT, hvis udgangsantagelsen er sand. Dermed tyder forsøget på, at antagelsen ikke er rigtig. Vores antagelse om, at forbrugsmønsteret er ens for de to køn formuleres som vores udgangshypotese. Hvis vores test kan afvise den hypotese, så har vi et vist belæg for at påstå, at der er en signifikant forskel 5 mellem de to køn. Vi har således en udgangshypotese, som per tradition kaldes H 0 og en alternativ hypotese H 1 givet som: H 0 p k =p m H 1 p k p m En anden måde at udtrykke H 0 på er, at der er uafhængighed mellem det at bruge mange penge på tøj og ens køn. H 1 svarer så til, at der er afhængighed mellem de to inddelingskriterier - forbrug og køn, dvs. H 0 H 1 Der er uafhængighed mellem de to kriterier. Der er ikke uafhængighed mellem de to kriterier. Vi starter med at antage, at H 0 udtrykker den sande tilstand af verden. I så fald kan vi estimere andelen af unge, der bruger mange penge på tøj, uden hensyntagen til, om de tilhører det ene eller det andet køn. Andelen af storforbrugere estimeres så til 0/360=0.5611, altså %. Så hvis vi har en gruppe på 00 unge, vil vi forvente, at 00*0.5611= 11. af dem er storforbrugere, og 00*( )= af dem var ikke-storforbrugere, uanset hvilket køn de har. Her har vi brugt regelen, at hvis sandsynligheden for at være storforbruger er givet ved p, så er sandsynligheden for det modsatte, nemlig at være ikke-storforbruger, givet ved (1-p). Ud over at være logisk er dette også en regneregel fra den basale sandsynlighedsteori. 4 At to hændelser A og B er uafhængige betyder at P(A B)=P(A)*P(B). For regneregler for sandsynligheder se [] eller [3]. 5 Begrebet statistisk signifikans er relateret til statistisk testteori. Se fx [].

5 Ved at regne på den måde kan vi udfylde skemaet med de værdier, som vi ville have forventet at se, hvis verden opførte sig som vores H 0 foreskriver. Forventede værdier under antagelse af at der er uafhængighed: <1500 kr./måned 1500 kr./måned Ialt Kvinder 158 * 00 = * 00 = Mænd 158 *160 = *160 = Ialt Afvigelserne mellem det resultat, vi fik i forsøget, og de hér udregnede forventede værdier er et udtryk for, hvor langt forsøgets virkelighed er fra den verden, der er modelleret i H 0. Imidlertid er det sådan, at summen af afvigelserne ( )+( )+( )+ ( ) = 0, og sådan vil det altid være. Så at lægge afvigelserne sammen giver os ikke noget samlet billede af, hvor stor afvigelsen er. I stedet viser det sig at være smart at udregne en χ teststørrelse. Man udregner differens mellem det observerede antal og det forventede antal i hver celle, sætter denne differens i anden og dividerer med det forventede antal. Til sidst summeres disse tal for alle celler, altså: ( obs. antal forv. antal) χ = forv. antal. En stor værdi af teststørrelsen tyder i denne sammenhæng på, at udgangshypotesen om uafhængighed IKKE er opfyldt. Altså: store værdier af χ teststørrelsen får os til at tro mere på H 1. Vi har så bare det problem tilbage, at vi skal afgøre, HVOR stor en teststørrelse skal være, før vi mener, den er så stor, at vi ikke vil tro på H 0. Til det brug skal vi vide, hvor store værdier teststørrelsen normalt vil antage, når H 0 er sand. Hvis hypotesen om uafhængighed er rigtig, og hvis man har en stor nok stikprøve ( sådan at alle de forventede værdier er større end 5), så ved man takket være nogle matematikeres arbejde hvilke værdier denne teststørrelse ville antage, hvis man lavede en uendelig række af forsøg som det skitserede. Den statistiske terminologi er, at man kender teststørrelsens fordeling 6 under H 0, idet den nemlig vil følge det, der hedder en χ fordeling med 1 frihedsgrad. (Udtales ki i anden - fordelingen.) (Og det er her, vi for en kort stund kan vende tilbage til vor subjektivt fastsatte grænse for, hvornår man bruger mange penge på tøj. Havde vi sat den grænse så højt eller så lavt, at der i en af cellerne med de forventede værdier var kommet et tal mindre end 5, så skulle vi enten have lavet grænsen om, eller være gået over til en anden statistik metode. 7 ) 6 Begrebet fordeling kræver introduktion af begrebet stokastisk variabel for at formaliseres. Se [] eller [3]. 7 Fx Fishers eksakte test.

6 Matematisk kan man vise, at i en verden, hvor køn og forbrugsmønster er uafhængige størrelser, så vil man i 5% af de gange, hvor man udvælger en stikprøve på 360 personer. få en teststørrelse, der er større end I 1% af ville man få en teststørrelse, der er større end Disse tal også kaldet kritiske værdier - kan findes i tabeller, på moderne lommeregnere, i Excel og i statistiske værktøjsprogrammer. Med Excel ser det fx således ud: Teststørrelsen fra vores stikprøve bliver χ = ( ) /87.78+(10-11.) /11. +(60-70.) /70.+( ) /89.78= = Den er jo altså er større end Så HVIS antagelsen om uafhængighed mellem køn og forbrug skal holde stik, så har vi hér set et forsøg, der vil optræde med en sandsynlighed, der er betydeligt mindre end Den statistiske terminologi er, at testsandsynligheden er mindre end 5 %. Det er vist lettere at tro på, at antagelsen IKKE holder. Vi forkaster vores udgangshypotese og siger: Forsøget har påvist en sammenhæng mellem køn og forbrug på tøj, der er signifikant på 5% niveau. Men vores teststørrelse er IKKE større end de Det betyder at testsandsynligheden er større end 1 %. Vi kan derfor ikke påvise en signifikant sammenhæng på 1% niveau. Hvis man, som det ofte er tilfældet, har en fast grænse for, hvornår man vil vælge at forkaste sin udgangshypotese, fx når testsandsynligheden er mindre end 5 %, siger man, at man arbejder med et signifikansniveau på 5%. Ved at bruge et fast signifikansniveau på fx 5% i en hel række af forsøg og test ved man altså, at man i 5% af testene fejlagtigt vil forkaste en sand udgangshypotese. Vi ved, hvor sikker metoden er, men vi ved ikke, om den enkelte beslutning om at tro på udgangshypotesen er rigtig eller ej. På din lommeregner kan du få den præcise sandsynlighed for at få en χ teststørrelse, der er større end de 4.78, selvom H 0 er sand. (Ved at slå værdien 4.78 op i en χ fordeling med 1 frihedsgrad.) Denne sandsynlighed kaldes p-værdien eller testsandsynligheden for testet. En p-værdi er altså sandsynligheden for at få en teststørrelse, der får os til at tvivle mindst lige så meget på H 0, som den, vi lige har set, selvom H 0 faktisk er den rigtig hypotese. I det aktuelle eksempel får vi en p-værdi på p = Også p-værdien kan vi finde ved hjælp af Excel eller lignende hjælpemidler. 8 De konkrete tal er fraktiler fra χ fordelingen med 1 frihedsgrad, der er den approximative fordeling af teststørrelsen. For en intuitiv forklaring af frihedsgrader, se [4].

7 Med Excel ser det således ud: Hvad gør vi, hvis vi har flere niveauer på hvert af inddelingskriterierne? Et andet eksempel: En hjerneforsker undersøger forskellige måder at operere for en bestemt form for hjernetumor. Der er tre forskellige operationstyper: Type A, hvor man kun fjerner selve tumoren; Type B, hvor man også tager lidt af det nærmeste omkringliggende væv bort, og Type C, hvor såvel tumor som en større del af det omkringliggende væv fjernes. Lægen ønsker at vide, hvordan operationstypen indvirker på chancen for at overleve et halvt år efter operationen. Over en årrække har lægen indsamlet følgende data over resultaterne af operationerne: (data er fiktive, problemstillingen er autentisk) I live Død Ialt Operation A Operation B Operation C Ialt En grafisk fremstilling af tallene kunne se sådan ud: Sammenhæng mellem operation og status 100% 90% 80% Relativ hyppighed 70% 60% 50% 40% 30% 0% 10% Død I live 0% A B C Operation

8 I stikprøven er der altså forskel på andelen af overlevende efter de forskellige typer af operation. Vi skal forsøge at undersøge, om det er en så stor forskel, at man kan sige, resultaterne kan generaliseres ud over denne stikprøve, altså: er det statistisk signifikant? Vi skal altså forsøge at regne ud, om den sete stikprøve er meget ekstrem, hvis vi antager, at der ikke er forskel på overlevelseschancerne efter de forskelige operationer. Vi lader p A være sandsynligheden er at være i live et halv år efter at have gennemgået en operation af type A, og tilsvarende for p B og p C. Udgangshypotesen er, at der er samme sandsynlighed for overlevelse efter alle tre typer operation, dvs H 0 H 1 p A = p B =p C Ikke alle tre sandsynligheder ens. Hvis udgangshypotesen holder, estimerer vi sandsynligheden for overlevelse ved 59 = , og vi kan udregne de forventede værdier efter samme princip som før: 95 Forventede værdier I live Død Ialt Operation A 0.611* 54 = ( ) *54 = Operation B 0.611*16 = ( ) *16 = Operation C 0.611* 5 = ( ) * 5 = Ialt Alle de forventede størrelser er større end 5, så vi kan bruge χ testet igen, nu bare med nogle lidt andre tal. 9 Teststørrelsen udregnes som før ved at summe Det vil sige, at vi her får ( obs. antal forv. antal) forv. antal over alle celler. ( ) ( ) ( ) (6 6.06) (9 15.5) ( ) 9.48 = Denne gang skal vi bruge en χ fordeling med (-1)*(3-1)=(antal_rækker -1)*(antal_søjler-1)= frihedsgrader. Matematikeren, der er i besiddelse af de relevante tabeller, kan her fortælle os, at vi med en sandsynlighed på 5% vil få en teststørrelse større end 5.99, og med sandsynlighed 1% en teststørrelse større end 9.81, NÅR udgangshypotesen er sand. Vi kan også selv finde en p-værdi via tabel, lommeregner eller i Excel med kommandoen CHIFOR- DELING(10.5;), og vi får en testsandsynlighed på p = Den approximerende χ fordeling har denne gang frihedsgrader. Antallet af frihedsgrader er (antal rækker- 1)*(antal søjler -1).

9 Så i dette tilfælde er vores valgmuligheder: Vi fastholder troen på, at de tre operationstyper giver samme overlevelseschance, og vi har set et forsøg, der har mindre end 1 % sandsynlighed for at indtræffe. ELLER Vi forkaster hypotesen om ens chancer for overlevelse og siger: Der er fundet en sammenhæng mellem overlevelseschance og operationstype, der er statistisk signifikant på 1% niveau. Imidlertid skal man tænke sig om, inden man foreslår operationstype C forbudt. Hvis der er en tredje faktor der influerer billedet, så kan det give misvisende konklusioner, når man kun tager to af dem i betragtning. Vi kigger lidt nærmer på tallene fra før: Eller i procenter: I live Død Ialt Operation A Operation B Operation C Ialt I live Død Ialt Operation A 74% 6% 100% Operation B 63% 37% 100% Operation C 36% 64% 100% Efter en nærmere inspektion af journalerne viser det sig, at også patientens alder er noteret, og ved at opdele i to grupper efter alder får vi billedet: 50 år eller derunder: eller i procent I live Død Ialt Operation A Operation B 0 Operation C ialt I live Død Ialt Operation A 96% 4% 100% Operation B 100% 0% 100% Operation C 100% 0% 100%

10 Over 50 år: I live Død Ialt Operation A Operation B Operation C Ialt eller i procent I live Død Ialt Operation A 50% 50% 100% Operation B 57% 43% 100% Operation C 33% 66% 100% Grafisk ser det nu sådan ud: sammenhæng mellem alder, operation og status 100% 90% 80% 70% 60% 50% 40% 30% 0% 10% 0% A B C A B C højst 50 år højst 50 år højst 50 år over 50 år over 50 år over 50 år Prøv at lave et nyt test for uafhængighed mellem overlevelse og operationsform for aldersgruppen over 50! Når man tager alderen med i betragtning, er operation C pludselig ikke længere så stor en skurk.

11 Her sker der det, at operationstypen og alderen ikke er uafhængige af hinanden eller af overlevelseschancen. Når der er flere vigtige faktorer, der spiller ind på en gang, så bør de alle tages med i analysen, der så bliver noget mere kompliceret. En statistisk metode, man kan anvende, hedder loglineære modeller. Men den sag vil vi ikke komme ind på hér - det må vente til universitetet. Opgaver: Opgave 1: En amerikansk undersøgelse af bilisters brug af sikkerhedsseler resulterede i følgende stikprøve: Brug af sikkerheds sele Køn Altid Som regel Af og til Aldrig Mænd Kvinder Spørgsmål 1: Opstil den relevante nulhypotese og den alternative hypotese for at undersøge, om der er uafhængighed mellem køn og brug af sikkerhedssele? Spørgsmål : Udregn tabellen med de forventede værdier og χ teststørrelsen Spørgsmål 3: Vil det være rimeligt at bruge en χ -fordeling til at vurdere teststørrelsen her? Spørgsmål 4: Giver stikprøven grundlag for at sige, at der er forskel på de to køns brug af sikkerhedsseler? Opgave : En forretningskæde vil undersøge, om farven på indpakningen af nye kartofler påvirker salget. Butikken sælger derfor i en periode poser med samme slags kartofler, alle med.5 kg/pose og til samme pris, men i poser med forskellig farve. Der bliver i alt sendt 600 poser kartofler ud i butikkerne, hvoraf 50 poser bliver solgt. Af de solgte poser er de 375 gule, og der er 55 gule poser tilbage. De øvrige poser er blå. Undersøg, om der er grundlag for at påstå, at farven på posen påvirker salget af kartofler. Undervejs skal du formulere de relevante hypoteser, kommentere på begreber som signifikansniveau og/eller p-værdi og forklare den anvendte metode.

12 Opgave 3: En dyrlæge har fået en mistanke om, at hunde af racen labrador har en større tendens til at udvikle allergi end andre hunderacer. (Bemærk! Fiktivt eksempel) Gennem det sidste år er der i klinikken blevet registret følgende undersøgelser og resultater af allergi hos hunde: Race \ allergi Ingen allergi Mild allergi Allergi Labrador 5 10 Schæfer Puddel Andet Spørgsmål 1: Opstil den relevante nulhypotese og den alternative hypotese for at undersøge, om der er uafhængighed mellem hunderace og udvikling af allergi? Spørgsmål : Udregn tabellen med de forventede værdier. Spørgsmål 3: Vil det være rimeligt at bruge en χ -fordeling til at vurdere teststørrelsen her? Hvis ikke, hvordan kan man så komme videre med undersøgelsen? En anden anvendelse af χ testet. Danmarks statistiks opgørelse af indkomstfordelingen for personer over 15 år i Danmark år 007 viser følgende billede: I=Indkomst i 1000 kr. % af befolkning I<50 50 I< I< I<00 00 I< I< I< I En markedsanalytiker har foretaget en undersøgelse af 1000 personers kendskab til et særdeles kostbart fladskærmsprodukt, men efterfølgende er der opstået tvivl om udvælgelsen af stikprøven, der er forgået som interviewundersøgelse over et par dage i et lokalt supermarked. Det frygtes, at stikprøven har fået for mange respondenter med i de lavere indkomstklasser. Heldigvis er der blevet spurgt om folks indkomst, så man kan lave et test for, om indkomstfordelingen i stikprøven synes at komme fra et specielt segment af befolkningen og altså dermed ikke at have den samme fordeling som indkomstfordelingen i Danmark. Hvis det er tilfældet, kan man nemlig ikke generalisere undersøgelsens resultat til hele befolkningen.

13 Indkomstfordelingen i stikprøven var: Observerede antal: I=Indkomst i 1000 kr. Antal i stikprøven I< I< I< I<00 00 I< I< I< I Modellen er følgende: Sandsynligheden for, at en tilfældig udvalgt person over 15 år tilhører en given indkomstklasse, er givet ved den procentdel af befolkningen, der tilhører denne klasse ifølge Danmarks statistiks indkomstfordeling. Sandsynligheden for, at en tilfældig udvalgt person har en indkomst på mindre end kr. om året er fx Hypotesen H 0 er, at vores stikprøve har en indkomstfordeling, der er den samme som den danske befolknings. 10 Hvis vores stikprøve skal repræsentere en tilfældig stikprøve på den danske befolkning, så vil vi derfor forvente, at 1000*0.064 personer har en indkomst på mindre end kr. På den måde kan vi som før beregne, hvor mange vi vil forvente i hver af de 8 indkomstkategorier: Forventede antal under udgangshypotesen: I=Indkomst i 1000 kr. Antal i stikprøven I<50 50 I< I< I<00 00 I< I< I< I Hypoteserne kan skrives. H 0 : Indkomstfordelingen i stikprøven adskiller sig ikke signifikant fra indkomstfordelingen i populationen. H 1 : Indkomstfordelingen i stikprøven er signifikant anderledes end indkomstfordelingen i populationen. Teststørrelsen udregnes på samme vis som før ved at summere alle indkomstgrupper. Dvs. vi får: ( obs. antal forv. antal) forv. antal over χ (98 64) (88 93) ( ) (136 13) (10 43) ( ) (5 66) (38 53) = = Det skal endnu engang understreges, at for at sikre repræsentativitet af en stikprøve så skal man følge de korrekte udvælgelesesmetoder og altså undgå denne form for conveinience sampling.

14 Teststørrelsen er denne gang χ fordelt med 7 frihedsgrader. (Beregnes som antallet af indkomstgrupper minus 1). Vores matematiker kan fortælle os, at med et signifikansniveau på 5 % skal vi forkaste udgangshypotesen, når teststørrelsen er større end 14.07, og på 1% signifikansniveau, når den er større end P-værdien for testet er for alle praktiske formåls skyld 0. Vi kan altså konkludere, at indkomstfordelingen i stikprøven afviger signifikant fra den generelle indkomstfordeling i Danmark, og at markedsanalytikeren skulle have fulgt reglerne for indsamling af repræsentative stikprøver. Opgaver: Opgave 1: Du har en mistanke om, at en af dine venner har en falsk terning. Derfor har du i al hemmelighed noteret udfaldet af alle vedkommendes kast med terningen gennem en hel aftens spil. Dine optegnelser viser, at terningen er endt på 1 i alt 5 gange, i alt 4 gange, 3 i alt 5 gange, 4 i alt 6 gange, 5 i alt 5 gange og 6 i alt 13 gange. Giver dine observationer anledning til at din mistanke bestyrkes? Du forventes at argumentere ud fra statistiske hypoteser og test, med berøring af begreber som signifikans og/eller p-værdi. Desuden forventes du at kommentere, hvilke konsekvenser du vil lade den statistiske analyse få i den konkrete problemstilling. Opgave : En mindre restaurant med et menukort bestående af 5 forskellige, men faste menuer plejer at have følgende ordrefordeling på disse: menu 1: 30 %, menu : 5 %, menu 3: 0 %, menu 4: 15 % og menu 5: 10 %. Restauranten foretager sine indkøb for at imødegå en efterspørgsel, der følger dette mønster. Imidlertid er man flere gange i den seneste tid løbet tør for menu 5, og man ønsker at afgøre, om det er en tilfældighed, eller om man skal revidere indkøbsplanerne. I den seneste uge har man haft 543 gæster. Af disse bestilte 15 menu 1, 101 bestilte menu, 110 bestilte menu 3, 91 bestilte menu 4 og 89 bestilte menu 5. Skal man revidere indkøbsplanerne? Litteratur: 1. J. Burt & G. Barber. Elementary Statistics for Geographers. The Guildford press.. P. Newbold. Statistics for Business and Economics. Prentice Hall International Editions. 3. P. Mortensen. Repræsentative undersøgelser. Systime. 4. H.J. Beck, H.C. Hansen, A. Jørgensen, L.Ø. Petersen, P. Bollerslev. Matematik i læreruddannelsen. Gyldendals Uddannelse.

Løs nu opgaverne i a) brug alt materialet her samt evt. regnearkene i Fronter som hjælp.

Løs nu opgaverne i a) brug alt materialet her samt evt. regnearkene i Fronter som hjælp. Udarbejdet af Thomas Jensen og Morten Overgård Nielsen Indhold Introduktion til materialet. s. 2 Introduktion til chi i anden test. s. 4 Et eksempel hastighed og ulykker på motorveje s. 8 Sådan udregnes

Læs mere

KURSUSMATERIALE TIL DET NYE STATISTIKPENSUM

KURSUSMATERIALE TIL DET NYE STATISTIKPENSUM KURSUSMATERIALE TIL DET NYE STATISTIKPENSUM Det foreliggende udkast til kursusmateriale er lagt ud til orientering for kollegerne med henblik på at indhente kommentarer til materialet. Sammen med Susanne

Læs mere

Personlig stemmeafgivning

Personlig stemmeafgivning Ib Michelsen X 2 -test 1 Personlig stemmeafgivning Efter valget i 2005 1 har man udspurgt en mindre del af de deltagende, om de har stemt personligt. Man har svar fra 1131 mænd (hvoraf 54 % har stemt personligt

Læs mere

Vejledende eksamensopgaver vedr. hypotesetest (stx B og stx A)

Vejledende eksamensopgaver vedr. hypotesetest (stx B og stx A) Vejledende eksamensopgaver vedr. hypotesetest (stx B og stx A) Opgave 1 I nedenstående tabel ses resultaterne af samtlige hjerteklapoperationer i 007-08 ved Odense Universitetshospital (OUH) sammenlignet

Læs mere

MATEMATIK A-NIVEAU. Anders Jørgensen & Mark Kddafi. Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012

MATEMATIK A-NIVEAU. Anders Jørgensen & Mark Kddafi. Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012 MATEMATIK A-NIVEAU Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012 Kapitel 4 Statistik & sandsynlighedsregning 2016 MATEMATIK A-NIVEAU Vejledende eksempler på eksamensopgaver

Læs mere

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0 Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt

Læs mere

Workshop i hypotesetest

Workshop i hypotesetest Workshop i hypotesetest Indholdsfortegnelse: Velkommen til TI-Nspire CAS version 3.2 Simple øvelser i chi2-test: Chi2-test I: Goodness-of-fit test side 1 Chi2-test II: Uafhængighedstest side 3 Vejledende

Læs mere

Maple 11 - Chi-i-anden test

Maple 11 - Chi-i-anden test Maple 11 - Chi-i-anden test Erik Vestergaard 2014 Indledning I dette dokument skal vi se hvordan Maple kan bruges til at løse opgaver indenfor χ 2 tests: χ 2 - Goodness of fit test samt χ 2 -uafhængighedstest.

Læs mere

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05 Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

c) For, er, hvorefter. Forklar.

c) For, er, hvorefter. Forklar. 1 af 13 MATEMATIK B hhx Udskriv siden FACITLISTE TIL KAPITEL 7 ØVELSER ØVELSE 1 c) ØVELSE 2 og. Forklar. c) For, er, hvorefter. Forklar. ØVELSE 3 c) ØVELSE 4 90 % konfidensinterval: 99 % konfidensinterval:

Læs mere

Hypotesetests, fejltyper og p-værdier

Hypotesetests, fejltyper og p-værdier Hypotesetests, fejltyper og p-værdier Søren Højsgaard Institut for Matematiske Fag, Aalborg Universitet October 25, 2018 Søren Højsgaard Institut for Matematiske Fag, Aalborg Hypotesetests, Universitet

Læs mere

J E T T E V E S T E R G A A R D

J E T T E V E S T E R G A A R D BINOMIALT EST J E T T E V E S T E R G A A R D F I P B I O L O G I M A R S E L I S B O R G G Y M N A S I U M D. 1 3. M A R T S 2 0 1 9 K A L U N D B O R G G Y M N A S I U M D. 1 4. M A R T S 2 0 1 9 HVEM

Læs mere

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele Anvendt Statistik Lektion 4 Hypotesetest generelt Test for middelværdi Test for andele Hypoteser og Test Hypotese I statistik er en hypotese en påstand om en populationsparameter. Typisk en påstand om

Læs mere

Værktøjshjælp for TI-Nspire CAS Struktur for appendiks:

Værktøjshjælp for TI-Nspire CAS Struktur for appendiks: Værktøjshjælp for TI-Nspire CAS Struktur for appendiks: Til hvert af de gennemgåede værktøjer findes der 5 afsnit. De enkelte afsnit kan læses uafhængigt af hinanden. Der forudsættes et elementært kendskab

Læs mere

Statistik II 1. Lektion. Analyse af kontingenstabeller

Statistik II 1. Lektion. Analyse af kontingenstabeller Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af

Læs mere

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test.

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test. Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ -test og Goodness of Fit test. Anvendelser af statistik Statistik er et levende og fascinerende emne, men at læse om det er alt

Læs mere

Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Dagens tema: Indfør centrale statistiske begreber. Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i

Læs mere

Flemmings Maplekursus 1. Løsning af ligninger

Flemmings Maplekursus 1. Løsning af ligninger Flemmings Maplekursus 1. Løsning af ligninger a) Ligninger med variabel og kun en løsning. Ligningen løses 10 3 Hvis vi ønsker løsningen udtrykt som en decimalbrøk i stedet: 3.333333333 Løsningen 3 er

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Uafhængighedstestet Eksempel: Bissau data Data kommer fra Guinea-Bissau i Vestafrika: 5273 børn blev undersøgt da de var yngre end 7 mdr og blev

Læs mere

2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900.

2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900. 2 -fordeling og 2 -test Generelt om 2 -fordelingen 2 -fordelingen er en kontinuert fordeling, modsat binomialfordelingen som er en diskret fordeling. Fordelingen er særdeles kompleks at beskrive med matematiske

Læs mere

for matematik pä B-niveau i hf

for matematik pä B-niveau i hf for matematik pä B-niveau i hf 75 50 5 016 Karsten Juul GRUPPEREDE DATA 1.1 Hvad er deskriptiv statistik?...1 1. Hvad er grupperede og ugrupperede data?...1 1.1 Eksempel pä ugrupperede data...1 1. Eksempel

Læs mere

En intro til radiologisk statistik. Erik Morre Pedersen

En intro til radiologisk statistik. Erik Morre Pedersen En intro til radiologisk statistik Erik Morre Pedersen Hypoteser og testning Statistisk signifikans 2 x 2 tabellen og lidt om ROC Inter- og intraobserver statistik Styrkeberegning Konklusion Litteratur

Læs mere

Kapitel 8 Chi-i-anden (χ 2 ) prøven

Kapitel 8 Chi-i-anden (χ 2 ) prøven Kapitel 8 Chi-i-anden (χ 2 ) prøven Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 19 Indledning Forskelle mellem stikprøver undersøges med z-test eller t-test for data målt på

Læs mere

Forelæsning 9: Inferens for andele (kapitel 10)

Forelæsning 9: Inferens for andele (kapitel 10) Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau... Indhold 1 Statistisk inferens: Hypotese og test 2 1.1 Nulhypotese - alternativ.................................. 2 1.2 Teststatistik........................................ 3 1.3 P-værdi..........................................

Læs mere

Estimation og konfidensintervaller

Estimation og konfidensintervaller Statistik og Sandsynlighedsregning STAT kapitel 4.4 Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne Estimation og konfidensintervaller Antag X Bin(n,

Læs mere

Dagens program. Praktisk information: Husk evalueringer af kurset

Dagens program. Praktisk information: Husk evalueringer af kurset Dagens program Praktisk information: Husk evalueringer af kurset Hypoteseprøvning kap. 11.1-11.3 Fokastelsesområdet kap. 11.1 Type I og Type II fejl kap. 11.1 Styrkefunktionen kap. 11.2 Stikprøvens størrelse

Læs mere

Betinget fordeling Uafhængighed. Beregning af forventet tabel Chi-kvadrat teststatistik Chi-kvadrat test. Chi-kvadratfordelingen Agresti - Summary

Betinget fordeling Uafhængighed. Beregning af forventet tabel Chi-kvadrat teststatistik Chi-kvadrat test. Chi-kvadratfordelingen Agresti - Summary 1 Kontingenstabeller Betinget fordeling Uafhængighed 2 Chi-kvadrat test for uafhængighed Beregning af forventet tabel Chi-kvadrat teststatistik Chi-kvadrat test. Chi-kvadratfordelingen Agresti - Summary

Læs mere

CMU PROJEKT HYPOTESETEST OG SIMULERING MICHAEL AGERMOSE JENSEN CHRISTIANSHAVNS GYMNASIUM

CMU PROJEKT HYPOTESETEST OG SIMULERING MICHAEL AGERMOSE JENSEN CHRISTIANSHAVNS GYMNASIUM CMU PROJEKT HYPOTESETEST OG SIMULERING MICHAEL AGERMOSE JENSEN CHRISTIANSHAVNS GYMNASIUM FORMÅL - BEKENDTGØRELSEN STX MATEMATIK A Kompetencer anvende simple statistiske eller sandsynlighedsteoretiske modeller

Læs mere

Statistik viden eller tilfældighed

Statistik viden eller tilfældighed MATEMATIK i perspektiv Side 1 af 9 DNA-analyser 1 Sandsynligheden for at en uskyldig anklages Følgende histogram viser, hvordan fragmentlængden for et DNA-område varierer inden for befolkningen. Der indgår

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Vejledende besvarelser til opgaver i kapitel 14

Vejledende besvarelser til opgaver i kapitel 14 Vejledende besvarelser til opgaver i kapitel 14 Opgave 1 a) Det første trin i opstillingen af en hypotesetest er at formulere to hypoteser, hvoraf den ene støtter den teori vi vil teste, mens den anden

Læs mere

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau Hvad skal vi lave? 1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ. Teststatistik P-værdi Signifikansniveau 2 t-test for middelværdi Tosidet t-test for middelværdi Ensidet t-test for middelværdi

Læs mere

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136 Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 36 Det er besværligt at regne med binomialfordelingen, og man vælger derfor ofte at bruge en approksimation med normalfordeling. Man

Læs mere

Susanne Ditlevsen Institut for Matematiske Fag susanne

Susanne Ditlevsen Institut for Matematiske Fag    susanne Statistik og Sandsynlighedsregning 1 STAT kapitel 4.4 Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne 7. undervisningsuge, mandag 1 Estimation og konfidensintervaller

Læs mere

Preben Blæsild og Jens Ledet Jensen

Preben Blæsild og Jens Ledet Jensen χ 2 Test Preben Blæsild og Jens Ledet Jensen Institut for Matematisk Fag Aarhus Universitet Egå Gymnasium, December 2010 Program 8.15-10.00 Forelæsning 10.15-12.00 Statlab: I arbejder, vi cirkler rundt

Læs mere

Statistik i basketball

Statistik i basketball En note til opgaveskrivning jerome@falconbasket.dk 4. marts 200 Indledning I Falcon og andre klubber er der en del gymnasieelever, der på et tidspunkt i løbet af deres gymnasietid skal skrive en større

Læs mere

Kønsproportion og familiemønstre.

Kønsproportion og familiemønstre. Københavns Universitet Afdeling for Anvendt Matematik og Statistik Projektopgave forår 2005 Kønsproportion og familiemønstre. Matematik 2SS Inge Henningsen februar 2005 Indledning I denne opgave undersøges,

Læs mere

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007 Rettevejledning til eksamen i Kvantitative metoder 1,. årsprøve. januar 007 I rettevejledningen henvises der til Berry and Lindgren "Statistics Theory and methods"(b&l) hvis ikke andet er nævnt. Opgave

Læs mere

Fagligt samspil mellem Ma-B og SA-A Lisbeth Basballe, Mariagerfjord Gymnasium og Marianne Kesselhahn, Egedal Gymnasium og HF

Fagligt samspil mellem Ma-B og SA-A Lisbeth Basballe, Mariagerfjord Gymnasium og Marianne Kesselhahn, Egedal Gymnasium og HF Fagligt samspil mellem Ma-B og SA-A Lisbeth Basballe, Mariagerfjord Gymnasium og Marianne Kesselhahn, Egedal Gymnasium og HF Vi ønskede at planlægge og afprøve et undervisningsforløb, hvor anvendelse af

Læs mere

En intro til radiologisk statistik

En intro til radiologisk statistik En intro til radiologisk statistik Erik Morre Pedersen Hypoteser og testning Statistisk signifikans 2 x 2 tabellen og lidt om ROC Inter- og intraobserver statistik Styrkeberegning Konklusion Litteratur

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan

Læs mere

1 Problemformulering CYKELHJELM

1 Problemformulering CYKELHJELM 1 Problemformulering I skal undersøge hvor mange cyklister, der kommer til skade og hvor alvorlige, deres skader er. I skal finde ud af, om cykelhjelm gør nogen forskel, hvis man kommer ud for en ulykke.

Læs mere

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up

Læs mere

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet Matematik A Studentereksamen Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet stx11-matn/a-080501 Tirsdag den 8. maj 01 Forberedelsesmateriale til stx A Net MATEMATIK Der

Læs mere

Skriftlig eksamen i samfundsfag

Skriftlig eksamen i samfundsfag OpenSamf Skriftlig eksamen i samfundsfag Indholdsfortegnelse 1. Introduktion 2. Præcise nedslag 3. Beregninger 3.1. Hvad kan absolutte tal være? 3.2. Procentvis ændring (vækst) 3.2.1 Tolkning af egne beregninger

Læs mere

Produkt og marked - matematiske og statistiske metoder

Produkt og marked - matematiske og statistiske metoder Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring

Læs mere

Schweynoch, 2003. Se eventuelt http://www.mathematik.uni-kassel.de/~fathom/projekt.htm.

Schweynoch, 2003. Se eventuelt http://www.mathematik.uni-kassel.de/~fathom/projekt.htm. Projekt 8.5 Hypotesetest med anvendelse af t-test (Dette materiale har været anvendt som forberedelsesmateriale til den skriftlige prøve 01 for netforsøget) Indhold Indledning... 1 χ -test... Numeriske

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

for matematik pä B-niveau i hf

for matematik pä B-niveau i hf for matematik pä B-niveau i hf 014 Karsten Juul TEST 1 StikprÅver... 1 1.1 Hvad er populationen?... 1 1. Hvad er stikpråven?... 1 1.3 Systematiske fejl ved valg af stikpråven.... 1 1.4 TilfÇldige fejl

Læs mere

χ 2 -test i GeoGebra Jens Sveistrup, Gammel Hellerup Gymnasium

χ 2 -test i GeoGebra Jens Sveistrup, Gammel Hellerup Gymnasium χ 2 -test i GeoGebra Jens Sveistrup, Gammel Hellerup Gymnasium Man kan nemt lave χ 2 -test i GeoGebra både goodness-of-fit-test og uafhængighedstest. Den følgende vejledning bygger på GeoGebra version

Læs mere

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning

Læs mere

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning

Læs mere

Velkommen til Flemmings store Maplekursus 1. lektion. Skift mellem tekst- og matematikmode

Velkommen til Flemmings store Maplekursus 1. lektion. Skift mellem tekst- og matematikmode Velkommen til Flemmings store Maplekursus 1. lektion. Skift mellem tekst- og matematikmode Man kan skifte mellem tekst- og matemamatikmode ved at trykke på F5. I øjeblikket er jeg i tekstmode.. 2. lektion.

Læs mere

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede

Læs mere

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Kapitel 7 Forskelle mellem centraltendenser

Kapitel 7 Forskelle mellem centraltendenser Kapitel 7 Forskelle mellem centraltendenser Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 29 Indledning 1. z-test for ukorrelerede data 2. t-test for ukorrelerede data med ens

Læs mere

Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller

Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller Statistik II 1. Lektion Sandsynlighedsregning Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller

Læs mere

Et statistisk test er en konfrontation af virkelighenden (data) med en teori (model).

Et statistisk test er en konfrontation af virkelighenden (data) med en teori (model). Hypotesetests, fejltyper og p-værdier og er den nu også det? Søren Højsgaard Institut for Matematiske Fag, Aalborg Universitet (updated: 2019-03-17) 1 / 40 Statistisk test Et statistisk test er en konfrontation

Læs mere

WORKSHOP 2C, DLF-kursus, Krogerup, 26. november 2015

WORKSHOP 2C, DLF-kursus, Krogerup, 26. november 2015 WORKSHOP 2C, DLF-kursus, Krogerup, 26. november 2015 At I får overblik over statistik og sandsynlighed som fagområde i folkeskolen indblik i didaktiske forskeres anbefalinger til undervisningen i statistik

Læs mere

Mikro-kursus i statistik 1. del. 24-11-2002 Mikrokursus i biostatistik 1

Mikro-kursus i statistik 1. del. 24-11-2002 Mikrokursus i biostatistik 1 Mikro-kursus i statistik 1. del 24-11-2002 Mikrokursus i biostatistik 1 Hvad er statistik? Det systematiske studium af tilfældighedernes spil!dyrkes af biostatistikere Anvendes som redskab til vurdering

Læs mere

Teoretisk Statistik, 2. december 2003. Sammenligning af poissonfordelinger

Teoretisk Statistik, 2. december 2003. Sammenligning af poissonfordelinger Uge 49 I Teoretisk Statistik, 2. december 2003 Sammenligning af poissonfordelinger o Generel teori o Sammenligning af to poissonfordelinger o Eksempel Opsummering om multinomialfordelinger Fishers eksakte

Læs mere

Note til styrkefunktionen

Note til styrkefunktionen Teoretisk Statistik. årsprøve Note til styrkefunktionen Først er det vigtigt at gøre sig klart, at når man laver statistiske test, så kan man begå to forskellige typer af fejl: Type fejl: At forkaste H

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 Indledning 2 Ensidet variansanalyse 3 Blokforsøg 4 Vekselvirkning 1 Indledning 2 Ensidet

Læs mere

Fig. 1 Billede af de 60 terninger på mit skrivebord

Fig. 1 Billede af de 60 terninger på mit skrivebord Simulation af χ 2 - fordeling John Andersen Introduktion En dag kastede jeg 60 terninger Fig. 1 Billede af de 60 terninger på mit skrivebord For at danne mig et billede af hyppighederne flyttede jeg rundt

Læs mere

Løsning til eksaminen d. 29. maj 2009

Løsning til eksaminen d. 29. maj 2009 DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Mikro-kursus i statistik 2. del Mikrokursus i biostatistik 1

Mikro-kursus i statistik 2. del Mikrokursus i biostatistik 1 Mikro-kursus i statistik 2. del 24-11-2002 Mikrokursus i biostatistik 1 Hvad er hypotesetestning? I sundhedsvidenskab:! Hypotesetestning = Test af nulhypotesen Hypotese-testning anvendes til at vurdere,

Læs mere

Spørgeskemaundersøgelser og databehandling

Spørgeskemaundersøgelser og databehandling DASG. Nye veje i statistik og sandsynlighedsregning. side 1 af 12 Spørgeskemaundersøgelser og databehandling Disse noter er udarbejdet i forbindelse med et tværfagligt samarbejde mellem matematik og samfundsfag

Læs mere

for gymnasiet og hf 2016 Karsten Juul

for gymnasiet og hf 2016 Karsten Juul for gymnasiet og hf 75 50 5 016 Karsten Juul Statistik for gymnasiet og hf Ä 016 Karsten Juul 4/1-016 Nyeste version af dette håfte kan downloades fra http://mat1.dk/noter.htm HÅftet mç benyttes i undervisningen

Læs mere

for gymnasiet og hf 2017 Karsten Juul

for gymnasiet og hf 2017 Karsten Juul for gymnasiet og hf 75 50 5 017 Karsten Juul Statistik for gymnasiet og hf 017 Karsten Juul 5/11-017 Nyeste version af dette hæfte kan downloades fra http://mat1.dk/noter.htm Hæftet må benyttes i undervisningen

Læs mere

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger Program Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Analyse af ikke-parrede stikprøver: repetition of rettelse af fejl! Lidt

Læs mere

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data Faculty of Life Sciences Program t-test Hypoteser, teststørrelser og p-værdier Claus Ekstrøm E-mail: ekstrom@life.ku.dk Resumé og hængepartier fra sidst. Eksempel: effekt af foder på hormonkoncentration

Læs mere

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

1 Sammenligning af 2 grupper Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver... 2

1 Sammenligning af 2 grupper Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver... 2 Indhold 1 Sammenligning af 2 grupper 2 1.1 Responsvariabel og forklarende variabel......................... 2 1.2 Afhængige/uafhængige stikprøver............................ 2 2 Sammenligning af 2 middelværdier

Læs mere

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se Epidemiologi og biostatistik. Uge, torsdag 5. februar 00 Morten Frydenberg, Institut for Biostatistik. Type og type fejl Statistisk styrke Nogle speciale metoder: Normalfordelte data : t-test eksakte sikkerhedsintervaller

Læs mere

Hvad skal vi lave? Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver

Hvad skal vi lave? Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver Hvad skal vi lave? 1 Sammenligning af 2 grupper Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver 2 Sammenligning af 2 middelværdier Uafhængige stikprøver Uafhængige stikprøver -

Læs mere

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M. Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet March 1, 2013 Sandsynlighedsregning og lagerstyring Normalfordelingen

Læs mere

Løsning til eksamen d.27 Maj 2010

Løsning til eksamen d.27 Maj 2010 DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1

Læs mere

At lave dit eget spørgeskema

At lave dit eget spørgeskema At lave dit eget spørgeskema 1 Lectio... 2 2. Spørgeskemaer i Google Docs... 2 3. Anvendelighed af din undersøgelse - målbare variable... 4 Repræsentativitet... 4 Fejlkilder: Målefejl - Systematiske fejl-

Læs mere

Kapitlet indledes med en beskrivelse af - og opgaver med - de tre former for sandsynlighed, som er omtalt i læseplanen for 7.- 9.

Kapitlet indledes med en beskrivelse af - og opgaver med - de tre former for sandsynlighed, som er omtalt i læseplanen for 7.- 9. Kapitlet indledes med en beskrivelse af - og opgaver med - de tre former for sandsynlighed, som er omtalt i læseplanen for 7.- 9. klassetrin: statistisk sandsynlighed, kombinatorisk sandsynlighed og personlig

Læs mere

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd I dag Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik SaSt) Helle Sørensen Først lidt om de sidste uger af SaSt. Derefter statistisk analyse af en enkelt

Læs mere

(Projektets første del er rent deskriptiv, mens anden del peger frem mod hypotesetest. Projektet kan gemmes til dette emne, eller tages op igen der)

(Projektets første del er rent deskriptiv, mens anden del peger frem mod hypotesetest. Projektet kan gemmes til dette emne, eller tages op igen der) Projekt 2.4 Menneskets proportioner (Projektets første del er rent deskriptiv, mens anden del peger frem mod hypotesetest. Projektet kan gemmes til dette emne, eller tages op igen der) I. Deskriptiv analyse

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Indledende om Signifikanstest Boldøvelser

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Indledende om Signifikanstest Boldøvelser Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Indledende om Signifikanstest Boldøvelser 1 Påstand: Et nyt præparat M virker mod migræne. Inden præparatet kan markedsføres, skal denne påstand

Læs mere

χ 2 test Formål med noten... 2 Goodness of fit metoden (GOF)... 2 1) Eksempel 1 er stikprøven repræsentativ for køn? (1 frihedsgrad)...

χ 2 test Formål med noten... 2 Goodness of fit metoden (GOF)... 2 1) Eksempel 1 er stikprøven repræsentativ for køn? (1 frihedsgrad)... χ Indhold Formål med noten... Goodness of fit metoden (GOF)... 1) Eksempel 1 er stikprøven repræsentativ for køn? (1 frihedsgrad)... ) χ -fordelingerne (fordelingsfunktionernes egenskaber)... 6 3) χ -

Læs mere

Normalfordelingen og Stikprøvefordelinger

Normalfordelingen og Stikprøvefordelinger Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger

Læs mere

Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1

Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1 Statistik Formålet... 1 Mindsteværdi... 1 Størsteværdi... 1 Ikke grupperede observationer... 2 Median og kvartiler defineres ved ikke grupperede observationer således:... 2 Middeltal defineres ved ikke

Læs mere

I. Deskriptiv analyse af kroppens proportioner

I. Deskriptiv analyse af kroppens proportioner Projektet er delt i to, og man kan vælge kun at gennemføre den ene del. Man kan vælge selv at frembringe data, fx gennem et samarbejde med idræt eller biologi, eller man kan anvende de foreliggende data,

Læs mere

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større

Læs mere

Risikofaktorudviklingen i Danmark fremskrevet til 2020

Risikofaktorudviklingen i Danmark fremskrevet til 2020 23. marts 9 Arbejdsnotat Risikofaktorudviklingen i Danmark fremskrevet til Udarbejdet af Knud Juel og Michael Davidsen Baseret på data fra Sundheds- og sygelighedsundersøgelserne er der ud fra køns- og

Læs mere

Løsning til opgave 7, 9, 10 og 11C Matematik B Sommer 2014

Løsning til opgave 7, 9, 10 og 11C Matematik B Sommer 2014 Vejledning til udvalgte opgave fra Matematik B, sommer 2014 Opgave 7 Størrelsen og udbudsprisen på 100 fritidshuse på Rømø er indsamlet via boligsiden.dk. a) Grafisk præsentation, der beskriver fordelingen

Læs mere

Basal statistik for sundhedsvidenskabelige forskere, efterår 2014 Udleveret 30. september, afleveres senest ved øvelserne i uge 44 (

Basal statistik for sundhedsvidenskabelige forskere, efterår 2014 Udleveret 30. september, afleveres senest ved øvelserne i uge 44 ( Hjemmeopgave Basal statistik for sundhedsvidenskabelige forskere, efterår 2014 Udleveret 30. september, afleveres senest ved øvelserne i uge 44 (28.-30. oktober) En stor undersøgelse søger at afdække forhold

Læs mere