χ 2 test Formål med noten... 2 Goodness of fit metoden (GOF) ) Eksempel 1 er stikprøven repræsentativ for køn? (1 frihedsgrad)...

Transkript

1 χ Indhold Formål med noten... Goodness of fit metoden (GOF)... 1) Eksempel 1 er stikprøven repræsentativ for køn? (1 frihedsgrad)... ) χ -fordelingerne (fordelingsfunktionernes egenskaber) ) χ - en ) Eksempel - er partierne gået tilbage? (3 frihedsgrader) ) Øvelse 1 Er befolkningen i Hillerød repræsentativ for hele Danmark? ) Øvelse er karakterfordelingen i. den samme som på landsplan? ) Goodness of fit med en hurtigere metode ) Goodness of Fit oversigt ) Hypotesening... 0 χ - for uafhængighed mellem to inddelingskriterier... 10) METODE 1: Den teoretiske løsningsmetode... 11) METODE : den hurtige løsningsmetode ) Projekt... 7 Appendix Nspire kommandoer til χ side 1 af 9 sider

2 Formål med noten I forbindelse med skriftlig eksamen skal du kunne bruge χ - (læses: ki i anden ) på to måder. Dels skal du kunne undersøge om en forelagt fordeling (de observerede data) følger en i forvejen kendt fordeling (de forventede værdier, kendt fra en større statistisk undersøgelse eller en teoretisk model). Denne undersøgelse kaldes goodness of fit og er det første disse noter handler om. Dels skal du kunne afgøre om nogle observationer er uafhængige. Det kan du læse om i den sidste del af disse noter. For at kunne forstå noterne skal du inden have sat dig ind i begreberne uafhængighed i sandsynlighedsregning, og du skal kende til kontinuerte fordelinger. Noterne til Goodness of Fit er lavet på baggrund af et notesæt af Jakob Bøje Pedersen, Frederiksborg Gymnasium og HF. Noterne er resultatet af et arbejde på DASG kurset IT i matematik, oktober 011, og er udarbejdet af Mikkel Nielsen, Falkonergården, Bente Quorning, Karen Gøtzsche-Larsen, Ishak Gürleyik og Eva Danielsen Nærum Gymnasium. Til kapitlet om χ- fordelinger hører en fil med opgaver i Nspire. Goodness of fit metoden (GOF) 1) Eksempel 1 er stikprøven repræsentativ for køn? (1 frihedsgrad) Vi starter med et eksempel. De forskellige begreber uddybes teoretisk efterfølgende. Fordelingen af kvinder og mænd i befolkningen antages at være henholdsvis 51% og 49%. Denne fordeling skal også kunne findes i en stikprøve, hvis undersøgelsen skal kunne betegnes som repræsentativ med hensyn til køn. Antag at vi i forbindelse med en statistiskundersøgelse har en stikprøve på 186 personer. Vi vil så undersøge om de 186 personer fordeler sig over køn på samme måde som populationen (den danske befolkning). Nulhypotese (H 0 ): Vi antager at stikprøven på 186 er repræsentativ for befolkningen. Dvs. at den afvigelse fra befolkningens kønsfordeling, som vi har i stikprøven er så lille, at det kan forklares ud fra tilfældig variation. Signifikansniveau: Vi vælger et signifikansniveau på 5%. Dvs., at vi vil forkaste hypotesen, hvis vores beregning viser, at en så usandsynlig stikprøve højest vil optræde i 5% af tilfældene. Dvs. hvis sandsynligheden for at vores stikprøve forekommer, er under 5% på betingelse af vores nulhypotese, så betragter vi det som så usandsynlig en stikprøve, at vi vil forkaste hypotesen. Vores stikprøve har vist følgende observationer: Køn Kvinder Mænd Sum Observerede antal side af 9 sider

3 Ud fra hele befolkningens kønsfordeling vil vi forvente: Køn Kvinder Mænd Sum Forventede antal = = Vi beregner χ størrelsen: χ χ = ( obsantal forvantal ) forv antal ( ) ( ) = + = = Jo større afvigelsen er mellem de observerede og de forventede værdier, jo større er χ størrelsen. Vi vil gerne vide hvor (u-)sandsynlig vores χ størrelse er. Frihedsgrader: For at kunne vurdere denne sandsynlighed skal vi kende antallet af frihedsgrader. Da vi kender observationssættets størrelse (vi stopper stikprøven, når vi har 186 personer), kan vi beregne antallet af kvinder, hvis vi kender antallet af mænd (eller omvendt). Man siger derfor statistisk, at der er én frihedsgrad. Hvis vi kalder antallet af kriterier for k (mand hhv. kvinde) kan vi beregne antallet af frihedsgrader som f = k 1 = 1 = 1. Vi skal nu vurdere størrelsen. Statistikere har vist, at χ størrelsen med stor tilnærmelse følger en såkaldt χ fordeling med 1 frihedsgrad (se næste kapitel). Fordelingen er vist grafisk nedenfor. P(χ -størelse > 3.17) =0.075 Vi er interesseret i at udregne tallet som er arealet under grafen fra 3.17 til. Vi kan slå dette areal op med en kommando i Nspire: side 3 af 9 sider

4 Ovenfor er vist en af de måder, man kan finde den kumulerede χ fordeling. Efter klikket på 8: χ Cdf får man følgende menu: Her vil vi gerne indtaste vores χ -værdi, 3.17, som nedre grænse og uendelig som øvre grænse. Det lete er i den øvre grænse at indtaste et stort tal og dernæst i kommando-linjen rette det store tal til uendelig ved hjælp af symbol-palletten: Cdf står for Cumulated Density Function (kumuleret tæthedsfunktion). Resultatet kaldes p-værdien eller -sandsynligheden og viser, at der er 7.5% sandsynlighed for at få en χ -værdi på 3.17 eller derover ved en tilfældig stikprøve med en frihedsgrad på 1. Da p-værdien er større end signifikansniveauet accepteres hypotesen, stikprøven er altså repræsentativ med hensyn til køn. Bemærk at p-værdien (7,5 %) er tæt på signifikansniveau 5% dvs. resultatet af en er usikkert og bør undersøges nærmere (stikprøven bør være større end 186). Populært sagt, er p-værdien et udtryk for nulhypotesens troværdighed og med en troværdighed på 7.5 % kan vi ikke afvise nulhypotesen. Hvis vi havde skullet forkaste nulhypotesen, så kunne vi se på de enkelte bidrag til χ -værdien, der så at sige viser, hvem den skyldige er, ud fra hvilket bidrag, der er størst. Her er de to bidrag på hhv og 1.6 næsten lige store, så man kan ikke skyde skylden på den ene part mere end den anden. side 4 af 9 sider

5 Hvor stor en χ -værdi kunne vi have accepteret? Det kan vi undersøge ved at spørge, ved hvilken x-værdi er arealet under grafen fra x til 5%? Vi skal bruge en kommando i samme menu-kæde som før, bare et trin under sidste kommando: Eller man indtaster kommandoen direkte som invchi(0.95,1). Uanset om man taster eller henter fra menuen får vi:. Der står 0.95 og ikke 0.05 fordi Nspire finder den x- værdi, hvor arealet under grafen fra 0 til x er den indtastede værdi. (Fra kontinuerte fordelinger husker vi, at det samlede areal er 1.) Resultatet viser, at der er 5% sandsynlighed for at få en χ -værdi på 3.84 eller højere. Hvis Nspire ikke havde haft den inverse kommando indbygget kunne man have løst problemet med nsolve:. χ Cdf kan indtastes som chicdf( ). side 5 af 9 sider

6 ) χ -fordelingerne (fordelingsfunktionernes egenskaber) Lad T være en stokastisk variabel, der kan være positiv eller 0. Vi siger, at T følger en χ -fordeling med f frihedsgrader (f er fordelingens parameter), hvis sandsynligheden for, at T har værdier i et bestemt interval, kan beregnes med den pågældende χ -fordeling. Hvis vi kalder frekvensfunktionen, også kaldet tæthedsfunktionen, for en χ -fordeling med f frihedsgrader for g f, kan sandsynligheden for, at T har værdier mellem a og b, beregnes som og hvor frekvensfunktionen er givet ved b P( a T b) = g ( x) dx, hvor 0 a b 0.5 f x x e dx 0 a 0.5 f 1 0.5x x e g ( x) =, hvor x 0 f f Nævneren i frekvensfunktionen er en konstant, der afhænger af f og som sikrer, at arealet under grafen for er 1. Herunder til venstre ses graferne for f-værdierne 1,, 4 og 6. P(a T b) er altså lig med arealet mellem x-aksen og grafen for fra x = a til x = b (se figuren ovenfor til højre). Vi siger, at P( T 5) beregnes som det bestemte integral af g f (x) med nedre grænse og øvre grænse 5. I Nspire kaldes frekvensfunktionerne for χ -fordelingerne for chipdf(x,f). Sandsynligheden P(a T b) beregnes som chicdf(a,b,f). side 6 af 9 sider

7 I de følgende opgaver skal I bruge Nspire-filen: chigrafer.tns. Opgaverne ligger som forskellige opgaver (faner i filen). I hver opgave skal I sikre jer at I får alle delspørgsmål med. (Se scroll-baren) Nspire opgave 1 I opgaven er frekvensfunktionerne g(x,f) defineret og grafen for f = 1 er indtegnet nederst til venstre. Brug g(x,f) til at indtegne graferne for f = og 3 i grafvinduet til venstre. I højre grafvindue indtegner du de tilsvarene grafer tegnet vha. chipdf(x,f). Sammenlign graferne er der forskelle? Blev de tegnet lige hurtigt? Nspire opgave Åbn opgave i Nspire-filen. Løs opgaven, der handler om arealet under graferne for frekvensfunktionerne. I har nu observeret, at P(0 T < ) = 1, da arealet under hele grafen er 1. Dette svarer til, at summen af alle sandsynlighederne er 1 i en fordeling med et endeligt antal udfald. Nspire opgave 3 I denne opgave skal du prøve at beregne sandsynligheder både a) ved beregning med invchi(areal, f), b) med arealet under grafen c) ved at løse en ligning. Nspire opgave 4 (ekstra) Om fordelingsfunktioner Frekvensfunktionerne har en række egenskaber, som du skal undersøge i den næste opgave. Nspire opgave 5 I denne opgave skal du undersøge frekvensfunktionernes maksimum og middelværdi Nspire opgave 6 Man kan her let skifte mellem de forskellige frekvensfunktioner. Prøv selv side 7 af 9 sider

8 3) χ - en Hypotesen om at to fordelinger er ens er rimelig, hvis de forventede værdier {forv antal,1, forv antal,,...} er tæt på de observerede værdier {obs antal,1, obs antal,, }. Derfor ser man på forskellen mellem disse værdier i χ -en. Forskellen kvadreres ( obs ) antal forvantal så bidragene altid er positive, uanset om obs antal,i er større eller mindre end forv antal,i. Dette udtryk for forskellen mellem obs antal,i og forv antal,i ses i forhold til den forventede værdi forv antal,i. Således giver det god mening at se på størrelsen: ( obs forv ) χ antal antal =. forvantal χ er tilnærmelsesvist χ -fordelt med f = (k 1) frihedsgrader (når vi kender det observerede antal for k 1 kriterier og det totale antal, kender vi det observerede antal for alle k kriterier). Tilnærmelsen er rimelig, hvis n 60 og forv antal,min 5. Her er n det samlede antal observationer, og forv antal,min er den laveste forventede værdi for et bestemt kriterium. Når man i det konkrete eksempel har beregnet værdien af størrelsen χ, skal man så forkaste eller acceptere hypotesen. En stor værdi af χ vil føre til forkastelse af hypotesen, mens en lille værdi af χ vil føre til accept af hypotesen. Om χ er lille eller stor afgøres ved hjælp af p- værdien, som sammenlignes med et signifikansniveau på (typisk) 5%. Hvis vi antager at hypotesen er sand, er p-værdien sandsynligheden for at få en værdi, der passer mindst lige så dårligt med hypotesen som χ -størrelsen. Det vil sige p-værdien er sandsynligheden for at få en χ - størrelse, der er større end χ. p-værdi = P(χ -størrelse χ ), hvor χ -størrelse er χ -fordelt med (k 1) frihedsgrader Hvis p-værdien er over 5% accepteres hypotesen og hvis p-værdien er under 5% forkastes hypotesen. (Med mindre man har valgt et andet signifikans-niveau). Vi betragter grafen for frekvensfunktionen for χ (3) til højre: Tallet χ aflæses på x-aksen og p-værdien = g ( ) 3 x dx aflæses χ som arealet af området mellem x-aksen og grafen for x [ χ ; [. side 8 af 9 sider

9 Her er g 3 som tidligere nævnt givet ved: x x e g ( x) =, hvor x x x e dx 0 Hvis vi lader χ (nedre grænse) vokse ser vi at p-værdien (arealet) bliver mindre. Vi har at - hvis χ er stor er p-værdien lille. - hvis χ er lille er p-værdien stor. 4) Eksempel - er partierne gået tilbage? (3 frihedsgrader) Vi ser på en situation, hvor der kun er 4 politiske partier at stemme på, og hvor de 4 partier ved sidste valg fik stemmeprocenterne: AA:7%, BB:16%, CC:39% og DD:18%. Ved en rundspørge blandt 1000 tilfældigt valgte vælgere fås hyppighederne: AA:60, BB:170, CC:430 og DD:140. Vi vil e om procentfordelingen har ændret sig. Nul-hypotesen, H 0 : procentfordelingen har ikke ændret sig. Signifikansniveau = 5% Observationer i stikprøven: Partier AA BB CC DD sum Observerede antal Forventede Observationer Partier AA BB CC DD sum Forventede antal = Bidrag til χ størrelsen: (60-70) /70 = Bemærk at forv antal,min er større end 5. Antallet af frihedsgrader: f = k-1 = 4 1 = 3. side 9 af 9 sider

10 χ størrelsen: ( obsantal forvantal ) χ = = = forv antal Fordelingen: Lad χ være værdien for χ størrelsen i en ny stikprøve med 1000 personer dvs. vi forventer at fordelingen af χ er en χ (3)-fordeling, altså en χ fordeling med 3 frihedsgrader Observationssættets p-værdi: ( χ 13.99) ( ) % p = P = g x dx = = I Nspire ser beregningen således ud: Da p-værdien er mindre end signifikansniveauet forkastes hypotesen, dvs. det er rimeligt at antage, at procentfordelingen har ændret sig. Vi ser, at det specielt er ændringerne for partierne CC og DD, der førte til forkastelse af hypotesen. Der er blevet væsentligt flere, der stemmer på DD, og væsentligt færre der stemmer på CC. side 10 af 9 sider

11 5) Øvelse 1 Er befolkningen i Hillerød repræsentativ for hele Danmark? Hypotese, H 0 : Hillerød har samme fordeling som hele landet mht. befolkningens oprindelse. For hele landet er befolkningen fordelt på følgende måde: 90.% er af dansk oprindelse, 7.47% er indvandrere og.31% er efterkommere af indvandrere. Udfyld de tomme felter nedenfor: Signifikansniveau:. Oprindelse Personer af dansk oprindelse Indvandrer Efterkommer Af indvandrer sum Hillerød Observeret Forventet antal Bidrag til χ - størrelse Teststørrelsen: χ -størrelse = (formel) = ( tal) Antal kriterier: k = Antal frihedsgrader: f = Teststørrelsen følger fordelingen: side 11 af 9 sider

12 p-værdien = P( ) = g( x) dx = = p-værdien betyder at Konklusion = 6) Øvelse er karakterfordelingen i. den samme som på landsplan? En gymnasieklasse (. ) har opnået følgende beståede standpunktskarakterer i foråret 011: karakter sum Antal i Fordeling på landsplan 10% 5% 30% 5% 10% 100% Forventede antal Bidrag til χ - størrelse Undersøg om. s karakterer har samme fordeling som fordelingen på landsplan ved at lave en Goodness of Fit. side 1 af 9 sider

13 7) Goodness of fit med en hurtigere metode I det følgende gennemregner vi eksempel fra side 9 igen dog kan vi komme frem til p-værdien noget hurtigere ved at benytte os af de indbyggede for Goodness of fit. Vi havde følgende situation: 4 partier havde ved sidste valg opnået stemmeprocenterne: AA:7%, BB:16%, CC:39% og DD:18%. Ved en rundspørge blandt 1000 tilfældigt valgte vælgere fås hyppighederne AA:60, BB:170, CC:430 og DD:140. Vi vil e om procentfordelingen har ændret sig. Nul-hypotesen: procentfordelingen har ikke ændret sig. Signifikansniveau = 5% Vi starter med at skrive stikprøvens observationer ind i et regneark bemærk at man kan skrive tekst i regnearket ved at bruge anførelsestegn: Vi kan nu udregne de forventede observationer ved i det grå formel felt at skrive: = procent*1000 Du skulle nu gerne have følgende oversigt over vores stikprøve: side 13 af 9 sider

14 I menuen Data kan vi via undermenuen kombinationsdiagram få tegnet et cirkeldiagram over vores observationer: I skal højreklik på jeres søjlediagram og vælge Cirkeldiagram Ved at stille jer i regnearket igen, kan I også frembringe et cirkeldiagram Over jeres forventede værdier: side 14 af 9 sider

15 Sammenholder vi de observerede hyppigheder med de forventede følges de så nogenlunde ad? Vi observerer de mest markante ændringer hos partierne CC og DD. Vi skal nu undersøge om de observerede forskelle er signifikante. Følger den observerede fordeling den forventede? Vi åbner en noteside og frembringer et matematikfelt (control M), herefter går vi via menuen Beregninger frem til undermenuen Der fremkommer nu en hjælpemenu, man skal udfylde husk at antallet af frihedsgrader er 3: Nu får vi frembragt alle de væsentligste parametre til at udtale os om Nulhypotesen: side 15 af 9 sider

16 P værdien er på 0.9 % og vi kan da forkaste Nulhypotesen (på 5 %-niveauet). dvs. det er rimeligt at antage, at procentfordelingen har ændret sig. Vi kan frembringe de enkelte partiers bidrag til talletχ = ved at åbne en mathboks. Derefter vælger vi Var i menubjælken foroven og under Var vælger vi Stat.values : Vi opnår følgende oversigt: De enkelte bidrag til χ fås frem med kommandoen: Vi ser at partiet AA bidrager med 0.37, BB bidrager med 0.63, CC bidrager med 4.10 og endelig bidrager DD med 8.89 til tallet χ = Testen bekræfter vores observation fra cirkeldiagrammet - synderne til denne holdningsændring blandt vælgerne er partierne CC og DD. side 16 af 9 sider

17 Vi kunne også foretage selve en i regnearket på følgende måde: Gå tilbage til siden med regnearket. Ved hjælp af control 4 og control 6 kan du skille dine sider ad og samle dem igen Stil dig i en celle og find frem til undermenuen for Goodness of Fit en Vi udfylder nu den fremkomne hjælpemenu på følgende måde husk at sætte hak ved Tegn, hvis du ønsker at den grafiske illustration skal med: Vi får nu udført hele en fra Lister og Regneark - vi får ydermere en grafisk illustration af en. side 17 af 9 sider

18 Bemærk, at vi ikke kan se det kritiske område, da vores tal er Arealet under grafen fra x=13.99 til uendelig er kun arealet er så småt, at vi ikke kan se skraveringen af arealet under grafen for frekvensfunktionen. side 18 af 9 sider

19 8) Goodness of Fit oversigt Goodness of Fit Goodness of Fit en anvendes til at undersøge om en forelagt fordeling (de observerede værdier) følger en i forvejen kendt fordeling (de forventede værdier). Hypotesen om at disse to fordelinger er ens es med en χ -, idet de observerede værdier opstilles i en 1 k-tabel (Obs-tabellen), hvor k er antallet af udfald/kategorier kriterie-1 kriterie- kriterie-k I alt Observerede antal obs antal,1 obs antal, obs antal,k N Forventede antal forv antal,1 forv antal, forv antal,k N Bidrag til χ Bidrag 1 Bidrag Bidrag k χ Hypotesen er at populationen følger en i forvejen kendt fordelingen af de k svar. Lader vi p 1, p...,p k være sandsynligheden for hver af de k svar, så er de forventede værdier forv antal,i = n p i Vores størrelse beregnes som ( obsantal forvantal ) χ = forv Om denne størrelse ved vi at fordelingen af χ er en χ (k-1)-fordeling, hvis alle de forventede værdier er mindst 5 og n > 60. Hvis sandsynligheden for at få en observation med endnu større afvigelse er under et signifikansniveau på 0.05 vil vi forkaste hypotesen. antal side 19 af 9 sider

20 9) Hypotesening Når vi ønsker at e en hypotese, udfører vi et stokastisk eksperiment. Ud fra det vi observerer (de observerede værdier/observationssættet), vil vi vurdere, om hypotesen kan forkastes eller accepteres. På dette grundlag kan vi ikke afgøre om en hypotese er sand eller falsk, derfor skal man være påpasselig med sit ordvalg. Får vi en observation, der passer dårligt med hypotesen, er det ikke sikkert, at den er falsk. Derfor bruger man formuleringen: "hypotesen forkastes" og med det mener vi, at det er rimeligt, at hypotesen er falsk. Får vi en observation, der passer godt med hypotesen, er det ikke sikkert, at den er sand. Derfor bruger man formuleringen: "hypotesen accepteres" og med det mener vi, at det er rimeligt, at hypotesen er sand. Til en statistisk hører en størrelse T, det vil sige en stokastisk variabel der beskriver observationssættet. I ene i dette notat er størrelse T altid χ fordelt. Teststørrelse T skal rangordne alle mulige observationssæt efter, hvor godt de passer til hypotesen. Ved hjælp af størrelse beregnes p-værdien, som er sandsynligheden for, at vi i et nyt eksperiment får et observationssæt, der passer mindst lige så dårligt med hypotesen, som det observationssæt, som vi har observeret p-værdien beregnes under antagelse af at hypotesen er sand. Bogstavet p står for det engelske ord "probability", der betyder sandsynlighed. I χ en vil vi kalde den beregnede værdi af størrelsen for T beregnet. De observationssæt, der passer mindst lige så dårligt med hypotesen som vores observationssæt, har T-værdier, der er mindst lige så store som T beregnet. Det vil sige, at p-værdien = P(T T beregnet ), hvor T er χ fordelt. Endelig skal vi ud fra p-værdien vurdere, om hypotesen skal forkastes eller accepteres. Der findes intet logisk matematisk grundlag, der entydigt fortæller os, hvornår vi skal forkaste eller acceptere en hypotese. Det er et af de steder i statistikken, hvor det bliver lidt løst/subjektivt. Hvis p-værdien er lille, er observationen ekstrem i forhold til hypotesen, dvs. hypotesen kan forkastes. Hvis p-værdien derimod er stor, er observationen ikke ekstrem i forhold til hypotesen, dvs. hypotesen accepteres. Grænsen mellem en lille (hypotesen forkastes) og en stor (hypotesen accepteres) p-værdi kaldes for signifikansniveauet. Signifikant betyder "betydelig" eller "ikke ubetydelig" underforstået grænsen mellem en ubetydelig effekt og en betydelig effekt. Signifikansniveauet bør fastlægges før observationen fra det stokastiske eksperiment kendes. Vi siger, at vi er hypotesen på et 5% signifikansniveau og mener, at hvis p-værdien er under 5%, vil vi forkastes hypotesen, dvs. der er en signifikant effekt (en betydelig effekt). side 0 af 9 sider

21 Man anvender ofte et signifikansniveau på 5% (eller 1%), men der er ikke nogen logisk grund til denne værdi, den er nærmest blevet en tradition. Man kan sige, at jo større signifikansniveauet bliver, jo nemmere er det at få forkastet hypotesen (og det er ofte, det der er interessant), men hermed bliver det også nemmere at forkaste en sand hypotese, hvilket man kalder fejl af type 1. Fejl af type er når en falsk hypotese accepteres. For at få styr på begreben kan vi betragte en tabel over på den ene side hypotesens sandhedsværdi og på den anden side resultatet af en: Hypotesen sand falsk Accepterer fejl af type Forkaster fejl af type 1 I vores retssystem kan vi arbejde med fejl af type 1 og type. Hypotesen er, at en mand er uskyldig. Fejl af type 1, er når manden dømmes, men er uskyldig (den sande hypotese forkastes). Fejl af type er, når manden frifindes og er skyldig (den falske hypotese accepteres). I retssystemet er det altid anklageren, der har bevisbyrden, og dette er for at mindske risikoen for at dømme en uskyldig (fejl af type 1). Hvis en kvinde tager en graviditets er hypotesen, at hun ikke er gravid. Fejl af type 1 opstår, hvis prøven er positiv, når hun ikke er gravid og fejl af type opstår, hvis prøven er negativ, når hun er gravid. side 1 af 9 sider

22 χ - for uafhængighed mellem to inddelingskriterier - Tosidet eller χ way En anden måde at bruge χ - er ved undersøgelser af uafhængighed. Vi kan f.eks. spørge om farveblindhed afhænger af køn. Vi vil så spørge en stor gruppe mennesker om deres køn og om de er farveblinde. Hvis andelen af farveblinde kvinder er lige så stor som andelen af farveblinde mænd afhænger farveblindhed ikke af køn. I praksis vil de to andele sjældent være præcis lige store (selvom der var tale om uafhængige hændelser), fordi de statistiske tilfældigheder i stikprøven påvirker resultatet. Derfor har vi igen brug for en måde at e, hvorvidt variationerne er store nok til at vi afviser vores nulhypotese (at farveblindhed ikke afhænger af køn). I det følgende vil vi demonstrere, hvordan man laver en χ - for uafhængighed i Nspire.Vi vil tage udgangspunkt i den følgende opgave: En forretningskæde vil undersøge, om farven på indpakningen af nye slik påvirker salget. Butikken sælger derfor i en periode poser med samme slags slik, alle med 50 g/pose og til samme pris. Der bliver i alt sendt 600 poser slik ud i butikkerne, hvoraf 50 bliver solgt. Af de solgte poser er 375 gule, og der er 55 gule poser tilbage. De øvrige poser er blå. Undersøg, om der er grundlag for at påstå, at farven påvirker salget af slik. Vi vil gennemgå to løsningsmetoder. 1) Den første metode baseres og forklares ud fra teorien om χ -. ) Den anden metode er en hurtig it-baseret løsningsmetode Resultaterne i de to metoder sammenlignes og analyseres. 10) METODE 1: Den teoretiske løsningsmetode Hypoteser og signifikansniveau: Vi begynde med at opstille en tabel i Lister og regneark af de observerede data ud fra de informationer vi får i opgavebeskrivelsen. Observerede data: side af 9 sider

23 Bemærk, at vi, udover de givne data med solgte og usolgte poser, tilføjer en række og en kolonne med summering af tallene. De to inddelingskriterier er hhv. farven på poserne og salg af slik. Vi opstiller en nulhypotese, som vi vil undersøge: H 0 : Der er uafhængighed mellem farven på poser og salg af slik. Dvs. vi antager, at farverne ikke har indflydelse på salget, og at variationer i salget mellem gule og blå poser kun skyldes tilfældigheder. Før vi går i gang med at e vores nulhypotese, vælger vi at fastsætte signifikansniveauet til 5%. Vi antager, at størrelsen følger en χ -fordeling med 1 frihedsgrad. Frihedsgraden beregnes som (antal rækker 1 ).(antal kolonner -1). Vi ser her bort fra summeringslisterne. Her er frihedsgraden (-1) (-1) = 1. Beregning af χ -størrelsen: For at beregne χ -størrelsen, skal vi først beregne de forventede værdier under antagelse af, at der er uafhængighed. Beregningseksempel: Hvis salget ikke afhænger af farven forventer vi ifølge definitionen for uafhængighed, at det forventede antal solgte gule poser samlet antal solgte poser summen af gule poser = samlet antal poser Derfor får vi: summen af gule poser det forventede antal solgte gule poser = i (samlet antal solgte poser) samlet antal poser 430 det forventede antal solgte gule poser = i Beregning af forventede observationer: side 3 af 9 sider

24 Opgave. a) Skriv selv formlerne op for de øvrige tre beregningsfelter og gennemfør beregningerne i N- spire. b) Lav derefter sumkontrollerne og kontroller at tallene stemmer overens med summerne (kolonne i_alt ) i de observerede data. For at beregne χ -størrelsen indsættes i formlen ( obsantal forvantal ) χ = forv antal Når vi indsætter de beregnede tal i tabellen kommer udtrykket nu til at se således ud (Bemærk, at vi definerer χ -størrelsen med det samme, så den kan bruges til at beregne sandsynligheden p.) Vi har nu beregnet χ -størrelsen til at være 0.39 (to betydende cifre). Vi vil nu prøve at illustrere betydningen af dette tal. På figuren har vi tegnet frekvensfunktionen for en χ -fordeling med frihedsgrad 1. I Nspire tastes i funktionsfeltet:. Vi har endvidere markeret den kritiske mængde svarende til et signifikansniveau på 5% (Dvs. at det skraverede areal udgør 5% af det samlede areal under kurven). side 4 af 9 sider

25 Hvis vores størrelse havde ligget i det skraverede område, altså været større end 3.84, så skulle vi have forkastet vores nulhypotese H 0. Men vores størrelse er kun 0.39, så vi kan ikke på det foreliggende grundlag forkaste hypotesen. Altså må vi formode, at salget af slik er uafhængig af farven på slikposerne. Grænsetilfældet svarende til et signifikansniveau på 5% kan beregnes i N-spire ved hjælp af den inverse funktion til χ -fordelingen. For at lave beregningen skal man først angive acceptmængden (1 den kritiske mængde, her = 0.95) dernæst antallet af frihedsgrader. Beregning af sandsynligheden For at færdiggøre vores undersøgelse, vil vi nu beregne den til størrelsen hørende sandsynlighed p. Beregningen foretages i N-spire med fordelingsfunktion for χ -fordelingen (den kumulerede). (Hvis man ikke har defineret sin størrelse, så kan man naturligvis bare indsætte den beregnede talværdi i stedet for.) Grafisk svarer sandsynligheden p til arealet under kurven for frekvensfunktionen til højre for størrelsen. p-værdien repræsenterer dermed nulhypotesens troværdighed. Den er her beregnet til 53.4 % og dvs., at den ligger langt over et signifikansniveau på 5 %. Dette understøtter derfor det tidligere udsagn om at sliksalget må formodes at være uafhængigt af farven på poserne. 11) METODE : den hurtige løsningsmetode Datamaterialet i vores opgave om slik er tosidet, da der i opgaven er to inddelingskriterier (farver og salg). I praksis betyder det, at tosidet data kan opskrives i en tabel med mindst to rækker og to kolonner. Til beregning af χ -størrelse og sandsynlighed, kan man anvende den beregningsfunktion i N-spire, som hedder χ -vejs. Først skal de givne data defineres som en matrix i Notefeltet. side 5 af 9 sider

26 Herefter anvendes en χ -vejs til beregning For at få vist resultaterne af beregningerne skrives stat.results i en Math Box. I resultatboksen kan man nu aflæse χ -størrelsen som 0.39 og χ sandsynligheden p til 53.4%. Man kan ved hjælp af kommandoen stat.compmatrix få de enkelte bidrag til tallet frem. Så kan man lettere få et overblik over de skyldige i vores undersøgelse. Herefter skal man naturligvis huske at skrive en konklusion i forhold til nulhypotesen. Da vores χ -størrelse kun er 0.39, kan vi ikke på det foreliggende grundlag forkaste hypotesen. Altså må vi formode at salget af slik er uafhængig af farven på slikposerne. p-værdien, der repræsenterer nulhypotesens troværdighed, er her beregnet til 53.4% og dvs. at den ligger langt over et signifikansniveau på 5%. Dette understøtter derfor det tidligere udsagn om at sliksalget må formodes at være uafhængig af farven på poserne. Når man sammenligner de to metoder, ser man til sin store glæde, at der er overensstemmelse mellem de beregnede resultater side 6 af 9 sider

27 1) Projekt Gruppestørrelser: 3 mands grupper. Elevtid: 5 timer Materialebrug: Hver gruppe medbringer selv: poser Haribos vingummibamser og to små eller en stor pose M&M s, de små kulørte chokoladeknapper. Produktkrav: Der ønskes en besvarelse af nedenstående opgaver. CASE: Den lille chokoladefabrik Sukkertop fra Chokoland, ikke så fjernt fra Kokosland tæt på Ækvator, har haft stor succes i deres eget land og har ønsker om at ekspandere på det globale marked. De har hørt om et firma kaldet Haribo, i det skønne land Danmark, der laver verdens lækreste, blødeste og mest velsmagende vingummibamser dem kunne Sukkertop godt tænke sig at fusionere med. Du bliver ansat som kvalitetskonsulent og skal gå Haribo i sømmene. Du får tre opgaver: 1. Firmaet Sukkertop har ikke rigtig forstået, hvordan man kan e om en givet observation følger en given forventet fordeling. Du skal med egne ord forklare, hvad en Goodness of fit går ud på du skal undervejs forklare de begreber du anvender i din redegørelse. (Forklaringerne må gerne flettes sammen med nedenstående opgaver). I en pose af Haribos vingummibamser er der bamser i fem forskellige farver. På Haribos hjemmeside kan man læse at en pose indeholder: 1/6 hvide guldbamser 1/6 orange guldbamser 1/3 røde guldbamser 1/6 grønne guldbamser 1/6 gule guldbamser side 7 af 9 sider

Vis mere