χ 2 test Formål med noten... 2 Goodness of fit metoden (GOF) ) Eksempel 1 er stikprøven repræsentativ for køn? (1 frihedsgrad)...
|
|
- Mathilde Steensen
- 8 år siden
- Visninger:
Transkript
1 χ Indhold Formål med noten... Goodness of fit metoden (GOF)... 1) Eksempel 1 er stikprøven repræsentativ for køn? (1 frihedsgrad)... ) χ -fordelingerne (fordelingsfunktionernes egenskaber) ) χ - en ) Eksempel - er partierne gået tilbage? (3 frihedsgrader) ) Øvelse 1 Er befolkningen i Hillerød repræsentativ for hele Danmark? ) Øvelse er karakterfordelingen i. den samme som på landsplan? ) Goodness of fit med en hurtigere metode ) Goodness of Fit oversigt ) Hypotesening... 0 χ - for uafhængighed mellem to inddelingskriterier... 10) METODE 1: Den teoretiske løsningsmetode... 11) METODE : den hurtige løsningsmetode ) Projekt... 7 Appendix Nspire kommandoer til χ side 1 af 9 sider
2 Formål med noten I forbindelse med skriftlig eksamen skal du kunne bruge χ - (læses: ki i anden ) på to måder. Dels skal du kunne undersøge om en forelagt fordeling (de observerede data) følger en i forvejen kendt fordeling (de forventede værdier, kendt fra en større statistisk undersøgelse eller en teoretisk model). Denne undersøgelse kaldes goodness of fit og er det første disse noter handler om. Dels skal du kunne afgøre om nogle observationer er uafhængige. Det kan du læse om i den sidste del af disse noter. For at kunne forstå noterne skal du inden have sat dig ind i begreberne uafhængighed i sandsynlighedsregning, og du skal kende til kontinuerte fordelinger. Noterne til Goodness of Fit er lavet på baggrund af et notesæt af Jakob Bøje Pedersen, Frederiksborg Gymnasium og HF. Noterne er resultatet af et arbejde på DASG kurset IT i matematik, oktober 011, og er udarbejdet af Mikkel Nielsen, Falkonergården, Bente Quorning, Karen Gøtzsche-Larsen, Ishak Gürleyik og Eva Danielsen Nærum Gymnasium. Til kapitlet om χ- fordelinger hører en fil med opgaver i Nspire. Goodness of fit metoden (GOF) 1) Eksempel 1 er stikprøven repræsentativ for køn? (1 frihedsgrad) Vi starter med et eksempel. De forskellige begreber uddybes teoretisk efterfølgende. Fordelingen af kvinder og mænd i befolkningen antages at være henholdsvis 51% og 49%. Denne fordeling skal også kunne findes i en stikprøve, hvis undersøgelsen skal kunne betegnes som repræsentativ med hensyn til køn. Antag at vi i forbindelse med en statistiskundersøgelse har en stikprøve på 186 personer. Vi vil så undersøge om de 186 personer fordeler sig over køn på samme måde som populationen (den danske befolkning). Nulhypotese (H 0 ): Vi antager at stikprøven på 186 er repræsentativ for befolkningen. Dvs. at den afvigelse fra befolkningens kønsfordeling, som vi har i stikprøven er så lille, at det kan forklares ud fra tilfældig variation. Signifikansniveau: Vi vælger et signifikansniveau på 5%. Dvs., at vi vil forkaste hypotesen, hvis vores beregning viser, at en så usandsynlig stikprøve højest vil optræde i 5% af tilfældene. Dvs. hvis sandsynligheden for at vores stikprøve forekommer, er under 5% på betingelse af vores nulhypotese, så betragter vi det som så usandsynlig en stikprøve, at vi vil forkaste hypotesen. Vores stikprøve har vist følgende observationer: Køn Kvinder Mænd Sum Observerede antal side af 9 sider
3 Ud fra hele befolkningens kønsfordeling vil vi forvente: Køn Kvinder Mænd Sum Forventede antal = = Vi beregner χ størrelsen: χ χ = ( obsantal forvantal ) forv antal ( ) ( ) = + = = Jo større afvigelsen er mellem de observerede og de forventede værdier, jo større er χ størrelsen. Vi vil gerne vide hvor (u-)sandsynlig vores χ størrelse er. Frihedsgrader: For at kunne vurdere denne sandsynlighed skal vi kende antallet af frihedsgrader. Da vi kender observationssættets størrelse (vi stopper stikprøven, når vi har 186 personer), kan vi beregne antallet af kvinder, hvis vi kender antallet af mænd (eller omvendt). Man siger derfor statistisk, at der er én frihedsgrad. Hvis vi kalder antallet af kriterier for k (mand hhv. kvinde) kan vi beregne antallet af frihedsgrader som f = k 1 = 1 = 1. Vi skal nu vurdere størrelsen. Statistikere har vist, at χ størrelsen med stor tilnærmelse følger en såkaldt χ fordeling med 1 frihedsgrad (se næste kapitel). Fordelingen er vist grafisk nedenfor. P(χ -størelse > 3.17) =0.075 Vi er interesseret i at udregne tallet som er arealet under grafen fra 3.17 til. Vi kan slå dette areal op med en kommando i Nspire: side 3 af 9 sider
4 Ovenfor er vist en af de måder, man kan finde den kumulerede χ fordeling. Efter klikket på 8: χ Cdf får man følgende menu: Her vil vi gerne indtaste vores χ -værdi, 3.17, som nedre grænse og uendelig som øvre grænse. Det lete er i den øvre grænse at indtaste et stort tal og dernæst i kommando-linjen rette det store tal til uendelig ved hjælp af symbol-palletten: Cdf står for Cumulated Density Function (kumuleret tæthedsfunktion). Resultatet kaldes p-værdien eller -sandsynligheden og viser, at der er 7.5% sandsynlighed for at få en χ -værdi på 3.17 eller derover ved en tilfældig stikprøve med en frihedsgrad på 1. Da p-værdien er større end signifikansniveauet accepteres hypotesen, stikprøven er altså repræsentativ med hensyn til køn. Bemærk at p-værdien (7,5 %) er tæt på signifikansniveau 5% dvs. resultatet af en er usikkert og bør undersøges nærmere (stikprøven bør være større end 186). Populært sagt, er p-værdien et udtryk for nulhypotesens troværdighed og med en troværdighed på 7.5 % kan vi ikke afvise nulhypotesen. Hvis vi havde skullet forkaste nulhypotesen, så kunne vi se på de enkelte bidrag til χ -værdien, der så at sige viser, hvem den skyldige er, ud fra hvilket bidrag, der er størst. Her er de to bidrag på hhv og 1.6 næsten lige store, så man kan ikke skyde skylden på den ene part mere end den anden. side 4 af 9 sider
5 Hvor stor en χ -værdi kunne vi have accepteret? Det kan vi undersøge ved at spørge, ved hvilken x-værdi er arealet under grafen fra x til 5%? Vi skal bruge en kommando i samme menu-kæde som før, bare et trin under sidste kommando: Eller man indtaster kommandoen direkte som invchi(0.95,1). Uanset om man taster eller henter fra menuen får vi:. Der står 0.95 og ikke 0.05 fordi Nspire finder den x- værdi, hvor arealet under grafen fra 0 til x er den indtastede værdi. (Fra kontinuerte fordelinger husker vi, at det samlede areal er 1.) Resultatet viser, at der er 5% sandsynlighed for at få en χ -værdi på 3.84 eller højere. Hvis Nspire ikke havde haft den inverse kommando indbygget kunne man have løst problemet med nsolve:. χ Cdf kan indtastes som chicdf( ). side 5 af 9 sider
6 ) χ -fordelingerne (fordelingsfunktionernes egenskaber) Lad T være en stokastisk variabel, der kan være positiv eller 0. Vi siger, at T følger en χ -fordeling med f frihedsgrader (f er fordelingens parameter), hvis sandsynligheden for, at T har værdier i et bestemt interval, kan beregnes med den pågældende χ -fordeling. Hvis vi kalder frekvensfunktionen, også kaldet tæthedsfunktionen, for en χ -fordeling med f frihedsgrader for g f, kan sandsynligheden for, at T har værdier mellem a og b, beregnes som og hvor frekvensfunktionen er givet ved b P( a T b) = g ( x) dx, hvor 0 a b 0.5 f x x e dx 0 a 0.5 f 1 0.5x x e g ( x) =, hvor x 0 f f Nævneren i frekvensfunktionen er en konstant, der afhænger af f og som sikrer, at arealet under grafen for er 1. Herunder til venstre ses graferne for f-værdierne 1,, 4 og 6. P(a T b) er altså lig med arealet mellem x-aksen og grafen for fra x = a til x = b (se figuren ovenfor til højre). Vi siger, at P( T 5) beregnes som det bestemte integral af g f (x) med nedre grænse og øvre grænse 5. I Nspire kaldes frekvensfunktionerne for χ -fordelingerne for chipdf(x,f). Sandsynligheden P(a T b) beregnes som chicdf(a,b,f). side 6 af 9 sider
7 I de følgende opgaver skal I bruge Nspire-filen: chigrafer.tns. Opgaverne ligger som forskellige opgaver (faner i filen). I hver opgave skal I sikre jer at I får alle delspørgsmål med. (Se scroll-baren) Nspire opgave 1 I opgaven er frekvensfunktionerne g(x,f) defineret og grafen for f = 1 er indtegnet nederst til venstre. Brug g(x,f) til at indtegne graferne for f = og 3 i grafvinduet til venstre. I højre grafvindue indtegner du de tilsvarene grafer tegnet vha. chipdf(x,f). Sammenlign graferne er der forskelle? Blev de tegnet lige hurtigt? Nspire opgave Åbn opgave i Nspire-filen. Løs opgaven, der handler om arealet under graferne for frekvensfunktionerne. I har nu observeret, at P(0 T < ) = 1, da arealet under hele grafen er 1. Dette svarer til, at summen af alle sandsynlighederne er 1 i en fordeling med et endeligt antal udfald. Nspire opgave 3 I denne opgave skal du prøve at beregne sandsynligheder både a) ved beregning med invchi(areal, f), b) med arealet under grafen c) ved at løse en ligning. Nspire opgave 4 (ekstra) Om fordelingsfunktioner Frekvensfunktionerne har en række egenskaber, som du skal undersøge i den næste opgave. Nspire opgave 5 I denne opgave skal du undersøge frekvensfunktionernes maksimum og middelværdi Nspire opgave 6 Man kan her let skifte mellem de forskellige frekvensfunktioner. Prøv selv side 7 af 9 sider
8 3) χ - en Hypotesen om at to fordelinger er ens er rimelig, hvis de forventede værdier {forv antal,1, forv antal,,...} er tæt på de observerede værdier {obs antal,1, obs antal,, }. Derfor ser man på forskellen mellem disse værdier i χ -en. Forskellen kvadreres ( obs ) antal forvantal så bidragene altid er positive, uanset om obs antal,i er større eller mindre end forv antal,i. Dette udtryk for forskellen mellem obs antal,i og forv antal,i ses i forhold til den forventede værdi forv antal,i. Således giver det god mening at se på størrelsen: ( obs forv ) χ antal antal =. forvantal χ er tilnærmelsesvist χ -fordelt med f = (k 1) frihedsgrader (når vi kender det observerede antal for k 1 kriterier og det totale antal, kender vi det observerede antal for alle k kriterier). Tilnærmelsen er rimelig, hvis n 60 og forv antal,min 5. Her er n det samlede antal observationer, og forv antal,min er den laveste forventede værdi for et bestemt kriterium. Når man i det konkrete eksempel har beregnet værdien af størrelsen χ, skal man så forkaste eller acceptere hypotesen. En stor værdi af χ vil føre til forkastelse af hypotesen, mens en lille værdi af χ vil føre til accept af hypotesen. Om χ er lille eller stor afgøres ved hjælp af p- værdien, som sammenlignes med et signifikansniveau på (typisk) 5%. Hvis vi antager at hypotesen er sand, er p-værdien sandsynligheden for at få en værdi, der passer mindst lige så dårligt med hypotesen som χ -størrelsen. Det vil sige p-værdien er sandsynligheden for at få en χ - størrelse, der er større end χ. p-værdi = P(χ -størrelse χ ), hvor χ -størrelse er χ -fordelt med (k 1) frihedsgrader Hvis p-værdien er over 5% accepteres hypotesen og hvis p-værdien er under 5% forkastes hypotesen. (Med mindre man har valgt et andet signifikans-niveau). Vi betragter grafen for frekvensfunktionen for χ (3) til højre: Tallet χ aflæses på x-aksen og p-værdien = g ( ) 3 x dx aflæses χ som arealet af området mellem x-aksen og grafen for x [ χ ; [. side 8 af 9 sider
9 Her er g 3 som tidligere nævnt givet ved: x x e g ( x) =, hvor x x x e dx 0 Hvis vi lader χ (nedre grænse) vokse ser vi at p-værdien (arealet) bliver mindre. Vi har at - hvis χ er stor er p-værdien lille. - hvis χ er lille er p-værdien stor. 4) Eksempel - er partierne gået tilbage? (3 frihedsgrader) Vi ser på en situation, hvor der kun er 4 politiske partier at stemme på, og hvor de 4 partier ved sidste valg fik stemmeprocenterne: AA:7%, BB:16%, CC:39% og DD:18%. Ved en rundspørge blandt 1000 tilfældigt valgte vælgere fås hyppighederne: AA:60, BB:170, CC:430 og DD:140. Vi vil e om procentfordelingen har ændret sig. Nul-hypotesen, H 0 : procentfordelingen har ikke ændret sig. Signifikansniveau = 5% Observationer i stikprøven: Partier AA BB CC DD sum Observerede antal Forventede Observationer Partier AA BB CC DD sum Forventede antal = Bidrag til χ størrelsen: (60-70) /70 = Bemærk at forv antal,min er større end 5. Antallet af frihedsgrader: f = k-1 = 4 1 = 3. side 9 af 9 sider
10 χ størrelsen: ( obsantal forvantal ) χ = = = forv antal Fordelingen: Lad χ være værdien for χ størrelsen i en ny stikprøve med 1000 personer dvs. vi forventer at fordelingen af χ er en χ (3)-fordeling, altså en χ fordeling med 3 frihedsgrader Observationssættets p-værdi: ( χ 13.99) ( ) % p = P = g x dx = = I Nspire ser beregningen således ud: Da p-værdien er mindre end signifikansniveauet forkastes hypotesen, dvs. det er rimeligt at antage, at procentfordelingen har ændret sig. Vi ser, at det specielt er ændringerne for partierne CC og DD, der førte til forkastelse af hypotesen. Der er blevet væsentligt flere, der stemmer på DD, og væsentligt færre der stemmer på CC. side 10 af 9 sider
11 5) Øvelse 1 Er befolkningen i Hillerød repræsentativ for hele Danmark? Hypotese, H 0 : Hillerød har samme fordeling som hele landet mht. befolkningens oprindelse. For hele landet er befolkningen fordelt på følgende måde: 90.% er af dansk oprindelse, 7.47% er indvandrere og.31% er efterkommere af indvandrere. Udfyld de tomme felter nedenfor: Signifikansniveau:. Oprindelse Personer af dansk oprindelse Indvandrer Efterkommer Af indvandrer sum Hillerød Observeret Forventet antal Bidrag til χ - størrelse Teststørrelsen: χ -størrelse = (formel) = ( tal) Antal kriterier: k = Antal frihedsgrader: f = Teststørrelsen følger fordelingen: side 11 af 9 sider
12 p-værdien = P( ) = g( x) dx = = p-værdien betyder at Konklusion = 6) Øvelse er karakterfordelingen i. den samme som på landsplan? En gymnasieklasse (. ) har opnået følgende beståede standpunktskarakterer i foråret 011: karakter sum Antal i Fordeling på landsplan 10% 5% 30% 5% 10% 100% Forventede antal Bidrag til χ - størrelse Undersøg om. s karakterer har samme fordeling som fordelingen på landsplan ved at lave en Goodness of Fit. side 1 af 9 sider
13 7) Goodness of fit med en hurtigere metode I det følgende gennemregner vi eksempel fra side 9 igen dog kan vi komme frem til p-værdien noget hurtigere ved at benytte os af de indbyggede for Goodness of fit. Vi havde følgende situation: 4 partier havde ved sidste valg opnået stemmeprocenterne: AA:7%, BB:16%, CC:39% og DD:18%. Ved en rundspørge blandt 1000 tilfældigt valgte vælgere fås hyppighederne AA:60, BB:170, CC:430 og DD:140. Vi vil e om procentfordelingen har ændret sig. Nul-hypotesen: procentfordelingen har ikke ændret sig. Signifikansniveau = 5% Vi starter med at skrive stikprøvens observationer ind i et regneark bemærk at man kan skrive tekst i regnearket ved at bruge anførelsestegn: Vi kan nu udregne de forventede observationer ved i det grå formel felt at skrive: = procent*1000 Du skulle nu gerne have følgende oversigt over vores stikprøve: side 13 af 9 sider
14 I menuen Data kan vi via undermenuen kombinationsdiagram få tegnet et cirkeldiagram over vores observationer: I skal højreklik på jeres søjlediagram og vælge Cirkeldiagram Ved at stille jer i regnearket igen, kan I også frembringe et cirkeldiagram Over jeres forventede værdier: side 14 af 9 sider
15 Sammenholder vi de observerede hyppigheder med de forventede følges de så nogenlunde ad? Vi observerer de mest markante ændringer hos partierne CC og DD. Vi skal nu undersøge om de observerede forskelle er signifikante. Følger den observerede fordeling den forventede? Vi åbner en noteside og frembringer et matematikfelt (control M), herefter går vi via menuen Beregninger frem til undermenuen Der fremkommer nu en hjælpemenu, man skal udfylde husk at antallet af frihedsgrader er 3: Nu får vi frembragt alle de væsentligste parametre til at udtale os om Nulhypotesen: side 15 af 9 sider
16 P værdien er på 0.9 % og vi kan da forkaste Nulhypotesen (på 5 %-niveauet). dvs. det er rimeligt at antage, at procentfordelingen har ændret sig. Vi kan frembringe de enkelte partiers bidrag til talletχ = ved at åbne en mathboks. Derefter vælger vi Var i menubjælken foroven og under Var vælger vi Stat.values : Vi opnår følgende oversigt: De enkelte bidrag til χ fås frem med kommandoen: Vi ser at partiet AA bidrager med 0.37, BB bidrager med 0.63, CC bidrager med 4.10 og endelig bidrager DD med 8.89 til tallet χ = Testen bekræfter vores observation fra cirkeldiagrammet - synderne til denne holdningsændring blandt vælgerne er partierne CC og DD. side 16 af 9 sider
17 Vi kunne også foretage selve en i regnearket på følgende måde: Gå tilbage til siden med regnearket. Ved hjælp af control 4 og control 6 kan du skille dine sider ad og samle dem igen Stil dig i en celle og find frem til undermenuen for Goodness of Fit en Vi udfylder nu den fremkomne hjælpemenu på følgende måde husk at sætte hak ved Tegn, hvis du ønsker at den grafiske illustration skal med: Vi får nu udført hele en fra Lister og Regneark - vi får ydermere en grafisk illustration af en. side 17 af 9 sider
18 Bemærk, at vi ikke kan se det kritiske område, da vores tal er Arealet under grafen fra x=13.99 til uendelig er kun arealet er så småt, at vi ikke kan se skraveringen af arealet under grafen for frekvensfunktionen. side 18 af 9 sider
19 8) Goodness of Fit oversigt Goodness of Fit Goodness of Fit en anvendes til at undersøge om en forelagt fordeling (de observerede værdier) følger en i forvejen kendt fordeling (de forventede værdier). Hypotesen om at disse to fordelinger er ens es med en χ -, idet de observerede værdier opstilles i en 1 k-tabel (Obs-tabellen), hvor k er antallet af udfald/kategorier kriterie-1 kriterie- kriterie-k I alt Observerede antal obs antal,1 obs antal, obs antal,k N Forventede antal forv antal,1 forv antal, forv antal,k N Bidrag til χ Bidrag 1 Bidrag Bidrag k χ Hypotesen er at populationen følger en i forvejen kendt fordelingen af de k svar. Lader vi p 1, p...,p k være sandsynligheden for hver af de k svar, så er de forventede værdier forv antal,i = n p i Vores størrelse beregnes som ( obsantal forvantal ) χ = forv Om denne størrelse ved vi at fordelingen af χ er en χ (k-1)-fordeling, hvis alle de forventede værdier er mindst 5 og n > 60. Hvis sandsynligheden for at få en observation med endnu større afvigelse er under et signifikansniveau på 0.05 vil vi forkaste hypotesen. antal side 19 af 9 sider
20 9) Hypotesening Når vi ønsker at e en hypotese, udfører vi et stokastisk eksperiment. Ud fra det vi observerer (de observerede værdier/observationssættet), vil vi vurdere, om hypotesen kan forkastes eller accepteres. På dette grundlag kan vi ikke afgøre om en hypotese er sand eller falsk, derfor skal man være påpasselig med sit ordvalg. Får vi en observation, der passer dårligt med hypotesen, er det ikke sikkert, at den er falsk. Derfor bruger man formuleringen: "hypotesen forkastes" og med det mener vi, at det er rimeligt, at hypotesen er falsk. Får vi en observation, der passer godt med hypotesen, er det ikke sikkert, at den er sand. Derfor bruger man formuleringen: "hypotesen accepteres" og med det mener vi, at det er rimeligt, at hypotesen er sand. Til en statistisk hører en størrelse T, det vil sige en stokastisk variabel der beskriver observationssættet. I ene i dette notat er størrelse T altid χ fordelt. Teststørrelse T skal rangordne alle mulige observationssæt efter, hvor godt de passer til hypotesen. Ved hjælp af størrelse beregnes p-værdien, som er sandsynligheden for, at vi i et nyt eksperiment får et observationssæt, der passer mindst lige så dårligt med hypotesen, som det observationssæt, som vi har observeret p-værdien beregnes under antagelse af at hypotesen er sand. Bogstavet p står for det engelske ord "probability", der betyder sandsynlighed. I χ en vil vi kalde den beregnede værdi af størrelsen for T beregnet. De observationssæt, der passer mindst lige så dårligt med hypotesen som vores observationssæt, har T-værdier, der er mindst lige så store som T beregnet. Det vil sige, at p-værdien = P(T T beregnet ), hvor T er χ fordelt. Endelig skal vi ud fra p-værdien vurdere, om hypotesen skal forkastes eller accepteres. Der findes intet logisk matematisk grundlag, der entydigt fortæller os, hvornår vi skal forkaste eller acceptere en hypotese. Det er et af de steder i statistikken, hvor det bliver lidt løst/subjektivt. Hvis p-værdien er lille, er observationen ekstrem i forhold til hypotesen, dvs. hypotesen kan forkastes. Hvis p-værdien derimod er stor, er observationen ikke ekstrem i forhold til hypotesen, dvs. hypotesen accepteres. Grænsen mellem en lille (hypotesen forkastes) og en stor (hypotesen accepteres) p-værdi kaldes for signifikansniveauet. Signifikant betyder "betydelig" eller "ikke ubetydelig" underforstået grænsen mellem en ubetydelig effekt og en betydelig effekt. Signifikansniveauet bør fastlægges før observationen fra det stokastiske eksperiment kendes. Vi siger, at vi er hypotesen på et 5% signifikansniveau og mener, at hvis p-værdien er under 5%, vil vi forkastes hypotesen, dvs. der er en signifikant effekt (en betydelig effekt). side 0 af 9 sider
21 Man anvender ofte et signifikansniveau på 5% (eller 1%), men der er ikke nogen logisk grund til denne værdi, den er nærmest blevet en tradition. Man kan sige, at jo større signifikansniveauet bliver, jo nemmere er det at få forkastet hypotesen (og det er ofte, det der er interessant), men hermed bliver det også nemmere at forkaste en sand hypotese, hvilket man kalder fejl af type 1. Fejl af type er når en falsk hypotese accepteres. For at få styr på begreben kan vi betragte en tabel over på den ene side hypotesens sandhedsværdi og på den anden side resultatet af en: Hypotesen sand falsk Accepterer fejl af type Forkaster fejl af type 1 I vores retssystem kan vi arbejde med fejl af type 1 og type. Hypotesen er, at en mand er uskyldig. Fejl af type 1, er når manden dømmes, men er uskyldig (den sande hypotese forkastes). Fejl af type er, når manden frifindes og er skyldig (den falske hypotese accepteres). I retssystemet er det altid anklageren, der har bevisbyrden, og dette er for at mindske risikoen for at dømme en uskyldig (fejl af type 1). Hvis en kvinde tager en graviditets er hypotesen, at hun ikke er gravid. Fejl af type 1 opstår, hvis prøven er positiv, når hun ikke er gravid og fejl af type opstår, hvis prøven er negativ, når hun er gravid. side 1 af 9 sider
22 χ - for uafhængighed mellem to inddelingskriterier - Tosidet eller χ way En anden måde at bruge χ - er ved undersøgelser af uafhængighed. Vi kan f.eks. spørge om farveblindhed afhænger af køn. Vi vil så spørge en stor gruppe mennesker om deres køn og om de er farveblinde. Hvis andelen af farveblinde kvinder er lige så stor som andelen af farveblinde mænd afhænger farveblindhed ikke af køn. I praksis vil de to andele sjældent være præcis lige store (selvom der var tale om uafhængige hændelser), fordi de statistiske tilfældigheder i stikprøven påvirker resultatet. Derfor har vi igen brug for en måde at e, hvorvidt variationerne er store nok til at vi afviser vores nulhypotese (at farveblindhed ikke afhænger af køn). I det følgende vil vi demonstrere, hvordan man laver en χ - for uafhængighed i Nspire.Vi vil tage udgangspunkt i den følgende opgave: En forretningskæde vil undersøge, om farven på indpakningen af nye slik påvirker salget. Butikken sælger derfor i en periode poser med samme slags slik, alle med 50 g/pose og til samme pris. Der bliver i alt sendt 600 poser slik ud i butikkerne, hvoraf 50 bliver solgt. Af de solgte poser er 375 gule, og der er 55 gule poser tilbage. De øvrige poser er blå. Undersøg, om der er grundlag for at påstå, at farven påvirker salget af slik. Vi vil gennemgå to løsningsmetoder. 1) Den første metode baseres og forklares ud fra teorien om χ -. ) Den anden metode er en hurtig it-baseret løsningsmetode Resultaterne i de to metoder sammenlignes og analyseres. 10) METODE 1: Den teoretiske løsningsmetode Hypoteser og signifikansniveau: Vi begynde med at opstille en tabel i Lister og regneark af de observerede data ud fra de informationer vi får i opgavebeskrivelsen. Observerede data: side af 9 sider
23 Bemærk, at vi, udover de givne data med solgte og usolgte poser, tilføjer en række og en kolonne med summering af tallene. De to inddelingskriterier er hhv. farven på poserne og salg af slik. Vi opstiller en nulhypotese, som vi vil undersøge: H 0 : Der er uafhængighed mellem farven på poser og salg af slik. Dvs. vi antager, at farverne ikke har indflydelse på salget, og at variationer i salget mellem gule og blå poser kun skyldes tilfældigheder. Før vi går i gang med at e vores nulhypotese, vælger vi at fastsætte signifikansniveauet til 5%. Vi antager, at størrelsen følger en χ -fordeling med 1 frihedsgrad. Frihedsgraden beregnes som (antal rækker 1 ).(antal kolonner -1). Vi ser her bort fra summeringslisterne. Her er frihedsgraden (-1) (-1) = 1. Beregning af χ -størrelsen: For at beregne χ -størrelsen, skal vi først beregne de forventede værdier under antagelse af, at der er uafhængighed. Beregningseksempel: Hvis salget ikke afhænger af farven forventer vi ifølge definitionen for uafhængighed, at det forventede antal solgte gule poser samlet antal solgte poser summen af gule poser = samlet antal poser Derfor får vi: summen af gule poser det forventede antal solgte gule poser = i (samlet antal solgte poser) samlet antal poser 430 det forventede antal solgte gule poser = i Beregning af forventede observationer: side 3 af 9 sider
24 Opgave. a) Skriv selv formlerne op for de øvrige tre beregningsfelter og gennemfør beregningerne i N- spire. b) Lav derefter sumkontrollerne og kontroller at tallene stemmer overens med summerne (kolonne i_alt ) i de observerede data. For at beregne χ -størrelsen indsættes i formlen ( obsantal forvantal ) χ = forv antal Når vi indsætter de beregnede tal i tabellen kommer udtrykket nu til at se således ud (Bemærk, at vi definerer χ -størrelsen med det samme, så den kan bruges til at beregne sandsynligheden p.) Vi har nu beregnet χ -størrelsen til at være 0.39 (to betydende cifre). Vi vil nu prøve at illustrere betydningen af dette tal. På figuren har vi tegnet frekvensfunktionen for en χ -fordeling med frihedsgrad 1. I Nspire tastes i funktionsfeltet:. Vi har endvidere markeret den kritiske mængde svarende til et signifikansniveau på 5% (Dvs. at det skraverede areal udgør 5% af det samlede areal under kurven). side 4 af 9 sider
25 Hvis vores størrelse havde ligget i det skraverede område, altså været større end 3.84, så skulle vi have forkastet vores nulhypotese H 0. Men vores størrelse er kun 0.39, så vi kan ikke på det foreliggende grundlag forkaste hypotesen. Altså må vi formode, at salget af slik er uafhængig af farven på slikposerne. Grænsetilfældet svarende til et signifikansniveau på 5% kan beregnes i N-spire ved hjælp af den inverse funktion til χ -fordelingen. For at lave beregningen skal man først angive acceptmængden (1 den kritiske mængde, her = 0.95) dernæst antallet af frihedsgrader. Beregning af sandsynligheden For at færdiggøre vores undersøgelse, vil vi nu beregne den til størrelsen hørende sandsynlighed p. Beregningen foretages i N-spire med fordelingsfunktion for χ -fordelingen (den kumulerede). (Hvis man ikke har defineret sin størrelse, så kan man naturligvis bare indsætte den beregnede talværdi i stedet for.) Grafisk svarer sandsynligheden p til arealet under kurven for frekvensfunktionen til højre for størrelsen. p-værdien repræsenterer dermed nulhypotesens troværdighed. Den er her beregnet til 53.4 % og dvs., at den ligger langt over et signifikansniveau på 5 %. Dette understøtter derfor det tidligere udsagn om at sliksalget må formodes at være uafhængigt af farven på poserne. 11) METODE : den hurtige løsningsmetode Datamaterialet i vores opgave om slik er tosidet, da der i opgaven er to inddelingskriterier (farver og salg). I praksis betyder det, at tosidet data kan opskrives i en tabel med mindst to rækker og to kolonner. Til beregning af χ -størrelse og sandsynlighed, kan man anvende den beregningsfunktion i N-spire, som hedder χ -vejs. Først skal de givne data defineres som en matrix i Notefeltet. side 5 af 9 sider
26 Herefter anvendes en χ -vejs til beregning For at få vist resultaterne af beregningerne skrives stat.results i en Math Box. I resultatboksen kan man nu aflæse χ -størrelsen som 0.39 og χ sandsynligheden p til 53.4%. Man kan ved hjælp af kommandoen stat.compmatrix få de enkelte bidrag til tallet frem. Så kan man lettere få et overblik over de skyldige i vores undersøgelse. Herefter skal man naturligvis huske at skrive en konklusion i forhold til nulhypotesen. Da vores χ -størrelse kun er 0.39, kan vi ikke på det foreliggende grundlag forkaste hypotesen. Altså må vi formode at salget af slik er uafhængig af farven på slikposerne. p-værdien, der repræsenterer nulhypotesens troværdighed, er her beregnet til 53.4% og dvs. at den ligger langt over et signifikansniveau på 5%. Dette understøtter derfor det tidligere udsagn om at sliksalget må formodes at være uafhængig af farven på poserne. Når man sammenligner de to metoder, ser man til sin store glæde, at der er overensstemmelse mellem de beregnede resultater side 6 af 9 sider
27 1) Projekt Gruppestørrelser: 3 mands grupper. Elevtid: 5 timer Materialebrug: Hver gruppe medbringer selv: poser Haribos vingummibamser og to små eller en stor pose M&M s, de små kulørte chokoladeknapper. Produktkrav: Der ønskes en besvarelse af nedenstående opgaver. CASE: Den lille chokoladefabrik Sukkertop fra Chokoland, ikke så fjernt fra Kokosland tæt på Ækvator, har haft stor succes i deres eget land og har ønsker om at ekspandere på det globale marked. De har hørt om et firma kaldet Haribo, i det skønne land Danmark, der laver verdens lækreste, blødeste og mest velsmagende vingummibamser dem kunne Sukkertop godt tænke sig at fusionere med. Du bliver ansat som kvalitetskonsulent og skal gå Haribo i sømmene. Du får tre opgaver: 1. Firmaet Sukkertop har ikke rigtig forstået, hvordan man kan e om en givet observation følger en given forventet fordeling. Du skal med egne ord forklare, hvad en Goodness of fit går ud på du skal undervejs forklare de begreber du anvender i din redegørelse. (Forklaringerne må gerne flettes sammen med nedenstående opgaver). I en pose af Haribos vingummibamser er der bamser i fem forskellige farver. På Haribos hjemmeside kan man læse at en pose indeholder: 1/6 hvide guldbamser 1/6 orange guldbamser 1/3 røde guldbamser 1/6 grønne guldbamser 1/6 gule guldbamser side 7 af 9 sider
2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900.
2 -fordeling og 2 -test Generelt om 2 -fordelingen 2 -fordelingen er en kontinuert fordeling, modsat binomialfordelingen som er en diskret fordeling. Fordelingen er særdeles kompleks at beskrive med matematiske
Læs merePersonlig stemmeafgivning
Ib Michelsen X 2 -test 1 Personlig stemmeafgivning Efter valget i 2005 1 har man udspurgt en mindre del af de deltagende, om de har stemt personligt. Man har svar fra 1131 mænd (hvoraf 54 % har stemt personligt
Læs mereVærktøjshjælp for TI-Nspire CAS Struktur for appendiks:
Værktøjshjælp for TI-Nspire CAS Struktur for appendiks: Til hvert af de gennemgåede værktøjer findes der 5 afsnit. De enkelte afsnit kan læses uafhængigt af hinanden. Der forudsættes et elementært kendskab
Læs mereχ 2 -test i GeoGebra Jens Sveistrup, Gammel Hellerup Gymnasium
χ 2 -test i GeoGebra Jens Sveistrup, Gammel Hellerup Gymnasium Man kan nemt lave χ 2 -test i GeoGebra både goodness-of-fit-test og uafhængighedstest. Den følgende vejledning bygger på GeoGebra version
Læs merefor gymnasiet og hf 2017 Karsten Juul
for gymnasiet og hf 75 50 5 017 Karsten Juul Statistik for gymnasiet og hf 017 Karsten Juul 5/11-017 Nyeste version af dette hæfte kan downloades fra http://mat1.dk/noter.htm Hæftet må benyttes i undervisningen
Læs mereMATEMATIK A-NIVEAU. Anders Jørgensen & Mark Kddafi. Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012
MATEMATIK A-NIVEAU Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012 Kapitel 4 Statistik & sandsynlighedsregning 2016 MATEMATIK A-NIVEAU Vejledende eksempler på eksamensopgaver
Læs mereSpørgeskemaundersøgelser og databehandling
DASG. Nye veje i statistik og sandsynlighedsregning. side 1 af 12 Spørgeskemaundersøgelser og databehandling Disse noter er udarbejdet i forbindelse med et tværfagligt samarbejde mellem matematik og samfundsfag
Læs mereHypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0
Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt
Læs merefor gymnasiet og hf 2016 Karsten Juul
for gymnasiet og hf 75 50 5 016 Karsten Juul Statistik for gymnasiet og hf Ä 016 Karsten Juul 4/1-016 Nyeste version af dette håfte kan downloades fra http://mat1.dk/noter.htm HÅftet mç benyttes i undervisningen
Læs mereMaple 11 - Chi-i-anden test
Maple 11 - Chi-i-anden test Erik Vestergaard 2014 Indledning I dette dokument skal vi se hvordan Maple kan bruges til at løse opgaver indenfor χ 2 tests: χ 2 - Goodness of fit test samt χ 2 -uafhængighedstest.
Læs mereMatematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet
Matematik A Studentereksamen Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet stx11-matn/a-080501 Tirsdag den 8. maj 01 Forberedelsesmateriale til stx A Net MATEMATIK Der
Læs merefor matematik pä B-niveau i hf
for matematik pä B-niveau i hf 014 Karsten Juul TEST 1 StikprÅver... 1 1.1 Hvad er populationen?... 1 1. Hvad er stikpråven?... 1 1.3 Systematiske fejl ved valg af stikpråven.... 1 1.4 TilfÇldige fejl
Læs mereLars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test.
Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ -test og Goodness of Fit test. Anvendelser af statistik Statistik er et levende og fascinerende emne, men at læse om det er alt
Læs mereStatistik II 1. Lektion. Analyse af kontingenstabeller
Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression
Læs mereVelkommen til Flemmings store Maplekursus 1. lektion. Skift mellem tekst- og matematikmode
Velkommen til Flemmings store Maplekursus 1. lektion. Skift mellem tekst- og matematikmode Man kan skifte mellem tekst- og matemamatikmode ved at trykke på F5. I øjeblikket er jeg i tekstmode.. 2. lektion.
Læs mereLineære sammenhænge, residualplot og regression
Lineære sammenhænge, residualplot og regression Opgave 1: Er der en bagvedliggende lineær sammenhæng? I mange sammenhænge indsamler man data som man ønsker at undersøge og afdække eventuelle sammenhænge
Læs mereStatistik. Peter Sørensen: Statistik og sandsynlighed Side 1
Statistik Formålet... 1 Mindsteværdi... 1 Størsteværdi... 1 Ikke grupperede observationer... 2 Median og kvartiler defineres ved ikke grupperede observationer således:... 2 Middeltal defineres ved ikke
Læs mereSchweynoch, 2003. Se eventuelt http://www.mathematik.uni-kassel.de/~fathom/projekt.htm.
Projekt 8.5 Hypotesetest med anvendelse af t-test (Dette materiale har været anvendt som forberedelsesmateriale til den skriftlige prøve 01 for netforsøget) Indhold Indledning... 1 χ -test... Numeriske
Læs mereAnvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele
Anvendt Statistik Lektion 4 Hypotesetest generelt Test for middelværdi Test for andele Hypoteser og Test Hypotese I statistik er en hypotese en påstand om en populationsparameter. Typisk en påstand om
Læs merefor matematik pä B-niveau i hf
for matematik pä B-niveau i hf 75 50 5 016 Karsten Juul GRUPPEREDE DATA 1.1 Hvad er deskriptiv statistik?...1 1. Hvad er grupperede og ugrupperede data?...1 1.1 Eksempel pä ugrupperede data...1 1. Eksempel
Læs mereKonfidensintervaller og Hypotesetest
Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller
Læs merec) For, er, hvorefter. Forklar.
1 af 13 MATEMATIK B hhx Udskriv siden FACITLISTE TIL KAPITEL 7 ØVELSER ØVELSE 1 c) ØVELSE 2 og. Forklar. c) For, er, hvorefter. Forklar. ØVELSE 3 c) ØVELSE 4 90 % konfidensinterval: 99 % konfidensinterval:
Læs mere3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve
Læs mereKønsproportion og familiemønstre.
Københavns Universitet Afdeling for Anvendt Matematik og Statistik Projektopgave forår 2005 Kønsproportion og familiemønstre. Matematik 2SS Inge Henningsen februar 2005 Indledning I denne opgave undersøges,
Læs mereLøsning til eksaminen d. 14. december 2009
DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,
Læs mereDeskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium
Deskriptiv (beskrivende) statistik er den disciplin, der trækker de væsentligste oplysninger ud af et ofte uoverskueligt materiale. Det sker f.eks. ved at konstruere forskellige deskriptorer, d.v.s. regnestørrelser,
Læs mereAnvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af
Læs mereTema. Dagens tema: Indfør centrale statistiske begreber.
Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i
Læs mereVejledende eksamensopgaver vedr. hypotesetest (stx B og stx A)
Vejledende eksamensopgaver vedr. hypotesetest (stx B og stx A) Opgave 1 I nedenstående tabel ses resultaterne af samtlige hjerteklapoperationer i 007-08 ved Odense Universitetshospital (OUH) sammenlignet
Læs mereHvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05
Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ
Læs mereSkriv punkternes koordinater i regnearket, og brug værktøjet To variabel regressionsanalyse.
Opdateret 28. maj 2014. MD Ofte brugte kommandoer i Geogebra. Generelle Punktet navngives A Geogebra navngiver punktet Funktionen navngives f Funktionen navngives af Geogebra Punktet på grafen for f med
Læs mereAt træffe sine valg i en usikker verden - eller den statistiske modellerings rolle.
At træffe sine valg i en usikker verden - eller den statistiske modellerings rolle. Af E. Susanne Christensen. Lektor i statistik. Institut for Matematiske Fag. Aalborg Universitet. I mange tilfælde og
Læs mereTrin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse
Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ
Læs mereIndhold Grupperede observationer... 1 Ugrupperede observationer... 3 Analyse af normalfordelt observationssæt... 4
BH Test for normalfordeling i WordMat Indhold Grupperede observationer... 1 Ugrupperede observationer... 3 Analyse af normalfordelt observationssæt... 4 Grupperede observationer Vi tager udgangspunkt i
Læs mereTemaopgave i statistik for
Temaopgave i statistik for matematik B og A Indhold Opgave 1. Kast med 12 terninger 20 gange i praksis... 3 Opgave 2. Kast med 12 terninger teoretisk... 4 Opgave 3. Kast med 12 terninger 20 gange simulering...
Læs mereSupplement til kapitel 7: Approksimationen til normalfordelingen, s. 136
Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 36 Det er besværligt at regne med binomialfordelingen, og man vælger derfor ofte at bruge en approksimation med normalfordeling. Man
Læs mereProjekt 8.3 Hvordan undersøges om et talmateriale normalfordelt?
Projekt 8.3 Hvordan undersøges om et talmateriale normalfordelt? Projektet drejer sig om at udvikle en metode, til at undersøge om et givet talmateriale med rimelighed kan siges at være normalfordelt.
Læs mereBilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen
Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Microsoft Excel har en del standard anvendelsesmuligheder i forhold til den beskrivende statistik og statistisk
Læs mereMatematik og samfundsfag Gini-koefficienten
Erik Vestergaard www.matematikfysik.dk Matematik og samfundsfag Gini-koefficienten Den såkaldte Gini-koefficient, introduceret i 92 i en artikel af den italienske statistiker, demograf og sociolog Corrado
Læs mereFlemmings Maplekursus 1. Løsning af ligninger
Flemmings Maplekursus 1. Løsning af ligninger a) Ligninger med variabel og kun en løsning. Ligningen løses 10 3 Hvis vi ønsker løsningen udtrykt som en decimalbrøk i stedet: 3.333333333 Løsningen 3 er
Læs mereGrupperede observationssæt Deskriptiv statistik: Middelværdi, frekvensfordeling, sumkurve, kvartilsæt, boxplot
Grupperede datasæt: Middelværdi, intervalfrekvens og kumuleret frekvens. Bilbestandens alder i 2005 fremgår af følgende tabel. Alder i år ]0;4] ]4;8] ]8;12] ]12;16] ]16;20] ]20;24] Antal i tusinde 401
Læs mereKapitel 8 Chi-i-anden (χ 2 ) prøven
Kapitel 8 Chi-i-anden (χ 2 ) prøven Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 19 Indledning Forskelle mellem stikprøver undersøges med z-test eller t-test for data målt på
Læs mere1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...
Indhold 1 Statistisk inferens: Hypotese og test 2 1.1 Nulhypotese - alternativ.................................. 2 1.2 Teststatistik........................................ 3 1.3 P-værdi..........................................
Læs mereHvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau
Hvad skal vi lave? 1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ. Teststatistik P-værdi Signifikansniveau 2 t-test for middelværdi Tosidet t-test for middelværdi Ensidet t-test for middelværdi
Læs mere3. Trekantsberegninger. Gør rede for cosinusrelationen i vilkårlige trekanter.
Matematik B, 2x - sommereksamen 2014 NB! Prøvespørgsmålene kan ændres på foranledning af censor 1. Trekantsberegninger Gør rede for en trekants vinkelsum og areal. Gør endvidere rede for ensvinklede trekanter.
Læs mereDeskriptiv statistik for matc i stx og hf
Deskriptiv statistik for matc i stx og hf 75 50 25 2019 Karsten Juul Deskriptiv statistik for matc i stx og hf Hvad er deskriptiv statistik? 1.1 Hvad er deskriptiv statistik?... 1 1.2 Hvad er grupperede
Læs mereCMU PROJEKT HYPOTESETEST OG SIMULERING MICHAEL AGERMOSE JENSEN CHRISTIANSHAVNS GYMNASIUM
CMU PROJEKT HYPOTESETEST OG SIMULERING MICHAEL AGERMOSE JENSEN CHRISTIANSHAVNS GYMNASIUM FORMÅL - BEKENDTGØRELSEN STX MATEMATIK A Kompetencer anvende simple statistiske eller sandsynlighedsteoretiske modeller
Læs mereKapitel 7 Forskelle mellem centraltendenser
Kapitel 7 Forskelle mellem centraltendenser Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 29 Indledning 1. z-test for ukorrelerede data 2. t-test for ukorrelerede data med ens
Læs mereHvad er meningen? Et forløb om opinionsundersøgelser
Hvad er meningen? Et forløb om opinionsundersøgelser Jette Rygaard Poulsen, Frederikshavn Gymnasium og HF-kursus Hans Vestergaard, Frederikshavn Gymnasium og HF-kursus Søren Lundbye-Christensen, AAU 17-10-2004
Læs mereFig. 1 Billede af de 60 terninger på mit skrivebord
Simulation af χ 2 - fordeling John Andersen Introduktion En dag kastede jeg 60 terninger Fig. 1 Billede af de 60 terninger på mit skrivebord For at danne mig et billede af hyppighederne flyttede jeg rundt
Læs mereDeskriptiv statistik for hf-matc
Deskriptiv statistik for hf-matc 75 50 25 2018 Karsten Juul Deskriptiv statistik for hf-matc Hvad er deskriptiv statistik? 1.1 Hvad er deskriptiv statistik?... 1 1.2 Hvad er grupperede og ugrupperede data?...
Læs mereMandags Chancen. En optimal spilstrategi. Erik Vestergaard
Mandags Chancen En optimal spilstrategi Erik Vestergaard Spilleregler denne note skal vi studere en optimal spilstrategi i det spil, som i fjernsynet går under navnet Mandags Chancen. Spillets regler er
Læs mereI. Deskriptiv analyse af kroppens proportioner
Projektet er delt i to, og man kan vælge kun at gennemføre den ene del. Man kan vælge selv at frembringe data, fx gennem et samarbejde med idræt eller biologi, eller man kan anvende de foreliggende data,
Læs mereForelæsning 9: Inferens for andele (kapitel 10)
Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs mereProjekt 2.9 Sumkurver som funktionsudtryk anvendt til Lorenzkurver og Ginikoefficienter (især for B- og A-niveau)
Projekt 2.9 Sumkurver som funktionsudtryk anvendt til Lorenzkurver og Ginikoefficienter En sumkurve fremkommer ifølge definitionen, ved at vi forbinder en række punkter afsat i et koordinatsystem med rette
Læs mereSkriftlig eksamen i samfundsfag
OpenSamf Skriftlig eksamen i samfundsfag Indholdsfortegnelse 1. Introduktion 2. Præcise nedslag 3. Beregninger 3.1. Hvad kan absolutte tal være? 3.2. Procentvis ændring (vækst) 3.2.1 Tolkning af egne beregninger
Læs merePreben Blæsild og Jens Ledet Jensen
χ 2 Test Preben Blæsild og Jens Ledet Jensen Institut for Matematisk Fag Aarhus Universitet Egå Gymnasium, December 2010 Program 8.15-10.00 Forelæsning 10.15-12.00 Statlab: I arbejder, vi cirkler rundt
Læs mereTeoretisk Statistik, 2. december 2003. Sammenligning af poissonfordelinger
Uge 49 I Teoretisk Statistik, 2. december 2003 Sammenligning af poissonfordelinger o Generel teori o Sammenligning af to poissonfordelinger o Eksempel Opsummering om multinomialfordelinger Fishers eksakte
Læs mereKvantitative Metoder 1 - Efterår Dagens program
Dagens program Estimation: Kapitel 9.7-9.10 Estimationsmetoder kap 9.10 Momentestimation Maximum likelihood estimation Test Hypoteser kap. 10.1 Testprocedure kap 10.2 Teststørrelsen Testsandsynlighed 1
Læs mereStatistik med TI-Nspire CAS version 3.2. Bjørn Felsager September 2012. [Fjerde udgave]
Statistik med TI-Nspire CAS version 3.2 Bjørn Felsager September 2012 [Fjerde udgave] Indholdsfortegnelse Forord Beskrivende statistik 1 Grundlæggende TI-Nspire CAS-teknikker... 4 1.2 Lister og regneark...
Læs mereAnvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination
Læs mereNspire opskrifter (Ma)
Nspire opskrifter (Ma) 18. maj 2018 1. Funktioner 1.1 Definér funktion 1.2 Bestem funktionsværdi 1.3 Tegn graf for funktion 1.4 Udfør regression 1.5 Find skæringspunkter mellem to grafer 2. Ligninger 2.1
Læs mereStatistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller
Statistik II 1. Lektion Sandsynlighedsregning Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller
Læs mereJ E T T E V E S T E R G A A R D
BINOMIALT EST J E T T E V E S T E R G A A R D F I P B I O L O G I M A R S E L I S B O R G G Y M N A S I U M D. 1 3. M A R T S 2 0 1 9 K A L U N D B O R G G Y M N A S I U M D. 1 4. M A R T S 2 0 1 9 HVEM
Læs mereEnsidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese
Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet
Læs mereVejledning til WordMat på Mac
Installation: WordMat på MAC Vejledning til WordMat på Mac Hent WordMat for MAC på www.eduap.com Installationen er først slut når du har gjort følgende 1. Åben Word 2. I menuen vælges: Word > Indstillinger
Læs mereRettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007
Rettevejledning til eksamen i Kvantitative metoder 1,. årsprøve. januar 007 I rettevejledningen henvises der til Berry and Lindgren "Statistics Theory and methods"(b&l) hvis ikke andet er nævnt. Opgave
Læs mereStatistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test
Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,
Læs mereSkriftlig eksamen Science statistik- ST501
SYDDANSK UNIVERSITET INSTITUT FOR MATEMATIK OG DATALOGI Skriftlig eksamen Science statistik- ST501 Torsdag den 21. januar Opgavesættet består af 5 opgaver, med i alt 13 delspørgsmål, som vægtes ligeligt.
Læs mereOversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff
Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs mereDagens program. Praktisk information: Husk evalueringer af kurset
Dagens program Praktisk information: Husk evalueringer af kurset Hypoteseprøvning kap. 11.1-11.3 Fokastelsesområdet kap. 11.1 Type I og Type II fejl kap. 11.1 Styrkefunktionen kap. 11.2 Stikprøvens størrelse
Læs mereVejledende besvarelser til opgaver i kapitel 14
Vejledende besvarelser til opgaver i kapitel 14 Opgave 1 a) Det første trin i opstillingen af en hypotesetest er at formulere to hypoteser, hvoraf den ene støtter den teori vi vil teste, mens den anden
Læs mereEksponentielle funktioner for C-niveau i hf
Eksponentielle funktioner for C-niveau i hf 2017 Karsten Juul Procent 1. Procenter på en ny måde... 1 2. Bestem procentvis ændring... 2 3. Bestem begyndelsesværdi... 2 4. Bestem slutværdi... 3 5. Vækstrate...
Læs mereStatistik viden eller tilfældighed
MATEMATIK i perspektiv Side 1 af 9 DNA-analyser 1 Sandsynligheden for at en uskyldig anklages Følgende histogram viser, hvordan fragmentlængden for et DNA-område varierer inden for befolkningen. Der indgår
Læs mereOversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable
Kursus 02402 Introduktion til Statistik Forelæsning 2: Kapitel 4, Diskrete fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs mereNormalfordelingen og Stikprøvefordelinger
Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger
Læs mereSimulering af stokastiske fænomener med Excel
Simulering af stokastiske fænomener med Excel John Andersen, Læreruddannelsen i Aarhus, VIA Det kan være en ret krævende læreproces at udvikle fornemmelse for mange begreber fra sandsynlighedsregningen
Læs mereGL. MATEMATIK B-NIVEAU
GL. MATEMATIK B-NIVEAU Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik 29. maj 2013 2016 Opgave 1 Opgave 2 Opgave 3 Opgave 4 Vejledende eksempler på eksamensopgaver og eksamensopgaver
Læs mereForelæsning 2: Kapitel 4, Diskrete fordelinger
Kursus 02402 Introduktion til Statistik Forelæsning 2: Kapitel 4, Diskrete fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs mereMODELSÆT 2; MATEMATIK TIL LÆREREKSAMEN
MODELSÆT ; MATEMATIK TIL LÆREREKSAMEN Forberedende materiale Den individuelle skriftlige røve i matematik vil tage udgangsunkt i følgende materiale:. En diskette med to regnearks-filer og en MathCad-fil..
Læs mereLøsning eksamen d. 15. december 2008
Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Læs mereKapitel 4 Sandsynlighed og statistiske modeller
Kapitel 4 Sandsynlighed og statistiske modeller Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 Indledning 2 Sandsynlighed i binomialfordelingen 3 Normalfordelingen 4 Modelkontrol
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs mere(Projektets første del er rent deskriptiv, mens anden del peger frem mod hypotesetest. Projektet kan gemmes til dette emne, eller tages op igen der)
Projekt 2.4 Menneskets proportioner (Projektets første del er rent deskriptiv, mens anden del peger frem mod hypotesetest. Projektet kan gemmes til dette emne, eller tages op igen der) I. Deskriptiv analyse
Læs mereUndervisningsbeskrivelse
Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Skoleår efterår 16, eksamen december 2016 Institution Kolding HF & VUC Uddannelse Fag og niveau Lærer(e) Hold
Læs mereExcel regneark. I dette kapitel skal I arbejde med noget af det, Excel regneark kan bruges til. INTRO EXCEL REGNEARK
Excel regneark Et regneark er et computerprogram, der bl.a. kan regne, tegne grafer og lave diagrammer. Regnearket kan bruges i mange forskellige sammenhænge, når I arbejder med matematik. Det kan gøre
Læs mere5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14
Module 5: Exercises 5.1 ph i blod.......................... 1 5.2 Medikamenters effektivitet............... 2 5.3 Reaktionstid........................ 3 5.4 Alkohol i blodet...................... 3 5.5
Læs mereEstimation og konfidensintervaller
Statistik og Sandsynlighedsregning STAT kapitel 4.4 Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne Estimation og konfidensintervaller Antag X Bin(n,
Læs mereDagens program. Praktisk information:
Dagens program Praktisk information: Husk hjemmeopgaven i statistik Hypoteseprøvning kap. 11.2,11.3 og 11.8 Eksempel på test Styrkefunktionen kap. 11.2 Stikprøvens størrelse kap. 11.3 Likelihood ratio
Læs mereI dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd
I dag Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik SaSt) Helle Sørensen Først lidt om de sidste uger af SaSt. Derefter statistisk analyse af en enkelt
Læs mereSandsynlighedsfordelinger for kontinuerte data på interval/ratioskala
3 5% 5% 5% 0 3 4 5 6 7 8 9 0 Statistik for biologer 005-6, modul 5: Normalfordelingen opstår når mange forskellige faktorer uafhængigt af hinanden bidrager med additiv variation til. F.eks. Højde af rekrutter
Læs mereLøsning til eksamen d.27 Maj 2010
DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1
Læs mereStatistik. Deskriptiv statistik, normalfordeling og test. Karsten Juul
Statistik Deskriptiv statistik, normalfordeling og test Karsten Juul Intervalhyppigheder En elevgruppe på et gymnasium har spurgt 100 tilfældigt valgte elever på gymnasiet om hvor lang tid det tager dem
Læs mereBesvarelser til øvelsesopgaver i uge 6
Besvarelser til øvelsesopgaver i uge 6 Opgave 7.46, side 228 (7ed 7.28, side 244 og 6ed: 7.28, side 240) Vi tænker os, at vi har data for emissionen {x 1, x 2,..., x n }, når det pågældende device er monteret.
Læs mereStatistik i basketball
En note til opgaveskrivning jerome@falconbasket.dk 4. marts 200 Indledning I Falcon og andre klubber er der en del gymnasieelever, der på et tidspunkt i løbet af deres gymnasietid skal skrive en større
Læs mereSusanne Ditlevsen Institut for Matematiske Fag susanne
Statistik og Sandsynlighedsregning 1 STAT kapitel 4.4 Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne 7. undervisningsuge, mandag 1 Estimation og konfidensintervaller
Læs mereAnalyse af en lineær regression med lav R 2 -værdi
Analyse af en lineær regression med lav R 2 -værdi Denne gennemgang omhandler figur 13 i Regn med biologi. Man kan sagtens lave beregninger på egne data. Forsøgsmæssigt kræver det bare en tommestok tapet
Læs mereProgram. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter
Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede
Læs mereTest nr. 5 af centrale elementer 02402
QuizComposer 2001- Olaf Kayser & Gunnar Mohr Contact: admin@quizcomposer.dk Main site: www.quizcomposer.dk Test nr. 5 af centrale elementer 02402 Denne quiz angår forståelse af centrale elementer i kursus
Læs mere