Statistik i basketball
|
|
- Albert Kjær
- 8 år siden
- Visninger:
Transkript
1 En note til opgaveskrivning 4. marts 200 Indledning I Falcon og andre klubber er der en del gymnasieelever, der på et tidspunkt i løbet af deres gymnasietid skal skrive en større opgave. Er man interesseret i matematik, og ønsker man at kombinere det med ens interesse for basketball, er en opgave om anvendelser af statistik i basketball en spændende mulighed. Der findes mange udmærkede bøger om statistik på alle niveauer, men der er mig bekendt ingen litteratur på dansk, der behandler konkrete anvendelser på scoringsprocenter i basketball. Dette tomrum forsøger denne lille note at udfylde. Den er altså rettet mod gymnasieelever, og bør ses som et supplement til de gymnasiale lærebøger. Sportsinteresserede i almindelighed med en interesse for statistik vil dog givetvis også kunne have glæde af noten. Et matematisk niveau svarende til gymnasiet samt lysten til at lære stoffet er eneste forudsætning. Binomialfordelingen En spillers scoringsprocent kan angives som et tal p [0, ]. Antager vi at scoringsforsøgenes udfald ikke påvirker hinanden (at de er uafhængige kan vi opfatte dette som at et forsøg på at score vil lykkes med sandsynlighed p. Man kan så spørge om, hvad sandsynligheden er for at en spiller med scoringsprocent p scorer på netop x ud af n skud eller formuleret matematisk: Hvis X er en stokastisk variabel, der angiver antallet af scoringer ud af n forsøg, hvad er da P (X x. Binomialfordelingen giver svaret n P (X x p x ( p n x, ( x hvor ( n x kaldes binomialkoefficienten n over x og er givet ved n n! x x!(n x!, hvor k! 2 (k k. Eksempel Med en scoringsprocent er 50 % er sandsynligheden for at score på 3 ud af 5 skud 5 /6. Tak til Morten Hornbech for mange kommentarer samt hjælp til at gøre formuleringerne mere klare.
2 Statistisk model En statistisk model består af en mængde af mulige observationer (udfaldsrummet og en mængde af mulige fordelinger for disse observationer. En fordeling tildeler hver observation en sandsynlig således at summen bliver. Ser vi på situationen fra før er mængden af mulige observationer givet ved E {0,,..., n}, altså de mulige antal gange man kan scorer på n skud. Mængden af mulige fordelinger er givet ved binomialfordelingerne for alle p [0, ], da vi forestiller os at vi ikke på forhånd kender spillerens scoringsprocent. Den korte notation for modellen er (E, (P p p [0,], (2 I denne model kan man udfra relevant skudstatistik undersøge om en given spiller eller et givent hold kan antages at have scoringssandsynlighed p. Eksempel Simon har skudt 25 straffekast og scoret på 7 (vores observation. Er det rimeligt at antage at Simons scoringssandsynlighed er 0,75? Man kunne også være interesseret i at sammenligne to spillere/hold. I dette tilfælde bliver den statistiske model (E, (P (p,p 2 (p,p 2 [0,] 2, (3 med E {0,..., n } {0,..., n 2 }, hvor n og n 2 er antallet af scoringsforsøg for den ene henholdsvis den anden spiller/hold, og n P (p,p 2 (X x, X 2 x 2 p x ( p n x n2 p x 2 2 ( p 2 n 2 x 2 x 2 r ( nr xr x 2 p xr r ( p r nr xr. Det forudsættes her at alle observationerne er uafhængige. Eksempel Falcons damehold har i første halvdel af sæsonen skudt 39 3 ere og ramt på 57, mens de i anden halvdel af sæsonen har skudt 09 3 ere og ramt på 56. Er Falcon blevet bedre til at skyde i løbet af sæsonen? Estimation Ofte er man interesseret i at estimere dvs. gætte en given størrelse fx et holds skudprocent så godt som muligt. Det bedste gæt (det mest sandsynlige valg betegnes maksimaliseringsestimatoren, som betegnes med ˆp. I binomialmodellen er ˆp x n, hvilket intuitivt ikke overrasker (hvorfor ikke? Kan du bevise det matematisk?. Test og hypoteser Signifikansniveau Man vælger på forhånd ens signifikansniveau ofte betegnet α. Man vælger stort set altid α 0.05, uden at nogen ville påstå, at det er bedre end så meget andet. Man kan tænke på signifikansniveau som følger: Man forestiller sig, at man kan gentage eksperimentet et utal af gange. Hvis den situation vi ser i vores data 2
3 forekommer mindre end 5 % af gangene vil vi sige, at det er for ekstremt til at være i overensstemmelse med vores model (under hypotesen og vi forkaster den. Eksempel En straffekastskytte skyder 0 skud og rammer på skud. Vi vil undersøge hypotesen om, at hendes scoringsprocent er 70 %. Hypotesen ender med at blive forkastet af følgende grund: Forestiller vi os, at hun ville have en scoringsprocent på 70 % og vi 00 gange satte hende til at skyde 0 straffekast ville det under 5 % af gangene ske, at hun kun ville ramme et skud. Derfor tror vi ikke på, at hendes scoringsprocent er 70 % og hypotesen forkastes. Hypoteser Typisk vil en hypotese være der er forskel på hold A og hold B s scoringsprocenter. I statistik undersøger man dog altid hypoteser på formen der er ingen forskel på hold A og hold B s scoringsprocenter, og ser så om man kan forkaste denne hypotese. Her gælder det om at holde tungen lige i munden: Man viser altså ikke, at der er forskel, men afviser i stedet på et givet signifikansniveau, at der ingen forskel er. Læs lige det igen! En hypotese i modellen givet ved (2 kaldes en simpel hypotese og skrives som: H 0 : p p. (4 Derimod kaldes en hypotese i modellen givet ved (3 for en sammensat hypotese: H : p p 2 p. (5 Teststørrelse Der findes et utal af teststørrelser man kan bruge, hvor en ofte brugt er kvotientteststørrelsen, Q(x. For en simpel hypotese har vi (4 Q(x ˆp x p ˆp n x p x/n x p x/n n x, p mens den for sammenligning af to grupper, dvs. sammensat hypotese (5, er Q(x 2 x n xr r (n x n nr xr r, (6 r x r n (n r x r n hvor n n + n 2 og x x + x 2. En teststørrelse er en hjælpestørrelse, der skal hjælpe os med at sige noget om, hvor godt en observation passer med vores hypotese. Testsandsynligheden Kaldes også for p-værdien for et test, og betegnes med ɛ(x for en given observation x. Følgende er sprogligt kludret så læs det langsomt! Testsandsynligheden udtrykker sandsynligheden for at få en observation, der passer dårligere eller lige så dårligt, som det vi har observeret under antagelsen om, at hypotesen H er opfyldt. Lad os sige, at ɛ(x 0.5. Det betyder altså, at hvis vi udfører eksperimentet et stort antal gange vil vi i gennemsnit 50 % af gangene få en observation, der passer dårligere. Således må vores konkrete observation x altså passe ganske godt. Jo større testsandsynligheden er jo mere rigtig er ens hypotese. Når man på forhånd har fastlagt et signifikansniveau α, forkaster man hypotesen H på niveau α, hvis ɛ(x α. 3
4 Approksimation af testsandsynlighed Man kan ofte godt finde testsandsynligheden eksakt, men det er utrolig besværligt. Heldigvis gælder følgende tilnærmelse/approksimation der meget hurtigt bliver ret god for store n og n 2 (i praksis bare større end 5-stykker: ɛ(x F χ 2 ( 2 log Q(x. Her er F χ 2 fordelingsfunktionen for χ 2 -fordelingen med frihedsgrad, mens log betegner den naturlige logaritme (ofte ln i gymnasiet. Man får selvfølgelig et tal ud af 2 log Q(x, der i øvrigt skal være positivt (ellers har man tastet/regnet forkert!. Dette sættes så ind i en (computer tabel for χ 2 -fordelingen, som man fx kan finde på chi-square-table.php. Pas på! Tabellen angiver F χ 2 (y, altså testsandsynligheden, og i øvrigt står DF for frihedsgrader (degrees of freedom. Vi er på jagt efter det y hvor F χ 2 (y Er nemlig y større må vi forkaste vores hypotese. Ifølge tabellen er grænsen y 3.84 for én frihedsgrad. Det vil sige, at hvis 2 log Q(x > 3.84 må vi forkaste hypotesen. Gennemregnet eksempel Hold A har skudt 738 og ramt 342. Hold B har skudt 584 og ramt 238. Den statistiske model bliver (E, (P (p,p 2 (p,p 2 [0,] 2 med E {0,..., 738} {0,..., 342}. Udfaldsrummet er altså alle tænkelige kombinationer af talpar, hvor. koordinaten ligger mellem 0 og 738, mens 2. koordinaten ligger mellem 0 og 584: fx (32, 34, men ikke (342, 603. Videre er P (p,p 2 (X 342, X ( hvor p [0, ] og p 2 [0, ]. Vores hypotese er: ( 584 p 342 ( p H 0 : Der er ingen forskel på hold A og hold B skudprocent. p ( p , Vi finder kvotientteststørrelsen ved at sætte ind i (6, og får Q(x Dermed bliver 2 log Q(x 4.3. Dette er klart større end 3.83, så hypotesen forkastes med et brag. Der er altså forskel! Vores bedste estimat for scoringsprocenterne for hold A er ˆp %, mens vi for hold B finder ˆp %. At vi finder, at der er en forskel er betryggende, da der er 6 procentpoints forskel, og begge hold har skudt et stort antal skud. Hvad mangler? Det er selvfølgelig ikke muligt på så lidt plads at behandle alt; så hvad mangler? Der mangler motivationen for, hvorfor vi gør som vi gør. Det kan virke oplagt og Udtales ki-i-anden. Hvis man sammenligner k grupper skal man bruge χ 2 -fordelingen med k frihedsgrader. 4
5 rigtigt, men der er også andre måder at gøre det på. Når man så har fastlagt sig på principperne skal man bevise, at det rent faktisk ender med at blive de formler vi har brugt. Hvis man har lyst til at fylde mere matematisk indhold i sin opgave er dette en mulig vej at gå. Ønsker man derimod at diskutere baggrunden for statistik, er der også masser at hente. Spørgsmål som hvilket signifikansniveau skal man bruge?, hvorfor overhovedet vælge signifikansniveau? Kan man ikke bare finde ens testsandsynlighed og så se om man er tilfreds?, hvad betyder det, at man forkaster en hypotese?, hvad er type I og type II fejl? og mange flere danner et godt grundlag for en omfattende diskussion af statistik. Et andet populært tema er de såkaldte player efficiency ratings, der i mange ligaer bruges til at vurdere, hvor produktive/effektive en spiller er. Dette emne er uddybende behandlet i Matheletics af Wayne Winston. Spørgsmål, rettelser og kommentarer modtages meget gerne via mail på jerome@falconbasket.dk. 5
Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination
Læs mereUge 48 II Teoretisk Statistik 27. november 2003. Numerisk modelkontrol af diskrete fordelinger: intro
Uge 48 II Teoretisk Statistik 7. november 003 Numerisk modelkontrol af diskrete fordelinger: intro Eksempel: kvalitetskontrol Goodness-of-fit test: generel teori Endeligt udfaldsrum Udfaldsrum uden øvre
Læs mereSusanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne
Statistik og Sandsynlighedsregning 1 Indledning til statistik, kap 2 i STAT Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne 5. undervisningsuge, onsdag
Læs mereSusanne Ditlevsen Institut for Matematiske Fag susanne
Statistik og Sandsynlighedsregning 1 STAT kapitel 4.4 Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne 7. undervisningsuge, mandag 1 Estimation og konfidensintervaller
Læs mereTema. Dagens tema: Indfør centrale statistiske begreber.
Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i
Læs mereKvantitative Metoder 1 - Forår 2007. Dagens program
Dagens program Hypoteser: kap: 10.1-10.2 Eksempler på Maximum likelihood analyser kap 9.10 Test Hypoteser kap. 10.1 Testprocedure kap 10.2 Teststørrelsen Testsandsynlighed 1 Estimationsmetoder Kvantitative
Læs merePhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006 I dag: To stikprøver fra en normalfordeling, ikke-parametriske metoder og beregning af stikprøvestørrelse Eksempel: Fiskeolie
Læs mereNormalfordelingen. Statistik og Sandsynlighedsregning 2
Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på
Læs mereMat2SS Vejledende besvarelse uge 11
MatSS Vejledende besvarelse uge Eksamen V99/00 opg. a Kønsfordelingen 996 den samme for de tre skoler Mænd Kvinder I alt København 5 = n x 56 = x 8 = n Odense 9 = n x 06 = x 5 = n Århus 0 = n x 40 = x
Læs mereOverheads til forelæsninger, mandag 5. uge På E har vi en mængde af mulige sandsynlighedsfordelinger for X, (P θ ) θ Θ.
Statistiske modeller (Definitioner) Statistik og Sandsynlighedsregning 2 IH kapitel 0 og En observation er en vektor af tal x (x,..., x n ) E, der repræsenterer udfaldet af et (eller flere) eksperimenter.
Læs mereKursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff
Kursus 02402 Introduktion til Statistik Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks
Læs merePersonlig stemmeafgivning
Ib Michelsen X 2 -test 1 Personlig stemmeafgivning Efter valget i 2005 1 har man udspurgt en mindre del af de deltagende, om de har stemt personligt. Man har svar fra 1131 mænd (hvoraf 54 % har stemt personligt
Læs mereMaple 11 - Chi-i-anden test
Maple 11 - Chi-i-anden test Erik Vestergaard 2014 Indledning I dette dokument skal vi se hvordan Maple kan bruges til at løse opgaver indenfor χ 2 tests: χ 2 - Goodness of fit test samt χ 2 -uafhængighedstest.
Læs mereNote til styrkefunktionen
Teoretisk Statistik. årsprøve Note til styrkefunktionen Først er det vigtigt at gøre sig klart, at når man laver statistiske test, så kan man begå to forskellige typer af fejl: Type fejl: At forkaste H
Læs mereHvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05
Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ
Læs mereEstimation og konfidensintervaller
Statistik og Sandsynlighedsregning STAT kapitel 4.4 Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne Estimation og konfidensintervaller Antag X Bin(n,
Læs mereTrin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse
Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ
Læs mere4. september 2003. π B = Lungefunktions data fra tirsdags Gennemsnit l/min
Epidemiologi og biostatistik Uge, torsdag 28. august 2003 Morten Frydenberg, Institut for Biostatistik. og hoste estimation sikkerhedsintervaller antagelr Normalfordelingen Prædiktion Statistisk test (udfra
Læs mereVærktøjshjælp for TI-Nspire CAS Struktur for appendiks:
Værktøjshjælp for TI-Nspire CAS Struktur for appendiks: Til hvert af de gennemgåede værktøjer findes der 5 afsnit. De enkelte afsnit kan læses uafhængigt af hinanden. Der forudsættes et elementært kendskab
Læs mereFig. 1 Billede af de 60 terninger på mit skrivebord
Simulation af χ 2 - fordeling John Andersen Introduktion En dag kastede jeg 60 terninger Fig. 1 Billede af de 60 terninger på mit skrivebord For at danne mig et billede af hyppighederne flyttede jeg rundt
Læs mereForelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6
Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220
Læs mereKapitlet indledes med en beskrivelse af - og opgaver med - de tre former for sandsynlighed, som er omtalt i læseplanen for 7.- 9.
Kapitlet indledes med en beskrivelse af - og opgaver med - de tre former for sandsynlighed, som er omtalt i læseplanen for 7.- 9. klassetrin: statistisk sandsynlighed, kombinatorisk sandsynlighed og personlig
Læs mereKønsproportion og familiemønstre.
Københavns Universitet Afdeling for Anvendt Matematik og Statistik Projektopgave forår 2005 Kønsproportion og familiemønstre. Matematik 2SS Inge Henningsen februar 2005 Indledning I denne opgave undersøges,
Læs mereForelæsning 8: Inferens for varianser (kap 9)
Kursus 02402 Introduktion til Statistik Forelæsning 8: Inferens for varianser (kap 9) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby
Læs mereSandsynlighedsregning: endeligt udfaldsrum (repetition)
Program: 1. Repetition: sandsynlighedsregning 2. Sandsynlighedsregning fortsat: stokastisk variabel, sandsynlighedsfunktion/tæthed, fordelingsfunktion. 1/16 Sandsynlighedsregning: endeligt udfaldsrum (repetition)
Læs mereOversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.
Kursus 242 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik Bygning 35/324 Danmarks Tekniske Universitet 28 Lyngby Danmark e-mail:
Læs mereForelæsning 3: Kapitel 5: Kontinuerte fordelinger
Kursus 02402 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs mereStatistik og Sandsynlighedsregning 1. IH kapitel 6
Statistik og Sandsynlighedsregning 1 IH kapitel 6 Overheads til forelæsninger. Uge 41/2005 1 Test i Polynomialfordelingen Forsøg: n uafhængige gentagelse af forsøg med m udfald. Vi observerer x = x 1,...,
Læs mereReminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model
Reminder: Hypotesetest for én parameter Antag vi har model Økonometri: Lektion 4 F -test Justeret R 2 Aymptotiske resultater y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi ønsker at teste hypotesen H
Læs mereAllan C. Malmberg. Terningkast
Allan C. Malmberg Terningkast INFA 2008 Programmet Terning Terning er et INFA-program tilrettelagt med henblik på elever i 8. - 10. klasse som har særlig interesse i at arbejde med situationer af chancemæssig
Læs mere02402 Løsning til testquiz02402f (Test VI)
02402 Løsning til testquiz02402f (Test VI) Spørgsmål 4. En ejendomsmægler ønsker at undersøge om hans kunder får mindre end hvad de har forlangt, når de sælger deres bolig. Han har regisreret følgende:
Læs mere2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900.
2 -fordeling og 2 -test Generelt om 2 -fordelingen 2 -fordelingen er en kontinuert fordeling, modsat binomialfordelingen som er en diskret fordeling. Fordelingen er særdeles kompleks at beskrive med matematiske
Læs mereOm at udregne enkeltstående hexadecimaler i tallet pi
Om at udregne enkeltstående hexadecimaler i tallet pi I 996 var det en sensation, da det kom frem, at det var lykkedes D. Bailey, P. Borwein og S. Plouffe at finde en formel for tallet π, med hvilken man
Læs mereVi kalder nu antal prøverør blandt de 20, hvor der ikke ses vækst for X.
Opgave I I en undersøgelse af et potentielt antibiotikum har man dyrket en kultur af en bestemt mikroorganisme og tilført prøver af organismen til 20 prøverør med et vækstmedium og samtidig har man tilført
Læs mereProjektopgave til Mat2SS. Espen Højsgaard (CPR xxxx) Rune Højsgaard (CPR xxxx)
Projektopgave til MatSS Espen Højsgaard (CPR 04038-xxxx) Rune Højsgaard (CPR 090678-xxxx) 1 1 Samme sandsynlighed for drengefødsel Vi har som udgangspunkt for løsning af opgaven brugt følgende tabeller,
Læs mereModul 5: Test for én stikprøve
Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 5: Test for én stikprøve 5.1 Test for middelværdi................................. 1 5.1.1 t-fordelingen.................................
Læs mereDeskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium
Deskriptiv (beskrivende) statistik er den disciplin, der trækker de væsentligste oplysninger ud af et ofte uoverskueligt materiale. Det sker f.eks. ved at konstruere forskellige deskriptorer, d.v.s. regnestørrelser,
Læs mereStatistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Introduktion Kasper K. Berthelsen, Inst f. Matematiske Fag Omfang: 8 Kursusgang I fremtiden
Læs merefor matematik pä B-niveau i hf
for matematik pä B-niveau i hf 014 Karsten Juul TEST 1 StikprÅver... 1 1.1 Hvad er populationen?... 1 1. Hvad er stikpråven?... 1 1.3 Systematiske fejl ved valg af stikpråven.... 1 1.4 TilfÇldige fejl
Læs mereAnvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af
Læs mereTeoretisk Statistik, 2. december 2003. Sammenligning af poissonfordelinger
Uge 49 I Teoretisk Statistik, 2. december 2003 Sammenligning af poissonfordelinger o Generel teori o Sammenligning af to poissonfordelinger o Eksempel Opsummering om multinomialfordelinger Fishers eksakte
Læs mereEffekter af studiejob, udveksling og projektorienterede forløb
Effekter af studiejob, udveksling og projektorienterede forløb En effektanalyse af kandidatstuderendes tilvalg på universiteterne Blandt danske universitetsstuderende er det en udbredt praksis at supplere
Læs mereKvantitative Metoder 1 - Efterår Dagens program
Dagens program Estimation: Kapitel 9.7-9.10 Estimationsmetoder kap 9.10 Momentestimation Maximum likelihood estimation Test Hypoteser kap. 10.1 Testprocedure kap 10.2 Teststørrelsen Testsandsynlighed 1
Læs mereStikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader
Stikprøver og stikprøve fordelinger Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Statistik Statistisk Inferens: Prediktere og forekaste værdier af
Læs mereHypotese test. Repetition fra sidst Hypoteser Test af middelværdi Test af andel Test af varians Type 1 og type 2 fejl Signifikansniveau
ypotese test Repetition fra sidst ypoteser Test af middelværdi Test af andel Test af varians Type 1 og type fejl Signifikansniveau Konfidens intervaller Et konfidens interval er et interval, der estimerer
Læs mereOpgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)
Kursus 02402: Besvarelser til øvelsesopgaver i uge 9 Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Som model benyttes en binomialfordeling, som beskriver antallet, X, blandt
Læs mereRegneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)
Formelsamlingen 1 Regneregler for middelværdier M(a + bx) a + bm X M(X+Y) M X +M Y Spredning varians og standardafvigelse VAR(X) 1 n n i1 ( X i - M x ) 2 Y a + bx VAR(Y) VAR(a+bX) b²var(x) 2 Kovariansen
Læs mereVejledende besvarelse af eksamen i Statistik for biokemikere, blok
Opgave 1 Vejledende besvarelse af eksamen i Statistik for biokemikere, blok 2 2006 Inge Henningsen og Niels Richard Hansen Analysevariablen i denne opgave er variablen forskel, der for hver af 10 kvinder
Læs mereOptimale konstruktioner - når naturen former. Opgaver. Opgaver og links, der knytter sig til artiklen om topologioptimering
Opgaver Opgaver og links, der knytter sig til artiklen om solsikke Opgave 1 Opgave 2 Opgaver og links, der knytter sig til artiklen om bobler Opgave 3 Opgave 4 Opgaver og links, der knytter sig til artiklen
Læs mereKonfidensinterval for µ (σ kendt)
Program 1. Repetition: konfidens-intervaller. 2. Hypotese test 3. Type I og type II fejl, p-værdi 4. En og to-sidede tests 5. Test for middelværdi (kendt varians) 6. Test for middelværdi (ukendt varians)
Læs mereProgram. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration
Faculty of Life Sciences Program Modelkontrol og prædiktion Claus Ekstrøm E-mail: ekstrom@life.ku.dk Test af hypotese i ensidet variansanalyse F -tests og F -fordelingen. Multiple sammenligninger. Bonferroni-korrektion
Læs mereStatistiske modeller
Statistiske modeller Statistisk model Datamatrice Variabelmatrice Hændelse Sandsynligheder Data Statistiske modeller indeholder: Variable Hændelser defineret ved mulige variabel værdier Sandsynligheder
Læs merec) For, er, hvorefter. Forklar.
1 af 13 MATEMATIK B hhx Udskriv siden FACITLISTE TIL KAPITEL 7 ØVELSER ØVELSE 1 c) ØVELSE 2 og. Forklar. c) For, er, hvorefter. Forklar. ØVELSE 3 c) ØVELSE 4 90 % konfidensinterval: 99 % konfidensinterval:
Læs mereI dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd
I dag Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik SaSt) Helle Sørensen Først lidt om de sidste uger af SaSt. Derefter statistisk analyse af en enkelt
Læs mereTema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.
Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller
Læs mereKapitel 7 Forskelle mellem centraltendenser
Kapitel 7 Forskelle mellem centraltendenser Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 29 Indledning 1. z-test for ukorrelerede data 2. t-test for ukorrelerede data med ens
Læs mereStatistik II 4. Lektion. Logistisk regression
Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Indledende om Signifikanstest Boldøvelser
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Indledende om Signifikanstest Boldøvelser 1 Påstand: Et nyt præparat M virker mod migræne. Inden præparatet kan markedsføres, skal denne påstand
Læs mereSANDSYNLIGHED FACIT SIDE 154-155
SIDE 154-155 Opgave 1 A. Data (x) h(x) f(x) 2 1 0,042 3 3 0,125 4 6 0,25 5 3 0,125 6 4 0,16 7 1 0,042 8 2 0,0833 9 1 0,042 10 2 0,0833 11 1 0,042 B. C. Diagrammet (et søjlediagram) er lavet ud fra hyppigheden,
Læs mereHypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0
Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt
Læs mereStatistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
Statistik II Lektion 3 Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Setup: To binære variable X og Y. Statistisk model: Konsekvens: Logistisk regression: 2 binære var. e e X Y P
Læs mereRygtespredning: Et logistisk eksperiment
Rygtespredning: Et logistisk eksperiment For at det nu ikke skal ende i en omgang teoretisk tørsvømning er det vist på tide vi kigger på et konkret logistisk eksperiment. Der er selvfølgelig flere muligheder,
Læs mereOm hypoteseprøvning (1)
E6 efterår 1999 Notat 16 Jørgen Larsen 11. november 1999 Om hypoteseprøvning 1) Det grundlæggende problem kan generelt formuleres sådan: Man har en statistisk model parametriseret med en parameter θ Ω;
Læs mereSupplement til kapitel 7: Approksimationen til normalfordelingen, s. 136
Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 36 Det er besværligt at regne med binomialfordelingen, og man vælger derfor ofte at bruge en approksimation med normalfordeling. Man
Læs mereUndervisningsbeskrivelse
Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Maj-juni, 2015/16 Institution Vid Gymnasier Uddannelse Fag og niveau Lærer(e) Hold hhx Matematik B Hasse Rasmussen
Læs mereLogistisk Regression. Repetition Fortolkning af odds Test i logistisk regression
Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression: Definitioner For en binær (0/) variabel Y antager vi P(Y)p P(Y0)-p Eksempel: Bil til arbejde vs alder
Læs mereEn oversigt over udvalgte kontinuerte sandsynlighedsfordelinger
Institut for Økonomi Aarhus Universitet Statistik 1, Forår 2001 Allan Würtz 4. April, 2001 En oversigt over udvalgte kontinuerte sandsynlighedsfordelinger Uniform fordeling Benyttes som model for situationer,
Læs mereJ E T T E V E S T E R G A A R D
BINOMIALT EST J E T T E V E S T E R G A A R D F I P B I O L O G I M A R S E L I S B O R G G Y M N A S I U M D. 1 3. M A R T S 2 0 1 9 K A L U N D B O R G G Y M N A S I U M D. 1 4. M A R T S 2 0 1 9 HVEM
Læs merefor gymnasiet og hf 2016 Karsten Juul
for gymnasiet og hf 75 50 5 016 Karsten Juul Statistik for gymnasiet og hf Ä 016 Karsten Juul 4/1-016 Nyeste version af dette håfte kan downloades fra http://mat1.dk/noter.htm HÅftet mç benyttes i undervisningen
Læs mereBilledbehandling og mønstergenkendelse: Lidt elementær statistik (version 1)
; C ED 6 > Billedbehandling og mønstergenkendelse Lidt elementær statistik (version 1) Klaus Hansen 24 september 2003 1 Elementære empiriske mål Hvis vi har observationer kan vi udregne gennemsnit og varians
Læs mereKapitel 4 Sandsynlighed og statistiske modeller
Kapitel 4 Sandsynlighed og statistiske modeller Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 Indledning 2 Sandsynlighed i binomialfordelingen 3 Normalfordelingen 4 Modelkontrol
Læs mereDagens Temaer. Test for lineær regression. Test for lineær regression - via proc glm. k normalfordelte obs. rækker i proc glm. p. 1/??
Dagens Temaer k normalfordelte obs. rækker i proc glm. Test for lineær regression Test for lineær regression - via proc glm p. 1/?? Proc glm Vi indlæser data i datasættet stress, der har to variable: areal,
Læs mereKonfidensintervaller og Hypotesetest
Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller
Læs mereEn intro til radiologisk statistik
En intro til radiologisk statistik Erik Morre Pedersen Hypoteser og testning Statistisk signifikans 2 x 2 tabellen og lidt om ROC Inter- og intraobserver statistik Styrkeberegning Konklusion Litteratur
Læs mereLEKTION 22 FARVEBEHANDLING
LEKTION 22 FARVEBEHANDLING I hvert eneste spil skal man som spilfører tage stilling til, hvordan samtlige fire farver skal spilles. Derfor er dette et vigtigt område i selve spilføringen. Mange kombinationer
Læs mereProgram. 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test.
Program 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test. 1/19 Konfidensinterval for µ (σ kendt) Estimat ˆµ = X bedste bud
Læs mereSandsynlighedsregning 2. forelæsning Bo Friis Nielsen
Vigtigste nye emner i.,. og.5 Sandsynlighedsregning. forelæsning Bo Friis Nielsen Anvendt Matematik og Computer Siene Danmarks Tekniske Universitet 800 Kgs. Lyngby Danmark Email: bfni@dtu.dk Binomialfordelingen
Læs mereStatikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression
Statikstik II 2. Lektion Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Sandsynlighedsregningsrepetition Antag at Svar kan være Ja og Nej. Sandsynligheden for at Svar Ja skrives
Læs mereForældretilfredshed 2015
Antal svar: 23, svarprocent: 77% INFORMATION OM UNDERSØGELSEN Forældretilfredshed 2015 er et samarbejde mellem Daginstitutionernes Lands-Organisation (DLO) og konsulentvirksomheden SURVIO. Formålet er
Læs mereNanostatistik: Opgavebesvarelser
Nanostatistik: Opgavebesvarelser JLJ Nanostatistik: Opgavebesvarelser p. 1/16 Pakkemaskine En producent hævder at poserne indeholder i gennemsnit 16 ounces sukker. Data: 10 pakker sukker: 16.1, 15.8, 15.8,
Læs mere1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...
Indhold 1 Statistisk inferens: Hypotese og test 2 1.1 Nulhypotese - alternativ.................................. 2 1.2 Teststatistik........................................ 3 1.3 P-værdi..........................................
Læs mereUndervisningsbeskrivelse
Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Vinter 2015-2016 Institution Vestegnen HF & VUC Uddannelse Fag og niveau Lærer Hold HF: E-learning Matematik
Læs mereUndervisningsbeskrivelse
Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Institution Uddannelse Fag og niveau Lærer(e) Hold Termin hvori undervisningen afsluttes: Juni 2013 Roskilde
Læs mere{ } { } {( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )}
Stokastisk eksperiment Et stokastisk eksperiment er et eksperiment, hvor vi fornuftigvis ikke på forhånd kan have en formodning om resultatet af eksperimentet. Til gengæld kan vi prøve at sige noget om,
Læs mereStatistik II 1. Lektion. Analyse af kontingenstabeller
Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression
Læs mereResumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se
Epidemiologi og biostatistik. Uge, torsdag 5. februar 00 Morten Frydenberg, Institut for Biostatistik. Type og type fejl Statistisk styrke Nogle speciale metoder: Normalfordelte data : t-test eksakte sikkerhedsintervaller
Læs mereBILAG 3: DETALJERET REDEGØ- RELSE FOR REGISTER- ANALYSER
Til Undervisningsministeriet (Kvalitets- og Tilsynsstyrelsen) Dokumenttype Bilag til Evaluering af de nationale test i folkeskolen Dato September 2013 BILAG 3: DETALJERET REDEGØ- RELSE FOR REGISTER- ANALYSER
Læs mereKursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet March 1, 2013 Sandsynlighedsregning og lagerstyring Normalfordelingen
Læs mereMETODESAMLING TIL ELEVER
METODESAMLING TIL ELEVER I dette materiale kan I finde forskellige metoder til at arbejde med kreativitet og innovation i forbindelse med den obligatoriske projektopgave. Metoderne kan hjælpe jer til:
Læs mereRettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007
Rettevejledning til eksamen i Kvantitative metoder 1,. årsprøve. januar 007 I rettevejledningen henvises der til Berry and Lindgren "Statistics Theory and methods"(b&l) hvis ikke andet er nævnt. Opgave
Læs mereLøsning eksamen d. 15. december 2008
Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Læs mereTjek. lønnen. Et værktøj til at undersøge lokal løndannelse og ligeløn på offentlige arbejdspladser. 2007 udgave Varenr. 7520
Tjek lønnen Et værktøj til at undersøge lokal løndannelse og ligeløn på offentlige arbejdspladser 2007 udgave Varenr. 7520 Indholdsfortegnelse Forord... 3 Teknisk introduktion... 4 Indledning... 5 Introduktion
Læs mereHvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau
Hvad skal vi lave? 1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ. Teststatistik P-værdi Signifikansniveau 2 t-test for middelværdi Tosidet t-test for middelværdi Ensidet t-test for middelværdi
Læs mereEn Maple time med efterfølgende elevgruppe diskussion og refleksionssamtale med lærer.
Bilag 5 En Maple time med efterfølgende elevgruppe diskussion og refleksionssamtale med lærer. Indledning Vi har som led i projektet observeret en del lektioner, med helt eller delvis fokus på Maple-brug.
Læs mereUndervisningsbeskrivelse
Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin juni 2019 Institution Uddannelse Fag og niveau Lærer(e) Hold Haderslev Handelsskole hhx Matematik B Carsten
Læs mereEpidemiologi og Biostatistik Opgaver i Biostatistik Uge 4: 2. marts
Århus 27. februar 2011 Morten Frydenberg Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 4: 2. marts Epibasic er nu opdateret til version 2.02 (obs. der er ikke ændret ved arket C-risk) Start med
Læs mereSamtaleteknik. At spørge sig frem
Omkring spørgeteknikken: Brug HV-ord: hvordan kan det være / hvad skulle der til for at ændre/ hvad ville der ske hvis. Men undgå hvorfor Har du nogen fornemmelse af hvad det er der går galt? Hvis nu din
Læs mereSkriftlig eksamen Science statistik- ST501
SYDDANSK UNIVERSITET INSTITUT FOR MATEMATIK OG DATALOGI Skriftlig eksamen Science statistik- ST501 Torsdag den 21. januar Opgavesættet består af 5 opgaver, med i alt 13 delspørgsmål, som vægtes ligeligt.
Læs mereDagens program. Praktisk information:
Dagens program Praktisk information: Husk hjemmeopgaven i statistik Hypoteseprøvning kap. 11.2,11.3 og 11.8 Eksempel på test Styrkefunktionen kap. 11.2 Stikprøvens størrelse kap. 11.3 Likelihood ratio
Læs mereUndervisningsbeskrivelse
Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Juni, 2014 Institution Vid Gymnasier, Rønde Uddannelse Fag og niveau Lærer(e) Hold hhx Matematik B Ann Risvang
Læs mere