Statistik i basketball
|
|
|
- Albert Kjær
- 9 år siden
- Visninger:
Transkript
1 En note til opgaveskrivning 4. marts 200 Indledning I Falcon og andre klubber er der en del gymnasieelever, der på et tidspunkt i løbet af deres gymnasietid skal skrive en større opgave. Er man interesseret i matematik, og ønsker man at kombinere det med ens interesse for basketball, er en opgave om anvendelser af statistik i basketball en spændende mulighed. Der findes mange udmærkede bøger om statistik på alle niveauer, men der er mig bekendt ingen litteratur på dansk, der behandler konkrete anvendelser på scoringsprocenter i basketball. Dette tomrum forsøger denne lille note at udfylde. Den er altså rettet mod gymnasieelever, og bør ses som et supplement til de gymnasiale lærebøger. Sportsinteresserede i almindelighed med en interesse for statistik vil dog givetvis også kunne have glæde af noten. Et matematisk niveau svarende til gymnasiet samt lysten til at lære stoffet er eneste forudsætning. Binomialfordelingen En spillers scoringsprocent kan angives som et tal p [0, ]. Antager vi at scoringsforsøgenes udfald ikke påvirker hinanden (at de er uafhængige kan vi opfatte dette som at et forsøg på at score vil lykkes med sandsynlighed p. Man kan så spørge om, hvad sandsynligheden er for at en spiller med scoringsprocent p scorer på netop x ud af n skud eller formuleret matematisk: Hvis X er en stokastisk variabel, der angiver antallet af scoringer ud af n forsøg, hvad er da P (X x. Binomialfordelingen giver svaret n P (X x p x ( p n x, ( x hvor ( n x kaldes binomialkoefficienten n over x og er givet ved n n! x x!(n x!, hvor k! 2 (k k. Eksempel Med en scoringsprocent er 50 % er sandsynligheden for at score på 3 ud af 5 skud 5 /6. Tak til Morten Hornbech for mange kommentarer samt hjælp til at gøre formuleringerne mere klare.
2 Statistisk model En statistisk model består af en mængde af mulige observationer (udfaldsrummet og en mængde af mulige fordelinger for disse observationer. En fordeling tildeler hver observation en sandsynlig således at summen bliver. Ser vi på situationen fra før er mængden af mulige observationer givet ved E {0,,..., n}, altså de mulige antal gange man kan scorer på n skud. Mængden af mulige fordelinger er givet ved binomialfordelingerne for alle p [0, ], da vi forestiller os at vi ikke på forhånd kender spillerens scoringsprocent. Den korte notation for modellen er (E, (P p p [0,], (2 I denne model kan man udfra relevant skudstatistik undersøge om en given spiller eller et givent hold kan antages at have scoringssandsynlighed p. Eksempel Simon har skudt 25 straffekast og scoret på 7 (vores observation. Er det rimeligt at antage at Simons scoringssandsynlighed er 0,75? Man kunne også være interesseret i at sammenligne to spillere/hold. I dette tilfælde bliver den statistiske model (E, (P (p,p 2 (p,p 2 [0,] 2, (3 med E {0,..., n } {0,..., n 2 }, hvor n og n 2 er antallet af scoringsforsøg for den ene henholdsvis den anden spiller/hold, og n P (p,p 2 (X x, X 2 x 2 p x ( p n x n2 p x 2 2 ( p 2 n 2 x 2 x 2 r ( nr xr x 2 p xr r ( p r nr xr. Det forudsættes her at alle observationerne er uafhængige. Eksempel Falcons damehold har i første halvdel af sæsonen skudt 39 3 ere og ramt på 57, mens de i anden halvdel af sæsonen har skudt 09 3 ere og ramt på 56. Er Falcon blevet bedre til at skyde i løbet af sæsonen? Estimation Ofte er man interesseret i at estimere dvs. gætte en given størrelse fx et holds skudprocent så godt som muligt. Det bedste gæt (det mest sandsynlige valg betegnes maksimaliseringsestimatoren, som betegnes med ˆp. I binomialmodellen er ˆp x n, hvilket intuitivt ikke overrasker (hvorfor ikke? Kan du bevise det matematisk?. Test og hypoteser Signifikansniveau Man vælger på forhånd ens signifikansniveau ofte betegnet α. Man vælger stort set altid α 0.05, uden at nogen ville påstå, at det er bedre end så meget andet. Man kan tænke på signifikansniveau som følger: Man forestiller sig, at man kan gentage eksperimentet et utal af gange. Hvis den situation vi ser i vores data 2
3 forekommer mindre end 5 % af gangene vil vi sige, at det er for ekstremt til at være i overensstemmelse med vores model (under hypotesen og vi forkaster den. Eksempel En straffekastskytte skyder 0 skud og rammer på skud. Vi vil undersøge hypotesen om, at hendes scoringsprocent er 70 %. Hypotesen ender med at blive forkastet af følgende grund: Forestiller vi os, at hun ville have en scoringsprocent på 70 % og vi 00 gange satte hende til at skyde 0 straffekast ville det under 5 % af gangene ske, at hun kun ville ramme et skud. Derfor tror vi ikke på, at hendes scoringsprocent er 70 % og hypotesen forkastes. Hypoteser Typisk vil en hypotese være der er forskel på hold A og hold B s scoringsprocenter. I statistik undersøger man dog altid hypoteser på formen der er ingen forskel på hold A og hold B s scoringsprocenter, og ser så om man kan forkaste denne hypotese. Her gælder det om at holde tungen lige i munden: Man viser altså ikke, at der er forskel, men afviser i stedet på et givet signifikansniveau, at der ingen forskel er. Læs lige det igen! En hypotese i modellen givet ved (2 kaldes en simpel hypotese og skrives som: H 0 : p p. (4 Derimod kaldes en hypotese i modellen givet ved (3 for en sammensat hypotese: H : p p 2 p. (5 Teststørrelse Der findes et utal af teststørrelser man kan bruge, hvor en ofte brugt er kvotientteststørrelsen, Q(x. For en simpel hypotese har vi (4 Q(x ˆp x p ˆp n x p x/n x p x/n n x, p mens den for sammenligning af to grupper, dvs. sammensat hypotese (5, er Q(x 2 x n xr r (n x n nr xr r, (6 r x r n (n r x r n hvor n n + n 2 og x x + x 2. En teststørrelse er en hjælpestørrelse, der skal hjælpe os med at sige noget om, hvor godt en observation passer med vores hypotese. Testsandsynligheden Kaldes også for p-værdien for et test, og betegnes med ɛ(x for en given observation x. Følgende er sprogligt kludret så læs det langsomt! Testsandsynligheden udtrykker sandsynligheden for at få en observation, der passer dårligere eller lige så dårligt, som det vi har observeret under antagelsen om, at hypotesen H er opfyldt. Lad os sige, at ɛ(x 0.5. Det betyder altså, at hvis vi udfører eksperimentet et stort antal gange vil vi i gennemsnit 50 % af gangene få en observation, der passer dårligere. Således må vores konkrete observation x altså passe ganske godt. Jo større testsandsynligheden er jo mere rigtig er ens hypotese. Når man på forhånd har fastlagt et signifikansniveau α, forkaster man hypotesen H på niveau α, hvis ɛ(x α. 3
4 Approksimation af testsandsynlighed Man kan ofte godt finde testsandsynligheden eksakt, men det er utrolig besværligt. Heldigvis gælder følgende tilnærmelse/approksimation der meget hurtigt bliver ret god for store n og n 2 (i praksis bare større end 5-stykker: ɛ(x F χ 2 ( 2 log Q(x. Her er F χ 2 fordelingsfunktionen for χ 2 -fordelingen med frihedsgrad, mens log betegner den naturlige logaritme (ofte ln i gymnasiet. Man får selvfølgelig et tal ud af 2 log Q(x, der i øvrigt skal være positivt (ellers har man tastet/regnet forkert!. Dette sættes så ind i en (computer tabel for χ 2 -fordelingen, som man fx kan finde på chi-square-table.php. Pas på! Tabellen angiver F χ 2 (y, altså testsandsynligheden, og i øvrigt står DF for frihedsgrader (degrees of freedom. Vi er på jagt efter det y hvor F χ 2 (y Er nemlig y større må vi forkaste vores hypotese. Ifølge tabellen er grænsen y 3.84 for én frihedsgrad. Det vil sige, at hvis 2 log Q(x > 3.84 må vi forkaste hypotesen. Gennemregnet eksempel Hold A har skudt 738 og ramt 342. Hold B har skudt 584 og ramt 238. Den statistiske model bliver (E, (P (p,p 2 (p,p 2 [0,] 2 med E {0,..., 738} {0,..., 342}. Udfaldsrummet er altså alle tænkelige kombinationer af talpar, hvor. koordinaten ligger mellem 0 og 738, mens 2. koordinaten ligger mellem 0 og 584: fx (32, 34, men ikke (342, 603. Videre er P (p,p 2 (X 342, X ( hvor p [0, ] og p 2 [0, ]. Vores hypotese er: ( 584 p 342 ( p H 0 : Der er ingen forskel på hold A og hold B skudprocent. p ( p , Vi finder kvotientteststørrelsen ved at sætte ind i (6, og får Q(x Dermed bliver 2 log Q(x 4.3. Dette er klart større end 3.83, så hypotesen forkastes med et brag. Der er altså forskel! Vores bedste estimat for scoringsprocenterne for hold A er ˆp %, mens vi for hold B finder ˆp %. At vi finder, at der er en forskel er betryggende, da der er 6 procentpoints forskel, og begge hold har skudt et stort antal skud. Hvad mangler? Det er selvfølgelig ikke muligt på så lidt plads at behandle alt; så hvad mangler? Der mangler motivationen for, hvorfor vi gør som vi gør. Det kan virke oplagt og Udtales ki-i-anden. Hvis man sammenligner k grupper skal man bruge χ 2 -fordelingen med k frihedsgrader. 4
5 rigtigt, men der er også andre måder at gøre det på. Når man så har fastlagt sig på principperne skal man bevise, at det rent faktisk ender med at blive de formler vi har brugt. Hvis man har lyst til at fylde mere matematisk indhold i sin opgave er dette en mulig vej at gå. Ønsker man derimod at diskutere baggrunden for statistik, er der også masser at hente. Spørgsmål som hvilket signifikansniveau skal man bruge?, hvorfor overhovedet vælge signifikansniveau? Kan man ikke bare finde ens testsandsynlighed og så se om man er tilfreds?, hvad betyder det, at man forkaster en hypotese?, hvad er type I og type II fejl? og mange flere danner et godt grundlag for en omfattende diskussion af statistik. Et andet populært tema er de såkaldte player efficiency ratings, der i mange ligaer bruges til at vurdere, hvor produktive/effektive en spiller er. Dette emne er uddybende behandlet i Matheletics af Wayne Winston. Spørgsmål, rettelser og kommentarer modtages meget gerne via mail på [email protected]. 5
Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination
Susanne Ditlevsen Institut for Matematiske Fag Email: [email protected] http://math.ku.dk/ susanne
Statistik og Sandsynlighedsregning 1 Indledning til statistik, kap 2 i STAT Susanne Ditlevsen Institut for Matematiske Fag Email: [email protected] http://math.ku.dk/ susanne 5. undervisningsuge, onsdag
Tema. Dagens tema: Indfør centrale statistiske begreber.
Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i
Kvantitative Metoder 1 - Forår 2007. Dagens program
Dagens program Hypoteser: kap: 10.1-10.2 Eksempler på Maximum likelihood analyser kap 9.10 Test Hypoteser kap. 10.1 Testprocedure kap 10.2 Teststørrelsen Testsandsynlighed 1 Estimationsmetoder Kvantitative
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006 I dag: To stikprøver fra en normalfordeling, ikke-parametriske metoder og beregning af stikprøvestørrelse Eksempel: Fiskeolie
Normalfordelingen. Statistik og Sandsynlighedsregning 2
Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på
Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff
Kursus 02402 Introduktion til Statistik Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks
Personlig stemmeafgivning
Ib Michelsen X 2 -test 1 Personlig stemmeafgivning Efter valget i 2005 1 har man udspurgt en mindre del af de deltagende, om de har stemt personligt. Man har svar fra 1131 mænd (hvoraf 54 % har stemt personligt
Maple 11 - Chi-i-anden test
Maple 11 - Chi-i-anden test Erik Vestergaard 2014 Indledning I dette dokument skal vi se hvordan Maple kan bruges til at løse opgaver indenfor χ 2 tests: χ 2 - Goodness of fit test samt χ 2 -uafhængighedstest.
Note til styrkefunktionen
Teoretisk Statistik. årsprøve Note til styrkefunktionen Først er det vigtigt at gøre sig klart, at når man laver statistiske test, så kan man begå to forskellige typer af fejl: Type fejl: At forkaste H
Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05
Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ
Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse
Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ
Værktøjshjælp for TI-Nspire CAS Struktur for appendiks:
Værktøjshjælp for TI-Nspire CAS Struktur for appendiks: Til hvert af de gennemgåede værktøjer findes der 5 afsnit. De enkelte afsnit kan læses uafhængigt af hinanden. Der forudsættes et elementært kendskab
Fig. 1 Billede af de 60 terninger på mit skrivebord
Simulation af χ 2 - fordeling John Andersen Introduktion En dag kastede jeg 60 terninger Fig. 1 Billede af de 60 terninger på mit skrivebord For at danne mig et billede af hyppighederne flyttede jeg rundt
Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6
Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220
Kapitlet indledes med en beskrivelse af - og opgaver med - de tre former for sandsynlighed, som er omtalt i læseplanen for 7.- 9.
Kapitlet indledes med en beskrivelse af - og opgaver med - de tre former for sandsynlighed, som er omtalt i læseplanen for 7.- 9. klassetrin: statistisk sandsynlighed, kombinatorisk sandsynlighed og personlig
Kønsproportion og familiemønstre.
Københavns Universitet Afdeling for Anvendt Matematik og Statistik Projektopgave forår 2005 Kønsproportion og familiemønstre. Matematik 2SS Inge Henningsen februar 2005 Indledning I denne opgave undersøges,
Sandsynlighedsregning: endeligt udfaldsrum (repetition)
Program: 1. Repetition: sandsynlighedsregning 2. Sandsynlighedsregning fortsat: stokastisk variabel, sandsynlighedsfunktion/tæthed, fordelingsfunktion. 1/16 Sandsynlighedsregning: endeligt udfaldsrum (repetition)
Forelæsning 3: Kapitel 5: Kontinuerte fordelinger
Kursus 02402 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model
Reminder: Hypotesetest for én parameter Antag vi har model Økonometri: Lektion 4 F -test Justeret R 2 Aymptotiske resultater y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi ønsker at teste hypotesen H
Allan C. Malmberg. Terningkast
Allan C. Malmberg Terningkast INFA 2008 Programmet Terning Terning er et INFA-program tilrettelagt med henblik på elever i 8. - 10. klasse som har særlig interesse i at arbejde med situationer af chancemæssig
02402 Løsning til testquiz02402f (Test VI)
02402 Løsning til testquiz02402f (Test VI) Spørgsmål 4. En ejendomsmægler ønsker at undersøge om hans kunder får mindre end hvad de har forlangt, når de sælger deres bolig. Han har regisreret følgende:
2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900.
2 -fordeling og 2 -test Generelt om 2 -fordelingen 2 -fordelingen er en kontinuert fordeling, modsat binomialfordelingen som er en diskret fordeling. Fordelingen er særdeles kompleks at beskrive med matematiske
Om at udregne enkeltstående hexadecimaler i tallet pi
Om at udregne enkeltstående hexadecimaler i tallet pi I 996 var det en sensation, da det kom frem, at det var lykkedes D. Bailey, P. Borwein og S. Plouffe at finde en formel for tallet π, med hvilken man
Modul 5: Test for én stikprøve
Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 5: Test for én stikprøve 5.1 Test for middelværdi................................. 1 5.1.1 t-fordelingen.................................
Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium
Deskriptiv (beskrivende) statistik er den disciplin, der trækker de væsentligste oplysninger ud af et ofte uoverskueligt materiale. Det sker f.eks. ved at konstruere forskellige deskriptorer, d.v.s. regnestørrelser,
Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Introduktion Kasper K. Berthelsen, Inst f. Matematiske Fag Omfang: 8 Kursusgang I fremtiden
for matematik pä B-niveau i hf
for matematik pä B-niveau i hf 014 Karsten Juul TEST 1 StikprÅver... 1 1.1 Hvad er populationen?... 1 1. Hvad er stikpråven?... 1 1.3 Systematiske fejl ved valg af stikpråven.... 1 1.4 TilfÇldige fejl
Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af
Teoretisk Statistik, 2. december 2003. Sammenligning af poissonfordelinger
Uge 49 I Teoretisk Statistik, 2. december 2003 Sammenligning af poissonfordelinger o Generel teori o Sammenligning af to poissonfordelinger o Eksempel Opsummering om multinomialfordelinger Fishers eksakte
Effekter af studiejob, udveksling og projektorienterede forløb
Effekter af studiejob, udveksling og projektorienterede forløb En effektanalyse af kandidatstuderendes tilvalg på universiteterne Blandt danske universitetsstuderende er det en udbredt praksis at supplere
Kvantitative Metoder 1 - Efterår Dagens program
Dagens program Estimation: Kapitel 9.7-9.10 Estimationsmetoder kap 9.10 Momentestimation Maximum likelihood estimation Test Hypoteser kap. 10.1 Testprocedure kap 10.2 Teststørrelsen Testsandsynlighed 1
Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader
Stikprøver og stikprøve fordelinger Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Statistik Statistisk Inferens: Prediktere og forekaste værdier af
Hypotese test. Repetition fra sidst Hypoteser Test af middelværdi Test af andel Test af varians Type 1 og type 2 fejl Signifikansniveau
ypotese test Repetition fra sidst ypoteser Test af middelværdi Test af andel Test af varians Type 1 og type fejl Signifikansniveau Konfidens intervaller Et konfidens interval er et interval, der estimerer
Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)
Formelsamlingen 1 Regneregler for middelværdier M(a + bx) a + bm X M(X+Y) M X +M Y Spredning varians og standardafvigelse VAR(X) 1 n n i1 ( X i - M x ) 2 Y a + bx VAR(Y) VAR(a+bX) b²var(x) 2 Kovariansen
Vejledende besvarelse af eksamen i Statistik for biokemikere, blok
Opgave 1 Vejledende besvarelse af eksamen i Statistik for biokemikere, blok 2 2006 Inge Henningsen og Niels Richard Hansen Analysevariablen i denne opgave er variablen forskel, der for hver af 10 kvinder
Optimale konstruktioner - når naturen former. Opgaver. Opgaver og links, der knytter sig til artiklen om topologioptimering
Opgaver Opgaver og links, der knytter sig til artiklen om solsikke Opgave 1 Opgave 2 Opgaver og links, der knytter sig til artiklen om bobler Opgave 3 Opgave 4 Opgaver og links, der knytter sig til artiklen
Konfidensinterval for µ (σ kendt)
Program 1. Repetition: konfidens-intervaller. 2. Hypotese test 3. Type I og type II fejl, p-værdi 4. En og to-sidede tests 5. Test for middelværdi (kendt varians) 6. Test for middelværdi (ukendt varians)
Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration
Faculty of Life Sciences Program Modelkontrol og prædiktion Claus Ekstrøm E-mail: [email protected] Test af hypotese i ensidet variansanalyse F -tests og F -fordelingen. Multiple sammenligninger. Bonferroni-korrektion
Statistiske modeller
Statistiske modeller Statistisk model Datamatrice Variabelmatrice Hændelse Sandsynligheder Data Statistiske modeller indeholder: Variable Hændelser defineret ved mulige variabel værdier Sandsynligheder
c) For, er, hvorefter. Forklar.
1 af 13 MATEMATIK B hhx Udskriv siden FACITLISTE TIL KAPITEL 7 ØVELSER ØVELSE 1 c) ØVELSE 2 og. Forklar. c) For, er, hvorefter. Forklar. ØVELSE 3 c) ØVELSE 4 90 % konfidensinterval: 99 % konfidensinterval:
Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.
Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller
Kapitel 7 Forskelle mellem centraltendenser
Kapitel 7 Forskelle mellem centraltendenser Peter Tibert Stoltze [email protected] Elementær statistik F2011 1 / 29 Indledning 1. z-test for ukorrelerede data 2. t-test for ukorrelerede data med ens
Statistik II 4. Lektion. Logistisk regression
Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Indledende om Signifikanstest Boldøvelser
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Indledende om Signifikanstest Boldøvelser 1 Påstand: Et nyt præparat M virker mod migræne. Inden præparatet kan markedsføres, skal denne påstand
SANDSYNLIGHED FACIT SIDE 154-155
SIDE 154-155 Opgave 1 A. Data (x) h(x) f(x) 2 1 0,042 3 3 0,125 4 6 0,25 5 3 0,125 6 4 0,16 7 1 0,042 8 2 0,0833 9 1 0,042 10 2 0,0833 11 1 0,042 B. C. Diagrammet (et søjlediagram) er lavet ud fra hyppigheden,
Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0
Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt
Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
Statistik II Lektion 3 Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Setup: To binære variable X og Y. Statistisk model: Konsekvens: Logistisk regression: 2 binære var. e e X Y P
Rygtespredning: Et logistisk eksperiment
Rygtespredning: Et logistisk eksperiment For at det nu ikke skal ende i en omgang teoretisk tørsvømning er det vist på tide vi kigger på et konkret logistisk eksperiment. Der er selvfølgelig flere muligheder,
Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136
Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 36 Det er besværligt at regne med binomialfordelingen, og man vælger derfor ofte at bruge en approksimation med normalfordeling. Man
Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression
Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression: Definitioner For en binær (0/) variabel Y antager vi P(Y)p P(Y0)-p Eksempel: Bil til arbejde vs alder
En oversigt over udvalgte kontinuerte sandsynlighedsfordelinger
Institut for Økonomi Aarhus Universitet Statistik 1, Forår 2001 Allan Würtz 4. April, 2001 En oversigt over udvalgte kontinuerte sandsynlighedsfordelinger Uniform fordeling Benyttes som model for situationer,
J E T T E V E S T E R G A A R D
BINOMIALT EST J E T T E V E S T E R G A A R D F I P B I O L O G I M A R S E L I S B O R G G Y M N A S I U M D. 1 3. M A R T S 2 0 1 9 K A L U N D B O R G G Y M N A S I U M D. 1 4. M A R T S 2 0 1 9 HVEM
for gymnasiet og hf 2016 Karsten Juul
for gymnasiet og hf 75 50 5 016 Karsten Juul Statistik for gymnasiet og hf Ä 016 Karsten Juul 4/1-016 Nyeste version af dette håfte kan downloades fra http://mat1.dk/noter.htm HÅftet mç benyttes i undervisningen
Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1)
; C ED 6 > Billedbehandling og mønstergenkendelse Lidt elementær statistik (version 1) Klaus Hansen 24 september 2003 1 Elementære empiriske mål Hvis vi har observationer kan vi udregne gennemsnit og varians
Kapitel 4 Sandsynlighed og statistiske modeller
Kapitel 4 Sandsynlighed og statistiske modeller Peter Tibert Stoltze [email protected] Elementær statistik F2011 1 Indledning 2 Sandsynlighed i binomialfordelingen 3 Normalfordelingen 4 Modelkontrol
Dagens Temaer. Test for lineær regression. Test for lineær regression - via proc glm. k normalfordelte obs. rækker i proc glm. p. 1/??
Dagens Temaer k normalfordelte obs. rækker i proc glm. Test for lineær regression Test for lineær regression - via proc glm p. 1/?? Proc glm Vi indlæser data i datasættet stress, der har to variable: areal,
Konfidensintervaller og Hypotesetest
Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller
En intro til radiologisk statistik
En intro til radiologisk statistik Erik Morre Pedersen Hypoteser og testning Statistisk signifikans 2 x 2 tabellen og lidt om ROC Inter- og intraobserver statistik Styrkeberegning Konklusion Litteratur
LEKTION 22 FARVEBEHANDLING
LEKTION 22 FARVEBEHANDLING I hvert eneste spil skal man som spilfører tage stilling til, hvordan samtlige fire farver skal spilles. Derfor er dette et vigtigt område i selve spilføringen. Mange kombinationer
Program. 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test.
Program 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test. 1/19 Konfidensinterval for µ (σ kendt) Estimat ˆµ = X bedste bud
Sandsynlighedsregning 2. forelæsning Bo Friis Nielsen
Vigtigste nye emner i.,. og.5 Sandsynlighedsregning. forelæsning Bo Friis Nielsen Anvendt Matematik og Computer Siene Danmarks Tekniske Universitet 800 Kgs. Lyngby Danmark Email: [email protected] Binomialfordelingen
Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression
Statikstik II 2. Lektion Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Sandsynlighedsregningsrepetition Antag at Svar kan være Ja og Nej. Sandsynligheden for at Svar Ja skrives
Forældretilfredshed 2015
Antal svar: 23, svarprocent: 77% INFORMATION OM UNDERSØGELSEN Forældretilfredshed 2015 er et samarbejde mellem Daginstitutionernes Lands-Organisation (DLO) og konsulentvirksomheden SURVIO. Formålet er
1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...
Indhold 1 Statistisk inferens: Hypotese og test 2 1.1 Nulhypotese - alternativ.................................. 2 1.2 Teststatistik........................................ 3 1.3 P-værdi..........................................
Undervisningsbeskrivelse
Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Institution Uddannelse Fag og niveau Lærer(e) Hold Termin hvori undervisningen afsluttes: Juni 2013 Roskilde
{ } { } {( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )}
Stokastisk eksperiment Et stokastisk eksperiment er et eksperiment, hvor vi fornuftigvis ikke på forhånd kan have en formodning om resultatet af eksperimentet. Til gengæld kan vi prøve at sige noget om,
Statistik II 1. Lektion. Analyse af kontingenstabeller
Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression
Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se
Epidemiologi og biostatistik. Uge, torsdag 5. februar 00 Morten Frydenberg, Institut for Biostatistik. Type og type fejl Statistisk styrke Nogle speciale metoder: Normalfordelte data : t-test eksakte sikkerhedsintervaller
BILAG 3: DETALJERET REDEGØ- RELSE FOR REGISTER- ANALYSER
Til Undervisningsministeriet (Kvalitets- og Tilsynsstyrelsen) Dokumenttype Bilag til Evaluering af de nationale test i folkeskolen Dato September 2013 BILAG 3: DETALJERET REDEGØ- RELSE FOR REGISTER- ANALYSER
Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet March 1, 2013 Sandsynlighedsregning og lagerstyring Normalfordelingen
METODESAMLING TIL ELEVER
METODESAMLING TIL ELEVER I dette materiale kan I finde forskellige metoder til at arbejde med kreativitet og innovation i forbindelse med den obligatoriske projektopgave. Metoderne kan hjælpe jer til:
Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007
Rettevejledning til eksamen i Kvantitative metoder 1,. årsprøve. januar 007 I rettevejledningen henvises der til Berry and Lindgren "Statistics Theory and methods"(b&l) hvis ikke andet er nævnt. Opgave
Løsning eksamen d. 15. december 2008
Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Tjek. lønnen. Et værktøj til at undersøge lokal løndannelse og ligeløn på offentlige arbejdspladser. 2007 udgave Varenr. 7520
Tjek lønnen Et værktøj til at undersøge lokal løndannelse og ligeløn på offentlige arbejdspladser 2007 udgave Varenr. 7520 Indholdsfortegnelse Forord... 3 Teknisk introduktion... 4 Indledning... 5 Introduktion
Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau
Hvad skal vi lave? 1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ. Teststatistik P-værdi Signifikansniveau 2 t-test for middelværdi Tosidet t-test for middelværdi Ensidet t-test for middelværdi
En Maple time med efterfølgende elevgruppe diskussion og refleksionssamtale med lærer.
Bilag 5 En Maple time med efterfølgende elevgruppe diskussion og refleksionssamtale med lærer. Indledning Vi har som led i projektet observeret en del lektioner, med helt eller delvis fokus på Maple-brug.
Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 4: 2. marts
Århus 27. februar 2011 Morten Frydenberg Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 4: 2. marts Epibasic er nu opdateret til version 2.02 (obs. der er ikke ændret ved arket C-risk) Start med
Samtaleteknik. At spørge sig frem
Omkring spørgeteknikken: Brug HV-ord: hvordan kan det være / hvad skulle der til for at ændre/ hvad ville der ske hvis. Men undgå hvorfor Har du nogen fornemmelse af hvad det er der går galt? Hvis nu din
Skriftlig eksamen Science statistik- ST501
SYDDANSK UNIVERSITET INSTITUT FOR MATEMATIK OG DATALOGI Skriftlig eksamen Science statistik- ST501 Torsdag den 21. januar Opgavesættet består af 5 opgaver, med i alt 13 delspørgsmål, som vægtes ligeligt.
Undervisningsbeskrivelse
Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Juni, 2014 Institution Vid Gymnasier, Rønde Uddannelse Fag og niveau Lærer(e) Hold hhx Matematik B Ann Risvang
