2011.09.20 lth@campus.dk
Intro Læseplan Beskrivende Statistik Sandsynligheder
Ordet kommer fra Latin.: statisticum (statsrådgiver) Italiensk.: statistica (statsmand / politiker) Hvorfor statistik? Træk fra statistikkens historie Model af virkeligheden Anvendelser Data, statistikerens råmateriale Kvalitative vs. Kvantitative Data (num. vs. ej num.) Diskrete vs. Kontinuerte Data
Data præsentation ved tabeller eller grafik Der laves ikke model for data og der antages ikke fordeling for data Ofte første skridt i en statistisk analyse HUSK: TEGN TEGN - TEGN
5 Positionsmål.: minimum (Min), maximum (Max), modaltal, fraktiler og middelværdi 4 Variationsmål.: variationsbredde, kvartilsafstand, varians og standardafvigelse.
Karakterfordeling i Engelsk Mundtlig, Grundskolens 9 kl, 2008/2009 http://statweb.uni-c.dk/databanken/uvmdataweb/showreport.aspx?report=kgs-antkar-fag-kar -3 0 2 4 7 10 12 Total 301 2867 7257 12051 15926 12613 10182 61197 EXCEL.: Tilf.->BEWIStat->1->a Husk data skal læses lodret i x h H f F 1-3 301 301 0,005 0,005 2 0 2867 3168 0,047 0,051 3 2 7257 10425 0,119 0,170 4 4 12051 22476 0,197 0,367 5 7 15926 38402 0,260 0,628 6 10 12613 51015 0,206 0,834 7 12 10182 61197 0,166 1 0,3 0,25 0,2 0,15 0,1 0,05 0-5 0 5 10 15 1,2 1 0,8 0,6 0,4 0,2 0-5 0 5 10 15
0,3 0,25 0,2 0,15 0,1 0,05 Modaltal 1,2 1 0,8 0,6 0,4 0,2 0-5 0 5 10 15 Min(xi)= -3 Max(xi)=12 0-5 0 5 10 15 Fraktiler, obs no. 25%.: (61197-1) 0,25=15300-> 4 50%.: (61197-1) 0,50=30599-> 7 75%.: (61197-1) 0,75=45898->10
Varians.: Gennemsnitlig kvadreret afstand Fra middelværdi Variationsbredde.: R=12-(-3)=15 Kvartilsafstand.: IQR=10-4=6 14 Boksplot af kvartiler og middelværdi Fra KeHaTools; s^2=13,53 s=3,68 12 10 8 6 4 2 0-2 -4 Karakterfordeling
En kort beskrivende statistisk analyse af karakterfordeling af de 67197 karakterer uddelt i Engelsk Mundtlig, Grundskolens 9 kl, 2008/2009 eksamen viser et gennemsnit på 6,88, hvilket er tæt på medianen 7. 25% af eleverne har fået 4 eller derunder men 75% har fået 10 eller derunder. Kvartilsafstanden er 6, hvilket svarer til lidt mindre 2 gange standardafvigelsen s=2,68 Overordnet synes karaktererne fordelt symmetrisk omkring middelværdien med godt halvdelen over og halvdelen under med størst tæthed ved middelværdien. Man kunne mistænke karakterne for at være normalfordelt. (mere om det på et senere tidspunkt.)
Historien Spil Astraglii (50.000 år) Terning (5500 år) Gerolamo Cardano (1501-76) Liber de Ludo Alea Fandt Additionsreglen og Multiplikationsreglen Piere de Fermat (1601-65) Blaise Pascal (1623-62) Terningen har ingen hukommelse Binomialkoefficientens anvendelse Jack Bernoulli (1654-1705) De store tals lov Chebyshev (1821-94) Stokastisk variabel
Udfaldsrum.: Mulige udfald Eksempel: En mønt har to sider, plat og krone så; Sandsynlighed.: Eksperiment (kast med en mønt) -> Hyppighed (hvor mange gange kommer plat/krone) -> Relativ hyppighed (antal -> %) -> Sandsynlighed (for ) Ærlig mønt.:
For Da gælder: udfaldsrummet for et eksperiment. 1) 2) 3) Her kan tolkes som frekvensen af udfaldet og betegnes sandsynlighedsfeltet og tilhørende sandsynlighedsfunktion. med udfaldsrum
Lad os kaste med en ærlig terning så Lad være hændelsen lavt kast, dvs så Lad B være hændelsen lige kast, dvs Lad C være hændelsen højt kast, dvs Hændelserne illustreres i et Venn-diagram så så
, kaldes Komplementær hændelse til Dermed har vi at og Vi har at, kaldes Fællesmængden i og, kaldes fraregnet og vi har at Så
, Kaldes Foreningsmængden af Vi har at og idet og da skal vi trække en fra. Regneregel.: Specielt gælder, hvis og er disjunkte at dvs. når
ss. For og Lad os se på Vi har at forudsat vi er i så for noget mere generelt samtidigt gælder at hvorfor der må gælde at
Lad 1) 2) 3) udfaldsrum en samling af delmængder, der opfylder
Lad en klassedeling af udfaldrummet og lad en hændelse i, da gælder
Vi har at der gælder Samtidigt ved vi at hvorfor Dermed har vi sidste regneregel
For et sandsynlighedsfelt og og hændelser gælder 1) 2) 3) 4) 5)
Lad og to puljer Du skal nu vælge 1 fra hver af de to puljer Tælletræet.: Der er 2 muligheder for I alt muligheder og 3 muligheder for
Lad igen og to puljer Antag nu vi skal vælge 1 fra pulje og 2 fra pulje Hvis rækkefølgen betyder noget, har vi formlen Der er 2 muligheder for og 3 muligheder for samt 2 for B2 I alt muligheder Brug Excel.: =PERMUT(n;k)
Lad igen og to puljer Hvis rækkefølgen ikke betyder noget, har vi Binomialformlen.: Der er 2 muligheder for, disse skal kombineres med 2 ud af 3 mulige fra pulje I alt muligheder Brug Excel.: =KOMBIN(n;k)
Forløb Opgaver Slides Gruppearbejde Egne eksempler Andet