Teoretisk Statistik, 9. februar Beskrivende statistik

Relaterede dokumenter
hvor i er observationsnummeret, som løber fra 1 til stikprøvestørrelsen n, X i

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Dagens program. Estimation: Kapitel Eksempler på middelrette og/eller konsistente estimator (de sidste fra sidste forelæsning)

24. januar Epidemiologi og biostatistik. Forelæsning 1 Uge 1, tirsdag. Niels Trolle Andersen, Afdelingen for Biostatistik.

Motivation. En tegning

antal gange krone sker i første n kast = n

Test i to populationer. Hypotesetest for parrede observationer Test for ens varians Gensyn med flyskræk!

Teoretisk Statistik, 18. november Stikprøveteori: hvor er vi, og hvor skal vi hen? Proportional allokering Optimal allokering

Statistik Lektion 8. Parrede test Test for forskel i andele Test for ens varians Gensyn med flyskræk!

Generelle lineære modeller

Spørgsmål 3 (5 %) Bestem sandsynligheden for at et tilfældigt valgt vindue har en fejl ved listerne, når man ved at der er fejl i glasset.

Løsninger til kapitel 7

9. Binomialfordelingen

1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens... 2

Mikroøkonomi, matematik og statistik Eksamenshjemmeopgave december 2007

Estimation ved momentmetoden. Estimation af middelværdiparameter

Statistik 8. gang 1 KONFIDENSINTERVALLER. Konfidensintervaller: kapitel 11. Valg og test af fordelingsfunktion

Sætning: Middelværdi og varians for linearkombinationer. Lad X 1,X 2,...,X n være stokastiske variable. Da gælder. Var ( a 0 + a 1 X a n X n

Matematik A. Højere handelseksamen. Tirsdag den 26. maj 2015 kl hhx151-mat/a

Meningsmålinger KLADDE. Thomas Heide-Jørgensen, Rosborg Gymnasium & HF, 2017

Bilag 5: DEA-modellen Bilaget indeholder en teknisk beskrivelse af DEA-modellen

Program. Populationer og stikprøver. Praktiske oplysninger. Eksempel vaccine mod miltbrand hos får. Praktiske oplysninger

Simpel Lineær Regression. Opsplitning af variationen Determinations koefficient Variansanalyse F-test Model-kontrol

6 Populære fordelinger

Uge 40 I Teoretisk Statistik, 30. september 2003

Gamle eksamensopgaver. Diskret Matematik med Anvendelser (DM72) & Diskrete Strukturer(DM504)

Program. Ensidet variansanalyse Normalfordelingen. Antibiotika og nedbrydning af organisk materiale. Tegninger

Den flerdimensionale normalfordeling

Maja Tarp AARHUS UNIVERSITET

Praktisk info. Statistisk analyse af en enkelt stikprøve: kendt eller ukendt varians Sandsynlighedsregning og Statistik (SaSt) I tirsdags.

Statistiske test. Efteråret 2010 Jens Friis, AAU. Hjemmeside :

Sandsynlighedsregning 9. forelæsning Bo Friis Nielsen

Løsningsforslag til skriftlig eksamen i Kombinatorik, sandsynlighed og randomiserede algoritmer (DM528)

Diskrete og kontinuerte stokastiske variable

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Projekt 4.8 De reelle tal og 1. hovedsætning om kontinuerte funktioner

Indholdsfortegnelse Generelt Diskrete stokastiske variable: Kontinuerte stokastiske variable: Regneregler for stokastiske variable

13. februar Resumé: En statistisk analyse resulterer ofte i : Et estimat ˆ θ med en tilhørende se( ˆ θ )

Sandsynlighedsregning 9. forelæsning Bo Friis Nielsen

Undersøgelse af numeriske modeller

STATISTISKE GRUNDBEGREBER

Velkommen. Program. Statistik og Sandsynlighedsregning 2 Sandsynlighedstætheder og kontinuerte fordelinger på R. Praktiske ting og sager

Vejledende besvarelser til opgaver i kapitel 15

Matematikkens mysterier - på et obligatorisk niveau. 7. Ligninger, polynomier og asymptoter

STATISTISKE GRUNDBEGREBER

29. januar Epidemiologi og biostatistik Forelæsning 2 Uge 1, torsdag 2. februar 2006 Michael Væth, Afdeling for Biostatistik.

Anvendt Statistik Lektion 3. Punkt- og intervalestimater Konfidensintervaller Valg af stikprøvestørrelse

Matematik A. Studentereksamen. Forberedelsesmateriale. Forsøg med digitale eksamensopgaver med adgang til internettet.

Statistik Lektion 7. Hypotesetest og kritiske værdier Type I og Type II fejl Styrken af en test Sammenligning af to populationer

Beregning af prisindeks for ejendomssalg

Stikprøvefordelinger og konfidensintervaller

STATISTIKNOTER Simple normalfordelingsmodeller

Elementær Matematik. Polynomier

Projekt 1.3 Brydningsloven

Claus Munk. kap. 1-3

(VIDENSKABSTEORI) STATISTIK (EKSPERIMENTELT ARBEJDE)

Dagens forelæsning. Claus Munk. kap Obligationer Grundlæggende Intro. Obligationer Grundlæggende Intro. Obligationer Grundlæggende Intro

Formelskrivning i Word 2. Sådan kommer du i gang 4. Eksempel med skrivning af brøker 5. Brøker skrevet med småt 6. Hævet og sænket skrift 6

Vejledende opgavebesvarelser

Test i polynomialfordelingen

Program. Statistisk inferens En enkelt stikprøve og lineær regression Stat. modeller, estimation og konfidensintervaller. Fordeling af gennemsnit

Begreber og definitioner

30. august Epidemiologi og biostatistik. Forelæsning 3 Uge 2, torsdag d. 8. september 2005 Michael Væth, Afdeling for Biostatistik.

Konfidens intervaller

Kvantitative metoder 2

Sammenligning af to grupper

Projekt 9.1 Regneregler for stokastiske variable middelværdi, varians og spredning

STATISTIK x-klasserne Gammel Hellerup Gymnasium

vejer (med fortegn). Det vil vi illustrere visuelt og geometrisk for (2 2)-matricer og (3 3)-matricer i enote 6.

Analyse 1, Prøve maj 2009

Sandsynlighedsteori 1.2 og 2 Uge 5.

Tests for forskel i central tendens for data på ordinal- og intervalskala. Typer af statistiske test:

Estimation og test i normalfordelingen

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab

x-klasserne Gammel Hellerup Gymnasium

Uge 10 Teoretisk Statistik 1. marts 2004

Sprednings problemer. David Pisinger

DATV: Introduktion til optimering og operationsanalyse, Bin Packing Problemet

Termodynamik. Indhold. Termodynamik. Første og anden hovedsætning 1/18

Kapitel 10 KALIBRERING AF STRØMNINGSMODEL

Noter om kombinatorik, Kirsten Rosenkilde, februar Kombinatorik

Oversigt. Kursus 02402/02323 Introducerende Statistik. Forelæsning 12: Inferens for andele. Klaus K. Andersen og Per Bruun Brockhoff

Projekt 3.2 Anlægsøkonomien i Storebæltsforbindelsen. Indhold. Hvad er matematik? 1 ISBN

Økonometri 1. Definition og motivation. Definition og motivation. Dagens program. Den multiple regressionsmodel 15. februar 2006

Beregning af prisindeks for ejendomssalg

Program. Middelværdi af Y = t(x ) Transformationssætningen

DATV: Introduktion til optimering og operationsanalyse, Følsomhed af Knapsack Problemet

GENEREL INTRODUKTION.

Længde [cm] Der er frit vandspejle i sandkassen. Herudover er sandkassen åben i højden cm i venstresiden og 0-20 cm i højresiden.

HASTIGHEDSKORT FOR DANMARK VHA. GPS

NOTAT Det daglige arbejde med blisterpakninger

Hypotesetest. Hypotesetest og kritiske værdier Type 1 og Type 2 fejl Styrken af en test Sammenligning af to populationer

De Platoniske legemer De fem regulære polyeder

Asymptotisk optimalitet af MLE

MOGENS ODDERSHEDE LARSEN. Fourieranalyse

Projekt 9.10 St. Petersborg paradokset

Uddannelsesparathed. Vejledning om processerne ved vurdering af uddannelsesparathed (UPV) og ansøgning til ungdomsuddannelserne

Forslag til besvarelser af opgaver m.m. i ε-bogen, Matematik for lærerstuderende

Supplerende noter II til MM04

Transkript:

Uge 7 I Teoretisk Statistik, 9 februar 004 Beskrivede statistik Kategoriserede variable 3 Kvatitative variable 4 Fraktiler for ugrupperede observatioer 5 Fraktiler for grupperede observatioer 6 Beliggeheds- og spredigsål Beskrivede statistik Idledede udersøgelse af data Bruges til at få overblik over data ide e egetlig statistisk aalyse (dvs ide opstillig af odel, estiatio, test af hypoteser) Både ueriske og grafiske etoder: Grafiske: Histogra, sølediagra, lagkagediagra, fraktildiagra, kassediagra, Nueriske: Geesit, spredig, edia, kvartiler, Lidt o ord Stokastisk variabel, X X atager sie værdier i S Udfaldsru, S E observatio er e observeret værdi af e stokastisk variabel Data/dataaterialet/datasættet/stikprøve er de salig af observatioer, der er til rådighed til statistisk aalyse

Kategoriserede variable Udfaldsruet har edelig age eleeter (et atal grupper/kategorier), og e observatio er e agivelse af de kategori observatioe tilhører E stikprøve på observatioer af e kategoriseret variabel ed kategorier er således e agivelse af : a = atal gage kategori er observeret =,, På basis heraf defieres de observerede relative hyppighed for kategori so a h = =,, De relative hyppigheder h,, h agiver stikprøves fordelig på kategorier Eksepler: Ferieforer Måed for rygestop Boligforer Lagkagediagra, blokdiagra, sølediagraer (af forskellige art)

Eksepel: Kategoriseret ferieavedelsesfordelig / grupperet idkostfordelig 3 Stikprøve på 3 daskere over 8 år fordelt både på kategorier for feries avedelse og på grupper efter deres idkosts størrelse i 974 Idkostiterval Kr Uder 0000 0000-39999 40000-59999 60000-79999 80000-99999 00000-49999 50000 og derover Ferie i Daark Hee Soerhus Ade ferie 33 5 8 00 0 5 55 8 66 57 43 5 3 5 46 4 79 64 3 3 34 Ferie i udladet 5 90 00 9 08 4 66 Ige ferie 0 65 05 7 33 39 8 Total 300 500 554 54 47 564 80 Total 749 68 868 675 55 3 Kilde: Levevilkår i Daark: Statistisk Oversigt 976 Daarks Statistik og Socialforskigsistituttet 976 Tabel 93 Kvatitative variable Egetlige talværdier x,, x ed udfaldsru (del af) ú Fordelige af e såda stikprøve på i alt observatioer på ú ka beskrives dels ved hælp af de ordede stikprøve x () x () x() hvor x (i) er i te idste observatio, dels ved at karakterisere stikprøve ht beliggehed og spredig på de reelle akse Eksepler: ædrig i $-kurs (se AJKM ex ) idkosters fordelig, se eksepel edefor

4 atal polit-studerede på e årgag pris på skrueøgler, se eksepel edefor Fraktildiagraer, histograer, kassediagraer Geesit, spredig, edia, kvartiler, deciler Fraktiler for ugrupperede observatioer Observatioer af ugrupperet kvatitativ variabel: x,,x x(p) er e p-fraktil (0 < p < ): Adele p af observatioere er idre ed eller lig x(p), adele -p er større ed x(p) For i`te observatio er x(p i ) = x (i),hvor p i = (i 05)/ (,hvis alle obs er forskellige) For adre p-værdier: teg (x (i),p i ), forbid successive pukter ed rette liier og aflæs x(p) på fraktildiagraet, (eller bereg x(p) ved lieær iterpolatio) fraktio p i+ p p i x (i) x (i+) x x(p)

5 Altså, hvis alle observatioer er forskellige, er hvor x (i) = x(p i ) () p i = i ½ Begrudelse for (): betragt liie x () x () x (3) x (4) Hvis atal observatioer øges, vil ca /4 af observatioere fordele sig ede for de første stiplede liie elle x () og x () Dee liie svarer altså til x(05) så Det er derfor rieligt at sætte hvilket fås so x(p ) ed x(05) = (x () + x () )/ x(05) = x (), p = /8 = ( - /)/

6 Eksepel: Fraktiler i fordelige af 5 idkoster i x (i) (i - /)/5 = p i x(p) 53 0033 67 000 x(0) = 67 3 83 067 4 84 033 5 0 0300 x(05) = 883 6 47 0367 7 54 0433 8 8 0500 x(05) = x = 8 9 93 0567 0 303 0633 385 0700 44 0767 x(075) = 443 3 633 0833 4 658 0900 x(090) = 658 5 803 0967 x(05) og x(075) er bestet ved lieær iterpolatio, se AJKM forel ()

7 Fraktiler for grupperede observatioer Grupperet ateriale: o hver ekelt observatio vides ku hvilket af give itervaller - "klasser" - de tilhører Klasse = [t -, t ], =,, = + = + Klasseidtpukt t t ( t t ) ( t t ) Atal observatioer i te klasse a =,, Hyppighed af observatioer i klasse h = a / klasse ]-, t ] ]t, t ] ]t -, [ klasse = idtpukt atal relativ hyppighed kuuleret hyppighed t a h = a / H = h t a h = a / H = h + h t a h = a / H =Σ h = = total Σa = Σh = Grupperet stikprøve: (a, a,,a ) Fordelig af de grupperede stikprøve: (h, h,, h ) Kuuleret hyppighed: H = (atal obs t )/ = h + þ +h = hyppighed af obs # t =,,, dvs t er e H -fraktil

8 Histogra: afbildig af h = h /(t t ) od t : Eksepel : E forbrugerorgaisatio øsker at udersøge priseres variatio på værktø Med heblik herpå udtog a i uge, 980 e tilfældig stikprøve på 00 isekræere, værktøsagasier, byggearkeder, etc fordelt over hele ladet I edeståede tabel er aført de således idsalede prisoplysiger på 6"- skrueøgler Tabel : De grupperede fordelig af prise på 6"-skrueøgler for 000 detailudsalg, uge, 980 pris i kroer atal observerede priser (0,5] 03 (5,0] 6 (0,0] 54 (0,30] 6 (30,40] 85 (40,50] 6 (50,60] 9 (60,70] 4 (70,+ ] 3 Total 000

9 Svarede til dee tabel ka edeståede histogra kostrueres % 0 h 00 0 t 5 0 0 30 40 50 60 70 Beliggeheds- og spredigsål Stikprøvefuktio: Reel fuktio af x, x,, x Lad os idføre betegelsere: i, i S= x SK = x i= i= hvor S står for Su og SK for Su af Kvadrater Geesit: ( ) S i i= x = x + x + + x /= x = Epirisk varias = stikprøvevarias:

s x x (SK S ) x x = ( i ) = ( i ) i= = 0 i= 0 Stadardafvigelse: s = s For grupperet stikprøve: Klasseidtpukt: ( ) Geesit: t = t + t / t = at a= = = Epirisk varias: st = a( t t) = SKt St a( t t) = 0 = = Beregig af s t : S a t,sk a t t = t = = = st = Σa( t tt + t ) = = Σat tσ at + Σat ( ) t ( ) ( ) = Σat Σ at = SKt S t/ t x & s s

() Beliggeheds- og spredigsål Geesit og edia er begge ål for fordeliges beliggehed Mediae er ere robust overfor ekstree observatioer ed geesittet Observatioer 3 4 5 3 4 50 Geesit 3 Media 3 3 Tilsvarede er kvartilafstade et ere robust ål for fordeliges bredde (eller spredig) ed stadardafvigelse s Hvis data ku foreligger so grupperede observatioer: Reg so o alle observatioer i e gruppe er lig idtpuktet i itervallet Dette giver aturligvis ikke det sae so hvis vi havde adgag til de ugrupperede observatioer