Kursus 02402 Introduktion til Statistik Forelæsning 1: Intro og beskrivende statistik Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: perbb@dtu.dk Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 1 Foråret 2014 1 / 22
Oversigt 1 Praktisk Information 2 Introduktion til Statistik 3 Beskrivende statistik: Nøgletal 4 Software: R Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 1 Foråret 2014 2 / 22
Praktisk Information Oversigt 1 Praktisk Information 2 Introduktion til Statistik 3 Beskrivende statistik: Nøgletal 4 Software: R Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 1 Foråret 2014 3 / 22
Praktisk Information Praktisk Information Undervisning: Hver dag kl. 9.00-13.00 Generel daglig agenda: FØR undervisningsmodulet: læs det annoncerede! 2x45 minutters forelæsning (ugens pensum) 2 timers øvelser (Mix af: Bog, Rnote, online quiz-spørgsmål) EFTER undervisningsmodulet: Test dig selv med online eksamens-quiz Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 1 Foråret 2014 4 / 22
Praktisk Information Praktisk Information Hjemmeside: 02403.imm.dtu.dk Note om software R Pensumliste, forelæsningsplan Øvelser & besvarelser Slides Podcasts af forelæsninger(på dansk OG engelsk) Quizzer Campusnet: www.campusnet.dtu.dk Meddelelser, visse (få)dokumenter Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 1 Foråret 2014 5 / 22
Introduktion til Statistik Oversigt 1 Praktisk Information 2 Introduktion til Statistik 3 Beskrivende statistik: Nøgletal 4 Software: R Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 1 Foråret 2014 6 / 22
Introduktion til Statistik Introduktion til Statistik Hvordan behandle (eller analysere) data? Hvad er tilfældig variation? Statistik er et værktøj til at træffe beslutninger: Hvor mange computere har vi solgt det sidste år? Hvad er forventet pris af en aktie? Er maskine A mere effektiv end maskine B? Statistik er et metodefag, der kan anvendes inden for de fleste fagområder, og er derfor et meget vigtigt værktøj Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 1 Foråret 2014 7 / 22
Introduktion til Statistik Statistik og Ingeniører Statistik er et vigtigt værktøj i problemløsning Analyse af data Kvalitetforbedring Forsøgsplanægning Forudsigelse af fremtidige værdier.. og meget mere! Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 1 Foråret 2014 8 / 22
Introduktion til Statistik Statistik Moderne statistik har baggrund i sandsynlighedsregning og beskrivende statistik Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 1 Foråret 2014 9 / 22
Introduktion til Statistik Statistik Statistik handler ofte om at analysere en stikprøve, der er taget fra en population Baseret på stikprøven, prøver vi at generalisere (eller udtale os) om populationen Det er derfor vigtigt, at stikprøven er repræsentativ for populationen Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 1 Foråret 2014 10 / 22
Beskrivende statistik: Nøgletal Oversigt 1 Praktisk Information 2 Introduktion til Statistik 3 Beskrivende statistik: Nøgletal 4 Software: R Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 1 Foråret 2014 11 / 22
Beskrivende statistik: Nøgletal Kapitel 2: Nøgletal Vi anvender en række nøgletal for at opsummere og beskrive data (stokastiske variable) Gennemsnit Median Varians s 2 x Standardafvigelse Fraktiler s Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 1 Foråret 2014 12 / 22
Beskrivende statistik: Nøgletal Gennemsnit Gennemsnittet er et nøgletal, der angiver tyngdepunkt eller centrering af data Gennemsnit: x = 1 n n i=1 Vi siger, at x er et estimat af middelværdien x i Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 1 Foråret 2014 13 / 22
Beskrivende statistik: Nøgletal Median Medianen er et også nøgletal, der angiver tyngdepunkt eller centrering af data. I nogle tilfælde, f.eks. hvis man har ekstreme værdier, er medianen at foretrække frem for middelværdien Median: Den midterste observation (i den sorterede rækkefølge) Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 1 Foråret 2014 14 / 22
Beskrivende statistik: Nøgletal Varians og standardafvigelse Variansen (eller standardafvigelsen) siger noget om hvor meget data spreder: Varians s 2 = 1 n 1 n (x i x) 2 i=1 Standardafvigelse (spredning) s = s 2 = 1 n 1 n (x i x) 2 i=1 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 1 Foråret 2014 15 / 22
Beskrivende statistik: Nøgletal Variationskoefficient Standardafvigelse og variansen er nøgletal for den absolutte variation. Hvis man gerne vil sammenligne variationen mellem forskellige datasæt, er det en god idé at anvende et relativt nøgletal, nemlig variationskoefficienten: V = s x 100 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 1 Foråret 2014 16 / 22
Beskrivende statistik: Nøgletal Fraktiler Medianen beregnes som det punkt, der deler data ind i to halvdele. Man kan naturligvis finde andre punkter, der deler data ind i andre dele, og det man kalder fraktiler. Ofte beregner man fraktilerne 0, 25, 50, 75, 100 % fraktiler og/eller 0, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100 % fraktiler Bemærk: 50% fraktilen svarer til medianen Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 1 Foråret 2014 17 / 22
Beskrivende statistik: Nøgletal Figurer/Tabeller Kvantitative data: Scatter plot (xy plot) Histogram Kumulativ fordeling Boxplots Antalsdata: Bar charts (pareto diagram) Pie charts Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 1 Foråret 2014 18 / 22
Software: R Oversigt 1 Praktisk Information 2 Introduktion til Statistik 3 Beskrivende statistik: Nøgletal 4 Software: R Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 1 Foråret 2014 19 / 22
Software: R Software: R Appendix C i bogen (7. og 8. udg.): Beskrivelse af R. (uploadet i Campusnet) R-øvelse i dag. R på Gbaren kan køres hjemmefra.(thinlinc) R kan installeres på egen computer.(se R-note) Anbefales: Brug RStudio (http://www.rstudio.com/) Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 1 Foråret 2014 20 / 22
Software: R Næste uge: Diskrete fordelinger - kapitel 4 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 1 Foråret 2014 21 / 22
Software: R Oversigt 1 Praktisk Information 2 Introduktion til Statistik 3 Beskrivende statistik: Nøgletal 4 Software: R Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 1 Foråret 2014 22 / 22