Forelæsning 1: Intro og beskrivende statistik



Relaterede dokumenter
Oversigt. Kursus Introduktion til Statistik. Forelæsning 1: Intro og beskrivende statistik. Per Bruun Brockhoff. Praktisk Information

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable

Forelæsning 2: Kapitel 4, Diskrete fordelinger

Oversigt. 1 Praktisk Information. 2 Introduction to Statistics - a primer. 3 Intro Case historier: IBM Big data, Novo Nordisk small data, Skive fjord

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Forelæsning 9: Inferens for andele (kapitel 10)

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Forelæsning 11: Kapitel 11: Regressionsanalyse

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Eksponential fordelingen

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

Kvantitative Metoder 1 - Forår Dagens program

Oversigt. Kursus Introduktion til Statistik. Forelæsning 10: Statistik ved hjælp af simulering. Per Bruun Brockhoff.

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff

Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning

Kvantitative Metoder 1 - Forår 2007

Oversigt. Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff. Envejs variansanalyse - eksempel

Forelæsning 10: Statistik ved hjælp af simulering

Forelæsning 8: Inferens for varianser (kap 9)

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup)

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 3: Kontinuerte fordelinger. Per Bruun Brockhoff

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Indblik i statistik - for samfundsvidenskab

Statistik vejledende læreplan og læringsmål, efteråret 2013 SmartLearning

Statistik. Hjemmeside: kkb. Statistik - lektion 1 p.1/22

Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl i Kirkesalen, Studiestræde 38 Øvelser

Forelæsning 1: Intro, R og beskrivende statistik

Fagplan for statistik, efteråret 2015

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

1 enote 1: Simple plots og deskriptive statistik. 2 enote2: Diskrete fordelinger. 3 enote 2: Kontinuerte fordelinger

Kvantitative Metoder 1 - Forår Dagens program

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion

Oversigt. 1 Intro: Regneeksempel og TV-data fra B&O. 2 Model og hypotese. 3 Beregning - variationsopspaltning og ANOVA tabellen

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1)

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Løsninger til kapitel 1

Oversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Produkt og marked - matematiske og statistiske metoder

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Beskrivende statistik

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion

Kapitel 3 Centraltendens og spredning

En Introduktion til SAS. Kapitel 5.

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Modul 7: Eksempler. 7.1 Beskrivende dataanalyse Diagrammer. Bent Jørgensen. Forskningsenheden for Statistik ST501: Science Statistik

Test nr. 4 af centrale elementer 02402

Studieplan Biostatistik Semester 1

Løsning eksamen d. 15. december 2008

Basal statistik. 30. januar 2007

Oversigt. 1 Intro: Regneeksempel og TV-data fra B&O. 2 Model. 3 Beregning - variationsopspaltning og ANOVA tabellen. 4 Hypotesetest (F-test)

Oversigt. 1 Praktisk Information. 2 Introduction to Statistics - a primer. 3 Population og stikprøve. 5 Beskrivende statistik: Grafisk fremstilling

Opgave 11.4 side 316 (7ed: 11.4, side 352 og 6ed: 11.2, side 345)

Ex µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4. hvor. Vha. R: Vha. tabel:

Undervisningsbeskrivelse

Institut for Matematiske Fag Sandsynlighedsregning og Statistik 2. R opgaver

VIGTIGT! Kurset består af: 1. Forelæsninger. 2. Øvelser. 3. Litteraturlæsning

Kvantitative Metoder 1 - Forår Dagens program

Kvantitative Metoder 1 - Forår 2007

Løsning til eksamen d.27 Maj 2010

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Test nr. 5 af centrale elementer 02402

Velkommen til kurset. Teoretisk Statistik. Lærer: Niels-Erik Jensen

Forelæsning 11: Envejs variansanalyse, ANOVA

Modelkontrol i Faktor Modeller

Løsning til eksaminen d. 14. december 2009

Binomialfordeling og konfidensinterval for en andel

Statistik noter - Efterår 2009 Keller - Statistics for management and economics

Projekt 1 Spørgeskemaanalyse af Bedst på Nettet

Kursus 02402/02323 Introduktion til statistik. Forelæsning 13: Et overblik over kursets indhold. Klaus K. Andersen og Per Bruun Brockhoff

Matematik/Statistik. statistik. Forelæser og ansvarlig for kursets statistikdel: Peter Sunde Afd. f. Populationsbiologi

(studienummer) (underskrift) (bord nr)

Modul 1: Beskrivende dataanalyse

Undervisningsbeskrivelse

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

Kvantitative Metoder 1 - Forår 2007

Hjemmeopgave. I bedes benytte sidste side fra denne opgavetekst i udfyldt stand som forside på jeres opgavebesvarelse. Siden findes også på nettet.

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Statistik i GeoGebra

Sandsynlighedsregning 11. forelæsning Bo Friis Nielsen

4 Oversigt over kapitel 4

Normalfordelingen og Stikprøvefordelinger


Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Undervisningsbeskrivelse

Undervisningsbeskrivelse

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 30. maj 2016 Kursus nr : (navn) (underskrift) (bord nr)

Transkript:

Kursus 02402 Introduktion til Statistik Forelæsning 1: Intro og beskrivende statistik Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: perbb@dtu.dk Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 1 Foråret 2014 1 / 22

Oversigt 1 Praktisk Information 2 Introduktion til Statistik 3 Beskrivende statistik: Nøgletal 4 Software: R Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 1 Foråret 2014 2 / 22

Praktisk Information Oversigt 1 Praktisk Information 2 Introduktion til Statistik 3 Beskrivende statistik: Nøgletal 4 Software: R Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 1 Foråret 2014 3 / 22

Praktisk Information Praktisk Information Undervisning: Hver dag kl. 9.00-13.00 Generel daglig agenda: FØR undervisningsmodulet: læs det annoncerede! 2x45 minutters forelæsning (ugens pensum) 2 timers øvelser (Mix af: Bog, Rnote, online quiz-spørgsmål) EFTER undervisningsmodulet: Test dig selv med online eksamens-quiz Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 1 Foråret 2014 4 / 22

Praktisk Information Praktisk Information Hjemmeside: 02403.imm.dtu.dk Note om software R Pensumliste, forelæsningsplan Øvelser & besvarelser Slides Podcasts af forelæsninger(på dansk OG engelsk) Quizzer Campusnet: www.campusnet.dtu.dk Meddelelser, visse (få)dokumenter Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 1 Foråret 2014 5 / 22

Introduktion til Statistik Oversigt 1 Praktisk Information 2 Introduktion til Statistik 3 Beskrivende statistik: Nøgletal 4 Software: R Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 1 Foråret 2014 6 / 22

Introduktion til Statistik Introduktion til Statistik Hvordan behandle (eller analysere) data? Hvad er tilfældig variation? Statistik er et værktøj til at træffe beslutninger: Hvor mange computere har vi solgt det sidste år? Hvad er forventet pris af en aktie? Er maskine A mere effektiv end maskine B? Statistik er et metodefag, der kan anvendes inden for de fleste fagområder, og er derfor et meget vigtigt værktøj Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 1 Foråret 2014 7 / 22

Introduktion til Statistik Statistik og Ingeniører Statistik er et vigtigt værktøj i problemløsning Analyse af data Kvalitetforbedring Forsøgsplanægning Forudsigelse af fremtidige værdier.. og meget mere! Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 1 Foråret 2014 8 / 22

Introduktion til Statistik Statistik Moderne statistik har baggrund i sandsynlighedsregning og beskrivende statistik Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 1 Foråret 2014 9 / 22

Introduktion til Statistik Statistik Statistik handler ofte om at analysere en stikprøve, der er taget fra en population Baseret på stikprøven, prøver vi at generalisere (eller udtale os) om populationen Det er derfor vigtigt, at stikprøven er repræsentativ for populationen Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 1 Foråret 2014 10 / 22

Beskrivende statistik: Nøgletal Oversigt 1 Praktisk Information 2 Introduktion til Statistik 3 Beskrivende statistik: Nøgletal 4 Software: R Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 1 Foråret 2014 11 / 22

Beskrivende statistik: Nøgletal Kapitel 2: Nøgletal Vi anvender en række nøgletal for at opsummere og beskrive data (stokastiske variable) Gennemsnit Median Varians s 2 x Standardafvigelse Fraktiler s Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 1 Foråret 2014 12 / 22

Beskrivende statistik: Nøgletal Gennemsnit Gennemsnittet er et nøgletal, der angiver tyngdepunkt eller centrering af data Gennemsnit: x = 1 n n i=1 Vi siger, at x er et estimat af middelværdien x i Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 1 Foråret 2014 13 / 22

Beskrivende statistik: Nøgletal Median Medianen er et også nøgletal, der angiver tyngdepunkt eller centrering af data. I nogle tilfælde, f.eks. hvis man har ekstreme værdier, er medianen at foretrække frem for middelværdien Median: Den midterste observation (i den sorterede rækkefølge) Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 1 Foråret 2014 14 / 22

Beskrivende statistik: Nøgletal Varians og standardafvigelse Variansen (eller standardafvigelsen) siger noget om hvor meget data spreder: Varians s 2 = 1 n 1 n (x i x) 2 i=1 Standardafvigelse (spredning) s = s 2 = 1 n 1 n (x i x) 2 i=1 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 1 Foråret 2014 15 / 22

Beskrivende statistik: Nøgletal Variationskoefficient Standardafvigelse og variansen er nøgletal for den absolutte variation. Hvis man gerne vil sammenligne variationen mellem forskellige datasæt, er det en god idé at anvende et relativt nøgletal, nemlig variationskoefficienten: V = s x 100 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 1 Foråret 2014 16 / 22

Beskrivende statistik: Nøgletal Fraktiler Medianen beregnes som det punkt, der deler data ind i to halvdele. Man kan naturligvis finde andre punkter, der deler data ind i andre dele, og det man kalder fraktiler. Ofte beregner man fraktilerne 0, 25, 50, 75, 100 % fraktiler og/eller 0, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100 % fraktiler Bemærk: 50% fraktilen svarer til medianen Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 1 Foråret 2014 17 / 22

Beskrivende statistik: Nøgletal Figurer/Tabeller Kvantitative data: Scatter plot (xy plot) Histogram Kumulativ fordeling Boxplots Antalsdata: Bar charts (pareto diagram) Pie charts Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 1 Foråret 2014 18 / 22

Software: R Oversigt 1 Praktisk Information 2 Introduktion til Statistik 3 Beskrivende statistik: Nøgletal 4 Software: R Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 1 Foråret 2014 19 / 22

Software: R Software: R Appendix C i bogen (7. og 8. udg.): Beskrivelse af R. (uploadet i Campusnet) R-øvelse i dag. R på Gbaren kan køres hjemmefra.(thinlinc) R kan installeres på egen computer.(se R-note) Anbefales: Brug RStudio (http://www.rstudio.com/) Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 1 Foråret 2014 20 / 22

Software: R Næste uge: Diskrete fordelinger - kapitel 4 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 1 Foråret 2014 21 / 22

Software: R Oversigt 1 Praktisk Information 2 Introduktion til Statistik 3 Beskrivende statistik: Nøgletal 4 Software: R Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 1 Foråret 2014 22 / 22