Forelæsning 1: Intro, R og beskrivende statistik

Størrelse: px
Starte visningen fra side:

Download "Forelæsning 1: Intro, R og beskrivende statistik"

Transkript

1 Introduktion til statistik Forelæsning 1: Intro, R og beskrivende statistik Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark pbac@dtu.dk Efterår 2018 DTU Compute Introduktion til Statistik Efterår / 61

2 Kapitel 1: Simple plots og deskriptiv statistik Tag en stikprøve: Brug deskriptiv statistik til at se på den! Opsummerende størrelser for stikprøve Gennemsnittet ( x) Standard afvigelse (s) Empirisk varians (s 2 ) Fraktiler og percentiler (f.eks. 15% af data ligger under 0.15 fraktil) Median, øvre- og nedre kvartiler Empririsk korrelation (r) (mellem to stikprøver) Simple plots Scatter plot (xy plot) Histogram (empirisk tæthed) Kumulativ fordeling (empirisk fordeling) Boxplots, søjlediagram, cirkeldiagram (lagkagediagram) DTU Compute Introduktion til Statistik Efterår / 61

3 Chapter 1: Simple Graphics and Summary Statistics Take a sample: Use descriptive statistics to look at it! Summary statistics Sample mean: x Sample standard deviation: s Sample variance: s 2 Quantiles and percentiles (e.g. 15% of data is below 0.15 quantile) Median, upper- and lower quartiles Sample correlation (r) (between two samples) Simple graphics Scatter plot (xy plot) Histogram (empirical density) Cumulative distribution (empirical distribution) Boxplots, Bar charts, Pie charts DTU Compute Introduktion til Statistik Efterår / 61

4 Oversigt 1 Praktisk Information 2 Introduction to Statistics - a primer 3 Population og stikprøve 4 Beskrivende statistik: Nøgletal Gennemsnit Median Spredning Fraktiler Kovarians og Korrelation 5 Beskrivende statistik: Grafisk fremstilling 6 Software: R 7 Projekter DTU Compute Introduktion til Statistik Efterår / 61

5 Praktisk Information Praktisk Information Generel daglig agenda: FØR undervisningsmodulet: læs det annoncerede i bogen! FØRST! 2 timers øvelser: Excersises i bogen (HUSK PEN OG PAPIR) DEREFTER 2x45 minutters forelæsning Skriftlig eksamen: Søndag 16. december OBLIGATORISKE projekter: 2 stk - skal godkendes for at kunne gå til eksamen Installer lige Socrative app på dit device DTU Compute Introduktion til Statistik Efterår / 61

6 Praktisk Information Praktisk Information Campusnet: Meddelelser Projekter - download og aflevering Hjemmeside: compute.dtu.dk Forelæsningsplan Læsemateriale: Introduction to Statistics at DTU Øvelser & besvarelser Slides og R-scripts Podcasts af forelæsninger (02402) (engelsk, gamle på dansk) Quizzer Projekt info DTU Compute Introduktion til Statistik Efterår / 61

7 Introduction to Statistics - a primer Eksempel med terning Hvordan kan man teste om en terning er fair? F.eks. givet en terning, svar på: Er der 1/6 sandsynlighed for at slå en sekser? Stort set umuligt at beskrive med fysik Derfor: Kast med terningen, observer og derefter udregn statistik Afgør om der er 1/6 ± fejlmargin sandsynlighed for at slå sekser med terningen Der er altid en hvis sandsynlighed for at tage fejl! men den kan styres til at matche risikoen man vil tage. DTU Compute Introduktion til Statistik Efterår / 61

8 Introduction to Statistics - a primer Hvor mange gange skal jeg slå med terningen? Hvor mange gange skal jeg slå med terningen for at afgøre om terningen slår seksere med 1/6 ± fejlmargin sandsynlighed? Det kan I nemt beregne om 13 uger :) Beregn det med R: alpha < ## Fejlmargen vi vil tillade (kaldet præcisionen, margin of error) ME < ## Beregn antal gange vi skal slå med terningen p * (1-p) * (qnorm(1-alpha/2)/me)^2 DTU Compute Introduktion til Statistik Efterår / 61

9 Introduction to Statistics - a primer Statistikken historie og anvendelse i medicin New England Journal of medicine: EDITORIAL: Looking Back on the Millennium in Medicine, N Engl J Med, 342:42-49, January 6, DTU Compute Introduktion til Statistik Efterår / 61

10 Introduction to Statistics - a primer Millennium list (10 vigtigste bidrag til udvikling af medicin) Elucidation of Human Anatomy and Physiology Discovery of Cells and Their Substructures Elucidation of the Chemistry of Life Application of Statistics to Medicine Development of Anesthesia Discovery of the Relation of Microbes to Disease Elucidation of Inheritance and Genetics Knowledge of the Immune System Development of Body Imaging Discovery of Antimicrobial Agents Development of Molecular Pharmacotherapy DTU Compute Introduktion til Statistik Efterår / 61

11 Introduction to Statistics - a primer James Lind One of the earliest clinical trials took place in 1747, when James Lind treated 12 scorbutic ship passengers with cider, an elixir of vitriol, vinegar, sea water, oranges and lemons, or an electuary recommended by the ship s surgeon. The success of the citrus-containing treatment eventually led the British Admiralty to mandate the provision of lime juice to all sailors, thereby eliminating scurvy from the navy. (se Man kan altså undersøge fænomener man ikke forstår og derefter begynde at forstå dem! DTU Compute Introduktion til Statistik Efterår / 61

12 Introduction to Statistics - a primer John Snow The origin of modern epidemiology is often traced to 1854, when John Snow demonstrated the transmission of cholera from contaminated water by analyzing disease rates among citizens served by the Broad Street Pump in London s Golden Square. He arrested the further spread of the disease by removing the pump handle from the polluted well. (se DTU Compute Introduktion til Statistik Eftera r / 61

13 Introduction to Statistics - a primer Google - Big Data A quote from New York Times, 5. August 2009, from the article titled For Today s Graduate, Just One Word: Statistics is: I keep saying that the sexy job in the next 10 years will be statisticians, said Hal Varian, chief economist at Google. And I m not kidding. DTU Compute Introduktion til Statistik Efterår / 61

14 Introduction to Statistics - a primer IBM - Big Data The key is to let computers do what they are good at, which is trawling these massive data sets for something that is mathematically odd, said Daniel Gruhl, an I.B.M. researcher whose recent work includes mining medical data to improve treatment. And that makes it easier for humans to do what they are good at - explain those anomalies. Optagelse af gæsteforedrag af Henrik H. Eliassen IBM på hjemmesiden. DTU Compute Introduktion til Statistik Efterår / 61

15 Introduction to Statistics - a primer Hvad er Statistik? Hvordan behandles (eller analyseres) data? Hvordan beskrives tilfældig variation? Statistik er et værktøj til at træffe beslutninger Vigtigt i ingeniørens værktøjskasse: Analyse af data Forsøgsplanlægning Forudsigelse af fremtidige værdier... og meget mere! DTU Compute Introduktion til Statistik Efterår / 61

16 Introduction to Statistics - a primer Spørgsmål Socrative.com, room: PBAC Tror du, at din karakter til eksamen ligger blandt de 50% højeste, dvs. ligger du i den bedste halvdel til eksamen? TRUE: Ja FALSE: Nej DTU Compute Introduktion til Statistik Efterår / 61

17 Introduction to Statistics - a primer Anvendelser på DTU (mest Compute) Energisystemer: Prognoser af sol- og vindkraft Modellering af energilagring, menneskers adfærd, spildevandsanlæg Styring: Mekaniske systemer (e.g. robotter, biler, skibe, vindmøller,...) Medicin (Compute): Statistik på medicinforsøg, Kunstig bugspytkirtel Billedanalyse: Billeder er observeret data! Røntgenbilleder, 3D skanninger, Video,... Signalbehandling: Elektriske systemer (filtre, forstærkere,...) Computer science: Internet data (trafik, Google, Facebook, osv.) Tekstgenkendelse, Sikkerhed: Server angreb etc. Byg: Tests af materialeegenskaber og konstruktioner Energisystemer og indeklima Management: Finans, spørgeskema undersøgelser,... Kemi, fysik, miljø,... Hver gang man har målinger skal man sådan set bruge statistik! DTU Compute Introduktion til Statistik Efterår / 61

18 Population og stikprøve Population og stikprøve Statistik handler ofte om at analysere en stikprøve (sample), der er taget fra en population (population) Baseret på stikprøven, vil vi generalisere om populationen (dvs. beskrive noget om hele populationen) Det er derfor vigtigt, at stikprøven er repræsentativ for populationen DTU Compute Introduktion til Statistik Efterår / 61

19 Population og stikprøve Population og stikprøve (Uendelig) Population Stikprøve {x 1,x 2,...,x n } Tilfældigt udvalgt Middelværdi µ Statistisk inferens Stikprøvegennemsnit x DTU Compute Introduktion til Statistik Efterår / 61

20 Population og stikprøve Population og stikprøve (Infinite) Statistical population Sample {x 1,x 2,...,x n } Randomly selected Mean µ Statistical Inference Sample mean x DTU Compute Introduktion til Statistik Efterår / 61

21 Population og stikprøve Meningsmålinger Socrative.com, room: PBAC Hvilken af følgende er en typisk årsag til at meningsmålinger ved valg ofte fejler? A: Stikprøvetagningen er simpelt, men beregningerne er for komplicerede B: Det er svært at tage en repræsentativ stikprøve (det er bl.a. svært at få alle grupper til at svare, samt forudse hvor meget de vil møde op og stemme) C: Vælgerne svarer simpelthen ikke rigtigt når de bliver adspurgt D: Ved ikke B: F.eks. hvis nogle grupper er svære at få til at svare på meningsmålinger, så bliver de underrepræsenterede i stikprøven. Det er svært at korrigere for! (det var bare et eksempel, der er mange årsager til biased meningsmålinger) DTU Compute Introduktion til Statistik Efterår / 61

22 Beskrivende statistik: Nøgletal Nøgletal (summary statistics) Vi anvender en række nøgletal (eller statistikker) for at opsummere og beskrive data (en stikprøve): Gennemsnit: Tyngdepunkt eller centrering Median: Tyngdepunkt eller centrering Varians: Variation Spredning: Variation (samme enhed som stikprøve) Fraktiler og kvartiler: Siger noget om fordelingen af stikprøve Variations koefficient: Variationen i stikprøve (enhedsløs) Kovarians: Samvariation mellem datasæt Korrelation: Samvariation mellem datasæt (enhedsløs) DTU Compute Introduktion til Statistik Efterår / 61

23 Beskrivende statistik: Nøgletal Gennemsnit Stikprøvegennemsnit (sample mean) Gennemsnittet er et nøgletal, der angiver tyngdepunkt eller centrering Stikprøvegennemsnit x = 1 n n x i i=1 Vi siger, at x er et estimat af middelværdien for populationen (populationsgennemsnittet) DTU Compute Introduktion til Statistik Efterår / 61

24 Beskrivende statistik: Nøgletal Median Median Medianen er et også nøgletal, der angiver centrering I nogle tilfælde, f.eks. hvis man har ekstreme værdier, er medianen at foretrække frem for gennemsnittet Median (stikprøvemedian): Den midterste observation i den sorterede rækkefølge (tallet hvor der er lige mange observationer under og over) DTU Compute Introduktion til Statistik Efterår / 61

25 Beskrivende statistik: Nøgletal Eksempel Eksempel: Højder af unge mænd Stikprøve (sample) x = [185, 184, 194, 180, 182] Gennemsnit n = 5 x = 1 ( ) = Median Først sorter data: Vælg så det midterste (idet n er ulige)(3 te) tal: 184 Hvis en person på 235cm tilføjes til stikprøven, hvilken bliver mest påvirket? (socrative.com eller app. Room:PBAC) A: Gennemsnittet B: Medianen C: Påvirkes lige meget D: Ved ikke Svar) A: Gennemsnittet. Det stiger meget mere end medianen (nyt gennemsnit og ny median 184.5) DTU Compute Introduktion til Statistik Efterår / 61

26 Beskrivende statistik: Nøgletal Eksempel Stikprøvevarians (sample variance) og -standardafvigelse (sample standard deviation) Stikprøvevarians siger noget om hvor meget observationerne er spredt: Stikprøvevarians s 2 = 1 n 1 Stikprøvestandardafvigelse s = s 2 = n i=1 1 n 1 (x i x) 2 n i=1 (x i x) 2 DTU Compute Introduktion til Statistik Efterår / 61

27 Beskrivende statistik: Nøgletal Spredning Eksempel med spredning: Højder af unge mænd Stikprøve (sample): x = [185, 184, 194, 180, 182] n = 5 Stikprøvevarians (sample variance) s 2 = 1 4( (185 x) 2 + (184 x) 2 + (194 x) 2 + (180 x) 2 + (182 x) 2) = 29 Standardafvigelse (sample standard deviation) s = s 2 = 29 = DTU Compute Introduktion til Statistik Efterår / 61

28 Beskrivende statistik: Nøgletal Fraktiler Fraktiler (percentiles eller quantiles) Medianen beregnes som det punkt, der deler data ind i to halvdele Man kan naturligvis finde punkter som deler i andre dele: De punkter kaldes fraktiler Ofte beregner man 0, 25, 50, 75, 100% fraktilerne kaldes kvartilerne (quartiles) 50% fraktilen er altså medianen Eksempel: 10% fraktilen er punktet (estimat) hvor 10% af observationerne ligger under DTU Compute Introduktion til Statistik Efterår / 61

29 Beskrivende statistik: Nøgletal Fraktiler Fraktiler (percentiles eller quantiles, Definition 1.7) Den p te fraktil (quantile), kan defineres ud fra følgende procedure: 1 Sorter de n observationer fra mindst til størst: x (1),...,x (n) 2 Beregn pn 3 Hvis pn er et helt tal: Midl den pn te og (pn + 1) te sorterede observationer Den p te fraktil = ( ) x (np) + x (np+1) /2 4 Hvis pn er et ikke-helt tal: tag den næste i den sorterede liste: Den p te fraktil = x ( np ) hvor np er ceiling( loftet ) af np, dvs. det mindste hele tal større end np DTU Compute Introduktion til Statistik Efterår / 61

30 Beskrivende statistik: Nøgletal Fraktiler Eksempel på fraktiler: Højder af unge mænd Data, n=10: Sorteret: Nedre kvartil (25% fraktil), Q 1 : Sorter og så vælg det rigtige baseret på np = 2.5: Q 1 = 167 Øvre kvartil (75% fraktil), Q 3 : Sorter og så vælg det rigtige baseret på np = 7.5: Q 3 = 187 DTU Compute Introduktion til Statistik Efterår / 61

31 Beskrivende statistik: Nøgletal Kovarians og Korrelation Kovarians og Korrelation - mål for sammenhæng Heights (x i ) Weights (y i ) Weight y = 78 x = Height DTU Compute Introduktion til Statistik Efterår / 61

32 Beskrivende statistik: Nøgletal Fraktiler Kovarians og Korrelation - Def og 1.18 Kovariansen Korrelationskoefficient r = 1 n 1 s xy = 1 n 1 n i=1 n i=1 (x i x)(y i ȳ) ( )( ) xi x yi ȳ = s xy s x s y s x s y hvor s x og s y er standard afvigelsen for henholdsvis x og y DTU Compute Introduktion til Statistik Efterår / 61

33 Beskrivende statistik: Nøgletal Fraktiler Kovarians og Korrelation - mål for sammenhæng Student Heights (x i ) Weights (y i ) (x i x) (y i ȳ) (x i x)(y i ȳ) s xy = 1 ( ) = = s x = 12.21, and s y = r = = 0.97 DTU Compute Introduktion til Statistik Efterår / 61

34 Beskrivende statistik: Nøgletal Fraktiler Korrelation - egenskaber Korrelation - egenskaber r er altid mellem 1 og 1: 1 r 1 r mål for den lineære sammenhæng mellem x og y r = ±1 kun hvis punkterne ligger på en ret linie r > 0 hvis den generelle trend it scatter plottet er positiv r < 0 hvis den generelle trend it scatter plottet er negativ DTU Compute Introduktion til Statistik Efterår / 61

35 Beskrivende statistik: Nøgletal Fraktiler Korrelation Socrative.com, room: PBAC Hvad er korrelationen mellem x og y? A: ca B: ca. 0 C: ca x y Svar) C: ca DTU Compute Introduktion til Statistik Efterår / 61

36 Beskrivende statistik: Nøgletal Fraktiler Korrelation Hvad er korrelationen mellem x og y? A: ca. 0 B: ca C: ca x y Svar) B: ca DTU Compute Introduktion til Statistik Efterår / 61

37 Beskrivende statistik: Nøgletal Fraktiler Korrelation Hvad er korrelationen mellem x og y? A: ca B: ca. 0 C: ca x y Svar) B: ca. 0 DTU Compute Introduktion til Statistik Efterår / 61

38 Beskrivende statistik: Nøgletal Fraktiler Korrelation Hvad er korrelationen mellem x og y? A: ca B: ca. 0 C: ca x y Svar) B: ca. 0 DTU Compute Introduktion til Statistik Efterår / 61

39 Beskrivende statistik: Grafisk fremstilling Beskrivende statistik (explorative statistics) Undersøg et data sæt Beskriv data ved at fremhæve de vigtige pointer så andre hurtigt kan se indhold, trends og synlige sammenhænge Præsenter data for andre, som ikke kender det Grafisk fremstilling med forskellige plots: Histogram (empirisk tæthedsfunktion) Empirisk kumulativ tæthedsfunktion Boxplot Scatterplot DTU Compute Introduktion til Statistik Efterår / 61

40 Software: R Software: R Installer R og Rstudio på egen computer Introduceres i bogen (kap. 1.5) Er integreret i mange ting i kurset vi gør Globalt og hurtigt voksende open source beregningsmiljø ADVARSEL: R kan IKKE erstatte vores hjerner!!!! (Læs sektion 1.5.4!) DTU Compute Introduktion til Statistik Efterår / 61

41 Software: R Software: R > ## Adding numbers in the console > 2+3 > ## Define a vector > x <- c(1, 4, 6, 2) > x > ## A sequence from 1 to 10 > x <- 1:10 > x DTU Compute Introduktion til Statistik Efterår / 61

42 Software: R Software: R ## Sample Mean and Median (data from enote) x <- c(168,161,167,179,184,166,198,187,191,179) mean(x) median(x) ## Sample variance and standard deviation var(x) sd(x) DTU Compute Introduktion til Statistik Efterår / 61

43 Software: R Software: R ## Sample quartiles quantile(x, type=2) ## 0% 25% 50% 75% 100% ## ## Sample quantiles 0%, 10%,..,90%, 100%: quantile(x, probs=seq(0, 1, by=0.10), type=2) ## 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% ## DTU Compute Introduktion til Statistik Efterår / 61

44 Software: R Histogram ## A histogram of the heights: hist(x) Histogram of x Frequency x DTU Compute Introduktion til Statistik Efterår / 61

45 Software: R Empirisk tæthed (empirical density plottes med density histogram) ## A density histogram (empirical distribution) of the heights: hist(x, freq=false, col="red", nclass=8) Density Histogram of x x DTU Compute Introduktion til Statistik Efterår / 61

46 Software: R Empirisk kumuleret distribution ## Empirical cumulated distribution function (ecdf) plot(ecdf(x), verticals=true) Fn(x) ecdf(x) x DTU Compute Introduktion til Statistik Efterår / 61

47 Software: R Boxplot ## A basic boxplot of the heights: (range=0 makes it "basic") boxplot(x, range=0, col="red", main="basic boxplot") text(1.3, quantile(x), c("minimum","q1","median","q3","maximum"), col="blue") Basic boxplot Maximum Q3 Median Q1 Minimum DTU Compute Introduktion til Statistik Efterår / 61

48 Software: R Modified boxplot ## A modified boxplot of the heights with an ## extreme observation, 235cm added: ## The modified version is the default boxplot(c(x,235), col="red", main="modified boxplot") text(1.3, quantile(c(x,235)), c("minimum","q1","median","q3", "Maximum"),col="blue") Modified boxplot Maximum Q3 Median Q1 Minimum DTU Compute Introduktion til Statistik Efterår / 61

49 Software: R Spørgsmål Socrative.com, room: PBAC Hvad er markeret med den lilla linie? A: Gennemsnittet B: Medianen C: 10% fraktilen D: 95% fraktilen Empirical density Density x Svar) D: 95% Fraktil DTU Compute Introduktion til Statistik Efterår / 61

50 Software: R Spørgsmål Socrative.com, room: PBAC Hvad er markeret med den røde linie? A: Gennemsnittet B: Medianen C: 10% fraktilen D: 95% fraktilen Empirical density Density x Svar) C: 10% Fraktil DTU Compute Introduktion til Statistik Efterår / 61

51 Software: R Spørgsmål Socrative.com, room: PBAC Hvad er markeret med den blå linie? A: Gennemsnittet B: Medianen C: 10% fraktilen D: 95% fraktilen Empirical density Density x Svar) B: Medianen DTU Compute Introduktion til Statistik Efterår / 61

52 Software: R Spørgsmål Socrative.com, room: PBAC Hvad er markeret med den grønne linie? A: Gennemsnittet B: Medianen C: 10% fraktilen D: 95% fraktilen Empirical density Density x Svar) A: Gennemsnittet DTU Compute Introduktion til Statistik Efterår / 61

53 Projekter Projekter Der skal laves to projekter Emne for alle projekter i 1. omgang: Beskrivende statistik, konfidensintervaller og hypotesetest 1. omgang er der fire projekter at vælge imellem: Handel med ETF I Varmeforbrug i Sønderborg I Skive fjord I BMI I Arbejde i grupper om beregninger, men rapporterne skal skrives individuelt, se mere på Se også afleveringsdatoer på hjemmesiden Begynd på projekt 1 næste gang til grupperegning Bemærk: der checkes for plagiering og det bliver anmeldt! Begge skal godkendes for at kunne gå til eksamen. Får man ikke godkendt første aflevering er der mulighed for genaflevering DTU Compute Introduktion til Statistik Efterår / 61

54 Projekter Næste uge Næste uge: Stokastiske variable, sandsynligheder, diskrete fordelinger - kapitel 2 i bogen HUSK AT BRUGE PAPIR OG BLYANT NÅR I REGNER! DTU Compute Introduktion til Statistik Efterår / 61

Oversigt. 1 Praktisk Information. 2 Introduction to Statistics - a primer. 3 Population og stikprøve. 5 Beskrivende statistik: Grafisk fremstilling

Oversigt. 1 Praktisk Information. 2 Introduction to Statistics - a primer. 3 Population og stikprøve. 5 Beskrivende statistik: Grafisk fremstilling Introduktion til statistik Forelæsning 1: Intro, R og beskrivende statistik Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Oversigt. 1 Praktisk Information. 2 Introduction to Statistics - a primer. 3 Intro Case historier: IBM Big data, Novo Nordisk small data, Skive fjord

Oversigt. 1 Praktisk Information. 2 Introduction to Statistics - a primer. 3 Intro Case historier: IBM Big data, Novo Nordisk small data, Skive fjord Course 02402/02323 Introducerende Statistik Forelæsning 1: Intro, R og beskrivende statistik Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet

Læs mere

Oversigt. 1 Praktisk Information. 2 Introduction to Statistics - a primer. 3 Introduktion til Statistik. 4 Anvendelser på DTU (mest Compute)

Oversigt. 1 Praktisk Information. 2 Introduction to Statistics - a primer. 3 Introduktion til Statistik. 4 Anvendelser på DTU (mest Compute) Introduktion til statistik Forelæsning 1: Intro, R og beskrivende statistik Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Forelæsning 1: Intro og beskrivende statistik

Forelæsning 1: Intro og beskrivende statistik Kursus 02402 Introduktion til Statistik Forelæsning 1: Intro og beskrivende statistik Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby

Læs mere

Oversigt. Kursus 02402 Introduktion til Statistik. Forelæsning 1: Intro og beskrivende statistik. Per Bruun Brockhoff. Praktisk Information

Oversigt. Kursus 02402 Introduktion til Statistik. Forelæsning 1: Intro og beskrivende statistik. Per Bruun Brockhoff. Praktisk Information Kursus 02402 Forelæsning 1: Intro og beskrivende statistik Oversigt 1 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher

Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher Kursus 02323: Introducerende Statistik Forelæsning 12: Forsøgsplanlægning Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 13: Summary Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 33B, Rum 9 Danmarks Tekniske Universitet 28 Lyngby Danmark e-mail: pbac@dtu.dk Efterår

Læs mere

Kursus 02402/02323 Introduktion til statistik. Forelæsning 13: Et overblik over kursets indhold. Klaus K. Andersen og Per Bruun Brockhoff

Kursus 02402/02323 Introduktion til statistik. Forelæsning 13: Et overblik over kursets indhold. Klaus K. Andersen og Per Bruun Brockhoff Kursus 02402/02323 Introduktion til statistik Forelæsning 13: Et overblik over kursets indhold Klaus K. Andersen og Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Danmarks Tekniske Universitet

Læs mere

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/ Program: 1. Repetition af vigtige sandsynlighedsfordelinger: binomial, (Poisson,) normal (og χ 2 ). 2. Populationer og stikprøver 3. Opsummering af data vha. deskriptive størrelser og grafer. 1/29 Binomial

Læs mere

1 enote 1: Simple plots og deskriptive statistik. 2 enote 2: Diskrete fordelinger. 3 enote 2: Kontinuerte fordelinger

1 enote 1: Simple plots og deskriptive statistik. 2 enote 2: Diskrete fordelinger. 3 enote 2: Kontinuerte fordelinger Kursus 02402/02323 Introduktion til statistik Forelæsning 13: Et overblik over kursets indhold Peder Bacher DTU Compute, Dynamiske Systemer Building 303B, Room 017 Danish Technical University 2800 Lyngby

Læs mere

Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger. Peder Bacher

Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger. Peder Bacher Introduktion til Statistik Forelæsning 2: Stokastisk variabel og diskrete fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

Oversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Oversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger Introduktion til Statistik Forelæsning 2: og diskrete fordelinger Oversigt 1 2 3 Fordelingsfunktion 4 Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 017 Danmarks Tekniske Universitet 2800

Læs mere

1 enote 1: Simple plots og deskriptive statistik. 2 enote2: Diskrete fordelinger. 3 enote 2: Kontinuerte fordelinger

1 enote 1: Simple plots og deskriptive statistik. 2 enote2: Diskrete fordelinger. 3 enote 2: Kontinuerte fordelinger Kursus 02402/02323 Introduktion til statistik Forelæsning 13: Et overblik over kursets indhold Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Building 324, Room 220 Danish Technical University

Læs mere

Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger. Peder Bacher

Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger. Peder Bacher Introduktion til Statistik Forelæsning 2: Stokastisk variabel og diskrete fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

Forelæsning 4: Konfidensinterval for middelværdi (og spredning)

Forelæsning 4: Konfidensinterval for middelværdi (og spredning) Introduktion til Statistik Forelæsning 4: Konfidensinterval for middelværdi (og spredning) Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Introduktion Kursusholder: Kasper K. Berthelsen Opbygning: Kurset består af 5 blokke En blok består af: To normale

Læs mere

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger Course 02402/02323 Introducerende Statistik Forelæsning 2: Stokastisk variabel og diskrete fordelinger Klaus K. Andersen og Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Danmarks Tekniske Universitet

Læs mere

Forelæsning 11: Envejs variansanalyse, ANOVA

Forelæsning 11: Envejs variansanalyse, ANOVA Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalyse, ANOVA Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

Kvantitative Metoder 1 - Forår 2007. Dagens program

Kvantitative Metoder 1 - Forår 2007. Dagens program Dagens program Kapitel 7 Introduktion til statistik Organisering af data Diskrete variabler Kontinuerte variabler Beskrivende statistik Fraktiler Gennemsnit Empirisk varians og spredning Empirisk korrelationkoe

Læs mere

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske

Læs mere

Forelæsning 11: Kapitel 11: Regressionsanalyse

Forelæsning 11: Kapitel 11: Regressionsanalyse Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

k UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test)

k UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test) Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalse, ANOVA Peder Bacher DTU Compute, Dnamiske Sstemer Bgning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lngb Danmark e-mail:

Læs mere

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

Statistik. Introduktion Deskriptiv statistik Sandsynslighedregning

Statistik. Introduktion Deskriptiv statistik Sandsynslighedregning Statistik Introduktion Deskriptiv statistik Sandsynslighedregning Introduktion Kasper K. Berthelsen, Institut f. Mat. Fag 8 Kursusgange Individuel mundtlig eksamen (7-skala) Udgangspunkt i opgaver Software:

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable Kursus 02402 Introduktion til Statistik Forelæsning 2: Kapitel 4, Diskrete fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Forelæsning 2: Kapitel 4, Diskrete fordelinger

Forelæsning 2: Kapitel 4, Diskrete fordelinger Kursus 02402 Introduktion til Statistik Forelæsning 2: Kapitel 4, Diskrete fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Introduktion til Statistik. Forelæsning 12: Inferens for andele. Peder Bacher

Introduktion til Statistik. Forelæsning 12: Inferens for andele. Peder Bacher Introduktion til Statistik Forelæsning 12: Inferens for andele Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk Efterår

Læs mere

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 3: Kontinuerte fordelinger. Per Bruun Brockhoff

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 3: Kontinuerte fordelinger. Per Bruun Brockhoff Course 242/2323 Introducerende Statistik Forelæsning 3: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 22 Danmarks Tekniske Universitet 28 Lyngby Danmark

Læs mere

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Introduktion Kasper K. Berthelsen, Inst f. Matematiske Fag Omfang: 8 Kursusgang I fremtiden

Læs mere

En Introduktion til SAS. Kapitel 5.

En Introduktion til SAS. Kapitel 5. En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel

Læs mere

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Introduktion Kasper K. Berthelsen, Inst f. Matematiske Fag Omfang: 8 Kursusgang I fremtiden

Læs mere

Introduktion til Statistik. Forelæsning 10: Inferens for andele. Peder Bacher

Introduktion til Statistik. Forelæsning 10: Inferens for andele. Peder Bacher Introduktion til Statistik Forelæsning 10: Inferens for andele Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk Efterår

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Kursus 242 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik Bygning 35/324 Danmarks Tekniske Universitet 28 Lyngby Danmark e-mail:

Læs mere

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Program 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Fordeling af X Stikprøve X 1,X 2,...,X n stokastisk X stokastisk. Ex (normalfordelt stikprøve)

Læs mere

Kursus 02323: Introducerende Statistik. Forelæsning 8: Simpel lineær regression. Peder Bacher

Kursus 02323: Introducerende Statistik. Forelæsning 8: Simpel lineær regression. Peder Bacher Kursus 02323: Introducerende Statistik Forelæsning 8: Simpel lineær regression Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Kursus 02402/02323 Introducerende Statistik

Kursus 02402/02323 Introducerende Statistik Kursus 02402/02323 Introducerende Statistik Forelæsning 8: Simpel lineær regression Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Kursus 02402 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

VIGTIGT! Kurset består af: 1. Forelæsninger. 2. Øvelser. 3. Litteraturlæsning

VIGTIGT! Kurset består af: 1. Forelæsninger. 2. Øvelser. 3. Litteraturlæsning Intro til statistik Rasmus F. Brøndum, Institut 17 (Matematik) Hjemmeside: people.math.aau.dk/~froberg 22 forelæsninger (hvor af jeg afholder de første 13) + det samme antal øvelsesgange. Hjælpelærer:

Læs mere

Ex µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4. hvor. Vha. R: Vha. tabel:

Ex µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4. hvor. Vha. R: Vha. tabel: Normal fordeling Tæthedsfunktion for normalfordeling med middelværdi µ og varians σ 2 : Program (8.15-10): f() = 1 µ)2 ep( ( 2πσ 2 2σ 2 ) E µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4 1. vigtige sandsynlighedsfordelinger:

Læs mere

Kapitel 3 Centraltendens og spredning

Kapitel 3 Centraltendens og spredning Kapitel 3 Centraltendens og spredning Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 25 Indledning I kapitel 2 omsatte vi de rå data til en tabel, der bedre viste materialets fordeling

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Indblik i statistik - for samfundsvidenskab

Indblik i statistik - for samfundsvidenskab Indblik i statistik - for samfundsvidenskab Læs mere om nye titler fra Academica på www.academica.dk Nikolaj Malchow-Møller og Allan H. Würtz Indblik i statistik for samfundsvidenskab Academica Indblik

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Note om Monte Carlo metoden

Note om Monte Carlo metoden Note om Monte Carlo metoden Kasper K. Berthelsen Version 1.2 25. marts 2014 1 Introduktion Betegnelsen Monte Carlo dækker over en lang række metoder. Fælles for disse metoder er, at de anvendes til at

Læs mere

Oversigt. 1 Motiverende eksempel: Højde-vægt. 2 Lineær regressionsmodel. 3 Mindste kvadraters metode (least squares)

Oversigt. 1 Motiverende eksempel: Højde-vægt. 2 Lineær regressionsmodel. 3 Mindste kvadraters metode (least squares) Kursus 02402/02323 Introducerende Statistik Forelæsning 8: Simpel lineær regression Oversigt Motiverende eksempel: Højde-vægt 2 Lineær regressionsmodel 3 Mindste kvadraters metode (least squares) Klaus

Læs mere

Basal statistik. 30. januar 2007

Basal statistik. 30. januar 2007 Basal statistik 30. januar 2007 Deskriptiv statistik Typer af data Tabeller Grafik Summary statistics Lene Theil Skovgaard, Biostatistisk Afdeling Institut for Folkesundhedsvidenskab, Københavns Universitet

Læs mere

Produkt og marked - matematiske og statistiske metoder

Produkt og marked - matematiske og statistiske metoder Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring

Læs mere

Statistik. Statistik. Hvad er Statistik? Hvad er Statistik? Hvad er Statistik? 1. Hvad er statistik? 2. Mennesker som måleinstrumenter

Statistik. Statistik. Hvad er Statistik? Hvad er Statistik? Hvad er Statistik? 1. Hvad er statistik? 2. Mennesker som måleinstrumenter Statistik Statistik 1. statistik? Per Bruun Brockhoff Professor i Statistik DTU Informatik 27 august 2009 http://www.imm.dtu.dk/~pbb 2. Mennesker som måleinstrumenter Egentlig ikke så meget: Danmarks Statistik:

Læs mere

1 Sandsynlighed Sandsynlighedsbegrebet Definitioner Diskret fordeling Betinget sandsynlighed og uafhængighed...

1 Sandsynlighed Sandsynlighedsbegrebet Definitioner Diskret fordeling Betinget sandsynlighed og uafhængighed... Indhold 1 Sandsynlighed 1 1.1 Sandsynlighedsbegrebet................................. 1 1.2 Definitioner........................................ 2 1.3 Diskret fordeling.....................................

Læs mere

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Lineær regression. Simpel regression. Model. ofte bruges følgende notation: Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til

Læs mere

enote 5: Simpel lineær regressions analyse Kursus 02402/02323 Introducerende Statistik Oversigt

enote 5: Simpel lineær regressions analyse Kursus 02402/02323 Introducerende Statistik Oversigt enote 5: Simpel lineær regressions analse Kursus 02402/02323 Introducerende Statistik Forelæsning 8: Simpel lineær regression To variable: og Beregn mindstekvadraters estimat af ret linje Inferens med

Læs mere

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Stikprøver og stikprøve fordelinger Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Statistik Statistisk Inferens: Prediktere og forekaste værdier af

Læs mere

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke

Læs mere

Hvorfor er det lige at vi skal lære det her?

Hvorfor er det lige at vi skal lære det her? Lektion 8 Stokastiske variable En stokastisk variabel er en afbildning af udfaldsrummet ind i de reelle tal. Man benytter ofte store bogstaver som X, Y og Z til at betegne en stokastisk variabel. Ved at

Læs mere

Løsning til eksamen d.27 Maj 2010

Løsning til eksamen d.27 Maj 2010 DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1

Læs mere

Forelæsning 10: Statistik ved hjælp af simulering

Forelæsning 10: Statistik ved hjælp af simulering Kursus 02402 Introduktion til Statistik Forelæsning 10: Statistik ved hjælp af simulering Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. 1/23 Opsummering af fordelinger X 1. Kendt σ: Z = X µ σ/ n N(0,1)

Læs mere

Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning

Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning Side 1 af 6 Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning Litteratur: Kenneth Hansen & Charlotte Koldsø: Statistik I økonomisk perspektiv, Hans Reitzels Forlag 2012, 2. udgave,

Læs mere

Beskrivende statistik

Beskrivende statistik Beskrivende statistik Stikprøve af størrelse n for variablen x: x 1, x 2,, x n Beskriv fordelingen af data med nogle få talstørrelser. Centralt mål: en værdi som data er centreret om. Variationsmål: mål

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Vejledende studieplan for kvantitativ metode og statistik FYS 514 Modul 14 efteråret 2017

Vejledende studieplan for kvantitativ metode og statistik FYS 514 Modul 14 efteråret 2017 Vejledende studieplan for kvantitativ metode og statistik FYS 514 Modul 14 efteråret 2017 Generelle kommentarer. Undervisningen følger lærebogen og det må kraftigt anbefales at anskaffe denne. Bogen koster

Læs mere

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet Eksamen ved Københavns Universitet i Kvantitative forskningsmetoder Det Samfundsvidenskabelige Fakultet 14. december 2011 Eksamensnummer: 5 14. december 2011 Side 1 af 6 1) Af boxplottet kan man aflæse,

Læs mere

Løsning til eksaminen d. 29. maj 2009

Løsning til eksaminen d. 29. maj 2009 DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag)

6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag) Institut for Folkesundhed Afdeling for Biostatistik Afdeling for Epidemiologi. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag) Opgave 1 Udgangspunktet for de følgende spørgsmål er artiklen:

Læs mere

Normalfordelingen og Stikprøvefordelinger

Normalfordelingen og Stikprøvefordelinger Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger

Læs mere

k UAFHÆNGIGE grupper F-test Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen

k UAFHÆNGIGE grupper F-test Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen Introduktion til Statistik Forelæsning 10: Envejs variansanalyse, ANOVA Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 017 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

Kvantitative Metoder 1 - Forår Dagens program

Kvantitative Metoder 1 - Forår Dagens program Dagens program Afsnit 6.1 Den standardiserede normalfordeling Normalfordelingen Beskrivelse af normalfordelinger: - Tæthed og fordelingsfunktion - Middelværdi, varians og fraktiler Lineære transformationer

Læs mere

Fagplan for statistik, efteråret 2015

Fagplan for statistik, efteråret 2015 Side 1 af 7 M Fagplan for statistik, efteråret 20 Litteratur Kenneth Hansen & Charlotte Koldsø (HK): Statistik I økonomisk perspektiv, Hans Reitzels Forlag 2012, 2. udgave, ISBN 9788741256047 HypoStat

Læs mere

4 Oversigt over kapitel 4

4 Oversigt over kapitel 4 IMM, 2002-09-14 Poul Thyregod 4 Oversigt over kapitel 4 Introduktion Hidtil har vi beskæftiget os med data. Når data repræsenterer gentagne observationer (i bred forstand) af et fænomen, kan det være bekvemt

Læs mere

Introduktion til Statistik. Forelæsning 5: Hypotesetest, power og modelkontrol - one sample. Peder Bacher

Introduktion til Statistik. Forelæsning 5: Hypotesetest, power og modelkontrol - one sample. Peder Bacher Introduktion til Statistik Forelæsning 5: Hypotesetest, power og modelkontrol - one sample Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens Oversigt Oversigt over emner 1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens 2 Konfidensinterval Konfidensinterval for andel Konfidensinterval - normalfordelt stikprøve

Læs mere

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1 Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen

Læs mere

Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl i Kirkesalen, Studiestræde 38 Øvelser

Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl i Kirkesalen, Studiestræde 38 Øvelser Uge 36 Velkommen tilbage Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl. -2 i Kirkesalen, Studiestræde 38 Øvelser Hold -4 og 6: mandag og onsdag kl. 8-; start 3. september Hold 5: tirsdag

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger Kursus 02402 Introduktion til Statistik Forelæsning 4: Kapitel 5: Kontinuerte fordelinger Rune Haubo B Christensen (based on slides by Per Bruun Brockhoff) DTU Compute, Statistik og Dataanalyse Bygning

Læs mere

02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5

02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5 02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5 Opgave 5.117, side 171 (7ed: 5.116 side 201 og 6ed: 5.116 side 197) I denne opgave skal vi benytte relationen mellem den log-normale fordeling

Læs mere

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j Hypoteser om mere end to stikprøver ANOVA k stikprøver: (ikke ordinale eller højere) H 0 : 1 2... k gælder også for k 2! H 0ij : i j H 0ij : i j simpelt forslag: k k 1 2 t-tests: i j DUER IKKE! Bonferroni!!

Læs mere

Basal statistik. 2. september 2008

Basal statistik. 2. september 2008 Basal statistik 2. september 2008 Deskriptiv statistik Grafik Summary statistics Normalfordelingen Typer af data Esben Budtz-Jørgensen, Biostatistisk Afdeling Institut for Folkesundhedsvidenskab, Københavns

Læs mere

Ikke-parametriske tests

Ikke-parametriske tests Ikke-parametriske tests 2 Dagens menu t testen Hvordan var det nu lige det var? Wilcoxson Mann Whitney U Kruskall Wallis Friedman Kendalls og Spearmans correlation 3 t-testen Patient Drug Placebo difference

Læs mere

Basal statistik. 29. januar 2008

Basal statistik. 29. januar 2008 Basal statistik 29. januar 2008 Deskriptiv statistik Grafik Summary statistics Normalfordelingen Typer af data Lene Theil Skovgaard, Biostatistisk Afdeling Institut for Folkesundhedsvidenskab, Københavns

Læs mere

Forelæsning 9: Inferens for andele (kapitel 10)

Forelæsning 9: Inferens for andele (kapitel 10) Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1

Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1 Statistik Formålet... 1 Mindsteværdi... 1 Størsteværdi... 1 Ikke grupperede observationer... 2 Median og kvartiler defineres ved ikke grupperede observationer således:... 2 Middeltal defineres ved ikke

Læs mere

Kvantitative Metoder 1 - Forår 2007

Kvantitative Metoder 1 - Forår 2007 Dagens program Kapitel 4: Diskrete fordelinger Afsnit 4.1-4.2, 4.7: Bernoulli fordeling Binomial fordeling Store Tals Lov (Laws of Averages, Laws of Large Numbers) 1 Bernoulli fordeling Kvantitative Metoder

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 14. december 2009 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Basic statistics for experimental medical researchers

Basic statistics for experimental medical researchers Basic statistics for experimental medical researchers Sample size calculations September 15th 2016 Christian Pipper Department of public health (IFSV) Faculty of Health and Medicinal Science (SUND) E-mail:

Læs mere

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større

Læs mere

Statistik. Hjemmeside: kkb. Statistik - lektion 1 p.1/22

Statistik. Hjemmeside:  kkb. Statistik - lektion 1 p.1/22 Statistik Kursets omfang: 2 ECTS Inklusiv mini-projekt! Bog: Complete Business Statistics, AD Aczel & J. Sounderpandian Software: SPSS eller Excel?? Forelæser: Kasper K. Berthelsen E-mail: kkb@math.aau.dk

Læs mere

Forelæsning 11: Tovejs variansanalyse, ANOVA

Forelæsning 11: Tovejs variansanalyse, ANOVA Introduktion til Statistik Forelæsning 11: Tovejs variansanalyse, ANOVA Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 22 sider. Skriftlig prøve: 13. december 2010 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Institut for Matematiske Fag Sandsynlighedsregning og Statistik 2. R opgaver

Institut for Matematiske Fag Sandsynlighedsregning og Statistik 2. R opgaver Institut for Matematiske Fag Sandsynlighedsregning og Statistik 2 Københavns Universitet Susanne Ditlevsen og Helle Sørensen R opgaver Det er en god ide at vænne sig til at skrive kommandoerne i en editor

Læs mere

Kapitel 4: Statistik ved simulering. Kursus 02323: Introducerende Statistik. Forelæsning 7: Simuleringsbaseret statistik.

Kapitel 4: Statistik ved simulering. Kursus 02323: Introducerende Statistik. Forelæsning 7: Simuleringsbaseret statistik. Kursus 02323: Introducerende Statistik Forelæsning 7: Simuleringsbaseret statistik Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Kvantitative Metoder 1 - Efterår Dagens program

Kvantitative Metoder 1 - Efterår Dagens program Dagens program Afsnit 6.1. Ligefordelinger, fra sidst Den standardiserede normalfordeling Normalfordelingen Beskrivelse af normalfordelinger: - Tæthed og fordelingsfunktion - Middelværdi, varians og fraktiler

Læs mere

Kvantitative Metoder 1 - Forår Dagens program

Kvantitative Metoder 1 - Forår Dagens program Dagens program Kontinuerte fordelinger Ventetider i en Poissonproces Beskrivelse af kontinuerte fordelinger: - Median og kvartiler - Middelværdi - Varians Simultane fordelinger 1 Ventetider i en Poissonproces

Læs mere

Deskriptiv statistik for hf-matc

Deskriptiv statistik for hf-matc Deskriptiv statistik for hf-matc 75 50 25 2018 Karsten Juul Deskriptiv statistik for hf-matc Hvad er deskriptiv statistik? 1.1 Hvad er deskriptiv statistik?... 1 1.2 Hvad er grupperede og ugrupperede data?...

Læs mere