Oversigt. 1 Praktisk Information. 2 Introduction to Statistics - a primer. 3 Introduktion til Statistik. 4 Anvendelser på DTU (mest Compute)

Størrelse: px
Starte visningen fra side:

Download "Oversigt. 1 Praktisk Information. 2 Introduction to Statistics - a primer. 3 Introduktion til Statistik. 4 Anvendelser på DTU (mest Compute)"

Transkript

1 Introduktion til statistik Forelæsning 1: Intro, R og beskrivende statistik Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark pbac@dtu.dk Efterår 2016 enote 1: Simple plots og deskriptiv statistik Teknikker til at se på data! (deskriptiv statistik) Opsummerende størrelser for stikprøve Gennemsnittet ( ) Empirisk standard afvigelse (s) Empirisk varians (s 2 ) Fraktiler og percentiler (f.eks. 15% af data ligger under 0.15 fraktil) Median, øvre- og nedre kvartiler Empririsk korrelation (r) (mellem to stikprøver) Simple plots Scatter plot (y plot) Histogram (empirisk tæthed) Kumulativ fordeling (empirisk fordeling) Boplots, søjlediagram, cirkeldiagram (lagkagediagram) DTU Compute Introduktion til Statistik Efterår / 61 DTU Compute Introduktion til Statistik Efterår / 61 enote 1: Simple Graphics and Summary Statistics Oversigt Look at data as it is! (descriptive statistics) Summary statistics Sample mean: Sample standard deviation: s Sample variance: s 2 Quantiles and percentiles (e.g. 15% of data is below 0.15 quantile) Median, upper- and lower quartiles Sample correlation (r) (between two samples) Simple graphics Scatter plot (y plot) Histogram (empirical density) Cumulative distribution (empirical distribution) Boplots, Bar charts, Pie charts 1 Praktisk Information 2 3 Introduktion til Statistik 4 Anvendelser på DTU (mest Compute) 5 Gennemsnit Median Spredning Fraktiler 6 Beskrivende statistik: Grafisk fremstilling 7 8 Projekter DTU Compute Introduktion til Statistik Efterår / 61 DTU Compute Introduktion til Statistik Efterår / 61

2 Praktisk Information Praktisk Information Praktisk Information Praktisk Information Undervisning: Hver fredag 8-10 Generel daglig agenda: FØR undervisningsmodulet: læs det annoncerede i enoten! 245 minutters forelæsning (ugens pensum) 2 timers øvelser: Enote Ecersises (HUSK PEN OG PAPIR) Skriftlig eksamen: Tirsdag 13. december. OBLIGATORISKE projekter: 2 stk - skal godkendes for at kunne gå til eksamen Installer lige socrative app på dit device Campusnet: Meddelelser Links til interessante historier Projekter - download og aflevering Hjemmeside: introstat.compute.dtu.dk Forelæsningsplan Læsemateriale: enoter Øvelser & besvarelser Slides og R-scripts Podcasts af gl. forelæsninger (02402) (På dansk OG engelsk) Quizzer Projekt info DTU Compute Introduktion til Statistik Efterår / 61 DTU Compute Introduktion til Statistik Efterår / 61 Eksempel med terning Hvor mange gange skal jeg slå med terningen? Hvordan kan man teste om en terning er fair? F.eks. givet en terning, svar på: Er der 1/6 sandsynlighed for at slå en sekser? Stort set umuligt at beskrive med fysik Derfor: Kast med terningen, observer og derefter udregn statistik Afgør om der er 1/6 ± fejlmargin sandsynlighed for at slå sekser med terningen Der er altid en hvis sandsynlighed for at tage fejl! men den kan styres til at matche risikoen man vil tage Hvor mange gange skal jeg slå med terningen for at afgøre om terningen slår seksere med 1/6 ± fejlmargin sandsynlighed? Det kan I nemt beregne om 13 uger :) Beregn det med R: alpha < ## Fejlmargen vi vil tillade (kaldet præcisionen) ME < ## Beregn antal gange vi skal slå med terningen p * (1-p) * (qnorm(1-alpha/2)/me)^2 DTU Compute Introduktion til Statistik Efterår / 61 DTU Compute Introduktion til Statistik Efterår / 61

3 Statistikken historie og anvendelse i medicin Millennium list (10 vigtigste bidrag til udvikling af medicin) Elucidation of Human Anatomy and Physiology Discovery of Cells and Their Substructures Elucidation of the Chemistry of Life New England Journal of medicine: Application of Statistics to Medicine EDITORIAL: Looking Back on the Millennium in Medicine, N Engl J Med, 342:42-49, January 6, Development of Anesthesia Discovery of the Relation of Microbes to Disease Elucidation of Inheritance and Genetics Knowledge of the Immune System Development of Body Imaging Discovery of Antimicrobial Agents Development of Molecular Pharmacotherapy DTU Compute Introduktion til Statistik Eftera r / 61 DTU Compute Introduktion til Statistik Eftera r / 61 James Lind John Snow One of the earliest clinical trials took place in 1747, when James Lind treated 12 scorbutic ship passengers with cider, an eliir of vitriol, vinegar, sea water, oranges and lemons, or an electuary recommended by the ship s surgeon. The success of the citrus-containing treatment eventually led the British Admiralty to mandate the provision of lime juice to all sailors, thereby eliminating scurvy from the navy. (See also The origin of modern epidemiology is often traced to 1854, when John Snow demonstrated the transmission of cholera from contaminated water by analyzing disease rates among citizens served by the Broad Street Pump in London s Golden Square. He arrested the further spread of the disease by removing the pump handle from the polluted well. (See also Man kan altsa undersøge fænomener man ikke forsta r og derefter begynde at forsta dem! DTU Compute Introduktion til Statistik Eftera r / 61 DTU Compute Introduktion til Statistik Eftera r / 61

4 Google - Big Data IBM - Big Data A quote from New York Times, 5. August 2009, from the article titled For Today s Graduate, Just One Word: Statistics is: I keep saying that the sey job in the net 10 years will be statisticians, said Hal Varian, chief economist at Google. And I m not kidding. The key is to let computers do what they are good at, which is trawling these massive data sets for something that is mathematically odd, said Daniel Gruhl, an I.B.M. researcher whose recent work includes mining medical data to improve treatment. And that makes it easier for humans to do what they are good at - eplain those anomalies. Optagelse af gæsteforedrag af Henrik H. Eliassen IBM på introstat hjemmesiden DTU Compute Introduktion til Statistik Efterår / 61 DTU Compute Introduktion til Statistik Efterår / 61 Introduktion til Statistik Introduktion til Statistik Anvendelser på DTU (mest Compute) Anvendelser på DTU (mest Compute) Hvordan behandles (eller analyseres) data? Hvordan beskrives tilfældig variation? Statistik er et værktøj til at træffe beslutninger Meget vigtigt værktøj i ingeniørens værktøjskasse: Analyse af data Forsøgsplanlægning Forudsigelse af fremtidige værdier... og meget mere! Energisystemer: Prognoser af sol- og vindkraft Optimering af energilagring f.eks. i bygninger Modellering af menneskers adfærd, spildevandsanlæg Styring: Robotnavigation Mekaniske systemer (e.g. biler, skibe, vindmøller,...) Medicin (Compute): Statistik på medicinforsøg Kunstig bugspytkirtel Billedanalyse: Billeder er observeret data! Røntgenbilleder, 3D skanninger Video DTU Compute Introduktion til Statistik Efterår / 61 DTU Compute Introduktion til Statistik Efterår / 61

5 Anvendelser på DTU (mest Compute) Anvendelser på DTU (mest Compute) Anvendelser på DTU (mest Compute) Population og stikprøve Signalbehandling: Elektriske systemer (filtre, forstærkere,...) Computer science: Internet data (trafik, Google, Facebook, osv.) Tekstgenkendelse Sikkerhed: Server angreb etc. Forsøg med programmer Byg: Tests af materialeegenskaber og konstruktioner Fremstillingsmetoder f.eks. støbning af beton Energisystemer og indeklima Management: Finans, spørgeskema undersøgelser,... Kemi, fysik, miljø,... Hver gang man har foretaget målinger skal man sådan set bruge statistik DTU Compute Introduktion til Statistik Efterår / 61 Statistik handler ofte om at analysere en stikprøve (sample), der er taget fra en population (population) Baseret på stikprøven, vil vi generalisere om populationen (dvs. beskrive noget om hele populationen) Det er derfor vigtigt, at stikprøven er repræsentativ for populationen DTU Compute Introduktion til Statistik Efterår / 61 Anvendelser på DTU (mest Compute) Population og stikprøve Anvendelser på DTU (mest Compute) Population og stikprøve Population Population Tilfældigt udvalgt Stikprøve: { 1, 2,..., n } Randomly selected Sample: { 1, 2,..., n } Middelværdi µ Statistisk inferens Gennemsnit Mean µ Statistical inference Sample mean DTU Compute Introduktion til Statistik Efterår / 61 DTU Compute Introduktion til Statistik Efterår / 61

6 Nøgletal (summary statistics) Gennemsnit Gennemsnit (average eller sample mean) Vi anvender en række nøgletal (eller statistikker) for at opsummere og beskrive data (en stikprøve): Gennemsnit: Tyngdepunkt eller centrering Median: Tyngdepunkt eller centrering Varians: Variation Spredning: Variation (samme enhed som stikprøve) Fraktiler og kvantiler: Siger noget om fordelingen af stikprøve Variations koefficient: Variationen i stikprøve (enhedsløs) Gennemsnittet er et nøgletal, der angiver tyngdepunkt eller centrering af en stikprøve Gennemsnit: = 1 n n i i=1 Vi siger, at er et estimat af middelværdien (mean) for populationen Kovarians: Samvariation mellem datasæt Korrelation: Samvariation mellem datasæt (enhedsløs) DTU Compute Introduktion til Statistik Efterår / 61 DTU Compute Introduktion til Statistik Efterår / 61 Median Eksempel Median Eksempel: Højder af unge mænd Stikprøve (Sample): Medianen er et også nøgletal, der angiver centrering af en stikprøve. I nogle tilfælde, f.eks. hvis man har ekstreme værdier, er medianen at foretrække frem for gennemsnittet Gennemsnit: = [185,184,194,180,182] n = 5 = 1 ( ) = Median: Den midterste observation i den sorterede rækkefølge (tallet hvor der er lige mange observationer under og over) Median: Først sorter data: Vælg så det midterste (idet n er ulige)(3 te) tal: 184 Hvis en person på 235cm tilføjes til stikprøven, hvilken bliver mest påvirket? (socrative.com eller app. Room:PBAC) A: Gennemsnittet B: Medianen C: Påvirkes lige meget D: Ved ikke Svar) A: Gennemsnittet. Det stiger meget mere end medianen (nyt gennemsnit og ny median 184.5) DTU Compute Introduktion til Statistik Efterår / 61 DTU Compute Introduktion til Statistik Efterår / 61

7 Eksempel Empirisk varians (Empirical variance) og standardafvigelse (empirical standard deviation) Spredning Eksempel med spredning: Højder af unge mænd Den empiriske varians (eller empirisk standardafvigelsen) siger noget om hvor meget observationerne er spredt: Varians s 2 = 1 n 1 n i=1 ( i ) 2 Standardafvigelse (spredning) (=standard deviation) s = n s 2 1 = n 1 ( i ) 2 i=1 Stikprøve (Sample): = [185, 184, 194, 180, 182] n = 5 Empirisk varians s 2 = 1 ( (185 ) 2 + (184 ) 2 + (194 ) 2 + (180 ) 2 + (182 ) 2) = 29 4 Standardafvigelse s = s 2 = 29 = DTU Compute Introduktion til Statistik Efterår / 61 DTU Compute Introduktion til Statistik Efterår / 61 Fraktiler Fraktiler (percentiles eller quantiles) Fraktiler Fraktiler (percentiles eller quantiles, Definition 1.6) Den p te fraktil, også kaldet quantile, kan defineres ud fra følgende procedure: Medianen beregnes som det punkt, der deler data ind i to halvdele Man kan naturligvis finde punkter som deler i andre dele: De punkter kaldes fraktiler Ofte beregner man 0, 25, 50, 75, 100% fraktilerne kaldes kvantilerne (quartiles) 50% fraktilen er altså medianen Eksempel: 25% fraktilen er punktet (estimat) hvor 25% af observationerne ligger under 1 Sorter de n observationer fra mindst til størst: (1),..., (n) 2 Beregn pn 3 Hvis pn er et helt tal: Midl den pn te og (pn + 1) te sorterede observationer Den p te fraktil = ( ) (np) + (np+1) /2 4 Hvis pn er et ikke-helt tal: tag den næste i den sorterede liste: Den p te fraktil = ( np ) hvor np er ceiling( loftet ) af np, dvs. det mindste hele tal større end np DTU Compute Introduktion til Statistik Efterår / 61 DTU Compute Introduktion til Statistik Efterår / 61

8 Fraktiler Eksempel på fraktiler: Højder af unge mænd: - mål for sammenhæng Heights ( i) Weights (y i) Data, n=10: Sorteret: Nedre kvartil (25% fraktil), Q 1 : Sorter og så vælg det rigtige baseret på np = 2.5: Q 1 = 167 Øvre kvartil (75% fraktil), Q 3 : Sorter og så vælg det rigtige baseret på np = 7.5: Q 3 = 187 Weight y = 78 = Height DTU Compute Introduktion til Statistik Efterår / 61 DTU Compute Introduktion til Statistik Efterår / 61 - Def og mål for sammenhæng Kovariansen: Korrelationskoefficient: r = 1 n 1 s y = 1 n 1 n i=1 n i=1 ( i )(y i ȳ) ( )( ) i yi ȳ = s y s s y s s y hvor s og s y er standard afvigelsen for henholdsvis og y Student Heights (i) Weights (yi) (i ) (yi ȳ) (i )(yi ȳ) s y = 1 ( ) = = s = 12.21, and s y = r = = 0.97 DTU Compute Introduktion til Statistik Efterår / 61 DTU Compute Introduktion til Statistik Efterår / 61

9 Korrelation - egenskaber r er altid mellem 1 og 1: 1 r 1 r mål for den lineære sammenhæng mellem og y r = ±1 kun hvis punkterne ligger på en ret linie r > 0 hvis den generelle trend it scatter plottet er positiv r < 0 hvis den generelle trend it scatter plottet er negativ DTU Compute Introduktion til Statistik Efterår / 61 Korrelation Hvad er korrelationen mellem og y? A: ca B: ca. 0 C: ca y Svar) C: ca DTU Compute Introduktion til Statistik Efterår / 61 Korrelation Hvad er korrelationen mellem og y? A: ca. 0 B: ca C: ca y Svar) B: ca DTU Compute Introduktion til Statistik Efterår / 61 Korrelation Hvad er korrelationen mellem og y? A: ca B: ca. 0 C: ca y Svar) B: ca. 0 DTU Compute Introduktion til Statistik Efterår / 61

10 Korrelation Hvad er korrelationen mellem og y? A: ca B: ca. 0 C: ca y Svar) B: ca. 0 DTU Compute Introduktion til Statistik Efterår / 61 Beskrivende statistik: Grafisk fremstilling Beskrivende statistik (eplorative statistics) Undersøg et data sæt Beskriv data ved at fremhæve de vigtige pointer så andre hurtigt kan se indhold, trends og synlige sammenhænge Præsenter data for andre, som ikke kender det Grafisk fremstilling med forskellige plots: Histogram (empirisk tæthedsfunktion) Empirisk kumulativ tæthedsfunktion Boplot Scatterplot DTU Compute Introduktion til Statistik Efterår / 61 Installer R og Rstudio på egen computer Introduceres i enoten Er integreret i mange ting i kurset vi gør Globalt og hurtigt voksende open source beregningsmiljø ADVARSEL: R kan IKKE erstatte vores hjerner!!!! (Læs sektion 1.5.4!) DTU Compute Introduktion til Statistik Efterår / 61 > ## Adding numbers in the console > 2+3 > ## Define a vector > <- c(1, 4, 6, 2) > > ## A sequence from 1 to 10 > <- 1:10 > DTU Compute Introduktion til Statistik Efterår / 61

11 ## Sample Mean and Median (data from enote) <- c(168,161,167,179,184,166,198,187,191,179) mean() median() ## Sample quartiles quantile(, type=2) ## 0% 25% 50% 75% 100% ## ## Sample variance and standard deviation var() sd() ## Sample quantiles 0%, 10%,..,90%, 100%: quantile(, probs=seq(0, 1, by=0.10), type=2) ## 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% ## DTU Compute Introduktion til Statistik Efterår / 61 DTU Compute Introduktion til Statistik Efterår / 61 Histogram Empirisk tæthed (empirical density eller density histogram) ## A histogram of the heights: hist() ## A density histogram (empirical distribution) of the heights: hist(, freq=false, col="red", nclass=8) Histogram of Histogram of Frequency Density DTU Compute Introduktion til Statistik Efterår / 61 DTU Compute Introduktion til Statistik Efterår / 61

12 Empirisk kumuleret distribution ecdf() Boplot Fn() ## A basic boplot of the heights: (range=0 makes it "basic") boplot(, range=0, col="red", main="basic boplot") tet(1.3, quantile(), c("minimum","q1","median","q3","maimum"), col="blue") Basic boplot Maimum Q3 Median Q1 Minimum DTU Compute Introduktion til Statistik Efterår / 61 DTU Compute Introduktion til Statistik Efterår / 61 Modified boplot ## A modified boplot of the heights with an ## etreme observation, 235cm added: ## The modified version is the default boplot(c(,235), col="red", main="modified boplot") tet(1.3, quantile(c(,235)), c("minimum","q1","median","q3", "Maimum"),col="blue") Modified boplot Maimum Q3 Median Q1 Minimum Markeret er: Gennemsnittet, Medianen, Fraktiler (10%, 95%) Hvad er markeret med den lilla linie? A: Gennemsnittet B: Medianen C: 10% fraktilen D: 95% fraktilen Empirical density Density Svar) D: 95% Fraktil DTU Compute Introduktion til Statistik Efterår / 61 DTU Compute Introduktion til Statistik Efterår / 61

13 Markeret er: Gennemsnittet, Medianen, Fraktiler (10%, 95%) Hvad er markeret med den røde linie? A: Gennemsnittet B: Medianen C: 10% fraktilen D: 95% fraktilen Empirical density Markeret er: Gennemsnittet, Medianen, Fraktiler (10%, 95%) Hvad er markeret med den blå linie? A: Gennemsnittet B: Medianen C: 10% fraktilen D: 95% fraktilen Empirical density Density Density Svar) C: 10% Fraktil Svar) B: Medianen DTU Compute Introduktion til Statistik Efterår / 61 DTU Compute Introduktion til Statistik Efterår / 61 Projekter Markeret er: Gennemsnittet, Medianen, Fraktiler (10%, 95%) Hvad er markeret med den grønne linie? A: Gennemsnittet B: Medianen C: 10% fraktilen D: 95% fraktilen Empirical density Density Svar) A: Gennemsnittet DTU Compute Introduktion til Statistik Efterår / 61 DTU Compute Introduktion til Statistik Efterår / 61

14 s Projekter Projekter Projekter Næste uge Der skal laves to projekter Emne for alle projekter i 1. omgang: Beskrivende statistik, konfidensintervaller og hypotesetest 1. omgang er der tre projekter at vælge imellem: Handel med ETF I Varmeforbrug i Sønderborg I Skive fjord I BMI I Man må gerne arbejde i grupper om beregninger, men rapporterne skal skrives individuelt, se mere på Se også afleveringsdatoer på hjemmesiden Begynd på projekt 1 efter opgaverne i dag til grupperegning Bemærk: der checkes for plagiering og det bliver anmeldt! Begge skal godkendes for at kunne gå til eksamen. Får man ikke godkendt første afleveringdtu ercompute der mulighed for genaflevering Introduktion til Statistik Efterår / 61 Næste uge: Stokastiske variable, sandsynligheder, diskrete fordelinger - kapitel 2 i enoten DTU Compute Introduktion til Statistik Efterår / 61

Oversigt. 1 Praktisk Information. 2 Introduction to Statistics - a primer. 3 Intro Case historier: IBM Big data, Novo Nordisk small data, Skive fjord

Oversigt. 1 Praktisk Information. 2 Introduction to Statistics - a primer. 3 Intro Case historier: IBM Big data, Novo Nordisk small data, Skive fjord Course 02402/02323 Introducerende Statistik Forelæsning 1: Intro, R og beskrivende statistik Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet

Læs mere

Oversigt. 1 Praktisk Information. 2 Introduction to Statistics - a primer. 3 Population og stikprøve. 5 Beskrivende statistik: Grafisk fremstilling

Oversigt. 1 Praktisk Information. 2 Introduction to Statistics - a primer. 3 Population og stikprøve. 5 Beskrivende statistik: Grafisk fremstilling Introduktion til statistik Forelæsning 1: Intro, R og beskrivende statistik Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Forelæsning 1: Intro, R og beskrivende statistik

Forelæsning 1: Intro, R og beskrivende statistik Introduktion til statistik Forelæsning 1: Intro, R og beskrivende statistik Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Forelæsning 1: Intro og beskrivende statistik

Forelæsning 1: Intro og beskrivende statistik Kursus 02402 Introduktion til Statistik Forelæsning 1: Intro og beskrivende statistik Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby

Læs mere

Oversigt. Kursus 02402 Introduktion til Statistik. Forelæsning 1: Intro og beskrivende statistik. Per Bruun Brockhoff. Praktisk Information

Oversigt. Kursus 02402 Introduktion til Statistik. Forelæsning 1: Intro og beskrivende statistik. Per Bruun Brockhoff. Praktisk Information Kursus 02402 Forelæsning 1: Intro og beskrivende statistik Oversigt 1 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

VIGTIGT! Kurset består af: 1. Forelæsninger. 2. Øvelser. 3. Litteraturlæsning

VIGTIGT! Kurset består af: 1. Forelæsninger. 2. Øvelser. 3. Litteraturlæsning Intro til statistik Rasmus F. Brøndum, Institut 17 (Matematik) Hjemmeside: people.math.aau.dk/~froberg 22 forelæsninger (hvor af jeg afholder de første 13) + det samme antal øvelsesgange. Hjælpelærer:

Læs mere

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

Forelæsning 8: Inferens for varianser (kap 9)

Forelæsning 8: Inferens for varianser (kap 9) Kursus 02402 Introduktion til Statistik Forelæsning 8: Inferens for varianser (kap 9) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby

Læs mere

Kapitel 3 Centraltendens og spredning

Kapitel 3 Centraltendens og spredning Kapitel 3 Centraltendens og spredning Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 Indledning 2 Centraltendens 3 Spredning 4 Praktisk beregning 5 Fraktiler 6 Opsamling 1 Indledning

Læs mere

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 3: Kontinuerte fordelinger. Per Bruun Brockhoff

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 3: Kontinuerte fordelinger. Per Bruun Brockhoff Course 242/2323 Introducerende Statistik Forelæsning 3: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 22 Danmarks Tekniske Universitet 28 Lyngby Danmark

Læs mere

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 13: Summary Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

k UAFHÆNGIGE grupper F-test Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen

k UAFHÆNGIGE grupper F-test Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen Introduktion til Statistik Forelæsning 10: Envejs variansanalyse, ANOVA Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 017 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Introduktion Kasper K. Berthelsen, Inst f. Matematiske Fag Omfang: 8 Kursusgang I fremtiden

Læs mere

Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher

Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher Kursus 02323: Introducerende Statistik Forelæsning 12: Forsøgsplanlægning Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

Kvantitative Metoder 1 - Forår 2007

Kvantitative Metoder 1 - Forår 2007 Dagens program Afsnit 3.3-3.5 Varians Eksempel: Forventet nytte Kovarians og korrelation Middelværdi og varians af summer af stokastiske variabler Eksempel: Porteføljevalg 1 Beskrivelse af fordelinger

Læs mere

Modul 5: Test for én stikprøve

Modul 5: Test for én stikprøve Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 5: Test for én stikprøve 5.1 Test for middelværdi................................. 1 5.1.1 t-fordelingen.................................

Læs mere

Kursus 02402/02323 Introduktion til statistik. Forelæsning 13: Et overblik over kursets indhold. Klaus K. Andersen og Per Bruun Brockhoff

Kursus 02402/02323 Introduktion til statistik. Forelæsning 13: Et overblik over kursets indhold. Klaus K. Andersen og Per Bruun Brockhoff Kursus 02402/02323 Introduktion til statistik Forelæsning 13: Et overblik over kursets indhold Klaus K. Andersen og Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Danmarks Tekniske Universitet

Læs mere

Basal statistik. 30. januar 2007

Basal statistik. 30. januar 2007 Basal statistik 30. januar 2007 Deskriptiv statistik Typer af data Tabeller Grafik Summary statistics Lene Theil Skovgaard, Biostatistisk Afdeling Institut for Folkesundhedsvidenskab, Københavns Universitet

Læs mere

Kapitel 3 Centraltendens og spredning

Kapitel 3 Centraltendens og spredning Kapitel 3 Centraltendens og spredning Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 25 Indledning I kapitel 2 omsatte vi de rå data til en tabel, der bedre viste materialets fordeling

Læs mere

Oversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Oversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger Introduktion til Statistik Forelæsning 2: og diskrete fordelinger Oversigt 1 2 3 Fordelingsfunktion 4 Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 017 Danmarks Tekniske Universitet 2800

Læs mere

Konfidensinterval for µ (σ kendt)

Konfidensinterval for µ (σ kendt) Program 1. Repetition: konfidens-intervaller. 2. Hypotese test 3. Type I og type II fejl, p-værdi 4. En og to-sidede tests 5. Test for middelværdi (kendt varians) 6. Test for middelværdi (ukendt varians)

Læs mere

1 enote 1: Simple plots og deskriptive statistik. 2 enote2: Diskrete fordelinger. 3 enote 2: Kontinuerte fordelinger

1 enote 1: Simple plots og deskriptive statistik. 2 enote2: Diskrete fordelinger. 3 enote 2: Kontinuerte fordelinger Kursus 02402/02323 Introduktion til statistik Forelæsning 13: Et overblik over kursets indhold Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Building 324, Room 220 Danish Technical University

Læs mere

1 enote 1: Simple plots og deskriptive statistik. 2 enote 2: Diskrete fordelinger. 3 enote 2: Kontinuerte fordelinger

1 enote 1: Simple plots og deskriptive statistik. 2 enote 2: Diskrete fordelinger. 3 enote 2: Kontinuerte fordelinger Kursus 02402/02323 Introduktion til statistik Forelæsning 13: Et overblik over kursets indhold Peder Bacher DTU Compute, Dynamiske Systemer Building 303B, Room 017 Danish Technical University 2800 Lyngby

Læs mere

Hypotese test. Repetition fra sidst Hypoteser Test af middelværdi Test af andel Test af varians Type 1 og type 2 fejl Signifikansniveau

Hypotese test. Repetition fra sidst Hypoteser Test af middelværdi Test af andel Test af varians Type 1 og type 2 fejl Signifikansniveau ypotese test Repetition fra sidst ypoteser Test af middelværdi Test af andel Test af varians Type 1 og type fejl Signifikansniveau Konfidens intervaller Et konfidens interval er et interval, der estimerer

Læs mere

Oversigt. 1 Eksempel. 2 Fordelingen for gennemsnittet t-fordelingen. 3 Konfidensintervallet for µ Eksempel

Oversigt. 1 Eksempel. 2 Fordelingen for gennemsnittet t-fordelingen. 3 Konfidensintervallet for µ Eksempel Kursus 02402/02323 Introducerende Statistik Forelæsning 4: Konfidensinterval for middelværdi (og spredning) Klaus K. Andersen og Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Danmarks Tekniske

Læs mere

Program. 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test.

Program. 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test. Program 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test. 1/19 Konfidensinterval for µ (σ kendt) Estimat ˆµ = X bedste bud

Læs mere

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 33B, Rum 9 Danmarks Tekniske Universitet 28 Lyngby Danmark e-mail: pbac@dtu.dk Efterår

Læs mere

Statistikkompendium. Statistik

Statistikkompendium. Statistik Statistik INTRODUKTION TIL STATISTIK Statistik er analyse af indsamlet data. Det vil sige, at man bearbejder et datamateriale, som i matematik næsten altid er tal. Derved får man et samlet overblik over

Læs mere

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/ Program: 1. Repetition af vigtige sandsynlighedsfordelinger: binomial, (Poisson,) normal (og χ 2 ). 2. Populationer og stikprøver 3. Opsummering af data vha. deskriptive størrelser og grafer. 1/29 Binomial

Læs mere

Statistik. Introduktion Deskriptiv statistik Sandsynslighedregning

Statistik. Introduktion Deskriptiv statistik Sandsynslighedregning Statistik Introduktion Deskriptiv statistik Sandsynslighedregning Introduktion Kasper K. Berthelsen, Institut f. Mat. Fag 8 Kursusgange Individuel mundtlig eksamen (7-skala) Udgangspunkt i opgaver Software:

Læs mere

Modul 7: Eksempler. 7.1 Beskrivende dataanalyse. 7.1.1 Diagrammer. Bent Jørgensen. Forskningsenheden for Statistik ST501: Science Statistik

Modul 7: Eksempler. 7.1 Beskrivende dataanalyse. 7.1.1 Diagrammer. Bent Jørgensen. Forskningsenheden for Statistik ST501: Science Statistik Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 7: Eksempler 7.1 Beskrivende dataanalyse............................... 1 7.1.1 Diagrammer.................................

Læs mere

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks

Læs mere

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration Faculty of Life Sciences Program Modelkontrol og prædiktion Claus Ekstrøm E-mail: ekstrom@life.ku.dk Test af hypotese i ensidet variansanalyse F -tests og F -fordelingen. Multiple sammenligninger. Bonferroni-korrektion

Læs mere

Module 2: Beskrivende Statistik

Module 2: Beskrivende Statistik Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen og Hans Chr. Petersen Module 2: Beskrivende Statistik 2.1 Histogrammer og søjlediagrammer......................... 1 2.2 Sammenfatning

Læs mere

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Introduktion Kursusholder: Kasper K. Berthelsen Opbygning: Kurset består af 5 blokke En blok består af: To normale

Læs mere

Kvantitative Metoder 1 - Forår 2007. Dagens program

Kvantitative Metoder 1 - Forår 2007. Dagens program Dagens program Kapitel 7 Introduktion til statistik Organisering af data Diskrete variabler Kontinuerte variabler Beskrivende statistik Fraktiler Gennemsnit Empirisk varians og spredning Empirisk korrelationkoe

Læs mere

Modul 3: Kontinuerte stokastiske variable

Modul 3: Kontinuerte stokastiske variable Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 3: Kontinuerte stokastiske variable 3.1 Kontinuerte stokastiske variable........................... 1 3.1.1 Tæthedsfunktion...............................

Læs mere

Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger. Peder Bacher

Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger. Peder Bacher Introduktion til Statistik Forelæsning 2: Stokastisk variabel og diskrete fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

Ensidet variansanalyse

Ensidet variansanalyse Ensidet variansanalyse Sammenligning af grupper Helle Sørensen E-mail: helle@math.ku.dk StatBK (Uge 47, mandag) Ensidet ANOVA 1 / 18 Program I dag: Sammenligning af middelværdier Sammenligning af spredninger

Læs mere

Forelæsning 11: Envejs variansanalyse, ANOVA

Forelæsning 11: Envejs variansanalyse, ANOVA Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalyse, ANOVA Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

Statistik med GeoGebra

Statistik med GeoGebra Statistik med GeoGebra Hayati Balo, AAMS, marts 2012 1 Observationssæt Det talmateriale, som man gerne vil undersøge, kaldes et observationssæt. Det talsæt som fremgår i tabel 5.1 kan indsættes i GeoGebra

Læs mere

Statistik vejledende læreplan og læringsmål, efteråret 2013 SmartLearning

Statistik vejledende læreplan og læringsmål, efteråret 2013 SmartLearning Side 1 af 6 Statistik vejledende læreplan og læringsmål, efteråret 2013 SmartLearning Litteratur: Kenneth Hansen & Charlotte Koldsø: Statistik I økonomisk perspektiv, Hans Reitzels Forlag 2012, 2. udgave,

Læs mere

Forelæsning 11: Kapitel 11: Regressionsanalyse

Forelæsning 11: Kapitel 11: Regressionsanalyse Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

En Introduktion til SAS. Kapitel 5.

En Introduktion til SAS. Kapitel 5. En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel

Læs mere

Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger. Peder Bacher

Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger. Peder Bacher Introduktion til Statistik Forelæsning 2: Stokastisk variabel og diskrete fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

Statistik. Statistik. Hvad er Statistik? Hvad er Statistik? Hvad er Statistik? 1. Hvad er statistik? 2. Mennesker som måleinstrumenter

Statistik. Statistik. Hvad er Statistik? Hvad er Statistik? Hvad er Statistik? 1. Hvad er statistik? 2. Mennesker som måleinstrumenter Statistik Statistik 1. statistik? Per Bruun Brockhoff Professor i Statistik DTU Informatik 27 august 2009 http://www.imm.dtu.dk/~pbb 2. Mennesker som måleinstrumenter Egentlig ikke så meget: Danmarks Statistik:

Læs mere

Program. Ensidet variansanalyse Sammenligning af grupper. Statistisk model og hypotese. Eksempel: Aldersfordeling i hjertestudie

Program. Ensidet variansanalyse Sammenligning af grupper. Statistisk model og hypotese. Eksempel: Aldersfordeling i hjertestudie Program Ensidet variansanalyse Sammenligning af grupper Helle Sørensen E-mail: helle@math.ku.dk I dag: Sammenligning af middelværdier Sammenligning af spredninger Parvise sammenligninger To eksempler:

Læs mere

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger Course 02402/02323 Introducerende Statistik Forelæsning 2: Stokastisk variabel og diskrete fordelinger Klaus K. Andersen og Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Danmarks Tekniske Universitet

Læs mere

Ex µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4. hvor. Vha. R: Vha. tabel:

Ex µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4. hvor. Vha. R: Vha. tabel: Normal fordeling Tæthedsfunktion for normalfordeling med middelværdi µ og varians σ 2 : Program (8.15-10): f() = 1 µ)2 ep( ( 2πσ 2 2σ 2 ) E µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4 1. vigtige sandsynlighedsfordelinger:

Læs mere

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium Deskriptiv (beskrivende) statistik er den disciplin, der trækker de væsentligste oplysninger ud af et ofte uoverskueligt materiale. Det sker f.eks. ved at konstruere forskellige deskriptorer, d.v.s. regnestørrelser,

Læs mere

enote 5: Simpel lineær regressions analyse Kursus 02402/02323 Introducerende Statistik Oversigt

enote 5: Simpel lineær regressions analyse Kursus 02402/02323 Introducerende Statistik Oversigt enote 5: Simpel lineær regressions analse Kursus 02402/02323 Introducerende Statistik Forelæsning 8: Simpel lineær regression To variable: og Beregn mindstekvadraters estimat af ret linje Inferens med

Læs mere

Kursus 02402/02323 Introducerende Statistik

Kursus 02402/02323 Introducerende Statistik Kursus 02402/02323 Introducerende Statistik Forelæsning 8: Simpel lineær regression Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne

Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne Statistik og Sandsynlighedsregning 1 Indledning til statistik, kap 2 i STAT Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne 5. undervisningsuge, onsdag

Læs mere

Kursus 02323: Introducerende Statistik. Forelæsning 8: Simpel lineær regression. Peder Bacher

Kursus 02323: Introducerende Statistik. Forelæsning 8: Simpel lineær regression. Peder Bacher Kursus 02323: Introducerende Statistik Forelæsning 8: Simpel lineær regression Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Basal statistik for sundhedsvidenskabelige forskere, forår 2015 Udleveret 3. marts, afleveres senest ved øvelserne i uge 13 (24.-25.

Basal statistik for sundhedsvidenskabelige forskere, forår 2015 Udleveret 3. marts, afleveres senest ved øvelserne i uge 13 (24.-25. Hjemmeopgave Basal statistik for sundhedsvidenskabelige forskere, forår 2015 Udleveret 3. marts, afleveres senest ved øvelserne i uge 13 (24.-25. marts) En stikprøve bestående af 65 mænd og 65 kvinder

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable Kursus 02402 Introduktion til Statistik Forelæsning 2: Kapitel 4, Diskrete fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Multipel Lineær Regression. Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test

Multipel Lineær Regression. Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test Multipel Lineær Regression Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test Multipel lineær regression x,x,,x k uafhængige variable

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på

Læs mere

Forelæsning 2: Kapitel 4, Diskrete fordelinger

Forelæsning 2: Kapitel 4, Diskrete fordelinger Kursus 02402 Introduktion til Statistik Forelæsning 2: Kapitel 4, Diskrete fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

k UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test)

k UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test) Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalse, ANOVA Peder Bacher DTU Compute, Dnamiske Sstemer Bgning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lngb Danmark e-mail:

Læs mere

Forelæsning 4: Konfidensinterval for middelværdi (og spredning)

Forelæsning 4: Konfidensinterval for middelværdi (og spredning) Introduktion til Statistik Forelæsning 4: Konfidensinterval for middelværdi (og spredning) Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

DDA Danish Design Association

DDA Danish Design Association DDA Danish Design Association LØNUNDERSØGELSE 2011 DEN DANSKE DESIGNBRANCHE Danish Design Association Uddrag !"#"$"%&'()'%*#+#,"$-*!"%-"'./00'.! +,,$1!'12'%*#+#,"$-*!"%-"'./00' 3! 1$4"5,-!67"$4"&1%&"'4"#"26&-'

Læs mere

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Program 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Fordeling af X Stikprøve X 1,X 2,...,X n stokastisk X stokastisk. Ex (normalfordelt stikprøve)

Læs mere

Vejledende studieplan for kvantitativ metode og statistik FYS 514 Modul 14 efteråret 2017

Vejledende studieplan for kvantitativ metode og statistik FYS 514 Modul 14 efteråret 2017 Vejledende studieplan for kvantitativ metode og statistik FYS 514 Modul 14 efteråret 2017 Generelle kommentarer. Undervisningen følger lærebogen og det må kraftigt anbefales at anskaffe denne. Bogen koster

Læs mere

Nanostatistik: Middelværdi og varians

Nanostatistik: Middelværdi og varians Nanostatistik: Middelværdi og varians JLJ Nanostatistik: Middelværdi og varians p. 1/28 Repetition Stokastisk variabel: funktion fra udfaldsrum over i de hele tal eller over i de reelle tal Ex: Ω = alle

Læs mere

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Kursus 242 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik Bygning 35/324 Danmarks Tekniske Universitet 28 Lyngby Danmark e-mail:

Læs mere

Oversigt. 1 Motiverende eksempel: Højde-vægt. 2 Lineær regressionsmodel. 3 Mindste kvadraters metode (least squares)

Oversigt. 1 Motiverende eksempel: Højde-vægt. 2 Lineær regressionsmodel. 3 Mindste kvadraters metode (least squares) Kursus 02402/02323 Introducerende Statistik Forelæsning 8: Simpel lineær regression Oversigt Motiverende eksempel: Højde-vægt 2 Lineær regressionsmodel 3 Mindste kvadraters metode (least squares) Klaus

Læs mere

En Introduktion til SAS. Kapitel 6.

En Introduktion til SAS. Kapitel 6. En Introduktion til SAS. Kapitel 6. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 6 Regressionsanalyse i SAS 6.1 Indledning Dette kapitel

Læs mere

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke

Læs mere

Lektion 9 Statistik enkeltobservationer

Lektion 9 Statistik enkeltobservationer Lektion 9 Statistik enkeltobservationer Middelværdi med mere Hyppigheds- og frekvens-tabeller Diagrammer Hvilket diagram er bedst? Boxplot Lektion 9 Side 1 Når man skal holde styr på mange oplysninger,

Læs mere

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Kursus 02402 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Indblik i statistik - for samfundsvidenskab

Indblik i statistik - for samfundsvidenskab Indblik i statistik - for samfundsvidenskab Læs mere om nye titler fra Academica på www.academica.dk Nikolaj Malchow-Møller og Allan H. Würtz Indblik i statistik for samfundsvidenskab Academica Indblik

Læs mere

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006 PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006 I dag: To stikprøver fra en normalfordeling, ikke-parametriske metoder og beregning af stikprøvestørrelse Eksempel: Fiskeolie

Læs mere

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Introduktion Kasper K. Berthelsen, Inst f. Matematiske Fag Omfang: 8 Kursusgang I fremtiden

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220

Læs mere

Undervisningsbeskrivelse

Undervisningsbeskrivelse Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Maj 2016 Institution Roskilde Handelsskole Uddannelse Fag og niveau Lærer(e) Hold Hhx Matematik B Kubilay

Læs mere

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge Opgave 1. Data indlæses i 3 kolonner, som f.eks. kaldessalt,pre ogpost. Der er således i alt tale om 26 observationer, idet de to grupper lægges

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Introduktion 1 Formelt Lærere: Esben Budtz-Jørgensen Jørgen Holm Petersen Øvelseslærere: Berivan+Kathrine, Amalie+Annabell Databehandling: SPSS

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Introduktion 1 Formelt Lærer: Jørgen Holm Petersen Øvelseslærere: Amalie og Marie Databehandling: SPSS Eksamen: Ugeopgave efterfulgt af mundtlig

Læs mere

Basal statistik. 29. januar 2008

Basal statistik. 29. januar 2008 Basal statistik 29. januar 2008 Deskriptiv statistik Grafik Summary statistics Normalfordelingen Typer af data Lene Theil Skovgaard, Biostatistisk Afdeling Institut for Folkesundhedsvidenskab, Københavns

Læs mere

Trolling Master Bornholm 2012

Trolling Master Bornholm 2012 Trolling Master Bornholm 1 (English version further down) Tak for denne gang Det var en fornøjelse især jo også fordi vejret var med os. Så heldig har vi aldrig været før. Vi skal evaluere 1, og I må meget

Læs mere

Privatansatte mænd bliver desuden noget hurtigere chef end kvinderne og forholdsvis flere ender i en chefstilling.

Privatansatte mænd bliver desuden noget hurtigere chef end kvinderne og forholdsvis flere ender i en chefstilling. Sammenligning af privatansatte kvinder og mænds løn Privatansatte kvindelige djøfere i stillinger uden ledelsesansvar har en løn der udgør ca. 96 procent af den løn deres mandlige kolleger får. I sammenligningen

Læs mere

Projekt 4.8. Kerners henfald (Excel)

Projekt 4.8. Kerners henfald (Excel) Projekt.8. Kerners henfald (Excel) Når radioaktive kerner henfalder under udsendelse af stråling, sker henfaldet I følge kvantemekanikken helt spontant, dvs. rent tilfældigt uden nogen påviselig årsag.

Læs mere

Faculty of Health Sciences. Logistisk regression: Interaktion Kvantitative responsvariable

Faculty of Health Sciences. Logistisk regression: Interaktion Kvantitative responsvariable Faculty of Health Sciences Logistisk regression: Interaktion Kvantitative responsvariable Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk

Læs mere

Statistik og Sandsynlighedsregning 2

Statistik og Sandsynlighedsregning 2 Statistik og Sandsynlighedsregning 2 Transformation af kontinuerte fordelinger på R, flerdimensionale kontinuerte fordelinger, mere om normalfordelingen Helle Sørensen Uge 7, onsdag SaSt2 (Uge 7, onsdag)

Læs mere

Funktionalligninger - løsningsstrategier og opgaver

Funktionalligninger - løsningsstrategier og opgaver Funktionalligninger - løsningsstrategier og opgaver Altså er f (f (1)) = 1. På den måde fortsætter vi med at samle oplysninger om f og kombinerer dem også med tidligere oplysninger. Hvis vi indsætter =

Læs mere

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse Afsnit 8.3 - E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse Først skal normalfordelingen lige defineres i Maple, så vi kan benytte den i vores udregninger. Dette gøres

Læs mere

2012 Nøglehulsmærket og Nøglehullet på spisesteder. Kommentarrapport med grafik for hovedresultater

2012 Nøglehulsmærket og Nøglehullet på spisesteder. Kommentarrapport med grafik for hovedresultater 2012 Nøglehulsmærket og Nøglehullet på spisesteder Kommentarrapport med grafik for hovedresultater Indhold 05-12-2012 Side Introduktion 3-4 Dataindsamling 5-6 Tolkning og grafisk fremstilling af resultater

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Trivsel og fravær i folkeskolen

Trivsel og fravær i folkeskolen Trivsel og fravær i folkeskolen Sammenfatning De årlige trivselsmålinger i folkeskolen måler elevernes trivsel på fire forskellige områder: faglig trivsel, social trivsel, støtte og inspiration og ro og

Læs mere

Forelæsning 9: Inferens for andele (kapitel 10)

Forelæsning 9: Inferens for andele (kapitel 10) Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Fagplan for statistik, efteråret 2015

Fagplan for statistik, efteråret 2015 Side 1 af 7 M Fagplan for statistik, efteråret 20 Litteratur Kenneth Hansen & Charlotte Koldsø (HK): Statistik I økonomisk perspektiv, Hans Reitzels Forlag 2012, 2. udgave, ISBN 9788741256047 HypoStat

Læs mere

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j Hypoteser om mere end to stikprøver ANOVA k stikprøver: (ikke ordinale eller højere) H 0 : 1 2... k gælder også for k 2! H 0ij : i j H 0ij : i j simpelt forslag: k k 1 2 t-tests: i j DUER IKKE! Bonferroni!!

Læs mere

Økonometri 1. Inferens i den lineære regressionsmodel 25. september 2006. Oversigt: De næste forelæsninger

Økonometri 1. Inferens i den lineære regressionsmodel 25. september 2006. Oversigt: De næste forelæsninger Oversigt: De næste forelæsninger Økonometri Inferens i den lineære regressionsmodel 5. september 006 Statistisk inferens: hvorledes man med udgangspunkt i en statistisk model kan drage konklusioner på

Læs mere

Generelt er korrelationen mellem elevens samlede vurdering i forsøg 1 og forsøg 2 på 0,79.

Generelt er korrelationen mellem elevens samlede vurdering i forsøg 1 og forsøg 2 på 0,79. Olof Palmes Allé 38 8200 Aarhus N Tlf.nr.: 35 87 88 89 E-mail: stil@stil.dk www.stil.dk CVR-nr.: 13223459 Undersøgelse af de nationale tests reliabilitet 26.02.2016 Sammenfatning I efteråret 2014 blev

Læs mere