Oversigt. 1 Praktisk Information. 2 Introduction to Statistics - a primer. 3 Introduktion til Statistik. 4 Anvendelser på DTU (mest Compute)
|
|
|
- Christoffer Nielsen
- 9 år siden
- Visninger:
Transkript
1 Introduktion til statistik Forelæsning 1: Intro, R og beskrivende statistik Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark [email protected] Efterår 2016 enote 1: Simple plots og deskriptiv statistik Teknikker til at se på data! (deskriptiv statistik) Opsummerende størrelser for stikprøve Gennemsnittet ( ) Empirisk standard afvigelse (s) Empirisk varians (s 2 ) Fraktiler og percentiler (f.eks. 15% af data ligger under 0.15 fraktil) Median, øvre- og nedre kvartiler Empririsk korrelation (r) (mellem to stikprøver) Simple plots Scatter plot (y plot) Histogram (empirisk tæthed) Kumulativ fordeling (empirisk fordeling) Boplots, søjlediagram, cirkeldiagram (lagkagediagram) DTU Compute Introduktion til Statistik Efterår / 61 DTU Compute Introduktion til Statistik Efterår / 61 enote 1: Simple Graphics and Summary Statistics Oversigt Look at data as it is! (descriptive statistics) Summary statistics Sample mean: Sample standard deviation: s Sample variance: s 2 Quantiles and percentiles (e.g. 15% of data is below 0.15 quantile) Median, upper- and lower quartiles Sample correlation (r) (between two samples) Simple graphics Scatter plot (y plot) Histogram (empirical density) Cumulative distribution (empirical distribution) Boplots, Bar charts, Pie charts 1 Praktisk Information 2 3 Introduktion til Statistik 4 Anvendelser på DTU (mest Compute) 5 Gennemsnit Median Spredning Fraktiler 6 Beskrivende statistik: Grafisk fremstilling 7 8 Projekter DTU Compute Introduktion til Statistik Efterår / 61 DTU Compute Introduktion til Statistik Efterår / 61
2 Praktisk Information Praktisk Information Praktisk Information Praktisk Information Undervisning: Hver fredag 8-10 Generel daglig agenda: FØR undervisningsmodulet: læs det annoncerede i enoten! 245 minutters forelæsning (ugens pensum) 2 timers øvelser: Enote Ecersises (HUSK PEN OG PAPIR) Skriftlig eksamen: Tirsdag 13. december. OBLIGATORISKE projekter: 2 stk - skal godkendes for at kunne gå til eksamen Installer lige socrative app på dit device Campusnet: Meddelelser Links til interessante historier Projekter - download og aflevering Hjemmeside: introstat.compute.dtu.dk Forelæsningsplan Læsemateriale: enoter Øvelser & besvarelser Slides og R-scripts Podcasts af gl. forelæsninger (02402) (På dansk OG engelsk) Quizzer Projekt info DTU Compute Introduktion til Statistik Efterår / 61 DTU Compute Introduktion til Statistik Efterår / 61 Eksempel med terning Hvor mange gange skal jeg slå med terningen? Hvordan kan man teste om en terning er fair? F.eks. givet en terning, svar på: Er der 1/6 sandsynlighed for at slå en sekser? Stort set umuligt at beskrive med fysik Derfor: Kast med terningen, observer og derefter udregn statistik Afgør om der er 1/6 ± fejlmargin sandsynlighed for at slå sekser med terningen Der er altid en hvis sandsynlighed for at tage fejl! men den kan styres til at matche risikoen man vil tage Hvor mange gange skal jeg slå med terningen for at afgøre om terningen slår seksere med 1/6 ± fejlmargin sandsynlighed? Det kan I nemt beregne om 13 uger :) Beregn det med R: alpha < ## Fejlmargen vi vil tillade (kaldet præcisionen) ME < ## Beregn antal gange vi skal slå med terningen p * (1-p) * (qnorm(1-alpha/2)/me)^2 DTU Compute Introduktion til Statistik Efterår / 61 DTU Compute Introduktion til Statistik Efterår / 61
3 Statistikken historie og anvendelse i medicin Millennium list (10 vigtigste bidrag til udvikling af medicin) Elucidation of Human Anatomy and Physiology Discovery of Cells and Their Substructures Elucidation of the Chemistry of Life New England Journal of medicine: Application of Statistics to Medicine EDITORIAL: Looking Back on the Millennium in Medicine, N Engl J Med, 342:42-49, January 6, Development of Anesthesia Discovery of the Relation of Microbes to Disease Elucidation of Inheritance and Genetics Knowledge of the Immune System Development of Body Imaging Discovery of Antimicrobial Agents Development of Molecular Pharmacotherapy DTU Compute Introduktion til Statistik Eftera r / 61 DTU Compute Introduktion til Statistik Eftera r / 61 James Lind John Snow One of the earliest clinical trials took place in 1747, when James Lind treated 12 scorbutic ship passengers with cider, an eliir of vitriol, vinegar, sea water, oranges and lemons, or an electuary recommended by the ship s surgeon. The success of the citrus-containing treatment eventually led the British Admiralty to mandate the provision of lime juice to all sailors, thereby eliminating scurvy from the navy. (See also The origin of modern epidemiology is often traced to 1854, when John Snow demonstrated the transmission of cholera from contaminated water by analyzing disease rates among citizens served by the Broad Street Pump in London s Golden Square. He arrested the further spread of the disease by removing the pump handle from the polluted well. (See also Man kan altsa undersøge fænomener man ikke forsta r og derefter begynde at forsta dem! DTU Compute Introduktion til Statistik Eftera r / 61 DTU Compute Introduktion til Statistik Eftera r / 61
4 Google - Big Data IBM - Big Data A quote from New York Times, 5. August 2009, from the article titled For Today s Graduate, Just One Word: Statistics is: I keep saying that the sey job in the net 10 years will be statisticians, said Hal Varian, chief economist at Google. And I m not kidding. The key is to let computers do what they are good at, which is trawling these massive data sets for something that is mathematically odd, said Daniel Gruhl, an I.B.M. researcher whose recent work includes mining medical data to improve treatment. And that makes it easier for humans to do what they are good at - eplain those anomalies. Optagelse af gæsteforedrag af Henrik H. Eliassen IBM på introstat hjemmesiden DTU Compute Introduktion til Statistik Efterår / 61 DTU Compute Introduktion til Statistik Efterår / 61 Introduktion til Statistik Introduktion til Statistik Anvendelser på DTU (mest Compute) Anvendelser på DTU (mest Compute) Hvordan behandles (eller analyseres) data? Hvordan beskrives tilfældig variation? Statistik er et værktøj til at træffe beslutninger Meget vigtigt værktøj i ingeniørens værktøjskasse: Analyse af data Forsøgsplanlægning Forudsigelse af fremtidige værdier... og meget mere! Energisystemer: Prognoser af sol- og vindkraft Optimering af energilagring f.eks. i bygninger Modellering af menneskers adfærd, spildevandsanlæg Styring: Robotnavigation Mekaniske systemer (e.g. biler, skibe, vindmøller,...) Medicin (Compute): Statistik på medicinforsøg Kunstig bugspytkirtel Billedanalyse: Billeder er observeret data! Røntgenbilleder, 3D skanninger Video DTU Compute Introduktion til Statistik Efterår / 61 DTU Compute Introduktion til Statistik Efterår / 61
5 Anvendelser på DTU (mest Compute) Anvendelser på DTU (mest Compute) Anvendelser på DTU (mest Compute) Population og stikprøve Signalbehandling: Elektriske systemer (filtre, forstærkere,...) Computer science: Internet data (trafik, Google, Facebook, osv.) Tekstgenkendelse Sikkerhed: Server angreb etc. Forsøg med programmer Byg: Tests af materialeegenskaber og konstruktioner Fremstillingsmetoder f.eks. støbning af beton Energisystemer og indeklima Management: Finans, spørgeskema undersøgelser,... Kemi, fysik, miljø,... Hver gang man har foretaget målinger skal man sådan set bruge statistik DTU Compute Introduktion til Statistik Efterår / 61 Statistik handler ofte om at analysere en stikprøve (sample), der er taget fra en population (population) Baseret på stikprøven, vil vi generalisere om populationen (dvs. beskrive noget om hele populationen) Det er derfor vigtigt, at stikprøven er repræsentativ for populationen DTU Compute Introduktion til Statistik Efterår / 61 Anvendelser på DTU (mest Compute) Population og stikprøve Anvendelser på DTU (mest Compute) Population og stikprøve Population Population Tilfældigt udvalgt Stikprøve: { 1, 2,..., n } Randomly selected Sample: { 1, 2,..., n } Middelværdi µ Statistisk inferens Gennemsnit Mean µ Statistical inference Sample mean DTU Compute Introduktion til Statistik Efterår / 61 DTU Compute Introduktion til Statistik Efterår / 61
6 Nøgletal (summary statistics) Gennemsnit Gennemsnit (average eller sample mean) Vi anvender en række nøgletal (eller statistikker) for at opsummere og beskrive data (en stikprøve): Gennemsnit: Tyngdepunkt eller centrering Median: Tyngdepunkt eller centrering Varians: Variation Spredning: Variation (samme enhed som stikprøve) Fraktiler og kvantiler: Siger noget om fordelingen af stikprøve Variations koefficient: Variationen i stikprøve (enhedsløs) Gennemsnittet er et nøgletal, der angiver tyngdepunkt eller centrering af en stikprøve Gennemsnit: = 1 n n i i=1 Vi siger, at er et estimat af middelværdien (mean) for populationen Kovarians: Samvariation mellem datasæt Korrelation: Samvariation mellem datasæt (enhedsløs) DTU Compute Introduktion til Statistik Efterår / 61 DTU Compute Introduktion til Statistik Efterår / 61 Median Eksempel Median Eksempel: Højder af unge mænd Stikprøve (Sample): Medianen er et også nøgletal, der angiver centrering af en stikprøve. I nogle tilfælde, f.eks. hvis man har ekstreme værdier, er medianen at foretrække frem for gennemsnittet Gennemsnit: = [185,184,194,180,182] n = 5 = 1 ( ) = Median: Den midterste observation i den sorterede rækkefølge (tallet hvor der er lige mange observationer under og over) Median: Først sorter data: Vælg så det midterste (idet n er ulige)(3 te) tal: 184 Hvis en person på 235cm tilføjes til stikprøven, hvilken bliver mest påvirket? (socrative.com eller app. Room:PBAC) A: Gennemsnittet B: Medianen C: Påvirkes lige meget D: Ved ikke Svar) A: Gennemsnittet. Det stiger meget mere end medianen (nyt gennemsnit og ny median 184.5) DTU Compute Introduktion til Statistik Efterår / 61 DTU Compute Introduktion til Statistik Efterår / 61
7 Eksempel Empirisk varians (Empirical variance) og standardafvigelse (empirical standard deviation) Spredning Eksempel med spredning: Højder af unge mænd Den empiriske varians (eller empirisk standardafvigelsen) siger noget om hvor meget observationerne er spredt: Varians s 2 = 1 n 1 n i=1 ( i ) 2 Standardafvigelse (spredning) (=standard deviation) s = n s 2 1 = n 1 ( i ) 2 i=1 Stikprøve (Sample): = [185, 184, 194, 180, 182] n = 5 Empirisk varians s 2 = 1 ( (185 ) 2 + (184 ) 2 + (194 ) 2 + (180 ) 2 + (182 ) 2) = 29 4 Standardafvigelse s = s 2 = 29 = DTU Compute Introduktion til Statistik Efterår / 61 DTU Compute Introduktion til Statistik Efterår / 61 Fraktiler Fraktiler (percentiles eller quantiles) Fraktiler Fraktiler (percentiles eller quantiles, Definition 1.6) Den p te fraktil, også kaldet quantile, kan defineres ud fra følgende procedure: Medianen beregnes som det punkt, der deler data ind i to halvdele Man kan naturligvis finde punkter som deler i andre dele: De punkter kaldes fraktiler Ofte beregner man 0, 25, 50, 75, 100% fraktilerne kaldes kvantilerne (quartiles) 50% fraktilen er altså medianen Eksempel: 25% fraktilen er punktet (estimat) hvor 25% af observationerne ligger under 1 Sorter de n observationer fra mindst til størst: (1),..., (n) 2 Beregn pn 3 Hvis pn er et helt tal: Midl den pn te og (pn + 1) te sorterede observationer Den p te fraktil = ( ) (np) + (np+1) /2 4 Hvis pn er et ikke-helt tal: tag den næste i den sorterede liste: Den p te fraktil = ( np ) hvor np er ceiling( loftet ) af np, dvs. det mindste hele tal større end np DTU Compute Introduktion til Statistik Efterår / 61 DTU Compute Introduktion til Statistik Efterår / 61
8 Fraktiler Eksempel på fraktiler: Højder af unge mænd: - mål for sammenhæng Heights ( i) Weights (y i) Data, n=10: Sorteret: Nedre kvartil (25% fraktil), Q 1 : Sorter og så vælg det rigtige baseret på np = 2.5: Q 1 = 167 Øvre kvartil (75% fraktil), Q 3 : Sorter og så vælg det rigtige baseret på np = 7.5: Q 3 = 187 Weight y = 78 = Height DTU Compute Introduktion til Statistik Efterår / 61 DTU Compute Introduktion til Statistik Efterår / 61 - Def og mål for sammenhæng Kovariansen: Korrelationskoefficient: r = 1 n 1 s y = 1 n 1 n i=1 n i=1 ( i )(y i ȳ) ( )( ) i yi ȳ = s y s s y s s y hvor s og s y er standard afvigelsen for henholdsvis og y Student Heights (i) Weights (yi) (i ) (yi ȳ) (i )(yi ȳ) s y = 1 ( ) = = s = 12.21, and s y = r = = 0.97 DTU Compute Introduktion til Statistik Efterår / 61 DTU Compute Introduktion til Statistik Efterår / 61
9 Korrelation - egenskaber r er altid mellem 1 og 1: 1 r 1 r mål for den lineære sammenhæng mellem og y r = ±1 kun hvis punkterne ligger på en ret linie r > 0 hvis den generelle trend it scatter plottet er positiv r < 0 hvis den generelle trend it scatter plottet er negativ DTU Compute Introduktion til Statistik Efterår / 61 Korrelation Hvad er korrelationen mellem og y? A: ca B: ca. 0 C: ca y Svar) C: ca DTU Compute Introduktion til Statistik Efterår / 61 Korrelation Hvad er korrelationen mellem og y? A: ca. 0 B: ca C: ca y Svar) B: ca DTU Compute Introduktion til Statistik Efterår / 61 Korrelation Hvad er korrelationen mellem og y? A: ca B: ca. 0 C: ca y Svar) B: ca. 0 DTU Compute Introduktion til Statistik Efterår / 61
10 Korrelation Hvad er korrelationen mellem og y? A: ca B: ca. 0 C: ca y Svar) B: ca. 0 DTU Compute Introduktion til Statistik Efterår / 61 Beskrivende statistik: Grafisk fremstilling Beskrivende statistik (eplorative statistics) Undersøg et data sæt Beskriv data ved at fremhæve de vigtige pointer så andre hurtigt kan se indhold, trends og synlige sammenhænge Præsenter data for andre, som ikke kender det Grafisk fremstilling med forskellige plots: Histogram (empirisk tæthedsfunktion) Empirisk kumulativ tæthedsfunktion Boplot Scatterplot DTU Compute Introduktion til Statistik Efterår / 61 Installer R og Rstudio på egen computer Introduceres i enoten Er integreret i mange ting i kurset vi gør Globalt og hurtigt voksende open source beregningsmiljø ADVARSEL: R kan IKKE erstatte vores hjerner!!!! (Læs sektion 1.5.4!) DTU Compute Introduktion til Statistik Efterår / 61 > ## Adding numbers in the console > 2+3 > ## Define a vector > <- c(1, 4, 6, 2) > > ## A sequence from 1 to 10 > <- 1:10 > DTU Compute Introduktion til Statistik Efterår / 61
11 ## Sample Mean and Median (data from enote) <- c(168,161,167,179,184,166,198,187,191,179) mean() median() ## Sample quartiles quantile(, type=2) ## 0% 25% 50% 75% 100% ## ## Sample variance and standard deviation var() sd() ## Sample quantiles 0%, 10%,..,90%, 100%: quantile(, probs=seq(0, 1, by=0.10), type=2) ## 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% ## DTU Compute Introduktion til Statistik Efterår / 61 DTU Compute Introduktion til Statistik Efterår / 61 Histogram Empirisk tæthed (empirical density eller density histogram) ## A histogram of the heights: hist() ## A density histogram (empirical distribution) of the heights: hist(, freq=false, col="red", nclass=8) Histogram of Histogram of Frequency Density DTU Compute Introduktion til Statistik Efterår / 61 DTU Compute Introduktion til Statistik Efterår / 61
12 Empirisk kumuleret distribution ecdf() Boplot Fn() ## A basic boplot of the heights: (range=0 makes it "basic") boplot(, range=0, col="red", main="basic boplot") tet(1.3, quantile(), c("minimum","q1","median","q3","maimum"), col="blue") Basic boplot Maimum Q3 Median Q1 Minimum DTU Compute Introduktion til Statistik Efterår / 61 DTU Compute Introduktion til Statistik Efterår / 61 Modified boplot ## A modified boplot of the heights with an ## etreme observation, 235cm added: ## The modified version is the default boplot(c(,235), col="red", main="modified boplot") tet(1.3, quantile(c(,235)), c("minimum","q1","median","q3", "Maimum"),col="blue") Modified boplot Maimum Q3 Median Q1 Minimum Markeret er: Gennemsnittet, Medianen, Fraktiler (10%, 95%) Hvad er markeret med den lilla linie? A: Gennemsnittet B: Medianen C: 10% fraktilen D: 95% fraktilen Empirical density Density Svar) D: 95% Fraktil DTU Compute Introduktion til Statistik Efterår / 61 DTU Compute Introduktion til Statistik Efterår / 61
13 Markeret er: Gennemsnittet, Medianen, Fraktiler (10%, 95%) Hvad er markeret med den røde linie? A: Gennemsnittet B: Medianen C: 10% fraktilen D: 95% fraktilen Empirical density Markeret er: Gennemsnittet, Medianen, Fraktiler (10%, 95%) Hvad er markeret med den blå linie? A: Gennemsnittet B: Medianen C: 10% fraktilen D: 95% fraktilen Empirical density Density Density Svar) C: 10% Fraktil Svar) B: Medianen DTU Compute Introduktion til Statistik Efterår / 61 DTU Compute Introduktion til Statistik Efterår / 61 Projekter Markeret er: Gennemsnittet, Medianen, Fraktiler (10%, 95%) Hvad er markeret med den grønne linie? A: Gennemsnittet B: Medianen C: 10% fraktilen D: 95% fraktilen Empirical density Density Svar) A: Gennemsnittet DTU Compute Introduktion til Statistik Efterår / 61 DTU Compute Introduktion til Statistik Efterår / 61
14 s Projekter Projekter Projekter Næste uge Der skal laves to projekter Emne for alle projekter i 1. omgang: Beskrivende statistik, konfidensintervaller og hypotesetest 1. omgang er der tre projekter at vælge imellem: Handel med ETF I Varmeforbrug i Sønderborg I Skive fjord I BMI I Man må gerne arbejde i grupper om beregninger, men rapporterne skal skrives individuelt, se mere på Se også afleveringsdatoer på hjemmesiden Begynd på projekt 1 efter opgaverne i dag til grupperegning Bemærk: der checkes for plagiering og det bliver anmeldt! Begge skal godkendes for at kunne gå til eksamen. Får man ikke godkendt første afleveringdtu ercompute der mulighed for genaflevering Introduktion til Statistik Efterår / 61 Næste uge: Stokastiske variable, sandsynligheder, diskrete fordelinger - kapitel 2 i enoten DTU Compute Introduktion til Statistik Efterår / 61
Oversigt. 1 Praktisk Information. 2 Introduction to Statistics - a primer. 3 Intro Case historier: IBM Big data, Novo Nordisk small data, Skive fjord
Course 02402/02323 Introducerende Statistik Forelæsning 1: Intro, R og beskrivende statistik Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet
Forelæsning 1: Intro, R og beskrivende statistik
Introduktion til statistik Forelæsning 1: Intro, R og beskrivende statistik Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:
Forelæsning 1: Intro og beskrivende statistik
Kursus 02402 Introduktion til Statistik Forelæsning 1: Intro og beskrivende statistik Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby
Oversigt. Kursus 02402 Introduktion til Statistik. Forelæsning 1: Intro og beskrivende statistik. Per Bruun Brockhoff. Praktisk Information
Kursus 02402 Forelæsning 1: Intro og beskrivende statistik Oversigt 1 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:
Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher
Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: [email protected]
Kapitel 3 Centraltendens og spredning
Kapitel 3 Centraltendens og spredning Peter Tibert Stoltze [email protected] Elementær statistik F2011 1 Indledning 2 Centraltendens 3 Spredning 4 Praktisk beregning 5 Fraktiler 6 Opsamling 1 Indledning
Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 3: Kontinuerte fordelinger. Per Bruun Brockhoff
Course 242/2323 Introducerende Statistik Forelæsning 3: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 22 Danmarks Tekniske Universitet 28 Lyngby Danmark
Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff
Kursus 02402 Introduktion til Statistik Forelæsning 13: Summary Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:
Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Introduktion Kasper K. Berthelsen, Inst f. Matematiske Fag Omfang: 8 Kursusgang I fremtiden
Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher
Kursus 02323: Introducerende Statistik Forelæsning 12: Forsøgsplanlægning Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: [email protected]
Modul 5: Test for én stikprøve
Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 5: Test for én stikprøve 5.1 Test for middelværdi................................. 1 5.1.1 t-fordelingen.................................
Kursus 02402/02323 Introduktion til statistik. Forelæsning 13: Et overblik over kursets indhold. Klaus K. Andersen og Per Bruun Brockhoff
Kursus 02402/02323 Introduktion til statistik Forelæsning 13: Et overblik over kursets indhold Klaus K. Andersen og Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Danmarks Tekniske Universitet
Basal statistik. 30. januar 2007
Basal statistik 30. januar 2007 Deskriptiv statistik Typer af data Tabeller Grafik Summary statistics Lene Theil Skovgaard, Biostatistisk Afdeling Institut for Folkesundhedsvidenskab, Københavns Universitet
Kapitel 3 Centraltendens og spredning
Kapitel 3 Centraltendens og spredning Peter Tibert Stoltze [email protected] Elementær statistik F2011 1 / 25 Indledning I kapitel 2 omsatte vi de rå data til en tabel, der bedre viste materialets fordeling
Oversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger
Introduktion til Statistik Forelæsning 2: og diskrete fordelinger Oversigt 1 2 3 Fordelingsfunktion 4 Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 017 Danmarks Tekniske Universitet 2800
Konfidensinterval for µ (σ kendt)
Program 1. Repetition: konfidens-intervaller. 2. Hypotese test 3. Type I og type II fejl, p-værdi 4. En og to-sidede tests 5. Test for middelværdi (kendt varians) 6. Test for middelværdi (ukendt varians)
1 enote 1: Simple plots og deskriptive statistik. 2 enote2: Diskrete fordelinger. 3 enote 2: Kontinuerte fordelinger
Kursus 02402/02323 Introduktion til statistik Forelæsning 13: Et overblik over kursets indhold Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Building 324, Room 220 Danish Technical University
1 enote 1: Simple plots og deskriptive statistik. 2 enote 2: Diskrete fordelinger. 3 enote 2: Kontinuerte fordelinger
Kursus 02402/02323 Introduktion til statistik Forelæsning 13: Et overblik over kursets indhold Peder Bacher DTU Compute, Dynamiske Systemer Building 303B, Room 017 Danish Technical University 2800 Lyngby
Hypotese test. Repetition fra sidst Hypoteser Test af middelværdi Test af andel Test af varians Type 1 og type 2 fejl Signifikansniveau
ypotese test Repetition fra sidst ypoteser Test af middelværdi Test af andel Test af varians Type 1 og type fejl Signifikansniveau Konfidens intervaller Et konfidens interval er et interval, der estimerer
Program. 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test.
Program 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test. 1/19 Konfidensinterval for µ (σ kendt) Estimat ˆµ = X bedste bud
Statistikkompendium. Statistik
Statistik INTRODUKTION TIL STATISTIK Statistik er analyse af indsamlet data. Det vil sige, at man bearbejder et datamateriale, som i matematik næsten altid er tal. Derved får man et samlet overblik over
Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/
Program: 1. Repetition af vigtige sandsynlighedsfordelinger: binomial, (Poisson,) normal (og χ 2 ). 2. Populationer og stikprøver 3. Opsummering af data vha. deskriptive størrelser og grafer. 1/29 Binomial
Statistik. Introduktion Deskriptiv statistik Sandsynslighedregning
Statistik Introduktion Deskriptiv statistik Sandsynslighedregning Introduktion Kasper K. Berthelsen, Institut f. Mat. Fag 8 Kursusgange Individuel mundtlig eksamen (7-skala) Udgangspunkt i opgaver Software:
Modul 7: Eksempler. 7.1 Beskrivende dataanalyse. 7.1.1 Diagrammer. Bent Jørgensen. Forskningsenheden for Statistik ST501: Science Statistik
Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 7: Eksempler 7.1 Beskrivende dataanalyse............................... 1 7.1.1 Diagrammer.................................
Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff
Kursus 02402 Introduktion til Statistik Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks
Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration
Faculty of Life Sciences Program Modelkontrol og prædiktion Claus Ekstrøm E-mail: [email protected] Test af hypotese i ensidet variansanalyse F -tests og F -fordelingen. Multiple sammenligninger. Bonferroni-korrektion
Module 2: Beskrivende Statistik
Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen og Hans Chr. Petersen Module 2: Beskrivende Statistik 2.1 Histogrammer og søjlediagrammer......................... 1 2.2 Sammenfatning
Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Introduktion Kursusholder: Kasper K. Berthelsen Opbygning: Kurset består af 5 blokke En blok består af: To normale
Kvantitative Metoder 1 - Forår 2007. Dagens program
Dagens program Kapitel 7 Introduktion til statistik Organisering af data Diskrete variabler Kontinuerte variabler Beskrivende statistik Fraktiler Gennemsnit Empirisk varians og spredning Empirisk korrelationkoe
Modul 3: Kontinuerte stokastiske variable
Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 3: Kontinuerte stokastiske variable 3.1 Kontinuerte stokastiske variable........................... 1 3.1.1 Tæthedsfunktion...............................
Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger. Peder Bacher
Introduktion til Statistik Forelæsning 2: Stokastisk variabel og diskrete fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark
Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher
Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: [email protected]
Ensidet variansanalyse
Ensidet variansanalyse Sammenligning af grupper Helle Sørensen E-mail: [email protected] StatBK (Uge 47, mandag) Ensidet ANOVA 1 / 18 Program I dag: Sammenligning af middelværdier Sammenligning af spredninger
Forelæsning 11: Envejs variansanalyse, ANOVA
Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalyse, ANOVA Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark
Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse
Statistik med GeoGebra
Statistik med GeoGebra Hayati Balo, AAMS, marts 2012 1 Observationssæt Det talmateriale, som man gerne vil undersøge, kaldes et observationssæt. Det talsæt som fremgår i tabel 5.1 kan indsættes i GeoGebra
Statistik vejledende læreplan og læringsmål, efteråret 2013 SmartLearning
Side 1 af 6 Statistik vejledende læreplan og læringsmål, efteråret 2013 SmartLearning Litteratur: Kenneth Hansen & Charlotte Koldsø: Statistik I økonomisk perspektiv, Hans Reitzels Forlag 2012, 2. udgave,
Forelæsning 11: Kapitel 11: Regressionsanalyse
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
En Introduktion til SAS. Kapitel 5.
En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel
Program. Ensidet variansanalyse Sammenligning af grupper. Statistisk model og hypotese. Eksempel: Aldersfordeling i hjertestudie
Program Ensidet variansanalyse Sammenligning af grupper Helle Sørensen E-mail: [email protected] I dag: Sammenligning af middelværdier Sammenligning af spredninger Parvise sammenligninger To eksempler:
Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger
Course 02402/02323 Introducerende Statistik Forelæsning 2: Stokastisk variabel og diskrete fordelinger Klaus K. Andersen og Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Danmarks Tekniske Universitet
Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium
Deskriptiv (beskrivende) statistik er den disciplin, der trækker de væsentligste oplysninger ud af et ofte uoverskueligt materiale. Det sker f.eks. ved at konstruere forskellige deskriptorer, d.v.s. regnestørrelser,
enote 5: Simpel lineær regressions analyse Kursus 02402/02323 Introducerende Statistik Oversigt
enote 5: Simpel lineær regressions analse Kursus 02402/02323 Introducerende Statistik Forelæsning 8: Simpel lineær regression To variable: og Beregn mindstekvadraters estimat af ret linje Inferens med
Kursus 02402/02323 Introducerende Statistik
Kursus 02402/02323 Introducerende Statistik Forelæsning 8: Simpel lineær regression Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark
Susanne Ditlevsen Institut for Matematiske Fag Email: [email protected] http://math.ku.dk/ susanne
Statistik og Sandsynlighedsregning 1 Indledning til statistik, kap 2 i STAT Susanne Ditlevsen Institut for Matematiske Fag Email: [email protected] http://math.ku.dk/ susanne 5. undervisningsuge, onsdag
Basal statistik for sundhedsvidenskabelige forskere, forår 2015 Udleveret 3. marts, afleveres senest ved øvelserne i uge 13 (24.-25.
Hjemmeopgave Basal statistik for sundhedsvidenskabelige forskere, forår 2015 Udleveret 3. marts, afleveres senest ved øvelserne i uge 13 (24.-25. marts) En stikprøve bestående af 65 mænd og 65 kvinder
Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable
Kursus 02402 Introduktion til Statistik Forelæsning 2: Kapitel 4, Diskrete fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Multipel Lineær Regression. Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test
Multipel Lineær Regression Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test Multipel lineær regression x,x,,x k uafhængige variable
Normalfordelingen. Statistik og Sandsynlighedsregning 2
Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på
Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18
Program 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Fordeling af X Stikprøve X 1,X 2,...,X n stokastisk X stokastisk. Ex (normalfordelt stikprøve)
Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)
Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske
Oversigt. 1 Motiverende eksempel: Højde-vægt. 2 Lineær regressionsmodel. 3 Mindste kvadraters metode (least squares)
Kursus 02402/02323 Introducerende Statistik Forelæsning 8: Simpel lineær regression Oversigt Motiverende eksempel: Højde-vægt 2 Lineær regressionsmodel 3 Mindste kvadraters metode (least squares) Klaus
En Introduktion til SAS. Kapitel 6.
En Introduktion til SAS. Kapitel 6. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 6 Regressionsanalyse i SAS 6.1 Indledning Dette kapitel
Anvendt Statistik Lektion 8. Multipel Lineær Regression
Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke
Lektion 9 Statistik enkeltobservationer
Lektion 9 Statistik enkeltobservationer Middelværdi med mere Hyppigheds- og frekvens-tabeller Diagrammer Hvilket diagram er bedst? Boxplot Lektion 9 Side 1 Når man skal holde styr på mange oplysninger,
Forelæsning 3: Kapitel 5: Kontinuerte fordelinger
Kursus 02402 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Indblik i statistik - for samfundsvidenskab
Indblik i statistik - for samfundsvidenskab Læs mere om nye titler fra Academica på www.academica.dk Nikolaj Malchow-Møller og Allan H. Würtz Indblik i statistik for samfundsvidenskab Academica Indblik
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006 I dag: To stikprøver fra en normalfordeling, ikke-parametriske metoder og beregning af stikprøvestørrelse Eksempel: Fiskeolie
Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Introduktion Kasper K. Berthelsen, Inst f. Matematiske Fag Omfang: 8 Kursusgang I fremtiden
Løsning eksamen d. 15. december 2008
Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6
Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220
Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge
Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge Opgave 1. Data indlæses i 3 kolonner, som f.eks. kaldessalt,pre ogpost. Der er således i alt tale om 26 observationer, idet de to grupper lægges
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Introduktion 1 Formelt Lærere: Esben Budtz-Jørgensen Jørgen Holm Petersen Øvelseslærere: Berivan+Kathrine, Amalie+Annabell Databehandling: SPSS
Trolling Master Bornholm 2012
Trolling Master Bornholm 1 (English version further down) Tak for denne gang Det var en fornøjelse især jo også fordi vejret var med os. Så heldig har vi aldrig været før. Vi skal evaluere 1, og I må meget
Privatansatte mænd bliver desuden noget hurtigere chef end kvinderne og forholdsvis flere ender i en chefstilling.
Sammenligning af privatansatte kvinder og mænds løn Privatansatte kvindelige djøfere i stillinger uden ledelsesansvar har en løn der udgør ca. 96 procent af den løn deres mandlige kolleger får. I sammenligningen
Projekt 4.8. Kerners henfald (Excel)
Projekt.8. Kerners henfald (Excel) Når radioaktive kerner henfalder under udsendelse af stråling, sker henfaldet I følge kvantemekanikken helt spontant, dvs. rent tilfældigt uden nogen påviselig årsag.
Faculty of Health Sciences. Logistisk regression: Interaktion Kvantitative responsvariable
Faculty of Health Sciences Logistisk regression: Interaktion Kvantitative responsvariable Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet [email protected]
Statistik og Sandsynlighedsregning 2
Statistik og Sandsynlighedsregning 2 Transformation af kontinuerte fordelinger på R, flerdimensionale kontinuerte fordelinger, mere om normalfordelingen Helle Sørensen Uge 7, onsdag SaSt2 (Uge 7, onsdag)
Funktionalligninger - løsningsstrategier og opgaver
Funktionalligninger - løsningsstrategier og opgaver Altså er f (f (1)) = 1. På den måde fortsætter vi med at samle oplysninger om f og kombinerer dem også med tidligere oplysninger. Hvis vi indsætter =
Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse
Afsnit 8.3 - E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse Først skal normalfordelingen lige defineres i Maple, så vi kan benytte den i vores udregninger. Dette gøres
Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte
3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve
Trivsel og fravær i folkeskolen
Trivsel og fravær i folkeskolen Sammenfatning De årlige trivselsmålinger i folkeskolen måler elevernes trivsel på fire forskellige områder: faglig trivsel, social trivsel, støtte og inspiration og ro og
Forelæsning 9: Inferens for andele (kapitel 10)
Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Fagplan for statistik, efteråret 2015
Side 1 af 7 M Fagplan for statistik, efteråret 20 Litteratur Kenneth Hansen & Charlotte Koldsø (HK): Statistik I økonomisk perspektiv, Hans Reitzels Forlag 2012, 2. udgave, ISBN 9788741256047 HypoStat
Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j
Hypoteser om mere end to stikprøver ANOVA k stikprøver: (ikke ordinale eller højere) H 0 : 1 2... k gælder også for k 2! H 0ij : i j H 0ij : i j simpelt forslag: k k 1 2 t-tests: i j DUER IKKE! Bonferroni!!
Økonometri 1. Inferens i den lineære regressionsmodel 25. september 2006. Oversigt: De næste forelæsninger
Oversigt: De næste forelæsninger Økonometri Inferens i den lineære regressionsmodel 5. september 006 Statistisk inferens: hvorledes man med udgangspunkt i en statistisk model kan drage konklusioner på
Generelt er korrelationen mellem elevens samlede vurdering i forsøg 1 og forsøg 2 på 0,79.
Olof Palmes Allé 38 8200 Aarhus N Tlf.nr.: 35 87 88 89 E-mail: [email protected] www.stil.dk CVR-nr.: 13223459 Undersøgelse af de nationale tests reliabilitet 26.02.2016 Sammenfatning I efteråret 2014 blev
