Matematik/Statistik. statistik. Forelæser og ansvarlig for kursets statistikdel: Peter Sunde Afd. f. Populationsbiologi

Størrelse: px
Starte visningen fra side:

Download "Matematik/Statistik. statistik. Forelæser og ansvarlig for kursets statistikdel: Peter Sunde Afd. f. Populationsbiologi"

Transkript

1 Matematik/Statistik statistik Forelæser og ansvarlig for kursets statistikdel: Peter Sunde Afd. f. Populationsbiologi M1, slide 1 Dagens prædiken: Introduktion til kurset Praktiske oplysninger Hvad vedkommer statistik os biologer! Hvad vi vil ha, at I skal ha ud af dette kursus Statistiske grundbegreber Hvad går statistik ud på? Observationer, stikprøver og populationer Stokastiske variable Mål for central tendens Mål for spredning M1, slide (Introduktion til kurset: praktiske oplysninger) 1

2 Matematik/Statistik Bio-statistik Matematik for biologer Populationsbiologi M1, slide 3 (Introduktion til kurset: praktiske oplysninger) Statistik 5-9 dobbeltforelæsninger (uge -) ugentlige øvelsestimer (sammen med matematik) Eksamen 7. januar timers skriftligt prøve Statistikdel og matematikdel vægtes lige Bestået, hvis >5% rigtigt M1, slide (Introduktion til kurset: praktiske oplysninger)

3 Kursusmateriale: Fowler et al Practical statistics for field biology. Lærebog: pensum. Kompendium og opgaver i biostatistik 8 kr M1, slide 5 (Introduktion til kurset: praktiske oplysninger) Statistik: Kursus-hjemmeside: Vælg menuerne: Courses Course homepages Undergraduate courses Blok - Matematik/Statistik Login to protected documents, Username: biologi, Password:biku --Start her.htm Kursusinformation og Downloads: Forelæsnings-slides Løsninger til regneopgaver Regneark med automatiserede statistikfunktioner M1, slide (Introduktion til kurset: praktiske oplysninger) 3

4 1 3 Vejledende forelæsningsplan Introduktion til kurset. Statistiske grundbegreber. Sandsynlighedsfordelinger for diskrete variable på nominalskala: Binomialfordelingen, Poisson-fordelingen. (1-5) Principper for hypotese-testning. Statistiske test for data på nominalskala: Binomialtestet, χ -tests. Fordelingsmønstre af tælledata. (-7, 3-1) 5 Sandsynlighedsfordelinger for data på interval- og ratioskala: normalfordeling, t-fordeling, F-fordeling, sikkerhedsgrænser for middelværdi og forskel i middelværdi. (7-) Tests for forskel i central tendens for data på ordinal- og interval/ratioskala: t-tests for afhængige of uafhængige stikprøver, Mann-Whitney U-test, Kruskall-Wallis test, Wilcoon s test, Friedman s test. (15-178) 7 Korrelation og regression: Covarians, Pearson s r, Spearman s r s, Lineær regression. (131-15) 8 Regression fortsat. Introduktion til variansanalyse og generelle lineære modeller, samt brug af statistisk software. ( , ) 9 Opsamling M1, slide 7 (Introduktion til kurset: praktiske oplysninger) Uge Statistik-forelæsninger * Relevante opgaver i øvelseskompendium Statistik i forbindelse med populationsøvelser (1 + ) Introduktion til kurset Statistiske grundbegreber. Sandsynlighedsfordelinger for diskrete stokastiske variable på nominalskala: Binomialfordelingen, Poisson-fordelingen. (1-5) 7 (3+) Principper for hypotese-testning. Statistiske test for data på nominalskala: Binomialtestet, χ -tests. Fordelingsmønstre af tælledata (-7, 3-1) 8 (5) Sandsynlighedsfordelinger for data på interval- og ratioskala: normalfordeling, t- fordeling, F-fordeling, sikkerhedsgrænser for middelværdi og forskel i middelværdi (7-) 9 () Tests for forskel i central tendens for data på ordinal, interval og ratioskala: t- tests, Mann-Whitney U-test, Kruskall- Wallis test, Wilcoon s test, Friedman s test (15-178) Sæt 1: 1 Sæt : 1 5 Sæt 3: 1 (også uge 7) Sæt 3: 1 (også uge ) Sæt 5: 1 5 Sæt : 1 Sæt : 1 5 (ingen) Livstabel: Binomialfordeling, binomialtest, χ one sample test Biologisk bekæmpelse: Mann- Whitney, Wilcoon, t-statistik Funktionelt respons: Spearman s r s, lineær regression Signalering: Mann-Whitney, Wilcoon, Spearman s r s 5 (7) Korrelation og regression: Covarians, Pearson s r, Spearman s r s, Lineær regression (131-15) 1 (8) Regression fortsat. Introduktion til variansanalyse og generelle lineære modeller, samt brug af statistisk software ( , ) Sæt 7: 1 3 Frøbank: χ (r c table), Wilcoon, fordelingsmønstre Populationsvækst: Mann- Whitney, Wilcoon, t-statistik Sæt 8: 1 Aldersstruktur: t-statistik, χ -statistik Dominans: Kruskall-Wallis, χ - statistik (9) Opsamling Eksempler på eksamensopgaver (ingen) M1, slide 8 (Introduktion til kurset) * Sidehenvisninger til lærebogen (Fowler et al. 1998) er angivet med rød tekst.

5 Introduktion til kurset Praktiske oplysninger Hvad vedkommer statistik os biologer! Hvad vi vil ha, at I skal ha ud af dette kursus M1, slide 9 (Introduktion til kurset: Hvad vedkommer statistik biologer?) Hvad vedkommer statistik egentlig os biologer? Statistisk analyse er en del af den (natur)videnskabelige metode! Statistik vil indgå i din professionelle hverdag! M1, slide (Introduktion til kurset: Hvad vedkommer statistik biologer?) 5

6 Statistisk analyse er en del af den naturvidenskabelige metode Data Statistisk analyse Kvantitativt resultat Biologisk tolkning Biologisk funderet konklusion M1, slide 11 (Introduktion til kurset: Hvad vedkommer statistik biologer?) = Varen DU skal levere Statistisk analyse er en del af den naturvidenskabelige metode Data Sampling design Statistisk analyse stærkest mulige metode Kvantitativt resultat Biologisk tolkning (Estimat af virkeligheden) Biologiske kompetence Biologisk funderet konklusion = Varen DU skal levere M1, slide 1 (Introduktion til kurset: Hvad vedkommer statistik biologer?)

7 Brugen af statistik bare stiger og stiger.. M1, slide 13 (Introduktion til kurset: Hvad vedkommer statistik biologer?) Forstår du denne tekst? Der var 7 hanner og 3 hunner i koloni A (7% hanner; 95% CI: 5-73%). I koloni B var det tilsvarende antal 3 og 1 (% hanner, 95% CI: 9-7%). Der var ingen signifikant forskel på fordelingen af hanner og hunner i de to kolonier (X [Yate s korrektion] =.5, df=1, P>.9). I de to kolonier tilsammen, var der signifikant flere hanner end hunner (binomial test (twotailed): P=.). M1, slide 1 (Introduktion til kurset: Hvad vedkommer statistik biologer?) 7

8 Formålsbeskrivelse: Undervisningen skal introducere de studerende til statistikkens grundbegreber og metoder, primært gennem konkrete eksempler på statistikkens anvendelse i forbindelse med biologiske problemstillinger. Der vil blive lagt vægt på, at den studerende med udgangspunkt i en konkret biologisk problemstilling kan opstille hypoteser, vælge signifikansniveau, vælge en statistisk test, der udnytter data optimalt, udføre beregningerne korrekt og til slut drage den rigtige konklusion baseret på de opstillede hypoteser og det valgte signifikansniveau. I løbet af kurset vil den studerende stifte bekendtskab med de mest anvendte statistiske fordelinger samt en række parametriske og parameterfrie tests. Endelig vil den studerende blive introduceret til statistisk software. M1, slide 1 (Introduktion til kurset: Hvad du skal lære på dette kursus) Hvad vi vil ha, at I skal ha ud af dette kursus Forståelse af statistikkens grundprincipper og underlæggende teori Basale færdigheder i brug af simpel statistik til behandling af egne data. En grundlæggende viden, som sætter jer i stand til på egen hånd, at opsøge mere viden.. M1, slide 17 (Introduktion til kurset: Hvad du skal lære på dette kursus) 8

9 Grib chancen! M1, slide 18 (Introduktion til kurset) Statistiske grundbegreber Hvad går statistik ud på? Observationer, stikprøver og populationer Stokastiske variable Mål for central tendens Mål for spredning M1, slide 19 (Statistiske grundbegreber) 9

10 Hvad er statistik? Én definition: There are three kinds of lies: lies, damned lies, and statistics Benjamin Disraeli, Britisk Premierminister M1, slide (Statistiske grundbegreber: Hvad går statistik ud på?) Hvad er statistik? En anden definition: Statistik: Det videnskabelige studie af data, som beskriver naturlig variation Videnskab: Objektiv, standardiseret metode Data: Kvantitative mængder af information, ikke enkeltobservationer Naturlig variation: Variation, som kan henføres til alle de begivenheder, der ikke er under undersøgerens direkte kontrol M1, slide 1 (Statistiske grundbegreber: Hvad går statistik ud på?)

11 Hvad er statistik? -En tredje definition: ved på basis af sandsynlighedsteori, at generalisere en kvantitativt udtrykt viden fra et begrænset antal observationer til en større helhed. (Kvantitativt = kan angives i talstørrelser) frekvens ( f ) M1, slide (Statistiske grundbegreber: Hvad går statistik ud på?) Forventet hyppig hed (p ) Hvad er statistik? - ved på basis af sandsynlighedsteori, at generalisere en kvantitativt udtrykt viden fra et begrænset antal observationer til en større helhed. Vægtfordeling af 8 kongepingviner vægtfordeling af alle kongepingviner frekvens ( f ) 8 Stikprøve population M1, slide 3 (Statistiske grundbegreber: Hvad går statistik ud på?) Forventet hyppig hed (p ).3. 11

12 frekvens ( f ) 8 Hvad bruger vi statistik til? - Ud fra stikprøvens sammensætning, kan vi estimere populationens sande sammensætning, som vi ikke kender. - Et estimat er derfor behæftet med statistisk usikkerhed - Statistisk teori sætter os i stand til at angive størrelsen af denne usikkerhed. Stikprøve population M1, slide (Statistiske grundbegreber: Hvad går statistik ud på?) Forventet hyppig hed (p ).3..1 Hovedanvendelser af statistik Induktiv/deskriptiv/beskrivende statistik: Angivelse af sikkerhedsgrænser omkring estimater af de sande underlæggende fordelinger Deduktiv (hypotese-testende) statistik: Test for om en observeret forskel er reel, ud fra sandsynligheden for at den kan tilskrives tilfældig variation A) Forskelle mellem grupper B) Sammenhænge mellem variable M1, slide 5 (Statistiske grundbegreber: Hvad går statistik ud på?) 1

13 Deskriptiv statistik Udgangspunktet for alle analyser: Hvordan ser mønsteret ud? - Hvad er de to stikprøvers estimerede middelværdier, og hvor stor er usikkerheden omkring de to estimater? M1, slide (Statistiske grundbegreber: Hvad går statistik ud på?) Værdi af variabel Deduktiv statistik, Hypotese-testning: Tester om en observeret forskel (eller sammenhæng) er reel. - Hvad er sandsynligheden for at den observerede forskel i gennemsnit skyldes tilfældigheder? Herom, meget mere senere... M1, slide 7 (Statistiske grundbegreber: Hvad går statistik ud på?) Værdi af variabel7 13

14 Datagrundlag/forsøgsdesign: Eksperimentelle data: Uafhængige variable kontrolleret af forsøgsleder F.eks. Kliniske forsøg: forsøgspersoner modtager forskellig behandling bestemt ved lodtrækning Korrelative data Uafhængige variable ikke underlagt forsøgsleders kontrol. F.eks. Epidemiologiske undersøgelser: dødelighed blandt rygere og ikke-rygere i en befolkning M1, slide 8 (Statistiske grundbegreber: Hvad går statistik ud på?) Eksempel på korrelative data: Fødselshyppighed og antal storkepar i Danmark, Fødsler per inb Antal storkepar M1, slide 9 (Statistiske grundbegreber: Hvad går statistik ud på?) 1

15 Fødsler per inb. Eksempel CORRELATION på korrelative IS NOT data: CAUSATION Fødselshyppighed og antal storkepar i Danmark, 189- En statistisk påviselig sammenhæng siger kun, at der er en sammenhæng. Ikke hvad den skyldes! Antal storkepar Statistisk funderede konklusioner er sårbare over for mistolkninger (eller manipulation..). Vær altid kritisk! M1, slide 3 (Statistiske grundbegreber: Hvad går statistik ud på?) Statistiske grundbegreber Hvad går statistik ud på? Observationer, stikprøver og populationer Stokastiske variable Mål for central tendens Mål for spredning M1, slide 31 (Statistiske grundbegreber: Observationer, stikprøver og populationer) 15

16 Stikprøve population M1, slide 3 (Statistiske grundbegreber: Observationer, stikprøver og populationer) Enkeltobservation: én pingvin Stikprøve: n pingviner i kolonien Statistisk population: alle pingviner i kolonien Biologisk population: alle kongepingviner, som har unger i februar måned (?) M1, slide 33 (Statistiske grundbegreber: Observationer, stikprøver og populationer) 1

17 Universelle krav til stikprøvetagning ( sampling )! Stikprøven skal være et tilfældigt udtræk af den statistiske population (repræsentativ)! Hvis stikprøven ikke er repræsentativ, er undersøgelsen biased. De enkelte observationer skal være indbyrdes uafhængige! M1, slide 3 (Statistiske grundbegreber: Observationer, stikprøver og populationer) Statistiske grundbegreber Hvad går statistik ud på? Observationer, stikprøver og populationer Stokastiske variable Mål for central tendens Mål for spredning M1, slide 35 (Statistiske grundbegreber: Stokastiske variable) 17

18 Variable Variabel: Hvad som helst, som varierer mellem observationer Stokastisk variabel: En variabel, hvis udfald/værdi vi på forhånd ikke kender. Udfaldsrum: Det sæt værdier en stokastisk variabel kan antage. M1, slide 3 (Statistiske grundbegreber: Stokastiske variable) Eksempler på variable Observation: Variabel: Udfaldsrum: Pingvin køn {, } Pingvin Længde (cm) [, ] Pingvin PCB indhold (ppm) [, ] Pingvinkoloni Antal Pingviner {, 1,.. } M1, slide 37 (Statistiske grundbegreber: Stokastiske variable) 18

19 Måleskalaer for variable: Nominal-skala ( klassifikations-skala ) {, },{rød, blå}, {konge-, kejserpingvin} Ordinal-skala ( rang-skala ) {pulli, juvenil, subadult, adult} Interval-skala Temperatur i C Ratio-skala Højde, masse, antal M1, slide 38 (Statistiske grundbegreber: Stokastiske variable) Matematiske operatorer: Nominal-skala = Ordinal-skala = > < Interval-skala = > < - + Ratio-skala = > < - + X /. M1, slide 39 (Statistiske grundbegreber: Stokastiske variable) 19

20 Diskrete og kontinuerte variable Diskrete variable discrete, discintinuous, meristic : Kan kun antage diskrete værdier Kontinuerte variable continuous : Kan antage alle værdier indenfor et givet udfaldsrum M1, slide (Statistiske grundbegreber: Stokastiske variable) Diskrete og kontinuerte variable Diskrete variable Antal pingviner i en koloni, X = {,1,... } Køn, X = {, } Kontinuerte variable Længde, X ], [ M1, slide 1 (Statistiske grundbegreber: Stokastiske variable)

21 Grafisk fremstilling Diskrete variable Unger Hunner Pindediagram( bar graphs ) Lagkagediagram (nominalskala) Hanner Antal observationer Antal reder Hanner Hunner Unger Gruppe Kontinuerte variable Histogram (interval-,ratioskala) Antal pingviner, f() Kuldstørrelse M1, slide (Statistiske grundbegreber: Stokastiske variable) Højde (cm ) Statistiske grundbegreber Hvad går statistik ud på? Observationer, stikprøver og populationer Stokastiske variable Mål for fordelingers centrale tendens Mål for fordelingers spredning M1, slide 3 (Statistiske grundbegreber: Mål for fordelingers centrale tendens 1

22 Forskellige mål for fordelingers centrale tendens Middelværdi/gennemsnit Median Modus M1, slide (Statistiske grundbegreber: Mål for fordelingers centrale tendens Middelværdi og gennemsnit (data på interval eller ratioskala) Middelværdien: mean µ = i N Gennemsnittet (estimat af middelværdi): sample mean average = µˆ = i n (Forskellige notationer betyder det samme) n i i i=1 = = n n n M1, slide 5 (Statistiske grundbegreber: Mål for fordelingers centrale tendens

23 = µˆ = i n H Eksempel på beregning af gennemsnit: i = {1,, 5, 51} Σ i = = 11 n = = Σ i /n =11/ = 35,5 35,3 M1, slide (Statistiske grundbegreber: Mål for fordelingers centrale tendens Gennemsnit af grupperede data f(), (Antal reder) f i = µˆ = n Kuldstørrelse f f* Σ f = n = 19 Σ i f i = 1 = Σ i f i / Σ f = 1 /19 =, M1, slide 7 (Statistiske grundbegreber: Mål for fordelingers centrale tendens 3

24 Medianen (data skal være på mindst ordinalskala) Den værdi som deler en frekvensfordeling i to lige store dele = 5% fraktil f(), (Antal reder med æg) : Kuldstørrelse M1, slide 8 (Statistiske grundbegreber: Mål for fordelingers centrale tendens Beregning af median når antallet af observationer (n) er ulige: Median= værdien af den (n + 1)/ te observation (19+1)/ = ende observation, Median = f(), (Antal reder med æg) : Kuldstørrelse M1, slide 9 (Statistiske grundbegreber: Mål for fordelingers centrale tendens f F

25 Beregning af median for en fordeling med et lige antal observationer To metoder: 1) Median = gennemsnittet af værdierne for den n/ te og den (n/+1) te observation: (interval-/ratioskala) eller ) Medianværdien ligger mellem værdien af den n/ te og den (n/+1) te observation. (ordinalskala) Find medianen for denne fordeling ( observationer): 1, 31, 3, 7 1) n/ = / = ; værdi af. observation = 31, (n/+1 = / + 1 = 3, værdi af 3. observation = 3 Median = (31 + 3)/ = 3.5 ) Medianen ligger i mellem 31 og 3 M1, slide 5 (Statistiske grundbegreber: Mål for fordelingers centrale tendens Modus Værdien af de(t) mest almindelige udfald f(), antal reder , kuldstørrelse Fordelinger med et, to eller tre toppunkter, kaldes henholdsvist uni-, bi og tri-modale M1, slide 51 (Statistiske grundbegreber: Mål for fordelingers centrale tendens 5

26 Tre måder at vægte central tendens for den typiske kuldstørrelse Gennemsnit = = 1/19 =, Median = 5 Modus = {;3} f(), antal reder , kuldstørrelse M1, slide 5 (Statistiske grundbegreber: Mål for fordelingers centrale tendens Statistiske grundbegreber Hvad går statistik ud på? Observationer, stikprøver og populationer Stokastiske variable Mål for fordelingers centrale tendens Mål for fordelingers spredning M1, slide 53 (Statistiske grundbegreber: Mål for fordelingers spredning

27 Tre fordelinger med samme gennemsnit, men forskellig spredning frekvens (f) = 31 n = 3 frekvens (f) frekvens (f) M1, slide 5 (Statistiske grundbegreber: Mål for fordelingers spredning Forskellige mål for, hvor stor forskel der er i værdier inden for en fordeling: Range, Fraktiler (mindst ordinalskala) Varians, standardafvigelse (interval/ratioskala) Variationskoefficient (kun ratioskala) frekvens (f) M1, slide 55 (Statistiske grundbegreber: Mål for fordelingers spredning 7

28 Range ( spændvidde ) Difference mellem den største og den lavest målte værdi Højeste værdi = 5, Laveste værdi =, Range = 5- = 5 f(), antal reder , kuldstørrelse M1, slide 5 (Statistiske grundbegreber: Mål for fordelingers spredning Fraktiler/procentiler ( Fractiles / Percentiles ) Angiver værdier, som afgrænser de mest ekstreme haler af fordelingen. I modsætning til range robuste over for variation i stikprøvestørrelse frekvens (f) M1, slide 57 (Statistiske grundbegreber: Mål for fordelingers spredning 8

29 F(), antal duehøge per interval 137 duehøgehunner dræbt i kollisionsulykker 3 Fraktiler/procentiler 5% fraktil (= medianen) Fractiles,/ Percentiles 95% Robuste over for variation i 5% stikprøvestørrelse fraktil weight (g) fraktil (kropsvægt, målt i gram) M1, slide 58 (Statistiske grundbegreber: Mål for fordelingers spredning Hvis stikprøven H havde været mindre De 137 hunner: 137 duehøgehunner dræbt i kollisionsulykker 3 af de 137 hunner: Sub-sample af hunner: weight (g) weight (g) M1, slide 59 (Statistiske grundbegreber: Mål for fordelingers spredning 9

30 Range, men ikke fraktilværdier, følsomme over for variation i stikprøvens størrelse H n = 137 n = n = n = Gennemsnit median Minimum Maksimum Difference: % procentil % procentil Difference: M1, slide (Statistiske grundbegreber: Mål for fordelingers spredning Afvigelsen fra gennemsnittet Deviation from the mean, deviate : D = i M1, slide 1 (Statistiske grundbegreber: Mål for fordelingers spredning 3

31 Den kvadrerede afvigelse fra gennemsnittet: Squared deviation from the mean Sum of squares, SS Kvadratsummen Mean square, MS Variansen Total-optælling: ( i µ) ( i µ) σ = i ( µ) N Stikprøve: ( i ) ( i ) s ( i ) = n 1 Standard deviation, Standard afvigelsen σ = i ( µ) N ( i ) s = n 1 M1, slide (Statistiske grundbegreber: Mål for fordelingers spredning Sum-of-squares : Sum of squares of the deviations, Sum of squares, SS, Kvadrat-summen SS c = ( i ) ( ) i SS = ( i ) n - En nøgleparameter i parametrisk statistik! (mere herom senere...) M1, slide 3 (Statistiske grundbegreber: Mål for fordelingers spredning 31

32 Frihedsgrader (ν)... Degrees of freedom, DF, ν DF = antal observationer (n) antal estimerede parametre. Hver populationsparameter, som estimeres ud fra en stikprøve spiser en informationsmængde svarende til 1 observation! M1, slide (Statistiske grundbegreber: Mål for fordelingers spredning Frihedsgrader (ν)... Et lomme-eksempel: X={13, 1, 15, 18} Da de aritmetiske afvigelser fra gennemsnittet summerer op til, vil den sidste (n te) observations afvigelse være defineret ud fra de foregående observationer! s ( i ) = n 1 i i -gnst Σ = n = gnst.= 15 M1, slide 5 (Statistiske grundbegreber: Mål for fordelingers spredning 3

33 Variationskoefficienten coefficient of variation, CV CV = s Angiver den relative variation, standardiseret i forhold til gennemsnittet. Da CV angiver et relativt forhold (er en ratio), skal data være på ratioskala M1, slide (Statistiske grundbegreber: Mål for fordelingers spredning Variationskoefficient Eksempel: længde af lårbensknogler hos to gnavere: CV = s Markmus: Bæver: Gnst. = SD =.8. CV =..7 M1, slide 7 (Statistiske grundbegreber: Mål for fordelingers spredning 33

34 frekvens (f) 8 = 31, n = S = 1,93 S = 1,38 CV =,5% frekvens (f) S = 5, S =,9 CV = 7,% frekvens (f) S =,8 S =,51 CV = 8,1% M1, slide 8 (Statistiske grundbegreber: Mål for fordelingers spredning Tjekliste, Modul 1 (uge ): Hvad er statistik? Observationsenhed, stikprøve, population Repræsentativitet, uafhængighed af observationer Stokastisk variabel, udfaldsrum Nominal-, ordinal-, interval- og ratioskala Diskrete eller kontinuerte variable Pindediagram, histogram Afledt variabel Induktiv (deskriptiv) og deduktiv (hypotesetestende) statistik middelværdi, gennemsnit, median, modus, fraktil varians, standardafvigelse, variationscoefficient kvadratsum ( Sum-of-squares, SS ) frihedsgrader M1, slide 9 (Statistiske grundbegreber: Tjekliste 3

M1, slide 4 (Introduktion til kurset: praktiske oplysninger) M1, slide 5 (Introduktion til kurset: praktiske oplysninger)

M1, slide 4 (Introduktion til kurset: praktiske oplysninger) M1, slide 5 (Introduktion til kurset: praktiske oplysninger) Matematik/Statistik statistik Forelæser og ansvarlig for kursets statistikdel: Peter Sunde Afd. f. Populationsbiologi PSunde@bi.ku.dk Statistik - 9 dobbeltforelæsninger (uge -) ugentlige øvelsestimer (sammen

Læs mere

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala 3 5% 5% 5% 0 3 4 5 6 7 8 9 0 Statistik for biologer 005-6, modul 5: Normalfordelingen opstår når mange forskellige faktorer uafhængigt af hinanden bidrager med additiv variation til. F.eks. Højde af rekrutter

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning

Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning Side 1 af 6 Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning Litteratur: Kenneth Hansen & Charlotte Koldsø: Statistik I økonomisk perspektiv, Hans Reitzels Forlag 2012, 2. udgave,

Læs mere

Løsning til eksaminen d. 29. maj 2009

Løsning til eksaminen d. 29. maj 2009 DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Kapitel 3 Centraltendens og spredning

Kapitel 3 Centraltendens og spredning Kapitel 3 Centraltendens og spredning Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 25 Indledning I kapitel 2 omsatte vi de rå data til en tabel, der bedre viste materialets fordeling

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Fagplan for statistik, efteråret 2015

Fagplan for statistik, efteråret 2015 Side 1 af 7 M Fagplan for statistik, efteråret 20 Litteratur Kenneth Hansen & Charlotte Koldsø (HK): Statistik I økonomisk perspektiv, Hans Reitzels Forlag 2012, 2. udgave, ISBN 9788741256047 HypoStat

Læs mere

Statistik vejledende læreplan og læringsmål, efteråret 2013 SmartLearning

Statistik vejledende læreplan og læringsmål, efteråret 2013 SmartLearning Side 1 af 6 Statistik vejledende læreplan og læringsmål, efteråret 2013 SmartLearning Litteratur: Kenneth Hansen & Charlotte Koldsø: Statistik I økonomisk perspektiv, Hans Reitzels Forlag 2012, 2. udgave,

Læs mere

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 13: Summary Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Introduktion Kasper K. Berthelsen, Inst f. Matematiske Fag Omfang: 8 Kursusgang I fremtiden

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Ikke-parametriske tests

Ikke-parametriske tests Ikke-parametriske tests 2 Dagens menu t testen Hvordan var det nu lige det var? Wilcoxson Mann Whitney U Kruskall Wallis Friedman Kendalls og Spearmans correlation 3 t-testen Patient Drug Placebo difference

Læs mere

Normalfordelingen og Stikprøvefordelinger

Normalfordelingen og Stikprøvefordelinger Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger

Læs mere

Statistik. Introduktion Deskriptiv statistik Sandsynslighedregning

Statistik. Introduktion Deskriptiv statistik Sandsynslighedregning Statistik Introduktion Deskriptiv statistik Sandsynslighedregning Introduktion Kasper K. Berthelsen, Institut f. Mat. Fag 8 Kursusgange Individuel mundtlig eksamen (7-skala) Udgangspunkt i opgaver Software:

Læs mere

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Introduktion Kursusholder: Kasper K. Berthelsen Opbygning: Kurset består af 5 blokke En blok består af: To normale

Læs mere

Kapitel 1 Statistiske grundbegreber

Kapitel 1 Statistiske grundbegreber Kapitel 1 Statistiske grundbegreber Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 Indledning 2 Population versus stikprøve 3 Variabeltyper og måleskalaer 4 Parametrisk versus ikke-parametrisk

Læs mere

Forelæsning 11: Kapitel 11: Regressionsanalyse

Forelæsning 11: Kapitel 11: Regressionsanalyse Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/ Program: 1. Repetition af vigtige sandsynlighedsfordelinger: binomial, (Poisson,) normal (og χ 2 ). 2. Populationer og stikprøver 3. Opsummering af data vha. deskriptive størrelser og grafer. 1/29 Binomial

Læs mere

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske

Læs mere

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

Indblik i statistik - for samfundsvidenskab

Indblik i statistik - for samfundsvidenskab Indblik i statistik - for samfundsvidenskab Læs mere om nye titler fra Academica på www.academica.dk Nikolaj Malchow-Møller og Allan H. Würtz Indblik i statistik for samfundsvidenskab Academica Indblik

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Stikprøver og stikprøve fordelinger Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Statistik Statistisk Inferens: Prediktere og forekaste værdier af

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen

Læs mere

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Introduktion 1 Formelt Lærere: Esben Budtz-Jørgensen Jørgen Holm Petersen Øvelseslærere: Berivan+Kathrine, Amalie+Annabell Databehandling: SPSS

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Undervisningsbeskrivelse

Undervisningsbeskrivelse Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin aug-juni 10/11 Institution Campus Vejle Handelsgymnasie Uddannelse Fag og niveau Lærer(e) Hold HHX Statistik

Læs mere

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet Eksamen ved Københavns Universitet i Kvantitative forskningsmetoder Det Samfundsvidenskabelige Fakultet 14. december 2011 Eksamensnummer: 5 14. december 2011 Side 1 af 6 1) Af boxplottet kan man aflæse,

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan

Læs mere

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Kvantitative Metoder 1 - Forår 2007. Dagens program

Kvantitative Metoder 1 - Forår 2007. Dagens program Dagens program Kapitel 7 Introduktion til statistik Organisering af data Diskrete variabler Kontinuerte variabler Beskrivende statistik Fraktiler Gennemsnit Empirisk varians og spredning Empirisk korrelationkoe

Læs mere

1 Regressionsproblemet 2

1 Regressionsproblemet 2 Indhold 1 Regressionsproblemet 2 2 Simpel lineær regression 3 2.1 Mindste kvadraters tilpasning.............................. 3 2.2 Prædiktion og residualer................................. 5 2.3 Estimation

Læs mere

Produkt og marked - matematiske og statistiske metoder

Produkt og marked - matematiske og statistiske metoder Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring

Læs mere

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3

Læs mere

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Program 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Fordeling af X Stikprøve X 1,X 2,...,X n stokastisk X stokastisk. Ex (normalfordelt stikprøve)

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Kursus 242 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik Bygning 35/324 Danmarks Tekniske Universitet 28 Lyngby Danmark e-mail:

Læs mere

Module 1: Data og Statistik

Module 1: Data og Statistik Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen og Hans Chr. Petersen Module 1: Data og Statistik 1.1 Hvad er statistik?................................... 1 1.2 Datatyper.......................................

Læs mere

Forelæsning 1: Intro og beskrivende statistik

Forelæsning 1: Intro og beskrivende statistik Kursus 02402 Introduktion til Statistik Forelæsning 1: Intro og beskrivende statistik Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby

Læs mere

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j Hypoteser om mere end to stikprøver ANOVA k stikprøver: (ikke ordinale eller højere) H 0 : 1 2... k gælder også for k 2! H 0ij : i j H 0ij : i j simpelt forslag: k k 1 2 t-tests: i j DUER IKKE! Bonferroni!!

Læs mere

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test Ikkeparametriske metoder Repetition Wilcoxon SignedRank Test KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se Epidemiologi og biostatistik. Uge, torsdag 5. februar 00 Morten Frydenberg, Institut for Biostatistik. Type og type fejl Statistisk styrke Nogle speciale metoder: Normalfordelte data : t-test eksakte sikkerhedsintervaller

Læs mere

Forsøgsplanlægning Stikprøvestørrelse

Forsøgsplanlægning Stikprøvestørrelse Basal statistik Esben Budtz-Jørgensen 6. november 2007 Forsøgsplanlægning Stikprøvestørrelse 1 41 Planlægning af et studie Videnskabelig hypotese Endpoints Instrumentelle/eksponerings variable Variationskilder

Læs mere

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Kursus 02402 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Forelæsning 2: Kapitel 4, Diskrete fordelinger

Forelæsning 2: Kapitel 4, Diskrete fordelinger Kursus 02402 Introduktion til Statistik Forelæsning 2: Kapitel 4, Diskrete fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable Kursus 02402 Introduktion til Statistik Forelæsning 2: Kapitel 4, Diskrete fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05 Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet

Læs mere

Mikro-kursus i statistik 1. del. 24-11-2002 Mikrokursus i biostatistik 1

Mikro-kursus i statistik 1. del. 24-11-2002 Mikrokursus i biostatistik 1 Mikro-kursus i statistik 1. del 24-11-2002 Mikrokursus i biostatistik 1 Hvad er statistik? Det systematiske studium af tilfældighedernes spil!dyrkes af biostatistikere Anvendes som redskab til vurdering

Læs mere

Oversigt. Kursus 02402 Introduktion til Statistik. Forelæsning 1: Intro og beskrivende statistik. Per Bruun Brockhoff. Praktisk Information

Oversigt. Kursus 02402 Introduktion til Statistik. Forelæsning 1: Intro og beskrivende statistik. Per Bruun Brockhoff. Praktisk Information Kursus 02402 Forelæsning 1: Intro og beskrivende statistik Oversigt 1 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 Indledning 2 Ensidet variansanalyse 3 Blokforsøg 4 Vekselvirkning 1 Indledning 2 Ensidet

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af

Læs mere

Kapitel 3 Centraltendens og spredning

Kapitel 3 Centraltendens og spredning Kapitel 3 Centraltendens og spredning Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 Indledning 2 Centraltendens 3 Spredning 4 Praktisk beregning 5 Fraktiler 6 Opsamling 1 Indledning

Læs mere

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning 1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion

Læs mere

Statistik. Hjemmeside: kkb. Statistik - lektion 1 p.1/22

Statistik. Hjemmeside:  kkb. Statistik - lektion 1 p.1/22 Statistik Kursets omfang: 2 ECTS Inklusiv mini-projekt! Bog: Complete Business Statistics, AD Aczel & J. Sounderpandian Software: SPSS eller Excel?? Forelæser: Kasper K. Berthelsen E-mail: kkb@math.aau.dk

Læs mere

4 Oversigt over kapitel 4

4 Oversigt over kapitel 4 IMM, 2002-09-14 Poul Thyregod 4 Oversigt over kapitel 4 Introduktion Hidtil har vi beskæftiget os med data. Når data repræsenterer gentagne observationer (i bred forstand) af et fænomen, kan det være bekvemt

Læs mere

To-sidet varians analyse

To-sidet varians analyse To-sidet varians analyse Repetition En-sidet ANOVA Parvise sammenligninger, Tukey s test Model begrebet To-sidet ANOVA Tre-sidet ANOVA Blok design SPSS ANOVA - definition ANOVA (ANalysis Of VAriance),

Læs mere

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau... Indhold 1 Statistisk inferens: Hypotese og test 2 1.1 Nulhypotese - alternativ.................................. 2 1.2 Teststatistik........................................ 3 1.3 P-værdi..........................................

Læs mere

VIGTIGT! Kurset består af: 1. Forelæsninger. 2. Øvelser. 3. Litteraturlæsning

VIGTIGT! Kurset består af: 1. Forelæsninger. 2. Øvelser. 3. Litteraturlæsning Intro til statistik Rasmus F. Brøndum, Institut 17 (Matematik) Hjemmeside: people.math.aau.dk/~froberg 22 forelæsninger (hvor af jeg afholder de første 13) + det samme antal øvelsesgange. Hjælpelærer:

Læs mere

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =

Læs mere

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange

Læs mere

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M. Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet March 1, 2013 Sandsynlighedsregning og lagerstyring Normalfordelingen

Læs mere

Estimation og usikkerhed

Estimation og usikkerhed Estimation og usikkerhed = estimat af en eller anden ukendt størrelse, τ. ypiske ukendte størrelser Sandsynligheder eoretisk middelværdi eoretisk varians Parametre i statistiske modeller 1 Krav til gode

Læs mere

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau Hvad skal vi lave? 1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ. Teststatistik P-værdi Signifikansniveau 2 t-test for middelværdi Tosidet t-test for middelværdi Ensidet t-test for middelværdi

Læs mere

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse Basal statistik Esben Budtz-Jørgensen 4. november 2008 Forsøgsplanlægning Stikprøvestørrelse 1 46 Planlægning af et studie Videnskabelig hypotese Endpoints Instrumentelle/eksponerings variable Variationskilder

Læs mere

Statistik Lektion 2. Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var.

Statistik Lektion 2. Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var. Statistik Lektion Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var. Repetition Stikprøve Stikprøvestørrelse n Stikprøvemiddelværdi Stikprøvevarians s Population

Læs mere

Løsning til eksamen d.27 Maj 2010

Løsning til eksamen d.27 Maj 2010 DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1

Læs mere

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger Program Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Analyse af ikke-parrede stikprøver: repetition of rettelse af fejl! Lidt

Læs mere

Kapitel 10 Simpel korrelation

Kapitel 10 Simpel korrelation Kapitel 10 Simpel korrelation Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 Indledning 2 Pearsons r 3 Spearmans ρ 1 Indledning 2 Pearsons r 3 Spearmans ρ Indledning Korrelation

Læs mere

Kapitel 7 Forskelle mellem centraltendenser

Kapitel 7 Forskelle mellem centraltendenser Kapitel 7 Forskelle mellem centraltendenser Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 29 Indledning 1. z-test for ukorrelerede data 2. t-test for ukorrelerede data med ens

Læs mere

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9 Indhold 1 Ensidet variansanalyse 2 1.1 Estimation af middelværdier............................... 3 1.2 Estimation af standardafvigelse............................. 3 1.3 F-test for ens middelværdier...............................

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Introduktion 1 Formelt Lærer: Jørgen Holm Petersen Øvelseslærere: Amalie og Marie Databehandling: SPSS Eksamen: Ugeopgave efterfulgt af mundtlig

Læs mere

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens Oversigt Oversigt over emner 1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens 2 Konfidensinterval Konfidensinterval for andel Konfidensinterval - normalfordelt stikprøve

Læs mere

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen Landmålingens fejlteori Lektion Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet En stokastisk variabel er en variabel,

Læs mere

Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller

Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller Statistik II 1. Lektion Sandsynlighedsregning Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller

Læs mere

Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Dagens tema: Indfør centrale statistiske begreber. Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i

Læs mere

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2

Læs mere

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke

Læs mere

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Lineær regression. Simpel regression. Model. ofte bruges følgende notation: Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til

Læs mere

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Statistik noter - Efterår 2009 Keller - Statistics for management and economics

Statistik noter - Efterår 2009 Keller - Statistics for management and economics Statistik noter - Efterår 2009 Keller - Statistics for management and economics Jonas Sveistrup Hansen - stud.merc.it 22. september 2009 1 Indhold 1 Begrebsliste 3 2 Forelæsning 1 - kap. 1-3 3 2.1 Kelvin

Læs mere

Kapitel 11 Lineær regression

Kapitel 11 Lineær regression Kapitel 11 Lineær regression Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 1 Indledning Vi modellerer en afhængig variabel (responset) på baggrund af en uafhængig variabel (stimulus),

Læs mere

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Anvendt Statistik Lektion 7. Simpel Lineær Regression Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot

Læs mere

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable Landmålingens fejlteori - lidt om kurset Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet Kursusholder

Læs mere

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større

Læs mere

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Introduktion Kasper K. Berthelsen, Inst f. Matematiske Fag Omfang: 8 Kursusgang I fremtiden

Læs mere

Beskrivende statistik

Beskrivende statistik Beskrivende statistik Stikprøve af størrelse n for variablen x: x 1, x 2,, x n Beskriv fordelingen af data med nogle få talstørrelser. Centralt mål: en værdi som data er centreret om. Variationsmål: mål

Læs mere

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller

Læs mere

Definition. Definitioner

Definition. Definitioner Definition Landmålingens fejlteori Lektion Diskrete stokastiske variable En reel funktion defineret på et udfaldsrum (med sandsynlighedsfordeling) kaldes en stokastisk variabel. - kkb@math.aau.dk http://people.math.aau.dk/

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Uafhængighedstestet Eksempel: Bissau data Data kommer fra Guinea-Bissau i Vestafrika: 5273 børn blev undersøgt da de var yngre end 7 mdr og blev

Læs mere

1 Sandsynlighed Sandsynlighedsbegrebet Definitioner Diskret fordeling Betinget sandsynlighed og uafhængighed...

1 Sandsynlighed Sandsynlighedsbegrebet Definitioner Diskret fordeling Betinget sandsynlighed og uafhængighed... Indhold 1 Sandsynlighed 1 1.1 Sandsynlighedsbegrebet................................. 1 1.2 Definitioner........................................ 2 1.3 Diskret fordeling.....................................

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π

Læs mere

Opgaver til kapitel 3

Opgaver til kapitel 3 Opgaver til kapitel 3 3.1 En løber er interesseret i at undersøge om hendes løbeur er kalibreret korrekt. Hun udmåler derfor en strækning på præcis 1000 m og løber den 16 gange. For hver løbetur noterer

Læs mere

Epidemiologi og Biostatistik

Epidemiologi og Biostatistik Kapitel 1, Kliniske målinger Epidemiologi og Biostatistik Introduktion til skilder (varianskomponenter) måleusikkerhed sammenligning af målemetoder Mogens Erlandsen, Institut for Biostatistik Uge, torsdag

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 14. december 2009 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere