Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion

Relaterede dokumenter
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Estimation

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

1 Hb SS Hb Sβ Hb SC = , (s = )

Mikro-kursus i statistik 1. del Mikrokursus i biostatistik 1

Normalfordelingen og Stikprøvefordelinger

Fagplan for statistik, efteråret 2015

Estimation og usikkerhed

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Basal statistik. 30. januar 2007

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning

Forelæsning 1: Intro og beskrivende statistik

Konfidensintervaller og Hypotesetest

6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag)

Velkommen til kurset. Teoretisk Statistik. Lærer: Niels-Erik Jensen

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Statistisk Model

Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl i Kirkesalen, Studiestræde 38 Øvelser

Susanne Ditlevsen Institut for Matematiske Fag susanne

6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag)

Oversigt. Kursus Introduktion til Statistik. Forelæsning 1: Intro og beskrivende statistik. Per Bruun Brockhoff. Praktisk Information

Studieplan Biostatistik Semester 1

Statistik vejledende læreplan og læringsmål, efteråret 2013 SmartLearning

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Opgaver til kapitel 3

Epidemiologi og Biostatistik. Mogens Erlandsen, Institut for Biostatistik Uge 1, tirsdag d. 5. februar 2002

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

1 Regressionsproblemet 2

Forelæsning 9: Inferens for andele (kapitel 10)

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup)

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Statistiske modeller

Statistik. Introduktion Deskriptiv statistik Sandsynslighedregning

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Bilagsnotat til: De nationale tests måleegenskaber

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Kapitel 4 Sandsynlighed og statistiske modeller

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Basal statistik. 2. september 2008

Statistiske principper

Eksamen i Statistik og skalavalidering

Basal statistik. 29. januar 2008

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Kapitel 1 Statistiske grundbegreber

VIGTIGT! Kurset består af: 1. Forelæsninger. 2. Øvelser. 3. Litteraturlæsning

Module 1: Data og Statistik

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Statistik kommandoer i Stata opdateret 22/ Erik Parner

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

a) Har måleresultaterne for de 2 laboranter samme varians? b) Tyder resultaterne på, at nogen af laboranterne måler med en systematisk fejl?

Kursets hjemmeside:

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger


Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium

Vejledende besvarelser til opgaver i kapitel 14

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Løsninger til kapitel 1

Økonometri 1. Inferens i den lineære regressionsmodel 25. september Økonometri 1: F6 1

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens

Indblik i statistik - for samfundsvidenskab

Forsøgsplanlægning Stikprøvestørrelse

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Undervisningsbeskrivelse

Kvantitative metoder 1

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

Kapitel 4 Sandsynlighed og statistiske modeller

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Kvantitative Metoder 1 - Forår Dagens program

Beskrivende statistik

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Statistik II 4. Lektion. Logistisk regression

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

Produkt og marked - matematiske og statistiske metoder

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Kvantitative Metoder 1 - Forår 2007

Modul 1: Beskrivende dataanalyse

Sommereksamen Bacheloruddannelsen i Medicin/Medicin med industriel specialisering

Undervisningsbeskrivelse

Dag 1: 1) Fra problemformulering til spørgeskema-tematikker; 2) Hvordan hører data sammen; 3) Overvejelser om datas egenskaber; 4) Hvad kan man

Undervisningsbeskrivelse

LÆRERVEJLEDNING. Fattigdom og ulighed

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test.

Øvelse 2. SPSS og sandsynlighedsregning

FAQ - Ofte stillede spørgsmål om synopsis og eksamen i faget Analyse af regnskabsdata

Transkript:

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Introduktion 1

Formelt Lærere: Esben Budtz-Jørgensen Jørgen Holm Petersen Øvelseslærere: Berivan+Kathrine, Amalie+Annabell Databehandling: SPSS Eksamen: Ugeopgave efterfulgt af mundtlig eksamination. 12-skalaen Lærebøger: Statistisk problemløsning. Præmisser, teknik og analyse af Svend Kreiner SPSS. Introduktion til databehandling & statistisk analyse af Tine Nielsen og Svend Kreiner Hjemmeside: Absalon: 3934-E16;Introduktion til statistik 2

Kursets formål Fagets mål er at give introduktion til elementære statistiske metoder omfattende deskriptive metoder, vurdering af usikkerhed ved statistiske beregninger samt statistisk afprøvning af hypoteser. Fokus er på enkle metoder til analyse af primært tælledata og i et begrænset omfang kontinuerte data med særligt henblik på anvendelser i folkesundhedsvidenskab. Faget omfatter anvendelsen af marginale analyser, stratificerede analyser til kontrol for konfounding og effekt-modifikation, samt den logistiske regressionsmodel. Efter kurset forventes den studerende at være rustet til at læse og vurdere forskning inden for folkesundhedsvidenskab, hvor undersøgelserne er gennemført med en af de ovenfor nævnte metoder. Desuden forventes den studerende at kunne formulere et enkelt folkesundhedsvidenskabeligt spørgsmål som et statistisk problem, samt kunne gennemføre de ovenfor nævnte statistiske analyser 3

til at belyse problemstillingen. 4

Kursets formål Den studerende skal for at opnå karakteren 12 med udgangspunkt i pensum kunne: redegøre for og anvende centrale begreber indenfor sandsynlighedsregning og statistik formulere et folkesundhedsvidenskabeligt spørgsmål som et statistisk problem diskutere de statistiske metoders og modellers forudsætninger og anvendelighed under forskellige omstændigheder karakterisere stikprøvens funktion i forhold til estimation af en parameter og usikkerheden på estimatet gøre rede for og gennemføre de statistiske analyser, teste de formulerede folkesundhedsvidenskabelige hypoteser og fortolke resultaterne. 5

Kursets formål Den studerende skal for at opnå karakteren 12 med udgangspunkt i pensum kunne: inddrage overvejelser omkring statistiske fejl og disses konsekvenser i forskellige sammenhænge sammenholde forskellige modellers resultater til en samlet sammenhængende konklusion udforme en klart disponeret og sprogligt konsistens synopsis med en sprogbrug der er i overensstemmelse med fagets terminologi kunne oversætte statistiske analyseresultater til lægmandssprog 6

Statistiske metodefejl Forkert formuleret statistisk problem Forkert valg af statistisk metode til at løse problemet Forkert brug af statistiske programmer Manglende forståelse af resultaterne Statistiske uheld på grund af statistisk usikkerhed For at undgå metodefejl er det nødvendigt, at man både forstår baggrunden - præmisserne - for det, der sker i løbet af en statistisk analyse, og for den statistiske teknik, der anvendes. 7

Eksamen En 1 uges opgave med efterfølgende mundtlig eksamen på 20 minuter Opgaven udleveres i slutningen af semestret, hvorefter de studerende afleverer en synopsis på 5-10 sider, der kan danne udgangspunkt for eksaminationen. Synopsen kan afleveres gruppevis (1-3 per gruppe), men eksaminationen vil være enkeltvis De studerende vil blive orienteret om i retningslinierne for en synopsis under kurset 8

Udbytte for de studerende: kunne kritisk vurdere udsagn med brug af statistik selv lave enkle analyser bidrag til projektdelen mere statistik på kandidatstudiet 9

Fra ide til afklaring Et (potentielt) folkesundhedsproblem identificeres Planlægning af undersøgelse - Hvilke oplysninger? Hvem? Hvordan? Data-indsamling Data-analyse - Hvad fortæller data om problemet? Formidling af resultaterne - Hvad er lavet - og hvorfor? Konklusioner? Forbehold? 10

Statistik Handler om at drage konklusioner om Det virkelige liv ud fra Data Ofte: Tabeller og figurer der opsummerer aspekter af virkeligheden Her : Metoder til analyse af oplysninger (data) mhp at uddrage relevant information om en problemstilling Elementer : Induktion, data-reduktion, variation 11

1. Fødsler i Østtyskland før og efter 1989 (Aalen, Figur 1.3, side 19) 12

2. Københavnernes sundhed 1996 (Figur 18-19, side 27) 13

3. Flour i drikkevandet (Aalen, Figur 2.6, side 39) 14

4. Dødelighed i Norge og i Tanzania (Aalen, Figur 1.2, side 18) 15

Variation Ved gentagen dataindsamling - hvad forventer man da at observere? person variation ( inter-individuel ), f.eks. i fødselsvægt: systematisk variation tilfældig variation, inkl. målefejl og observatør variation dag til dag variation ( intra-individuel ), f.eks. blodtryk stikprøve variation, f.eks. Kbh.undersøgelse, valg 16

Datatyper: kvantitative data - måledata fødselsvægt blodtryk kategoriske data - tælledata død: ja/nej fysisk aktivitet i 4 kategorier (levetider) 17

Statistisk Metode Ud fra en stikprøve ( sample ) 1. beskrives variationen i en population 2. drages konklusioner om ukendte størrelser ( parametre ) i populationen. 1. deskriptiv statistik 2. statistisk inferens Nøgleord: beregninger, data reduktion data præsentation, statistisk model Redskaber: matematik - specielt sandsynlighedsregning EDB, grafik Vigtigst: sund fornuft! 18

Deskriptiv statistik Metoder: tabeller (absolutte, relative hyppigheder) tegninger (histogram, scatterplot ) stikprøvestørrelser summary statistics positionsmål: gennemsnit, median, percentiler variationsmål: standard afvigelse, variationsbredde ( range ) korrelationsmål 19

Brød-konsumering (Altman, Tabel 3.6, side 43) 20

Brød-konsumering 21

Brød-konsumering 22

Brød-konsumering 23

Normalfordeling Den vigtigste fordeling i statistik 24

Normalfordeling nogle gange er målte størrelser normalfordelte 25

Normalfordeling De fleste gange er de ikke Fordeling af svarene på spørgsmålet om den generelle tilfredshed med livet. Kurven svarer til en normalfordeling med samme middelværdi og spredning som i fordelingen af tilfredsheden 26

Normalfordeling Den centrale grænseværdisætning Fordeling af den gennemsnitlige tilfredshed i 220 tilfældigt udvalgte grupper på 10 personer. Kurven svarer til en normalfordeling med samme middelværdi og spredning som i fordelingen af tilfredsheden 27

Selvstudium Histogram, scatterplot positionsmål: gennemsnit, median variationsmål: standardafvigelse (varians), percentiler Box-plot Lav matematik-quiz på Absalon 28