Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Introduktion 1
Formelt Lærere: Esben Budtz-Jørgensen Jørgen Holm Petersen Øvelseslærere: Berivan+Kathrine, Amalie+Annabell Databehandling: SPSS Eksamen: Ugeopgave efterfulgt af mundtlig eksamination. 12-skalaen Lærebøger: Statistisk problemløsning. Præmisser, teknik og analyse af Svend Kreiner SPSS. Introduktion til databehandling & statistisk analyse af Tine Nielsen og Svend Kreiner Hjemmeside: Absalon: 3934-E16;Introduktion til statistik 2
Kursets formål Fagets mål er at give introduktion til elementære statistiske metoder omfattende deskriptive metoder, vurdering af usikkerhed ved statistiske beregninger samt statistisk afprøvning af hypoteser. Fokus er på enkle metoder til analyse af primært tælledata og i et begrænset omfang kontinuerte data med særligt henblik på anvendelser i folkesundhedsvidenskab. Faget omfatter anvendelsen af marginale analyser, stratificerede analyser til kontrol for konfounding og effekt-modifikation, samt den logistiske regressionsmodel. Efter kurset forventes den studerende at være rustet til at læse og vurdere forskning inden for folkesundhedsvidenskab, hvor undersøgelserne er gennemført med en af de ovenfor nævnte metoder. Desuden forventes den studerende at kunne formulere et enkelt folkesundhedsvidenskabeligt spørgsmål som et statistisk problem, samt kunne gennemføre de ovenfor nævnte statistiske analyser 3
til at belyse problemstillingen. 4
Kursets formål Den studerende skal for at opnå karakteren 12 med udgangspunkt i pensum kunne: redegøre for og anvende centrale begreber indenfor sandsynlighedsregning og statistik formulere et folkesundhedsvidenskabeligt spørgsmål som et statistisk problem diskutere de statistiske metoders og modellers forudsætninger og anvendelighed under forskellige omstændigheder karakterisere stikprøvens funktion i forhold til estimation af en parameter og usikkerheden på estimatet gøre rede for og gennemføre de statistiske analyser, teste de formulerede folkesundhedsvidenskabelige hypoteser og fortolke resultaterne. 5
Kursets formål Den studerende skal for at opnå karakteren 12 med udgangspunkt i pensum kunne: inddrage overvejelser omkring statistiske fejl og disses konsekvenser i forskellige sammenhænge sammenholde forskellige modellers resultater til en samlet sammenhængende konklusion udforme en klart disponeret og sprogligt konsistens synopsis med en sprogbrug der er i overensstemmelse med fagets terminologi kunne oversætte statistiske analyseresultater til lægmandssprog 6
Statistiske metodefejl Forkert formuleret statistisk problem Forkert valg af statistisk metode til at løse problemet Forkert brug af statistiske programmer Manglende forståelse af resultaterne Statistiske uheld på grund af statistisk usikkerhed For at undgå metodefejl er det nødvendigt, at man både forstår baggrunden - præmisserne - for det, der sker i løbet af en statistisk analyse, og for den statistiske teknik, der anvendes. 7
Eksamen En 1 uges opgave med efterfølgende mundtlig eksamen på 20 minuter Opgaven udleveres i slutningen af semestret, hvorefter de studerende afleverer en synopsis på 5-10 sider, der kan danne udgangspunkt for eksaminationen. Synopsen kan afleveres gruppevis (1-3 per gruppe), men eksaminationen vil være enkeltvis De studerende vil blive orienteret om i retningslinierne for en synopsis under kurset 8
Udbytte for de studerende: kunne kritisk vurdere udsagn med brug af statistik selv lave enkle analyser bidrag til projektdelen mere statistik på kandidatstudiet 9
Fra ide til afklaring Et (potentielt) folkesundhedsproblem identificeres Planlægning af undersøgelse - Hvilke oplysninger? Hvem? Hvordan? Data-indsamling Data-analyse - Hvad fortæller data om problemet? Formidling af resultaterne - Hvad er lavet - og hvorfor? Konklusioner? Forbehold? 10
Statistik Handler om at drage konklusioner om Det virkelige liv ud fra Data Ofte: Tabeller og figurer der opsummerer aspekter af virkeligheden Her : Metoder til analyse af oplysninger (data) mhp at uddrage relevant information om en problemstilling Elementer : Induktion, data-reduktion, variation 11
1. Fødsler i Østtyskland før og efter 1989 (Aalen, Figur 1.3, side 19) 12
2. Københavnernes sundhed 1996 (Figur 18-19, side 27) 13
3. Flour i drikkevandet (Aalen, Figur 2.6, side 39) 14
4. Dødelighed i Norge og i Tanzania (Aalen, Figur 1.2, side 18) 15
Variation Ved gentagen dataindsamling - hvad forventer man da at observere? person variation ( inter-individuel ), f.eks. i fødselsvægt: systematisk variation tilfældig variation, inkl. målefejl og observatør variation dag til dag variation ( intra-individuel ), f.eks. blodtryk stikprøve variation, f.eks. Kbh.undersøgelse, valg 16
Datatyper: kvantitative data - måledata fødselsvægt blodtryk kategoriske data - tælledata død: ja/nej fysisk aktivitet i 4 kategorier (levetider) 17
Statistisk Metode Ud fra en stikprøve ( sample ) 1. beskrives variationen i en population 2. drages konklusioner om ukendte størrelser ( parametre ) i populationen. 1. deskriptiv statistik 2. statistisk inferens Nøgleord: beregninger, data reduktion data præsentation, statistisk model Redskaber: matematik - specielt sandsynlighedsregning EDB, grafik Vigtigst: sund fornuft! 18
Deskriptiv statistik Metoder: tabeller (absolutte, relative hyppigheder) tegninger (histogram, scatterplot ) stikprøvestørrelser summary statistics positionsmål: gennemsnit, median, percentiler variationsmål: standard afvigelse, variationsbredde ( range ) korrelationsmål 19
Brød-konsumering (Altman, Tabel 3.6, side 43) 20
Brød-konsumering 21
Brød-konsumering 22
Brød-konsumering 23
Normalfordeling Den vigtigste fordeling i statistik 24
Normalfordeling nogle gange er målte størrelser normalfordelte 25
Normalfordeling De fleste gange er de ikke Fordeling af svarene på spørgsmålet om den generelle tilfredshed med livet. Kurven svarer til en normalfordeling med samme middelværdi og spredning som i fordelingen af tilfredsheden 26
Normalfordeling Den centrale grænseværdisætning Fordeling af den gennemsnitlige tilfredshed i 220 tilfældigt udvalgte grupper på 10 personer. Kurven svarer til en normalfordeling med samme middelværdi og spredning som i fordelingen af tilfredsheden 27
Selvstudium Histogram, scatterplot positionsmål: gennemsnit, median variationsmål: standardafvigelse (varians), percentiler Box-plot Lav matematik-quiz på Absalon 28