Kapitel 1 Statistiske grundbegreber

Relaterede dokumenter
Kapitel 7 Forskelle mellem centraltendenser

Kapitel 3 Centraltendens og spredning

Kapitel 8 Chi-i-anden (χ 2 ) prøven

Kapitel 3 Centraltendens og spredning

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse

Kapitel 10 Simpel korrelation

Kapitel 13 Reliabilitet og enighed

Statistiske data. Datamatricen. Variable j. ... X ij = x ij... Anonymiserede og ækvivalente dataindivider. Datamodellen

Module 1: Data og Statistik

Kapitel 2 Frekvensfordelinger

Kapitel 4 Sandsynlighed og statistiske modeller

Kapitel 4 Sandsynlighed og statistiske modeller

Kønsproportion og familiemønstre.

Kapitel 11 Lineær regression

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Normalfordelingen og Stikprøvefordelinger

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion

MPH specialmodul Epidemiologi og Biostatistik

Indblik i statistik - for samfundsvidenskab

02402 Løsning til testquiz02402f (Test VI)

Velkommen til kurset. Teoretisk Statistik. Lærer: Niels-Erik Jensen

Forelæsning 2: Kapitel 4, Diskrete fordelinger

Kvantitative metoder 2

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable

Matematik/Statistik. statistik. Forelæser og ansvarlig for kursets statistikdel: Peter Sunde Afd. f. Populationsbiologi

Behandling af kvantitative data

Konfidensintervaller og Hypotesetest

Kvantitative Metoder 1 - Forår 2007

Module 4: Ensidig variansanalyse

Kvantitative Metoder 1 - Forår Dagens program

Kvantitative metoder 2

a) Har måleresultaterne for de 2 laboranter samme varians? b) Tyder resultaterne på, at nogen af laboranterne måler med en systematisk fejl?

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Opgaver til kapitel 3

M1, slide 4 (Introduktion til kurset: praktiske oplysninger) M1, slide 5 (Introduktion til kurset: praktiske oplysninger)

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

University of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion

Program dag 2 (11. april 2011)

Studieplan Biostatistik Semester 2

Susanne Ditlevsen Institut for Matematiske Fag susanne

Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1)

Test nr. 6 af centrale elementer 02402

Eks. 1: Kontinuert variabel som i princippet kan måles med uendelig præcision. tid, vægt,

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Statistik II 1. Lektion. Analyse af kontingenstabeller

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

Teoretisk Statistik, 2. december Sammenligning af poissonfordelinger

Studieplan Biostatistik Semester 3

Mikro-kursus i statistik 1. del Mikrokursus i biostatistik 1

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion

2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900.

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Følgende tabel (fra Fisher) giver forøgelsen af sovetiden i timer fra et eksperiment med 10 patienter vedrørende 2 sovemidler A og B.

Oversigt. Kursus Introduktion til Statistik. Forelæsning 10: Statistik ved hjælp af simulering. Per Bruun Brockhoff.

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

2 Populationer. 2.1 Virkelige populationer

HVAD er metodelære? HVAD er metode? HVAD er metode? HVORFOR metodelære? Strukturering. Strukturering og måleskalaer.

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

Undervisningsbeskrivelse

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Regressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer.

Amager Privatskole, klassetrin 2018 TRIVSELSMÅLING FOR AMAGER PRIVATSKOLE. 2017/18 SKOLERAPPORT klassetrin Tårnby Kommune

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test.

-UDDANNELSE KURSUSBESKRIVELSE. Diploma HD 1. del

Reproducerbarheden og normale værdier for en ny dynamisk tredimensionel undersøgelsesmodel til vurdering af columnas kinematik under gang hos børn.

Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning

Statistik noter - Efterår 2009 Keller - Statistics for management and economics

For nemheds skyld: m = 2, dvs. interesseret i fordeling af X 1 og X 2. Nemt at generalisere til vilkårligt m.

HVAD er metodelære? Strukturering. Dagens program:

Oversigt. Kursus Introduktion til Statistik. Forelæsning 1: Intro og beskrivende statistik. Per Bruun Brockhoff. Praktisk Information

Forelæsning 1: Intro og beskrivende statistik

Fagplan for statistik, efteråret 2015

C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b2.

Introduktion til Beregneren og arbejde med progression i DNT Vejen kommune, Brørup, marts Jakob Wandall, NordicMetrics ApS

Kvantitative Metoder 1 - Forår Dagens program

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger

Tillæg til studieordningen for bacheloruddannelsen i Sundhedsteknologi

Schweynoch, Se eventuelt

DEN NATIONALE TRIVSELSMÅLING 2018/19 SKOLERAPPORT. Skødstrup Skole, klassetrin Aarhus Kommune

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Tema. Dagens tema: Indfør centrale statistiske begreber.

Opgavens formålet er at undersøge variationen mellem to laboratoriers bestemmelse af po 2 i blod.

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Epidemiologi og Biostatistik. Mogens Erlandsen, Institut for Biostatistik Uge 1, tirsdag d. 5. februar 2002

Transkript:

Kapitel 1 Statistiske grundbegreber Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011

1 Indledning 2 Population versus stikprøve 3 Variabeltyper og måleskalaer 4 Parametrisk versus ikke-parametrisk statistik

1 Indledning 2 Population versus stikprøve 3 Variabeltyper og måleskalaer 4 Parametrisk versus ikke-parametrisk statistik

Indledning Statistik bearbejder data systematisk Statistik giver reproducérbare resultater Statistik giver mulighed for at generalisere Statistik benyttes i videnskabelige artikler

Eksempel på indsamlede data Tabel 1.1 Opdigtede læsescores for 30 piger og 30 drenge i tredje klasse Køn Score drenge 55 46 32 54 60 77 49 43 64 32 24 44 59 79 89 19 21 48 57 52 35 68 55 88 69 38 49 79 24 48 piger 22 63 40 78 64 55 45 88 33 53 54 69 74 62 51 58 71 66 68 41 67 51 38 42 63 71 84 95 55 71

Læsescores (fortsat) Svært at få overblik og drage nogle (fornuftige) konklusioner Kan gruppere data i en tabel Frekvensfordeling (kapitel 2) Kan beskrive typisk værdi og variation Centraltendens og spredning (kapitel 3) Kan sammenligne stikprøvegennemsnit t-test (kapitel 7)

Læsescores (fortsat) Svært at få overblik og drage nogle (fornuftige) konklusioner Kan gruppere data i en tabel Frekvensfordeling (kapitel 2) Kan beskrive typisk værdi og variation Centraltendens og spredning (kapitel 3) Kan sammenligne stikprøvegennemsnit t-test (kapitel 7)

Læsescores (fortsat) Svært at få overblik og drage nogle (fornuftige) konklusioner Kan gruppere data i en tabel Frekvensfordeling (kapitel 2) Kan beskrive typisk værdi og variation Centraltendens og spredning (kapitel 3) Kan sammenligne stikprøvegennemsnit t-test (kapitel 7)

Læsescores (fortsat) Svært at få overblik og drage nogle (fornuftige) konklusioner Kan gruppere data i en tabel Frekvensfordeling (kapitel 2) Kan beskrive typisk værdi og variation Centraltendens og spredning (kapitel 3) Kan sammenligne stikprøvegennemsnit t-test (kapitel 7)

1 Indledning 2 Population versus stikprøve 3 Variabeltyper og måleskalaer 4 Parametrisk versus ikke-parametrisk statistik

Population versus stikprøve I de fleste undersøgelser vil vi generalisere til en population på bagggrund af undersøgelse af en stikprøve Kræver typisk at stikprøvens elementer er udtaget simpelt tilfældigt En population kan være endelig (finit) eller uendelig (infinit)

1 Indledning 2 Population versus stikprøve 3 Variabeltyper og måleskalaer 4 Parametrisk versus ikke-parametrisk statistik

Variabeltyper Afhængige og uafhængige variable Diskrete og kontinuerte variable

Måleskalaer Nominalskala Måler tilhørsforhold til ikke-ordnede kategorier (fx. køn og ordklasse) Ordinalskala Ordnet skala (fx. karakterer) hvor forskellen mellem 6 og 7 ikke kan sammelignes med forskellen mellem 7 og 8, eller hvor 10 ikke kan siges at repræsentere det dobbelte af 5 Intervalskala Ordnet og med sammenlignelige forskelle (fx. tidsskala eller temperatur målt i celcius), så spring af samme længde repræsenterer samme ændrig Ratioskala Har giver også forholdstal mening (længdemål eller temperatur målt i kelvin), så 10 er det dobbelte af 5

1 Indledning 2 Population versus stikprøve 3 Variabeltyper og måleskalaer 4 Parametrisk versus ikke-parametrisk statistik

Parametrisk versus ikke-parametrisk statistik Parametrisk Parametriske metoder er de klassiske metoder, der baseres på test af hypoteser om parametre i statistiske modeller bygger ofte på antagelser om fordelinger Non-parametrisk Er antagelserne ikke rimelige kan man ofte finde et non-parametrisk alternativ disse er dog ofte mindre følsomme