Forebyggelse og reparation - vægtning af data. Brian Larsen Thorsted

Størrelse: px
Starte visningen fra side:

Download "Forebyggelse og reparation - vægtning af data. Brian Larsen Thorsted"

Transkript

1 Forebyggelse og reparation - vægtning af data Brian Larsen Thorsted [email protected]

2 Indhold Usikkerhed i stikprøveundersøgelser Bortfald Estimation Regressionsestimator Reduktion af usikkerhed Repræsentativitet genskabes Konkluderende bemærkninger

3 Den perfekte verden In a perfect world a survey has no nonresponse. All selected elements cooperate and deliver all of the requested data, with no measurement error. In that perfect but non-existent world, a survey has only sampling error. Lundström og Särndal 2005, Estimation in Surveys with Nonresponse

4 Usikkerhed i stikprøver Kilder til usikkerhed: Tilfældig fejl stokastisk struktur i udvælgelse Systematisk fejl / bias målefejl bortfald/missing fejlsøgning opregning tabellering mm. Kun den tilfældige fejl kan kvantificeres Ønsker at minimere den tilfældige fejl og kontrollere den systematiske fejl Forebyggelse og reparation

5 Bortfald Fokus på bortfaldet Et problem hvis bortfaldet er skævt og korreleret med spørgeskemavariable resultatet er bias på estimaterne

6 Bortfald Eksempel (Särndal & Lundström 2005) Gennemsnitlig indkomst, M: Kr. Gennemsnitlig indkomst, K: Kr. Svarprocent, M: 50 pct. Svarprocent, K: 90 pct. kvinder er overrepræsenteret Gennemsnitlig indkomst er lavest for kvinder Total populationsindkomst underestimeres

7 Bortfald - Forskerbeskyttelse Månedlig udvikling i antal personer med forskerbeskyttelse jan-04 apr-04 jul-04 okt-04 jan-05 apr-05 jul-05 okt-05 jan-06 apr-06 jul-06 okt-06 jan-07 apr-07 jul-07 okt-07 jan-08 apr-08 jul-08 okt-08 jan-09 apr-09 jul-09 Månedlig vækst Antal personer Månedlig vækst Antal

8 Estimation Beregn en vægt for hver interviewperson Angiver hvor mange andre hver interviewperson repræsenterer Udgangspunkt er designvægten v = N n

9 Traditionel estimation Traditionel opregning deler baggrunds- og svarpopulation op i flerdimensional tabel Tabel dannes typisk på baggrund af køn, alder og geografi Der tages højde for skævt bortfald Fælles vægt til alle i samme celle Beregningsmæssigt ikke tungt Men demografiske faktorer forklarer typisk kun lille del af skævt bortfald stikprøvestørrelse er begrænsning

10 Regressionsestimat Modellerer Y vha. j hjælpevariable, X,,, i regressionsmodel 1 L X j y + + B x + k = B1 x1 k j jk e k B,, Koefficienterne bestemmes vha. mindste kvadraters metode 1 L Jo større R 2 jo større effektiv stikprøve B j

11 Regressionsestimat Populationstotalen estimeres da som tˆ greg y = tˆ = y i S + J N n j= 1 Bˆ j y i g i ( t x j tˆ x j ) Bemærk: Model assisted estimation!

12 Regressionsestimat, varians Variansen er Hvor n S n N N t V y greg y ) (ˆ ˆ = 1 1 ˆ ˆ = = = n e g n x B y g S S i i i S i J j ji j i i y

13 Regressionsestimator Regressionsestimat kan håndtere flere registervariable end traditionelt Forklaringskraft i registervariable udnyttes i opregning Motiveret af stigende bortfald og stigende krav til effektivitet

14 Regressionsestimator Traditionelle kategoriske variable (alder, køn, geografi) kan bruges I kombination med en eller flere andre variable Hovedvirkning dvs. ingen kombination!! Kategoriske og kontinuerte variable Repræsentativitet genskabes på en lang række registervariable Forskellige vægte

15 Reduktion af usikkerhed Arbejdskraftundersøgelsen bortfald 43 pct. Antal arbejdsløse (AKU) 2. kvt Metode Arbejdsløse Usikkerhed Relativ usikkerhed (CV) Direkte estimat / ,9 pct. Alder*køn*region / ,2 pct. Anvendt estimat / ,0 pct. Effektiv stikprøve forøges med 10 pct.

16 Repræsentativitet genskabes Population Simpel tilfældig stikprøve Stikprøve efter forskerbeskyttelse Svarstikprøven efter alt bortfald Vægte de svar Køn Mand Kvinde Aldersgruppe år år år år år år Uddannelse Grundskole Gymnasial og erhvervsfagliguddannelse Mellemlang videregående uddannelse Lang videregående uddannelse Pct.

17 Repræsentativitet genskabes Population Simpel tilfældig stikprøve Stikprøve efter forskerbeskyttelse Svarstikprøven efter alt bortfald Vægtede svar Pct. Socioøkonomisk status Selvstændig Lønmodtager Arbejdsløs Uddannelsessøgende Pensionist/Efterlønsmodtager Uden for arbejdsstyrken, børn, øvrige Gennemsnitlige familieindkomst kr kr kr kr over kr Flyttet Flyttet efter flytteblanket Ikke flyttet

18 Kontrol af estimation Estimation af kendt registerindkomst Metode Gennemsnit Spredning (Før skat i kr) Direkte estimat Køn*alder*region Anvendt estimat (uden indkomst) Register

19 Repræsentativitet genskabes Estimater er baseret på fordeling fra registre ikke fra svarene Kvalitetsløft Reduktion af bias

20 Reduktion af usikkerhed Ved korrelation med registervariable sænkes usikkerhed Kvalitetsløft Smallere konfidensintervaller Større effektiv stikprøve

21 Analyse Regressionsanalyser bør laves på vægtede svar Sikrer repræsentativitet og middelrette estimater Konservative signifikansniveauer skyldes empirisk varians fra før g 2 e 2 i i Sˆ 2 = i S y n 1

22 Konkluderende bemærkninger Forebyggelse/reparation nødvendig Muligt at genskabe repræsentativitet på en række parametre Samtidig med gevinst på effektiv stikprøve men (survey)-verden bliver ikke perfekt af den grund

Repræsentative undersøgelser før og nu. Peter Linde, Interviewservice [email protected]

Repræsentative undersøgelser før og nu. Peter Linde, Interviewservice pli@dst.dk Repræsentative undersøgelser før og nu Peter Linde, Interviewservice [email protected] >> >> Dagsorden Hvad er en repræsentativ undersøgelse? Bortfald og forskerbeskyttelse Vægtning for bortfald Effekt af vægtning

Læs mere

Repræsentative undersøgelser Non-response Vægte. Peter Linde, DST Survey

Repræsentative undersøgelser Non-response Vægte. Peter Linde, DST Survey Repræsentative undersøgelser Non-response Vægte Peter Linde, DST Survey [email protected] >> >> Dagsorden Hvad er en repræsentativ undersøgelse? Bortfaldes betydning for repræsentativitet Vægtning for bortfald

Læs mere

Forskerbeskyttelse i CPR 2008

Forskerbeskyttelse i CPR 2008 Danmarks Statistik, Metode 16. janaur 2008 Statistisk metode BNL Forskerbeskyttelse i CPR 2008 Antallet af personer med forskerbeskyttelse har siden år 2000 været kraftigt stigende, og det stiger fortsat.

Læs mere

Det gode håndværk eller simpel datafangst? Peter Linde [email protected] 8. juni 2009

Det gode håndværk eller simpel datafangst? Peter Linde pli@dst.dk 8. juni 2009 Det gode håndværk eller simpel datafangst? Peter Linde [email protected] 8. juni 2009 Tre udsagn Tal er tyranni Ikke alt der tæller kan tælles og ikke at der kan tælles tæller (Einstein) Man kan kun have tillid

Læs mere

UNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER

UNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER UNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER Undervisningseffekten udregnes som forskellen mellem den forventede og den faktiske karakter i 9. klasses afgangsprøve. Undervisningseffekten udregnes

Læs mere

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning 1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion

Læs mere

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse . september 5 Epidemiologi og biostatistik. Forelæsning Uge, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk Eksempel: Systolisk blodtryk Udgangspunkt: Vi ønsker at prædiktere det systoliske blodtryk hos en gruppe af personer. Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Afdeling for Biostatistik.

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser

Læs mere

Derfor skal livrenter. betydning privatøkonomien. Forsikring & Pension Analyserapport 2011:7. Ann-Kathrine Ejsing. Andreas Østergaard Nielsen

Derfor skal livrenter. betydning privatøkonomien. Forsikring & Pension Analyserapport 2011:7. Ann-Kathrine Ejsing. Andreas Østergaard Nielsen Analyserapport 2011:7 Derfor skal livrenter ikke Finansiel ind under forståelses 100.000 betydning kr. s for loftet privatøkonomien AnnKathrine Ejsing Andreas Østergaard Nielsen Philip Heymans Allé 1,

Læs mere

FINANSIEL FORSTÅELSE OG REGNEFÆRDIGHED

FINANSIEL FORSTÅELSE OG REGNEFÆRDIGHED FINANSIEL FORSTÅELSE OG REGNEFÆRDIGHED PENGE- OG PENSIONSPANELET OKTOBER 2016 METODE Undersøgelsen er baseret på en svensk undersøgelse fra Finansinspektionen fra 2014 1. Det er forsøgt at gøre den danske

Læs mere

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 13: Summary Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Forsikringssvindel. - hvem, hvordan og hvorfor. Forsikring & Pension Analyserapport 2011:9. Andreas Østergaard Nielsen

Forsikringssvindel. - hvem, hvordan og hvorfor. Forsikring & Pension Analyserapport 2011:9. Andreas Østergaard Nielsen - hvem, hvordan og Andreas Østergaard Nielsen Philip Heymans Allé 1, 2900 Hellerup, Telefon 41 91 91 91, www.forsikringogpension.dk Side 1 Indhold 1. Indledning og sammenfatning 4 2. Muligheder for at

Læs mere

Webpaneler: Rekruttering, stratificering & sampling

Webpaneler: Rekruttering, stratificering & sampling Webpaneler: Rekruttering, stratificering & sampling Klassiske udfordringer med online data-indsamling Bias introduceres i flere led: 1. Hvem er online? 2. Hvem kan rekrutteres? 3. Selv-selektion TP Taget

Læs mere

Økonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2

Økonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2 Økonometri 1 Den simple regressionsmodel 11. september 2006 Dagens program Den simple regressionsmodel SLR : Én forklarende variabel (Wooldridge kap. 2.1-2.4) Motivation for gennemgangen af SLR Definition

Læs mere

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier

Læs mere

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske

Læs mere

Dokumentation af interviewundersøgelser

Dokumentation af interviewundersøgelser Dokumentation af interviewundersøgelser Varedeklaration Opgave Kunde Delopgaver udført af: Population Stikprøve Dataindsamling Opregning Population Bruttostikprøve Nettostikprøve Antal svar Svarprocenter:

Læs mere

Forelæsning 11: Kapitel 11: Regressionsanalyse

Forelæsning 11: Kapitel 11: Regressionsanalyse Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala 3 5% 5% 5% 0 3 4 5 6 7 8 9 0 Statistik for biologer 005-6, modul 5: Normalfordelingen opstår når mange forskellige faktorer uafhængigt af hinanden bidrager med additiv variation til. F.eks. Højde af rekrutter

Læs mere

Problemstillinger omkring spørgeskemaundersøgelser blandt etniske minoriteter. Vibeke Jakobsen SFI Det Nationale Forskningscenter for Velfærd

Problemstillinger omkring spørgeskemaundersøgelser blandt etniske minoriteter. Vibeke Jakobsen SFI Det Nationale Forskningscenter for Velfærd Problemstillinger omkring spørgeskemaundersøgelser blandt etniske minoriteter Vibeke Jakobsen SFI Det Nationale Forskningscenter for Velfærd Er kvaliteten lavere i data indsamlet blandt etniske minoriteter

Læs mere

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05 Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Betydningen af konjunktur og regelændringer for udviklingen i sygedagpengemodtagere

Betydningen af konjunktur og regelændringer for udviklingen i sygedagpengemodtagere DET ØKONOMISKE RÅD S E K R E T A R I A T E T d. 20. maj 2005 SG Betydningen af konjunktur og regelændringer for udviklingen i sygedagpengemodtagere Baggrundsnotat vedr. Dansk Økonomi, forår 2005, kapitel

Læs mere

Kvalitetsmåling i statistik

Kvalitetsmåling i statistik Kvalitetsmåling i statistik Peter Linde. Survey and Methods. Statistics Denmark. [email protected] Opfyldelse af brugernes behov Over- eller undervurderer statistikken den faktiske udvikling, og hvor sikre er

Læs mere

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3

Læs mere

Stor stigning i gruppen af rige danske familier

Stor stigning i gruppen af rige danske familier Stor stigning i gruppen af rige danske familier Gruppen af rige danskere er steget markant siden 2004. Hovedparten af familierne består af to voksne i aldersgruppen 50-65 år uden hjemmeboende børn. Personer

Læs mere

Økonometri: Lektion 2 Multipel Lineær Regression 1/27

Økonometri: Lektion 2 Multipel Lineær Regression 1/27 Økonometri: Lektion 2 Multipel Lineær Regression 1/27 Multipel Lineær Regression Sidst så vi på simpel lineær regression, hvor y er forklaret af én variabel. Der er intet, der forhindre os i at have mere

Læs mere

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

To samhørende variable

To samhørende variable To samhørende variable Statistik er tal brugt som argumenter. - Leonard Louis Levinsen Antagatviharn observationspar x 1, y 1,, x n,y n. Betragt de to tilsvarende variable x og y. Hvordan måles sammenhængen

Læs mere

Normalfordelingen og Stikprøvefordelinger

Normalfordelingen og Stikprøvefordelinger Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger

Læs mere

FraværsStatistik dokumentation 12. september 2008

FraværsStatistik dokumentation 12. september 2008 FraværsStatistik dokumentation 12. september 2008 Formål Kun det uregelmæssige fravær belyses Formålet med FraværsStatistikken er at belyse mønstre i fraværets sammensætning og udvikling indenfor DA-området.

Læs mere

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet Eksamen ved Københavns Universitet i Kvantitative forskningsmetoder Det Samfundsvidenskabelige Fakultet 14. december 2011 Eksamensnummer: 5 14. december 2011 Side 1 af 6 1) Af boxplottet kan man aflæse,

Læs mere

Kvantitative metoder 2

Kvantitative metoder 2 Kvantitative metoder 2 Den multiple regressionsmodel 5. marts 2007 regressionsmodel 1 Dagens program Emnet for denne forelæsning er stadig den multiple regressionsmodel (Wooldridge kap. 3.4-3.5, E.2) Variansen

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Løsning til eksaminen d. 29. maj 2009

Løsning til eksaminen d. 29. maj 2009 DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Økonometri 1. Prediktion. Dummyvariabler 9. oktober Økonometri 1: F9 1

Økonometri 1. Prediktion. Dummyvariabler 9. oktober Økonometri 1: F9 1 Økonometri 1 Prediktion. Dummyvariabler 9. oktober 2006 Økonometri 1: F9 1 Program frem til efterårsferien Om goodness-of-fit, prediktion og residualer (kap. 6.3-4) Kvalitative egenskaber i den multiple

Læs mere

! Variansen på OLS estimatoren. ! Multikollinaritet. ! Variansen i misspecificerede modeller. ! Estimat af variansen på fejlleddet

! Variansen på OLS estimatoren. ! Multikollinaritet. ! Variansen i misspecificerede modeller. ! Estimat af variansen på fejlleddet Dagens program Økonometri Den multiple regressionsmodel 4. februar 003 regressionsmodel Emnet for denne forelæsning er stadig den multiple regressionsmodel (Wooldridge kap. 3.4-3.5)! Opsamling fra sidst

Læs mere

ET BILLEDE AF DE IKKE-FORSIKREDE

ET BILLEDE AF DE IKKE-FORSIKREDE 6. juni 2006 ET BILLEDE AF DE IKKE-FORSIKREDE Dette notat forsøger at give et billede af de personer på arbejdsmarkedet, som ikke er forsikret i en A-kasse. Datagrundlaget er Lovmodelregistret, der udgør

Læs mere

! Proxy variable. ! Målefejl. ! Manglende observationer. ! Dataudvælgelse. ! Ekstreme observationer. ! Eksempel: Lønrelation (på US data)

! Proxy variable. ! Målefejl. ! Manglende observationer. ! Dataudvælgelse. ! Ekstreme observationer. ! Eksempel: Lønrelation (på US data) Dagens program Økonometri 1 Specifikation, og dataproblemer 10. april 003 Emnet for denne forelæsning er specifikation (Wooldridge kap. 9.-9.4)! Proxy variable! Målefejl! Manglende observationer! Dataudvælgelse!

Læs mere

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

JUSTITSMINISTERIETS FORSKNINGSKONTOR NOVEMBER 2011 LÆGDOMMERES REPRÆSENTATIVITET. Undersøgelse vedrørende perioden til

JUSTITSMINISTERIETS FORSKNINGSKONTOR NOVEMBER 2011 LÆGDOMMERES REPRÆSENTATIVITET. Undersøgelse vedrørende perioden til JUSTITSMINISTERIETS FORSKNINGSKONTOR NOVEMBER 2011 LÆGDOMMERES REPRÆSENTATIVITET Undersøgelse vedrørende perioden 1.1.2012 til 31.12.2015. 1. Indledning I 2000 gennemførte Justitsministeriets Forskningskontor

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

Kvantitative Metoder 1 - Forår 2007. Dagens program

Kvantitative Metoder 1 - Forår 2007. Dagens program Dagens program Kapitel 7 Introduktion til statistik Organisering af data Diskrete variabler Kontinuerte variabler Beskrivende statistik Fraktiler Gennemsnit Empirisk varians og spredning Empirisk korrelationkoe

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

hvor y antages approksimeret ved normalfordeling med middelværdi y og varians va^r(y): y ± u 1-/2 # cv(y) # y = y(1 ± u 1-/2 # cv(y))

hvor y antages approksimeret ved normalfordeling med middelværdi y og varians va^r(y): y ± u 1-/2 # cv(y) # y = y(1 ± u 1-/2 # cv(y)) 1 Opgave II.1 a) Stikprøvevariansen er vidt forskellig for de fire varetyper, men denne absolutte størrelse er vanskelig at sammenligne på tværs af varetyper, da disse har vidt forskellige niveauer, målt

Læs mere

Indledning...1. Analyse af lønforskellen mellem kvinder og mænd...2

Indledning...1. Analyse af lønforskellen mellem kvinder og mænd...2 Ligelønsanalyse sammenligning af privatansatte kvinder og mænds løn Ref. PIL/- 17.02.2016 Indledning I dette notat præsenteres resultater fra en analyse af lønforskellen mellem mænd og kvinder. Analysen

Læs mere

Viden om og holdning til private og offentlige pensionsordninger

Viden om og holdning til private og offentlige pensionsordninger Viden om og holdning til private og offentlige pensionsordninger Viden om og holdning til private og offentlige pensionsordninger Bo Bilde /Peter Linde Danmarks Statistik Interviewservice Telefon 3917

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Estimation

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Estimation Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Estimation Eksempel: Bissau data Data kommer fra Guinea-Bissau i Vestafrika: 5273 børn blev undersøgt da de var yngre end 7 mdr og blev herefter

Læs mere

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Anvendt Statistik Lektion 7. Simpel Lineær Regression Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot

Læs mere

Statistik II 4. Lektion. Logistisk regression

Statistik II 4. Lektion. Logistisk regression Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:

Læs mere

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Den samlede model til estimation af lønpræmien er da givet ved:

Den samlede model til estimation af lønpræmien er da givet ved: Lønpræmien Lønpræmien i en branche kan indikere, om konkurrencen er hård eller svag i branchen. Hvis der er svag konkurrence mellem virksomhederne i branchen, vil det ofte give sig udslag i både højere

Læs mere

Mobning på arbejdspladsen. En undersøgelse af oplevelser med mobning blandt STEM-ansatte

Mobning på arbejdspladsen. En undersøgelse af oplevelser med mobning blandt STEM-ansatte Mobning på arbejdspladsen En undersøgelse af oplevelser med mobning blandt STEM-ansatte September 2018 Mobning på arbejdspladsen Resumé Inden for STEM (Science, Technology, Engineering & Math) var der

Læs mere

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Stikprøver og stikprøve fordelinger Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Statistik Statistisk Inferens: Prediktere og forekaste værdier af

Læs mere

Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning

Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning Side 1 af 6 Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning Litteratur: Kenneth Hansen & Charlotte Koldsø: Statistik I økonomisk perspektiv, Hans Reitzels Forlag 2012, 2. udgave,

Læs mere

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Statistik II Lektion 3 Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Setup: To binære variable X og Y. Statistisk model: Konsekvens: Logistisk regression: 2 binære var. e e X Y P

Læs mere

1 Metodeappendiks. Spørgeskemaet omhandler ledernes erfaringer med forældresamarbejde og indeholder både faktuelle spørgsmål og holdningsspørgsmål.

1 Metodeappendiks. Spørgeskemaet omhandler ledernes erfaringer med forældresamarbejde og indeholder både faktuelle spørgsmål og holdningsspørgsmål. 1 Metodeappendiks Om undersøgelserne Der er foretaget to spørgeskemaundersøgelser blandt hhv. forældre til børn, som går i daginstitution og daginstitutionsledere. Danmarks Statistik har stået for udsendelse

Læs mere

Noter til Specialkursus i videregående statistik

Noter til Specialkursus i videregående statistik Noter til Specialkursus i videregående statistik Poul Thyregod IMM, februar 2005 Indhold Forord 6 1 Momenter og flerdimensionale stokastiske variable 7 1.0 Indledning............................. 7 1.1

Læs mere

Fagplan for statistik, efteråret 2015

Fagplan for statistik, efteråret 2015 Side 1 af 7 M Fagplan for statistik, efteråret 20 Litteratur Kenneth Hansen & Charlotte Koldsø (HK): Statistik I økonomisk perspektiv, Hans Reitzels Forlag 2012, 2. udgave, ISBN 9788741256047 HypoStat

Læs mere

Simpel Lineær Regression: Model

Simpel Lineær Regression: Model Simpel Lineær Regression: Model Sidst så vi på simpel lineære regression. Det er en statisisk model på formen y = β 0 + β 1 x + u, hvor fejlledet u, har egenskaben E[u x] = 0. Dette betyder bl.a. E[y x]

Læs mere

! Husk at udfylde spørgeskema 3. ! Lineær sandsynlighedsmodel. ! Eksempel. ! Mere om evaluering og selvselektion

! Husk at udfylde spørgeskema 3. ! Lineær sandsynlighedsmodel. ! Eksempel. ! Mere om evaluering og selvselektion Dagens program Økonometri 1 Dummy variable 4. marts 003 Emnet for denne forelæsning er kvalitative variable i den multiple regressionsmodel (Wooldridge kap. 7.5-7.6+8.1)! Husk at udfylde spørgeskema 3!

Læs mere