Forebyggelse og reparation - vægtning af data. Brian Larsen Thorsted
|
|
- Freja Eriksen
- 7 år siden
- Visninger:
Transkript
1 Forebyggelse og reparation - vægtning af data Brian Larsen Thorsted bnl@dst.dk
2 Indhold Usikkerhed i stikprøveundersøgelser Bortfald Estimation Regressionsestimator Reduktion af usikkerhed Repræsentativitet genskabes Konkluderende bemærkninger
3 Den perfekte verden In a perfect world a survey has no nonresponse. All selected elements cooperate and deliver all of the requested data, with no measurement error. In that perfect but non-existent world, a survey has only sampling error. Lundström og Särndal 2005, Estimation in Surveys with Nonresponse
4 Usikkerhed i stikprøver Kilder til usikkerhed: Tilfældig fejl stokastisk struktur i udvælgelse Systematisk fejl / bias målefejl bortfald/missing fejlsøgning opregning tabellering mm. Kun den tilfældige fejl kan kvantificeres Ønsker at minimere den tilfældige fejl og kontrollere den systematiske fejl Forebyggelse og reparation
5 Bortfald Fokus på bortfaldet Et problem hvis bortfaldet er skævt og korreleret med spørgeskemavariable resultatet er bias på estimaterne
6 Bortfald Eksempel (Särndal & Lundström 2005) Gennemsnitlig indkomst, M: Kr. Gennemsnitlig indkomst, K: Kr. Svarprocent, M: 50 pct. Svarprocent, K: 90 pct. kvinder er overrepræsenteret Gennemsnitlig indkomst er lavest for kvinder Total populationsindkomst underestimeres
7 Bortfald - Forskerbeskyttelse Månedlig udvikling i antal personer med forskerbeskyttelse jan-04 apr-04 jul-04 okt-04 jan-05 apr-05 jul-05 okt-05 jan-06 apr-06 jul-06 okt-06 jan-07 apr-07 jul-07 okt-07 jan-08 apr-08 jul-08 okt-08 jan-09 apr-09 jul-09 Månedlig vækst Antal personer Månedlig vækst Antal
8 Estimation Beregn en vægt for hver interviewperson Angiver hvor mange andre hver interviewperson repræsenterer Udgangspunkt er designvægten v = N n
9 Traditionel estimation Traditionel opregning deler baggrunds- og svarpopulation op i flerdimensional tabel Tabel dannes typisk på baggrund af køn, alder og geografi Der tages højde for skævt bortfald Fælles vægt til alle i samme celle Beregningsmæssigt ikke tungt Men demografiske faktorer forklarer typisk kun lille del af skævt bortfald stikprøvestørrelse er begrænsning
10 Regressionsestimat Modellerer Y vha. j hjælpevariable, X,,, i regressionsmodel 1 L X j y + + B x + k = B1 x1 k j jk e k B,, Koefficienterne bestemmes vha. mindste kvadraters metode 1 L Jo større R 2 jo større effektiv stikprøve B j
11 Regressionsestimat Populationstotalen estimeres da som tˆ greg y = tˆ = y i S + J N n j= 1 Bˆ j y i g i ( t x j tˆ x j ) Bemærk: Model assisted estimation!
12 Regressionsestimat, varians Variansen er Hvor n S n N N t V y greg y ) (ˆ ˆ = 1 1 ˆ ˆ = = = n e g n x B y g S S i i i S i J j ji j i i y
13 Regressionsestimator Regressionsestimat kan håndtere flere registervariable end traditionelt Forklaringskraft i registervariable udnyttes i opregning Motiveret af stigende bortfald og stigende krav til effektivitet
14 Regressionsestimator Traditionelle kategoriske variable (alder, køn, geografi) kan bruges I kombination med en eller flere andre variable Hovedvirkning dvs. ingen kombination!! Kategoriske og kontinuerte variable Repræsentativitet genskabes på en lang række registervariable Forskellige vægte
15 Reduktion af usikkerhed Arbejdskraftundersøgelsen bortfald 43 pct. Antal arbejdsløse (AKU) 2. kvt Metode Arbejdsløse Usikkerhed Relativ usikkerhed (CV) Direkte estimat / ,9 pct. Alder*køn*region / ,2 pct. Anvendt estimat / ,0 pct. Effektiv stikprøve forøges med 10 pct.
16 Repræsentativitet genskabes Population Simpel tilfældig stikprøve Stikprøve efter forskerbeskyttelse Svarstikprøven efter alt bortfald Vægte de svar Køn Mand Kvinde Aldersgruppe år år år år år år Uddannelse Grundskole Gymnasial og erhvervsfagliguddannelse Mellemlang videregående uddannelse Lang videregående uddannelse Pct.
17 Repræsentativitet genskabes Population Simpel tilfældig stikprøve Stikprøve efter forskerbeskyttelse Svarstikprøven efter alt bortfald Vægtede svar Pct. Socioøkonomisk status Selvstændig Lønmodtager Arbejdsløs Uddannelsessøgende Pensionist/Efterlønsmodtager Uden for arbejdsstyrken, børn, øvrige Gennemsnitlige familieindkomst kr kr kr kr over kr Flyttet Flyttet efter flytteblanket Ikke flyttet
18 Kontrol af estimation Estimation af kendt registerindkomst Metode Gennemsnit Spredning (Før skat i kr) Direkte estimat Køn*alder*region Anvendt estimat (uden indkomst) Register
19 Repræsentativitet genskabes Estimater er baseret på fordeling fra registre ikke fra svarene Kvalitetsløft Reduktion af bias
20 Reduktion af usikkerhed Ved korrelation med registervariable sænkes usikkerhed Kvalitetsløft Smallere konfidensintervaller Større effektiv stikprøve
21 Analyse Regressionsanalyser bør laves på vægtede svar Sikrer repræsentativitet og middelrette estimater Konservative signifikansniveauer skyldes empirisk varians fra før g 2 e 2 i i Sˆ 2 = i S y n 1
22 Konkluderende bemærkninger Forebyggelse/reparation nødvendig Muligt at genskabe repræsentativitet på en række parametre Samtidig med gevinst på effektiv stikprøve men (survey)-verden bliver ikke perfekt af den grund
Repræsentative undersøgelser før og nu. Peter Linde, Interviewservice pli@dst.dk
Repræsentative undersøgelser før og nu Peter Linde, Interviewservice pli@dst.dk >> >> Dagsorden Hvad er en repræsentativ undersøgelse? Bortfald og forskerbeskyttelse Vægtning for bortfald Effekt af vægtning
Læs mereBortfaldets betydning i dag og over tid
Bortfaldets betydning i dag og over tid Belyst ved eksempler Peter Linde Interviewservice pli@dst.dk 27. november 2013 Dagsorden Hvad er en repræsentativ undersøgelse? Definition af responsrate Bortfald
Læs mereRepræsentative undersøgelser Non-response Vægte. Peter Linde, DST Survey
Repræsentative undersøgelser Non-response Vægte Peter Linde, DST Survey pli@dst.dk >> >> Dagsorden Hvad er en repræsentativ undersøgelse? Bortfaldes betydning for repræsentativitet Vægtning for bortfald
Læs mereOptimering af stikprøver vha. registre. Peter Linde, DST Survey
Optimering af stikprøver vha. registre Peter Linde, DST Survey pli@dst.dk >> >> Dagsorden Vi følger en undersøgelses tilblivelse: Stikprøvedesignet, undersøgelsestyper, register (frame) og til sidst non-response,
Læs mereÆndringer i AKU-opregningen 2019
13. september 2019 TCO Arbejdsmarked Ændringer i AKU-opregningen 2019 Baggrund Arbejdskraftundersøgelsen (AKU) er en stikprøvebaseret interviewundersøgelse af den danske befolkning i alderen 15-74 år.
Læs mereForskerbeskyttelse i CPR 2008
Danmarks Statistik, Metode 16. janaur 2008 Statistisk metode BNL Forskerbeskyttelse i CPR 2008 Antallet af personer med forskerbeskyttelse har siden år 2000 været kraftigt stigende, og det stiger fortsat.
Læs mereDet gode håndværk eller simpel datafangst? Peter Linde pli@dst.dk 8. juni 2009
Det gode håndværk eller simpel datafangst? Peter Linde pli@dst.dk 8. juni 2009 Tre udsagn Tal er tyranni Ikke alt der tæller kan tælles og ikke at der kan tælles tæller (Einstein) Man kan kun have tillid
Læs mere1. Frekvenstabeller. Tabel 1: Ville du være modstander af, at din datter giftede sig med en dansker?
Indholdsfortegnelse 1. Frekvenstabeller... 3 2. Kryds med køn... 5 3. Kryds med alder... 7 4. Kryds med Region... 9 5. Kryds med Indkomst... 11 6. Kryds med oprindelsesland... 13 7. Om undersøgelsen...
Læs mereDatabrud i Arbejdskraftundersøgelsen mellem 2016 og 2017
21. februar 2018 TCO, SWE Arbejdsmarked Databrud i Arbejdskraftundersøgelsen mellem 2016 og 2017 Resumé Der er brud i dataserien for Arbejdskraftundersøgelsen (AKU) mellem fjerde kvartal 2016 og første
Læs mereDatabrud i Arbejdskraftundersøgelsen i 1. kvt. 2017
24. maj 2017 TCO, SWE Arbejdsmarked Databrud i Arbejdskraftundersøgelsen i 1. kvt. 2017 Resumé Der er brud i dataserien for Arbejdskraftundersøgelsen (AKU) mellem fjerde kvartal 2016 og første kvartal
Læs mereUNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER
UNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER Undervisningseffekten udregnes som forskellen mellem den forventede og den faktiske karakter i 9. klasses afgangsprøve. Undervisningseffekten udregnes
Læs mereEksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning
1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion
Læs mereFøler du overordnet set, at det danske samfund har taget godt eller dårligt imod dig?
Indholdsfortegnelse 1. Frekvenstabeller... 3 2. Kryds med køn... 10 3. Kryds med alder... 17 4. Kryds med Region... 24 5. Kryds med Indkomst... 31 6. Kryds med oprindelsesland... 38 7. Om undersøgelsen...
Læs mereHvor enig eller uenig er du i følgende udsagn: Jeg håber en dag at flytte tilbage til det land, jeg oprindeligt kommer fra.
Indholdsfortegnelse 1. Frekvenstabeller... 3 2. Kryds med køn... 11 3. Kryds med alder... 19 4. Kryds med Region... 27 5. Kryds med Indkomst... 35 6. Kryds med oprindelsesland... 43 7. Om undersøgelsen...
Læs mere12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse
. september 5 Epidemiologi og biostatistik. Forelæsning Uge, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression
Læs mereAnalysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17
nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse
Læs mereEpidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk
Eksempel: Systolisk blodtryk Udgangspunkt: Vi ønsker at prædiktere det systoliske blodtryk hos en gruppe af personer. Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Afdeling for Biostatistik.
Læs mereEpidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse
Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser
Læs mereDerfor skal livrenter. betydning privatøkonomien. Forsikring & Pension Analyserapport 2011:7. Ann-Kathrine Ejsing. Andreas Østergaard Nielsen
Analyserapport 2011:7 Derfor skal livrenter ikke Finansiel ind under forståelses 100.000 betydning kr. s for loftet privatøkonomien AnnKathrine Ejsing Andreas Østergaard Nielsen Philip Heymans Allé 1,
Læs mereFINANSIEL FORSTÅELSE OG REGNEFÆRDIGHED
FINANSIEL FORSTÅELSE OG REGNEFÆRDIGHED PENGE- OG PENSIONSPANELET OKTOBER 2016 METODE Undersøgelsen er baseret på en svensk undersøgelse fra Finansinspektionen fra 2014 1. Det er forsøgt at gøre den danske
Læs mereKursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff
Kursus 02402 Introduktion til Statistik Forelæsning 13: Summary Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:
Læs mereForsikringssvindel. - hvem, hvordan og hvorfor. Forsikring & Pension Analyserapport 2011:9. Andreas Østergaard Nielsen
- hvem, hvordan og Andreas Østergaard Nielsen Philip Heymans Allé 1, 2900 Hellerup, Telefon 41 91 91 91, www.forsikringogpension.dk Side 1 Indhold 1. Indledning og sammenfatning 4 2. Muligheder for at
Læs mereWebpaneler: Rekruttering, stratificering & sampling
Webpaneler: Rekruttering, stratificering & sampling Klassiske udfordringer med online data-indsamling Bias introduceres i flere led: 1. Hvem er online? 2. Hvem kan rekrutteres? 3. Selv-selektion TP Taget
Læs mereBilag S.1: Beskrivelse af beregningen af koefficienten på indvandrerbaggrund
Bilag S.1: Beskrivelse af beregningen af koefficienten på indvandrerbaggrund Det er kun i model (1) i artiklen, at den gennemsnitlige betydning af at have indvandrerbaggrund (α 1 ) direkte kan estimeres.
Læs mereØkonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2
Økonometri 1 Den simple regressionsmodel 11. september 2006 Dagens program Den simple regressionsmodel SLR : Én forklarende variabel (Wooldridge kap. 2.1-2.4) Motivation for gennemgangen af SLR Definition
Læs mereUge 43 I Teoretisk Statistik, 21. oktober Forudsigelser
Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier
Læs mereForelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)
Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske
Læs mereKvantitative Metoder 1 - Forår 2007
Dagens program Estimation: Kapitel 9.1-9.3 Estimation Estimationsfejlen Bias Eksempler Bestemmelse af stikprøvens størrelse Konsistens De nitioner påkonsistens Eksempler på konsistente og middelrette estimatorer
Læs mereDokumentation af interviewundersøgelser
Dokumentation af interviewundersøgelser Varedeklaration Opgave Kunde Delopgaver udført af: Population Stikprøve Dataindsamling Opregning Population Bruttostikprøve Nettostikprøve Antal svar Svarprocenter:
Læs mereForelæsning 11: Kapitel 11: Regressionsanalyse
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs mere3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve
Læs mereBudgetanalyse FFL 2008. Analyse af Danmarks Statistik: Effektivisering af stikprøveundersøgelser
Budgetanalyse FFL 2008 Analyse af Danmarks Statistik: Effektivisering af stikprøveundersøgelser Maj 2007 Budgetanalyse FFL 2008 Printet i Danmarks Statistik Juni 2007 Oplag 150 stk. Danmarks Statistik
Læs mereSandsynlighedsfordelinger for kontinuerte data på interval/ratioskala
3 5% 5% 5% 0 3 4 5 6 7 8 9 0 Statistik for biologer 005-6, modul 5: Normalfordelingen opstår når mange forskellige faktorer uafhængigt af hinanden bidrager med additiv variation til. F.eks. Højde af rekrutter
Læs mereProblemstillinger omkring spørgeskemaundersøgelser blandt etniske minoriteter. Vibeke Jakobsen SFI Det Nationale Forskningscenter for Velfærd
Problemstillinger omkring spørgeskemaundersøgelser blandt etniske minoriteter Vibeke Jakobsen SFI Det Nationale Forskningscenter for Velfærd Er kvaliteten lavere i data indsamlet blandt etniske minoriteter
Læs mereFokus på Forsyning. Datagrundlag og metode
Fokus på Forsyning I notatet gennemgås datagrundlaget for brancheanalysen af forsyningssektoren sammen med variable, regressionsmodellen og tilhørende tests. Slutteligt sammenfattes analysens resultater
Læs mereHvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05
Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ
Læs mereJUSTITSMINISTERIETS FORSKNINGSKONTOR DECEMBER 2015 LÆGDOMMERES REPRÆSENTATIVITET. Undersøgelse vedrørende perioden til
JUSTITSMINISTERIETS FORSKNINGSKONTOR DECEMBER 2015 LÆGDOMMERES REPRÆSENTATIVITET Undersøgelse vedrørende perioden 1.1.2016 til 31.12.2019. 1. Indledning I år 2000 gennemførte Justitsministeriets Forskningskontor
Læs mereKvantitative metoder 2
Kvantitative metoder 2 Specifikation og dataproblemer 2. maj 2007 KM2: F22 1 Program Specifikation og dataproblemer, fortsat (Wooldridge kap. 9): Betydning af målefejl Dataudvælgelse: Manglende observationer
Læs mereBetydningen af konjunktur og regelændringer for udviklingen i sygedagpengemodtagere
DET ØKONOMISKE RÅD S E K R E T A R I A T E T d. 20. maj 2005 SG Betydningen af konjunktur og regelændringer for udviklingen i sygedagpengemodtagere Baggrundsnotat vedr. Dansk Økonomi, forår 2005, kapitel
Læs mere1 Regressionsproblemet 2
Indhold 1 Regressionsproblemet 2 2 Simpel lineær regression 3 2.1 Mindste kvadraters tilpasning.............................. 3 2.2 Prædiktion og residualer................................. 5 2.3 Estimation
Læs mereKvalitetsmåling i statistik
Kvalitetsmåling i statistik Peter Linde. Survey and Methods. Statistics Denmark. pli@dst.dk Opfyldelse af brugernes behov Over- eller undervurderer statistikken den faktiske udvikling, og hvor sikre er
Læs mereMindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning
1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3
Læs mereStor stigning i gruppen af rige danske familier
Stor stigning i gruppen af rige danske familier Gruppen af rige danskere er steget markant siden 2004. Hovedparten af familierne består af to voksne i aldersgruppen 50-65 år uden hjemmeboende børn. Personer
Læs mereØkonometri: Lektion 2 Multipel Lineær Regression 1/27
Økonometri: Lektion 2 Multipel Lineær Regression 1/27 Multipel Lineær Regression Sidst så vi på simpel lineær regression, hvor y er forklaret af én variabel. Der er intet, der forhindre os i at have mere
Læs mereTrin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse
Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ
Læs mereTo samhørende variable
To samhørende variable Statistik er tal brugt som argumenter. - Leonard Louis Levinsen Antagatviharn observationspar x 1, y 1,, x n,y n. Betragt de to tilsvarende variable x og y. Hvordan måles sammenhængen
Læs mereKvotering: Der er sat en totalkvote på gennemførte interviews
Metodenotat Dataindsamling: Foretaget via NORSTATS onlinepanel. Feltperiode: 19. januar 25. januar 2007 Stikprøve: 1002 Svarprocent: Sampling: Der er sendt ud nationalt repræsentativt til befolkningen
Læs mereNormalfordelingen og Stikprøvefordelinger
Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger
Læs mereFraværsStatistik dokumentation 12. september 2008
FraværsStatistik dokumentation 12. september 2008 Formål Kun det uregelmæssige fravær belyses Formålet med FraværsStatistikken er at belyse mønstre i fraværets sammensætning og udvikling indenfor DA-området.
Læs mereEksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet
Eksamen ved Københavns Universitet i Kvantitative forskningsmetoder Det Samfundsvidenskabelige Fakultet 14. december 2011 Eksamensnummer: 5 14. december 2011 Side 1 af 6 1) Af boxplottet kan man aflæse,
Læs mereKvantitative metoder 2
Kvantitative metoder 2 Den multiple regressionsmodel 5. marts 2007 regressionsmodel 1 Dagens program Emnet for denne forelæsning er stadig den multiple regressionsmodel (Wooldridge kap. 3.4-3.5, E.2) Variansen
Læs mereBilag 6: Bootstrapping
Bilag 6: Bootstrapping Bilaget indeholder en gennemgang af bootstrapping og anvendelsen af bootstrapping til at bestemme den konkurrencepressede front. FORSYNINGSSEKRETARIATET FEBRUAR 2013 INDLEDNING...
Læs mereEstimation og usikkerhed
Estimation og usikkerhed = estimat af en eller anden ukendt størrelse, τ. ypiske ukendte størrelser Sandsynligheder eoretisk middelværdi eoretisk varians Parametre i statistiske modeller 1 Krav til gode
Læs mereHver anden vil benytte øget åbningstid i dagtilbud
Børnefamiliers dagtilbud og arbejdsliv 17. maj 18 Hver anden vil benytte øget åbningstid i dagtilbud Halvdelen af alle lønmodtagere med børn mellem -13 år ville benytte sig af udvidede åbningstider i deres
Læs mereKonfidensintervaller og Hypotesetest
Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller
Læs mereLøsning til eksaminen d. 29. maj 2009
DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Læs mereDansk Økonomi, efterår 2018
Baggrundsnotat til Beskæftigelseseffekten af en erhvervsuddannelse til ufaglærte Dansk Økonomi, efterår 2018 Formandskabet d. 29.11.2018 Marie Møller Kjeldsen Beskæftigelseseffekten af en erhvervsuddannelse
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs mereKvinde Mand Kvinde Mand
analyse=39 Vordingborg Kvinde Mand Kvinde Mand I alt antal antal I alt antal antal -9 år -9 år 7 353 85 97 87 5 8 8 7 35-9 år 8 39 9 3 98 3-39 år 57 3 3 38 73-9 år 59 9 3 3 99 3 5-59 år 5 7 89 78 9 8-9
Læs mereAppendiks A. Entreprenørskabsundervisning i befolkningen, specielt blandt unge
Appendiks A. Entreprenørskabsundervisning i befolkningen, specielt blandt unge Redegørelsen ovenfor er baseret på statistiske analyser, der detaljeres i det følgende, et appendiks for hvert afsnit. Problematikken
Læs mereØkonometri 1. Prediktion. Dummyvariabler 9. oktober Økonometri 1: F9 1
Økonometri 1 Prediktion. Dummyvariabler 9. oktober 2006 Økonometri 1: F9 1 Program frem til efterårsferien Om goodness-of-fit, prediktion og residualer (kap. 6.3-4) Kvalitative egenskaber i den multiple
Læs mere! Variansen på OLS estimatoren. ! Multikollinaritet. ! Variansen i misspecificerede modeller. ! Estimat af variansen på fejlleddet
Dagens program Økonometri Den multiple regressionsmodel 4. februar 003 regressionsmodel Emnet for denne forelæsning er stadig den multiple regressionsmodel (Wooldridge kap. 3.4-3.5)! Opsamling fra sidst
Læs mereET BILLEDE AF DE IKKE-FORSIKREDE
6. juni 2006 ET BILLEDE AF DE IKKE-FORSIKREDE Dette notat forsøger at give et billede af de personer på arbejdsmarkedet, som ikke er forsikret i en A-kasse. Datagrundlaget er Lovmodelregistret, der udgør
Læs mere! Proxy variable. ! Målefejl. ! Manglende observationer. ! Dataudvælgelse. ! Ekstreme observationer. ! Eksempel: Lønrelation (på US data)
Dagens program Økonometri 1 Specifikation, og dataproblemer 10. april 003 Emnet for denne forelæsning er specifikation (Wooldridge kap. 9.-9.4)! Proxy variable! Målefejl! Manglende observationer! Dataudvælgelse!
Læs mereOversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse
Læs mereJUSTITSMINISTERIETS FORSKNINGSKONTOR NOVEMBER 2011 LÆGDOMMERES REPRÆSENTATIVITET. Undersøgelse vedrørende perioden til
JUSTITSMINISTERIETS FORSKNINGSKONTOR NOVEMBER 2011 LÆGDOMMERES REPRÆSENTATIVITET Undersøgelse vedrørende perioden 1.1.2012 til 31.12.2015. 1. Indledning I 2000 gennemførte Justitsministeriets Forskningskontor
Læs mereNormalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ
Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet
Læs merePenge- og Pensionspanelet Opsparing til uforudsete udgifter
Penge- og Pensionspanelet Opsparing til uforudsete udgifter 09-11-2018 Om undersøgelsen Kantar Gallup har på vegne af Penge- og Pensionspanelet gennemført en undersøgelse omkring danskernes økonomi ift.
Læs mereØkonometri 1. Dagens program. Den simple regressionsmodel 15. september 2006
Dagens program Økonometri Den simple regressionsmodel 5. september 006 Den simple lineære regressionsmodel (Wooldridge kap.4-.6) Eksemplet fortsat: Løn og uddannelse på danske data Funktionel form Statistiske
Læs mereKvantitative Metoder 1 - Forår 2007. Dagens program
Dagens program Kapitel 7 Introduktion til statistik Organisering af data Diskrete variabler Kontinuerte variabler Beskrivende statistik Fraktiler Gennemsnit Empirisk varians og spredning Empirisk korrelationkoe
Læs mereInstitut for Matematiske Fag Aalborg Universitet Specielt: Var(aX) = a 2 VarX 1/40. Lad X α, X β og X γ være stokastiske variable (vinkelmålinger) med
Repetition: Varians af linear kombination Landmålingens fejlteori Lektion 5 Fejlforplantning - rw@math.aau.dk Antag X 1, X,..., X n er uafhængige stokastiske variable, og Y er en linearkombination af X
Læs merea1 Skal der være begrænsninger for, hvor mange timer om ugen dagpengemodtagere må arbejde frivilligt, hvis de står til rådighed for arbejdsmarkedet?
a1 Skal der være begrænsninger for, hvor mange timer om ugen dagpengemodtagere må arbejde frivilligt, hvis de står til rådighed for arbejdsmarkedet? STEMME I MORGEN TOTAL (A) Socialdemokr(B) Radikale Ven
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs merehvor y antages approksimeret ved normalfordeling med middelværdi y og varians va^r(y): y ± u 1-/2 # cv(y) # y = y(1 ± u 1-/2 # cv(y))
1 Opgave II.1 a) Stikprøvevariansen er vidt forskellig for de fire varetyper, men denne absolutte størrelse er vanskelig at sammenligne på tværs af varetyper, da disse har vidt forskellige niveauer, målt
Læs mere2019-opregningens effekt på Arbejdskraftundersøgelsens
2. september 2019 TCO, TST Arbejdsmarked 2019-opregningens effekt på Arbejdskraftundersøgelsens hovedtal Baggrund I Arbejdskraftundersøgelsens (AKU s) nye opregning inddrages en række registre, der giver
Læs mereIndledning...1. Analyse af lønforskellen mellem kvinder og mænd...2
Ligelønsanalyse sammenligning af privatansatte kvinder og mænds løn Ref. PIL/- 17.02.2016 Indledning I dette notat præsenteres resultater fra en analyse af lønforskellen mellem mænd og kvinder. Analysen
Læs mereViden om og holdning til private og offentlige pensionsordninger
Viden om og holdning til private og offentlige pensionsordninger Viden om og holdning til private og offentlige pensionsordninger Bo Bilde /Peter Linde Danmarks Statistik Interviewservice Telefon 3917
Læs mereBefolkning og folkekirke Lystrup Sogn
Befolkning og folkekirke Tabel 1-2011 Antal personer fordelt efter aldersgruppe, køn, etnisk herkomst og medlemskab af folkekirken Alders- Befolkning Af dansk herkomst 00-04 år 199 172 371 185 154 339
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Estimation
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Estimation Eksempel: Bissau data Data kommer fra Guinea-Bissau i Vestafrika: 5273 børn blev undersøgt da de var yngre end 7 mdr og blev herefter
Læs mereAnvendt Statistik Lektion 7. Simpel Lineær Regression
Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot
Læs mereFordeling af midler til specialundervisning på baggrund af skoledistrikter
NOTAT Fordeling af midler til specialundervisning på baggrund af skoledistrikter Model for Norddjurs Kommune Søren Teglgaard Jakobsen Maj 2013 Indholdsfortegnelse FORMÅL... 1 METODE... 1 POPULATION...
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mål for sammenhæng mellem to variable
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Mål for sammenhæng mellem to variable Estimation Stikprøve Data Population Teori relativ hyppighed parameter estimat sandsynlighed parameter
Læs mereStatistik II 4. Lektion. Logistisk regression
Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:
Læs mereStore forskelle imellem efterlønnere og personer i arbejde
Store forskelle imellem efterlønnere og personer i arbejde Der er udpræget forskel på efterlønsmodtagere og personer i beskæftigelse i alderen 60-64- årige. Generelt er der flere kvinder, ufaglærte og
Læs mere460 responses. Holdninger til integration. Demogra. Dit køn (udfyld selv uden at spørge) Hvor gammel er du? QUESTIONS RESPONSES 460
Holdninger til integration QUESTIONS RESPONSES 460 SUMMARY INDIVIDUAL Accepting responses Demogra Dit køn (udfyld selv uden at spørge) 53.3% Mand Kvinde 46.7% Hvor gammel er du? https://docs.google.com/forms/d/16fzw8q1ff7zqaluroer-gx5nbbjnhvd_abpgmach4r0/edit#responses
Læs mereProgram: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19
Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større
Læs mereKursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte
Læs mereDen samlede model til estimation af lønpræmien er da givet ved:
Lønpræmien Lønpræmien i en branche kan indikere, om konkurrencen er hård eller svag i branchen. Hvis der er svag konkurrence mellem virksomhederne i branchen, vil det ofte give sig udslag i både højere
Læs mereMobning på arbejdspladsen. En undersøgelse af oplevelser med mobning blandt STEM-ansatte
Mobning på arbejdspladsen En undersøgelse af oplevelser med mobning blandt STEM-ansatte September 2018 Mobning på arbejdspladsen Resumé Inden for STEM (Science, Technology, Engineering & Math) var der
Læs mereStikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader
Stikprøver og stikprøve fordelinger Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Statistik Statistisk Inferens: Prediktere og forekaste værdier af
Læs mereRAR Østjylland Nøgletal for arbejdsmarkedet
RAR Østjylland Nøgletal for arbejdsmarkedet Marts 2015 Beskæftigelsen i RAR Østjylland Finanskrisen resulterede i et væsentligt fald i beskæftigelsen fra 2008 til 2009 på 13.953 lønmodtagere målt i 3.
Læs mereStatistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning
Side 1 af 6 Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning Litteratur: Kenneth Hansen & Charlotte Koldsø: Statistik I økonomisk perspektiv, Hans Reitzels Forlag 2012, 2. udgave,
Læs mereStatistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
Statistik II Lektion 3 Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Setup: To binære variable X og Y. Statistisk model: Konsekvens: Logistisk regression: 2 binære var. e e X Y P
Læs mere1 Metodeappendiks. Spørgeskemaet omhandler ledernes erfaringer med forældresamarbejde og indeholder både faktuelle spørgsmål og holdningsspørgsmål.
1 Metodeappendiks Om undersøgelserne Der er foretaget to spørgeskemaundersøgelser blandt hhv. forældre til børn, som går i daginstitution og daginstitutionsledere. Danmarks Statistik har stået for udsendelse
Læs mereDer foretages endvidere en såkaldt overlapsbehandling, der sikrer, at ingen ledig indgår i statistikken med mere end 37 timer pr. uge.
Notat Vedrørende: Ledighedsstatistik og sæsonkorrektion Sagsnavn: Arbejdsmarked, Statistik og Analyser 2015 Sagsnummer: 15.20.00-G01-15-15 Skrevet af: Morten Fich og Troels Rasmussen E-mail: Morten.Brorson.Fich@randers.dk
Læs mereNoter til Specialkursus i videregående statistik
Noter til Specialkursus i videregående statistik Poul Thyregod IMM, februar 2005 Indhold Forord 6 1 Momenter og flerdimensionale stokastiske variable 7 1.0 Indledning............................. 7 1.1
Læs mereFagplan for statistik, efteråret 2015
Side 1 af 7 M Fagplan for statistik, efteråret 20 Litteratur Kenneth Hansen & Charlotte Koldsø (HK): Statistik I økonomisk perspektiv, Hans Reitzels Forlag 2012, 2. udgave, ISBN 9788741256047 HypoStat
Læs mereLandmålingens fejlteori - Repetition - Fordeling af slutfejl - Lektion 8
Landmålingens fejlteori Repetition - Fordeling af slutfejl Lektion 8 - tvede@math.aau.dk http://www.math.aau.dk/ tvede/teaching/l4 Institut for Matematiske Fag Aalborg Universitet 15. maj 2008 1/13 Fordeling
Læs mereSimpel Lineær Regression: Model
Simpel Lineær Regression: Model Sidst så vi på simpel lineære regression. Det er en statisisk model på formen y = β 0 + β 1 x + u, hvor fejlledet u, har egenskaben E[u x] = 0. Dette betyder bl.a. E[y x]
Læs mere! Husk at udfylde spørgeskema 3. ! Lineær sandsynlighedsmodel. ! Eksempel. ! Mere om evaluering og selvselektion
Dagens program Økonometri 1 Dummy variable 4. marts 003 Emnet for denne forelæsning er kvalitative variable i den multiple regressionsmodel (Wooldridge kap. 7.5-7.6+8.1)! Husk at udfylde spørgeskema 3!
Læs mere