Bayesiansk statistik. Tom Engsted. DSS Aarhus, 28 november 2017

Relaterede dokumenter
Economics Working Papers

Kvantitative Metoder 1 - Efterår Dagens program

Kvantitative Metoder 1 - Forår Dagens program

Dagens program. Praktisk information:

Dagens program. Praktisk information: Husk evalueringer af kurset

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Normalfordelingen og Stikprøvefordelinger

BM121 Resume af tirsdags forlæsningen, Uge 47

Rettevejledning til Kvantitative metoder 1, 2. årsprøve 18. juni timers prøve med hjælpemidler

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Note om Monte Carlo metoden

Vejledende besvarelser til opgaver i kapitel 14

Bilag 7. SFA-modellen

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Note til styrkefunktionen

Konfidensintervaller og Hypotesetest

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)

En oversigt over udvalgte kontinuerte sandsynlighedsfordelinger

Statistik II 4. Lektion. Logistisk regression

Tema. Dagens tema: Indfør centrale statistiske begreber.

Statistiske principper

4. september π B = Lungefunktions data fra tirsdags Gennemsnit l/min

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl i Kirkesalen, Studiestræde 38 Øvelser

Et statistisk test er en konfrontation af virkelighenden (data) med en teori (model).

Om hypoteseprøvning (1)

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Estimation

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136

Estimation og konfidensintervaller

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Økonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2

Definition. Definitioner

Susanne Ditlevsen Institut for Matematiske Fag susanne

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Skriftlig Eksamen ST501: Science Statistik Tirsdag den 8. juni 2010 kl

Et firma tuner biler. Antallet af en bils cylindere er givet ved den stokastiske variabel X med massetæthedsfunktionen

1. februar Lungefunktions data fra tirsdags Gennemsnit l/min

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Test for strukturelle ændringer i investeringsadfærden

Forelæsning 9: Inferens for andele (kapitel 10)

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

Kombinant. En kombinant er en afbildning. hvor (Y, K) er endnu et målbart rum. Typisk taler vi om reelle kombinanter, hvor Y = R.

Kvantitative Metoder 1 - Forår 2007

Hypotesetests, fejltyper og p-værdier

Velkommen til kurset. Teoretisk Statistik. Lærer: Niels-Erik Jensen

Produkt og marked - matematiske og statistiske metoder

Produkt og marked - matematiske og statistiske metoder

Module 4: Ensidig variansanalyse

Preben Blæsild og Jens Ledet Jensen

En intro til radiologisk statistik. Erik Morre Pedersen

µ = κ (θ); Kanonisk link, θ = g(µ) Poul Thyregod, 9. maj Specialkursus vid.stat. foraar 2005

Kvantitative metoder 2

Kvantitative metoder 2

Økonometri 1. Inferens i den lineære regressionsmodel 25. september Økonometri 1: F6 1

Kapitel 4 Sandsynlighed og statistiske modeller

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Estimation af bilkøbsrelationen med nye indkomst- og formueudtryk

Program. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen)

Forsøgsplanlægning Stikprøvestørrelse

Statistisk model. Definition: En statistisk model består af et repræsentationsrum (X, E) og en familie P af sandsynlighedsmål

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Statistik i basketball

Økonometri 1. Dagens program. Den simple regressionsmodel 15. september 2006

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet

Fordele og ulemper ved latent klasseanalyse

Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

Løsning til eksaminen d. 14. december 2009

Løsning eksamen d. 15. december 2008

Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1)

Stastistik og Databehandling på en TI-83

Kvantitative Metoder 1 - Forår Dagens program

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Schweynoch, Se eventuelt

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data

Praktisk info. Statistisk analyse af en enkelt stikprøve: kendt eller ukendt varians Sandsynlighedsregning og Statistik (SaSt) I tirsdags.

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser

Mikro-kursus i statistik 1. del Mikrokursus i biostatistik 1

Indblik i statistik - for samfundsvidenskab

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Stamoplysninger til brug ved prøver til gymnasiale uddannelser

Tidsværdi for gods i Sverige

Transkript:

Bayesiansk statistik Tom Engsted DSS Aarhus, 28 november 2017 1

Figure 1: Nicolajs gur 2

Klassisk frekvensbaseret statistik Statistisk beslutningsteori Bayesiansk statistik Et kompromis mellem den klassiske og den bayesianske tilgang Nogle loso ske/videnskabsteoretiske/metodiske overvejelser Machine learning (Nicolaj) 3

Motiverende eksempel (fra Startz, 2014): y t+1 = + y t + " t+1 y t : daglige S&P500 afkast over perioden 1957-2012 Den estimerede model: b = 0:026, t-stat = 3:09, p-værdi = 0:002! meget stærk evidens imod H o : = 0 MEN: en bayesiansk analyse giver meget anderledes resultater, med sandsynligheden for H o (P Ho ) fra 11% til 50%. (For beregning af P Ho, se senere). 4

Klassisk frekvensbaseret statistik Givet modellen, er det kun stikprøven der indeholder information om modellens parametre. Maksimum likelihood estimation: Vælg de parametre, der maksimerer sandsynligheden for at få den givne stikprøve. Estimerede parametre er stokastiske variable, men populationsparametre er IKKE stokastiske!! Det giver IKKE mening at tale om sandsynligheden for H o. Sandsynligheder er objektive, baseret alene på stikprøven: frekvensbaseret 5

Klassiske hypotesetest: Fisher (1925): p -værdien som mål for hvor stærk evidens der er imod H o, men ingen eksplicit H 1. Neyman and Pearson (1933): H o og H 1, valg af signi kansniveau, forkast eller forkast ikke H o til fordel for H 1, ingen p-værdi, Type-1 og Type-2 fejl. Valg af signi kansniveau: "5% reglen" stammer oprindeligt fra Fisher som en uformel og ikke-fast tommel ngerregel, men blev - desværre! - hurtigt en "fast regel". 5% afspejler (implicit) en større vægtning af Type-1 fejl end Type-2 fejl... men anvendes IKKE konsistent i praksis! 6

Z tests for andele og middelværdier: p H o : p = p o, Z ratio = b p o r p o (1 p o ) n N(0; 1) under H o H o : = o, Z ratio = Y o S= p n t(n 1) under H o Bemærk: Ved et fast signi kansniveau (eks. 5%), bliver alle tests signi kante når n bliver stor nok. p-værdien i testene giver IKKE P (H o j data), men derimod P (data j H o )! 7

Statistisk beslutningsteori Træ e en konkret beslutning baseret på et hypotesetest: Hvis H o forkastes, træ er vi beslutning B 1. Hvis H o ikke forkastes, træ er vi beslutning B 2. Inddrag omkostninger/konsekvenser ved hhv. Type-1 fejl og Type-2 fejl! Tabsfunktion. Minimer det forventede tab L = pl 1 + (1 p)l 2, hvor p = P (H o ), L 1 og L 2 er omkostningerne ved hhv. Type-1 og Type-2 fejl, og og er sandsynlighederne for hhv. Type-1 og Type-2 fejl. Bemærk: her opereres med P (H o ), dvs. implicit en bayesiansk tilgang. Bemærk: er signi kansniveauet. 8

Leamer (1978): Vælg så L minimeres! "Line of enlightened judgement". For p = 0:50 og L 1 = L 2, fås for Z-testet for nedenstående gur. (Hvor H o : = 0, H 1 : = 0:5, = 2). Bemærk: det optimale signi kansniveau er generelt meget forskellig fra 5%. Hvordan fastsættes L 1 og L 2? Svært... ofte umuligt! Hvordan fastsættes p = P (H o )? Svært... ofte umuligt! Men ved at bruge Bayes formel kan man udlede den implicitte p i testet udfra det valgte signi kansniveau (se nedenfor). 9

Figure 2: "Line of enlightened judgement" for test på middelværdi (Fra Kim, 2015). 10

Bayesiansk statistik Grundprincip: Kombiner den information stikprøven giver med á priori viden gennem Bayes formel til at få P (H o j data). P (H o j data) P Ho = P (data j H o ) P (H o) P (data) P (data j H o ) er den sædvanlige likelihoodfunktion P (H o ) er á priori sandsynligheden for H o Givet data, er P (data) en normaliseringskonstant 11

Bemærk: Det er vigtigt at skelne mellem P (H o j data) og P (data j H o )! Lad D være "død" og H være "hængning". Hvad er P (H j D)? Hvad er P (D j H)? Populationsparametre opfattes som stokastiske variable. Sandsynligheder er subjektive... hver af os har vores egen prior. 12

De ner Bayes-faktoren og prior odds ratio som hhv. P (data j H o ) P (data j H 1 ) og P (H o) P (H 1 ) Hermed fås posterior odds ratio som P Ho P H1 = (Bayes-faktor) (prior odds ratio) = P (data j H o) P (data j H 1 ) P (H o) P (H 1 ) 13

P Ho fås som: P Ho = P (data j H o ) P (H o ) (P (data j H o ) P (H o )) + (P (data j H 1 ) (1 P (H o ))) Med en neutral prior, P (H o ) = P (H 1 ) = 0:5, fås: P Ho = P (data j H o ) P (data j H o ) + P (data j H 1 ) Bemærk: P Ho kan være meget forskellig fra p-værdien! 14

Eksempel (fra Startz, 2014): Et møntkast, ssh for krone =. H o : = 0:5, H 1 : = 0:8 Mønten kastes n = 32 gange og 21 krone observeres ) b = 0:656 Standard Z test: Z ratio = 1:765, p-værdi = 0:039 Med P (H o ) = P (H 1 ) = 0:5, fås P Ho = 0:030 0:030+0:024 = 0:56 Bemærk: Vi afviser H o på standard 5% signi kansniveau, men P Ho er større end P H1! Se gur næste side. 15

Figure 3: Møntkast, H o : = 0:5, H 1 : = 0:8 (Startz, 2014) 16

Hvad nu hvis alternativhypotesen i stedet er H 1 : 6= 0:5? P Ho = P (data j H o ) P (data j H o ) + R P (data j 1 )f( 1 )d 1 Med en uniform prior for 1 over enhedsintervallet [0; 1], dvs. f( 1 ) = 1, fås med numerisk beregning af integralet og n = 32 guren på næste side. Bemærk: Også her er der stor forskel på p-værdien og P Ho. Bemærk: Selv i sådanne simple eksempler kræves der ofte numerisk integration i bayesiansk analyse. 17

Figure 4: Møntkast, H o : = 0:5, H 1 : 6= 0:5 (Startz, 2014) 18

Kompromis mellem den klassiske og bayesianske tilgang: En full-blown bayesiansk analyse kan være svær at udføre i praksis fordi den kræver speci kation af en prior for alle relevante hypoteser (H o og modellerne indeholdt i H 1 ). Kan man kombinere de klassiske tests med bayesianske metoder til at få P Ho, uden at speci cere en konkret prior for alle modeller? Ja, der er forskellige muligheder: Med den givne teststatistik og det valgte signi kansniveau, brug Bayes formel til at udlede den implicitte prior (se Startz, 2014, s.139-141). Bemærk: der er altid en implicit prior i et klassisk test!! klassisk frekvensbaseret statistik er ikke objektiv! (pas på med "letting the data speak") 19

Litteraturen indeholder simple formler for at beregne P Ho udfra t-statistikker på regressionskoe cienter, og med forskellige simple priors (eksempelvis Startz, 2014, s.146-158; Kim and Ji, 2015, s.3-4). BIC: Lad t være t-statistikken for en regressionsparameter. BIC fås hermed som: BIC = t 2 + ln(n), og P Ho = exp(0:5 BIC), (jf. Startz, 2014, s.172-177) 1 + exp(0:5 BIC) Minimum Bayes Factors (MBF): Den Bayes faktor der giver den stærkeste evidens imod H o. (Harvey, 2017, s.1422-1431). 20

For et klassisk Z test, fås MBF = exp( (Z ratio) 2 =2), og P Ho = MBF prior odds 1 + (MBF prior odds) SD-MBF: Symmetrisk og aftagende prior for H 1 omkring H o. (Harvey, 2017, s.1422-1431). SD-MBF = exp(1) p-værdi ln(p-værdi) I konkrete anvendelser af disse simple metoder fås ofte P Ho, der afviger meget fra de klassiske p-værdier. 21

Afsluttende loso ske/videnskabsteoretiske/metodiske overvejelser: De klassiske frekvensbaserede statistiske metoder blev oprindeligt udviklet for eksperimentelle data og små stikprøver. Men de este empiriske analyser indenfor økonomi (og samfundsvidenskab generelt) anvender ikke-eksperimentelle data. Og efterhånden er vores stikprøver blevet ret store (ofte tusindvis af observationer). Et særligt kendetegn for økonomiske - og samfundsvidenskabelige - modeller, er, at de alle er grove approksimationer til virkeligheden. George Box i 1978: "All models are wrong but some are useful". 22

De klassiske tests med fokus på P (data j H o ) clasher med dette... vi ved jo, at H o er forkert! Det er mere interessant at spørge: Hvor forkert er H o? Eller: hvilken model er mest sandsynlig, H o modellen eller H 1 modellen? Den bayesianske tilgang egner sig bedre til at besvare de spørgsmål vi som økonomer er interesserede i. Under alle omstændigheder: Stop med bevidstløst at anvende et 5% signi kansniveau! Inddrag Type-2 fejl og styrken af testene. Tænk over, hvad konsekvenserne er af hhv. Type-1 og Type-2 fejl. Tænk over, hvad din implicitte prior er... det du tror mest på, er det H o eller H 1? 23

Bayesiansk estimation (hvis tiden tillader det) Udled posterior-fordelingen for parameteren (vha. Bayes formel og en prior), og vælg en bestemt fraktil eller moment i fordelingen som estimat. Med en kvadratisk tabsfunktion, vælges typisk middelværdien i fordelingen. Eksempel: Med en uniform prior i intervallet (0; 1), fås Bayes estimatet af sandsynlighedsparameteren i Bernoullifordelingen,, som b b = Y n+2 +1, hvor n er stikprøvestørrelsen og Y er antal succes. (Sammenlign med maksimum likelihood estimatoren b ml = Y n ). Bayesiansk estimation og modelevaluering anvendes ofte i DSGE makromodeller, hvor modellerne netop ikke antages at være sande og derfor ikke testes med klassiske tests. I stedet beregnes posterior odds ratios for modellerne. 24

Anbefalet litteratur: Harvey, C.R. (2017): The scienti c outlook in nancial economics. Journal of Finance 72, 1399-1440. Kim, J.H., and P.I. Ji (2015): Signi cance testing in empirical nance: A critical review and assessment. Journal of Empirical Finance 34, 1-14. Leamer, E. (1978): Speci cation Searches: Ad hoc inference with nonexperimental data. Wiley, New York. Startz, R. (2014): Choosing the more likely hypothesis. Foundations and Trends in Econometrics 7, 119-189. 25