Appendiks Økonometrisk teori... II
|
|
|
- Ejvind Holm
- 9 år siden
- Visninger:
Transkript
1 Appendiks Økonometrisk teori... II De klassiske SLR-antagelser... II Hypotesetest... VII Regressioner... VIII Inflation:... VIII Test for SLR antagelser... IX Reset-test... IX Plots... X Breusch-Pagan test... X Boligpriser... X Test for SLR antagelser... XI Reset test... XI Plots... XII 1 Breusch-Pagan test... XII Analyse af skattestop... XIII Analyse af afdragsfrie lån... XIII I
2 Økonometrisk teori 1 De klassiske SLR-antagelser SLR 1 (lineær parametre) Første betingelse er, at populationen kan opskrives som en lineær sammenhæng Dette betyder, at de uafhængige koefficienter skal indgå i en lineær sammenhæng som ovenfor, hvor og er populationens skæring og hældning. Udover en lineær sammenhæng er der flere betingelser, der skal være opfyldt ifølge SLR 1. Den korrekte funktionel form skal være opfyldt, dvs. at der ikke forsøges at forklare en kurve ud fra en linje De korrekte data er brugt, dvs., at der ikke er udeladt nogen vigtige forklarende variable. Er der udeladt vigtige forklarende variable, vil parametrene blive biased. Dette er mere kritisk end at benytte for mange forklarende variable, da dette vil få betydning for variansens størrelse, men ikke for om hvorvidt parametrene er unbiased eller biased. At fejlleddet kan adderes på den lineære ligning. 1 Test for SLR 1 For at teste om SLR1 er opfyldt benyttes to tests. Den ene hedder en RESET test (Regression Specification Error Term). Denne test beregner, om den funktionelle form er korrekt. Mere præcist tilføjer den en ekstra variabel, der er potenser af de beregnede estimater. Denne test beregnes som en F-test, og en H 0 hypotese opstilles. Hvis de ekstra variable er signifikante, forkastes H 0 hypotesen, og den funktionelle form er derfor ikke korrekt. Den nye ligning kommer derfor til at se således ud: Der testes altså for, om δ 1 har indflydelse på y. Er dette tilfældet, er den korrekte funktionelle form ikke opnået, og SLR 1 er brudt. 2 Hypoteserne bliver derfor: 1 Wooldridge (09) Kap. 2 II
3 H 0 : δ 1 = 0, H 1 : δ 1 0 En anden test, der kan benyttes, er testen for irrelevante variable. Til denne benyttes en t-test, hvor en H 0 hypotese opstilles, hvor de estimerede variable sættes til at være lig 0. Er nogle af de estimerede variable ikke signifikante, vil der være irrelevante variable i regression. Den sidste test kan dog kun foretages, hvis SLR er overholdt, således at fejlleddene er homoskedastiske. Hvis SLR 1 ikke er overholdt, medfører dette, at parametrene er biased. SLR 2 (tilfældig stikprøve) Stikprøven, der udtages, skal således være uafhængig af andre stikprøver, og repræsentanterne skal være tilfældige. Test for SLR2 For at se om SLR2 er overholdt, vurderes dataene. Her skal man lægge særlig vægt på, om dataene er repræsentative, og om de er opsamlet på helt tilfældigt grundlag. Er dette ikke tilfældet er parametrene biased. 1 SLR 3 (stikprøvevariation) Stikprøveværdierne, må ikke være af samme værdi. Dette sker sjældent, for hvis x varierer i populationen vil den typisk også gøre det i stikprøven. Test for SLR 3 Hvis standardafvigelse for x i er lig nul, så er SLR 3 brudt. Er dette ikke tilfældet vil SLR 3 være opfyldt. Simpel inspektion af data vil typisk afsløre om SLR 3 er brudt. SLR 4 (Betinget middelværdi nul) Dette betyder, at fejlleddet u har en forventet værdi på 0 for alle værdier af den uafhængige variable 2 Dette betyder at fejlleddet ikke må være korreleret med den forklarende variable. Test for SLR 4 III
4 Hvis antagelse SLR 4 om at fejlleddet skal have en forventet værdi på 0 er brudt, bliver estimaterne biased. Et eksempel på dette kunne være en regression mellem indkomst og uddannelse. (Wooldridge 09) Her vil estimaterne blive biased, da der ikke er den korrekte sammenhæng mellem indkomst og uddannelse. Den rigtige sammenhæng er uddannelse kvadreret og indkomst Ovenstående ligning vil være den korrekte at bruge til regression, og disse estimater vil blive unbiased. 1 En anden måde hvorpå SLR 4 ikke er opfyldt er, hvis en forklarende variable udelades. Er dette tilfældet vil de allerede eksisterende variable i regressionen absorbere noget af den sammenhæng, der er mellem den udeladte forklarende variabel og den afhængige. En korrekt regressionsligning med to forklarende variabel ser således ud: Kendes det korrekte forhold ikke og derfor kun benyttes én forklarende variabel, vil der fås et ukorrekt forhold mellem den afhængige variabel og den forklarende. Herunder opstilles en ligning, hvor en forklarende variabel udelades: Der fås nu en sammenhæng mellem estimaterne der ser således ud, hvor der er mellem de to forklarende variable. er den sammenhæng IV
5 Vi får nu Da begge forklarende variable er relevante, er, og derfor er det kun hvis, at vores estimat er unbiased. Ellers vil det blive biased, idet sammenhængen mellem den forklarende variabel og den afhængige ikke bliver korrekt. For at teste om SLR 4 er overholdt anvendes ligeledes en RESET test. Hvis SLR 4 ikke er overholdt, vil de tilføjede ikke lineære forklarende variable blive signifikante. På denne måde kan RESET testen også afsløre om SLR 4 er overholdt. SLR 4 kontrolleres yderligere ved at indsætte residualerne i et plot for netop at se om SLR 4 er overholdt. Det grafiske plot kan ikke anvendes som et bevis men som en yderligere indikator for, hvorvidt SLR 4 er overholdt. SLR (homoskedastiske fejlled) Fejlleddet u har samme varians for enhver værdi af den forklarende variabel 1 Dette kan forklares ud fra figur x. Som det ses på figur x har observationerne ikke samme fordeling af fejlleddet. I starten ligger observationerne meget tæt på linjen. I næste sektion har fejlleddet en anden fordeling, og i tredje sektion ligger fejlleddene endnu længere fra hinanden. På den måde har fejlleddene ikke samme fordeling af variansen, og derved viser denne graf heteroskedastiske fejlled. Figur 1 2 V
6 Test for SLR Hvis SLR ikke er opfyldt er der heteroskedasticitet i fejlleddene. Dette betyder, at der ikke længere er samme varians mellem fejlleddene. Ved homoskedastiske fejlled er variansen den samme Ved heteroskedastiske fejlled På denne måde er estimaterne ikke længere BLUE, altså er det ikke længere den bedste lineære estimation. Det er således vigtigt at teste for om vores fejlled er homoskedastiske eller ej. Der vil blive anvendt to test for kontrollere for homoskedastiske fejlled. Den første der introduceres er Breusch-Pagan testen. En lineær sammenhæng antages og følgende relation mellem fejlleddene fås: Ved denne antagelse fås følgende H 0 hypotese: Denne hypotese testes ved at erstatte de sande fejlled med OLS residualerne. Disse udregnes som F-test eller LM-test (lagrange multiplier) δ 1 Regressionen af OLS residualerne udføres og noteres. F-test størrelsen LM- test størrelsen Hjælperegressionen bliver således for en forenklet regression Testen konstrueres som en LM test og bliver således VI
7 Hvis SLR ikke er overholdt, og estimaterne er heteroskedastiske, er fejlledendes varians ikke konstante. Dette betyder at OLS ikke længere opfylder BLUE betingelserne. Der kan derfor være andre metoder der er bedre at benytte. Idet fejlleddenes varians ikke er konstant, vil OLS estimaterne ikke følge en T- eller F-fordeling. En hypotesetest under SLR vil derfor ikke være valid. Hypotesetest Da det ønskes at teste de forskellige antagelser benyttes hypotesetest også kaldet signifikanstest. Der vil nu være en kort gennemgang af hvad signifikansniveau, samt F - og T- test betyder i denne sammenhæng. 1 Inden der laves en hypotesetest, vælges et signifikansniveau. Signifikansniveauet er et tal således at H 0 -hypotesen forkastes, hvis p-værdien er mindre end. Vælges et signifikansniveau på % vil man kun forkaste H 0 -hypotesen, hvis p-værdien, som er sandsynligheden for at man tager fejl, er under de %. En H 0 -hypotese kan forkastes men aldrig accepteres. Hvis H 0 -hypotesen forkastes accepteres den alternative hypotese, H 1. Hvis H 0 -hypotesen forkastes selvom den er sand, kaldes dette en Type 1-fejl. Sandsynligheden for en type 1-fejl er således det valgte signifikansniveau. Type 2 fejl er sandsynligheden for at en H 0 -hypotese ikke forkastes, selvom denne er falsk. Når der hypotesetestes ønskes det at finde ud af om en enkelt eller en gruppe af variable, har signifikans for modellen. En populationsmodel kan se således ud: Ved OLS er estimatorerne unbiased og benævnes for den enkelte koefficient hypoteser om en specifik. For at undersøge benyttes en t-test. For at teste flere hypoteser omkring parametrene anvendes en F-test. Disse parametre ønskes undersøgt, og derved laves hypoteser, hvorved der kan testes for deres betydning i modellen. 2 En F-test bruges til, at sammenligne forskellen mellem to modeller. En F-model er konstrueret ud fra to tilfældige variable der begge følger en chi 2 fordeling, hvor de er delt med graderne af frihed. Denne følger nu en F-fordeling. F-test er ofte anvendt når der ønskes at teste grupper af variable for forskellige sammenhæng. 30 For at teste om en enkelt variabel kan udelades i en model kan t-testen bruges. F-testen kan også bruges hertil, men kun hvis det er en tosidet test. Ved en t-test kan en variabel være insignifikant i VII
8 sig selv, men ved en F-test kan det vise sig, at variablen i en gruppe af andre variable kan have stor signifikans. Dette gælder også omvendt, hvor en enkelt variabel kan få betydning for hele gruppen, selvom denne variabel ved en t-test vil være insignifikant. Derfor er det altså igen vigtigt at H 0 -hypotesen kun forkastes og ikke accepteres. Det gælder altså for F-test at denne anvendes ved at teste om et sæt af variable er forskellig fra nul, mens t-test anvendes ved at teste en enkelt hypotese. En t-test er konstrueret ud fra en student s t-distribution, der ligner en normal fordeling, med større volumen i lower- og uppertail. Når den ene eller anden test udføres, vil der udover H 0 -hypotesen og den alternative H 1 -hypotese være et signifikansniveau der skal bestemmes. Ved testen findes en kritisk værdi, og ud fra signifikansniveauet vil man enten forkaste eller ikke forkaste H 0 -hypotesen. Er p-værdien lavere end signifikansniveauet forkastes H 0 -hypotesen. P-værdien er en sandsynlighed og ligger derfor altid mellem 0 og Regressioner Inflation: Script window: RegModel.2 <- lm(inflation~pengemængde.index, data=projekt) summary(regmodel.2) Output Window Call: lm(formula = Inflation ~ pengemængde.index, data = Projekt) Residuals: 2 Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) 2 Wooldridge (09) VIII
9 (Intercept) pengemængde.index Signif. codes: 0 '***' '**' 0.01 '*' 0.0 '.' 0.1 ' ' 1 Residual standard error: on 7 degrees of freedom Multiple R-squared: ,... Adjusted R-squared: F-statistic: on 1 and 7 DF, p-value: 0.98 Test for SLR antagelser Reset-test Script window resettest(inflation ~ pengemængde.index, power=2:3, type="fitted", data=projekt) Output window 1 > resettest(inflation ~ pengemængde.index, power=2:3, type="fitted", + data=projekt)... RESET test data: Inflation ~ pengemængde.index RESET = , df1 = 2, df2 =, p-value = Residual standard error: on 7 degrees of freedom Multiple R-squared: ,... Adjusted R-squared: F-statistic: on 1 and 7 DF, p-value: 0.98 IX
10 Plots Script window oldpar <- par(oma=c(0,0,3,0), mfrow=c(2,2)) plot(regmodel.) par(oldpar) Plot Breusch-Pagan test Script Window bptest(inflation ~ pengemængde.index, varformula = ~ fitted.values(regmodel.1), studentize=false, data=projekt) Output Window > bptest(inflation ~ pengemængde.index, varformula = ~ + fitted.values(regmodel.1), studentize=false, data=projekt) 1... Breusch-Pagan test data: Inflation ~ pengemængde.index BP = 2.326, df = 1, p-value = Boligpriser Script window RegModel.3 <- lm(boligprisindex~pengemængde.index, data=projekt) X
11 summary(regmodel.3) Output window Call: lm(formula = Boligprisindex ~ pengemængde.index, data = Projekt) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) pengemængde.index ** Signif. codes: 0 '***' '**' 0.01 '*' 0.0 '.' 0.1 ' ' 1 Residual standard error: on 7 degrees of freedom Multiple R-squared: ,... Adjusted R-squared: F-statistic: 19 on 1 and 7 DF, p-value: Test for SLR antagelser Reset test Script window resettest(boligprisindex ~ pengemængde.index, power=2:3, type="fitted", data=projekt) 2 Output window > resettest(boligprisindex ~ pengemængde.index, power=2:3, type="fitted", XI
12 + data=projekt) RESET test data: Boligprisindex ~ pengemængde.index RESET = 7.083, df1 = 2, df2 =, p-value = Plots Script window oldpar <- par(oma=c(0,0,3,0), mfrow=c(2,2)) plot(regmodel.3) par(oldpar) Plot Breusch-Pagan test Script window bptest(boligprisindex ~ pengemængde.index, varformula = ~ 1 fitted.values(regmodel.2), studentize=false, data=projekt) Output window Breusch-Pagan test data: Boligprisindex ~ pengemængde.index BP = 3.761, df = 1, p-value = XII
13 Analyse af skattestop Beregnet månedlig ydelse ved køb af enfamiliesbolig Den Konstante ydelse på annuitetslånet ( af kapitakindvindingsfaktoren. bestemmes ved anvendelse Udregningseksempel 01: Begregnet nutidsværdi af besparelse: Nutidsværdien findes vha. Udrengningseksempel 03: Analyse af afdragsfrie lån. Udregning af afdrag. Udregningseksempel: Udregning af renter. Udregningseksempel: XIII
14 XIV
Økonometri Lektion 1 Simpel Lineær Regression 1/31
Økonometri Lektion 1 Simpel Lineær Regression 1/31 Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Statistisk model: Vi antager at sammenhængen
Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model
Reminder: Hypotesetest for én parameter Antag vi har model Økonometri: Lektion 4 F -test Justeret R 2 Aymptotiske resultater y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi ønsker at teste hypotesen H
Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater
Økonometri: Lektion 4 Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater 1 / 35 Hypotesetest for én parameter Antag vi har model y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi
Simpel Lineær Regression
Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Vi antager at sammenhængen mellem y og x er beskrevet ved y = β 0 + β 1 x + u. y: Afhængige
Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse
Forelæsning 11: Kapitel 11: Regressionsanalyse
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller
Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =
Økonometri: Lektion 6 Emne: Heteroskedasticitet
Økonometri: Lektion 6 Emne: Heteroskedasticitet 1 / 32 Konsekvenser af Heteroskedasticitet Antag her (og i resten) at MLR.1 til MLR.4 er opfyldt. Antag MLR.5 ikke er opfyldt, dvs. vi har heteroskedastiske
Kvantitative metoder 2
Kvantitative metoder Heteroskedasticitet 11. april 007 KM: F18 1 Oversigt: Heteroskedasticitet OLS estimation under heteroskedasticitet (W.8.1-): Konsekvenser af heteroskedasticitet for OLS Gyldige test
Lagrange multiplier test. Økonometri: Lektion 6 Håndtering ad heteroskedasticitet. Konsekvenser af Heteroskedasticitet
Lagrange multiplier test Et alternativ til F -testet af en eller flere parametre. Økonometri: Lektion 6 Håndtering ad heteroskedasticitet Antag vi har model: y = β 0 + β 1 x 2 + + β k x k + u. Vi ønsker
Økonometri: Lektion 6 Emne: Heteroskedasticitet
Økonometri: Lektion 6 Emne: Heteroskedasticitet 1 / 34 Lagrange multiplier test Et alternativ til F -testet af en eller flere parametre. Antag vi har model: Vi ønsker at teste hypotesen y = β 0 + β 1 x
MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som
MLR antagelserne Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + u, hvor β 0, β 1, β 2,...,β k er ukendte parametere,
Konfidensintervaller og Hypotesetest
Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller
Løsning til eksamen d.27 Maj 2010
DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1
Anvendt Statistik Lektion 8. Multipel Lineær Regression
Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke
Normalfordelingen. Statistik og Sandsynlighedsregning 2
Statistik og Sandsynlighedsregning 2 Repetition og eksamen T-test Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige
Kvantitative metoder 2
Kvantitative metoder 2 Den multiple regressionsmodel 5. marts 2007 regressionsmodel 1 Dagens program Emnet for denne forelæsning er stadig den multiple regressionsmodel (Wooldridge kap. 3.4-3.5, E.2) Variansen
Økonometri: Lektion 2 Multipel Lineær Regression 1/27
Økonometri: Lektion 2 Multipel Lineær Regression 1/27 Multipel Lineær Regression Sidst så vi på simpel lineær regression, hvor y er forklaret af én variabel. Der er intet, der forhindre os i at have mere
Lineær regression. Simpel regression. Model. ofte bruges følgende notation:
Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til
Økonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2
Økonometri 1 Den simple regressionsmodel 11. september 2006 Dagens program Den simple regressionsmodel SLR : Én forklarende variabel (Wooldridge kap. 2.1-2.4) Motivation for gennemgangen af SLR Definition
Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data
Faculty of Life Sciences Program t-test Hypoteser, teststørrelser og p-værdier Claus Ekstrøm E-mail: [email protected] Resumé og hængepartier fra sidst. Eksempel: effekt af foder på hormonkoncentration
Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ
Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet
Simpel Lineær Regression: Model
Simpel Lineær Regression: Model Sidst så vi på simpel lineære regression. Det er en statisisk model på formen y = β 0 + β 1 x + u, hvor fejlledet u, har egenskaben E[u x] = 0. Dette betyder bl.a. E[y x]
! Variansen på OLS estimatoren. ! Multikollinaritet. ! Variansen i misspecificerede modeller. ! Estimat af variansen på fejlleddet
Dagens program Økonometri Den multiple regressionsmodel 4. februar 003 regressionsmodel Emnet for denne forelæsning er stadig den multiple regressionsmodel (Wooldridge kap. 3.4-3.5)! Opsamling fra sidst
! Proxy variable. ! Målefejl. ! Manglende observationer. ! Dataudvælgelse. ! Ekstreme observationer. ! Eksempel: Lønrelation (på US data)
Dagens program Økonometri 1 Specifikation, og dataproblemer 10. april 003 Emnet for denne forelæsning er specifikation (Wooldridge kap. 9.-9.4)! Proxy variable! Målefejl! Manglende observationer! Dataudvælgelse!
Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0
Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt
Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge
Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2
Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol
Økonometri: Lektion 5 Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol 1 / 35 Veksekvirkning: Motivation Vi har set på modeller som Price
Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17
nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse
Økonometri: Lektion 2 Multipel Lineær Regression 1/33
Økonometri: Lektion 2 Multipel Lineær Regression 1/33 Simpel Lineær Regression: Model Sidst så vi på simpel lineære regression. Det er en statisisk model på formen y = β 0 +β 1 x +u, hvor fejlledet u,
Normalfordelingen. Statistik og Sandsynlighedsregning 2
Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på
Økonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1
Økonometri 1 Dummyvariabler 13. oktober 2006 Økonometri 1: F10 1 Dagens program Dummyvariabler i den multiple regressionsmodel (Wooldridge kap. 7.3-7.6) Dummy variabler for kvalitative egenskaber med flere
Statistik II 4. Lektion. Logistisk regression
Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:
Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22
Dagens Emner Likelihood teori Lineær regression (intro) p. 1/22 Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 ) = ( 1 2πσ 2)n/2 e 1 2σ 2 P n (x i µ) 2 er tætheden som
Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet
Eksamen ved Københavns Universitet i Kvantitative forskningsmetoder Det Samfundsvidenskabelige Fakultet 14. december 2011 Eksamensnummer: 5 14. december 2011 Side 1 af 6 1) Af boxplottet kan man aflæse,
Bilag 12 Regressionsanalysens tabeller og forklaringer
Bilag 12 Regressionsanalysens tabeller og forklaringer Regressionsanalysens tabeller og forklaringer Regressionsanalysen vil være delt op i 2 blokke. Første blok vil analysere hvor meget de tre TPB variabler
Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning
1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion
Module 4: Ensidig variansanalyse
Module 4: Ensidig variansanalyse 4.1 Analyse af én stikprøve................. 1 4.1.1 Estimation.................... 3 4.1.2 Modelkontrol................... 4 4.1.3 Hypotesetest................... 6 4.2
Statistik Lektion 4. Variansanalyse Modelkontrol
Statistik Lektion 4 Variansanalyse Modelkontrol Eksempel Spørgsmål: Er der sammenhæng mellem udetemperaturen og forbruget af gas? Y : Forbrug af gas (gas) X : Udetemperatur (temp) Scatterplot SPSS: Estimerede
Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19
Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større
Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af
Opgave I II III IV V VI Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar 5 4 4 2 3 1 1 5 4 1
Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 1. juni 2005 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle sædvanlige Dette sæt er besvaret af (navn)
Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05
Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ
Motivation. En tegning
Motivatio Scatter-plot at det mådelige salg mod det måedlige reklamebudget. R: plot(salg ~ budget, data = salg) Økoometri Lektio Simpel Lieær Regressio salg 400 450 500 550 20 25 30 35 40 45 50 budget
Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse
Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ
Multipel Lineær Regression
Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer
Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at
Likelihood teori Lineær regression (intro) Dagens Emner Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 1 ) = ( 2πσ 2)n/2 e 1 2 P n (xi µ)2 er tætheden som funktion af
Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning
1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3
Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Appendiks A Anvendte test statistikker
Appendiks A Anvendte test statistikker Afhandlingen opdeler testene i henholdsvis parametriske og ikke-parametriske test. De første fire test er parametriske test, mens de ikke-parametriske test udgør
! Husk at udfylde spørgeskema 3. ! Lineær sandsynlighedsmodel. ! Eksempel. ! Mere om evaluering og selvselektion
Dagens program Økonometri 1 Dummy variable 4. marts 003 Emnet for denne forelæsning er kvalitative variable i den multiple regressionsmodel (Wooldridge kap. 7.5-7.6+8.1)! Husk at udfylde spørgeskema 3!
Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1
Økonometri 1 Inferens i den lineære regressionsmodel 2. oktober 2006 Økonometri 1: F8 1 Dagens program Opsamling om asymptotiske egenskaber: Asymptotisk normalitet Asymptotisk efficiens Test af flere lineære
Vejledende besvarelser til opgaver i kapitel 14
Vejledende besvarelser til opgaver i kapitel 14 Opgave 1 a) Det første trin i opstillingen af en hypotesetest er at formulere to hypoteser, hvoraf den ene støtter den teori vi vil teste, mens den anden
Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Stastistik og Databehandling på en TI-83
Stastistik og Databehandling på en TI-83 Af Jonas L. Jensen ([email protected]). 1 Fordelingsfunktioner Husk på, at en fordelingsfunktion for en stokastisk variabel X er funktionen F X (t) = P (X t) og at
Opgavebesvarelse, brain weight
Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) For 20 nyfødte mus er der i tabellen nedenfor anført oplysning om kuldstørrelsen (fra 3 til 12
18. december 2013 Mat B eksamen med hjælpemidler Peter Harremoës. P = 100 x 0.6 y 0.4 1000 = 100 x 0.6 y 0.4 10 = x 0.6 y 0.4 10 y 0.4 = x 0.
Opgave 6 Vi sætter P = 1000 og isolerer x i ligningen Se Bilag 2! P = 100 x 0.6 y 0.4 1000 = 100 x 0.6 y 0.4 10 = x 0.6 y 0.4 10 y 0.4 = x 0.6 ( 10 y 0.4 )1 /0.6 = x 10 1 /0.6 y 0.4 /0.6 = x x = 10 5 /3
Økonometri: Lektion 7 Emne: Prædiktionsintervaller, RESET teset, proxy variable og manglende data.
Økonometri: Lektion 7 Emne: Prædiktionsintervaller, RESET teset, proxy variable og manglende data. 1 / 32 Motivation Eksempel: Savings = β 0 + β 1 Income + u Vi ved allerede, hvordan vi estimerer regresseionlinjen:
Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader
Stikprøver og stikprøve fordelinger Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Statistik Statistisk Inferens: Prediktere og forekaste værdier af
To-sidet varians analyse
To-sidet varians analyse Repetition En-sidet ANOVA Parvise sammenligninger, Tukey s test Model begrebet To-sidet ANOVA Tre-sidet ANOVA Blok design SPSS ANOVA - definition ANOVA (ANalysis Of VAriance),
Rettevejledning til Økonomisk Kandidateksamen 2007II. Kvantitative Metoder 2: Tag-hjem eksamen
Rettevejledning til Økonomisk Kandidateksamen 2007II Kvantitative Metoder 2: Tag-hjem eksamen Der skal for hver studerende foretages en samlet bedømmelse af tag-hjem gruppeopgaven og den individuelle 2-timers
Module 12: Mere om variansanalyse
Module 12: Mere om variansanalyse 12.1 Parreded observationer.................. 1 12.2 Faktor med 2 niveauer (0-1 variabel)......... 3 12.3 Tosidig variansanalyse med tilfældig virkning..... 9 12.3.1 Uafhængighedsbetragtninger..........
Økonometri 1. Inferens i den lineære regressionsmodel 25. september Økonometri 1: F6 1
Økonometri 1 Inferens i den lineære regressionsmodel 25. september 2006 Økonometri 1: F6 1 Oversigt: De næste forelæsninger Statistisk inferens: hvorledes man med udgangspunkt i en statistisk model kan
Oversigt. 1 Motiverende eksempel: Højde-vægt. 2 Lineær regressionsmodel. 3 Mindste kvadraters metode (least squares)
Kursus 02402/02323 Introducerende Statistik Forelæsning 8: Simpel lineær regression Oversigt Motiverende eksempel: Højde-vægt 2 Lineær regressionsmodel 3 Mindste kvadraters metode (least squares) Klaus
To samhørende variable
To samhørende variable Statistik er tal brugt som argumenter. - Leonard Louis Levinsen Antagatviharn observationspar x 1, y 1,, x n,y n. Betragt de to tilsvarende variable x og y. Hvordan måles sammenhængen
Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet
Matematik A Studentereksamen Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet stx11-matn/a-080501 Tirsdag den 8. maj 01 Forberedelsesmateriale til stx A Net MATEMATIK Der
Økonometri 1. Dagens program. Den multiple regressionsmodel 18. september 2006
Dagens program Økonometri Den multiple regressionsmodel 8. september 006 Opsamling af statistiske resultater om den simple lineære regressionsmodel (W kap..5). Den multiple lineære regressionsmodel (W
3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve
Løsning til eksaminen d. 14. december 2009
DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,
Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser
Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier
Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression
Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π
