Statistik Lektion 15 Mere Lineær Regression. Modelkontrol Prædiktion Multipel Lineære Regression
|
|
- Elias Lauridsen
- 6 år siden
- Visninger:
Transkript
1 Statstk Lekton 15 Mere Lneær Regresson Modelkontrol Prædkton Multpel Lneære Regresson
2 Smpel Lneær Regresson - repetton Spørgsmål: Afhænger y lneært af x?. Model: y = β + β x + ε ε d N(0, σ ) Systematsk komponent + Stokastsk komponent
3 Estmaton - repetton Vha. Mndste Kvadraters Metode fnder v regressonslnjen hvor b b yˆ 1 0 = = = SS b SS xy x y b x b x 1 yˆ = b0 + b1 x estmat af estmat af β β estmat af E( Y X = 1 0 x ) = β 0 + β x 1 Resdual: ˆ e = y y = y b0 b1 x
4 Kovarans og Korrelaton Defnton af kovarans: Cov(X,Y)=E[(EX-μX )(EY-μY)] Defnton af korrelatonskoeffcent: Cov(X,Y) ρ = ρ( X, Y ) = σ X σ Y ρ beskrver hvor høj grad der er en lneær sammenhæng mellem X og Y. Estmat af ρ : SSXY r = SS SS X Y
5 Forklaret og uforklaret afvgelse Y s afvgelse fra Y kan opdeles to: Y Y Yˆ Y Uforklaret afvgelse Forklaret afvgelse Y = b0 + b1 X Totale afvgelse X X X
6 Den totale varaton Den totale varaton for data er n 2 SST = ( ) ( = y 1 y = SS Varatonen data omkrng datas mddelværd SST = Sum of Squares Total Y )
7 Total og forklaret varaton - llustraton Y Y Den totale varaton ses når v kgger langs x-aksen X Den uforklarede varaton ses når v kgger langs regressonslnen X
8 Opsltnng af den totale varaton Den totale varaton kan opslttes: 2 ( ) n 2 ( ) n y y = y yˆ + ( yˆ ) 2 n = 1 = 1 = 1 y SSE n ( y ˆ ) 2 y = = er den uforklarede varaton. SSR n 1 ( y ) 2 = = er den forklarede varaton. ˆ 1 y SSR = Sum of Squares Regresson
9 Total og forklaret varaton Opspltnng af varatonen Total = Uforklaret + Forklaret 2 n 2 n ( y y) = ( y yˆ ) + ( yˆ y) n = 1 = 1 = 1 2 SST = SSE + SSR
10 Determnatons koeffcenten Determnatons Koeffcenten: Andelen af den totale varaton, der er forklaret. r 2 Forklaret varaton SSR SST SSE = = = = 1 Total varaton SST SST SSE SST Pr defnton: 0 r 2 1. Jo tættere r 2 er på 1, jo mere af varatonen data er forklaret af modellen. r 2 >0.8 er godt! r 2 meget tæt på 1 er dog mstænkelgt.
11 Eksempler på r 2 Y Y Y r 2 = 0 SST SSE X r 2 = 0.50 X SST SSE SSR r 2 = 0.90 S S E SST SSR X
12 Eksempel: Reklamebudget vs salg
13 r 2 SSR = SST = 17030, ,250 = 0,403
14 Modelkontrol For at kunne stole på test og estmater skal v skre os, at modellens antagelser er overholdt! Er der en lneær sammenhæng mellem X og Y? Er fejlleddene ε 1,, ε n uafhænge? Følger fejlleddene ε 1,, ε n alle N(0,σ 2 )?
15 Resdualanalyse Bemærk at resdualet er et estmat af fejlledet ε. e = y yˆ Dvs. e erne groft sagt skal opføre sg som uafhængge N(0,σ 2 ) varable! Grafsk kontrol: Plot e erne mod x eller. ŷ
16 Resdualplot Resdualer Resdualer 0 0 x or y$ x or y$ Homoskedastsk: Resdualerne ser ud tl at varere lge meget for alle x eller ŷ. Desuden er resdualerne ufahængge af hnanden og x. Heteroskedastsk: Varansen for resdualerne ændrer sg når x ændrer sg. Resdualer Resdualer 0 0 Td Resdualerne udvser lneær trend med tden (ellern anden varabel v kke har brugt). Dette ndkerer at td skulle nkluderes modellen. x or y$ Det buede mønster ndkerer en underlæggende kke-lneær sammenhæng.
17 TV-Statstk-Køkken Jeg har snydt og lavet mt eget data Det lgner reklame/salg data, men med flere observatoner (n=30).
18 Resdualer SPSS I Lnear Regresson vnduet vælges Save I Save vnduet vælges Unstandardzed både under Reresduals (e erne) og ŷ Predcted Values ( erne).
19 Efter endt regresson skaber SPSS to nye søjler Data Edtor, der ndeholder resdualer ( RES_1 ) prædktoner ( PRE_1 ). Derefter kan man fx lave scatter plots.
20 Scatter plot af resdualer (e erne) mod højde (x erne) (øverst) resdualer (e erne) mod prædktonerne ( erne) (nederst). ŷ Ser jo ganske usystematsk ud!
21 Grafske check for Normalfordelng For at tjekke holdbarheden af antagelsen om normalfordelte fejlled: ( ε ~N(0,σ 2 ) ) Lav et hstogram over resdualerne og se efter om det normalfordelt ud. Lave et normalfordelngsplot (Q-Q plot). Lav et formelt χ 2 -test for goodness of ft tl en normalfordelng for resdualerne (Kaptel 14)
22 Hstogram af resdualer Det ser jo ca normalfordelt ud
23 Normalfordelngsplot (Q-Q plot) For hvert resdual e udregner v q = l + 1+ m n + 1 hvor l er antallet af resdualer der er mndre end e, og m er antallet af resdualer med samme værd som e. 2 For hvert q fnder v z, så P(Z z )= q, hvor Z~N(0,1). Hvs e erne er normalfordelte vl et plot af (e, z ) lgge på en ret lne.
24 Normalfordelngsplot (Q-Q plot) Hvs alle e erne er forskellge kan v bruge en tegnng: z erne opnås ved at nddele normalfordelngen n+1 lge store stykker Areal = 1/(n+1) z 5
25 Vælg Analyze Descrptve Statstcs Q-Q plots Ser helt fnt ud snor sg kke alt for systematsk omkrng lnjen.
26 Prædkton SLR-modellen Punktprædkton: Hvlken værd vl y forventelgt antage, hvs x antager en bestemt værd, fx x=10? Svar: ˆ = b0 + b1 y 10 ˆ = b + b x y 1 Ganske smpelt ved at ndsætte x den estmerede regressons lnje! Dvs. v prædkterer som bedste bud på 0 punktets værd. Bedst kke at prædktere for x værder for langt fra, hvor v har data.
27 Prædktonsnterval for observatonen X x x n s n t y SS ) ( 1 1 1) ( ˆ ± α Et (1-α)100% prædktons nterval for Y X=x er Hvor s= MSE. Et (1-α)100% konfdens nterval for E(Y X=x) er X x x n s n t y SS ) ( 1 1) ( ˆ ± α
28 Prædktonsbånd Y Prædktonsbånd for E[Y X] Regressonslnje y Prædktonsbånd for Y X x X Prædktonsbåndene fremkommer ved at betragte konfdensntervallets endepunkter som funkton af x.
29 Multpel Lneær Regresson Data: Sæt af observatoner (x 1, x 2,, x k, y ), = 1,,n y er den afhængge varabel x 1, x 2,, x k er de k forklarende/uafhængge forklarende varable for y. Model: Y = β 0 + β 1 x β k x k + ε ε 1,,ε n IID ε ~ N(0,σ 2 ) E[Y x ] = β 0 + β 1 x β k x + k k = β 0 j = β j x 1 j (lneær mddelværd-struktur)
30 Forudsætnnger Lneær sammenhæng mellem Y og X j. X j erne er faste tal ε ~N(0,σ 2 ) (uafhænggt af x og andre ε) X erne skal være lneært uafhængge
31 Eksempel Eksempel: Y = Vægt Y = Vægt for te person X 1 = Højde X 1 = Højde for te person X 2 = Alder X 2 = Alder for te person Model for te persons vægt: ) (0, ~,, σ ε ε ε ε β β β N x x Y n d K =
32 Multpel regresson llustraton (k = 2) y ε y x 2 β 2 β β 1x1 β 2x2 β 1 β 0 x 1 y = x2 β + β x + β + ε
33 Parameter fortolknnger Y = x2 β + β x + β + ε β 0 = Værd af E(Y x 1 =x 2 = =x k =0) β j = Eks: Konstant der sger, hvor meget E(Y X) ændrer sg hvs x j vokser med 1 og alle andre x er forblver uforandrede. β 2 margnal ændrng vægt som funkton af margnal ændrng alder.
34 Estmeret Model og Resdualer Model y = β 0 + β x β x ε y e ε d N(0, σ 2 ) Estmeret model ˆ = b + b x + b x y Resdual e = yˆ y x 2 $y = b + b x + b x x 1
35 Estmaton: Mndste kvadraters metode Mnmer summen af de kvadrerede resdualer n 2 n e = 1 = k xk = = SSE ( y b b x b x b x L b ) Matematsk set samme procedure som smpel lneær regresson: Dfferenter med hensyn tl b j, j=0,...,k og sæt de k+1 lgnnger lg nul. Resultat: (k+1) lgnnger med (k+1) ubekendte. 2 Løs!! (kræver mere avanceret matematk og ekstra meget te på kanden)
36 Multpel Lneær Regresson SPSS En måde at lave multpel lneær regresson på er vha. Lnear Regresson funktonen, hvor I blot ndsætter flere varable som Independent.
37 Eksempel Model: 2 Y = β0 + β1x1 + β2x2 + ε, ε..d. N(0, σ ), = 1, K, n y = Vægt for te person x = Højde og x 1 2 = Alder for te person. Estmerede regressonslnje: y ˆ = b + b x Coeffcents a b 2 x 2 Model 1 (Constant) h jde alder a. Dependent Varable: vægt Unstandardzed Coeffcents Standardzed Coeffcents B Std. Error Beta t Sg. -102,949 4,037-25,499,000,968,022,672 43,159,000,162,012,215 13,835,000
38 Estmat af σ 2 Fejlleds-varansen Estmat af σ 2 2 SSE s = = n k 1 Estmatoren er unbased. MSE
39 Test: Er modellen umagen værd? Hypoteser H 0 : β 1 = β 2 = = β k = 0 H 1 : Mndst et β j 0 (V kan lge så godt sge, at y erne alle har en og samme mddelværd) (Der er en lneær sammenhæng mellem y og mndst ét af x j erne) Hvs H 0 er sand: MSR = SSR/k også et estmat af σ 2. Hvs H 0 ej sand: Så er MSR generelt større end σ 2. Hvs H 0 sand: MSR/MSE ~ F(k,n-k-1)
40 ANOVA Tabellen Source of varaton Sums of squares df Mean Squares F-rato P-værd Regresson SSR k MSR=SSR/k MSR/MSE? Error SSE n-k-1 MSE= SSE/(n-k-1) Total SST n-1 Jo større F=MSR/MSE er, jo mndre tror v på H 0. P-værden er sandsynlgheden for at observere en større F værd næste gang, hvs H 0 er sand.
41 Eksempel (fortsat ) ANOVA b Model 1 Regresson Resdual Total Sum of Squares df Mean Square F Sg , , ,226,000 a , , , F = MSR / MSE = ,0 / 111,98 = 934,23 P-værden er mndre end 0,05, så afvser v H 0 hypotesen, dvs. Vægt har en lneær sammenhæng med enten Højde eller vægt eller begge.
42 Test for regressonsparametre Som smpel lneær regresson har v b ~ N( β, σ ( b hvor σ(b ) 2 estmeres ved s(b ) 2. Udregnngen af s(b ) 2 overlader v tl SPSS. ) 2 )
43 Test for regressonsparametre Test for hypotesen H H 0 1 : : β = 0 β 0 (Ingen lneær sammenhæng mellem y og x ) Teststørrelse: b s( b ) t( n k 1) Problem: Som ved varans-analysen har v problemer med det samlede sgnfkans-nveau når v laver mange test. ~
44 Eksempel Model 1 (Constant) h jde alder a. Dependent Varable: vægt Unstandardzed Coeffcents Coeffcents a Standardzed Coeffcents B Std. Error Beta t Sg. -102,949 4,037-25,499,000,968,022,672 43,159,000,162,012,215 13,835,000 Betragt H 0 : β 1 =0 (Ingen lneær samh. med højde) H 1 : β 1 0 b 0,968 t-teststørrelsen: t = = = 44 s( b ) 0,022 Da P-værden er mndre end 0.05, forkaster v H 0.
Opsamling. Simpel/Multipel Lineær Regression Logistisk Regression Ikke-parametriske Metoder Chi-i-anden Test
Opsamlng Smpel/Multpel Lneær Regresson Logstsk Regresson Ikke-parametrske Metoder Ch--anden Test Opbygnng af statstsk model Specfcer model Lgnnger og antagelser Estmer parametre Modelkontrol Er modellen
Læs mereStatistik II Lektion 4 Generelle Lineære Modeller. Simpel Lineær Regression Multipel Lineær Regression Flersidet Variansanalyse (ANOVA)
Statstk II Lekton 4 Generelle Lneære Modeller Smpel Lneær Regresson Multpel Lneær Regresson Flersdet Varansanalyse (ANOVA) Logstsk regresson Y afhængg bnær varabel X 1,,X k forklarende varable, skala eller
Læs mereStatikstik II 4. Lektion. Generelle Lineære Modeller
Statkstk II 4. Lekton Generelle Lneære Modeller Generel Lneær Model Y afhængg skala varabel X 1,,X k forklarende varable, skala eller bnære Model: Mddelværden af Y gvet X + k = E( Y X ) = α + β x + + β
Læs mereStatistik II Lektion 5 Modelkontrol. Modelkontrol Modelsøgning Større eksempel
Statstk II Lekton 5 Modelkontrol Modelkontrol Modelsøgnng Større eksempel Generel Lneær Model Y afhængg skala varabel 1,, k forklarende varable, skala eller bnære Model: Mddelværden af Y gvet =( 1,, k
Læs mereAnvendt Statistik Lektion 10. Regression med både kvantitative og kvalitative forklarende variable Modelkontrol
Anvendt Statstk Lekton 0 Regresson med både kvanttatve og kvaltatve forklarende varable Modelkontrol Opsummerng I forbndelse med multpel lneær regresson så v på modeller på formen E y] = α... [ 3 3 4 4
Læs mereSimpel Lineær Regression - repetition
Smpel Leær Regresso - repetto Spørgsmål: Afhæger leært af?. Model: β + β + ε ε d N(0, σ 0 ) Sstematsk kompoet + Stokastsk kompoet Estmato - repetto Vha. Mdste Kvadraters Metode fder v regressosle hvor
Læs mereAnvendt Statistik Lektion 10. Regression med både kvantitative og kvalitative forklarende variable Modelsøgning Modelkontrol
Anvendt Statstk Lekton 0 Regresson med både kvanttatve og kvaltatve forklarende varable Modelsøgnng Modelkontrol Opsummerng I forbndelse med multpel lneær regresson så v på modeller på formen E[ y] = α...
Læs mereStatistik II Lektion 5 Modelkontrol. Modelkontrol Modelsøgning Større eksempel
Statstk II Lekton 5 Modelkontrol Modelkontrol Modelsøgnng Større eksempel Opbygnng af statstsk model Eksploratv data-analyse Specfcer model Lgnnger og antagelser Estmer parametre Modelkontrol Er modellen
Læs mereØkonometri lektion 7 Multipel Lineær Regression. Testbaseret Modelkontrol
Økonometr lekton 7 Multpel Lneær Regresson Testbaseret Modelkontrol MLR Model på Matrxform Den multple lneære regressons model kan skrves som X y = Xβ + Hvor og Mndste kvadraters metode gver følgende estmat
Læs mereStatikstik II 3. Lektion. Multipel Logistisk regression Generelle Lineære Modeller
Statkstk II 3. Lekton Multpel Logstsk regresson Generelle Lneære Modeller Defntoner: Repetton Sandsynlghed for at Ja tl at være en god læser gvet at man er en dreng skrves: P( God læser Ja Køn Dreng) Sandsynlghed
Læs mereKvantitative metoder 2
Program for dag: Kvanttatve metoder Den smple regressonsmodel 9. februar 007 Regressonsmodel med en forklarende varabel (W..3-5) Varansanalyse og goodness of ft Enheder og funktonel form af varabler modellen
Læs mereRegressionsanalyse. Epidemiologi og Biostatistik. 1.Simpel lineær regression (Kapitel 11) systolisk blodtryk og alder
Regressonsanalyse Epdemolog og Bostatstk Mogens Erlandsen, Insttut for Bostatstk Uge, torsdag (forelæsnng) 1.Smpel lneær regresson (Kaptel 11) systolsk blodtryk og alder. Multpel lneær regresson (Kaptel
Læs mereMorten Frydenberg Biostatistik version dato:
Morten Frydenberg Bostatstk verson dato: -4- Bostatstk uge mandag Morten Frydenberg, Afdelng for Bostatstk Resume: Hvad har v været gennem ndtl nu Lneær (normal) regresson en kontnuert forklarende varabel
Læs mereØkonometri 1. Heteroskedasticitet 27. oktober Økonometri 1: F12 1
Økonometr 1 Heteroskedastctet 27. oktober 2006 Økonometr 1: F12 1 Dagens program: Heteroskedastctet (Wooldrdge kap. 8.3-4) Sdste gang: I dag: Konsekvenser af heteroskedastctet for OLS Korrekton af varansen
Læs mereØkonometri 1. Lineær sandsynlighedsmodel. Hvad nu hvis den afhængige variabel er en kvalitativ variabel (med to kategorier)?
Dagens program Økonometr Heteroskedastctet 6. oktober 004 Hovedemnet for denne forelæsnng er heteroskedastctet (kap. 8.-8.3) Lneære sandsynlghedsmodel (kap 7.5) Konsekvenser af heteroskedastctet Hvordan
Læs mereLineær regressionsanalyse8
Lneær regressonsanalyse8 336 8. Lneær regressonsanalyse Lneær regressonsanalyse Fra kaptel 4 Mat C-bogen ved v, at man kan ndtegne en række punkter et koordnatsystem, for at afgøre, hvor tæt på en ret
Læs mereØkonometri 1 Efterår 2006 Ugeseddel 9
Økonometr 1 Efterår 006 Ugeseddel 9 Program for øvelserne: Opsamlng på Ugeseddel 8 Gruppearbejde SAS øvelser Ugeseddel 9 består at undersøge, om der er heteroskedastctet vores model for væksten og så fald,
Læs mereØkonometri 1. Test for heteroskedasticitet. Test for heteroskedasticitet. Dagens program. Heteroskedasticitet 26. oktober 2005
Dagens program Økonometr Heteroskedastctet 6. oktober 005 Emnet for denne forelæsnng er heteroskedastctet (Wooldrdge kap. 8.3-8.4) Konsekvenser af heteroskedastctet Hvordan fnder man en effcent estmator?
Læs mereEKSAMEN I MATEMATIK-STATISTIK, 27. JANUAR 2006, KL 9-13
EKSAMEN I MATEMATIK-STATISTIK, 7. JANUAR 006, KL 9-13 [HER STARTER STATISTIKDELEN] Opgave 3 (5%): Bologsk baggrundsnformaton tl forståelse af opgaven: Dr producerer kke altd lge meget afkom af hvert køn.
Læs mereSimpel Lineær Regression. Opsplitning af variationen Determinations koefficient Variansanalyse F-test Model-kontrol
Simpel Lieær Regressio Opsplitig af variatioe Determiatios koefficiet Variasaalse F-test Model-kotrol Opbgig af statistisk model Specificer model Ligiger og atagelser Estimer parametre Modelkotrol Er modelle
Læs mereKvantitative metoder 2
Dagens program: Heteroskedastctet (Wooldrdge kap. 8.4) Kvanttatve metoder Heteroskedastctet 6. aprl 007 Sdste gang: Konsekvenser af heteroskedastctet for OLS Whte s korrekton af OLS varansen Test for heteroskedastctet
Læs mereStatistik Lektion 14 Simpel Lineær Regression. Simpel lineær regression Mindste kvadraters metode Kovarians og Korrelation
Statstk Lekto 4 Smpel Leær Regresso Smpel leær regresso Mdste kvadraters metode Kovaras og Korrelato Scatterplot Scatterplot kf Advertsg Epedtures ( ad Sales ( Et scatterplot vser par (, af observatoer.
Læs mereAnvendt Statistik Lektion 8. Multipel Lineær Regression
Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke
Læs mereAnvendt Statistik Lektion 7. Simpel Lineær Regression
Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot
Læs mere6. SEMESTER Epidemiologi og Biostatistik Opgaver til 3. uge, fredag
Afdelng for Epdemolog Afdelng for Bostatstk 6. SEESTER Epdemolog og Bostatstk Opgaver tl 3. uge, fredag Data tl denne opgave stammer fra. Bland: An Introducton to edcal Statstcs (Exercse 11E ). V har hentet
Læs mereØkonometri lektion 5 Multipel Lineær Regression. Inferens Modelkontrol Prædiktion
Økonometri lektion 5 Multipel Lineær Regression Inferens Modelkontrol Prædiktion Multipel Lineær Regression Data: Sæt af oservationer (x i, x i,, x ki, y i, i,,n y i er den afhængige variael x i, x i,,
Læs mereStatistik Lektion 4. Variansanalyse Modelkontrol
Statistik Lektion 4 Variansanalyse Modelkontrol Eksempel Spørgsmål: Er der sammenhæng mellem udetemperaturen og forbruget af gas? Y : Forbrug af gas (gas) X : Udetemperatur (temp) Scatterplot SPSS: Estimerede
Læs mereKvantitative metoder 2
y = cy ( c 0) Plan for resten af gennemgangen Kvanttatve metoder Instrumentvarabel estmaton 4. maj 007 F5: Instrumentvarabel (IV) estmaton: Introdukton tl endogentet og nstrumentvarabler En regressor,
Læs mereKvantitative metoder 2
Kvanttatve metoder 2 Instrumentvarabel estmaton 14. maj 2007 KM2: F25 1 y = cy ( c 0) Plan for resten af gennemgangen F25: Instrumentvarabel (IV) estmaton: Introdukton tl endogentet og nstrumentvarabler
Læs mereRepetition. Forårets højdepunkter
Repetto Forårets højdepukter Forårets højdepukter Smpel Leær Regresso Smpel leær regresso: Mdste kvadraters metode Kovaras og Korrelato Scatterplot Scatterplot kf Advertsg Epedtures (X ad Sales (Y Et scatterplot
Læs merePrøveeksamen Indtjening, konkurrencesituation og produktudvikling i danske virksomheder Kommenteret vejledende besvarelse
Økonometr Prøveeksamen Indtjenng, konkurrencestuaton og produktudvklng danske vrksomheder Kommenteret vejledende besvarelse Resultaterne denne besvarelse er fremkommet ved brug af eksamensnummer 7. Dne
Læs mereMultipel Lineær Regression
Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer
Læs mereVægtet model. Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl. Vægte. Vægte: Eksempel. Definition: Vægtrelationen
Vægtet model Landmålngens fejlteor Lekton 4 Vægtet gennemsnt Fordelng af slutfejl - kkb@mathaaudk http://peoplemathaaudk/ kkb/undervsnng/lf3 Insttut for Matematske Fag Aalborg Unverstet Gvet n uafhængge
Læs mereStatistik Lektion 16 Multipel Lineær Regression
Statistik Lektion 6 Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk
Læs mereKvantitative metoder 2
Program for dag: Kvanttatve metoder Opsamlng vedr. nferens uden MLR.5: Beregnng af robuste standardfejl og kovarans under heteroskedastctet (W8.) W.6: Flere emner en multpel regressonsmodel Inferens den
Læs mereStatistik 9. gang 1 REGRESSIONSANALYSE. Korrelation (kontrol af model) Regression (tilpasning af model)
Statstk 9. gag REGRESSIONSANALYSE Korrelato kotrol af model Regresso tlpasg af model Statstk 9. gag KORRELATIONS ANALYSE. Grad af fælles varato mellem X og Y. Område og fordelg af sample data 3. Optræde
Læs mereØkonometri 1. Lineær sandsynlighedsmodel (Wooldridge 8.5). Dagens program: Heteroskedasticitet 30. oktober 2006
Dagens program: Øonometr 1 Heterosedastctet 30. otober 006 Effcent estmaton under heterosedastctet (Wooldrdge 8.4): Sdste gang: Kendte vægte - Weghted Least Squares (WLS) Generalzed Least Squares (GLS)
Læs mereLogistisk regression. Logistisk regression. Probit model Fortolkning udfra latent variabel. Odds/Odds ratio
Logstsk regresson Logstsk regresson Odds/Odds rato Probt model Fortolknng udfra latent varabel En varabel Y parameter p P( Y 1 Bernoull/bnomal fordelngen 1 1 p. er Bernoull- fordelt med sandsynlgheds hvs
Læs mereØkonometri 1. Interne evalueringer. Interne evalueringer. Dagens program. Heteroskedaticitet (Specifikation og dataproblemer) 2.
Dagens program Øonometr 1 Heterosedatctet (Specfaton og dataproblemer). november 005 dataproblemer 1 Interne evaluernger Emner for denne forelæsnng: Heterosedastctet (ap 8.4-8.5) Egensaber ved FGLS Esempel
Læs mereMultipel regression. Data fra opgave 3 side 453: Multipel regressionsmodel: Y = α + β 1 x 1 + β 2 x 2 + ǫ. hvor ǫ N(0, σ 2 ).
Program 1. multipel regression 2. polynomiel regression (og andre kurver) 3. kategoriske variable 4. Determinationkoefficient og justeret determinationskoefficient 5. ANOVA-tabel 1/13 Multipel regression
Læs mereLandbrugets efterspørgsel efter Kunstgødning. Angelo Andersen
Landbrugets efterspørgsel efter Kunstgødnng Angelo Andersen.. Problemformulerng I forbndelse med ønsket om at reducere kvælstof udlednngen fra landbruget kan det være nyttgt at undersøge hvordan landbruget
Læs mereØkonometri 1. Avancerede Paneldata Metoder II Introduktion til Instrumentvariabler 27. november 2006
Økonometr 1 Avancerede Paneldata Metoder II Introdukton tl Instrumentvarabler 27. november 2006 Paneldata metoder Sdste gang: Paneldata med to eller flere peroder og fxed effects estmaton. Første-dfferens
Læs mereØkonometri Lektion 1 Simpel Lineær Regression 1/31
Økonometri Lektion 1 Simpel Lineær Regression 1/31 Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Statistisk model: Vi antager at sammenhængen
Læs mereSandsynlighedsregning 12. forelæsning Bo Friis Nielsen
Sandsynlghedsregnng. forelæsnng Bo Frs Nelsen Matematk og Computer Scence Danmarks Teknske Unverstet 800 Kgs. Lyngby Danmark Emal: bfn@mm.dtu.dk Dagens nye emner afsnt 6.5 Den bvarate normalfordelng Y
Læs mereBinomialfordelingen: april 09 GJ
Bnomalfordelngen: aprl 09 GJ Spm A 14: Sandsynlghedsregnng og statstk. Efter en kort ntrodukton af grundlæggende begreber sandsynlghedsregnng og statstk skal du skal ntroducere bnomalfordelngsmodellen
Læs mereBilag 6: Økonometriske
Marts 2015 Blag 6: Økonometrske analyser af energselskabernes omkostnnger tl energsparendsatsen Energstyrelsen Indholdsfortegnelse 1. Paneldataanalyse 3 Specfkaton af anvendte panel regressonsmodeller
Læs mereVariansanalyse (ANOVA) Repetition, ANOVA Tjek af model antagelser Konfidensintervaller for middelværdierne Tukey s test for parvise sammenligninger
Vaansanalyse (ANOVA) Repetton, ANOVA Tjek af model antagelse Konfdensntevalle fo mddelvædene Tukey s test fo pavse sammenlgnnge ANOVA - defnton ANOVA (ANalyss Of VAance), også kaldet vaansanalyse e en
Læs mereForelæsning 11: Kapitel 11: Regressionsanalyse
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs mereUgeseddel 8. Gruppearbejde:
Ugeseddel 8 Gruppearbejde: 1. Ved at nkludere en dummyvarabel for et bestemt landeområde, svarer tl at konstatere, at dsse lande har nogle unkke karakterstka, som har betydnng for væksten, som kke gør
Læs mereModul 11: Simpel lineær regression
Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 11: Simpel lineær regression 11.1 Regression uden gentagelser............................. 1 11.1.1 Oversigt....................................
Læs mereAnalysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17
nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse
Læs mereProgram: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19
Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større
Læs mereOversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse
Læs mereØkonometri 1. Funktionel form. Funktionel form (fortsat) Dagens program. Den simple regressionsmodel 14. september 2005
Dages program Økoometr De smple regressosmodel 4. september 5 Dee forelæsg drejer sg stadg om de smple regressosmodel (Wooldrdge kap.4-.6) Fuktoel form Hvorår er OLS mddelret? Varase på OLS estmatore Regressosmodelle
Læs mereØkonometri 1. Avancerede Paneldata Metoder I 24.november F18: Avancerede Paneldata Metoder I 1
Økonometr 1 Avancerede Paneldata Metoder I 24.november 2006 F18: Avancerede Paneldata Metoder I 1 Paneldatametoder Sdste gang: Paneldata begreber og to-perode tlfældet (kap 13.3-4) Uobserveret effekt modellen:
Læs mereVægtet model. Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl. Vægte. Vægte: Eksempel. Definition: Vægtrelationen
Vægtet model Landmålngens fejlteor Lekton 4 Vægtet gennemsnt Fordelng af slutfejl - kkb@mathaaudk http://peoplemathaaudk/ kkb/undervsnng/lf Gvet n uafhængge målnger x,, x n af n størrelser µ,, µ n Målnger
Læs mereKvantitative metoder 2 Forår 2007 Ugeseddel 9
Kvanttatve metoder 2 Forår 2007 Ugeseddel 9 Program for øvelserne: Introdukton af problemstllng og datasæt Gruppearbejde SAS øvelser Paneldata for tlbagetræknngsalder Ugesedlen analyserer et datasæt med
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs mereEstimation af CES - forbrugssystemet med og uden dynamik: -fcf/fcfv sammenhold med fcv/fcfv -fct/fcts sammenhold med fcs/fcts
Danmarks Statstk MODELGRUPPEN Arbejdspapr [udkast] Andreas Østergaard Iversen 140609 Estmaton af CES - forbrugssystemet med og uden dynamk: -fcf/fcfv sammenhold med fcv/fcfv -fct/fcts sammenhold med fcs/fcts
Læs mereAntag X 1,..., X n stokastiske variable med fælles middelværdi µ og varians σ 2. Hvis µ er ukendt estimeres σ 2 ved 1/36.
Estmaton af varans/sprednng Landmålngens fejlteor Lekton 4 Vægtet gennemsnt Fordelng af slutfejl - rw@math.aau.dk Insttut for Matematske Fag Aalborg Unverstet Antag X,..., X n stokastske varable med fælles
Læs mereMultipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression
Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende
Læs mereØkonometri 1 Efterår 2006 Ugeseddel 13
Økonometr 1 Efterår 2006 Ugeseddel 13 Prram for øvelserne: Gruppearbejde plenumdskusson SAS øvelser Øvelsesopgave: Vækstregressoner (fortsat) Ugeseddel 13 fortsætter den emprske analyse af vækstregressonen
Læs mereØkonometri 1. For mange variable i modellen. For få variable. Dagens program. Den multiple regressionsmodel 21. september 2004
Dages program Økoometr De multple regressosmodel. september 004 Emet for dee forelæsg er stadg de multple regressosmodel (Wooldrdge kap. 3.4-3.5) Praktske bemærkg Opsamlg fra sdst Irrelevate varable og
Læs meremen nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller
Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =
Læs mereSandsynlighedsregning og statistik med binomialfordelingen
Sandsynlghedsregnng og statstk med bnomalfordelngen Katja Kofod Svan og Olav Lyndrup Januar 09 Indhold Stokastske varable... 3 Mddelværd og sprednng... 6 Bnomalfordelngen... Andre sandsynlghedsfordelnger...
Læs mereLineær regression. Simpel regression. Model. ofte bruges følgende notation:
Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til
Læs mereHusholdningsbudgetberegner
Chrstophe Kolodzejczyk & Ncola Krstensen Husholdnngsbudgetberegner En model for husholdnngers daglgvareforbrug udarbejdet for Penge- og Pensonspanelet Publkatonen Husholdnngsbudgetberegner En model for
Læs mereBinomialfordelingen. Erik Vestergaard
Bnomalfordelngen Erk Vestergaard Erk Vestergaard www.matematkfysk.dk Erk Vestergaard,. Blleder: Forsde: Stock.com/gnevre Sde : Stock.com/jaroon Sde : Stock.com/pod Desuden egne fotos og llustratoner. Erk
Læs mereRettevejledning til Økonomisk Kandidateksamen 2007I, Økonometri 1
Rettevejlednng tl Økonomsk Kanddateksamen 2007I, Økonometr Vurderngsgrundlaget er selve opgavebesvarelsen og blaget. Programmer og data, som er afleveret elektronsk, bedømmes som sådan kke, men er anvendt
Læs mereSimpel Lineær Regression
Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Vi antager at sammenhængen mellem y og x er beskrevet ved y = β 0 + β 1 x + u. y: Afhængige
Læs mereDLU med CES-nytte. Resumé:
Danmarks Statstk MODELGRUPPEN Arbejdspapr* Grane Høegh 17. august 2006 DLU med CES-nytte Resumé: Her papret undersøges det om en generalserng af den bagvedlggende nyttefunkton DLU fra Cobb-Douglas med
Læs mereLøsning eksamen d. 15. december 2008
Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Læs merePrøveeksamen Indtjening, konkurrencesituation og produktudvikling i danske virksomheder Kommenteret vejledende besvarelse
Økonometr Forår 00 Prøveeksamen Indtjenng, konkurrencestuaton og produktudvklng danske vrksomheder Kommenteret vejledende besvarelse Resultaterne denne besvarelse er fremkommet ved brug af eksamensnummer
Læs mereØkonometri: Lektion 6 Emne: Heteroskedasticitet
Økonometri: Lektion 6 Emne: Heteroskedasticitet 1 / 32 Konsekvenser af Heteroskedasticitet Antag her (og i resten) at MLR.1 til MLR.4 er opfyldt. Antag MLR.5 ikke er opfyldt, dvs. vi har heteroskedastiske
Læs mereUdvikling af en metode til effektvurdering af Miljøstyrelsens Kemikalieinspektions tilsyn og kontrol
Udvklng af en metode tl effektvurderng af Mljøstyrelsens Kemkalenspektons tlsyn og kontrol Orenterng fra Mljøstyrelsen Nr. 10 2010 Indhold 1 FORORD 5 2 EXECUTIVE SUMMARY 7 3 INDLEDNING 11 3.1 AFGRÆNSNING
Læs mereVi ønsker også at teste hypoteser om parametrene. F.eks: Kan µ tænkes at være 0 (eller anden fast, kendt værdi)? Eksempel: dollarkurser
Uge 37 I Teoretsk Statstk, 9.sept. 003. Fordelger kyttet tl N-ford. Gvet: uafhægge observatoer af samme N(µ,σ )-fordelte stokastske varabel. Formelt: X,X,,X uafhægge, alle N(µ,σ )-fordelt. Mddelværd µ
Læs mereLogistisk Regression. Repetition Fortolkning af odds Test i logistisk regression
Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π
Læs mereLogistisk Regression. Repetition Fortolkning af odds Test i logistisk regression
Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression: Definitioner For en binær (0/) variabel Y antager vi P(Y)p P(Y0)-p Eksempel: Bil til arbejde vs alder
Læs mereBrugen af R^2 i gymnasiet
Downloaded from orbt.dtu.dk on: Dec 0, 017 Brugen af R^ gymnaset Brockhoff, Per B.; Hansen, Ernst; Ekstrøm, Claus Thorn Publshed n: LMFK-Bladet Publcaton date: 017 Document Verson Publsher's PDF, also
Læs mereSimpel Lineær Regression: Model
Simpel Lineær Regression: Model Sidst så vi på simpel lineære regression. Det er en statisisk model på formen y = β 0 + β 1 x + u, hvor fejlledet u, har egenskaben E[u x] = 0. Dette betyder bl.a. E[y x]
Læs mereχ 2 -fordelte variable
χ -fordelte varable Defnton af χ -fordelngen Kvadratsummen V n af n uafhængge standardserede normalfordelte stokastske varable sges at være χ -fordelt med n frhedsgrader. V n fremkommer altså som V n =
Læs mereØkonometri: Lektion 2 Multipel Lineær Regression 1/27
Økonometri: Lektion 2 Multipel Lineær Regression 1/27 Multipel Lineær Regression Sidst så vi på simpel lineær regression, hvor y er forklaret af én variabel. Der er intet, der forhindre os i at have mere
Læs mereLøsninger til kapitel 12
Løsnnger tl kaptel 1 Opgave 1.1 HypoStat gver umddelbart: ft = 7 En P Teststørrelse H 0 : Alle P passer mandag 80 0,14857 48,8571 3,89737 H 1 : Ikke alle P passer trsdag 30 0,14857 48,8571 1,48899 onsdag
Læs mereTo-sidet variansanalyse
Program 1. To-sidet variansanalyse 2. Hierarkisk princip 3. Tre (og flere) sidet variansanalyse 4. Variansanalyse med blocking 5. Flersidet variansanalyse med tilfældige faktorer 6. En oversigtsslide til
Læs mereKvantitative metoder 2
Program for dag: Kvattatve metoder Iferes de leære regressosmodel 9. marts 007 Opsamlg vedr. feres e leær regressosmodel uder Gauss-Markov atagelser (W.4-5) Eksempel med flere restrktoer (F-test) Lagrage
Læs mereLineær regression i SAS. Lineær regression i SAS p.1/20
Lineær regression i SAS Lineær regression i SAS p.1/20 Lineær regression i SAS Simpel lineær regression Grafisk modelkontrol Multipel lineær regression SAS-procedurer: PROC REG PROC GPLOT Lineær regression
Læs merePrøveeksamen Indtjening, konkurrencesituation og produktudvikling i danske virksomheder Kommenteret vejledende besvarelse
Økonometr Prøveeksamen Indtjenng, konkurrencestuaton og produktudvklng danske vrksomheder Kommenteret vejledende besvarelse Resultaterne denne besvarelse er fremkommet ved brug af eksamensnummer 7. Dne
Læs mereProgram. 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12
Program 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12 Ensidet variansanalyse: analyse af grupperede data Nedbrydningsrate for tre typer af opløsningsmidler (opgave 13.8 side 523) Sorption
Læs mereAnvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele
Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning
Læs mereMLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som
MLR antagelserne Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + u, hvor β 0, β 1, β 2,...,β k er ukendte parametere,
Læs merePrøveeksamen Indtjening, konkurrencesituation og produktudvikling i danske virksomheder Kommenteret vejledende besvarelse
Økonometr Prøveeksamen Indtjenng, konkurrencestuaton og produktudvklng danske vrksomheder Kommenteret vejledende besvarelse Resultaterne denne besvarelse er fremkommet ved brug af eksamensnummer 7. Dne
Læs mereModul 12: Regression og korrelation
Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 12: Regression og korrelation 12.1 Sammenligning af to regressionslinier........................ 1 12.1.1 Test for ens hældning............................
Læs mereβ = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1
Lineær regression Lad x 1,..., x n være udfald af stokastiske variable X 1,..., X n og betragt modellen M 2 : X i N(α + βt i, σ 2 ) hvor t i, i = 1,..., n, er kendte tal. Konkret analyseres (en del af)
Læs mereIkke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test
Ikkeparametriske metoder Repetition Wilcoxon SignedRank Test KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,
Læs mereStatistik Lektion 17 Multipel Lineær Regression
Statistik Lektion 7 Multipel Lineær Regression Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test Multipel lineær regression x,x,,x
Læs mereAnvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele
Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning
Læs mereScorer FCK "for mange" mål i det sidste kvarter?
Uge 7 I Teoretsk Statstk, 9. aprl 2004. Hvor er v? Hvor var v: opstllg af statstske modeller Hvor skal v he: tro om estmato og test 2. Eksempel: FCK Estmato (tutvt) Test Maksmum lkelhood estmato Scorer
Læs mereKvantitative metoder 2 Forår 2007 Ugeseddel 10
Kvanttatve metoder 2 Forår 2007 Ugeseddel 0 Program for øvelserne: Gennemgang af teoropgave fra Ugesedel 9 Gruppearbejde og plenumdskusson SAS øvelser, spørgsmål -4. Sdste øvelsesgang (uge 2): SAS øvelser,
Læs mereLagrange multiplier test. Økonometri: Lektion 6 Håndtering ad heteroskedasticitet. Konsekvenser af Heteroskedasticitet
Lagrange multiplier test Et alternativ til F -testet af en eller flere parametre. Økonometri: Lektion 6 Håndtering ad heteroskedasticitet Antag vi har model: y = β 0 + β 1 x 2 + + β k x k + u. Vi ønsker
Læs mere