Repetition. Forårets højdepunkter

Relaterede dokumenter
Statistik Lektion 14 Simpel Lineær Regression. Simpel lineær regression Mindste kvadraters metode Kovarians og Korrelation

Simpel Lineær Regression - repetition

Statistik 9. gang 1 REGRESSIONSANALYSE. Korrelation (kontrol af model) Regression (tilpasning af model)

Økonometri 1. Funktionel form. Funktionel form (fortsat) Dagens program. Den simple regressionsmodel 14. september 2005

Økonometri 1. For mange variable i modellen. For få variable. Dagens program. Den multiple regressionsmodel 21. september 2004

Vi ønsker også at teste hypoteser om parametrene. F.eks: Kan µ tænkes at være 0 (eller anden fast, kendt værdi)? Eksempel: dollarkurser

Eksempel: PEFR. Epidemiologi og biostatistik. Uge 1, tirsdag. Erik Parner, Institut for Biostatistik.

Hvorfor n-1 i stikprøvevariansen?

Simpel Lineær Regression. Opsplitning af variationen Determinations koefficient Variansanalyse F-test Model-kontrol

Kvantitative metoder 2

Spørgsmål 1 (5 %) Bestem sandsynligheden for at batteriet kan anvendes i mere end 5 timer.

Statikstik II 4. Lektion. Generelle Lineære Modeller

BEVISER TIL KAPITEL 7

Variansanalyse. på normalfordelte observationer af Jens Friis

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Økonometri 1. Instrumentvariabelestimation 26. november Plan for IV gennemgang. Exogenitetsantagelsen. Exogenitetsantagelsen for OLS

Motivation. En tegning

Statistik II Lektion 4 Generelle Lineære Modeller. Simpel Lineær Regression Multipel Lineær Regression Flersidet Variansanalyse (ANOVA)

Økonometri 1. Definition og motivation. Definition og motivation. Dagens program. Den multiple regressionsmodel 21. september 2005

Statikstik II 3. Lektion. Multipel Logistisk regression Generelle Lineære Modeller

Men tilbage til regression og Chi-i-anden. test. Begge begreber refererer til normalfordelingen med middelværdi μ og spredning σ.

Scorer FCK "for mange" mål i det sidste kvarter?

Statistik Lektion 15 Mere Lineær Regression. Modelkontrol Prædiktion Multipel Lineære Regression

Notato: k grupper observeret tl tdspuktere (logartmerede) t1;t2;:::;t k. Tl tdspukt observeres et atal ( ) ph-vρrder, 1 ; 2 ;:::;. V opfatter dem som

Fordelingen af gentagne observationer (målinger) kan beskrives ved hjælp af et histogram, der viser antallet af målinger i et givet interval.

bestemmes. kendes ( ) A i Subjektiv information + objektiv information Bayesiansk statistik (gang 10) Bayes sætning

Opsamling. Simpel/Multipel Lineær Regression Logistisk Regression Ikke-parametriske Metoder Chi-i-anden Test

Betænkning om kommunernes udgiftsbehov. Bilag (med metodediskussion af professor Anders Milhøj)

Anvendt Statistik Lektion 10. Regression med både kvantitative og kvalitative forklarende variable Modelkontrol

Kvantitative metoder 2

Supplement til sandsynlighedsregning og matematisk statistik

Rettevejledning til Økonomisk Kandidateksamen 2006I, Økonometri 1

Anvendt Statistik Lektion 10. Regression med både kvantitative og kvalitative forklarende variable Modelsøgning Modelkontrol

Korrelation (kontrol af model) Regression (tilpasning af model) 1. Grad af fælles variation mellem X og Y. 2. Område og fordeling af sample data

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Analyse af bivariate data: korrelation og regression. korrelation. Korrelation og regression: Co-varians:

Induktionsbevis og sum af række side 1/7

Indeks over udviklingen i biltrafikken i Danmark

Statistik II Lektion 5 Modelkontrol. Modelkontrol Modelsøgning Større eksempel

Lineære Normale Modeller

Lineær regression lidt mere tekniske betragtninger om R^2 og et godt alternativ

Pearsons formel for χ 2 test. Den teoretiske forklaring

Statistisk analyse. Vurdering af usikkerhed i forbindelse med statistiske opgørelser forudsætter:

Økonometri lektion 7 Multipel Lineær Regression. Testbaseret Modelkontrol

Statistik II Lektion 5 Modelkontrol. Modelkontrol Modelsøgning Større eksempel

Økonometri 1. Heteroskedasticitet 27. oktober Økonometri 1: F12 1

Anvendt Statistik Lektion 3. Punkt- og intervalestimater Konfidensintervaller Valg af stikprøvestørrelse

Kogebog: 5. Beregn F d

FORDELINGER: HYPERGEOMETRISK FORDELING, BINOMIALFORDELING MIDDELVÆRDI DEFINITION. X er en stokastisk variabel på et endeligt sandsynlighedsfelt ( )

Statistik Lektion 7. Hypotesetest og kritiske værdier Type I og Type II fejl Styrken af en test Sammenligning af to populationer

Brugen af R 2 i gymnasiet

24. januar Epidemiologi og biostatistik. Forelæsning 1 Uge 1, tirsdag. Niels Trolle Andersen, Afdelingen for Biostatistik.

Regressionsanalyse. Epidemiologi og Biostatistik. 1.Simpel lineær regression (Kapitel 11) systolisk blodtryk og alder

EKSAMEN I MATEMATIK-STATISTIK, 27. JANUAR 2006, KL 9-13

Regressions modeller Hvad regresserer vi på og hvorfor? Anders Stockmarr Axelborg statistikgruppe 6/

Morten Frydenberg Biostatistik version dato:

Økonometri 1. Test for heteroskedasticitet. Test for heteroskedasticitet. Dagens program. Heteroskedasticitet 26. oktober 2005

SUPPLEMENT til Anvendt statistik

x-klasserne Gammel Hellerup Gymnasium

Generelle lineære modeller

13. februar Resumé: En statistisk analyse resulterer ofte i : Et estimat ˆ θ med en tilhørende se( ˆ θ )

Kvantitative metoder 2

Økonometri lektion 5 Multipel Lineær Regression. Inferens Modelkontrol Prædiktion

Økonometri 1. Lineær sandsynlighedsmodel. Hvad nu hvis den afhængige variabel er en kvalitativ variabel (med to kategorier)?

Økonometri 1. Definition og motivation. Definition og motivation. Dagens program. Den multiple regressionsmodel 15. februar 2006

L komponent produceret i linie 1

Kvalitet af indsendte måledata

hvor i er observationsnummeret, som løber fra 1 til stikprøvestørrelsen n, X i

Økonometri 1. Interne evalueringer. Interne evalueringer. Dagens program. Heteroskedaticitet (Specifikation og dataproblemer) 2.

Kvantitative metoder 2

Økonometri 1. Lineær sandsynlighedsmodel (Wooldridge 8.5). Dagens program: Heteroskedasticitet 30. oktober 2006

Kvantitative metoder 2

Kvantitative metoder 2

Test i to populationer. Hypotesetest for parrede observationer Test for ens varians Gensyn med flyskræk!

1 Løsning og mindste kvadraters løsninger af lineære ligningssystemer

Økonometri 1 Efterår 2006 Ugeseddel 9

IKKE-KONTINUERTE (DISKRETE) STOKASTISKE VARIABLE MIDDELVÆRDI, VARIANS, SPREDNING FORDELINGER: HYPERGEOMETRISK, BINOMIAL, POISSON

FACITLISTE TIL KOMPLEKSE TAL

Praktisk info. Statistisk analyse af en enkelt stikprøve: kendt eller ukendt varians Sandsynlighedsregning og Statistik (SaSt) I tirsdags.

Elementær Matematik. Sandsynlighedsregning

Lineær regressionsanalyse8

Løsninger til kapitel 7

Økonometri 1 Efterår 2006 Ugeseddel 13

Statistik 8. gang 1 KONFIDENSINTERVALLER. Konfidensintervaller: kapitel 11. Valg og test af fordelingsfunktion

30. august Epidemiologi og biostatistik. Forelæsning 3 Uge 2, torsdag d. 8. september 2005 Michael Væth, Afdeling for Biostatistik.

Kvantitative metoder 2 Forår 2007 Ugeseddel 9

Multipel Lineær Regression

Vægtet model. Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl. Vægte. Vægte: Eksempel. Definition: Vægtrelationen

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab

Videregående Algoritmik. David Pisinger, DIKU. Reeksamen, April 2005

Variansanalyse (ANOVA) Repetition, sammenligning af to grupper Variansanalyse: Sammenligning af flere end to middelværdier.

Kvantitative metoder 2 Forår 2007 Ugeseddel 10

antal gange krone sker i første n kast = n

6. SEMESTER Epidemiologi og Biostatistik Opgaver til 3. uge, fredag

Kontrol af udledninger ved produktion af ørred til havbrugsfisk

1.0 FORSIKRINGSFORMER

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

1 Regressionsproblemet 2

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Transkript:

Repetto Forårets højdepukter

Forårets højdepukter

Smpel Leær Regresso Smpel leær regresso: Mdste kvadraters metode Kovaras og Korrelato

Scatterplot Scatterplot kf Advertsg Epedtures (X ad Sales (Y Et scatterplot vser par (, af oservatoer. I eksemplet er reklameudget og afsætge. Sales 4 8 6 4 I scatter plottet er tlføjet e ret le 3 Advertsg 4 5 Bemærk hvorda par af og har tedes tl at lgge omkrg e ret le. hvorda par af og kke falder præcs på le. hvorda le eskrver hvorda geemst afgæger af.

Flere scatterplot X Y Y Y X X Y Y Y X X X

Smpel Leær Regresso (SLR Smpel ford v ku har é forklarede varael emlg. Leær ford sammehæge mellem og er leær.

Smpel leær regressosmodel Y X β β β d ε ε β + β + ε ε d N(, σ - de afhægge varael. - de uafhægge varael faste - det græske ogstav eta - skærgspukt med -akse - hældgskoeffcet - depedet, detcall dstruted uafhægg, detsk fordelte - det græske ogstav epslo - det eeste stokastske elemet modelle

Smpel leær regresso tegge Modelle er: ε + β d N(, σ β + ε Y E[Y X] β + β X Modelle sger: E(Y X β + β X V(Y X σ Y X ~ N(β + β X, σ Y β ε { } β X X

Edu e tegg Y Y β + β Y ~N(β + β,σ..d. ormalfordelte fejlled 3 4 5 X

Forudsætger for SLR (/3 Der er e leær sammehæg mellem X og Y. Idledede tjek: Scatter plot af (X,Y ser puktere ud tl at lgge lags e le?

Forudsætger for SLR (/3 Værdere af de uafhægge varale X atages at være faste dvs. kke stokastske. Mao. Atages X at være kedt eller målt ude støj / målefejl Idledede tjek: Logsk sas.

Forudsætger for SLR (3/3 Fejledee ε atages være uafhægge og ormalfordelte med mddelværd og varas σ. Idledede tjek: Se efter dlsede prolemer scatter plot af (X,Y.

Eksempel: Reklame udget vs salg Sammehæg mellem det ugetlge reklame-udget og det ugetlg salg? Reklame udget ( Salg ( 4 385 4 5 395 365 3 475 5 44 4 49 4 5 56 4 55 5 48 5 5

Scatterplot SPSS Graphs Chart Bulder Vælg Smple Scatter Placer relevate varale på og aksere. Klk OK

Scatterplot af data SPSS Og hva så?

Estmato Model: β + β + ε ε er..d. N(,σ β, β og σ er modelles parametre ukedte! Estmato af β og β svarer tl at vælge de le, der passer edst tl de oserverede pukter. Estmerede regressos le ˆ + er estmat for β og er estmat for β. Y hat er estmat for E(Y X Spørgsmål: Hvorda estmerer v β og β?

Resdual led e ˆ ( er de (lodrette afstade fra de estmerede le tl puktet (,. Y Det oservered e datapukt Yˆ + X Y $Y e Y ˆ Y. { ( X, Y Y ˆ de forvedtede værd for Y De fttede regressosle gvet X X X

Mdste kvadraters metode V vl fde og så summe af de kvadrede fejl lver mdst mulg. Dvs, v vl mmere SSE er Sum of Squared Errors. Skrevet ud: SSE ˆ + ( e ( Bemærk: Fukto af to varale ( og. e

Mmerg SSE er e fukto af og. SSE V vl fde og så SSE er mdst mulg.

Mmerg udført Defer fukto Q(, SSE. Dvs v skal mmere Q(,. Fremgagsmåde: Fd de to partelle afledte og : Q(, " Q dffeteret mht. - lad som om Sæt partelle afledte lg ul: ( ( Q(, Q(, To lgger med to uekedte: Løs dem! ( Q( (, er e kostat" Q(,

Omskrvg af afledte mht. ( + + Q (, (

Afledte mht. { } ( + + ( ( ( (, ( Q

+ + ( ( To lgger med to uekedte Idsæt ( ( på s plads: ( + (3 Estmat af β! Isolér o (

( ( ( + + + (3 Isoler : c c c ( ( ( Estmat af β

Estmater per hådkraft 4 6 385 485 54 4 4 6 8 5 65 395 565 9875 4 365 335 73 3 9 475 565 45 5 5 44 936 4 6 49 4 96 4 4 764 84 5 5 56 336 8 4 6 55 7565 5 65 48 34 5 5 5 6 55 4 565 5445 595 935

69 394 3. - 565-935 ( ( ( ( 5445( 4 ( 4 69 5445 394 677 97 353.7 4 Estmerede regressos le: ˆ 343.7+ 3.

Samme hstore SPSS Aalze Regresso Lear Placer de afhæge varael ( -varale Depedet. Placer de uafhægge/ forklarede varale ( -varale Idpedet(s. Klk OK.

SPSS output Estmerede regressos lje: ˆ 343.76 + 3.

Regeformler For at gøre lvet ldt lettere vl v ruge følgede forkortelser/regeformler Bemærk: Nok at udrege følgede fem udtrk: ( ( SS ( ( SS ( ( SS ( (

Ldt regeregler Regeregel: Ford: Kosekves: ( ( ( (

Estmateres fordelg Estmatore B svarede tl estmatet er ( ( SS Y Y B SS ( Bemærk at Y ere store, dvs de er stokastske varale, derfor er B også er e stokastsk varael. Estmator: Stokastsk varael. Estmat: Fast tal, dvs. ej stokastsk. Opået ved at dsætte oservatoere estmatore.

Estmatore B s fordelg Hvs de leære regressos model er sad gælder der for estmatore B : Mddelværd: Varas: Fordelg: E( B β V ( B B ~ σ ( N β, σ ( Bemærk: Når SS er stor så er S llle!

Plads tl udregger

Estmatore B s fordelg Estmatore B svarede tl estmatet er Mddelværd Varas Fordelg B Y B Y B ( β B E B V ( ( σ N B (, ~ σ β

Estmato af σ varase for fejledee I foråret estmerede v varase e uafhægg stkprøve ved s ( For smpel leær regresso ruger v Atal frhedsgrader Mus é, da s volverer ét estmat, emlg. s ( ˆ SSE MSE Mea Squared Error MSE Atal frhedsgrader Mus to, da s volverer to estmater, emlg og.

Udregg af SSE ( ( ( ( ( ( ( ( XY Y XY X X XY Y XY X Y SS SS SS SS SS SS SS SS SS SS ( ( ( ˆ + + + Hermed opår v Som desude er e uased estmator for σ. SS SS df SSE s XY Y

Næste gag Kofdestervaller for parametre Test af hpoteser Korrelato