Bilag 12 Regressionsanalysens tabeller og forklaringer

Størrelse: px
Starte visningen fra side:

Download "Bilag 12 Regressionsanalysens tabeller og forklaringer"

Transkript

1 Bilag 12 Regressionsanalysens tabeller og forklaringer Regressionsanalysens tabeller og forklaringer Regressionsanalysen vil være delt op i 2 blokke. Første blok vil analysere hvor meget de tre TPB variabler forklarer Adfærdsintentionen. Blok 2 vil bruge Adfærdsintentionen som en uafhængig variable sammen med evne variablerne Vaner og Subjektiv viden, involveringsniveau og demografiske variabler til at analysere hvor meget de forklarer adfærden tilsammen. Blok 1 I blok 1 analyseres forholdene mellem den afhængige variabel Adfærdsintentionen (DV) og de tre uafhængige variabler (IV er) Holdning, Subjektiv Norm og Subjektiv Adfærdskontrol. Se figur??? Herunder. Data er analyseret gennem SPSS regression og første trin er at teste modellens forudsætninger, anden trin er at evaluere modellen og tredje trin er at evaluere hver IV. Trin 1: Test af forudsætninger Forudsætninger i modellen skal testes både før og efter Bilag 12 - Side 1 af 17

2 Forudsætning 1: = - Zero mean - linearitet Dette er den vigtigste forudsætning, for den klarlægger om der overhoved er tale om et lineært sammenhæng mellem den afhængige og uafhængige variabler. Er der ikke tal om en lineær sammenhæng mellem variablerne, så vil den bedste rette linje ikke give rigtige værdier for de fleste værdier af x og forskellen mellem og den forudsagte værdi vil have en middelværdi der ikke er = 0{{71 Hansen, Kenneth 2007}}. Denne forudsætning er altid opfyldt når der er en konstant variable i modellen {{69 Jensen 2009}} og derfor er forudsætningen i dette sammenhæng opfyldt. Endvidere vil usignifikante variabler (hvor der ingen sammenhæng er mellem DV og IV) blive fjernet ved en gennem gang af en multipel regressionsanalyse. Forudsætning 2: = Homoskedasitet af residualer Punkterne i plottet burde ligge jævnt fordelt omkring 0. Selvom der er til dels systematik i punkterne vurderes det at de ikke er nok til at konkludere heteroskedasitet. I tilfælde af heteroskedasitet ville det betyde at variansen ikke Bilag 12 - Side 2 af 17

3 varierer mellem de individuelle fejlled. Homoskedasitet er relateret til antagelsen om normalitet, fordi når man antager normalitet er forholdet mellem variablerne homoskedastiske {{27 G. Tabachnic, Barbara 2005}}. Forudsætning 3:, = - Mutually uncorrelated Denne forudsætning er kun problematisk i forhold til tidsserie data. Men da denne opgave bygger på cross-section data antages denne forudsætning at være opfyldt. Forudsætning 4:, = 0 En fjerde forudsætning er at fejlledene er uafhængige af hinanden. Da dataen er indsamlet via spørgeskemaer som er sendt ud til folks private adresse er der ingen sandsynlighed for at der er sammenhæng mellem fejlledene, da deltagerne ikke har haft nogen indflydelse på hinandens svar. Dette kan også testes i en Durbin-Watson Test som SPSS udfører. Værdien skal lægge mellem 1,5 og 2,5 og gerne omkring 2{{70 Fidell, A.P 2009}}: Da dette er tilfældet antages forudsætningen at være opfyldt. Forudsætning 5: ~.., for alle Normalitet Normalitet af standardiserede residualer Da residualerne lægger i en forholdsvis ret linje antages det at der ikke er nogen store afvigelser fra normalitet. Bilag 12 - Side 3 af 17

4 Forudsætning 6: Ingen outliers mellem den afhængige og de uafhængige variabler Fidell & Tabanhnick {{27 G. Tabachnic, Barbara 2005}} definer cases som outliers hvis de har et standardiseret residual på mere end 3,3 eller mindre end -3,3. Pallant {{72 Pallant, Julie 2007}} vurdere at det ikke er unormalt at finde et par outliers i en stor stikprøve. I residualplottet under forudsætning 2 ser det ikke umiddelbart ud til at der er nogle outliers. Det er valgt at teste via Mahalanobis distances, da det er mere sikkert at sammenligne tal. Slår man den kritiske værdi op for 3 uafhængige variabler er den og sammenlignet med for afhandlingens datasæt. Det tyder på at der er outliers. Ved at se på den nye variabel MAH_Intention i Data view vinduet, ser man at der specielt er en outliers som overskrider den kritiske værdi. Denne case er slettet fra videre analyser, fordi overskridelsen af den kritiske værdi er stor og det er efterfølgende testet at forudsætning 1-5 stadig er opfyldt. Forudsætning 7: Ingen Multicollinaritet eller singularitet Ser man på Tolerance så indikere tallene hvor meget af variansen i adfærdsintentionen som holdning alene forklare. Altså den varians som de andre variabler ikke er i stand til at forklare. Ingen af værdierne er under 0,10 og derfor tyder det ikke på at der er multikollinearitet mellem variablerne, altså at de forklarer den samme varians. Ser man videre på Variansens inflations faktor (VIF) så tyder det ligeledes ikke på at der er multikollinearitet mellem variablerne da VIF værdierne i den situation ville være noget højere, over 10. Multikollinearitet kan også afvises ved at se på modellens korrelationsmatrix. Se afsnit herunder om evaluering af modellen. Bilag 12 - Side 4 af 17

5 Trin 2: Evaluering af model I denne model ses det at pga. missung values er der forskel i antal deltagere (N) der indgår i analysen. I korrelationsmatrixen ses det at der er korrelation mellem Adfærdsintention og de uafhængige variabler. Niveauerne for korrelation burde være over 0,3 og under 0,7. Korrelationsforholdet mellem Adfærdsintentionen og Holdning er på 0,293. Afvigelsen er så lille at det vælges at se bort fra den. Den lave korrelation tyder på at Holdning kun forklarer en lille del af variansen i Adfærdsintentionen, men dog så meget at variablen forbliver i analysen indtil videre. Ingen af korrelationerne er over 0,7 hvilket betyder at de uafhængige variabler ikke i høj grad korrelere mellem hinanden, altså forklarer den samme varians i Adfærdsintentionen. De ses at de 3 uafhængige variabler (Holdning, Subjektiv Norm & Subjektiv Adfærdskontrol) forklarer 39,1 % af variansen i Adfærdsintentionen. Bilag 12 - Side 5 af 17

6 For at modellen kan betragtes som signifikant skal p < a. Modellens p-værdi er 0,000 og a = hvilket betyder at modellen er signifikant i forhold til at forklarer forholdet mellem de 3 uafhængige variabler og adfærdsintentionen. Trin 3: Evaluering af IV erne Når Iv erne skal evalueres skal der igen ses på Koefificienterne. Som det første ses der på Beta værdierne under standardiseret koefficienter. Den højeste værdi Subjektiv adfærdskontrol: 0,370. Dette betyder at subjektiv adfærdskontrol giver det største unikke bidrag til Adfærdsintentionen (DV) når der er kontrolleret for variansen af alle andre variabler i modellen. Beta værdien for Subjektiv Norm er lidt lavere (0,308) hvilket betyder den giver et lidt mindre unikt bidrag og mindste bidrag er Holdning (0,184). Herefter bliver signifikant værdierne undersøgt for at finde ud af om variablerne giver et en unik statistisk signifikant bidrag til regressionsligningen. Før dette er opfyldt skal værdierne være under 0,05. I afhandlingens koefficient tabel kan det ses at alle tre variabler her en p-værdi under 0,05 og det kan derfor konkluderes at hver uafhængig variabel giver et unikt statistisk signifikant bidrag til regressionsligningen. Som det tredje bliver det undersøgt hvor meget hver IV bidrager med til Forklaringsgraden R squre. Ved at sætte værdierne for hvert variabel i anden fx 0,180 =0,0324. Det vil betyde at Holdning bidrager til 3,2% af forklaringsgraden, hvilket man må sige er temmelig lidt. Subjektiv Norm der i mod bidrager væsentlig mere 0,284 =0,080 altså 8,0%. Men mest af alt bidrager Subjektiv Adfærdskontrol 0,341 =0,116, altså med 11,6%. Da disse tal ikke giver den total forklaringsgrad når de bliver lagt sammen er det fordi at disse part correlations værdier kun repræsentere det unikke bidrag fra hver af de uafhængige variabler, resten af forklaringsgraden skal findes i fælles variansen, altså den del af variansen i Adfærdsintentionen som ikke er unik for de enkelte variabler. Bilag 12 - Side 6 af 17

7 Blok 2 Den anden del af den multiple regressionsanalyse medtager flere variabler. Nu bliver Adfærdsintentionen til en uafhængig variable der sammen med evne variablerne Vaner og subjektiv viden, involveringsniveau og demografiske variabler skal forklarer den faktiske adfærd. Trin 1 Test af forudsætninger Forudsætning 1 = Gennemsnittet skal være lig nul linearitet Som var tilfældet i Blok 1 så skal der være linearitet mellem fejlledene. Igen er forudsætningen opfyldt da der er en kontant i regressionsligningen, nemlig adfærden. Forudsætning 2: = Homoskedasitet af residualer Da punkterne ligger jævnt fordelt omkring 0, antges at der er homoskedasitet i fejlledene. Forudsætning 3:, = - Mutually uncorrelated Denne forudsætning er kun problematisk i forhold til tidsserie data. Men da denne opgave bygger på cross-section data antages denne forudsætning at være opfyldt. Forudsætning 4:, En fjerde forudsætning er at fejlledene er uafhængige af hinanden. Da dataene er indsamlet via spørgeskemaer som er sendt ud til folks private adresse er der ingen sandsynlighed for at der er sammenhæng mellem fejlledene, da deltagerne ikke har haft nogen indflydelse på hinandens svar. Dette kan også testes i en Durbin-Watson Test som SPSS udfører. Værdien skal lægge mellem 1,5 og 2,5 og gerne omkring 2: Bilag 12 - Side 7 af 17

8 Durbin-Watson testen viser også at fejlledene er uafhængige af hinanden. Bilag 12 - Side 8 af 17

9 Forudsætning 5: ~.., for alle Normalitet Da residualerne lægger i en forholdsvis ret linje antages det at der ikke er nogen store afvigelser fra normalitet. Forudsætning 6: Ingen outliers mellem den afhængige og de uafhængige variabler Slår man kritisk værdi af Chi squres op i en tabel finder man at for 14 uafhængige variabler finder man at for en p- værdi på 0,001 er den kritiske værdi 36,123. Det ses, efter at have slettet 3 cases at der ikke længere er nogle ekstreme værdier og derfor ingen outliers. De værdier der blev slettet var hhv. 48,085, og Efterfølgende er det tjekket at forudsætning 1-5 stadig er opfyldt efter de 3 cases er slettet. Bilag 12 - Side 9 af 17

10 Forudsætning 7: Ingen Multicollinaritet eller singularitet Ser man på Tolerance så indikere tallene hvor meget af variansen i adfærdsintentionen som holdning alene forklare. Altså den varians som de andre variabler ikke er i stand til at forklare. Ingen af værdierne er under 0,10 og derfor tyder det ikke på at der er multikollinearitet mellem variablerne, altså at de forklarer den samme varians. Ser man videre på Variansens inflations faktor (VIF) så tyder det heller ikke på at der er singularitet mellem variablerne da VIF værdierne i den situation ville være noget højere, over 10. Multikollinearitet kan også afvises ved at se på modellens korrelationsmatrix. Se afsnit herunder om evaluering af modellen. Trin 2: Evaluering af model Bilag 12 - Side 10 af 17

11 Her ses Korrelationsmatrixen. Pga. den størrelse med så mange uafhængige variabler kan den være utydelig. Men det kan dig ses at er korrelation mellem Adfærden og de uafhængige variabler. Niveauerne for korrelation burde være over 0,3 mellem Adfærden og de uafhængige variabler og ikke over 0,7 mellem de uafhængige variabler. Det ses at kan, objektiv viden, hus sammensætning, boligform (eje/leje), boligbeskrivelse (m.havne/u.have), Uddannelsesniveau, profession, årsindkomst, og antal km til nærmeste genbrugsplads ikke korrelere særlig højt med Adfærden. Der vil sige at de ikke forklarer særlig meget af adfærden. Det vil sige at mange ad de demografiske variabler ikke er særlig effektive i forklaringen af adfærd. Ingen bliver taget ud af modellen endnu, det er hver enkelt IV s signifikans der bestemmer det senere i analysen. Det kan ses at der ikke er høj korrelation mellem nogle af de uafhængige variabler, altså multikollinearitet. Intention og vaner har en høj korrelation på 6,46 man den er stadig under 7 og derfor anses det ikke vor at være et problem på nuværende tidspunkt. Ud fra R square kan det ses at vores uafhængige variabler forklarer 74,8% af variansen i Adfærden. Det må siges at være et højt antal. For at modellen kan betragtes som signifikant skal p < a. Modellens p-værdi er 0,000 og a = hvilket betyder at modellen er signifikant i forhold til at forklarer forholdet mellem de 13 uafhængige variabler og adfærdsintentionen. Bilag 12 - Side 11 af 17

12 Trin 3: Evaluering af IV erne Som det første ses der på Beta værdierne under standardiseret koefficienter. Den højeste værdi Vaner Total: 0,722. Dette betyder at Vaner total giver det største unikke bidrag til Adfærden (DV) når der er kontrolleret for variansen af alle andre variabler i modellen. Beta værdien for Subjektiv Viden er noget lavere (0,161) hvilket betyder den giver et lidt mindre unikt bidrag, næst efter kommer Person sammensætning af husene med 0,129, Objektiv viden med -0,105, Profession med -0,100. resten af variablerne giver næsten ingen unikke bidrag til adfærden. Herefter bliver signifikant værdierne undersøgt for at finde ud af om variablerne giver et en unik statistisk signifikant bidrag til regressionsligningen. Før dette er opfyldt skal værdierne være under 0,05. i signifikant niveauet ses det at det kun er vaner og subjektiv viden, som er signifikant i modellen. Resten af variablerne et usignifikante, derfor bliver den uafhængigvariable som er mest usignifikant taget ud af modellen og der bliver lavet en ny multiple regression ind til alle uafhængige variabler der indgår i modellen er signifikante. Første uafhængige variable der bliver taget ud af modellen er overraskende nok adfærdsintentionen, altså den afhængige variable fra blok 1 herefter i denne rækkefølge: Km til nærmeste genbrugsplads, alder, involveringsniveau, boligbeskrivelse, uddannelses niveau, køn, Eje/lejebolig, personsammensætning i husstanden, årsindkomst og objektiv viden. Det betyder at alle demografiske variabler på nær profession er taget ud af modellen. Overraskende så er involveringsniveau også usignifikant i forhold til at forklarer adfærden og derfor også taget ud. Den endelige model indeholder kun Evne variablerne: vaner og subjektiv viden, samt den demografiske variable profession. Bilag 12 - Side 12 af 17

13 Når der er taget variabler ud af en regressions model skal forudsætningerne testen igen. Forudsætning 1 Gennemsnittet skal være lig nul linearitet Som var tilfældet i Blok 1 så skal der være linearitet mellem fejlledene. Igen er forudsætningen opfyldt da der er en kontant i regressionsligningen, nemlig adfærden. Forudsætning 2: Homoskedasitet af residualer Da punkterne ligger jævnt fordelt omkring 0, antages at der er homoskedasitet i fejlledene. Forudsætning 3:, Gensidigt ukorreleret Denne forudsætning er kun problematisk i forhold til tidsserie data. Men da denne opgave bygger på cross-section data antages denne forudsætning at være opfyldt. Forudsætning 4:, En fjerde forudsætning er at fejlledene er uafhængige af hinanden. Da dataene er indsamlet via spørgeskemaer som er sendt ud til folks private adresse er der ingen sandsynlighed for at der er sammenhæng mellem fejlledene, da deltagerne ikke har haft nogen indflydelse på hinandens svar. Dette kan også testes i en Durbin-Watson Test som SPSS udfører. Værdien skal lægge mellem 1,5 og 2,5 og gerne omkring 2: Bilag 12 - Side 13 af 17

14 Durbin-Whatsom testen er næsten præcis 2 og derfor antages forudsætningen at være overholdt. Forudsætning 5: ~.., for alle Normalitet Da residualerne lægger i en forholdsvis ret linje antages det at der ikke er nogen store afvigelser fra normalitet Forudsætning 6: Ingen outliers mellem den afhængige og de uafhængige variabler For 3 variabler er den kritiske chi square værdi 16,27 og da maximum værdier i Mahalanobis testen er 13,81 er forudsætningen overholdt. Der er altså ingen outliers i datasættet. Bilag 12 - Side 14 af 17

15 Forudsætning 7: Ingen Multicollinaritet eller singularitet Ser man på Tolerance så indikere tallene hvor meget af variansen i adfærdsintentionen som holdning alene forklare. Altså den varians som de andre variabler ikke er i stand til at forklare. Ingen af værdierne er under 0,10 og derfor tyder det ikke på at der er multikollinearitet mellem variablerne, altså at de forklarer den samme varians. Ser man videre på Variansens inflations faktor (VIF) så tyder det ligeledes ikke på at der er multikollinearitet mellem variablerne da VIF værdierne i den situation ville være noget højere, over 10. Multikollinearitet kan også afvises ved at se på modellens korrelationsmatrix. Se afsnit herunder om evaluering af modellen. Trin 2: Evaluering af model Ser man på beskrivende statisitk kan man se at stort set at næsten alle deltagerne har svaret på alle spørgsmålene i de 4 variabler, dog er der flest der har svaret på profession. Her ses Korrelationsmatrixen som er korrelation mellem Adfærden og de 3 uafhængige variabler som er signifikante i forhold til at forklare adfærden. Niveauerne for korrelation bør ikke være under 0,3 mellem Adfærden og de uafhængige variabler og ikke over 0,7 mellem de uafhængige variabler. Dog er profession noget lav da den Bilag 12 - Side 15 af 17

16 ikke engang korreler med Adfærden på 0,01. Det betyder at profession kun forklarer en meget lille del af adfærden, men dog er den signifikant og bliver i modellen. Vaner derimod forklarer, som før, rigtig meget adfærden med en korrelation på 0,829 og i midten er subjektiv viden som også forklarer Adfærden fornuftigt, nemlig emd en korrelation på 0,572. Der man på R Squre, kan man se at de tre uafhængige variabler forklarer 71,9% af variansen i adfærden. Det må antages at være rimelig godt. Dog er det ikke hele variansen der kan forklares via de 3 variabler og der må derfor være andre faktorer som forklarer de sidste 30% af variansen. Vigtigst af alt er om den muliple regresstion overhoved er signifikant i forhold til at forklarer adfærden. Før det kan bekræftes skal P<a = Da p=0,000 er regressionslingningen signifikant er vaner, subjektiv viden og profession signifikant i forhold til at forklarer adfærden. Evaluering af VI erne Til sidst skal IV erne evalueres endnu engang. Det er dog konstateret at de alle er signifikante og regressionsligningen er signifikant. Men for at se lidt nærmere på hvor meget de forskellige uafhængige variabler hver især forklarer ses der nærmere på koefficienterne igen. Bilag 12 - Side 16 af 17

17 Som det sidste bliver det undersøgt hvor meget hver IV bidrager med til Forklaringsgraden R squre. Ved at sætte værdierne for hvert variabel i anden fx 0,621 =0,385. Det vil betyde at Holdning bidrager til 38,5% af forklaringsgraden, hvilket man må sige er temmelig meget. Subjektiv Viden der i mod bidrager væsentlig mindre 0,112 =0,012 altså kun 1,2%. Mens Profession også kun bidrager lidt 0,113 =0,017, altså med 1,7%. Da disse tal ikke giver den total forklaringsgrad når de bliver lagt sammen er det fordi at disse part correlations værdier kun repræsentere det unikke bidrag fra hver af de uafhængige variabler, resten af forklaringsgraden skal findes i fælles variansen, altså den del af variansen i Adfærden som ikke er unik for de enkelte variabler. Regressionsligning Adfærd = * Vaner +137 * Subjektiv Viden * Profession. Det betyder at Bilag 12 - Side 17 af 17

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet Eksamen ved Københavns Universitet i Kvantitative forskningsmetoder Det Samfundsvidenskabelige Fakultet 14. december 2011 Eksamensnummer: 5 14. december 2011 Side 1 af 6 1) Af boxplottet kan man aflæse,

Læs mere

Fokus på Forsyning. Datagrundlag og metode

Fokus på Forsyning. Datagrundlag og metode Fokus på Forsyning I notatet gennemgås datagrundlaget for brancheanalysen af forsyningssektoren sammen med variable, regressionsmodellen og tilhørende tests. Slutteligt sammenfattes analysens resultater

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

Multipel Lineær Regression

Multipel Lineær Regression Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer

Læs mere

Statistik Lektion 17 Multipel Lineær Regression

Statistik Lektion 17 Multipel Lineær Regression Statistik Lektion 7 Multipel Lineær Regression Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test Multipel lineær regression x,x,,x

Læs mere

Appendiks Økonometrisk teori... II

Appendiks Økonometrisk teori... II Appendiks Økonometrisk teori... II De klassiske SLR-antagelser... II Hypotesetest... VII Regressioner... VIII Inflation:... VIII Test for SLR antagelser... IX Reset-test... IX Plots... X Breusch-Pagan

Læs mere

Økonometri: Lektion 2 Multipel Lineær Regression 1/27

Økonometri: Lektion 2 Multipel Lineær Regression 1/27 Økonometri: Lektion 2 Multipel Lineær Regression 1/27 Multipel Lineær Regression Sidst så vi på simpel lineær regression, hvor y er forklaret af én variabel. Der er intet, der forhindre os i at have mere

Læs mere

Simpel Lineær Regression: Model

Simpel Lineær Regression: Model Simpel Lineær Regression: Model Sidst så vi på simpel lineære regression. Det er en statisisk model på formen y = β 0 + β 1 x + u, hvor fejlledet u, har egenskaben E[u x] = 0. Dette betyder bl.a. E[y x]

Læs mere

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke

Læs mere

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning 1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion

Læs mere

Simpel Lineær Regression

Simpel Lineær Regression Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Vi antager at sammenhængen mellem y og x er beskrevet ved y = β 0 + β 1 x + u. y: Afhængige

Læs mere

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som MLR antagelserne Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + u, hvor β 0, β 1, β 2,...,β k er ukendte parametere,

Læs mere

Økonometri: Lektion 2 Multipel Lineær Regression 1/33

Økonometri: Lektion 2 Multipel Lineær Regression 1/33 Økonometri: Lektion 2 Multipel Lineær Regression 1/33 Simpel Lineær Regression: Model Sidst så vi på simpel lineære regression. Det er en statisisk model på formen y = β 0 +β 1 x +u, hvor fejlledet u,

Læs mere

Bilag 1: Beregning af omkostningsækvivalenter

Bilag 1: Beregning af omkostningsækvivalenter Bilag 1: Beregning af omkostningsækvivalenter Bilaget indeholder den tekniske beregning af omkostningsækvivalenterne til brug for benchmarkingen 2013. FORSYNINGSSEKRETARIATET FEBRUAR 2013 INDLEDNING...

Læs mere

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i. Repetition af vektor-regning Økonometri: Lektion 3 Matrix-formulering Fordelingsantagelse Hypotesetest Antag vi har to n-dimensionelle (søjle)vektorer a 1 b 1 a 2 a =. og b = b 2. a n b n Tænk på a og

Læs mere

To samhørende variable

To samhørende variable To samhørende variable Statistik er tal brugt som argumenter. - Leonard Louis Levinsen Antagatviharn observationspar x 1, y 1,, x n,y n. Betragt de to tilsvarende variable x og y. Hvordan måles sammenhængen

Læs mere

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Anvendt Statistik Lektion 7. Simpel Lineær Regression Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot

Læs mere

Økonometri Lektion 1 Simpel Lineær Regression 1/31

Økonometri Lektion 1 Simpel Lineær Regression 1/31 Økonometri Lektion 1 Simpel Lineær Regression 1/31 Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Statistisk model: Vi antager at sammenhængen

Læs mere

Appendiks A Anvendte test statistikker

Appendiks A Anvendte test statistikker Appendiks A Anvendte test statistikker Afhandlingen opdeler testene i henholdsvis parametriske og ikke-parametriske test. De første fire test er parametriske test, mens de ikke-parametriske test udgør

Læs mere

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05 Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Statistik Lektion 4. Variansanalyse Modelkontrol

Statistik Lektion 4. Variansanalyse Modelkontrol Statistik Lektion 4 Variansanalyse Modelkontrol Eksempel Spørgsmål: Er der sammenhæng mellem udetemperaturen og forbruget af gas? Y : Forbrug af gas (gas) X : Udetemperatur (temp) Scatterplot SPSS: Estimerede

Læs mere

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Kvantitative metoder 2

Kvantitative metoder 2 Kvantitative metoder 2 Specifikation og dataproblemer 2. maj 2007 KM2: F22 1 Program Specifikation og dataproblemer, fortsat (Wooldridge kap. 9): Betydning af målefejl Dataudvælgelse: Manglende observationer

Læs mere

Spm. Subjektiv Norm: Andre personer i min husstand forventer, at vores metalemballage bliver afleveret til genanvendelse 20 SN1

Spm. Subjektiv Norm: Andre personer i min husstand forventer, at vores metalemballage bliver afleveret til genanvendelse 20 SN1 Spm nr. Navn Lable 1 Køn Køn 2 Alder Alder 3 HusSammensætning Hvem bor i husstanden (person sammensætning) 4 Boligform Eje/leje bolig 5 BeskrivelseBolig Bolig beskrivelse hus/lejlighed - m.have/u.have

Læs mere

Løsninger til kapitel 14

Løsninger til kapitel 14 Opgave 14.1 a) Linjetilpasningsplottet bliver: Løsninger til kapitel 14 Idet datapunkterne ligger tæt på og jævnt fordelt omkring den rette linje, så ser det ud til, at der med rimelighed er tale om en

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af

Læs mere

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Kapitel 11 Lineær regression

Kapitel 11 Lineær regression Kapitel 11 Lineær regression Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 1 Indledning Vi modellerer en afhængig variabel (responset) på baggrund af en uafhængig variabel (stimulus),

Læs mere

Regressionsanalyse i SurveyBanken

Regressionsanalyse i SurveyBanken Først vælges datasættet De Kommunale Nøgletal. Klik på Variable Description og derefter De Kommunale Nøgletal 2010. De enkelte variable i datasættet bliver nu oplistet og kan vælges. Klik herefter på Analysis

Læs mere

Anna Kock Maj Bilag 7: Interview med Anders Rene Jensen, indkøbs- og marketingchef i Rema 1000

Anna Kock Maj Bilag 7: Interview med Anders Rene Jensen, indkøbs- og marketingchef i Rema 1000 Bilag Bilag 1: Oversigt over bilag på CD Bilag 7: Interview med Anders Rene Jensen, indkøbs- og marketingchef i Rema 1000 Bilag 8: Interview med Alexander Jensen, købmand i Rema 1000 Bilag 9: Bilag 10:

Læs mere

Eksempel , opg. 2

Eksempel , opg. 2 Faktorer En faktor er en gruppering/inddeling af målinger/observationer pga. Tilsigtede variationer i en eller flere forsøgsparametre Nødvendige (potentielle) blok-effekter såsom gentagne målinger på samme

Læs mere

Multipel Lineær Regression. Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test

Multipel Lineær Regression. Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test Multipel Lineær Regression Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test Multipel lineær regression x,x,,x k uafhængige variable

Læs mere

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl Reeksamen 2018 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 13-08-2018 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Benchmarking af kommunernes sagsbehandling antagelser, metode og resultater

Benchmarking af kommunernes sagsbehandling antagelser, metode og resultater Benchmarking af kommunernes sagsbehandling antagelser, metode og resultater Anna Amilon Materiel vurdering Ved vurderingen af en afgørelses materielle indhold vurderes afgørelsens korrekthed i forhold

Læs mere

Skriftlig eksamen Science statistik- ST501

Skriftlig eksamen Science statistik- ST501 SYDDANSK UNIVERSITET INSTITUT FOR MATEMATIK OG DATALOGI Skriftlig eksamen Science statistik- ST501 Torsdag den 21. januar Opgavesættet består af 5 opgaver, med i alt 13 delspørgsmål, som vægtes ligeligt.

Læs mere

! Proxy variable. ! Målefejl. ! Manglende observationer. ! Dataudvælgelse. ! Ekstreme observationer. ! Eksempel: Lønrelation (på US data)

! Proxy variable. ! Målefejl. ! Manglende observationer. ! Dataudvælgelse. ! Ekstreme observationer. ! Eksempel: Lønrelation (på US data) Dagens program Økonometri 1 Specifikation, og dataproblemer 10. april 003 Emnet for denne forelæsning er specifikation (Wooldridge kap. 9.-9.4)! Proxy variable! Målefejl! Manglende observationer! Dataudvælgelse!

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Økonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2

Økonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2 Økonometri 1 Den simple regressionsmodel 11. september 2006 Dagens program Den simple regressionsmodel SLR : Én forklarende variabel (Wooldridge kap. 2.1-2.4) Motivation for gennemgangen af SLR Definition

Læs mere

Statistik Lektion 16 Multipel Lineær Regression

Statistik Lektion 16 Multipel Lineær Regression Statistik Lektion 6 Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på

Læs mere

Psykisk arbejdsmiljø og stress

Psykisk arbejdsmiljø og stress Psykisk arbejdsmiljø og stress - Hvilke faktorer har indflydelse på det psykiske arbejdsmiljø og medarbejdernes stress Marts 2018 Konklusion Denne analyse forsøger at afklare, hvilke faktorer der påvirker

Læs mere

Økonometri 1. Dagens program. Den simple regressionsmodel 15. september 2006

Økonometri 1. Dagens program. Den simple regressionsmodel 15. september 2006 Dagens program Økonometri Den simple regressionsmodel 5. september 006 Den simple lineære regressionsmodel (Wooldridge kap.4-.6) Eksemplet fortsat: Løn og uddannelse på danske data Funktionel form Statistiske

Læs mere

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration Faculty of Life Sciences Program Modelkontrol og prædiktion Claus Ekstrøm E-mail: ekstrom@life.ku.dk Test af hypotese i ensidet variansanalyse F -tests og F -fordelingen. Multiple sammenligninger. Bonferroni-korrektion

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination

Læs mere

Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning

Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning Side 1 af 6 Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning Litteratur: Kenneth Hansen & Charlotte Koldsø: Statistik I økonomisk perspektiv, Hans Reitzels Forlag 2012, 2. udgave,

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

MAT A HHX FACITLISTE TIL KAPITEL 8. Øvelser. Øvelse 1 Graf tegnes med CAS. Øvelse 2. Bedste rette linie: Øvelse 3. Øvelse 4.

MAT A HHX FACITLISTE TIL KAPITEL 8. Øvelser. Øvelse 1 Graf tegnes med CAS. Øvelse 2. Bedste rette linie: Øvelse 3. Øvelse 4. 1 af 12 MAT A HHX Udskriv siden FACITLISTE TIL KAPITEL 8 Øvelser Øvelse 1 Graf tegnes med CAS. Øvelse 2 Bedste rette linie: Øvelse 3 Bedste rette linie: Øvelse 4 Bedste rette linie: Øvelse 5 ad øvelse

Læs mere

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model Reminder: Hypotesetest for én parameter Antag vi har model Økonometri: Lektion 4 F -test Justeret R 2 Aymptotiske resultater y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi ønsker at teste hypotesen H

Læs mere

Rettevejledning til Økonomisk Kandidateksamen 2007II. Økonometri 1

Rettevejledning til Økonomisk Kandidateksamen 2007II. Økonometri 1 Rettevejledning til Økonomisk Kandidateksamen 2007II Økonometri 1 Vurderingsgrundlaget for tag-hjem eksamen er selve opgavebesvarelsen og bilaget. Programmer og data bedømmes som sådan ikke, men er anvendt

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression // SVAR

ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression // SVAR ! ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression // SVAR Eksempel 1 AT OPSTILLE EN SIMPEL LINEÆR REGRESSIONSMODEL - GENNEMGÅS AF JAKOB Et stort lager måler løbende

Læs mere

Unge afgiver rask væk personlige oplysninger for at få adgang til sociale medier

Unge afgiver rask væk personlige oplysninger for at få adgang til sociale medier Af: Juniorkonsulent Christoffer Thygesen og cheføkonom Martin Kyed Notat 6. februar 06 Unge afgiver rask væk personlige oplysninger for at få adgang til sociale medier Analysens hovedresultater Kun hver

Læs mere

Fokus på forsyning Investeringer I: Behov og afkast Investeringer II: Konsekvenser

Fokus på forsyning Investeringer I: Behov og afkast Investeringer II: Konsekvenser Investeringer I: Behov og afkast Investeringer II: Konsekvenser : I notatet beskrives datagrundlaget for analyserne af spildevandsselskabernes tilstand, muligheder og valg vedr. investering og finansiering.

Læs mere

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1 Økonometri 1 Inferens i den lineære regressionsmodel 2. oktober 2006 Økonometri 1: F8 1 Dagens program Opsamling om asymptotiske egenskaber: Asymptotisk normalitet Asymptotisk efficiens Test af flere lineære

Læs mere

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering Eksamen 2016 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 17-02-2015 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm. Multiple choice opgaver Der gøres opmærksom på, at ideen med opgaverne er, at der er ét og kun ét rigtigt svar på de enkelte spørgsmål. Endvidere er det ikke givet, at alle de anførte alternative svarmuligheder

Læs mere

Kvantitative metoder 2

Kvantitative metoder 2 Kvantitative metoder 2 Den multiple regressionsmodel 5. marts 2007 regressionsmodel 1 Dagens program Emnet for denne forelæsning er stadig den multiple regressionsmodel (Wooldridge kap. 3.4-3.5, E.2) Variansen

Læs mere

02402 Løsning til testquiz02402f (Test VI)

02402 Løsning til testquiz02402f (Test VI) 02402 Løsning til testquiz02402f (Test VI) Spørgsmål 4. En ejendomsmægler ønsker at undersøge om hans kunder får mindre end hvad de har forlangt, når de sælger deres bolig. Han har regisreret følgende:

Læs mere

Skriftlig eksamen i samfundsfag

Skriftlig eksamen i samfundsfag OpenSamf Skriftlig eksamen i samfundsfag Indholdsfortegnelse 1. Introduktion 2. Præcise nedslag 3. Beregninger 3.1. Hvad kan absolutte tal være? 3.2. Procentvis ændring (vækst) 3.2.1 Tolkning af egne beregninger

Læs mere

Forelæsning 11: Kapitel 11: Regressionsanalyse

Forelæsning 11: Kapitel 11: Regressionsanalyse Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Løsning til eksaminen d. 29. maj 2009

Løsning til eksaminen d. 29. maj 2009 DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

HYPOTESE 1 - MULTIPEL REGRESSION...

HYPOTESE 1 - MULTIPEL REGRESSION... Indholdsfortegnelse Bilag 1 - TM Graveyard Model... 1 Bilag 2 - Persontransport i Danmark... 1 Bilag 3 - SG&A udgifter for TM i perioden 2010-2014... 2 Bilag 4 - Nyregistrerede biler i perioden 2011-2014...

Læs mere

ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression

ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression ! ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression Eksempel 1 AT OPSTILLE EN SIMPEL LINEÆR REGRESSIONSMODEL - GENNEMGÅS AF JAKOB Et stort lager måler løbende sine

Læs mere

Kvantitative metoder 2

Kvantitative metoder 2 Kvantitative metoder Heteroskedasticitet 11. april 007 KM: F18 1 Oversigt: Heteroskedasticitet OLS estimation under heteroskedasticitet (W.8.1-): Konsekvenser af heteroskedasticitet for OLS Gyldige test

Læs mere

Statistisk rapport Brugerundersøgelse Rudersdal Kommune 2011 og 2012

Statistisk rapport Brugerundersøgelse Rudersdal Kommune 2011 og 2012 Atlas Performance Solutions GmbH Hofstrasse 64 8032 Zürich Schweiz Statistisk rapport Brugerundersøgelse Rudersdal Kommune 2011 og 2012 Denne rapport indeholder en teknisk og statistisk oversigt over resultaterne

Læs mere

Synopsis til kursus i Statistik og skalavalidering på Folkesundhedsvidenskab

Synopsis til kursus i Statistik og skalavalidering på Folkesundhedsvidenskab Synopsis til kursus i Statistik og skalavalidering på Folkesundhedsvidenskab Eksamensnr. 26, 41 og 11 Anslag (uden tabeller og figurer): 23.933 1 1. Indledning...3 2. Deskriptiv statistik...3 3. Indledende

Læs mere

Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater.

Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater. Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater. 1 Sammenfatning Der er en statistisk signifikant positiv sammenhæng mellem opnåelse af et godt testresultat og elevernes oplevede

Læs mere

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0 Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt

Læs mere

Module 4: Ensidig variansanalyse

Module 4: Ensidig variansanalyse Module 4: Ensidig variansanalyse 4.1 Analyse af én stikprøve................. 1 4.1.1 Estimation.................... 3 4.1.2 Modelkontrol................... 4 4.1.3 Hypotesetest................... 6 4.2

Læs mere

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Statikstik II 2. Lektion Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Sandsynlighedsregningsrepetition Antag at Svar kan være Ja og Nej. Sandsynligheden for at Svar Ja skrives

Læs mere

Hver anden vil benytte øget åbningstid i dagtilbud

Hver anden vil benytte øget åbningstid i dagtilbud Børnefamiliers dagtilbud og arbejdsliv 17. maj 18 Hver anden vil benytte øget åbningstid i dagtilbud Halvdelen af alle lønmodtagere med børn mellem -13 år ville benytte sig af udvidede åbningstider i deres

Læs mere

Økonometri 1. Dagens program. Den multiple regressionsmodel 18. september 2006

Økonometri 1. Dagens program. Den multiple regressionsmodel 18. september 2006 Dagens program Økonometri Den multiple regressionsmodel 8. september 006 Opsamling af statistiske resultater om den simple lineære regressionsmodel (W kap..5). Den multiple lineære regressionsmodel (W

Læs mere

Tema: Kommunal variation i tilkendelse af førtidspension i 2008

Tema: Kommunal variation i tilkendelse af førtidspension i 2008 Tema: Kommunal variation i tilkendelse af førtidspension i 2008 Der er stor variation i, hvor mange førtidspensioner kommunerne har tilkendt i 2008. Nogle kommuner har tilkendt én eller derunder pr. 1.000

Læs mere

Center for Statistik. Multipel regression med laggede responser som forklarende variable

Center for Statistik. Multipel regression med laggede responser som forklarende variable Center for Statistik Handelshøjskolen i København MPAS Tue Tjur November 2006 Multipel regression med laggede responser som forklarende variable Ved en tidsrække forstås i almindelighed et datasæt, der

Læs mere

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større

Læs mere

Generelle lineære modeller

Generelle lineære modeller Generelle lineære modeller Regressionsmodeller med én uafhængig intervalskala variabel: Y en eller flere uafhængige variable: X 1,..,X k Den betingede fordeling af Y givet X 1,..,X k antages at være normal

Læs mere

1 Regressionsproblemet 2

1 Regressionsproblemet 2 Indhold 1 Regressionsproblemet 2 2 Simpel lineær regression 3 2.1 Mindste kvadraters tilpasning.............................. 3 2.2 Prædiktion og residualer................................. 5 2.3 Estimation

Læs mere

Økonometri lektion 5 Multipel Lineær Regression. Inferens Modelkontrol Prædiktion

Økonometri lektion 5 Multipel Lineær Regression. Inferens Modelkontrol Prædiktion Økonometri lektion 5 Multipel Lineær Regression Inferens Modelkontrol Prædiktion Multipel Lineær Regression Data: Sæt af oservationer (x i, x i,, x ki, y i, i,,n y i er den afhængige variael x i, x i,,

Læs mere

De variable, som er inkluderet i de forskellige modeller, er følgende:

De variable, som er inkluderet i de forskellige modeller, er følgende: DUL II. Undersøgelse af hvilke faktorer, der er væsentlige for at understøtte, at der er klare og veltilrettelagte mål tilstede i arbejdet med elevernes læring Følgende er en statistisk analyse af ovenstående

Læs mere

Modul 11: Simpel lineær regression

Modul 11: Simpel lineær regression Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 11: Simpel lineær regression 11.1 Regression uden gentagelser............................. 1 11.1.1 Oversigt....................................

Læs mere

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper. 1. Indlæs data. * HUSK at angive din egen placering af filen; data framing; infile '/home/sro00/mph2016/framing.txt' firstobs=2; input id sex age frw sbp sbp10 dbp chol cig chd yrschd death yrsdth cause;

Læs mere

Statistik II 1. Lektion. Analyse af kontingenstabeller

Statistik II 1. Lektion. Analyse af kontingenstabeller Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression

Læs mere

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 14. december 2009 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

1. Intoduktion. Undervisningsnoter til Øvelse i Paneldata

1. Intoduktion. Undervisningsnoter til Øvelse i Paneldata 1 Intoduktion Før man springer ud i en øvelse om paneldata og panelmodeller, kan det selvfølgelig være rart at have en fornemmelse af, hvorfor de er så vigtige i moderne mikro-økonometri, og hvorfor de

Læs mere

Bilag 16: Robusthedsanalyser af effektiviseringspotentialerne Bilaget indeholder analyser af effektiviseringspotentialernes robusthed.

Bilag 16: Robusthedsanalyser af effektiviseringspotentialerne Bilaget indeholder analyser af effektiviseringspotentialernes robusthed. Bilag 16: Robusthedsanalyser af effektiviseringspotentialerne Bilaget indeholder analyser af effektiviseringspotentialernes robusthed. FORSYNINGSSEKRETARIATET FEBRUAR 2013 INDLEDNING... 3 1. COSTDRIVERSAMMENSÆTNING...

Læs mere

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer. Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2008 En gruppe bestående af 45 patienter med reumatoid arthrit randomiseres til en af 6 mulige behandlinger, nemlig placebo, aspirin eller

Læs mere

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved Matematisk Modellering 1 (reeksamen) Side 1 Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved { 1 hvis x {1, 2, 3}, p X (x) = 3 0 ellers,

Læs mere

Løsninger til kapitel 15. størrelsen i kvadratmeter, X. en dummy-variabel, som indikerer om der er havudsigt eller ej, så er modellen

Løsninger til kapitel 15. størrelsen i kvadratmeter, X. en dummy-variabel, som indikerer om der er havudsigt eller ej, så er modellen Løsninger til kapitel 5 Opgave 5. a) Hvis Y indikerer prisen, størrelsen i kvadratmeter, afstanden i meter til vandet og en dummy-variael, som indikerer om der er havudsigt eller ej, så er modellen Y =

Læs mere

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test Ikkeparametriske metoder Repetition Wilcoxon SignedRank Test KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Undervisningsnoter til øvelse i Panel Modeller. %, it. E(x kjs

Undervisningsnoter til øvelse i Panel Modeller. %, it. E(x kjs 4 I afsnit 3 beskæftigede vi os med 1EC modellen og viste, hvordan den kunne estimereres med FGLS - bla under forudsætning af, at det individspecifikke stokastiske led er ukorreleret med de forklarende

Læs mere

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier

Læs mere

Module 3: Statistiske modeller

Module 3: Statistiske modeller Department of Statistics ST502: Statistisk modellering Pia Veldt Larsen Module 3: Statistiske modeller 31 ANOVA 1 32 Variabelselektion 4 321 Multipel determinationskoefficient 5 322 Variabelselektion med

Læs mere

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater Økonometri: Lektion 4 Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater 1 / 35 Hypotesetest for én parameter Antag vi har model y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere