Bilag 12 Regressionsanalysens tabeller og forklaringer
|
|
|
- Marianne Mikkelsen
- 9 år siden
- Visninger:
Transkript
1 Bilag 12 Regressionsanalysens tabeller og forklaringer Regressionsanalysens tabeller og forklaringer Regressionsanalysen vil være delt op i 2 blokke. Første blok vil analysere hvor meget de tre TPB variabler forklarer Adfærdsintentionen. Blok 2 vil bruge Adfærdsintentionen som en uafhængig variable sammen med evne variablerne Vaner og Subjektiv viden, involveringsniveau og demografiske variabler til at analysere hvor meget de forklarer adfærden tilsammen. Blok 1 I blok 1 analyseres forholdene mellem den afhængige variabel Adfærdsintentionen (DV) og de tre uafhængige variabler (IV er) Holdning, Subjektiv Norm og Subjektiv Adfærdskontrol. Se figur??? Herunder. Data er analyseret gennem SPSS regression og første trin er at teste modellens forudsætninger, anden trin er at evaluere modellen og tredje trin er at evaluere hver IV. Trin 1: Test af forudsætninger Forudsætninger i modellen skal testes både før og efter Bilag 12 - Side 1 af 17
2 Forudsætning 1: = - Zero mean - linearitet Dette er den vigtigste forudsætning, for den klarlægger om der overhoved er tale om et lineært sammenhæng mellem den afhængige og uafhængige variabler. Er der ikke tal om en lineær sammenhæng mellem variablerne, så vil den bedste rette linje ikke give rigtige værdier for de fleste værdier af x og forskellen mellem og den forudsagte værdi vil have en middelværdi der ikke er = 0{{71 Hansen, Kenneth 2007}}. Denne forudsætning er altid opfyldt når der er en konstant variable i modellen {{69 Jensen 2009}} og derfor er forudsætningen i dette sammenhæng opfyldt. Endvidere vil usignifikante variabler (hvor der ingen sammenhæng er mellem DV og IV) blive fjernet ved en gennem gang af en multipel regressionsanalyse. Forudsætning 2: = Homoskedasitet af residualer Punkterne i plottet burde ligge jævnt fordelt omkring 0. Selvom der er til dels systematik i punkterne vurderes det at de ikke er nok til at konkludere heteroskedasitet. I tilfælde af heteroskedasitet ville det betyde at variansen ikke Bilag 12 - Side 2 af 17
3 varierer mellem de individuelle fejlled. Homoskedasitet er relateret til antagelsen om normalitet, fordi når man antager normalitet er forholdet mellem variablerne homoskedastiske {{27 G. Tabachnic, Barbara 2005}}. Forudsætning 3:, = - Mutually uncorrelated Denne forudsætning er kun problematisk i forhold til tidsserie data. Men da denne opgave bygger på cross-section data antages denne forudsætning at være opfyldt. Forudsætning 4:, = 0 En fjerde forudsætning er at fejlledene er uafhængige af hinanden. Da dataen er indsamlet via spørgeskemaer som er sendt ud til folks private adresse er der ingen sandsynlighed for at der er sammenhæng mellem fejlledene, da deltagerne ikke har haft nogen indflydelse på hinandens svar. Dette kan også testes i en Durbin-Watson Test som SPSS udfører. Værdien skal lægge mellem 1,5 og 2,5 og gerne omkring 2{{70 Fidell, A.P 2009}}: Da dette er tilfældet antages forudsætningen at være opfyldt. Forudsætning 5: ~.., for alle Normalitet Normalitet af standardiserede residualer Da residualerne lægger i en forholdsvis ret linje antages det at der ikke er nogen store afvigelser fra normalitet. Bilag 12 - Side 3 af 17
4 Forudsætning 6: Ingen outliers mellem den afhængige og de uafhængige variabler Fidell & Tabanhnick {{27 G. Tabachnic, Barbara 2005}} definer cases som outliers hvis de har et standardiseret residual på mere end 3,3 eller mindre end -3,3. Pallant {{72 Pallant, Julie 2007}} vurdere at det ikke er unormalt at finde et par outliers i en stor stikprøve. I residualplottet under forudsætning 2 ser det ikke umiddelbart ud til at der er nogle outliers. Det er valgt at teste via Mahalanobis distances, da det er mere sikkert at sammenligne tal. Slår man den kritiske værdi op for 3 uafhængige variabler er den og sammenlignet med for afhandlingens datasæt. Det tyder på at der er outliers. Ved at se på den nye variabel MAH_Intention i Data view vinduet, ser man at der specielt er en outliers som overskrider den kritiske værdi. Denne case er slettet fra videre analyser, fordi overskridelsen af den kritiske værdi er stor og det er efterfølgende testet at forudsætning 1-5 stadig er opfyldt. Forudsætning 7: Ingen Multicollinaritet eller singularitet Ser man på Tolerance så indikere tallene hvor meget af variansen i adfærdsintentionen som holdning alene forklare. Altså den varians som de andre variabler ikke er i stand til at forklare. Ingen af værdierne er under 0,10 og derfor tyder det ikke på at der er multikollinearitet mellem variablerne, altså at de forklarer den samme varians. Ser man videre på Variansens inflations faktor (VIF) så tyder det ligeledes ikke på at der er multikollinearitet mellem variablerne da VIF værdierne i den situation ville være noget højere, over 10. Multikollinearitet kan også afvises ved at se på modellens korrelationsmatrix. Se afsnit herunder om evaluering af modellen. Bilag 12 - Side 4 af 17
5 Trin 2: Evaluering af model I denne model ses det at pga. missung values er der forskel i antal deltagere (N) der indgår i analysen. I korrelationsmatrixen ses det at der er korrelation mellem Adfærdsintention og de uafhængige variabler. Niveauerne for korrelation burde være over 0,3 og under 0,7. Korrelationsforholdet mellem Adfærdsintentionen og Holdning er på 0,293. Afvigelsen er så lille at det vælges at se bort fra den. Den lave korrelation tyder på at Holdning kun forklarer en lille del af variansen i Adfærdsintentionen, men dog så meget at variablen forbliver i analysen indtil videre. Ingen af korrelationerne er over 0,7 hvilket betyder at de uafhængige variabler ikke i høj grad korrelere mellem hinanden, altså forklarer den samme varians i Adfærdsintentionen. De ses at de 3 uafhængige variabler (Holdning, Subjektiv Norm & Subjektiv Adfærdskontrol) forklarer 39,1 % af variansen i Adfærdsintentionen. Bilag 12 - Side 5 af 17
6 For at modellen kan betragtes som signifikant skal p < a. Modellens p-værdi er 0,000 og a = hvilket betyder at modellen er signifikant i forhold til at forklarer forholdet mellem de 3 uafhængige variabler og adfærdsintentionen. Trin 3: Evaluering af IV erne Når Iv erne skal evalueres skal der igen ses på Koefificienterne. Som det første ses der på Beta værdierne under standardiseret koefficienter. Den højeste værdi Subjektiv adfærdskontrol: 0,370. Dette betyder at subjektiv adfærdskontrol giver det største unikke bidrag til Adfærdsintentionen (DV) når der er kontrolleret for variansen af alle andre variabler i modellen. Beta værdien for Subjektiv Norm er lidt lavere (0,308) hvilket betyder den giver et lidt mindre unikt bidrag og mindste bidrag er Holdning (0,184). Herefter bliver signifikant værdierne undersøgt for at finde ud af om variablerne giver et en unik statistisk signifikant bidrag til regressionsligningen. Før dette er opfyldt skal værdierne være under 0,05. I afhandlingens koefficient tabel kan det ses at alle tre variabler her en p-værdi under 0,05 og det kan derfor konkluderes at hver uafhængig variabel giver et unikt statistisk signifikant bidrag til regressionsligningen. Som det tredje bliver det undersøgt hvor meget hver IV bidrager med til Forklaringsgraden R squre. Ved at sætte værdierne for hvert variabel i anden fx 0,180 =0,0324. Det vil betyde at Holdning bidrager til 3,2% af forklaringsgraden, hvilket man må sige er temmelig lidt. Subjektiv Norm der i mod bidrager væsentlig mere 0,284 =0,080 altså 8,0%. Men mest af alt bidrager Subjektiv Adfærdskontrol 0,341 =0,116, altså med 11,6%. Da disse tal ikke giver den total forklaringsgrad når de bliver lagt sammen er det fordi at disse part correlations værdier kun repræsentere det unikke bidrag fra hver af de uafhængige variabler, resten af forklaringsgraden skal findes i fælles variansen, altså den del af variansen i Adfærdsintentionen som ikke er unik for de enkelte variabler. Bilag 12 - Side 6 af 17
7 Blok 2 Den anden del af den multiple regressionsanalyse medtager flere variabler. Nu bliver Adfærdsintentionen til en uafhængig variable der sammen med evne variablerne Vaner og subjektiv viden, involveringsniveau og demografiske variabler skal forklarer den faktiske adfærd. Trin 1 Test af forudsætninger Forudsætning 1 = Gennemsnittet skal være lig nul linearitet Som var tilfældet i Blok 1 så skal der være linearitet mellem fejlledene. Igen er forudsætningen opfyldt da der er en kontant i regressionsligningen, nemlig adfærden. Forudsætning 2: = Homoskedasitet af residualer Da punkterne ligger jævnt fordelt omkring 0, antges at der er homoskedasitet i fejlledene. Forudsætning 3:, = - Mutually uncorrelated Denne forudsætning er kun problematisk i forhold til tidsserie data. Men da denne opgave bygger på cross-section data antages denne forudsætning at være opfyldt. Forudsætning 4:, En fjerde forudsætning er at fejlledene er uafhængige af hinanden. Da dataene er indsamlet via spørgeskemaer som er sendt ud til folks private adresse er der ingen sandsynlighed for at der er sammenhæng mellem fejlledene, da deltagerne ikke har haft nogen indflydelse på hinandens svar. Dette kan også testes i en Durbin-Watson Test som SPSS udfører. Værdien skal lægge mellem 1,5 og 2,5 og gerne omkring 2: Bilag 12 - Side 7 af 17
8 Durbin-Watson testen viser også at fejlledene er uafhængige af hinanden. Bilag 12 - Side 8 af 17
9 Forudsætning 5: ~.., for alle Normalitet Da residualerne lægger i en forholdsvis ret linje antages det at der ikke er nogen store afvigelser fra normalitet. Forudsætning 6: Ingen outliers mellem den afhængige og de uafhængige variabler Slår man kritisk værdi af Chi squres op i en tabel finder man at for 14 uafhængige variabler finder man at for en p- værdi på 0,001 er den kritiske værdi 36,123. Det ses, efter at have slettet 3 cases at der ikke længere er nogle ekstreme værdier og derfor ingen outliers. De værdier der blev slettet var hhv. 48,085, og Efterfølgende er det tjekket at forudsætning 1-5 stadig er opfyldt efter de 3 cases er slettet. Bilag 12 - Side 9 af 17
10 Forudsætning 7: Ingen Multicollinaritet eller singularitet Ser man på Tolerance så indikere tallene hvor meget af variansen i adfærdsintentionen som holdning alene forklare. Altså den varians som de andre variabler ikke er i stand til at forklare. Ingen af værdierne er under 0,10 og derfor tyder det ikke på at der er multikollinearitet mellem variablerne, altså at de forklarer den samme varians. Ser man videre på Variansens inflations faktor (VIF) så tyder det heller ikke på at der er singularitet mellem variablerne da VIF værdierne i den situation ville være noget højere, over 10. Multikollinearitet kan også afvises ved at se på modellens korrelationsmatrix. Se afsnit herunder om evaluering af modellen. Trin 2: Evaluering af model Bilag 12 - Side 10 af 17
11 Her ses Korrelationsmatrixen. Pga. den størrelse med så mange uafhængige variabler kan den være utydelig. Men det kan dig ses at er korrelation mellem Adfærden og de uafhængige variabler. Niveauerne for korrelation burde være over 0,3 mellem Adfærden og de uafhængige variabler og ikke over 0,7 mellem de uafhængige variabler. Det ses at kan, objektiv viden, hus sammensætning, boligform (eje/leje), boligbeskrivelse (m.havne/u.have), Uddannelsesniveau, profession, årsindkomst, og antal km til nærmeste genbrugsplads ikke korrelere særlig højt med Adfærden. Der vil sige at de ikke forklarer særlig meget af adfærden. Det vil sige at mange ad de demografiske variabler ikke er særlig effektive i forklaringen af adfærd. Ingen bliver taget ud af modellen endnu, det er hver enkelt IV s signifikans der bestemmer det senere i analysen. Det kan ses at der ikke er høj korrelation mellem nogle af de uafhængige variabler, altså multikollinearitet. Intention og vaner har en høj korrelation på 6,46 man den er stadig under 7 og derfor anses det ikke vor at være et problem på nuværende tidspunkt. Ud fra R square kan det ses at vores uafhængige variabler forklarer 74,8% af variansen i Adfærden. Det må siges at være et højt antal. For at modellen kan betragtes som signifikant skal p < a. Modellens p-værdi er 0,000 og a = hvilket betyder at modellen er signifikant i forhold til at forklarer forholdet mellem de 13 uafhængige variabler og adfærdsintentionen. Bilag 12 - Side 11 af 17
12 Trin 3: Evaluering af IV erne Som det første ses der på Beta værdierne under standardiseret koefficienter. Den højeste værdi Vaner Total: 0,722. Dette betyder at Vaner total giver det største unikke bidrag til Adfærden (DV) når der er kontrolleret for variansen af alle andre variabler i modellen. Beta værdien for Subjektiv Viden er noget lavere (0,161) hvilket betyder den giver et lidt mindre unikt bidrag, næst efter kommer Person sammensætning af husene med 0,129, Objektiv viden med -0,105, Profession med -0,100. resten af variablerne giver næsten ingen unikke bidrag til adfærden. Herefter bliver signifikant værdierne undersøgt for at finde ud af om variablerne giver et en unik statistisk signifikant bidrag til regressionsligningen. Før dette er opfyldt skal værdierne være under 0,05. i signifikant niveauet ses det at det kun er vaner og subjektiv viden, som er signifikant i modellen. Resten af variablerne et usignifikante, derfor bliver den uafhængigvariable som er mest usignifikant taget ud af modellen og der bliver lavet en ny multiple regression ind til alle uafhængige variabler der indgår i modellen er signifikante. Første uafhængige variable der bliver taget ud af modellen er overraskende nok adfærdsintentionen, altså den afhængige variable fra blok 1 herefter i denne rækkefølge: Km til nærmeste genbrugsplads, alder, involveringsniveau, boligbeskrivelse, uddannelses niveau, køn, Eje/lejebolig, personsammensætning i husstanden, årsindkomst og objektiv viden. Det betyder at alle demografiske variabler på nær profession er taget ud af modellen. Overraskende så er involveringsniveau også usignifikant i forhold til at forklarer adfærden og derfor også taget ud. Den endelige model indeholder kun Evne variablerne: vaner og subjektiv viden, samt den demografiske variable profession. Bilag 12 - Side 12 af 17
13 Når der er taget variabler ud af en regressions model skal forudsætningerne testen igen. Forudsætning 1 Gennemsnittet skal være lig nul linearitet Som var tilfældet i Blok 1 så skal der være linearitet mellem fejlledene. Igen er forudsætningen opfyldt da der er en kontant i regressionsligningen, nemlig adfærden. Forudsætning 2: Homoskedasitet af residualer Da punkterne ligger jævnt fordelt omkring 0, antages at der er homoskedasitet i fejlledene. Forudsætning 3:, Gensidigt ukorreleret Denne forudsætning er kun problematisk i forhold til tidsserie data. Men da denne opgave bygger på cross-section data antages denne forudsætning at være opfyldt. Forudsætning 4:, En fjerde forudsætning er at fejlledene er uafhængige af hinanden. Da dataene er indsamlet via spørgeskemaer som er sendt ud til folks private adresse er der ingen sandsynlighed for at der er sammenhæng mellem fejlledene, da deltagerne ikke har haft nogen indflydelse på hinandens svar. Dette kan også testes i en Durbin-Watson Test som SPSS udfører. Værdien skal lægge mellem 1,5 og 2,5 og gerne omkring 2: Bilag 12 - Side 13 af 17
14 Durbin-Whatsom testen er næsten præcis 2 og derfor antages forudsætningen at være overholdt. Forudsætning 5: ~.., for alle Normalitet Da residualerne lægger i en forholdsvis ret linje antages det at der ikke er nogen store afvigelser fra normalitet Forudsætning 6: Ingen outliers mellem den afhængige og de uafhængige variabler For 3 variabler er den kritiske chi square værdi 16,27 og da maximum værdier i Mahalanobis testen er 13,81 er forudsætningen overholdt. Der er altså ingen outliers i datasættet. Bilag 12 - Side 14 af 17
15 Forudsætning 7: Ingen Multicollinaritet eller singularitet Ser man på Tolerance så indikere tallene hvor meget af variansen i adfærdsintentionen som holdning alene forklare. Altså den varians som de andre variabler ikke er i stand til at forklare. Ingen af værdierne er under 0,10 og derfor tyder det ikke på at der er multikollinearitet mellem variablerne, altså at de forklarer den samme varians. Ser man videre på Variansens inflations faktor (VIF) så tyder det ligeledes ikke på at der er multikollinearitet mellem variablerne da VIF værdierne i den situation ville være noget højere, over 10. Multikollinearitet kan også afvises ved at se på modellens korrelationsmatrix. Se afsnit herunder om evaluering af modellen. Trin 2: Evaluering af model Ser man på beskrivende statisitk kan man se at stort set at næsten alle deltagerne har svaret på alle spørgsmålene i de 4 variabler, dog er der flest der har svaret på profession. Her ses Korrelationsmatrixen som er korrelation mellem Adfærden og de 3 uafhængige variabler som er signifikante i forhold til at forklare adfærden. Niveauerne for korrelation bør ikke være under 0,3 mellem Adfærden og de uafhængige variabler og ikke over 0,7 mellem de uafhængige variabler. Dog er profession noget lav da den Bilag 12 - Side 15 af 17
16 ikke engang korreler med Adfærden på 0,01. Det betyder at profession kun forklarer en meget lille del af adfærden, men dog er den signifikant og bliver i modellen. Vaner derimod forklarer, som før, rigtig meget adfærden med en korrelation på 0,829 og i midten er subjektiv viden som også forklarer Adfærden fornuftigt, nemlig emd en korrelation på 0,572. Der man på R Squre, kan man se at de tre uafhængige variabler forklarer 71,9% af variansen i adfærden. Det må antages at være rimelig godt. Dog er det ikke hele variansen der kan forklares via de 3 variabler og der må derfor være andre faktorer som forklarer de sidste 30% af variansen. Vigtigst af alt er om den muliple regresstion overhoved er signifikant i forhold til at forklarer adfærden. Før det kan bekræftes skal P<a = Da p=0,000 er regressionslingningen signifikant er vaner, subjektiv viden og profession signifikant i forhold til at forklarer adfærden. Evaluering af VI erne Til sidst skal IV erne evalueres endnu engang. Det er dog konstateret at de alle er signifikante og regressionsligningen er signifikant. Men for at se lidt nærmere på hvor meget de forskellige uafhængige variabler hver især forklarer ses der nærmere på koefficienterne igen. Bilag 12 - Side 16 af 17
17 Som det sidste bliver det undersøgt hvor meget hver IV bidrager med til Forklaringsgraden R squre. Ved at sætte værdierne for hvert variabel i anden fx 0,621 =0,385. Det vil betyde at Holdning bidrager til 38,5% af forklaringsgraden, hvilket man må sige er temmelig meget. Subjektiv Viden der i mod bidrager væsentlig mindre 0,112 =0,012 altså kun 1,2%. Mens Profession også kun bidrager lidt 0,113 =0,017, altså med 1,7%. Da disse tal ikke giver den total forklaringsgrad når de bliver lagt sammen er det fordi at disse part correlations værdier kun repræsentere det unikke bidrag fra hver af de uafhængige variabler, resten af forklaringsgraden skal findes i fælles variansen, altså den del af variansen i Adfærden som ikke er unik for de enkelte variabler. Regressionsligning Adfærd = * Vaner +137 * Subjektiv Viden * Profession. Det betyder at Bilag 12 - Side 17 af 17
Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet
Eksamen ved Københavns Universitet i Kvantitative forskningsmetoder Det Samfundsvidenskabelige Fakultet 14. december 2011 Eksamensnummer: 5 14. december 2011 Side 1 af 6 1) Af boxplottet kan man aflæse,
Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17
nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse
Multipel Lineær Regression
Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer
Statistik Lektion 17 Multipel Lineær Regression
Statistik Lektion 7 Multipel Lineær Regression Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test Multipel lineær regression x,x,,x
Appendiks Økonometrisk teori... II
Appendiks Økonometrisk teori... II De klassiske SLR-antagelser... II Hypotesetest... VII Regressioner... VIII Inflation:... VIII Test for SLR antagelser... IX Reset-test... IX Plots... X Breusch-Pagan
Økonometri: Lektion 2 Multipel Lineær Regression 1/27
Økonometri: Lektion 2 Multipel Lineær Regression 1/27 Multipel Lineær Regression Sidst så vi på simpel lineær regression, hvor y er forklaret af én variabel. Der er intet, der forhindre os i at have mere
Simpel Lineær Regression: Model
Simpel Lineær Regression: Model Sidst så vi på simpel lineære regression. Det er en statisisk model på formen y = β 0 + β 1 x + u, hvor fejlledet u, har egenskaben E[u x] = 0. Dette betyder bl.a. E[y x]
Anvendt Statistik Lektion 8. Multipel Lineær Regression
Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke
Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning
1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion
Simpel Lineær Regression
Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Vi antager at sammenhængen mellem y og x er beskrevet ved y = β 0 + β 1 x + u. y: Afhængige
MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som
MLR antagelserne Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + u, hvor β 0, β 1, β 2,...,β k er ukendte parametere,
Økonometri: Lektion 2 Multipel Lineær Regression 1/33
Økonometri: Lektion 2 Multipel Lineær Regression 1/33 Simpel Lineær Regression: Model Sidst så vi på simpel lineære regression. Det er en statisisk model på formen y = β 0 +β 1 x +u, hvor fejlledet u,
To samhørende variable
To samhørende variable Statistik er tal brugt som argumenter. - Leonard Louis Levinsen Antagatviharn observationspar x 1, y 1,, x n,y n. Betragt de to tilsvarende variable x og y. Hvordan måles sammenhængen
Anvendt Statistik Lektion 7. Simpel Lineær Regression
Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot
Økonometri Lektion 1 Simpel Lineær Regression 1/31
Økonometri Lektion 1 Simpel Lineær Regression 1/31 Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Statistisk model: Vi antager at sammenhængen
Appendiks A Anvendte test statistikker
Appendiks A Anvendte test statistikker Afhandlingen opdeler testene i henholdsvis parametriske og ikke-parametriske test. De første fire test er parametriske test, mens de ikke-parametriske test udgør
Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05
Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ
Statistik Lektion 4. Variansanalyse Modelkontrol
Statistik Lektion 4 Variansanalyse Modelkontrol Eksempel Spørgsmål: Er der sammenhæng mellem udetemperaturen og forbruget af gas? Y : Forbrug af gas (gas) X : Udetemperatur (temp) Scatterplot SPSS: Estimerede
Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse
Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ
Løsninger til kapitel 14
Opgave 14.1 a) Linjetilpasningsplottet bliver: Løsninger til kapitel 14 Idet datapunkterne ligger tæt på og jævnt fordelt omkring den rette linje, så ser det ud til, at der med rimelighed er tale om en
Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af
Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression
Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende
Konfidensintervaller og Hypotesetest
Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller
Kapitel 11 Lineær regression
Kapitel 11 Lineær regression Peter Tibert Stoltze [email protected] Elementær statistik F2011 1 / 1 Indledning Vi modellerer en afhængig variabel (responset) på baggrund af en uafhængig variabel (stimulus),
Regressionsanalyse i SurveyBanken
Først vælges datasættet De Kommunale Nøgletal. Klik på Variable Description og derefter De Kommunale Nøgletal 2010. De enkelte variable i datasættet bliver nu oplistet og kan vælges. Klik herefter på Analysis
Anna Kock Maj Bilag 7: Interview med Anders Rene Jensen, indkøbs- og marketingchef i Rema 1000
Bilag Bilag 1: Oversigt over bilag på CD Bilag 7: Interview med Anders Rene Jensen, indkøbs- og marketingchef i Rema 1000 Bilag 8: Interview med Alexander Jensen, købmand i Rema 1000 Bilag 9: Bilag 10:
Multipel Lineær Regression. Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test
Multipel Lineær Regression Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test Multipel lineær regression x,x,,x k uafhængige variable
Skriftlig eksamen Science statistik- ST501
SYDDANSK UNIVERSITET INSTITUT FOR MATEMATIK OG DATALOGI Skriftlig eksamen Science statistik- ST501 Torsdag den 21. januar Opgavesættet består af 5 opgaver, med i alt 13 delspørgsmål, som vægtes ligeligt.
! Proxy variable. ! Målefejl. ! Manglende observationer. ! Dataudvælgelse. ! Ekstreme observationer. ! Eksempel: Lønrelation (på US data)
Dagens program Økonometri 1 Specifikation, og dataproblemer 10. april 003 Emnet for denne forelæsning er specifikation (Wooldridge kap. 9.-9.4)! Proxy variable! Målefejl! Manglende observationer! Dataudvælgelse!
Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ
Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet
Løsning til eksaminen d. 14. december 2009
DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,
Økonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2
Økonometri 1 Den simple regressionsmodel 11. september 2006 Dagens program Den simple regressionsmodel SLR : Én forklarende variabel (Wooldridge kap. 2.1-2.4) Motivation for gennemgangen af SLR Definition
Statistik Lektion 16 Multipel Lineær Regression
Statistik Lektion 6 Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk
Normalfordelingen. Statistik og Sandsynlighedsregning 2
Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på
Psykisk arbejdsmiljø og stress
Psykisk arbejdsmiljø og stress - Hvilke faktorer har indflydelse på det psykiske arbejdsmiljø og medarbejdernes stress Marts 2018 Konklusion Denne analyse forsøger at afklare, hvilke faktorer der påvirker
Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test
Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,
Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration
Faculty of Life Sciences Program Modelkontrol og prædiktion Claus Ekstrøm E-mail: [email protected] Test af hypotese i ensidet variansanalyse F -tests og F -fordelingen. Multiple sammenligninger. Bonferroni-korrektion
Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination
Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning
Side 1 af 6 Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning Litteratur: Kenneth Hansen & Charlotte Koldsø: Statistik I økonomisk perspektiv, Hans Reitzels Forlag 2012, 2. udgave,
Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
MAT A HHX FACITLISTE TIL KAPITEL 8. Øvelser. Øvelse 1 Graf tegnes med CAS. Øvelse 2. Bedste rette linie: Øvelse 3. Øvelse 4.
1 af 12 MAT A HHX Udskriv siden FACITLISTE TIL KAPITEL 8 Øvelser Øvelse 1 Graf tegnes med CAS. Øvelse 2 Bedste rette linie: Øvelse 3 Bedste rette linie: Øvelse 4 Bedste rette linie: Øvelse 5 ad øvelse
Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model
Reminder: Hypotesetest for én parameter Antag vi har model Økonometri: Lektion 4 F -test Justeret R 2 Aymptotiske resultater y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi ønsker at teste hypotesen H
Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression // SVAR
! ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression // SVAR Eksempel 1 AT OPSTILLE EN SIMPEL LINEÆR REGRESSIONSMODEL - GENNEMGÅS AF JAKOB Et stort lager måler løbende
Unge afgiver rask væk personlige oplysninger for at få adgang til sociale medier
Af: Juniorkonsulent Christoffer Thygesen og cheføkonom Martin Kyed Notat 6. februar 06 Unge afgiver rask væk personlige oplysninger for at få adgang til sociale medier Analysens hovedresultater Kun hver
Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse
Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1
Økonometri 1 Inferens i den lineære regressionsmodel 2. oktober 2006 Økonometri 1: F8 1 Dagens program Opsamling om asymptotiske egenskaber: Asymptotisk normalitet Asymptotisk efficiens Test af flere lineære
Eksamen Bacheloruddannelsen i Medicin med industriel specialisering
Eksamen 2016 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 17-02-2015 Tid: kl. 09.00-11.00 Bedømmelsesform
Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.
Multiple choice opgaver Der gøres opmærksom på, at ideen med opgaverne er, at der er ét og kun ét rigtigt svar på de enkelte spørgsmål. Endvidere er det ikke givet, at alle de anførte alternative svarmuligheder
Kvantitative metoder 2
Kvantitative metoder 2 Den multiple regressionsmodel 5. marts 2007 regressionsmodel 1 Dagens program Emnet for denne forelæsning er stadig den multiple regressionsmodel (Wooldridge kap. 3.4-3.5, E.2) Variansen
02402 Løsning til testquiz02402f (Test VI)
02402 Løsning til testquiz02402f (Test VI) Spørgsmål 4. En ejendomsmægler ønsker at undersøge om hans kunder får mindre end hvad de har forlangt, når de sælger deres bolig. Han har regisreret følgende:
Skriftlig eksamen i samfundsfag
OpenSamf Skriftlig eksamen i samfundsfag Indholdsfortegnelse 1. Introduktion 2. Præcise nedslag 3. Beregninger 3.1. Hvad kan absolutte tal være? 3.2. Procentvis ændring (vækst) 3.2.1 Tolkning af egne beregninger
Forelæsning 11: Kapitel 11: Regressionsanalyse
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Løsning til eksaminen d. 29. maj 2009
DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
HYPOTESE 1 - MULTIPEL REGRESSION...
Indholdsfortegnelse Bilag 1 - TM Graveyard Model... 1 Bilag 2 - Persontransport i Danmark... 1 Bilag 3 - SG&A udgifter for TM i perioden 2010-2014... 2 Bilag 4 - Nyregistrerede biler i perioden 2011-2014...
ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression
! ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression Eksempel 1 AT OPSTILLE EN SIMPEL LINEÆR REGRESSIONSMODEL - GENNEMGÅS AF JAKOB Et stort lager måler løbende sine
Kvantitative metoder 2
Kvantitative metoder Heteroskedasticitet 11. april 007 KM: F18 1 Oversigt: Heteroskedasticitet OLS estimation under heteroskedasticitet (W.8.1-): Konsekvenser af heteroskedasticitet for OLS Gyldige test
Synopsis til kursus i Statistik og skalavalidering på Folkesundhedsvidenskab
Synopsis til kursus i Statistik og skalavalidering på Folkesundhedsvidenskab Eksamensnr. 26, 41 og 11 Anslag (uden tabeller og figurer): 23.933 1 1. Indledning...3 2. Deskriptiv statistik...3 3. Indledende
Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater.
Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater. 1 Sammenfatning Der er en statistisk signifikant positiv sammenhæng mellem opnåelse af et godt testresultat og elevernes oplevede
Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0
Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt
Module 4: Ensidig variansanalyse
Module 4: Ensidig variansanalyse 4.1 Analyse af én stikprøve................. 1 4.1.1 Estimation.................... 3 4.1.2 Modelkontrol................... 4 4.1.3 Hypotesetest................... 6 4.2
Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression
Statikstik II 2. Lektion Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Sandsynlighedsregningsrepetition Antag at Svar kan være Ja og Nej. Sandsynligheden for at Svar Ja skrives
Økonometri 1. Dagens program. Den multiple regressionsmodel 18. september 2006
Dagens program Økonometri Den multiple regressionsmodel 8. september 006 Opsamling af statistiske resultater om den simple lineære regressionsmodel (W kap..5). Den multiple lineære regressionsmodel (W
Center for Statistik. Multipel regression med laggede responser som forklarende variable
Center for Statistik Handelshøjskolen i København MPAS Tue Tjur November 2006 Multipel regression med laggede responser som forklarende variable Ved en tidsrække forstås i almindelighed et datasæt, der
Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19
Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større
Generelle lineære modeller
Generelle lineære modeller Regressionsmodeller med én uafhængig intervalskala variabel: Y en eller flere uafhængige variable: X 1,..,X k Den betingede fordeling af Y givet X 1,..,X k antages at være normal
Økonometri lektion 5 Multipel Lineær Regression. Inferens Modelkontrol Prædiktion
Økonometri lektion 5 Multipel Lineær Regression Inferens Modelkontrol Prædiktion Multipel Lineær Regression Data: Sæt af oservationer (x i, x i,, x ki, y i, i,,n y i er den afhængige variael x i, x i,,
De variable, som er inkluderet i de forskellige modeller, er følgende:
DUL II. Undersøgelse af hvilke faktorer, der er væsentlige for at understøtte, at der er klare og veltilrettelagte mål tilstede i arbejdet med elevernes læring Følgende er en statistisk analyse af ovenstående
Modul 11: Simpel lineær regression
Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 11: Simpel lineær regression 11.1 Regression uden gentagelser............................. 1 11.1.1 Oversigt....................................
Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.
1. Indlæs data. * HUSK at angive din egen placering af filen; data framing; infile '/home/sro00/mph2016/framing.txt' firstobs=2; input id sex age frw sbp sbp10 dbp chol cig chd yrschd death yrsdth cause;
Statistik II 1. Lektion. Analyse af kontingenstabeller
Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression
Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning
1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3
Løsning eksamen d. 15. december 2008
Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
1. Intoduktion. Undervisningsnoter til Øvelse i Paneldata
1 Intoduktion Før man springer ud i en øvelse om paneldata og panelmodeller, kan det selvfølgelig være rart at have en fornemmelse af, hvorfor de er så vigtige i moderne mikro-økonometri, og hvorfor de
1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.
Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2008 En gruppe bestående af 45 patienter med reumatoid arthrit randomiseres til en af 6 mulige behandlinger, nemlig placebo, aspirin eller
Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved
Matematisk Modellering 1 (reeksamen) Side 1 Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved { 1 hvis x {1, 2, 3}, p X (x) = 3 0 ellers,
Løsninger til kapitel 15. størrelsen i kvadratmeter, X. en dummy-variabel, som indikerer om der er havudsigt eller ej, så er modellen
Løsninger til kapitel 5 Opgave 5. a) Hvis Y indikerer prisen, størrelsen i kvadratmeter, afstanden i meter til vandet og en dummy-variael, som indikerer om der er havudsigt eller ej, så er modellen Y =
Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test
Ikkeparametriske metoder Repetition Wilcoxon SignedRank Test KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,
Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser
Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier
Module 3: Statistiske modeller
Department of Statistics ST502: Statistisk modellering Pia Veldt Larsen Module 3: Statistiske modeller 31 ANOVA 1 32 Variabelselektion 4 321 Multipel determinationskoefficient 5 322 Variabelselektion med
Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater
Økonometri: Lektion 4 Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater 1 / 35 Hypotesetest for én parameter Antag vi har model y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi
3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve
