OpenSamf Skriftlig eksamen i samfundsfag Indholdsfortegnelse 1. Introduktion 2. Præcise nedslag 3. Beregninger 3.1. Hvad kan absolutte tal være? 3.2. Procentvis ændring (vækst) 3.2.1 Tolkning af egne beregninger (vækst) 3.3. Procentandele 3.4. Indekstal 4. χ2 (Chi-i-anden) 4.1 Tolkning af Chi2-testen 5. Lineær regression 1. Introduktion Hvad gør du til den skriftlige eksamen i samfundsfag, når du sidder med en tabel eller figur? Det skal dette appendiks guide dig igennem. Jeg har løbende linket til andre kapitler i OnlineBogen, hvor du har mulighed for at gå dybere inde i det metodiske. I de stiplede bokse kan du finde eksempler på gode formuleringer fra elevbesvarelser. I din besvarelse af opgaven skal du helst undgå at lave direkte afskrift af indholdet i boksene, men det er selvfølgelig tilladt at lade sig inspirere. Der er under de stiplede bokse givet en forklaring på, hvorfor eksemplet er godt. 2. Præcise nedslag Vi starter med det vigtigste og derfor får det også et helt afsnit for sig selv. Præcise nedslag, præcise nedslag, man kan ikke sige det nok. Det er vigtigt, at når du behandler data opstillet i tabeller eller figurer at du dokumenterer din undersøgelse/argumentation: I Tabel 1 er BNP angivet i faste priser, jeg har derfor beregnet den procentvise ændring i Tabel 2. I 2009 kan vi aflæse en negativ vækst i BNP på -5,73 procent, dvs. at den danske økonomi på daværende tidspunkt var i recession. Lavkonjunkturen begynder i 2007 med en BNP vækst på 1,7 procent og går altså i recession i 2008 og 2009 med en vækst på hhv. -0,8 og -5,73 procent. Siden 2010 har den økonomiske vækst fluktueret mellem -0,36 og 1,46 procent, altså i en fortsat lavkonjunktur, og med en relativ lav BNP-vækst i 2013 på 0,42 procent. I ovenstående ses hvordan påstanden om lavkonjunktur dokumenteres med nedslag i BNP-væksten for de enkelte år.
Eksemplet afsluttes korrekt med en opsamlingen over udviklingen og med særlig vægt på de seneste tal i tabellen. 3. Beregninger Ofte vil det være nødvendigt at foretage forskellige beregninger inden man når til de præcise nedslag. Nedenfor vil vi gennemgå de mest hyppige former for beregninger. Tal der skal beregnes på vil ofte optræde i tabelform. Nogle opgaver vil også stille krav til beregninger: Opgaverne er typisk formuleret som: Undersøg, hvad der af materialet i bilag Xx kan udledes om et fagligt emne Undersøgelsen skal understøttes af relevante beregninger. Man kan grundlæggende sige, at der ikke skal beregnes yderligere på relative tal som fx procenttal. Derimod skal man være opmærksom op om der findes absolutte tal i bilagsmaterialet. 3.1. Hvad kan absolutte tal være? Absolute tal kan være BNP opgivet i kroner (dvs. ikke i procent). Det kan også være saldo, gæld, indkomst, forbrug osv. opgivet i kroner eller antal. Der er også set eksempler på personer, lande og mange andre ting. Det vigtigste er at de ikke er opgivet i procent, vækst, indeks osv., for så er der allerede foretaget beregninger. Nogle gang oplyses i tabellen at det er absolutte tal som i tabellen nedenfor fra Uddannelse (Studentereksamen m. internet 30/05-2012). Krydstabellen indeholder to variable uddannelse i rækkerne og holdning til flygninge i kolonnerne. 3.2. Procentvis ændring (vækst) Vi skal beregne procentvis ændring når vi har tal som beskriver en udvikling, det vil ofte være fx BNP i faste priser. Formålet er her at undersøge, hvor meget BNP vokser med pr. år dvs. BNPvæksten. En tabel kunne se ud som nedenstående. Tabellen stammer fra et hjemmestrikket opgavesæt. Til beregningen af væksten anvendes den simple formel: Slutværdi begyndelsesværdi begyndelsesværdi 100 Væksten i 2009 bliver derfor: (1518, 0 1610, 3) 1610, 3 100 = 5, 73% I tabellen angives BNP for året, dvs. i 2008 sluttede året med en BNP på 1610,3 mia. og i 2009 sluttede året med en BNP på 1518 mia. I beregningen af væksten for 2009 ser vi derfor på slutværdien for året, hvilket er lig med 1518 mia., begyndelsesværdien for året er hvordan 2008 sluttede, nemlig 1610,3. Vi har således beregnet at væksten i 2009 var -5,73 procent dvs. negativ (BNP gik fra 1610,3 -> 1518 mia.). Vi beregner nu de resterende tal og opstiller dem herefter i en tabel:
Bemærk at væksten for 2008 selvfølgelig ikke kan beregnes da vi ikke kender udgangspunktet (BNP i begyndelsen af året/slutningen af 2007). 3.2.1 Tolkning af egne beregninger (vækst) Nedenfor gives der en tolkning af de beregninger der er foretaget i tabel 2. I Tabel 1 er BNP angivet i faste priser, jeg har derfor beregnet den procentvise ændring i Tabel 2. I 2009 kan vi aflæse en negativ vækst i BNP på -5,73 procent, dvs. at den danske økonomi på daværende tidspunkt var i recession. Lavkonjunkturen begynder i 2007 med en BNP vækst på 1,7 procent og går altså i recession i 2008 og 2009 med en vækst på hhv. -0,8 og -5,73 procent. Siden 2010 har den økonomiske vækst fluktueret mellem -0,36 og 1,46 procent, altså i en fortsat lavkonjunktur, og med en relativ lav BNP-vækst i 2013 på 0,42 procent. Det er vigtigt i tolkningen at angive: 1. Hvilke tal der er opgivet i den orginale tabel (I Tabel 1 er BNP angivet i faste priser) 2. Hvilke beregninger du har foretaget (jeg har derfor beregnet den procentvise ændring i Tabel 2) 3. Præcise nedslag (1,7 procent) 4. Afsluttet med den seneste udvikling. Faktisk skal de seneste tal fylde ligeså meget eller mere end gamle tal (Siden 2010 har den økonomiske vækst fluktueret mellem -0,36 og 1,46 procent, altså i en fortsat lavkonjunktur, og med en relativ lav BNP-vækst i 2013 på 0,42 procent). I forhold til punkt 4, ses det ofte at elever fortaber sig i kriseårene i deres iver over at forklare det med finanskrisen osv. Hvilket betyder at de helt glemmer at se på de nyeste tal. Det kan trække væsentlig ned, hvis opgaven er at undersøge udviklingen i BNP. Note i forhold til længden på eksemplet Ovenstående eksempel er taget fra en fællesdelsbesvarelse og forkortet. I fællesdelen er man begrænset at besvarelsen maksimalt må fylde 700 ord, hvilket skal dække over to opgaver. I den efterfølgende delopgave er der ingen begrænsing på antallet af ord. Eksemplet er derfor ikke alene fyldstgørende for besvarelsen, men skal uddybes med yderlige forklaring. Det kan fx være at samme opgave indeholder arbejdsløsheden i procent, her vil det således være oplagt at sammenligne udviklingen og forklare den økonomiske sammenhæng mellem væksten i BNP, som du har beregnet, og arbejdsløsheden. Hint: høj arbejdsløshed -> lav BNPvækst (og omvendt). 3.3. Procentandele En beregningstype der skal bidrage med at sige hvor meget noget udgør af noget andet. Nedenfor i Tabel 1 er et eksempel fra Forbrug (Studentereksamen 30/05-2013). I tabellen kan vi aflæse de absolutte tal. Vi kan fx aflæse af personer under uddannelse har en gennemsnitlige bruttohusstandsindkomst på 127.000 kr. og at de forbruger 139.000 kr om året. For pensionister er det hhv. 311.000 kr og 215.000 kr. Pensionister bruger altså absolut flere penge på forbrug end folk under uddannelse. Men bruger de også relativt flere penge? Altså hvor stor en andel udgør forbruget af indkomsten? Forbrugets andel af indkomsten er også det vi i økonomiske termer kalder forbrugskvoten. Ovenfor ses beregningerne for forbrugskvoten i Tabel 1a. Forbrugskvoten er fremkommet ved at dividere forbruget med husstandsindkomsten. Eksempelvis for selvstændige:
Hvilket altså giver en forbrugskvote på 0,526 eller 52,6 % dvs. at selvstændige bruger 52,6 % af deres samlet husstandsindkomst på forbrug. Lidt anderledes ser det ud for personer under uddannelse deres forbrugskvote er på 109,4 %, og nu kan I selv overveje hvorfor og hvad det betyder at have en forbrugskvote over 1 eller 100 %. 3.4. Indekstal Du kan i opgaver kommer ud for tabeller som indeholder en udvikling. Det kan fx være udviklingen i BNP, og hvor du skal sammenlige flere lande. Problemet er bare at BNP er opgivet i forskellige valutaer (DKK, USD osv.). Det er derfor ikke umiddelbart let af sammenligne udviklingen. Her kan beregning af indekstal være nødvendigt. I et andre tilfælde kan det også være du skal sammenligne udviklingen i flere vidt forskellige enheder, her benytter du også indekstal for at kunne foretage sammenligningen. I tabel 2 er angivet en tabel fra studentereksamen maj 2012. Det er absolutte tal og angiver antallet af personer i ud fra forskellige variable i forskellige år. I ovenstående tabel 2a kan der nu udledes de procentvise ændringer fra 2007 i forhold til en række paramenter som relatere sig til arbejdsstyrken. Arbejdsstyrken er faldet med 2,2 % mens ledigheden er steget 65,2 % fra 2007 til 2011. Indekstal er grundlæggende at man undersøger den procentvise ændring ud fra en basisværdi (ofte et basisår) i dette tilfælde 20xx. 4. χ2 (Chi-i-anden) 394 749 = 0, 526 I krydstabeller med to variable vil der nogle gange være opgivet en chi-i-anden test. I studenteropgaverne angives ikke testværdien, men testværdiens signifikansniveau, se eksempel nedenfor fra Forbrug (Studentereksamen 30/05-2013). I tabellen kan vi aflæse at den ene variabel er køn, mens den anden variabel er holdning til shopping. Procenterne er beregnet inden for kønnene. Læs mere om beregninger af procenter i en krydstabel her. I tabellen kan vi aflæse, at 17 % af mændene ofte shopper for fornøjelsens skyld, mens andelen af kvinder som shopper for fornøjelsens skyld udgør 37 %. Der er en nogenlunde lige stor andel af mænd og kvinder, som sjældent shopper for fornøjelsens skyld hhv. 40 og 46 %. Under svarmuligheden aldrig ser vi at 43 % af mændene aldrig shopper for fornøjelse, mens det kun gælder for 17 % af kvinderne. Det ser således ud til, at kvinder i højere grad end mænd shopper for fornøjelsens skyld. For at kunne sige noget om forskellen med større sikkerhed, er vi nødt til at tolke på Chi2-testen, som er oplyst i bunden af tabellen.
4.1 Tolkning af Chi2-testen Vi får oplyst i bunden af tabellen, at p-værdien er mindre end 0,01. P-værdien angiver sandsynligheden for at få fordelingen i tabellen, hvis nul-hypotesen er sand: at der er uafhængighed mellem køn og shopper for fornøjelse. Mere konkret betyder det, at hvis der i virkeligheden er den samme fordeling mellem mænd og kvinder og om de shopper for fornøjelsen skyld, hvad er så sandsynligheden for at få den fordelingen i tabellen, hvor der ser ud til at være en relativ stor forskelle mænd og kvinder. I dette tilfælde, så er sandsynligheden mindre end 1 % (omskrevet fra decimaltal 0,01). Inden vi kan konkludere på om der så er forskel mellem mænd og kvinder, er vi nødt til at fastsætte et niveau, hvor vi kan sige, at forskellen er signifikant nok til at vi kan afvise nul-hypotesen, om at der ingen forskel er mellem mænd og kvinder. Det niveau kalder vi signifikansniveauet. Under normal omstændigheder sætter vi det til 0,05 eller 5 % inden for samfundsvidenskaberne. Nu har vi fastsat signifikansniveauet, og kan dermed konkludere på chi-testen (autentisk elevbesvarelse): Det kan statistisk bestemmes, hvorvidt der er uafhængighed mellem holdning til shopping for fornøjelsens skyld og køn. Der er allerede foretaget en chi-i-anden test hvor p-værdien opgives til mindre end 0,01. Hvis der fastsættes et signifikansniveau på 0,05, er p-værdien mindre end signifikansniveauet og H0-hypotesen om uafhængighed kan derfor afvises. Det tyder således på, at der er en signifikant forskel andelen af mænd og kvinder som shopper for fornøjelsens skyld. Det er vigtigt i tolkningen at angive: 1. Hvad der testes for (uafhængighed mellem holdning til shopping for fornøjelsens skyld og køn) 2. P-værdien (p < 0,01) 3. Signifikansniveau (0,05) 4. Resultatet af testen på baggrund af signifikansniveauet (uafhængighed kan afvises) 5. Hvad det betyder (der er en signifikant forskel andelen af mænd og kvinder som shopper for fornøjelsens skyld) 5. Lineær regression Der har i de seneste par år optrådt flere regressioner i de skriftlige opgavesæt. De er nemme at kende, det er to variable plottet i et koordinatsystem med de observerede værdier, den bedste rette linjer, en forskrift samt den forklarede varians R 2. Nedenfor ses et eksempel fra Et splittet Danmark (Studentereksamen 28/05-2013). Regressionsmodellen giver en forklaringskraft R2 på 0,51, hvilket betyder at den lineære model med den uafhængige variable Antal års uddannelse kan forklare 51 procent af variationen i den afhængige variable Andel personer med en indkomst under 100.000 kr. pr. år. Forskriften y = -1,31x + 0,28 betyder at ét års uddannelse mindsker andelen som tjener under 100.000 kr. pr. år med 1,31 procentpoint. Dvs. jo flere år brugt på uddannelse jo lavere sandsynlighed for at tjene under 100.000 kr. pr. år.
Ovenstående Figur 2 fra studentereksamen 2013 er ikke den mest elegante lineær regression. Det bliver mere eller mindre kringlet når y-aksen er angivet som andelen af folk med en indkomst under 100.000 kr inden for uddannelseskategorien. Det ville være nemmere hvis det var personlig indkomst, og i dette tilfælde omregnet til gennemsnitlig indkomst, da man undersøger på gruppeniveau. Så vil tolkningen kunne lyde noget i retningen af Ét års ekstra uddannelse øger i gennemsnit den personlige indkomst med xx.xxx. Sammenhængen vil være positiv og mere logisk. I forhold til at bedømme om forklaringskraften er høj eller lav, så er det vigtigt at tage højde for hvilke variable, der er med i modellen. Er det fx andre ting der kan påvirke variablerne? Altså hvad mangler for at opnå en højere forklaringskraft? I det tilfælde med Figur 2 kunne det fx være om man var i arbejde eller ej, som også havde (stor) indflydelse på ens indkomst. Arbejdsløse akademikere, studerende osv. tjener mindre end folk i arbejde. Der ses i Figur 2 kun på antal års uddannelse og altså ikke om man stadig er studerende, arbejdsløs eller i arbejde. Kan vi forvente at sammenhængen mellem variablerne er lovmæssig. Er det fx økonomiske sammenhænge eller sociologiske? Inden for fysik og matematik vil man gerne have en R2-værdi så tæt på 1 eller 100 %. Så høje R2- værdier kan vi ikke forvente at få inden for samfundsvidenskaberne. Vi kan dog forvente at vi et lidt mere forudsigelige når det drejer sig om økonomi end om sociologi. Link: Se mere om tolkning af R 2 her Litteraturhenvisning til denne side: Madsen, K. (2017). Skriftlig eksamen i samfundsfag. I: OpenSamf.dk. URL: http://www.opensamf.dk/skriftligeksamen/. Sidst besøgt 23/08/2017. Om: OpenSamf fungerer som en gratis onlinebog med fokus på kvantitativ og statistisk metode. Indholdet er målrettet gymnasieelever. Indholdet er under udarbejdelse.