Ungdommens Naturvidenskabelige Forening: Valgkampens og valgets matematik Rune Stubager, ph.d., lektor, Institut for Statskundskab, Aarhus Universitet
Disposition Meningsmålinger Hvorfor kan vi stole på dem? Hvad er usikkerheden? Et eksempel Det kommunale valgsystem Hvordan bliver stemmer til mandater?
1 Meningsmålinger Problemet: En normal meningsmåling består som regel af ca. 1000 personer, som er blevet stillet ét eller flere spørgsmål fx hvilket parti, de vil stemme på ved valget. Hvordan kan vi overhovedet sige noget om hele befolkningen ud fra kun 1000 personer? Svaret: Sandsynlighedsteori
1.1 Notation Et eksempel: Rambøll giver S 42,0% af stemmerne i Århus Kommune = en andel på 0,42 Men hvad er S stemmeandel i hele kommunens befolkningen? π = Andelen i hele befolkningen (populationsparameteren) πˆ = Stikprøvens estimat af andelen i befolkningen n = Stikprøvens størrelse
1.2 Det sandsynlighedsteoretiske grundlag Andelen i en given stikprøve er et stikprøvemål dvs. noget der er beregnet på baggrund af en stikprøve Hvis man udtager mange stikprøver og beregner det samme mål, vil der være en vis variation i dem Man kan derfor vise dem i et stolpediagram, hvor hver stolpe viser, hvor mange stikprøver, der har fået en given værdi for målet Den fordeling, der herved fremkommer, kaldes stikprøvemålsfordelingen og det er den vi er interesserede i
1.2 Den centrale grænseværdisætning Hvis stikprøven er udtrukket simpelt tilfældigt, gælder det, at: Når n er tilstrækkelig stor, vil πˆ s fordeling uanset fordelingen i populationen være omtrent normalfordelt med gennemsnit π og standardafvigelse (kaldes standardfejl) σ π ˆ = π( 1 n π) = π( 1 n π)
1.2 Den centrale grænseværdisætning Simulation http://www.vias.org/simulations/simusoft_cenlimit.html Og hvad kan vi så bruge det til? Vi kender ikke π, men vi ved, at når stikprøven er udtaget tilfældigt, så gælder CGS, og så følger stikprøvefordelingen normalfordelingen For normalfordelinger kan det vises, at 95% af fordelingen ligger inden for en afstand på ± 1,96 gange standardfejlen af gennemsnittet
1.2 Normalfordelingen 95% 2,5% 2,5% 1,96 σ ˆ π π 1,96 σ ˆ π
1.3 Konfidensintervaller Vores fordeling er en fordeling af stikprøvemål for andelen π Dvs. hvis vi for hver stikprøve laver et interval på ± 1,96 gange standardfejlen rundt om estimatet af π, så vil det indeholde π i 95% af de gange, vi udtrækker en stikprøve For den enkelte stikprøve siger man, at intervallet indeholder π med 95% konfidens (= sikkerhed) Intervallet kaldes således et konfidensinterval og viser altså de værdier, hvor indenfor det er rimeligt sandsynligt, at π falder
1.3 Princippet bag et 95% konfidensinterval for andelen 95% 2,5% 2,5% 1,96 σ ˆ π 1,96 σ ˆ π σ ˆ π πˆ 1,96 1,96 σ ˆ π πˆ π πˆ
1.3 En lille detalje Beregning af standardfejlen forudsætter kendskab til π: σ π ˆ = π( 1 n π) = π( 1 n π) I praksis estimeres denne dog ud fra stikprøven, så standardfejlen beregnes som σˆ πˆ = π( ˆ 1 n π) ˆ = π( ˆ 1 n π) ˆ
1.4 Konfidensinterval for andele: Definition Et 95% konfidensinterval for π er defineret som πˆ ± 1,96 ˆ σ π ˆ Vi opstiller altså et interval, hvori π befinder sig med 95% konfidens Gælder som udgangspunkt kun for n>30 og 0,3 < π < 0,7
1.4 Definition (forts.) Generelt: n skal overstige 30 For π < 0,3 eller π > 0,7: Stikprøvemålsfordelingen skæv skærpet krav til n: Der skal mindst være 10 observationer både i den kategori vi måler andelen for og i resten af gruppen fx skal mindst 10 respondenter ville stemme på S og mindst 10 respondenter på alle andre partier til sammen
1.5 Et eksempel Fx: Rambøll i JP Århus i søndags: Estimat: Andel S-vælgere = 0,42, n=785 Et 95% konfidensinterval for andelen af S- vælgere: πˆ 1,96 σˆ ± πˆ 0,42 ± 1,96 0,42 ( 1 0,42) 785 ( 0,385; 0,455)
1.6 Faktorer, der påvirker bredden Formlen igen: af konfidensintervaller πˆ ± 1,96 ˆ σ π ˆ Bredden påvirkes af to faktorer: Tallet, der ganges med Standardfejlen
1.6.1 Tallet, der ganges med Afgøres af konfidensniveauet Kan principielt fastsættes, som man vil Dvs. under vores kontrol Konventionelt 95% eller 99% Jo højere, jo større tal, og dermed jo bredere konfidensinterval Mao.: Jo mere sikker man vil være, jo flere værdier er mulige, og jo mindre præcist kan vi udtale os
1.6.2 Standardfejlen Formlen igen: σˆ πˆ = π( ˆ 1 n π) ˆ To elementer heri: Den estimerede populationsstandardafvigelse n
1.6.2.1 Standardafvigelsen Populationsparameter kan ikke ændres Estimeres fra stikprøven Formlen igen: σˆ = πˆ ( 1 πˆ )
Under vores kontrol! 1.6.2.2 n Da 2 n = 4n, kræver dobbelt præcision (dvs. halv bredde på intervallet = halvering af standardfejlen) 4-dobbelt n (for et givet konfidensniveau): 1 2 σˆ πˆ = σˆ 1 2 πˆ = π( ˆ 1 π) ˆ, n π( ˆ 1 π) ˆ n = π( ˆ 1 π) ˆ 4n
1.6.2.3 Eksemplet igen 4-dobling af antallet af respondenter i Rambøllmålingen: 785 3140 95% konfidensinterval for S-andelen: πˆ 1,96 σˆ ± πˆ 0,42 ± 1,96 ( 0,403; 0,437) 0,42 3140 ( 1 0,42) Dvs. ca. et spænd på 0,034 (= halvdelen af første interval)
1.7 Søndagens Rambøll nu med usikkerhed Parti Stemmeandel i % Usikkerhed Socialdemokr. 42,0 ±3,5 Radikale 6,1 ±1,7 Konservative 5,4 ±1,6 SF 15,7 ±2,5 KD 0,7 ±0,6 DF 3,2 ±1,2 Venstre 23,4 ±3,0 Liberal Alliance 0,5 ±0,5 Enhedslisten 2,7 ±1,1 Andre 0,1 ±0,2
2 Valgsystemet Valgsystemet er reglerne for at omsætte stemmerne til mandater efter valget Kan være mere eller mindre kompliceret, alt efter hvilke hensyn man vil tage Et forholdsvist simpelt system vil være at inddele landet i kredse og så lade den kandidat, der får flest stemmer i hver kreds, få kredsens mandat En anden mulighed er at tælle alle stemmer på et parti i hele landet op og så fordele mandaterne proportionelt efter disse stemmetal
2 Valgsystemet Folektingsvalgsystemet er ganske kompliceret mandaterne fordeles i 6 trin for at sikre en vis spredning ud over landet samtidig med at proportionaliteten sikres nogenlunde. Det kommunale valgsystem (bruges både ved valg til kommunalbestyrelser og regionsråd) er noget simplere. Det har mellem 2 og 4 trin, og er også baseret på en proportionel fordeling af mandaterne.
2 Valgsystemet Spørgsmålet er, hvordan proportionaliteten opnås. Afgøres bl.a. af afstanden mellem tallene i den divisorrække, der bruges ved mandatberegningen I det kommunale valgsystem bruges den d Hondske divisorrække (1,2,3,4 osv.), der tenderer til at favorisere de store partier Til gengæld er der mulighed for at listerne kan indgå valg- og listeforbund, der gør det muligt for mindre lister at slå sig sammen og derved opveje noget af de store partiers fordel
2 Valgsystemet Hver kommune/region betragtes som én enhed. De to-fire trin: 1. Mandaterne fordeles på valgforbund/listeforbund/lister efter d Hondske divisorrække 2. Mandaterne fordeles indenfor valgforbund efter d Hondske divisorrække 3. Mandaterne fordeles indenfor listeforbund efter d Hondske divisorrække 4. Mandaterne fordeles på personer
2 Valgsystemet Mandaternes fordeling på valgforbund/listeforbund/lister: Stemmetallet for alle valgforbund, listeforbund, der ikke er i valgforbund, og lister, der ikke er i valgforbund eller listeforbund divideres med tallene 1, 2, 3, 4 osv. (den d Hondtske divisorrække), og mandaterne fordeles til de højeste kvotienter Lister, der ikke er i valgforbund eller listeforbund, har herved fået deres mandater
2 Valgsystemet Mandaternes fordeling indenfor valgforbund: Stemmetallene for alle lister eller listeforbund i et valgforbund divideres med tallene 1, 2, 3, 4 osv., og mandaterne fordeles til de højeste kvotienter Lister, der ikke har indgået listeforbund, har herved fået deres mandater
2 Valgsystemet Mandaternes fordeling indenfor listeforbund: Stemmetallene for alle lister i et listeforbund divideres med tallene 1, 2, 3, 4 osv., og mandaterne fordeles til de højeste kvotienter Herved er alle mandater fordelt ned på individuelle lister
2 Valgsystemet Fordeling af mandater på personer: Afhænger af opstillingsformen: Sideordnet Partiliste Sideordnet: Hver kandidat får deres egne personlige stemmer. Mandaterne fordeles i rækkefølgen efter disse stemmetal
2 Valgsystemet Partiliste: Først udregnes listens fordelingstal (listens samlede stemmetal/antal mandater+1, forhøjet til nærmeste hele tal). De kandidater (om nogen), der har opnået mindst lige så mange stemmer som fordelingstallet, er valgt For øvrige kandidater ser man først på den første kandidat på listen, som tillægges så mange listestemmer, som det kræver for at opnå fordelingstallet, hvorefter vedkommende er valgt De øvrige listestemmer fordeles dernæst til nr. 2, 3 osv. på listen på samme måde, indtil der ikke er flere listestemmer tilbage De kandidater, der ikke bliver valgt, er suppleanter i den rækkefølge, deres stemmetal tilsiger
2 Valgsystemet Der er ingen formel spæregrænse ved kommunale valg men der er en reel: Opstår ved at der jo kun er et vist antal mandater til fordeling i hver kommune, så de mindste lister kan ikke være sikre på et mandat For at være helt sikker på mandat i Århus skal en liste have 3,13% af stemmerne Afhængigt af antallet af valg- og listeforbund kan en liste dog få mandat med ned til et sted omkring 2,2% af stemmerne (måske endda lavere)
2 Valgsystemet Skævheder (= disproportionalitet) kan opstå, fx hvis små lister i et valgforbund ikke får stemmer nok til at kunne få del i fordelingen af mandater indenfor valgforbundet I så fald går alle mandaterne til valgforbundet til den/de største liste(r)