Per Vejrup-Hansen STATISTIK. med Excel. 2. udgave

Størrelse: px
Starte visningen fra side:

Download "Per Vejrup-Hansen STATISTIK. med Excel. 2. udgave"

Transkript

1 Per Vejrup-Hansen STATISTIK med Excel 2. udgave

2

3 Per Vejrup-Hansen Statistik med Excel

4 Per Vejrup-Hansen Statistik med Excel 2. trykte udgave e-bogsudgave 2012 Samfundslitteratur 2012 e-isbn: Omslag: Klahr grafisk design (Jesper Hansen) Sats og ebogsproduktion: Narayana Press, Gylling Samfundslitteratur Rosenørns Allé Frederiksberg C Tlf Fax slforlagene@samfundslitteratur.dk Alle rettigheder forbeholdes. Kopiering fra denne bog må kun finde sted på institutioner, der har indgået aftale med COPY-DAN, og kun inden for de i aftalen nævnte rammer. Undtaget herfra er korte uddrag til anmeldelse.

5 Indholdsfortegnelse Læsevejledning... 5 Kapitel 1 Hvad er statistik? Brugen af Excel Kapitel 2 Beskrivelse af fordelinger. Histogram og fordelingsmål Grafisk afbildning: Histogram Positionsmål: Gennemsnit, median mv. Mål for skævhed Varians og standardafvigelse: Mål for spredning Variationskoefficient: Forskel i spredning Appendiks: Beregninger for grupperede data Opgaver Kapitel 3 Test af forskelle i gennemsnit og proportioner Teoretisk indledning: Usikkerhed på gennemsnit i stikprøver Test af ét gennemsnit. Enkeltsidet versus dobbeltsidet test. Konfidensinterval Usikkerhed på proportion (procentandel) Test af forskel mellem to gennemsnit: t-test Test af forskel mellem flere gennemsnit: Variansanalyse (ANOVA) Opgaver Kapitel 4 Forskelle i fordeling af kvalitative kendetegn (c 2 -test) Er fordelingen normal : Som forventet? Samme fordeling af kendetegn i forskellige grupper? Kontingenstabel Opgaver Indholdsfortegnelse 3

6 Kapitel 5 Korrelation og regression Indledning Korrelation og korrelationskoefficient Regressionsanalyse I. Simpel, lineær regression Regressionsanalyse II. Simpel, ikke-lineær regression Regressionsanalyse III. Multipel regression med dummyvariabel Opgaver BILAG 1 Statistiske funktioner og dataanalyser i Excel. Hvor findes de? BILAG 2 Oversigter over anvendte funktioner og dataanalyser BILAG 3 Grundlæggende Excel til statistiske analyser Formatering af regneark med data Organisering af kolonner og rækker mv. til analyser af surveydata Fremgangsmåde for Excelfunktion. Markering af celler og Autofyld Dannelse af Pivottabel (kontingenstabel) Relative og absolutte referencer: Beregning med konstanter Diagrammer: Punktdiagram og søjlediagram Import af eksterne data med et andet dataformat BILAG 4 Tendenslinjer: Matematiske kendetegn Stikord Indholdsfortegnelse

7 Læsevejledning Bogens hovedsigte er at vise, hvordan man løser typiske statistiske problemstillinger ved hjælp af Microsoft Excel. Vejledningen i Excel er konkret rettet mod, hvordan man analyserer data fra en stikprøveundersøgelse eller survey (fx data indsamlet med SurveyXact eller et andet online survey-program). Problemstillingerne kan ses af indholdsfortegnelsen: Kapitel 2 behandler beskrivelser af et datasæt, som skal analyseres. Kapitel 3 viser, hvordan man tester, om der er en signifikant forskel mellem to (eller flere) gennemsnit og proportioner. Kapitel 4 viser, hvordan man tester, om der er en forskel i kvalitative kendetegn mellem grupper, fx om fordelingen på svarkategorier er forskellig for mænd og kvinder. Endelig omhandler kapitel 5 analyser af sammenhænge mellem forskellige størrelser, fx erhvervserfaring og indkomst (korrelations- og regressionsanalyse). Det generelle, teoretiske grundlag er behandlet kortfattet i afsnit 3.1. Her forklares usikkerheden på et gennemsnit. Målet herfor kaldes standardfejlen, som med varierende specifikationer er det grundlæggende mål i test. I kapitel 1 omtales de to typer af data: Numeriske og kategorielle variabler. Excel Den konkrete anvendelse af statistiske funktioner og dataanalyser i Excel er vist for hver test ved hjælp af dialogbokse. Illustrationen i bilag 1 viser, hvor disse værktøjer findes i Excel, og hovedelementerne i et regneark kan ses her. Orienteringen mod surveydata er udgangspunktet for bilag 3, der trin for trin viser, hvordan data i Excel redigeres og organiseres som grundlag for analyser af surveydata. Samtidig gives en elementær vejledning i, hvordan man markerer og udvælger dataceller, kopierer en formel med autofyld, danner en pivottabel, laver et punktdiagram osv. Bogen anvender Excel 2010, men den kan også bruges med Excel I oversigten i bilag 2 vises således for hver funktion, hvilken benævnelse funktionen har i Excel Oftest er navnet på funktionen den samme i Excel 2010 og I en supplerende oversigt vises de engelske navne Læsevejledning 5

8 for funktionerne. Dermed kan bogen også bruges med en engelsk Excelversion. Opgaver I slutningen af hvert kapitel findes nogle opgaver. Data til opgaver, der er markeret med en stjerne, findes i en Excelfil på webadressen: Heri kan man også se regneark med løsninger til alle opgaver. Nogle opgaver anvender det samme, større surveydatasæt. Det er opgaverne 2.1, 3.7, 4.2 og 5.1. Via disse kan man indøve successive analyser af et surveydatasæt. 6 Læsevejledning

9 KAPITEL 1 Hvad er statistik? Brugen af Excel Statistik er læren om indsamling, analyse, præsentation og fortolkning af data. I denne fremstilling er det primært analyse og fortolkning, der er emnet. Hovedformålet er at give en anvendelsesorienteret indføring i statistiske metoder ved anvendelse af funktioner i regnearksprogrammet Excel (Microsoft Office). Der findes to typer af data. På den ene side har man kvantitative data, hvor man måler hvor meget eller hvor mange af noget. Det er numeriske variabler som fx personers vægt, alder, indkomst osv. På den anden side findes kvalitative data, hvor man registrerer forskellige kendetegn eller kategorier. Det er kategorielle variabler som fx køn, hvor der findes to kategorier (mand, kvinde), eller det kan være svarkategorier i et spørgeskema (enig, uenig, ved ikke, eller hvilket parti man ville stemme på, dvs. et navn). For hver type af data findes forskellige statistiske mål, med hver sine analysemetoder. For kvantitative data er gennemsnit og spredning centrale mål. For kvalitative data drejer det sig om proportioner, dvs. de andele, som bestemte kategorier udgør (fx procentandelen af kvinder), eller det kan være fordelingen på alle kategorier under ét, der undersøges. Det illustreres i følgende figur 1.1. Figur 1.1. Kvantitative data og kvalitative data KVANTITATIVE DATA Numeriske variabler (alder, indkomst) KVALITATIVE DATA Kategorielle variabler (køn, svarkategorier) MÅL Gennemsnit Varians og spredning TEST Usikkerhed på gennemsnit i stikprøve Sammenligning af gennemsnit MÅL Proportioner (andele) Fordelingen på kategorier TEST Usikkerhed på proportion i stikprøve Sammenligning af fordelinger Hvad er statistik? Brugen af Excel 7

10 I oversigten nævnes under test usikkerhed på gennemsnit og proportioner i stikprøver. Det kaldes også statistisk inferens, dvs. problemet at slutte (inferere) fra en stikprøve til hele populationen. Problemet er, at fx de personer, der indgår i en stikprøve, vil være et tilfældigt udsnit af hele befolkningen (populationen), og det giver en usikkerhed i at slutte fra gennemsnit eller proportioner i stikprøven til det, der er gældende for hele befolkningen (se figur 1.2). Der kan eksempelvis være lidt flere socialdemokrater blandt personerne i en stikprøve med fx 900 svarpersoner end i hele befolkningen (på flere millioner personer) på et givent tidspunkt. Den statistiske analyse består da i at bestemme usikkerheden på den andel, der ifølge stikprøven stemmer på socialdemokratiet. Det er i forbindelse med anvendelse af stikprøver, at selve det statistiske problem vedrørende usikkerhed på gennemsnitsmål mv. opstår. Figur 1.2. Statistisk inferens Population? Stikprøve Man kan også betragte statistiske analyser som metoder til sammenligning af gennemsnittet i en stikprøve med et bestemt gennemsnitstal eller med gennemsnittet i en anden stikprøve: Er en given forskel sikker, eller kan der være tale om en tilfældighed? Stikprøver kan være observationer i en befolkning, fx ved en meningsmåling, eller de kan være mere styrede i form af eksperimenter. Ved eksperimenter kan man anvende forsøgsgrupper og kontrolgrupper, eller man kan foretage målinger af de samme personer på forskellige tidspunkter. Den statistiske analyse består da i at teste forskellen (i gennemsnittet) mellem forsøgs- og kontrolgruppe eller mellem før og efter for de samme personer. I det følgende behandles statistiske test af gennemsnit og proportioner i kapitel 3, mens test af fordelinger af kategorielle variabler behandles i kapitel 4. Forinden redegøres for beskrivelsen af numeriske fordelinger i 8 Kapitel 1

11 kapitel 2 (gennemsnitsmål, andre positionsmål og spredningsmål). Fordelingsbeskrivelse er grundlæggende for alt det følgende, da det er variansen eller spredningen i kvantitative mål, der ligger bag usikkerheden i et gennemsnit. I en gruppe vil legemshøjde eller indkomst variere fra person til person, og jo større denne variation er, jo større vil usikkerheden på gennemsnittet alt andet lige være. I det afsluttende kapitel 5 er problemstillingen analyser af sammenhæng mellem størrelser eller variabler, fx sammenhængen mellem alder og indkomst eller mellem alder, køn og indkomst. Emnet er således korrelations- og regressionsanalyse. Hvad er statistik? Brugen af Excel 9

12

13 KAPITEL 2 Beskrivelse af fordelinger. Histogram og fordelingsmål 2.1. Grafisk afbildning: Histogram Et godt råd er, at man altid bør starte med at lave en grafisk afbildning af et talmateriale. Hvordan ser tallenes struktur eller fordeling ud? Er fordelingen skæv eller symmetrisk? Er tallene meget spredte? Er der måske nogle ekstreme talværdier, som kan forstyrre resultaterne, fx gennemsnittet? Vi skal straks se på et eksempel, der vil blive anvendt gennem hele dette kapitel. Det drejer sig om lønninger i en virksomhed blandt 21 funktionærer. I stigende orden tænker vi os følgende månedslønninger i kroner: Hvordan er lønningerne fordelt? Er der tale om en jævn fordeling med en ophobning omkring en typisk månedsløn? En simpel metode til at danne et billede af fordelingen er at gruppere lønningerne i intervaller eller løngrupper à fx kr. Der fremkommer nu et ganske klart billede af fordelingen: Det ses bl.a., at der er en tydelig ophobning af observationer lønninger i intervallet Beskrivelse af fordelinger. Histogram og fordelingsmål 11

14 I Excel kan man danne et præcist billede af fordelingen både i tabelform og grafisk i en figur. Det drejer sig om dataanalysen Histogram, der optæller antallet (frekvensen) af observationer i bestemte intervaller og udskriver et tilhørende søjlediagram. Analysen åbnes ved at vælge fanen Data / Dataanalyse / Histogram. Derved fås et billede som nedenstående, hvor data (lønningerne) findes i regnearkets kolonne A, og dialogboksen for Histogram vises: I dialogboksen til Histogram angives/markeres: Inputområde: Celleområdet med de enkelte tal (lønninger) markeres, her A2:A22. Se eventuelt bilag 3, afsnit 3 om markering og indsætning af celleområde i en dialogboks Intervalområde: Her er der ikke angivet et intervalområde. Da vælger programmet selv intervaller. Det er en fordel ved store datasæt med mange observationer, hvor man ikke umiddelbart kan se det samlede værdiområde for observationerne. Ønsker man selv at definere intervalopdelingen, skal man angive intervalgrænserne i en kolonne (se figur 2.1 nedenfor med dataanalysens egen intervalopdeling). Label: Udelades (afkrydses ikke), da det i modsat fald kan medføre fejl ( ugyldig reference ). 12 Kapitel 2

15 Outputindstillinger: Her er valgt Outputområde, og der er indsat celle B2. Klik på boksen før cellen indsættes. Det vil sige, at output (histogrammet) bliver placeret i samme regneark som lønningerne. Ellers kan vælges et nyt regneark. Diagramoutput: Afkrydses. Figur 2.1. Diagramoutput: Histogram For det første fremkommer en tabel med Interval og Hyppighed. Et intervaltal angiver den øvre grænse for et interval, dvs. at fx tallet angiver intervallet < x altså observationer over det forrige intervaltal og til og med intervaltallet. I dette interval er hyppigheden, dvs. antallet af observationer (lønninger), lig med 8. Bemærk, at programmet har dannet fem intervaller inkl. intervallet Mere, som er en restgruppe af observationer på over Intervallerne har samme længde på Hvis man ønsker selv at angiver intervallerne, skal man angive tal som i kolonne B og derefter indsætte celleområdet i dialogboksen. For det andet fremkommer histogrammet, dvs. det visuelle indtryk af fordelingen af lønningerne. Det er et søjlediagram, som er blevet dannet automatisk via tallene i tabellen. I bilag 3, afsnit 6.b. kan man se en vejledning til ændringer af overskrift og aksetitler mv. i histogrammet. Beskrivelse af fordelinger. Histogram og fordelingsmål 13

16 Hvad fortæller histogrammet søjlediagrammet os? Histogrammet viser først og fremmest, at fordelingen er skæv, ikke-symmetrisk. Den største søjle med flest observationer er intervallet ; det er modus- eller modalintervallet. Det ses, at der er flere observationer med højere lønninger end lavere lønninger, dvs. at der ligger flest observationer på højre side. Det kaldes en højreskæv fordeling, hvilket typisk gælder funktionærlønninger. Det er oplagt, at sandsynligheden er størst for, at en tilfældig person befinder sig i modalintervallet Positionsmål: Gennemsnit, median mv. Mål for skævhed Efter den grafiske fremstilling er det næste skridt at foretage en nærmere beskrivelse af fordelingen via forskellige kvantitative mål eller nøgletal. I Excels dataanalyse findes en Dataanalyse, der på én gang frembringer hovedparten af disse mål 1. Det er Beskrivende statistik. 1 Mange af disse mål findes også som enkelte statistiske funktioner i Excel, men almindeligvis vil det være hensigtsmæssigt at bruge dataanalysen Beskrivende statistik, hvor man kan få en række forskellige mål samtidig. 14 Kapitel 2

17 Ovenfor vises dialogboksen for Beskrivende statistik til analyse af de 21 funktionærlønninger. Cellen A1 med overskriften LØN er medtaget i Inputområde, og følgelig afkrydses Etiketter. Det er vigtigt at afkrydse feltet Resuméstatistik, da der ellers ikke kommer et output! Output ses i tabel 2.1. Hvis man formindsker antal decimaler, vil tallene fremstå mere overskuelige. Her er alle decimaler fjernet. Kommandoen Formindsk decimaler på Startsiden anvendes, jf. også bilag 3, afsnit 1. Tabel 2.1. Output: Beskrivende statistik LØN Middelværdi Standardfejl 538 Median Tilstand Standardafvigelse 2465 Stikprøvevarians Kurtosis 0 Skævhed 0 Område Minimum Maksimum Sum Antal 21 Konfidensniveau (95,0 %) 1122 I dette afsnit skal vi koncentrere os om de såkaldte positionsmål, dvs. enkelte punkter i fordelingen. Det drejer sig om gennemsnit (middeltal), median og kvartiler, som under ét giver simple mål for skævhed og spredning. Desuden skal vi se på de mere sammensatte mål for fordelingens form, der bygger på alle observationer (skævhed og kurtosis). Et gennemgående tema er således mål for arten af og graden af skævhed i en fordeling. Det kan have en selvstændig interesse, men det har desuden betydning for, om det er korrekt at anvende det almindelige gennemsnit som centralmål og standardafvigelsen som mål for spredning. Gennemsnit / Middelværdi I statistikersprog kaldes det almindelige, aritmetiske gennemsnit middelværdi. I tabel 2.1 er Middelværdi lig med kr. (med almindelig afrunding). Dette løngennemsnit fremkommer som summen af de 21 Beskrivelse af fordelinger. Histogram og fordelingsmål 15

18 lønninger divideret med antallet af personer. Disse mål fremgår også nederst i outputtabellen som henholdsvis Sum og Antal. Lønsummen er således kroner pr. måned. For at indøve matematiske formuleringer skal udtrykket for gennemsnit eller middelværdi vises. Idet værdien af de enkelte observationer benævnes x i, og n er antallet af observationer, er udtrykket for middelværdien x følgende: x = i Sx n Median Median er midterværdien i fordelingen, dvs. den værdi (løn), som halvdelen ligger under, og halvdelen ligger over. Det er således lønnen for den midterste person, når personerne opstilles eller sorteres efter stigende løn. Medianen på kr. er lønnen for den 11. person, idet 10 personer har en løn, der ligger henholdsvis under og over denne persons løn. n Generelt bestemmes medianobservationen som nr. + 1 observation. 2 Ved 21 observationer som i eksemplet giver det netop nr. 11. Ved et ulige antal observationer giver det således et heltal, dvs. en bestemt observation. Ved et lige antal, fx 24, bliver det nr. 12,5 observation, og medianværdien bestemmes da ved lineær interpolation, dvs. her det simple gennemsnit af lønningerne for observation nr. 12 og 13. I eksemplet gælder, at medianen er lidt mindre end middeltallet (gennemsnittet), nemlig 105 kroner mindre. Når medianen er forskellig fra gennemsnittet, betyder det, at fordelingen er skæv dvs. ikke-symmetrisk. I dette tilfælde, hvor medianen er mindre end gennemsnittet, er der tale om en højreskæv fordeling, jf. også histogrammet i figur 2.1. Der er en tung hale af observationer til højre af høje værdier og det trækker gennemsnittet op. Det er grunden til, at statistik over specielt funktionærlønninger typisk indeholder medianværdien som supplement til gennemsnittet. Gennemsnittet ville specielt være misvisende, hvis én eller to af de høje lønninger var ekstremt høje (fx omkring kroner). Det ville i betydelig grad trække gennemsnittet op men det ville ikke påvirke medianværdien. Når en fordeling er (meget) skæv, er medianen det bedste udtryk for den typiske værdi (løn). På den anden side er det kun gennemsnittet, der har den egenskab, at multiplikation med antal observationer er lig med summen af værdierne (lønsummen). I figur 2.2 illustreres de to typer af skæve fordelinger sammen med en symmetrisk, ikke-skæv fordeling, idet forholdet mellem gennemsnit (G) og median (M) angives. Desuden vises kvartilerne 1. kvartil (K1) og 3. kvartil (K3). 16 Kapitel 2

19 Figur 2.2. Hovedtyper af fordelinger (a) Højreskæv (a) (c) Symmetrisk (c) Symmetrisk K1 MG K3 K1 M=G K3 (b) Venstreskæv (b) Venstreskæv K1 G M K3 Forklaring: G = Gennemsnit M = Median K1 = 1. kvartil (Nedre kvartil) K3 = 3. kvartil (Øvre kvartil) Kvartiler Kvartiler er positionsmål, som desværre ikke indgår i output fra Beskrivende statistik. Her skal man anvende den statistiske funktion KVARTIL. MEDTAG. Kvartiler eller kvarte punkter er et vigtigt supplement til medianen, idet kvartilerne giver et mål for spredningen i fordelingen. Igen tænker vi os, at observationerne (personerne) er sorteret efter stigende værdi, fx løn. Da gælder, at: 1. kvartil eller nedre kvartil er værdien af den observation, der ligger en fjerdedel inde i den sorterede rækkefølge, dvs. at en fjerdedel 25 procent har en lavere værdi (løn) end 1. kvartil-værdien. 3. kvartil eller øvre kvartil er værdien af den observation, der ligger tre fjerdedele inde i den sorterede rækkefølge, dvs. at tre fjerdedele 75 procent har en lavere værdi (løn) end 3. kvartilværdien eller at en fjerdedel har en højere værdi. Man kan også tale om 2. kvartil, men det er det samme som medianen (idet 2. fjerdedel jo er det samme som halvdelen). I Excels funktion KVAR- TIL.MEDTAG kan man angive 2. kvartil, og det er således én måde at beregne medianen på. Som det er tilfældet med medianen, kan kvartilerne ligge mellem to konkrete observationer, og der anvendes da lineær interpolation til at Beskrivelse af fordelinger. Histogram og fordelingsmål 17

20 finde kvartilværdien som et punkt mellem værdierne af de konkrete observationer 2. Vi skal igen se på eksemplet med funktionærlønninger. Dialogboksen for funktionen KVARTIL.MEDTAG ser således ud: Matrix er blot et andet ord for inputområdet (tallene). I boksen Kvart angives 1 for 1. kvartil og 3 for 3. kvartil. For Kvartil lig med 2 fås medianen (og ikke middelværdien, som der står i dialogboksen). Det ses, at tallet for 1. kvartil-værdien allerede vises i dialogboksen. Når der trykkes på OK-knappen, kommer tallet ind i regnearket i den celle, som man stod i, da funktionen blev indsat. Derefter markeres næste celle, hvor 3. kvartil-værdien skal indsættes, og funktionen indsættes igen, her med Kvartil = 3. Når der skal foretages en serie af beregninger ved hjælp af en funktion, er det hensigtsmæssigt at opbygge en tabel i regnearket med relevante benævnelser. Resultatet kan da se således ud, hvor teksterne er skrevet i første kolonne, og resultaterne via funktionen er placeret i anden kolonne: 2 Observationsnummeret for 1. kvartil bestemmes som: (1 + Medianens nummer) / 2, og observationsnummeret for 3. kvartil bestemmes som: (Medianens nummer + n) / 2, hvor n er det totale antal observationer. Hvis fx medianens nummer er den 12,5 observation (jf. tidligere), bliver 1. kvartilens observationsnummer lig med (1+12,5) / 2 = 6, kvartilen underforstået 1. kvartil-værdien beregnes derefter ved interpolation, dvs. som værdien af den sjette observation plus 0,75 gange differencen mellem værdierne af sjette og syvende observation (svarende til tre fjerdedele af afstanden mellem de to konkrete observationer). 18 Kapitel 2

21 1. kvartil Median (2. kvartil) kvartil Med hensyn til de konkrete talværdier gælder for dette eksempel, at kvartilobservationerne præcis rammer bestemte observationer i lønfordelingen (nr. 6 og nr. 16). Relativ kvartilafstand: Spredning Vi ved allerede, at fordelingen af lønningerne er højreskæv, idet gennemsnittet er større end medianen. Det kan også ses af, at afstanden fra medianen til 3. kvartil er større end afstanden til 1. kvartil (henholdsvis og kr.). Kvartilen i fordelingens højre side, altså 3. kvartil, ligger længere væk, når tyngden i fordelingen ligger i højre side (se også figur 2.2). Den specifikke og nye information, som kvartilværdierne giver, er imidlertid et mål for spredningen i fordelingen, fx graden af lønspredning. Jo større spredningen er, jo større vil afstanden mellem kvartilerne være. Kvartilafstanden (Inter-Quartile Range) er her Hvis man har forskellige grupper af lønmodtagere, kan man dermed sammenligne spredningen via kvartilafstanden. Det er imidlertid kun meningsfuldt, hvis der er tale om grupper med nogenlunde samme lønniveau. Hvis der er tale om forskellige niveauer, bør man anvende den relative kvartilafstand, dvs. forskellen set i relation til medianværdien eller mere formelt: Relativ kvartilafstand = 3. kvartil 1. kvartil Median I eksemplet bliver den relative kvartilafstand lig med 2620 / = 0,10. Brugen af den relative kvartilafstand kan illustreres ved hjælp af generel lønstatistik. Heri offentliggøres løngennemsnit, median og kvartiler. Man nøjes ikke med gennemsnittet, fordi der typisk er tale om skæve fordelinger. I tabel 2.2 vises tallene for grupper af ansatte fordelt efter arbejdsfunktion. Beskrivelse af fordelinger. Histogram og fordelingsmål 19

22 Tabel 2.2. Timeløn for lønmodtagere uden ledelsesansvar i den private sektor Arbejde, der forudsætter viden på højeste niveau inden for pågældende område 3 Arbejde, der forudsætter viden på mellemniveau 4 Almindeligt kontor- og kundeservicearbejde 5 Service- og salgsarbejde 6 Arbejde inden for landbrug, skovbrug og fiskeri ekskl. medhjælp 7 Håndværkspræget arbejde 8 Operatør- og monteringsarbejde samt transportarbejde 9 Andet manuelt arbejde GNS. 1. KVARTIL MEDIAN 3. KVARTIL GNS / MEDIAN (K3-K1) / M ,06 0, ,08 0, ,06 0, ,08 0, ,01 0, ,03 0, ,05 0, ,05 0,30 Kilde: Statistikbanken, tabel LON02. De to sidste kolonner er vores bearbejdning af de fire positionsmål. I den næstsidste kolonne er beregnet forholdet mellem gennemsnittet og medianen, der siger noget om skævheden i lønfordelingen. I alle tilfælde er tallet større end én svarende til, at gennemsnittet er større end medianen hvilket vil sige, at fordelingen er højreskæv for alle grupper. Graden af skævhed varierer en del med den laveste skævhed i landbrugsog håndværksarbejde. Det kan illustreres som forskellen mellem (a) og (b) i figur Kapitel 2

23 Figur 2.3. Illustration af grad af skævhed (a) Stor skævhed (a) Stor skævhed (b) Mindre skævhed (b) Mindre skævhed M G MG M = median, G = gennemsnit I sidste kolonne i tabel 2.2 er den relative kvartilafstand beregnet. Et tal på fx 0,33 betyder, at forskellen er 33 procent mellem 1. og 3. kvartillønnen set i forhold til den midterste løn, medianen. Et klart resultat er, at lønspredningen er mindre blandt ansatte med manuelle arbejdsfunktioner end blandt ansatte med ikke-manuelle funktioner. Det ses, at der for nogenlunde samme relative kvartilafstand er tale om betydelige forskelle i den absolutte forskel mellem kvartilerne. Det skyldes de markant forskellige lønniveauer, og det viser, at den relative forskel mellem kvartilerne er det relevante mål. Fraktiler (fx deciler) En generalisering af kvartiler er fraktiler. Et meget detaljeret niveau er percentiler, dvs. hundrededele, men i praksis anvendes typisk deciler, tiendedele, når man vil foretage en mere detaljeret beskrivelse af en fordeling end via kvartiler. 1. decil angiver den værdi (løn), som den lavestlønnede tiendedel ligger på eller under, og 9. decil viser, hvilken løn den højestlønnede tiendedel ligger på eller over. Fraktiler kan beregnes ved hjælp af Excels statistiske funktion FRAKTIL.MEDTAG 3. Beregningen af deciler vises i bilag 3, afsnit 5.d. 3 I dialogboksen for FRAKTIL.MEDTAG angives fx K=0,1 for 1. decil og K=0,9 for 9. decil. Percentiler vil være tal mellem K=0,01 og K=0,99. Beskrivelse af fordelinger. Histogram og fordelingsmål 21

24 Sammensatte mål for skævhed og form: Skævhed og kurtosis Skævhed er et sammensat mål for arten og graden af skævhed, der baseres på alle observationer. Et positivt tal er udtryk for, at der findes en tung hale af høje værdier, dvs. at fordelingen er højreskæv. Det er tilfældet i løneksemplet, hvor skævheden har en positiv værdi på 0,34 jf. outputtet af Beskrivende statistik i tabel 2.1. Et negativt tal er udtryk for en venstreskæv fordeling 4. En tommelfingerregel for graden af skævhed i forhold til en symmetrisk fordeling er, at en skævhed på mere end +1 eller mindre end -1 angiver en kritisk skæv fordeling. Gennemsnit og standardafvigelse er da misvisende mål, og i så fald bør man anvende medianen som mål for den typiske værdi og kvartilafstanden som mål for spredning. Modsat gælder: 1 Skævhed +1 nær /nogenlunde en symmetrisk fordeling Hvis det er tilfældet, kan gennemsnit og standardafvigelse anvendes som mål for fordelingens typiske værdi og spredning. Standardafvigelse omtales i næste afsnit. Kurtosis er et mål for, i hvilken grad fordelingen er spids eller flad sammenlignet med normalfordelingen (der er en særlig klokkeformet, symmetrisk fordeling, jf. senere). En positiv værdi angiver en relativt spids fordeling, og en negativ værdi en forholdsvis flad fordeling. En værdi mellem -1 og +1 angiver, at der nogenlunde er tale om en klokkeformet fordeling. I løneksemplet er kurtosis lig med 0,25. Det vil sige, at denne fordeling er lidt mere spids end en klokkeformet fordeling. Men der er samtidig tale om en lav værdi og dermed en ringe grad af afvigelse fra normalfordelingens klokkeform. n x - x i 4 I Excel anvendes følgende formel for skævhed: S( ) 3 hvor s er ( n -1)( n - 2) s standardafvigelsen og x i x er forskellen mellem de enkelte observationer x i og middeltallet x. Formlen udtrykker omtrentligt den gennemsnitlige afvigelse mellem de enkelte talværdier og gennemsnittet målt i antal standardafvigelser, opløftet i tredje potens. Når der opløftes til tredje potens, bevares fortegnet til x i x. 22 Kapitel 2

LØNSPREDNINGSOPGØRELSER NU TILGÆNGELIG I LOPAKS

LØNSPREDNINGSOPGØRELSER NU TILGÆNGELIG I LOPAKS LØNSPREDNINGSOPGØRELSER NU TILGÆNGELIG I LOPAKS INDHOLD 2 Formål 2 LOPAKS 3 Begreber 6 Eksempler 6. december 2010 LOPAKS er nu udvidet med en ny tabel, der giver mulighed for at opgøre lønspredning på

Læs mere

Per Vejrup-Hansen Praktisk statistik. Omslag: Torben Klahr.dk Lundsted Grafisk tilrettelæggelse: Samfundslitteratur Grafik Tryk: Narayana Press

Per Vejrup-Hansen Praktisk statistik. Omslag: Torben Klahr.dk Lundsted Grafisk tilrettelæggelse: Samfundslitteratur Grafik Tryk: Narayana Press Per Vejrup-Hansen Praktisk statistik 6. 5. udgave 2008 2013 Omslag: Torben Klahr.dk Lundsted Grafisk tilrettelæggelse: Samfundslitteratur Grafik Tryk: Narayana Press ISBN Trykt 978-87-593-1381-7 bog ISBN

Læs mere

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Microsoft Excel har en del standard anvendelsesmuligheder i forhold til den beskrivende statistik og statistisk

Læs mere

Per Vejrup-Hansen Praktisk statistik. Omslag: Torben Klahr.dk Lundsted Grafisk tilrettelæggelse: Samfundslitteratur Grafik Tryk: Narayana Press

Per Vejrup-Hansen Praktisk statistik. Omslag: Torben Klahr.dk Lundsted Grafisk tilrettelæggelse: Samfundslitteratur Grafik Tryk: Narayana Press Per Vejrup-Hansen Praktisk statistik 6. 5. udgave 2008 2013 Omslag: Torben Klahr.dk Lundsted Grafisk tilrettelæggelse: Samfundslitteratur Grafik Tryk: Narayana Press ISBN Trykt 978-87-593-1381-7 bog ISBN

Læs mere

Statistik i GeoGebra

Statistik i GeoGebra Statistik i GeoGebra Peter Harremoës 13. maj 2015 Jeg vil her beskrive hvordan man kan lave forskellige statistiske analyser ved hjælp af GeoGebra 4.2.60.0. De statistiske analyser svarer til pensum Matematik

Læs mere

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Introduktion Kursusholder: Kasper K. Berthelsen Opbygning: Kurset består af 5 blokke En blok består af: To normale

Læs mere

Kvantitative Metoder 1 - Forår 2007. Dagens program

Kvantitative Metoder 1 - Forår 2007. Dagens program Dagens program Kapitel 7 Introduktion til statistik Organisering af data Diskrete variabler Kontinuerte variabler Beskrivende statistik Fraktiler Gennemsnit Empirisk varians og spredning Empirisk korrelationkoe

Læs mere

Analyse af en lineær regression med lav R 2 -værdi

Analyse af en lineær regression med lav R 2 -værdi Analyse af en lineær regression med lav R 2 -værdi Denne gennemgang omhandler figur 13 i Regn med biologi. Man kan sagtens lave beregninger på egne data. Forsøgsmæssigt kræver det bare en tommestok tapet

Læs mere

Teknikker til analyse af tal med Excel

Teknikker til analyse af tal med Excel 1 Appendiks 2 Teknikker til analyse af tal med Excel Dette appendiks indeholder mange gentagelser fra kapitel 10, afsnit 4 Teknikker til analyse af tal i Den skinbarlige virkelighed) dog med den forskel,

Læs mere

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test.

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test. Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ -test og Goodness of Fit test. Anvendelser af statistik Statistik er et levende og fascinerende emne, men at læse om det er alt

Læs mere

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Introduktion Kasper K. Berthelsen, Inst f. Matematiske Fag Omfang: 8 Kursusgang I fremtiden

Læs mere

Deskriptiv statistik for hf-matc

Deskriptiv statistik for hf-matc Deskriptiv statistik for hf-matc 75 50 25 2018 Karsten Juul Deskriptiv statistik for hf-matc Hvad er deskriptiv statistik? 1.1 Hvad er deskriptiv statistik?... 1 1.2 Hvad er grupperede og ugrupperede data?...

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1

Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1 Statistik Formålet... 1 Mindsteværdi... 1 Størsteværdi... 1 Ikke grupperede observationer... 2 Median og kvartiler defineres ved ikke grupperede observationer således:... 2 Middeltal defineres ved ikke

Læs mere

Beskrivende statistik

Beskrivende statistik Beskrivende statistik Stikprøve af størrelse n for variablen x: x 1, x 2,, x n Beskriv fordelingen af data med nogle få talstørrelser. Centralt mål: en værdi som data er centreret om. Variationsmål: mål

Læs mere

Kapitel 3 Centraltendens og spredning

Kapitel 3 Centraltendens og spredning Kapitel 3 Centraltendens og spredning Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 25 Indledning I kapitel 2 omsatte vi de rå data til en tabel, der bedre viste materialets fordeling

Læs mere

Deskriptiv statistik for matc i stx og hf

Deskriptiv statistik for matc i stx og hf Deskriptiv statistik for matc i stx og hf 75 50 25 2019 Karsten Juul Deskriptiv statistik for matc i stx og hf Hvad er deskriptiv statistik? 1.1 Hvad er deskriptiv statistik?... 1 1.2 Hvad er grupperede

Læs mere

Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1

Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1 Statistik Formålet... 1 Mindsteværdi... 1 Størsteværdi... 1 Ikke grupperede observationer... 2 Median og kvartiler defineres ved ikke grupperede observationer således:... 2 Middeltal defineres ved ikke

Læs mere

2 Populationer. 2.1 Virkelige populationer

2 Populationer. 2.1 Virkelige populationer 2 Populationer I en statistisk sammenhæng er en population en samling af elementer, fx personer, virksomheder, lande, kunder eller mere abstrakte objekter. Fra en population kan man udtage en stikprøve.

Læs mere

Hvad siger statistikken?

Hvad siger statistikken? Eleverne har tidligere (fx i Kolorit 7, matematik grundbog) arbejdet med især beskrivende statistik (deskriptiv statistik). I dette kapitel fokuseres i højere grad på, hvordan datamateriale kan tolkes

Læs mere

Fagplan for statistik, efteråret 2015

Fagplan for statistik, efteråret 2015 Side 1 af 7 M Fagplan for statistik, efteråret 20 Litteratur Kenneth Hansen & Charlotte Koldsø (HK): Statistik I økonomisk perspektiv, Hans Reitzels Forlag 2012, 2. udgave, ISBN 9788741256047 HypoStat

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Normalfordelingen og Stikprøvefordelinger

Normalfordelingen og Stikprøvefordelinger Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger

Læs mere

Oversigt. Kursus 02402 Introduktion til Statistik. Forelæsning 1: Intro og beskrivende statistik. Per Bruun Brockhoff. Praktisk Information

Oversigt. Kursus 02402 Introduktion til Statistik. Forelæsning 1: Intro og beskrivende statistik. Per Bruun Brockhoff. Praktisk Information Kursus 02402 Forelæsning 1: Intro og beskrivende statistik Oversigt 1 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Forelæsning 1: Intro og beskrivende statistik

Forelæsning 1: Intro og beskrivende statistik Kursus 02402 Introduktion til Statistik Forelæsning 1: Intro og beskrivende statistik Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby

Læs mere

Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning

Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning Side 1 af 6 Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning Litteratur: Kenneth Hansen & Charlotte Koldsø: Statistik I økonomisk perspektiv, Hans Reitzels Forlag 2012, 2. udgave,

Læs mere

brikkerne til regning & matematik statistik preben bernitt

brikkerne til regning & matematik statistik preben bernitt brikkerne til regning & matematik statistik 2+ preben bernitt brikkerne til regning & matematik statistik 2+ 1. udgave som E-bog ISBN: 978-87-92488-33-6 2009 by bernitt-matematik.dk Kopiering af denne

Læs mere

Løsning til eksamen d.27 Maj 2010

Løsning til eksamen d.27 Maj 2010 DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1

Læs mere

Projekt 1 Spørgeskemaanalyse af Bedst på Nettet

Projekt 1 Spørgeskemaanalyse af Bedst på Nettet Projekt 1 Spørgeskemaanalyse af Bedst på Nettet D.29/2 2012 Udarbejdet af: Katrine Ahle Warming Nielsen Jannie Jeppesen Schmøde Sara Lorenzen A) Kritik af spørgeskema Set ud fra en kritisk vinkel af spørgeskemaet

Læs mere

Antal timer 19 5 7 10 0 6 6 3 7 6 4 14 6 5 12 10 Køn k m k m m k m k m k k k m k k k

Antal timer 19 5 7 10 0 6 6 3 7 6 4 14 6 5 12 10 Køn k m k m m k m k m k k k m k k k Statistik 5 Statistik er en meget omfattende matematisk disciplin, og den anvendes i meget stor udstrækning i vores moderne samfund. Den handler om at analysere et (ofte meget stort) talmateriale. Det

Læs mere

statistik og sandsynlighed

statistik og sandsynlighed brikkerne til regning & matematik statistik og sandsynlighed trin 2 preben bernitt brikkerne statistik og sandsynlighed 2 1. udgave som E-bog ISBN: 978-87-92488-20-6 2004 by bernitt-matematik.dk Kopiering

Læs mere

Indhold Forelæsning Dat-D1: Regneark Matematik og databehandling 2012

Indhold Forelæsning Dat-D1: Regneark Matematik og databehandling 2012 Indhold Forelæsning Dat-D1: Regneark Matematik og databehandling 2012 Henrik L. Pedersen Institut for Matematiske Fag henrikp@life.ku.dk 1 Forberedelsesopgaverne Dat-D-1 og Dat-D-2 2 Regnearks grundprincipper

Læs mere

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Stikprøver og stikprøve fordelinger Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Statistik Statistisk Inferens: Prediktere og forekaste værdier af

Læs mere

At kommunikere i diagrammer

At kommunikere i diagrammer At kommunikere i diagrammer Statistik formidles grafisk i kurver, søjler, cirkler og tabeller, målet er at formidle data i form af tal på en let og overskuelig måde, så læseren hurtigt kan danne sig et

Læs mere

Dig og din puls. 17-10-2004 Dig og din puls Side 1 af 17

Dig og din puls. 17-10-2004 Dig og din puls Side 1 af 17 Dig og din puls Jette Rygaard Poulsen, Frederikshavn Gymnasium og HF-kursus Hans Vestergaard, Frederikshavn Gymnasium og HF-kursus Søren Lundbye-Christensen, AAU 17-10-2004 Dig og din puls Side 1 af 17

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af

Læs mere

Statistik. Statistik er analyse af indsamlet data. Det vil sige at man bearbejder et datamateriale som i matematik næsten altid er tal.

Statistik. Statistik er analyse af indsamlet data. Det vil sige at man bearbejder et datamateriale som i matematik næsten altid er tal. Statistik Statistik er analyse af indsamlet data. Det vil sige at man bearbejder et datamateriale som i matematik næsten altid er tal. Derved får man et samlet overblik over talmaterialet, og man kan konkludere

Læs mere

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium Deskriptiv (beskrivende) statistik er den disciplin, der trækker de væsentligste oplysninger ud af et ofte uoverskueligt materiale. Det sker f.eks. ved at konstruere forskellige deskriptorer, d.v.s. regnestørrelser,

Læs mere

VIGTIGT! Kurset består af: 1. Forelæsninger. 2. Øvelser. 3. Litteraturlæsning

VIGTIGT! Kurset består af: 1. Forelæsninger. 2. Øvelser. 3. Litteraturlæsning Intro til statistik Rasmus F. Brøndum, Institut 17 (Matematik) Hjemmeside: people.math.aau.dk/~froberg 22 forelæsninger (hvor af jeg afholder de første 13) + det samme antal øvelsesgange. Hjælpelærer:

Læs mere

Indblik i statistik - for samfundsvidenskab

Indblik i statistik - for samfundsvidenskab Indblik i statistik - for samfundsvidenskab Læs mere om nye titler fra Academica på www.academica.dk Nikolaj Malchow-Møller og Allan H. Würtz Indblik i statistik for samfundsvidenskab Academica Indblik

Læs mere

1. Opbygning af et regneark

1. Opbygning af et regneark 1. Opbygning af et regneark Et regneark er et skema. Vandrette rækker og lodrette kolonner danner celler, hvori man kan indtaste tal, tekst, datoer og formler. De indtastede tal og data kan bearbejdes

Læs mere

c. Radius for hver sekter er målt i cm og angivet i følgende tabel. Desuden er arealet af hvert område beregnet.

c. Radius for hver sekter er målt i cm og angivet i følgende tabel. Desuden er arealet af hvert område beregnet. Kapitel 2 Øvelse 2.2 Cirklen er inddelt i 12 sektorer, én for hver måned. Antallet af dødsfald vokser kraftigt i juli og august og er højt flere måneder, men stiger yderligere hen over vintermånederne.

Læs mere

BL Danmarks Almene Boliger. Lønstatistik for akademiske ansatte, september måned 2018

BL Danmarks Almene Boliger. Lønstatistik for akademiske ansatte, september måned 2018 BL Danmarks Almene Boliger Lønstatistik for akademiske ansatte, september måned 2018 AE januar 2019 1 Indhold 1. Undersøgelsens metode... 3 2. Lønbegreberne i tabellerne... 5 3. Alle Akademikere... 7 1A.

Læs mere

Excel tutorial om lineær regression

Excel tutorial om lineær regression Excel tutorial om lineær regression I denne tutorial skal du lære at foretage lineær regression i Microsoft Excel 2007. Det forudsættes, at læseren har været igennem det indledende om lineære funktioner.

Læs mere

Projekt 2.9 Sumkurver som funktionsudtryk anvendt til Lorenzkurver og Ginikoefficienter (især for B- og A-niveau)

Projekt 2.9 Sumkurver som funktionsudtryk anvendt til Lorenzkurver og Ginikoefficienter (især for B- og A-niveau) Projekt 2.9 Sumkurver som funktionsudtryk anvendt til Lorenzkurver og Ginikoefficienter En sumkurve fremkommer ifølge definitionen, ved at vi forbinder en række punkter afsat i et koordinatsystem med rette

Læs mere

BL Danmarks Almene Boliger. Lønstatistik for administrative ansatte, september måned 2014

BL Danmarks Almene Boliger. Lønstatistik for administrative ansatte, september måned 2014 BL Danmarks Almene Boliger Lønstatistik for administrative ansatte, september måned 2014 AE januar 2015 1 Indhold 1. Undersøgelsens metode... 5 2. Lønbegreberne i tabellerne... 7 3. Alle... 9 1A. Årlig

Læs mere

BL Danmarks Almene Boliger. Lønstatistik for inspektører, september måned 2017

BL Danmarks Almene Boliger. Lønstatistik for inspektører, september måned 2017 BL Danmarks Almene Boliger Lønstatistik for inspektører, september måned 2017 AE januar 2018 1 Indhold 1. Undersøgelsens metode... 5 2. Lønbegreberne i tabellerne... 7 3. Alle... 9 1A. Årlig lønsum (mill.

Læs mere

BL Danmarks Almene Boliger. Lønstatistik for inspektører, september måned 2018

BL Danmarks Almene Boliger. Lønstatistik for inspektører, september måned 2018 BL Danmarks Almene Boliger Lønstatistik for inspektører, september måned 2018 AE januar 2019 1 Indhold 1. Undersøgelsens metode... 5 2. Lønbegreberne i tabellerne... 7 3. Alle... 9 1A. Årlig lønsum (mill.

Læs mere

ANVENDT STATISTIK (med anvendelse af Excel)

ANVENDT STATISTIK (med anvendelse af Excel) MOGENS ODDERSHEDE LARSEN ANVENDT STATISTIK (med anvendelse af Excel) Hyppighed 0 18 16 14 1 10 8 6 4 0 6,94 7,0 7,1 7,18 7,6 7,34 7,4 7,5 7,58 7,66 Mere Hyppighed. udgave 008 FORORD Notatet er bygget op

Læs mere

LUP læsevejledning til afdelingsrapporter

LUP læsevejledning til afdelingsrapporter Indhold Hvordan du bruger læsevejledningen... 1 Oversigtsfigur... 2 Temafigur... 3 Spørgsmålstabel... 4 Respondenter og repræsentativitet... 6 Oversigtsfigur for afsnit/underopdelinger... 8 Uddybende forklaring

Læs mere

Undervisningsplan. Stamoplysninger til brug ved prøver til gymnasiale uddannelser. Oversigt over planlagte undervisningsforløb

Undervisningsplan. Stamoplysninger til brug ved prøver til gymnasiale uddannelser. Oversigt over planlagte undervisningsforløb Undervisningsplan Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Skoleåret 2015-2016 Institution Svendborg Erhvervsskole Uddannelse Fag og niveau Lærer(e) Hold HHX Matematik C Jesper

Læs mere

Grundlæggende STATISTIK (med anvendelse af Excel)

Grundlæggende STATISTIK (med anvendelse af Excel) MOGENS ODDERSHEDE LARSEN Grundlæggende STATISTIK (med anvendelse af Excel) Hyppighed 20 18 16 14 12 10 8 6 4 2 0 6,94 7,02 7,1 7,18 7,26 7,34 7,42 7,5 7,58 7,66 Mere Hyppighed 1. udgave 2007 FORORD Notatet

Læs mere

Løsninger til kapitel 1

Løsninger til kapitel 1 Opgave. a) observation hyppighed frekvens kum. frekvens 2,25,25 3,875,325 2 3,875,5 3 3,875,6875 4,625,75 5,625,825 6,,825 7 2,25,9375 8,,9375 9,625, Frekvenser illustreres i et pindediagram,2,8,6,4,2,,8,6,4,2

Læs mere

BL Danmarks Almene Boliger. Lønstatistik for akademiske ansatte, september måned 2017

BL Danmarks Almene Boliger. Lønstatistik for akademiske ansatte, september måned 2017 BL Danmarks Almene Boliger Lønstatistik for akademiske ansatte, september måned 2017 AE januar 2018 1 Indhold 1. Undersøgelsens metode... 3 2. Lønbegreberne i tabellerne... 5 3. Alle Akademikere... 7 1A.

Læs mere

INTRODUKTION TIL DIAGRAMFUNKTIONER I EXCEL

INTRODUKTION TIL DIAGRAMFUNKTIONER I EXCEL INTRODUKTION TIL DIAGRAMFUNKTIONER I EXCEL I denne og yderligere at par artikler vil jeg se nærmere på diagramfunktionerne i Excel, men der er desværre ikke plads at gennemgå disse i alle detaljer, dertil

Læs mere

BL Danmarks Almene Boliger. Lønstatistik for inspektører, september måned 2014

BL Danmarks Almene Boliger. Lønstatistik for inspektører, september måned 2014 BL Danmarks Almene Boliger Lønstatistik for inspektører, september måned 2014 AE januar 2015 1 Indhold 1. Undersøgelsens metode... 5 2. Lønbegreberne i tabellerne... 7 3. Alle... 9 1A. Årlig lønsum (mill.

Læs mere

Personaleomsætning september

Personaleomsætning september Personaleomsætning september 2015-2016 Personaleomsætningsstatistikken findes i to udgaver. Den ene er tilgængelig for alle på KRLs hjemmeside, den anden er kun tilgængelig for kommuner og regioner med

Læs mere

BL Danmarks Almene Boliger. Lønstatistik for akademiske ansatte, september måned 2014

BL Danmarks Almene Boliger. Lønstatistik for akademiske ansatte, september måned 2014 BL Danmarks Almene Boliger Lønstatistik for akademiske ansatte, september måned 2014 AE januar 2015 1 Indhold 1. Undersøgelsens metode... 3 2. Lønbegreberne i tabellerne... 5 3. Alle Akademikere... 7 1A.

Læs mere

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 13: Summary Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

UNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER

UNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER UNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER Undervisningseffekten udregnes som forskellen mellem den forventede og den faktiske karakter i 9. klasses afgangsprøve. Undervisningseffekten udregnes

Læs mere

5. Statistik. Hayati Balo,AAMS. 1. Carstensen, Frandsen og Studsgaard, stx mat B2, systime

5. Statistik. Hayati Balo,AAMS. 1. Carstensen, Frandsen og Studsgaard, stx mat B2, systime 5. Statistik Hayati Balo,AAMS Følgende fremstilling er baseret på 1. Carstensen, Frandsen og Studsgaard, stx mat B2, systime 1. Ugrupperede Observationer Hvis der foreligger et antal målinger eller observationer

Læs mere

Kapitel 7 Forskelle mellem centraltendenser

Kapitel 7 Forskelle mellem centraltendenser Kapitel 7 Forskelle mellem centraltendenser Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 29 Indledning 1. z-test for ukorrelerede data 2. t-test for ukorrelerede data med ens

Læs mere

BL Danmarks Almene Boliger. Lønstatistik for inspektører, september måned 2016

BL Danmarks Almene Boliger. Lønstatistik for inspektører, september måned 2016 BL Danmarks Almene Boliger Lønstatistik for inspektører, september måned 2016 AE februar 2017 1 Indhold 1. Undersøgelsens metode... 5 2. Lønbegreberne i tabellerne... 7 3. Alle... 9 1A. Årlig lønsum (mill.

Læs mere

for gymnasiet og hf 2017 Karsten Juul

for gymnasiet og hf 2017 Karsten Juul for gymnasiet og hf 75 50 5 017 Karsten Juul Statistik for gymnasiet og hf 017 Karsten Juul 5/11-017 Nyeste version af dette hæfte kan downloades fra http://mat1.dk/noter.htm Hæftet må benyttes i undervisningen

Læs mere

MAteMAtik For LærerStUDerenDe

MAteMAtik For LærerStUDerenDe JOhN schou kristine JEss hans christian hansen JEppE skott MAteMAtik For LærerStUDerenDe stokastik 1. 10. klasse Joh n Schou, Kristine Jess, Hans Christian Hansen og Jeppe Skott Matematik for lærerstuderende

Læs mere

BL Danmarks Almene Boliger. Lønstatistik for gartnere, september måned 2017

BL Danmarks Almene Boliger. Lønstatistik for gartnere, september måned 2017 BL Danmarks Almene Boliger Lønstatistik for gartnere, september måned 2017 AE januar 2018 1 Indhold 1. Undersøgelsens metode... 3 2. Lønbegreberne i tabellerne... 5 3. Alle gartnere... 7 1A. Årlig lønsum

Læs mere

Schweynoch, 2003. Se eventuelt http://www.mathematik.uni-kassel.de/~fathom/projekt.htm.

Schweynoch, 2003. Se eventuelt http://www.mathematik.uni-kassel.de/~fathom/projekt.htm. Projekt 8.5 Hypotesetest med anvendelse af t-test (Dette materiale har været anvendt som forberedelsesmateriale til den skriftlige prøve 01 for netforsøget) Indhold Indledning... 1 χ -test... Numeriske

Læs mere

BL Danmarks Almene Boliger. Lønstatistik for boligsociale medarbejdere, september måned 2018

BL Danmarks Almene Boliger. Lønstatistik for boligsociale medarbejdere, september måned 2018 BL Danmarks Almene Boliger Lønstatistik for boligsociale medarbejdere, september måned 2018 AE januar 2019 1 Indhold 1. Undersøgelsens metode... 5 2. Lønbegreberne i tabellerne... 7 3. Alle boligsociale

Læs mere

Simulering af stokastiske fænomener med Excel

Simulering af stokastiske fænomener med Excel Simulering af stokastiske fænomener med Excel John Andersen, Læreruddannelsen i Aarhus, VIA Det kan være en ret krævende læreproces at udvikle fornemmelse for mange begreber fra sandsynlighedsregningen

Læs mere

Gennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP()

Gennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP() Gennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP() John Andersen, Læreruddannelsen i Aarhus, VIA Et kast med 10 terninger gav følgende udfald Fig. 1 Result of rolling 10 dices

Læs mere

BL Danmarks Almene Boliger. Lønstatistik for boligsociale medarbejdere, september måned 2017

BL Danmarks Almene Boliger. Lønstatistik for boligsociale medarbejdere, september måned 2017 BL Danmarks Almene Boliger Lønstatistik for boligsociale medarbejdere, september måned 2017 AE januar 2018 1 Indhold 1. Undersøgelsens metode... 5 2. Lønbegreberne i tabellerne... 7 3. Alle boligsociale

Læs mere

INDHOLDSFORTEGNELSE. INDLEDNING... Indledning. KAPITEL ET... Kom videre med Excel. KAPITEL TO... 27 Referencer og navne

INDHOLDSFORTEGNELSE. INDLEDNING... Indledning. KAPITEL ET... Kom videre med Excel. KAPITEL TO... 27 Referencer og navne INDHOLDSFORTEGNELSE INDLEDNING... Indledning KAPITEL ET... Kom videre med Excel Flyt markering efter Enter... 8 Undgå redigering direkte i cellen... 9 Markering ved hjælp af tastaturet... 10 Gå til en

Læs mere

Kapitel 4 Sandsynlighed og statistiske modeller

Kapitel 4 Sandsynlighed og statistiske modeller Kapitel 4 Sandsynlighed og statistiske modeller Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 Indledning 2 Sandsynlighed i binomialfordelingen 3 Normalfordelingen 4 Modelkontrol

Læs mere

BL Danmarks Almene Boliger. Lønstatistik for inspektører, september måned 2013

BL Danmarks Almene Boliger. Lønstatistik for inspektører, september måned 2013 BL Danmarks Almene Boliger Lønstatistik for inspektører, september måned 2013 AE januar 2014 1 Indhold 1 Undersøgelsens metode... 5 2 Lønbegreberne i tabellerne... 7 3. Alle... 9 1A. Årlig lønsum (mill.

Læs mere

BL Danmarks Almene Boliger. Lønstatistik for akademiske ansatte, september måned 2016

BL Danmarks Almene Boliger. Lønstatistik for akademiske ansatte, september måned 2016 BL Danmarks Almene Boliger Lønstatistik for akademiske ansatte, september måned 2016 AE februar 2017 1 Indhold 1. Undersøgelsens metode... 3 2. Lønbegreberne i tabellerne... 5 3. Alle Akademikere... 7

Læs mere

Installa on af Analysis Toolpak og KeHaTools

Installa on af Analysis Toolpak og KeHaTools Installa on af Analysis Toolpak og KeHaTools Installa on af Analysis Toolpak Denne er nødvendig for at kunne lave optællinger, variansanalyse (kap. 12) og regressionsanalyser (kap. 15 pg 16). Analysis

Læs mere

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet Matematik A Studentereksamen Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet stx11-matn/a-080501 Tirsdag den 8. maj 01 Forberedelsesmateriale til stx A Net MATEMATIK Der

Læs mere

Fig. 1 Billede af de 60 terninger på mit skrivebord

Fig. 1 Billede af de 60 terninger på mit skrivebord Simulation af χ 2 - fordeling John Andersen Introduktion En dag kastede jeg 60 terninger Fig. 1 Billede af de 60 terninger på mit skrivebord For at danne mig et billede af hyppighederne flyttede jeg rundt

Læs mere

Ved et folketingsvalg eller en folkeafstemning spørger man alle stemmeberettigede, og kun en del af dem stemmer.

Ved et folketingsvalg eller en folkeafstemning spørger man alle stemmeberettigede, og kun en del af dem stemmer. Matematik C (må anvendes på Ørestad Gymnasium) Statistik Statistik er bearbejdning af talmaterialer, der ofte indeholderstore mængder af tal. De indsamles og registreres i mange forskellige sammenhænge

Læs mere

Huskesedler. Anvendelse af regneark til statistik

Huskesedler. Anvendelse af regneark til statistik Huskesedler Anvendelse af regneark til statistik August 2013 2 Indholdsfortegnelse Aktivere Analysis Toolpak... 4 Dataudtræk fra Danmarks Statistik... 4 Kopiering af formler... 4 Målsøgning... 5 Normalfordeling...

Læs mere

Statistik vejledende læreplan og læringsmål, efteråret 2013 SmartLearning

Statistik vejledende læreplan og læringsmål, efteråret 2013 SmartLearning Side 1 af 6 Statistik vejledende læreplan og læringsmål, efteråret 2013 SmartLearning Litteratur: Kenneth Hansen & Charlotte Koldsø: Statistik I økonomisk perspektiv, Hans Reitzels Forlag 2012, 2. udgave,

Læs mere

C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b2.

C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b2. C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b. 5.000 4.800 4.600 4.400 4.00 4.000 3.800 3.600 3.400 3.00 3.000 1.19% 14.9% 7.38% 40.48% 53.57% 66.67% 79.76% 9.86% 010 011

Læs mere

for gymnasiet og hf 2016 Karsten Juul

for gymnasiet og hf 2016 Karsten Juul for gymnasiet og hf 75 50 5 016 Karsten Juul Statistik for gymnasiet og hf Ä 016 Karsten Juul 4/1-016 Nyeste version af dette håfte kan downloades fra http://mat1.dk/noter.htm HÅftet mç benyttes i undervisningen

Læs mere

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen

Læs mere

Undervisningsbeskrivelse

Undervisningsbeskrivelse Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Institution Uddannelse Fag og niveau Lærer(e) Hold Termin hvori undervisningen afsluttes: Maj-juni, 14. Denne

Læs mere

Statistik. Kvartiler og middeltal defineres forskelligt ved grupperede observationer og ved ikke grupperede observationer.

Statistik. Kvartiler og middeltal defineres forskelligt ved grupperede observationer og ved ikke grupperede observationer. Statistik Formålet... 1 Mindsteværdi... 1 Størsteværdi... 1 Ikke grupperede observationer... 2 Median og kvartiler defineres ved ikke grupperede observationer således:... 2 Middeltal defineres ved ikke

Læs mere

BL Danmarks Almene Boliger. Lønstatistik for administrative ansatte, september måned 2017

BL Danmarks Almene Boliger. Lønstatistik for administrative ansatte, september måned 2017 BL Danmarks Almene Boliger Lønstatistik for administrative ansatte, september måned 2017 AE januar 2018 1 Indhold 1. Undersøgelsens metode... 5 2. Lønbegreberne i tabellerne... 7 3. Alle administrative

Læs mere

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Læs mere

Dig og din puls Lærervejleding

Dig og din puls Lærervejleding Dig og din puls Lærervejleding Indledning I det efterfølgende materiale beskrives et forløb til matematik C, hvori eleverne skal måle hvilepuls og arbejdspuls og beskrive observationerne matematisk. Materialet

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Introduktion 1 Formelt Lærere: Esben Budtz-Jørgensen Jørgen Holm Petersen Øvelseslærere: Berivan+Kathrine, Amalie+Annabell Databehandling: SPSS

Læs mere

Spørgeskemaundersøgelser og databehandling

Spørgeskemaundersøgelser og databehandling DASG. Nye veje i statistik og sandsynlighedsregning. side 1 af 12 Spørgeskemaundersøgelser og databehandling Disse noter er udarbejdet i forbindelse med et tværfagligt samarbejde mellem matematik og samfundsfag

Læs mere

Undervisningsplan. Stamoplysninger til brug ved prøver til gymnasiale uddannelser. Oversigt over planlagte undervisningsforløb

Undervisningsplan. Stamoplysninger til brug ved prøver til gymnasiale uddannelser. Oversigt over planlagte undervisningsforløb Undervisningsplan Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Skoleåret 2016-2017 Institution Svendborg Erhvervsskole Uddannelse Fag og niveau Lærer(e) Hold HHX Matematik C Ole

Læs mere

For at få tegnet en graf trykkes på knappen for graftegning. Knap for graftegning

For at få tegnet en graf trykkes på knappen for graftegning. Knap for graftegning Graftegning på regneark. Ved hjælp af Excel regneark kan man nemt tegne grafer. Man åbner for regnearket ligger under Microsoft Office. Så indtaster man tallene fra tabellen i regnearkets celler i en vandret

Læs mere

Baggrundsnotat: Søskendes uddannelsesvalg og indkomst

Baggrundsnotat: Søskendes uddannelsesvalg og indkomst 17. december 2013 Baggrundsnotat: Søskendes uddannelsesvalg og indkomst Dette notat redegør for den økonometriske analyse af indkomstforskelle mellem personer med forskellige lange videregående uddannelser

Læs mere

Specialkort med Valgdata

Specialkort med Valgdata Specialkort med Valgdata Søren Risbjerg Thomsen d. 25. april 2017 Introduktion I det følgende beskrives, hvordan man anvender Valgdata til at skabe specialkort, dvs. kort hvor man selv bestemmer indholdet

Læs mere

Excel tutorial om indekstal og samfundsfag 2008

Excel tutorial om indekstal og samfundsfag 2008 Excel tutorial om indekstal og samfundsfag 2008 I denne note skal vi behandle data fra CD-rommen Samfundsstatistik 2008, som indeholder en mængde data, som er relevant i samfundsfag. Vi skal specielt analysere

Læs mere

Samfundsfagslærerens lille manual vol. II

Samfundsfagslærerens lille manual vol. II Samfundsfagslærerens lille manual vol. II Hvilke beregningsopgaver bør trænes i undervisningen? Formålet her er, at danne overblik over hvilke beregningsopgaver der hører ind under daglig samfundsfagsundervisningen

Læs mere

Diagrammer visualiser dine tal

Diagrammer visualiser dine tal Diagrammer visualiser dine tal Indledning På de efterfølgende sider vil du blive præsenteret for nye måder at arbejde med Diagrammer på i Excel. Vejledningen herunder er vist i Excel 2007 versionen, og

Læs mere

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14 Module 5: Exercises 5.1 ph i blod.......................... 1 5.2 Medikamenters effektivitet............... 2 5.3 Reaktionstid........................ 3 5.4 Alkohol i blodet...................... 3 5.5

Læs mere

Modul 1: Beskrivende dataanalyse

Modul 1: Beskrivende dataanalyse Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 1: Beskrivende dataanalyse 1.1 Statistik og dataanalyse............................... 1 1.2 Variable og data...................................

Læs mere