Teknikker til analyse af tal med Excel

Størrelse: px
Starte visningen fra side:

Download "Teknikker til analyse af tal med Excel"

Transkript

1 1 Appendiks 2 Teknikker til analyse af tal med Excel Dette appendiks indeholder mange gentagelser fra kapitel 10, afsnit 4 Teknikker til analyse af tal i Den skinbarlige virkelighed) dog med den forskel, at appendikset indeholder vejledning i, hvordan disse teknikker kan benyttes ved hjælp af regnearket i Microsoft Excel, Microsoft Office Professional plus Univariat analyse Betragter du alene én variabel og dens fordeling på undersøgelsesenhederne, er du i gang med den simpleste form for kvantitativ analyse, det der betegnes univariat analyse. Frekvensfordeling Det kan være en frekvensfordeling, du kan udtrykke i absolutte tal eller procenter. Det kan fx være en opgørelse over, hvor mange i en spørgeskemaundersøgelse der har svaret i de enkelte svarkategorier på hvert spørgsmål. Denne analyseform har et rent beskrivende formål. På næste side ser du et rådatasæt, der er organiseret i et Excel-regneark:

2 2 ib andersen: den skinbarlige virkelighed samfundslitteratur.dk Figur 1: Udsnit af regneark med respondenters besvarelser på en spørgeskemaundersøgelse af trivsel i en større dansk virksomhed. Datasættet stammer fra en trivselsundersøgelse i en større dansk virksomhed: Tallene i matrixen repræsenterer svar på et spørgeskema om trivsel. Kolonne A angiver svarpersonens nummer. Der er i alt 5418 besvarelser, men af pladshensyn er kun de 22 første besvarelser medtaget. Svarene i kolonne B står for køn. 1 betyder kvinde, og 2 betyder mand. Svarene fx i kolonne G er svarene på spørgsmålet.: Hvor tilfreds er du med at være ansat i virksomheden? Her står 1 for Meget tilfreds 2 for Overvejende tilfreds 3 for Overvejende utilfreds 4 for Meget utilfreds Disse svarkategorier angiver en ordinalskala (jf. kap. 4, afsnit 5: Måleniveauer for data). En univariat analyse af disse trivselsdata kan bestå i at give en oversigt over,

3 3 hvor mange personer, der har svaret på de forskellige spørgsmål fordelt på kategorier. Det vil se således ud for spørgsmålet i kolonne G: Figur 2: Frekvensfordeling af respondenters besvarelse af spørgsmålet: Hvor tilfreds er du med at være ansat i virksomheden? Du kan se, at der i alt er 5382 af de 5418, der har svaret på dette spørgsmål. Samtidig kan du se, at de overvejende har svaret i de to første svarkategorier. Hvis du beregner den procentvise fordeling på svarkategorierne, får du følgende tabel: Figur 3: Procentvis fordeling af respondenters besvarelse af spørgsmålet: Hvor tilfreds er du med at være ansat i virksomheden? Med andre ord svarer mere end 94 % af respondenterne positivt på dette spørgsmål. Søjlediagram Grafisk kan du udtrykke dette i et søjlediagram: Figur 4: Frekvensfordeling af respondenters besvarelse: Søjlediagram

4 4 ib andersen: den skinbarlige virkelighed samfundslitteratur.dk Dette kan ske i Excel ved at markere tabellens indmad inklusive kolonne og rækkenavne og derefter klikke på fanen Indsæt, vælge funktionen Diagrammer og derefter klikke på Søjle. Gennemsnit Hvis du har tal, der er skalerbare på mindst intervalskalaniveau, kan resultatet af en univariat analyse være et gennemsnitstal. Se på nedenstående datasæt: Figur 5: Påbegyndte boliger og salg fordelt over kvartaler Kilde: Frit efter Vejrup-Hansen (2008). Matrixen viser en oversigt over en virksomheds salg (Y) fordelt over kvartaler i 4,5 år. X-variablen viser et indekstal for antal påbegyndte boliger kvartalet før. Hvis vi i første omgang kun ser på salget, kan vi se, at det varierer over hele perioden mellem 70 som det laveste og 142 som det højeste salg. Vi kan udregne det gennemsnitlige salg over hele perioden ved at tage et aritmetisk gennemsnit af salgstallene ved at lægge alle salgstallene sammen og dividere med antallet af kvartaler. Så når vi frem til det gennemsnitlige salg pr. kvartal, som er 98,17 ved hjælp af formlen: gennemsnit = x i /n, hvor x i er alle salgstal, som lægges sammen og divideres med antal observationer n (=18).

5 5 Spredning Hvis vi ønsker at vide, hvor meget salgstallene spreder sig om dette gennemsnit, kan vi beregne spredningen. Formlen for spredning er følgende: hvor n er antallet af observationer i dette tilfælde 18. x i angiver de 18 forskellige observationer af salg t, og x-streg er gennemsnittet, som vi fandt ovenfor. Formlen siger, at differencerne mellem gennemsnittet og de enkelte salgsobservationer beregnes og kvadreres, hvorefter de lægges sammen og divideres med n-1(=17), og endelig tages kvadratroden af den fremkomne størrelse. I dette tilfælde kommer vi frem til en spredning på 15,26. Tager vi spredningen og ganger med 2 og henholdsvis trækker den fra og lægger den til gennemsnittet - får vi følgende to værdier: 67,65 og 128,69. Hvis fordelingen er tilnærmelsesvis normalfordelt, ved vi, at vi har godt 95 af den samlede fordeling mellem disse to tal se nedenstående illustration: Figur 6: Spredningen (også kaldet standardafvigelsen) i en normalfordeling Gns. 68,2% 95,4% 99,7% Antal standardafvigelser Kilde: Per Vejrup-Hansen (2012). I Excel beregnes gennemsnit og spredning lettest ved at omdanne datasættet til en Excel-tabel. Vælg fanen Indsæt og klik på ikonet Tabel ude til venstre i fanen. Du får nu følgende dialogboks frem:

6 6 ib andersen: den skinbarlige virkelighed samfundslitteratur.dk Du angiver i feltet, hvor tabellen skal hente sine data. Husk at medtage overskrifter og sæt flueben i Tabellen indeholder overskrifter. Klik på OK : Vi får nu en Exceltabel, der ser sådan ud: Figur 7: Påbegyndte boliger og salg fordelt over kvartaler: Tabel Det anbefales generelt, at du fra begyndelsen omdanner din matrix til en tabel. Det medfører bl.a., at afgrænsningen bliver dynamisk, så du fx kan indsætte eller slette rækker og kolonner uden at skulle revidere formler og funktioner. Anbring nu din markør i en tilfældig tabelcelle. Der fremkommer nu en fane Tabelværktøjer Design. Vælg fanen og sæt flueben i Rækken total lige nedenfor. Nu tilføjes en række med Total. Anbring din markør i denne række i kolonnen Salg sådan her: Tryk på den lille pil til højre for cellen. Du får nu en række muligheder. Tryk på hhv. Gennemsnit og Stdafv. Den sidste angiver spredningen omkring gennemsnittet. Prøv evt. selv nogen af de øvrige beregningsfunktioner i menuen for at se, hvad de indeholder.

7 7 Histogram Ønsker du at udtrykke salget grafisk, kan du bruge funktionen Histogram. Gå ind i fanen Data og vælg funktionen Dataanalyse helt ude til højre. Hvis denne funktion ikke kan ses i din fane, skal du aktivere den. Du finder fremgangsmåden til denne aktivering her: [http://office.microsoft.com/da-dk/excel-help/hurtig-startaktivere-og-bruge-et-tilfojelsesprogram-ha aspx]. Men inden du bruger funktionen Histogram skal Excel have at vide, i hvilke intervaller dine data skal ordnes. Ved siden af Salg t skiver du Interval, og nedenunder angiver du intervalinddelingen. Vælg fanen Data, dernæst Dataanalyse, marker Histogram og klik OK. Følgende dialogboks kommer op: Angiv først salgstallene i Inputområde, angiv Intervalområde, sæt flueben i Diagramoutput og klik OK. Du får nu et histogram som her:

8 8 ib andersen: den skinbarlige virkelighed samfundslitteratur.dk Figur 8: Påbegyndte boliger og salg: Histogram Beregning af gennemsnit, spredning samt den grafiske fremstilling af tallene giver en god oversigt over salgsfordelingen over kvartalerne. Bivariat analyse Den bivariate analyse beskæftiger sig med to variabler og deres indbyrdes samvariation. Krydstabeller For at undersøge en sådan samvariation kan du krydse de to variabler. Det sker ved at sammenholde værdierne på de to variabler for hver enkelt undersøgelsesenhed. Resultaterne kan angives i en krydstabel. Du kan tage udgangspunkt i et Excel-regneark eller et regneark, der er omdannet til Excel-tabel til at danne krydstabeller mellem de forskellige variabler to og to med den funktion, der hedder Pivottabel. Tager du udgangspunkt i den ovenfor refererede matrix med trivselsdata, kan du se, at der er i alt 45 spørgsmål i spørgeskemaet. Det vil sige, at du kan producere 45x44/2 krydstabeller (n(n-1)/2) = 990 krydstabeller. Det er et meget stort arbejde, hvis dette skal gøres i Excel uden et særligt redskab. Men her kan du betjene dig af den funktion i Excel, der hedder Pivottabel. I Excel finder du pivottabel-funktionen i fanen Indsæt helt ude til venstre:

9 9 Klik på ikonet Pivottabel og følgende dialogboks Opret pivottabel kommer op: Du skal nu vælge Tabel/område, hvor Pivottabellen skal hente sine data. Du kan med fordel vælge hele datasættet fra variablen Køn til den sidste variabel i kolonne AT. Så du vælger området fra B2 til AT5419. Derefter skal du vælge, om pivottabellen skal dannes i det Eksisterende regneark eller i et Nyt regneark. Du vælger Nyt regneark. Nu ser dialogboksen sådan ud:

10 10 ib andersen: den skinbarlige virkelighed samfundslitteratur.dk Vælg OK. Nu kommer følgende skærmbillede op i venstre side af skærmen: Dette skærmbillede viser, hvor tabellen bliver dannet. Her vil du kunne følge, hvordan din tabel ser ud og ændre indhold, alt efter hvilke variabler du vælger hhv. til tabellens forspalte (rækker) og tabellens hoved (kolonner). I højre side af skærmen er der en menu, der ser sådan ud:

11 11 Dette område angiver de variabler, du kan placere hhv. i forspalten ( Rækkenavne ) og i tabelhovedet ( Kolonnenavne ). Du vælger variabler ved at trække dem fra variabeloversigten ned til felterne hhv. Rækkenavne og Kolonnenavne. Du vælger variablen Køn og trækker den ned i feltet Rækkenavne, og du vælger variablen nr. seks fra oven: Hvor tilfreds er du med at være ansat i virksomheden, og trækker den ned i feltet Kolonnenavne. Til sidst skal du vælge en vilkårlig variabel, som du trækker ned i Værdier. Hvis datamatrixen indeholder tal som variabelværdier, som de gør her, skal du også vælge, om værdierne skal lægges sammen, eller om det

12 12 ib andersen: den skinbarlige virkelighed samfundslitteratur.dk blot er antallet af hver værdi der skal findes. Excel tager automatisk sumværdien, men du er interesseret i antallet. Derfor må du klikke på den lille pil ved siden Sumvariablen. Her er valgt køn som sumvariabel. Hvis du klikker på den lille pil til højre, får du en dialogboks op. Du klikker på det sidste emne i dialogboksen Værdiindstillinger. Herved fremkommer en ny dialogboks som ser således ud: Du klikker på Antal og derefter OK. Du får nu en pivottabel frem, der ser således ud:

13 13 Figur 9: Køn fordelt på trivsel (1) 0 Her angiver 0 angiver, at spørgsmålet ikke er besvaret. Der alt 125 personer, der ikke har svaret på spørgsmålet om køn. Vi sletter derfor denne række. Det fremgår, at en person har kønnet 3, men det eksisterer ikke. Det må være en fejl ved udfyldelse eller kodning. Så den række sletter vi også. Det fremgår af tabellens kolonne 0, at der er 36 personer, der ikke har svaret på trivsels-spørgsmålet. Du fjerner rækker og kolonner ved at trykke på den lille pil ud for rækkenavne hhv. kolonne navne. Der fremkommer så en menu, hvor alle rækker hhv. kolonner er angivet med et flueben. Fjerner du fluebenet i dem, du ikke ønsker at have med fjerner du hhv. uønskede rækker og kolonner. Du klikker bare i fluebenet, så forsvinder det. Derefter klikker du på OK. Du får nu en tabel, der ser sådan ud: Figur 10: Køn fordelt på trivsel (2) Du er ikke helt tilfreds med tabellen. Hvis du vil redigere række- og kolonnenavne, skal du tage en kopi af pivottabellen og indsætte den med Indsæt speciel. Den funktion finder du, hvis du højreklikker på det felt, hvor tabellen skal indsættes. Du får en dialogboks op, hvor du vælger Indsæt speciel. Der kommer nu en ny dialogboks op, som ser sådan ud:

14 14 ib andersen: den skinbarlige virkelighed samfundslitteratur.dk Du vælger Værdier, som du ser ovenfor. Derefter klikker du på K. Du har nu en tabel, som ikke har bindinger til den oprindelige pivottabel. Der for kan du redigere tabellen som du vil. Eventuelt med et sådant udseende: Figur 11: Køn fordelt på trivsel (3) Tabellens forspalte angiver køn, og tabellens hoved angiver de fire svarmuligheder på det stillede spørgsmål om tilfredshed. Variablen køn udgør en nominalskala, og variablen tilfredshed udgør en ordinalskala (jf. kap. 4, afsnit 5). Tabellen viser, at der i alt er personer med i tabellen (de resterende 157 er internt bortfald). Heraf er 642 kvinder og mænd. Tabellen viser, hvordan kvinder og mænds besvarelser fordeler sig over de fire mulige svarkategorier. Hvis du ønsker at under-

15 15 søge, om der er forskel på kvinder og mænds besvarelser, kan det fx gøres ved at se på den procentvise fordeling af de to køn over de forskellige svarmuligheder. Det gøres ligeledes nemt i Excel ved hjælp af formelindsætning eller ved hjælp af Værktøjer til pivottabel. Bruger du den første fremgangsmåde, skal du først tage en almindelig kopi af ovenstående tabel. Derefter skal du placere markøren i den kopierede tabels celle i første række og kolonne. Du kan nu bruge formlen =B5/$F5*100 og trække igennem hele den kopierede tabel. Så får den en tabel, der ser sådan ud, hvis du har begrænset decimalerne til to og tilføjet procentvis i tabeloverskriften: Figur 12: Køn procentvis fordelt på trivsel Bruger du den anden fremgangsmåde, skal du gå tilbage til din pivottabel. Marker tabellen og fane-menuen vil ændre sig, så der fremkommer en fane med Værktøjer til pivotabel. Sådan her: Du vælger fanen Indstillinger og klikker på ikonet med %-tegnet (det sidste ikon på ovenstående billede). Din pivottabel vil blive fyldt med de sammen procenter, som tabellen ovenfor. Det er meget hurtigt og nemt. Men vil du have samme design på din tabel som ovenstående, skal du igennem hele redigeringsprocessen igen. Det slipper du for ved at bruge formelmetoden. Umiddelbart ser det ud som om, at de to køn svarer meget i overensstemmelse med hverandre.

16 16 ib andersen: den skinbarlige virkelighed samfundslitteratur.dk Søjlediagram i bivariat analyse Dette kan tydeligt illustreres grafisk med et søjlediagram. I Excel markerer man blot tabellens indmad, køn og svarmuligheder for derefter at klikke på Søjle i funktionen Diagrammer i fanen Indsæt. Herved fremkommer følgende søjlediagram: Figur 13: Køn fordelt på trivsel: Søjlediagram Diagrammet viser ligeledes temmelig tydeligt en meget lille variation mellem kvinder og mænds besvarelse. Samtidig viser diagrammet, at kvinders svar fordeler sig mere spredt end mændenes svar. Statistiske mål for samvariation mellem to variabler Der findes en lang række statistiske mål for samvariation mellem to variabler, som du kan udtrykke med en talstørrelse eller en sandsynlighed. Der findes grundlæggende to former for disse mål: ikke-parametriske mål og parametriske mål. Husk, at et statistisk samvariationsmål intet siger om årsagssammenhænge! Ikke-parametriske mål Disse mål betegnes også som fordelingsfrie mål (se kapitel 10 i Den skinbarlige virkelighed). Et hyppigt anvendt mål er χ2-testet. Dette test kan udføres uanset hvilken skala, vi arbejder med (nominal-, ordinal-, interval- eller forholdstalsskala). χ2-testet kan gennemføres i Excel, og den χ 2 -størrelse, som χ 2 -testet i Excel angiver, er sandsynligheden for, at der ingen sammenhæng er i tabellen. Med andre ord sandsynligheden for, at der er en fuldstændig ligelig fordeling mellem kvinder og mænds svar.

17 17 Excel har brug for to tabeller til at gennemføre dette test. Den ene tabel er den, der er angivet i den tidligere figur, der indeholder de absolutte tal for Køn fordelt på trivsel. Den anden tabel er en konstrueret tabel, der angiver, hvordan fordelingen burde se ud, såfremt der var fuldstændig ligelig svarfordeling mellem kønnene (også kaldet forventede værdier ). Denne tabel beregnes ud fra i alt værdierne for hhv. rækker og kolonner. For hver tabelcelle ganges deres kolonnes Hovedtotal -værdi med deres rækkes Hovedtotal -værdi og dette tal divideres med det totale antal besvarelser (i dette tilfælde 5261 besvarelser). Dette gøres for hver celle i tabellen. I Excel kan man bruge formelfunktionen til denne beregning (jf. appendiks 1). Nedenfor vises tabellen over de forventede værdier: Figur 14: Køn fordelt på trivsel: forventede værdier I Excel finder vi χ 2 -testet på følgende måde: Gå ind i fanen Formler og vælg Flere funktioner og vælg derefter Statistik og endelig chi2.test. Der fremkommer nu en dialogboks, hvor du skal angive områderne for henholdsvis observerede værdier og forventede værdier, og tryk på OK. Excel vil nu beregne sandsynligheden for, at der ingen samvariation er. Beregningen giver en værdi på 0, Det vil sige, at der er godt 1 promilles sandsynlighed for, at der ikke er samvariation mellem køn og tilfredshed. Alternativt må du så slutte, at der må være en eller anden form for samvariation, men χ 2 -testet fortæller dig ikke, hvad det er for en eventuel samvariation, der er mellem de to variabler. Det er jo lidt overraskende, at χ 2 -testet antyder, at der er en samvariation, når vi på procentfordeling og søjlediagram vurderede, at der næsten var ligelig fordeling mellem kønnenes besvarelser. Dette afslører en svaghed ved χ 2 -testet. Når man har så mange observationer (i dette tilfælde 5216), vil χ 2 -testet vise meget små sandsynligheder for, at der ikke er nogen samvariation mellem de to variabler. Havde du taget en stikprøve på 10 % af dem, der har besvaret spørgeskemaet fx hver tiende respondent (i alt 526 besvarelser), ville χ 2 -testet have givet en sandsynlighed på 0,6246. Altså godt 62 % sandsynlighed for, at der ingen samvariation er mellem de to variabler. Der findes andre ikke-parametriske mål for samvariation mellem to variabler. Disse forudsætter som regel en rangordnet skala (ordinalskala). Svarkategorierne i trivselsvariabelen ovenfor udgør en ordinalskala. Disse mål beregnes ved at give data rang-værdier. Den mindste værdi får rang 1, den næstmindste rang 2 og så videre.

18 18 ib andersen: den skinbarlige virkelighed samfundslitteratur.dk Der er ikke nødvendigvis lige så langt mellem 1 og 2, som der er mellem 2 og 3 osv. Dette er ikke-parametrisk statistik beregnet til at håndtere. Et meget almindeligt anvendt mål er Kendall rangordens korrelation. Som regel betegnet med det græske bogstav τ (Tau). Dette mål kan beregnes for to variabler, der er målt på ordinalskalaniveau. Målet varierer fra -1 til +1 og angiver hhv. perfekt negativ samvariation og perfekt positiv samvariation mellem to variabler. τ = 0 angiver, at der ingen samvariation er mellem de to variable. τ kan ikke umiddelbart beregnes ved hjælp af Excel regneark. (brug SPSS eller SAS). Hvis du ønsker at bruge dette sammenhængsmål, bør du henvende dig til en ekspert på området. Kendall τ svarer lidt til Pearson produkt-moment korrelationskoefficient r (se efterfølgende). Parametriske mål Der findes andre samvariationsmål, der bygger på statiske fordelinger (almindeligvis normalfordelingen). Korrelationsmål Det mest anvendte mål, hvis to stokastiske variabler x og y er normalfordelt og målt på mindst intervalniveau, er (Pearson) korrelationskoefficienten, som almindeligvis angives med bogstavet R eller r. Dette mål er et mål for lineær samvariation mellem de to variabler. r varierer på samme måde som Kendall fra -1 til +1. Fortegnet angiver, om sammenhængen er positiv eller negativ. Tallet angiver, hvor godt variabelmålingerne på x og y samler sig om en ret linje. Se illustrationen nedenfor: Figur 15: Grafisk illustration af forskellige korrelationskoefficienter Illustration af korrelationskoefficienten r (a) _ y Gns.:x r = 0,7 _ Gns.:y x y (b) y (c) r = 0,98 r = 0 x x

19 19 Denne koefficient er let at beregne i Excel regneark. Tag udgangspunkt i den tidligere viste tabel som her: Kilde: Per Vejrup-Hansen, Ønsker du at se, hvordan sammenhængen er mellem salg og påbegyndt antal boliger kvartalet før, kan du grafisk gengive dette i et Excel punktdiagram. Marker de to kolonner med hhv. Påbeg t-1 samt Salg t. Gå ind i fanen Indsæt, gå til Diagrammer og klik på Punktdiagram. Der fremkommer nu nogle valgmuligheder for punktdiagrammer. Klik på det punktdiagram, der kun består af punkter (og ingen streger og kurver). Nu får du følgende diagram frem:

20 20 ib andersen: den skinbarlige virkelighed samfundslitteratur.dk Figur 16: Påbegyndte boliger og salg: Punktdiagram Dette diagram viser samhørende værdier for salg og antal påbegyndte boliger i kvartalet før. Der er tilsyneladende en vis positiv samvariation mellem de to variabler. Du kan lægge en tendenslinje ind i diagrammet ved at højreklikke på en af de blå punkter i diagrammet. Der fremkommer nu nogle forskellige muligheder. Du klikker på Tilføj tendenslinje og du får følgende diagram frem: Figur 17: Påbegyndte boliger og salg: Punktdiagram med tendenslinje Excel placerer automatisk tendenslinjen, så den bedst passer til de forskellige punkter, hvis der er en lineær samvariation.

21 21 Du kan beregne Pearsons korrelationskoefficient sådan her: Gå ind i fanen Data, vælg Dataanalyse, derefter Korrelation og klik på OK. Derefter viser følgende dialogboks sig: Hvor du angiver dine datas inputområde og klikker på OK. Herefter viser Excel følgende beregning: Figur 18: Korrelationsanalyse Hvor tallet ud for kolonne 1 og 2 angiver Pearsons r = 0,745064, hvilket antyder, at der er en god positiv samvariation mellem de to variable, svarende til det, vi så på punktdiagrammet. Du kan læse mere om Pearsons og Kedalls korrelationsmål i kapitel 10 i Den skinbarlige virkelighed. Regression Tendenslinjens hældning kan du beregne ved simpel lineær regressionsanalyse, som også er temmelig nemt at foretage i Excel. Gå ind i fanen Data, vælg Dataanalyse, derefter Regression og klik OK. Derefter viser følgende dialogboks:

22 22 ib andersen: den skinbarlige virkelighed samfundslitteratur.dk Hvor du indsætter områderne for Y og X, hvor X angiver den såkaldte uafhængige variabel og Y den afhængige variable, hvilket vil sige, at din antagelse er, at antal påbegyndte boliger forårsager et bestemt salg plus minus tilfældige variationer. Klikker du på OK, får du følgende beregning: Figur 19: Regressionsanalyse

23 23 Vi skal kun koncentrere os om tallene ud for række 4 Multipel R, 17 Skæring og X-variabel 1. Multipel R svarer nøjagtig til den korrelationskoefficient r, som vi fandt tidligere. Tendenslinjen er en ret linje, som matematisk kan beskrives med denne formel: Y = a + bx eller Salg t = a + b. Påbeg t-1, hvor a er det stykke linjen afskærer af Y- aksen, og b er hældningskoefficienten. Skæringen = 54,54349 er altså der, hvor linjen skærer Y-aksen og X-variabel 1 = 0, er linjen hældning. Du kan nu udtrykke salgets afhængighed af påbegyndte boliger med denne ligning: Slag t = 54,54 + 0, Påbeg t-1. Det vil sige, at vi kan beregne en cirka-værdi for salget, fx hvis Pabeg t-1 er fx ved at indsætte i ligningen. Dette vil så give et cirka salg på ca Hældningskoefficienten er et udtryk for styrken af sammenhængen mellem de to variabler. Regressionsanalyse forudsætter, at de to variabler er kontinuerte og minimum er målt på intervalskalaniveau. Ligeledes forudsættes det, at den afhængige variabel skal være normalfordelt og har samme spredning på Y for alle X. Logistisk regression I den lineære regressionsanalyse ovenfor opfattes den afhængige variabel Y som et observerbart tal. Hvis den afhængige variabel kun har to udfald fx føler stress og føler ikke stress, kan vi anvende logistisk regression. Der fører for vidt her at forklare i detaljer, hvordan sådan en analyse gennemføres. En logistisk regressionsanalyse kan ikke umiddelbart gennemføres i Excel. Vil du gennemføre en sådan analyse, bør du henvende dig til en ekspert på området. Multivariat analyse Multivariat analyse anvender du, når du ønsker at undersøge samvariationen imellem flere variabler på samme tid. Udgangspunktet for en sådan analyse er ønsket om at sandsynliggøre en eller flere årsagssammenhænge for at kunne opstille en kausalmodel (en model, der angiver årsagssammenhængene mellem et sæt af variabler). Korrelationsanalyse En af de metoder, du kan anvende i den multiple analyse er korrelationsanalyse, som tilfældet var i den bivariate analyse. Nedenstående tabel angiver som ovenfor samvariationen mellem Påbegyndte antal boliger t-1 og Salg t, men nu indeholder tabellen foruden disse to variabler en tredje variabel: Antal kvadratmeter påbegyndt boligareal t-1 illustreret i tabellen ved KM t-1.

24 24 ib andersen: den skinbarlige virkelighed samfundslitteratur.dk Figur 20: Påbegyndte boliger, påbegyndte kvadratmeter og salg (konstrueret) Du vælger nu at afprøve følgende kausalmodel: Påbeg t-1 KM t-1 Salg t Det vil sige, at antal påbegyndte boliger i kvartalet før forårsager et bestemt antal kvadratmeter påbegyndt boligareal i dette kvartal, som igen forårsager et bestemt salg i det efterfølgende kvartal. Du bruger nu igen korrelationsanalysen til at undersøge denne sammenhæng nu med tre variabler. Du markerer de tre variabelkolonner i tabellen og anvender korrelation i Dataanalyse, som tidligere. Du får nu en korrelationsmatrix, der ser således ud: Figur 21: Korrelationsmatrix

25 25 Af denne matrix kan du se, at der er en meget fin positiv lineær samvariation mellem Påbeg t-1 og KM t-1 med en korrelationskoefficient på 0,937. Samvariationen mellem KM t-1 og Salg t er på 0,674. Samvariationen mellem Påbeg t-1 og Salg t er, som du tidligere har fundet frem til, 0,745. Det vil sige, at hvis vi vil forudsige salget på basis af disse de to variable, der her er nævnt, vil den bedste forudsigelse være den, der er baseret på Påbeg t-1. Multipel regressionsanalyse Multipel regressionsanalyse har til formål at undersøge den lineære samvariation mellem to eller flere uafhængige variabler (x 1, x 2, x 3.) og en afhængig variabel y. Det vil sige af typen y = a + b 1 x 1 +b 2 x 2 +. De uafhængige variabler kan både være kvantitative og kvalitative, fx henholdsvis alder og køn. Betragt følgende eksempel, der er en oversigt over samhørende værdier for pris på lejligheder, størrelse og kvalitet: Figur 22: Ejerlejligheder: Pris, kvalitet og størrelse Kilde: Per Vejrup-Hansen, Regnearket ændres til en tabel og ordnes efter kvalitet. Der tilføjes tre kolonner med koder for kvalitet således:

26 26 ib andersen: den skinbarlige virkelighed samfundslitteratur.dk Figur 23: Ejerlejligheder: Pris, kvalitet, størrelse og dummyvariabler Den kvalitative variabel Kvalitet kan ikke anvendes direkte, men der skal dannes tre såkaldte dummyvariabler. Dette gøres ved at udvide med tre kolonner for hhv. LAV, MIDDEL og HØJ kvalitet, sådan at de tre kvalitetskategorier kodes med et 1 -tal, hvor kategorien forekommer i kolonnen, og med O, hvor den ikke forekommer. I regressionsanalysen skal kun indgå to dummyvariabler, når der er tre kategorier. Den sidste kolonne opfatter Excel som referencekolonne, hvilket du kan se senere. Det vil sige, at dummyvariablerne LAV og MIDDEL indgår som uafhængige (forklarende) variabler sammen med den kvantitative variabel Størrelse. De tre forklarende variabler er markeret med X1, X2 og X3 over kolonnerne. De skal udgøre en sammenhængende blok (være nabokolonner). Celleområdet C3-E18 bliver således X-område i regressionen, idet overskrifter (etiketter medtages). Dialogboksen ser sådan ud (Vejrup-Hansen, 2012: 106f.).

27 27 De væsentligste oplysninger i den omfattende regressionsmatrix, som Excel producerer, er følgende: Figur 24: Regressionskoefficienter Resultatet kan skrives på følgende måde: Pris = ,05. Størrelse 276. LAV 64. MIDDEL

28 28 ib andersen: den skinbarlige virkelighed samfundslitteratur.dk Denne regressionsodel angiver, at for en given m2-størrelse har en lejlighed af lav kvalitet en pris, der ligger kroner under en lejlighed med høj kvalitet. En lejlighed med middelkvalitet ligger kroner under en lejlighed med høj kvalitet. Konstantleddet på 912 ( ) gælder for referencekategorien høj kvalitet, idet de to sidste led jo er lig med nul, når kvalitet er lig med høj. Konstantleddet angiver et niveau i det relevante område for størrelser af lejligheder. For lejligheder af lav kvalitet er konstanten lig med 912 minus 276, dvs. at koefficienten til en dummyvariabel angiver en niveauforskel. Koefficienten til Størrelse er 3,05 dvs. at prisen øges med godt kroner pr. ekstra kvadratmeter. Det er et gennemsnit for alle lejlighedstyper under ét. Forskellen mellem lav, middel og høj kvalitet kommer kun til udtryk i en niveauforskel i den anvendte model. Regressionens output Linjetilpasningsplot (for variablen Størrelse) giver en udmærket illustration, jf. figuren nedenfor. De forventede værdier ifølge regressionsmodellen danner tre forskellige niveauer svarende til de tre kvalitetsvurderinger. I figuren er det fremhævet ved, at der manuelt er indtegnet tre rette linjer for høj, middel og lav. Linjerne er parallelle og har samme hældningskoefficient, dvs. koefficienten til Størrelse (Vejrup-Hansen 2012: 108). Figur 25: Ejerlejligheder: Pris, kvalitet og størrelse: Tilpasningsplot

29 29 Litteratur til fortsat læsning Ønsker du at vide mere om statistik og anvendelsen af Excel til statistiske beregninger, kan du med fordel læse Vejrup-Hansen, Per (2012). Statistik med Excel. 2. udgave. Frederiksberg: Samfundslitteratur.

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Microsoft Excel har en del standard anvendelsesmuligheder i forhold til den beskrivende statistik og statistisk

Læs mere

Excel tutorial om lineær regression

Excel tutorial om lineær regression Excel tutorial om lineær regression I denne tutorial skal du lære at foretage lineær regression i Microsoft Excel 2007. Det forudsættes, at læseren har været igennem det indledende om lineære funktioner.

Læs mere

Per Vejrup-Hansen Praktisk statistik. Omslag: Torben Klahr.dk Lundsted Grafisk tilrettelæggelse: Samfundslitteratur Grafik Tryk: Narayana Press

Per Vejrup-Hansen Praktisk statistik. Omslag: Torben Klahr.dk Lundsted Grafisk tilrettelæggelse: Samfundslitteratur Grafik Tryk: Narayana Press Per Vejrup-Hansen Praktisk statistik 6. 5. udgave 2008 2013 Omslag: Torben Klahr.dk Lundsted Grafisk tilrettelæggelse: Samfundslitteratur Grafik Tryk: Narayana Press ISBN Trykt 978-87-593-1381-7 bog ISBN

Læs mere

Dig og din puls. 17-10-2004 Dig og din puls Side 1 af 17

Dig og din puls. 17-10-2004 Dig og din puls Side 1 af 17 Dig og din puls Jette Rygaard Poulsen, Frederikshavn Gymnasium og HF-kursus Hans Vestergaard, Frederikshavn Gymnasium og HF-kursus Søren Lundbye-Christensen, AAU 17-10-2004 Dig og din puls Side 1 af 17

Læs mere

Statistik i GeoGebra

Statistik i GeoGebra Statistik i GeoGebra Peter Harremoës 13. maj 2015 Jeg vil her beskrive hvordan man kan lave forskellige statistiske analyser ved hjælp af GeoGebra 4.2.60.0. De statistiske analyser svarer til pensum Matematik

Læs mere

Gennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP()

Gennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP() Gennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP() John Andersen, Læreruddannelsen i Aarhus, VIA Et kast med 10 terninger gav følgende udfald Fig. 1 Result of rolling 10 dices

Læs mere

Excel tutorial om indekstal og samfundsfag 2008

Excel tutorial om indekstal og samfundsfag 2008 Excel tutorial om indekstal og samfundsfag 2008 I denne note skal vi behandle data fra CD-rommen Samfundsstatistik 2008, som indeholder en mængde data, som er relevant i samfundsfag. Vi skal specielt analysere

Læs mere

For at få tegnet en graf trykkes på knappen for graftegning. Knap for graftegning

For at få tegnet en graf trykkes på knappen for graftegning. Knap for graftegning Graftegning på regneark. Ved hjælp af Excel regneark kan man nemt tegne grafer. Man åbner for regnearket ligger under Microsoft Office. Så indtaster man tallene fra tabellen i regnearkets celler i en vandret

Læs mere

Disposition for kursus i Excel2007

Disposition for kursus i Excel2007 Disposition for kursus i Excel2007 Analyse af data (1) Demo Øvelser Målsøgning o evt. opgave 11 Scenariestyring o evt. opgave 12 Datatabel o evt. opgave 13 Evt. Graf og tendens o evt. opgave 10 Subtotaler

Læs mere

1. Opbygning af et regneark

1. Opbygning af et regneark 1. Opbygning af et regneark Et regneark er et skema. Vandrette rækker og lodrette kolonner danner celler, hvori man kan indtaste tal, tekst, datoer og formler. De indtastede tal og data kan bearbejdes

Læs mere

Beregn operationsalder

Beregn operationsalder Beregn operationsalder I denne vejledning kigges på hvordan man beregner den alder patienten har ved operation. Data til dette findes i dataudtræk fra Skema 1A eller dataudtræk med data fra alle skemaer.

Læs mere

Regneark Excel fortsat

Regneark Excel fortsat Regneark Excel fortsat Indhold SÅDAN TEGNES GRAFER I REGNEARK EXCEL... 1 i Excel 97-2003... 1 I Excel 2007... 1 ØVELSE... 2 I Excel 97-2003:... 2 I Excel 2007... 3 OM E-OPGAVER 12A... 4 Sådan tegnes grafer

Læs mere

KURSUS I ANALYSEPORTALEN (AP) DANSK PALLIATIV DATABASE 3 1. ÅBNING AF ANALYSEPORTALEN 3 2. OPRETTELSE AF EN RAPPORT DVS. START AF DATAANALYSE 4

KURSUS I ANALYSEPORTALEN (AP) DANSK PALLIATIV DATABASE 3 1. ÅBNING AF ANALYSEPORTALEN 3 2. OPRETTELSE AF EN RAPPORT DVS. START AF DATAANALYSE 4 KURSUS I ANALYSEPORTALEN (AP) DANSK PALLIATIV DATABASE 3 1. ÅBNING AF ANALYSEPORTALEN 3 2. OPRETTELSE AF EN RAPPORT DVS. START AF DATAANALYSE 4 3. VALG AF DATA 5 4. BEHANDLING OG VISNING AF DATA 7 1 Liste

Læs mere

Om at finde bedste rette linie med Excel

Om at finde bedste rette linie med Excel Om at finde bedste rette linie med Excel Det er en vigtig og interessant opgave at beskrive fænomener i naturen eller i samfundet matematisk. Dels for at få en forståelse af sammenhængende indenfor det

Læs mere

Huskesedler. Anvendelse af regneark til statistik

Huskesedler. Anvendelse af regneark til statistik Huskesedler Anvendelse af regneark til statistik August 2013 2 Indholdsfortegnelse Aktivere Analysis Toolpak... 4 Dataudtræk fra Danmarks Statistik... 4 Kopiering af formler... 4 Målsøgning... 5 Normalfordeling...

Læs mere

INTRODUKTION TIL DIAGRAMFUNKTIONER I EXCEL

INTRODUKTION TIL DIAGRAMFUNKTIONER I EXCEL INTRODUKTION TIL DIAGRAMFUNKTIONER I EXCEL I denne og yderligere at par artikler vil jeg se nærmere på diagramfunktionerne i Excel, men der er desværre ikke plads at gennemgå disse i alle detaljer, dertil

Læs mere

2 Populationer. 2.1 Virkelige populationer

2 Populationer. 2.1 Virkelige populationer 2 Populationer I en statistisk sammenhæng er en population en samling af elementer, fx personer, virksomheder, lande, kunder eller mere abstrakte objekter. Fra en population kan man udtage en stikprøve.

Læs mere

d Kopier formlen fra celle A3 ned i kolonne A. Kopier formlen fra celle C3 ned i kolonne C. Undersøg, hvad der sker med formlen, når den kopieres.

d Kopier formlen fra celle A3 ned i kolonne A. Kopier formlen fra celle C3 ned i kolonne C. Undersøg, hvad der sker med formlen, når den kopieres. KOPIARK 17 # ligninger og formler i excel 2007, 1 1 Du skal lave et regneark, som kan bruges til at løse ligningen 5 x 11 = 7 + 3 x. a Lav et regneark som vist. HUSK: Gør en kolonne bredere Man kan gøre

Læs mere

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Anvendt Statistik Lektion 7. Simpel Lineær Regression Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot

Læs mere

Projekt 8.3 Hvordan undersøges om et talmateriale normalfordelt?

Projekt 8.3 Hvordan undersøges om et talmateriale normalfordelt? Projekt 8.3 Hvordan undersøges om et talmateriale normalfordelt? Projektet drejer sig om at udvikle en metode, til at undersøge om et givet talmateriale med rimelighed kan siges at være normalfordelt.

Læs mere

Spørgeskemaundersøgelser og databehandling

Spørgeskemaundersøgelser og databehandling DASG. Nye veje i statistik og sandsynlighedsregning. side 1 af 12 Spørgeskemaundersøgelser og databehandling Disse noter er udarbejdet i forbindelse med et tværfagligt samarbejde mellem matematik og samfundsfag

Læs mere

Diagrammer visualiser dine tal

Diagrammer visualiser dine tal Diagrammer visualiser dine tal Indledning På de efterfølgende sider vil du blive præsenteret for nye måder at arbejde med Diagrammer på i Excel. Vejledningen herunder er vist i Excel 2007 versionen, og

Læs mere

Per Vejrup-Hansen STATISTIK. med Excel. 2. udgave

Per Vejrup-Hansen STATISTIK. med Excel. 2. udgave Per Vejrup-Hansen STATISTIK med Excel 2. udgave Per Vejrup-Hansen Statistik med Excel Per Vejrup-Hansen Statistik med Excel 2. trykte udgave 2012 1. e-bogsudgave 2012 Samfundslitteratur 2012 e-isbn: 978-87-593-1736-5

Læs mere

Lynvejledninger. Anvendelse af pivot-tabeller Microsoft Excel 2013

Lynvejledninger. Anvendelse af pivot-tabeller Microsoft Excel 2013 Lynvejledninger Anvendelse af pivot-tabeller Microsoft Excel 2013 Juni 2017 2 Indholdsfortegnelse Brugerdefinerede beregninger... 5 Eksterne data... 6 Filtrer data... 7 Filtrer data (fortsat)... 8 Filtrer

Læs mere

Behandling af kvantitative data 19.11.2012

Behandling af kvantitative data 19.11.2012 Behandling af kvantitative data 19.11.2012 I dag skal vi snakke om Kvantitativ metode i kort form Hvordan man kan kode og indtaste data Data på forskellig måleniveau Hvilke muligheder, der er for at analysere

Læs mere

SPAM-mails. ERFA & Søren Noah s A4-Ark 2010. Køber varer via spam-mails. Læser spam-mails. Modtager over 40 spam-mails pr. dag. Modtager spam hver dag

SPAM-mails. ERFA & Søren Noah s A4-Ark 2010. Køber varer via spam-mails. Læser spam-mails. Modtager over 40 spam-mails pr. dag. Modtager spam hver dag SPAM-mails Køber varer via spam-mails Læser spam-mails Modtager over 40 spam-mails pr. dag Modtager spam hver dag 0 10 20 30 40 50 60 70 80 90 ERFA & Søren Noah s A4-Ark 2010 Datapræsentation: lav flotte

Læs mere

Program dag 2 (11. april 2011)

Program dag 2 (11. april 2011) Program dag 2 (11. april 2011) Dag 2: 1) Hvordan kan man bearbejde data; 2) Undersøgelse af datamaterialet; 3) Forskellige typer statistik; 4) Indledende dataundersøgelser; 5) Hvad kan man sige om sammenhænge;

Læs mere

Kvantitative Metoder 1 - Forår 2007. Dagens program

Kvantitative Metoder 1 - Forår 2007. Dagens program Dagens program Kapitel 7 Introduktion til statistik Organisering af data Diskrete variabler Kontinuerte variabler Beskrivende statistik Fraktiler Gennemsnit Empirisk varians og spredning Empirisk korrelationkoe

Læs mere

Stolpediagrammer for kategoriske data med -catplot-

Stolpediagrammer for kategoriske data med -catplot- Stolpediagrammer for kategoriske data med -catplot- [Revideret 4. oktober 2013] Kim Mannemar Sønderskov Institut for Statskundskab, Aarhus Universitet ks@ps.au.dk Denne note gennemgår, hvordan resultaterne

Læs mere

Statistik II 1. Lektion. Analyse af kontingenstabeller

Statistik II 1. Lektion. Analyse af kontingenstabeller Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression

Læs mere

Lineære sammenhænge, residualplot og regression

Lineære sammenhænge, residualplot og regression Lineære sammenhænge, residualplot og regression Opgave 1: Er der en bagvedliggende lineær sammenhæng? I mange sammenhænge indsamler man data som man ønsker at undersøge og afdække eventuelle sammenhænge

Læs mere

Computerundervisning

Computerundervisning Frederiksberg Seminarium Computerundervisning Koordinatsystemer og funktioner Elevmateriale 30-01-2009 Udarbejdet af: Pernille Suhr Poulsen Christina Klitlyng Julie Nielsen Opgaver GeoGebra Om at genkende

Læs mere

Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater.

Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater. Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater. 1 Sammenfatning Der er en statistisk signifikant positiv sammenhæng mellem opnåelse af et godt testresultat og elevernes oplevede

Læs mere

Kvadratisk regression

Kvadratisk regression Kvadratisk regression Helle Sørensen Institut for Matematiske Fag Københavns Universitet Juli 2011 I kapitlet om lineær regression blev det vist hvordan man kan modellere en lineær sammenhæng mellem to

Læs mere

Mini AT-forløb om kommunalvalg: Mandatfordeling og Retfærdighed 1.x og 1.y 2009 ved Ringsted Gymnasium MANDATFORDELING

Mini AT-forløb om kommunalvalg: Mandatfordeling og Retfærdighed 1.x og 1.y 2009 ved Ringsted Gymnasium MANDATFORDELING MANDATFORDELING Dette materiale er lavet som supplement til Erik Vestergaards hjemmeside om samme emne. 1 http://www.matematiksider.dk/mandatfordelinger.html I dette materiale er en række øvelser der knytter

Læs mere

Indhold Forelæsning Dat-D1: Regneark Matematik og databehandling 2012

Indhold Forelæsning Dat-D1: Regneark Matematik og databehandling 2012 Indhold Forelæsning Dat-D1: Regneark Matematik og databehandling 2012 Henrik L. Pedersen Institut for Matematiske Fag henrikp@life.ku.dk 1 Forberedelsesopgaverne Dat-D-1 og Dat-D-2 2 Regnearks grundprincipper

Læs mere

Schweynoch, 2003. Se eventuelt http://www.mathematik.uni-kassel.de/~fathom/projekt.htm.

Schweynoch, 2003. Se eventuelt http://www.mathematik.uni-kassel.de/~fathom/projekt.htm. Projekt 8.5 Hypotesetest med anvendelse af t-test (Dette materiale har været anvendt som forberedelsesmateriale til den skriftlige prøve 01 for netforsøget) Indhold Indledning... 1 χ -test... Numeriske

Læs mere

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet Matematik A Studentereksamen Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet stx11-matn/a-080501 Tirsdag den 8. maj 01 Forberedelsesmateriale til stx A Net MATEMATIK Der

Læs mere

LINEÆR PROGRAMMERING I EXCEL

LINEÆR PROGRAMMERING I EXCEL LINEÆR PROGRAMMERING I EXCEL K A P P E N D I X I lærebogens kapitel 29 afsnit 3 er det med 2 eksempler blevet vist, hvordan kapacitetsstyringen kan optimeres, når der er 2 produktionsmuligheder og flere

Læs mere

Fokus på Forsyning. Datagrundlag og metode

Fokus på Forsyning. Datagrundlag og metode Fokus på Forsyning I notatet gennemgås datagrundlaget for brancheanalysen af forsyningssektoren sammen med variable, regressionsmodellen og tilhørende tests. Slutteligt sammenfattes analysens resultater

Læs mere

Hvad siger statistikken?

Hvad siger statistikken? Eleverne har tidligere (fx i Kolorit 7, matematik grundbog) arbejdet med især beskrivende statistik (deskriptiv statistik). I dette kapitel fokuseres i højere grad på, hvordan datamateriale kan tolkes

Læs mere

Søren Christiansen 22.12.09

Søren Christiansen 22.12.09 1 2 Dette kompendie omhandler simpel brug af Excel til brug for simpel beregning, såsom mængde og pris beregning sammentælling mellem flere ark. Excel tilhører gruppen af programmer som samlet kaldes Microsoft

Læs mere

Åbn Paint, som er et lille tegne- og billedbehandlingsprogram der findes under Programmer i mappen Tilbehør. Åbn også Word.

Åbn Paint, som er et lille tegne- og billedbehandlingsprogram der findes under Programmer i mappen Tilbehør. Åbn også Word. 75 Paint & Print Screen (Skærmbillede med beskæring) Åbn Paint, som er et lille tegne- og billedbehandlingsprogram der findes under Programmer i mappen Tilbehør. Åbn også Word. 1. Minimer straks begge

Læs mere

Matematik A og Informationsteknologi B

Matematik A og Informationsteknologi B Matematik A og Informationsteknologi B Projektopgave 2 Eksponentielle modeller Benjamin Andreas Olander Christiansen Jens Werner Nielsen Klasse 2.4 6. december 2010 Vejledere: Jørn Christian Bendtsen og

Læs mere

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet Eksamen ved Københavns Universitet i Kvantitative forskningsmetoder Det Samfundsvidenskabelige Fakultet 14. december 2011 Eksamensnummer: 5 14. december 2011 Side 1 af 6 1) Af boxplottet kan man aflæse,

Læs mere

Maple. Skærmbilledet. Vi starter med at se lidt nærmere på opstartsbilledet i Maple. Værktøjslinje til indtastningsområdet. Menulinje.

Maple. Skærmbilledet. Vi starter med at se lidt nærmere på opstartsbilledet i Maple. Værktøjslinje til indtastningsområdet. Menulinje. Maple Dette kapitel giver en kort introduktion til hvordan Maple 12 kan benyttes til at løse mange af de opgaver, som man bliver mødt med i matematiktimerne på HHX. Skærmbilledet Vi starter med at se lidt

Læs mere

Temaopgave i statistik for

Temaopgave i statistik for Temaopgave i statistik for matematik B og A Indhold Opgave 1. Kast med 12 terninger 20 gange i praksis... 3 Opgave 2. Kast med 12 terninger teoretisk... 4 Opgave 3. Kast med 12 terninger 20 gange simulering...

Læs mere

Undersøgelse om IT i folkeskolen 2011

Undersøgelse om IT i folkeskolen 2011 Undersøgelse om IT i folkeskolen 2011 Udarbejdet af Scharling Research for redaktionen af Folkeskolen, november 2011 Scharling.dk Formål Denne rapport har til hensigt at afdække respondenternes kendskab

Læs mere

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

χ 2 -test i GeoGebra Jens Sveistrup, Gammel Hellerup Gymnasium

χ 2 -test i GeoGebra Jens Sveistrup, Gammel Hellerup Gymnasium χ 2 -test i GeoGebra Jens Sveistrup, Gammel Hellerup Gymnasium Man kan nemt lave χ 2 -test i GeoGebra både goodness-of-fit-test og uafhængighedstest. Den følgende vejledning bygger på GeoGebra version

Læs mere

Graph brugermanual til matematik C

Graph brugermanual til matematik C Graph brugermanual til matematik C Forord Efterfølgende er en guide til programmet GRAPH. Programmet kan downloades gratis fra nettet og gemmes på computeren/et usb-stik. Det betyder, det også kan anvendes

Læs mere

Hvad er meningen? Et forløb om opinionsundersøgelser

Hvad er meningen? Et forløb om opinionsundersøgelser Hvad er meningen? Et forløb om opinionsundersøgelser Jette Rygaard Poulsen, Frederikshavn Gymnasium og HF-kursus Hans Vestergaard, Frederikshavn Gymnasium og HF-kursus Søren Lundbye-Christensen, AAU 17-10-2004

Læs mere

Easy Guide i GallupPC

Easy Guide i GallupPC Easy Guide i GallupPC Version. 6.00.00 Gallup A/S Masnedøgade 22-26 DK 2100 København Ø Telefon 39 27 27 27 Fax 39 27 50 80 Indhold SÅDAN KOMMER DU I GANG MED AT ANVENDE GALLUPPC... 2 TILFØJELSE AF UNDERSØGELSER

Læs mere

Et eksempel på en todimensional normalfordeling Anders Milhøj September 2006

Et eksempel på en todimensional normalfordeling Anders Milhøj September 2006 Et eksempel på en todimensional normalfordeling Anders Milhøj September 006 I dette notat gennemgås et eksempel, der illustrerer den todimensionale normalfordelings egenskaber. Notatet lægger sig op af

Læs mere

Filtyper, filformat og skabelon. Tabel. Tekstombrydning. Demo Fremstil, gem og brug en skabelon. Øvelser Fremstil, gem og brug en skabelon

Filtyper, filformat og skabelon. Tabel. Tekstombrydning. Demo Fremstil, gem og brug en skabelon. Øvelser Fremstil, gem og brug en skabelon Disposition for kursus i Word 2007 Filtyper, filformat og skabelon Demo Fremstil, gem og brug en skabelon Øvelser Fremstil, gem og brug en skabelon Tabel Demo Opret en tabel ud fra en tekst Øvelser Opret

Læs mere

Per Vejrup-Hansen Praktisk statistik. Omslag: Torben Klahr.dk Lundsted Grafisk tilrettelæggelse: Samfundslitteratur Grafik Tryk: Narayana Press

Per Vejrup-Hansen Praktisk statistik. Omslag: Torben Klahr.dk Lundsted Grafisk tilrettelæggelse: Samfundslitteratur Grafik Tryk: Narayana Press Per Vejrup-Hansen Praktisk statistik 6. 5. udgave 2008 2013 Omslag: Torben Klahr.dk Lundsted Grafisk tilrettelæggelse: Samfundslitteratur Grafik Tryk: Narayana Press ISBN Trykt 978-87-593-1381-7 bog ISBN

Læs mere

Tak for kaffe! 17-10-2004 Tak for kaffe! Side 1 af 16

Tak for kaffe! 17-10-2004 Tak for kaffe! Side 1 af 16 Tak for kaffe! Jette Rygaard Poulsen, Frederikshavn Gymnasium og HF-kursus Hans Vestergaard, Frederikshavn Gymnasium og HF-kursus Søren Lundbye-Christensen, AAU 17-10-2004 Tak for kaffe! Side 1 af 16 Tak

Læs mere

Indhold Grupperede observationer... 1 Ugrupperede observationer... 3 Analyse af normalfordelt observationssæt... 4

Indhold Grupperede observationer... 1 Ugrupperede observationer... 3 Analyse af normalfordelt observationssæt... 4 BH Test for normalfordeling i WordMat Indhold Grupperede observationer... 1 Ugrupperede observationer... 3 Analyse af normalfordelt observationssæt... 4 Grupperede observationer Vi tager udgangspunkt i

Læs mere

Excel 2007 (5): Formler, diagrammer og tips

Excel 2007 (5): Formler, diagrammer og tips Excel 2007 (5): Formler, diagrammer og tips HUSK AT: Man kan godt skrive flere linjer under hinanden i den samme celle. Marker den pågældende celle (evt. flere celler) og vælg "Ombryd tekst" på fanebladet

Læs mere

Introduktion til SPSS

Introduktion til SPSS Introduktion til SPSS Øvelserne på dette statistikkursus skal gennemføres ved hjælp af det såkaldte SPSS program. Det er erfaringsmæssigt sådan, at man i forbindelse af øvelserne på statistikkurser bruger

Læs mere

Kapitel 10 Simpel korrelation

Kapitel 10 Simpel korrelation Kapitel 10 Simpel korrelation Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 Indledning 2 Pearsons r 3 Spearmans ρ 1 Indledning 2 Pearsons r 3 Spearmans ρ Indledning Korrelation

Læs mere

Excel-5: Formler, diagrammer og tips

Excel-5: Formler, diagrammer og tips Excel-5: Formler, diagrammer og tips HUSK AT: Man kan godt skrive flere linjer under hinanden i den samme celle. Marker den pågældende celle (evt. flere celler) og vælg i menulinjen: Formater Celler Fanebladet

Læs mere

Tilpas: Hurtig adgang

Tilpas: Hurtig adgang Tilpas: Hurtig adgang Genveje, Se skærmtips Se tips Hold alt tasten nede. Og brug bogstaver Word Fanen Filer PDF dokument Brug skabelon Visninger Husk Luk ved fuldskærmsvisning Brug zoom skyder Marker,

Læs mere

Indledning. På de følgende sider vises, primært i tegneserieform, lidt om mulighederne i PC-AXIS for Windows.

Indledning. På de følgende sider vises, primært i tegneserieform, lidt om mulighederne i PC-AXIS for Windows. Indledning PC-AXIS for Windows er et talbehandlingsprogram, der kan håndtere store mængder statistisk materiale. PC-AXIS giver mulighed for at arbejde videre med det statistiske materiale i egne programmer

Læs mere

Kvantitative metoder 2

Kvantitative metoder 2 Kvalitative egenskaber og dummyvariabler Kvantitative metoder 2 Dummyvariabler 28. marts 2007 Vi har (hovedsagligt) set på kvantitative variabler (løn, priser, forbrug, indkomst, )... Men hvad med kvalitative

Læs mere

Fig. 1 Billede af de 60 terninger på mit skrivebord

Fig. 1 Billede af de 60 terninger på mit skrivebord Simulation af χ 2 - fordeling John Andersen Introduktion En dag kastede jeg 60 terninger Fig. 1 Billede af de 60 terninger på mit skrivebord For at danne mig et billede af hyppighederne flyttede jeg rundt

Læs mere

INDHOLDSFORTEGNELSE. INDLEDNING... Indledning. KAPITEL ET... Kom videre med Excel. KAPITEL TO... 27 Referencer og navne

INDHOLDSFORTEGNELSE. INDLEDNING... Indledning. KAPITEL ET... Kom videre med Excel. KAPITEL TO... 27 Referencer og navne INDHOLDSFORTEGNELSE INDLEDNING... Indledning KAPITEL ET... Kom videre med Excel Flyt markering efter Enter... 8 Undgå redigering direkte i cellen... 9 Markering ved hjælp af tastaturet... 10 Gå til en

Læs mere

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test.

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test. Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ -test og Goodness of Fit test. Anvendelser af statistik Statistik er et levende og fascinerende emne, men at læse om det er alt

Læs mere

Simulering af stokastiske fænomener med Excel

Simulering af stokastiske fænomener med Excel Simulering af stokastiske fænomener med Excel John Andersen, Læreruddannelsen i Aarhus, VIA Det kan være en ret krævende læreproces at udvikle fornemmelse for mange begreber fra sandsynlighedsregningen

Læs mere

Skriftlig eksamen i samfundsfag

Skriftlig eksamen i samfundsfag OpenSamf Skriftlig eksamen i samfundsfag Indholdsfortegnelse 1. Introduktion 2. Præcise nedslag 3. Beregninger 3.1. Hvad kan absolutte tal være? 3.2. Procentvis ændring (vækst) 3.2.1 Tolkning af egne beregninger

Læs mere

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Introduktion Kasper K. Berthelsen, Inst f. Matematiske Fag Omfang: 8 Kursusgang I fremtiden

Læs mere

Regnearket Excel - en introduktion

Regnearket Excel - en introduktion Regnearket Excel - en introduktion Flytte rundt i regnearket. Redigere celler Hjælp Celleindhold Kopiering af celler Lokalmenu og celleegenskaber Opgaver 1. Valutakøb 2. Hvor gammel er du 3. Momsberegning

Læs mere

Modellering af elektroniske komponenter

Modellering af elektroniske komponenter Modellering af elektroniske komponenter Formålet er at give studerende indblik i hvordan matematik som fag kan bruges i forbindelse med at modellere fysiske fænomener. Herunder anvendelse af Grafregner(TI-89)

Læs mere

Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1

Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1 Statistik Formålet... 1 Mindsteværdi... 1 Størsteværdi... 1 Ikke grupperede observationer... 2 Median og kvartiler defineres ved ikke grupperede observationer således:... 2 Middeltal defineres ved ikke

Læs mere

Dig og din puls Lærervejleding

Dig og din puls Lærervejleding Dig og din puls Lærervejleding Indledning I det efterfølgende materiale beskrives et forløb til matematik C, hvori eleverne skal måle hvilepuls og arbejdspuls og beskrive observationerne matematisk. Materialet

Læs mere

Multipel Lineær Regression

Multipel Lineær Regression Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer

Læs mere

Projekt 1 Spørgeskemaanalyse af Bedst på Nettet

Projekt 1 Spørgeskemaanalyse af Bedst på Nettet Projekt 1 Spørgeskemaanalyse af Bedst på Nettet D.29/2 2012 Udarbejdet af: Katrine Ahle Warming Nielsen Jannie Jeppesen Schmøde Sara Lorenzen A) Kritik af spørgeskema Set ud fra en kritisk vinkel af spørgeskemaet

Læs mere

Regressionsanalyse i SurveyBanken

Regressionsanalyse i SurveyBanken Først vælges datasættet De Kommunale Nøgletal. Klik på Variable Description og derefter De Kommunale Nøgletal 2010. De enkelte variable i datasættet bliver nu oplistet og kan vælges. Klik herefter på Analysis

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af

Læs mere

Kapitel 1 Statistiske grundbegreber

Kapitel 1 Statistiske grundbegreber Kapitel 1 Statistiske grundbegreber Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 Indledning 2 Population versus stikprøve 3 Variabeltyper og måleskalaer 4 Parametrisk versus ikke-parametrisk

Læs mere

Kausalitet. Introduktion til samfundsvidenskabelig metode. Samfundsvidenskabelig metode. Hvad er metode? Hvad er kausalitet.

Kausalitet. Introduktion til samfundsvidenskabelig metode. Samfundsvidenskabelig metode. Hvad er metode? Hvad er kausalitet. Introduktion til samfundsvidenskabelig metode Samfundsvidenskabelig metode IT-Universitetet September 2007 Mikkel Leihardt Hvad er metode? Metode er regler og retningslinjer for, hvordan vi undersøger

Læs mere

ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression

ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression ! ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression Eksempel 1 AT OPSTILLE EN SIMPEL LINEÆR REGRESSIONSMODEL - GENNEMGÅS AF JAKOB Et stort lager måler løbende sine

Læs mere

Skriv punkternes koordinater i regnearket, og brug værktøjet To variabel regressionsanalyse.

Skriv punkternes koordinater i regnearket, og brug værktøjet To variabel regressionsanalyse. Opdateret 28. maj 2014. MD Ofte brugte kommandoer i Geogebra. Generelle Punktet navngives A Geogebra navngiver punktet Funktionen navngives f Funktionen navngives af Geogebra Punktet på grafen for f med

Læs mere

praktiskegrunde Regression og geometrisk data analyse (2. del) Ulf Brinkkjær

praktiskegrunde Regression og geometrisk data analyse (2. del) Ulf Brinkkjær praktiskegrunde Praktiske Grunde. Nordisk tidsskrift for kultur- og samfundsvidenskab Nr. 3 / 2010. ISSN 1902-2271. www.hexis.dk Regression og geometrisk data analyse (2. del) Ulf Brinkkjær Introduktion

Læs mere

REDIGERING AF REGNEARK

REDIGERING AF REGNEARK REDIGERING AF REGNEARK De to første artikler af dette lille "grundkursus" i Excel, nemlig "How to do it" 8 og 9 har været forholdsvis versionsuafhængige, idet de har handlet om ting, som er helt ens i

Læs mere

Tekst, tal og formler I et regneark kan man indtaste tekst, tal og formler:

Tekst, tal og formler I et regneark kan man indtaste tekst, tal og formler: Tekst, tal og formler I et regneark kan man indtaste tekst, tal og formler: I cellerne A1, A2 og A3 er der indtastet tekst. Tekst bliver venstrestillet. I cellerne B1 og B2 er der indtastet tal. Tal bliver

Læs mere

Microsoft Excel - en kort introduktion. Grundlag

Microsoft Excel - en kort introduktion. Grundlag Microsoft Excel - en kort introduktion Grundlag Udover menuer og knapper - i princippet som du kender det fra Words eller andre tekstbehandlingsprogrammer - er der to grundlæggende vigtige størrelser i

Læs mere

Statistik med TI-Nspire CAS version 3.2. Bjørn Felsager September 2012. [Fjerde udgave]

Statistik med TI-Nspire CAS version 3.2. Bjørn Felsager September 2012. [Fjerde udgave] Statistik med TI-Nspire CAS version 3.2 Bjørn Felsager September 2012 [Fjerde udgave] Indholdsfortegnelse Forord Beskrivende statistik 1 Grundlæggende TI-Nspire CAS-teknikker... 4 1.2 Lister og regneark...

Læs mere

How to do in rows and columns 8

How to do in rows and columns 8 INTRODUKTION TIL REGNEARK Denne artikel handler generelt om, hvad regneark egentlig er, og hvordan det bruges på et principielt plan. Indholdet bør derfor kunne anvendes uden hensyn til, hvilken version

Læs mere

Kapitel 3 Lineære sammenhænge

Kapitel 3 Lineære sammenhænge Matematik C (må anvendes på Ørestad Gymnasium) Lineære sammenhænge Det sker tit, at man har flere variable, der beskriver en situation, og at der en sammenhæng mellem de variable. Enhver formel er faktisk

Læs mere

Pivottabeller, diagrammer og databehandling. Underviser: Nina Kirkegaard Schou Mobil

Pivottabeller, diagrammer og databehandling. Underviser: Nina Kirkegaard Schou Mobil Pivottabeller, diagrammer og databehandling Underviser: Nina Kirkegaard Schou Mobil 21 48 65 16 E-mail: ns@teamcrm.dk Emner: Excel Pivottabeller/diagrammer og databehandling Brugerfladen Import af data

Læs mere

Vejledende besvarelse

Vejledende besvarelse Ib Michelsen Svar: stx B 29. maj 2013 Side 1 1. Udfyld tabellen Vejledende besvarelse Givet funktionen f (x)=4 5 x beregnes f(2) f (2)=4 5 2 =4 25=100 Den udfyldte tabel er derfor: x 0 1 2 f(x) 4 20 100

Læs mere

Normalfordelingen og Stikprøvefordelinger

Normalfordelingen og Stikprøvefordelinger Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger

Læs mere

UNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER

UNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER UNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER Undervisningseffekten udregnes som forskellen mellem den forventede og den faktiske karakter i 9. klasses afgangsprøve. Undervisningseffekten udregnes

Læs mere

Kapitel 4 Sandsynlighed og statistiske modeller

Kapitel 4 Sandsynlighed og statistiske modeller Kapitel 4 Sandsynlighed og statistiske modeller Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 Indledning 2 Sandsynlighed i binomialfordelingen 3 Normalfordelingen 4 Modelkontrol

Læs mere

Beregn gennemsnitlig BMI

Beregn gennemsnitlig BMI Beregn gennemsnitlig BMI I denne vejledning kigges på hvordan man beregner den gennemsnitlige BMI ved operation. Data til dette findes i dataudtræk fra Skema 1A eller dataudtræk med data fra alle skemaer.

Læs mere

Start-mat. for stx og hf Karsten Juul

Start-mat. for stx og hf Karsten Juul Start-mat for stx og hf 0,6 5, 9 2017 Karsten Juul Start-mat for stx og hf 2017 Karsten Juul 1/8-2017 (7/8-2017) Nyeste version af dette hæfte kan downloades fra http://mat1.dk/noter.htm. Hæftet må benyttes

Læs mere

Installa on af Analysis Toolpak og KeHaTools

Installa on af Analysis Toolpak og KeHaTools Installa on af Analysis Toolpak og KeHaTools Installa on af Analysis Toolpak Denne er nødvendig for at kunne lave optællinger, variansanalyse (kap. 12) og regressionsanalyser (kap. 15 pg 16). Analysis

Læs mere

Løsning til eksamen d.27 Maj 2010

Løsning til eksamen d.27 Maj 2010 DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1

Læs mere

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke

Læs mere