C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b2.

Relaterede dokumenter
Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Mikro-kursus i statistik 1. del Mikrokursus i biostatistik 1

Konfidensintervaller og Hypotesetest

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Vejledende løsninger kapitel 8 opgaver

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens

University of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse

1 Hb SS Hb Sβ Hb SC = , (s = )

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Stikprøver og acceptgrænser

Note til styrkefunktionen

Kapitel 7 Forskelle mellem centraltendenser

Produkt og marked - matematiske og statistiske metoder

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

1 Sammenligning af 2 grupper Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver... 2

Hvad skal vi lave? Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver

Løsning eksamen d. 15. december 2008

(studienummer) (underskrift) (bord nr)

Opgave 11.4 side 316 (7ed: 11.4, side 352 og 6ed: 11.2, side 345)

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test.

Meningsmålinger - hvad kan vi sige med sikkerhed?

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

Note om Monte Carlo metoden

Normalfordelingen og Stikprøvefordelinger

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

c) For, er, hvorefter. Forklar.

Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag)

Personlig stemmeafgivning

Statistik II 4. Lektion. Logistisk regression

Løsning til eksaminen d. 14. december 2009

Eksamen i Statistik for biokemikere. Blok

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Kapitel 4 Sandsynlighed og statistiske modeller

Opgave 6. Opgave 7. Peter Harremoës Matematik A med hjælpemidler 26 maj a) Se Bilag 2! b) Variablen n isoleres. L = 2 z 1 α. L = 2 z 1 α L = n =

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Projekt 1 Spørgeskemaanalyse af Bedst på Nettet

Opgaver til kapitel 3

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

Peter Harremoës Matematik A eksamen med hjælpemidler 25. maj 2016

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Et statistisk test er en konfrontation af virkelighenden (data) med en teori (model).

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Peter Harremoës Matematik A eksamen med hjælpemidler 25. maj For at finde ekstrema skal ligningen f (x) = 0 løses. f er differentieret.

Forelæsning 9: Inferens for andele (kapitel 10)

Mikro-kursus i statistik 2. del Mikrokursus i biostatistik 1

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Kundernes tilfredshed med skadesforsikringsselskaberne i Danmark

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Kapitel 12 Variansanalyse

Vejledende besvarelser til opgaver i kapitel 14

Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher

Modelkontrol i Faktor Modeller

HANDICAPREVISIONEN (HR) FORKLARET

Besvarelser til øvelsesopgaver i uge 6

Kapitel 12 Variansanalyse

Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller

Dansk Erhvervs gymnasieanalyse Sådan gør vi

Project in Statistics MB

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet

Peter Harremoës Mat A eksamen med hjælpemidler 15. december f (x) = 0. 2x + k 1 x = 0 2x 2 + k = 0 2x 2 = k x 2 = k 2. k 2.

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)

Handicaprevisionen (HR) forklaret

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Peter Harremoës Matematik A med hjælpemidler 17. august Stamfunktionen til t 1 /2. Grænserne er indsat i stamfunktionen. a 2 +9.

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Økonometri 1. Inferens i den lineære regressionsmodel 25. september Økonometri 1: F6 1

Matematik A, maj Peter Bregendal. Løsninger vha. Nspire CAS. Delprøven uden hjælpemidler. Opgave 1. Givet funktionen f (x) = -x 3 + 4x 2-3x+10

Sundhedsstyrelsens notat om karakterberegning

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Metode til beregning af karakterer for service og kvalitet på sygehuse. Notat af 26. september 2006

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Analyse af måledata II

Sandsynlighedsregning

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Kapitel 4 Sandsynlighed og statistiske modeller

Transkript:

C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b. 5.000 4.800 4.600 4.400 4.00 4.000 3.800 3.600 3.400 3.00 3.000 1.19% 14.9% 7.38% 40.48% 53.57% 66.67% 79.76% 9.86% 010 011 Greve 010 Greve 011 Gennemsnit 010 Gennemsnit 011 I 010 var Greve kommunes score 4,3 af 6, hvor gennemsnittet var 4,, altså 0,8 point bedre end gennemsnittet. I 011 var Greve kommunes score 4,3, hvor gennemsnittet var 4,11, altså 0,1 points bedre end gennemsnittet. Fra 010 til 011 er Greve kommunes score faldet med 0,07, hvor gennemsnittet for kommunerne er faldet med 0,11. Greve kommune havde bedre score i 010, har kommunen stadig klaret sig bedre i 011, set i forhold til gennemsnittet. z = x μ σ z = 4,3 4,11 0,3 = 0,51 Greve kommune ligger mindre end en standard afvigelse fra gennemsnittet, mere præcist ligger kommunen 0,51σ fra gennemsnittet. 7

D) Beregning af 95% konfidensinterval og fortolkning af resultatet Ved at beregne konfidensintervallet for vores brugerspørgsmål, er det muligt at få indtryk af hvor stor sandsynligheden er, for at et givent antal stikprøver befinder inden for et bestemt interval. Vi beregnede 95% konfidensinterval på følgende måde: Værdier Interval = 95 % Standardafvigelse = 1.65 Gennemsnit: 4.3 Population = 139 Tallet for cirka to standardafvigelser = 1,96 Beregning gns. ± 1,96 x (s / n ) = 4,3 ± 1,96 x (1,65 / 139 ) = 4,3 ± 1,96 x (1,65 / 11,79 ) = 4,3 ± 1,96 x (0,14) = 4,3 ± 0,744 Konfidensintervallet er således 3,96 4,50 Figur 3 Det lyse område under kurven illustrerer konfidensintervallet. 8

Tolkning af konfidensinterval Konfidensintervallet giver et teoretisk fingerpeg om, hvor pålidelige resultaterne af 139 stikprøver kan siges at være. 95% af stikprøverne i Greve kommunes undersøgelse ligger i intervallet 3,96 4,50, hvilket vil sige, at der er et vist udsving. Umiddelbart virker intervallet ikke så stort, at undersøgelsen ikke er brugbar, men det betyder ikke, at den ikke kunne forbedres. For at gøre usikkerheden mindre kunne man lave en større stikprøve. Dette ville medføre et mindre konfidensinterval, hvilket vil sige, at 95 % af stikprøverne ville ligge indenfor et mindre interval. På den måde ville den teoretiske sandsynlighed for at ens stikprøver afspejler den population man vil undersøge, stige. E) Signifikanstest 1) Ligger Greve Kommune i top 10%? I dette afsnit vil vi ved hjælp af signifikanstest på datasættet fra 011 undersøge, hvorvidt vores brugervenlighedsspørgsmål Teksterne på hjemmesiden er skrevet i et klart og letforståeligt sprog kan antages at have et gennemsnit på 4,6 i populationen (brugere af Greve kommunes website). Et gennemsnit på 4,6 ville placere Greve i top 10% blandt de deltagende kommuner. Eftersom vi antager, at stikprøven er udtaget simpelt tilfældigt og stikprøvens størrelse er 139, (hvilket overstiger 30, som er minimum) kan normalfordelingen bruges som sampling distribution. Vores hypoteser bliver som følger: Nulhypotese, H0: μ0 = 4,6 Alternativ hypotese, H1: μ < 4,6 Vi vil med andre ord gerne undersøge, om det er sandsynligt, at der i populationen er et gennemsnit på 4,6 eller højere på trods af, at der i stikprøven er et lavere gennemsnit. Dette gør vi ved i første omgang at udregne z- scoren og derefter udregne sandsynligheden for denne z- score i en normalfordeling. Z- scoren udregnes efter følgende formel, hvor x er gennemsnittet for stikprøven, µ0 er det hypotetiske gennemsnit for populationen, s er standardafvigelsen og n er stikprøvestørrelsen: 9

x = 4,3 µ0 = 4,6 s = 1,65 n = 139 z = (4,3-4,6) / (1,65/ 139) = -,66 Herefter undersøger vi sandsynligheden for at en z- værdi af maksimalt denne størrelse forekommer i en normalfordeling. P (-,66 > z) = 0,003907 Figur 4 Illustration af en minimal P- værdi på 0,4% Ud fra denne meget lille p- værdi, må vi afvise vores nul- hypotese. Udregningen af P- værdien 0,4% viser, at nul- hypotesen ikke opretholdes på et 5% niveau. Vi afviser dermed H0, idet resultatet er statistisk signifikant på et P- niveau. Det vil altså sige, at det ikke er sandsynligt, at der i populationen er et gennemsnit på mindst 4,6 på vores brugervenlighedsspørgsmål. Greve kommune placerer sig dermed ikke i top 10% blandt kommunerne, når det handler om klare og forståelige hjemmesidetekster. 10

) Greve Kommunes udvikling fra 010-011 Ved hjælp af signifikanstest på datasættet fra 011 vil vi yderlige undersøge, hvorvidt det er sandsynligt, at Greve kommunes website har forbedret sig fra 010 til 011 inden for vores brugervurderingsspørgsmål Teksterne på hjemmesiden er skrevet i et klart og letforståeligt sprog. Dette gør vi ved at undersøge, om det er sandsynligt eller ej, at der i 011 i populationen var det samme gennemsnit, som der i 010 var i stikprøven. Eftersom vi antager, at stikprøven er udtaget simpelt tilfældigt og stikprøvens størrelse er 139, kan normalfordelingen bruges som sampling distribution. Vores hypoteser bliver som følger: Nul- hypotese, H0: μ1 - μ = 0 Alternativ hypotese, H1: : μ1 - μ 0 Herefter udregner vi z- scoren efter formlen for sammenligning af gennemsnit for to uafhængige stikprøver: ( x z = 1 x) 0 s n 1 1 s + n μ1 = 4,3 µ = 4,3 s = 1,65 n1 = 139 n = 59 z = ((4,3-4,3) - 0)/ (1,65 /139 + 1,75 /59) = - 0,09/ 0,066 = - 0,34 Og derefter p- værdien P (- 0,34 > z) = 0,37 11

Figur 5 Illustration af P- værdi på 37% Beregningen viser en P- værdi på hele 37%, hvilket betyder, at H0 opretholdes på et 5% niveau. Med andre ord kan vi slutte, at gennemsnittet på vores brugervenlighedsspørgsmål kan antages at være det samme i 010 og 011. Der er altså ikke grund til at afkræfte vores nul- hypotese, og vi kan dermed ikke konkludere, at der er sket en stigning i populationens gennemsnitlige vurdering af spørgsmålet. 1