Skolesektionen på

Størrelse: px
Starte visningen fra side:

Download "Skolesektionen på www.ballerup.dk"

Transkript

1 Skolesektionen på Louise Callisen Dyhr (ldyh) Marie Louise Gottlieb Frederiksen (mgfr) Janus Askø Madsen (jaam) Nanna Petersen (nshy) Antal tegn: Afleveringsdato: 21. maj 2014

2 1 Indledning Deskriptiv statistik Sidevisninger A/B test Designændringer Konfidensintervaller Hypotesetest for to andele Afvigelser på månedlig basis Hypotesetest for to middelværdier Kategoriserede variable Konklusion Side 1 af 26

3 1 Indledning Denne rapport bygger på en A/B test gennemført i forbindelse med kurset Statistiske metoder til Websiteoptimering. Rapporten indeholder statistiske beregninger og fortolkninger af en række data, som er blevet til under et casestudie af Ballerup Kommunes skolesektion. Siden er en undersektion på Ballerup Kommunes hjemmeside. Sektionen rummer alle informationer vedrørende kommunens folkeskoler. Det er Center for Skole og Institutioner, der lægger indhold ind på hjemmesidens skolesektion. Da Ballerup Kommune er en offentlig institution, består hjemmesidens målgruppe af byens nuværende og kommende borgere. Kommunes medarbejdere benytter også hjemmesiden til at finde forskellige informationer. På skolesektionen er den primære målgruppe forældre til børn i kommunens folkeskoler, privatskoler eller 10. klasser. Den typiske bruger af skolesektionen (og dermed den afgrænsede målgruppe i dette projekt) vil være forældre, hvis børn skal begynde i én af Ballerup Kommunes skoler. Forældrene kan have børn, der skal starte i børnehaveklasse, men det kan også dreje sig om børn, der skifter skole inden for kommunen eller er tilflyttere udefra. Forældre, der allerede har børn i Ballerup Kommunes skoler, benytter primært skolernes interne kommunikationsplatforme kaldet SkoleIntra og ikke kommunens skolesektion. En undtagelse herfor fandt sted under lærerlockouten i 2013, hvor kommunen udsendte generel information om processen. Skolesektionens overordnede formål er altså at informere forældre om, hvilke skoler og tilbud de kan finde i kommunen, hvilket skoledistrikt de hører til, og hvordan deres barn indskrives i skolen. For Center for Skole og Institutioner, som er skolesektionens afsender, er det vigtigste formål med sektionen, at brugeren finder, hvad de søger. Det er vanskeligt at opstille en mere konkret målsætning for skolesektionen. Fokus ligger på, at borgeren så vidt muligt skal kunne finde svar på skolerelaterede spørgsmål, så han slipper for at kontakte kommunen via telefon eller fysisk fremmøde. Èt af projektgruppens medlemmer arbejder for Ballerup Kommune med at vedligeholde Side 2 af 26

4 skolesektionen. Vi har derfor haft adgang til brugbar viden om sitets formål, og endvidere haft mulighed for at iværksætte nødvendige tiltag for at gennemføre A/B test. 2 Deskriptiv statistik Ved hjælp af analyseværktøjet Google Analytics (GA) har vi udtrukket statistik over brugeradfærden på siden Skoler ( på Ballerup Kommunes hjemmeside. 2.1 Sidevisninger GA muliggør blandt andet at udtrække et overblik over den kvantitative variabel antal sidevisninger på siden Skoler. En sidevisning registreres, når en side på sitet bliver indlæst i den besøgendes browser. Værdien sidevisninger er det samlede antal gange, en side er vist i en valgt periode. GA viser både den registrerede data visuelt i en graf og på tabelform. I perioden 1. januar til 31. januar 2014 har der været 775 sidevisninger på siden Skoler (se figur 1). Figur 1 - oversigt over antal besøgende på skolesektionen fra 1. til 31. januar 2014 Side 3 af 26

5 Nedenstående graf er et nærbillede af den kvantitative variabel antal sidevisninger pr dag i januar måned 2014 på skolesektionen. Ved at nærstudere udviklingen af sidevisningerne ses det, at der i starten af hver uge i den pågældende periode er høj trafik, og at der i weekenden er relativt lav trafik. Figur 2 - Antal sidevisninger per dag i januar 2014 Nedbrydes den kvantitative variabel sidevisninger pr dag på én forklarende variabel, nemlig hvilket device brugeren benytter, når de besøger siden, tegner der sig følgende billede (se figur 3). Figur 3 -antal sidevisninger på skolesektionen fordelt på device Side 4 af 26

6 Skolesektionen besøges af brugere, der i januar 2014 anvendte henholdsvis desktop (592), tablet (115) eller mobil (68). Figur 4 herunder opsummerer i et søjlediagram, hvordan sidevisningerne på skolesektionen fordeler sig på devices. Alle sidevisninger dækker over det samlede antal visninger af en side. Unikke sidevisninger tager højde for, at den samme bruger godt kan klikke på den samme side flere gange under et besøg på siden. Ud fra grafen i figur 4 er det tydeligt, at størstedelen af de besøgende benytter deres desktop, når de klikker ind på skolesektionen. Ballerup Kommune har anvendt en del ressourcer på at mobiloptimere deres hjemmeside og herunder også skolesektionen. Trods vækst i brugen af smartphones i samfundet generelt afslører oversigten herunder, at besøgende på skolesektionen i langt de fleste tilfælde besøger siden fra deres desktop Sidevisninger pr. device type Antal Alle sidevisninger Unikke sidevisninger 0 Desktop Tablet Mobile Device type Figur 4 - Sidevisninger og unikke sidevisninger efter device type 3 A/B test En A/B test er en metode, hvor man sammenligner en kontrolgruppe, der udsættes for én version af en hjemmeside, med en eller flere forsøgsgrupper, der udsættes for en eller flere varianter af samme hjemmeside. Variationen kan bestå i at eksempelvis tekst eller et billede, er ændret. Formålet er at finde frem til hvilken af varianterne, der bedst påvirker brugerne til at foretage en ønskede handling, som f.eks. køb, accept af yderligere kommunikation eller lignende. Vi vil anvende metoden A/B test Side 5 af 26

7 Louise, Marie, Janus og Nanna Statistiske metoder til websiteoptimering Eksamensopgave 21. maj 2014 FOR14 til at undersøge, om designændringer kan forbedre skolesektionen på Ballerup.dk. Vores testperiode løb fra 27. marts 2014 til 22. april Alle data i A/B testen er fra denne periode. 3.1 Designændringer Højre spalte i skolesektionen fremstår rodet (se figur 5), forvirrende og uklar. Der er ingen tydelig prioritering af indholdet, man er ikke umiddelbart klar over, hvilke sider links fører til, og der er ringe sammenhæng i indholdet. Målet med en ændring var at skabe en mere overskuelig højre spalte med en tydelig kommunikation og dermed en forøget forståelse af indholdet. Vores redesign ser ud som følgende (B siden) sammenlignet med det nuværende design (A siden): A side: B side: Figur 5 Designet og redesignet af højrespalten på Skoler siden Side 6 af 26

8 Ændringen er udformet igennem følgende 3 tiltag: 1. Retorik 2. Gruppering 3. Placering Retorik På Ballerup Kommunes skolesektion oplever vi en uklar retorik i forhold til sidens egentlige indhold. Eksempelvis bruges ordet Selvbetjening dette fører til et plugin styret af KMD, som mest af alt er en link-samling til andre selvbetjeningsløsninger. Brugere kunne umiddelbart forbinde Selvbetjening med et sted, hvor man fx direkte kan indskrive sit barn i skolen. Et andet eksempel er, at der et sted bruges ordet Privatskole både som overskrift og som underpunkt. Ballerup Kommunes begrundelse for dette er, at man rent teknisk ikke kan sætte overskriften til at være et link. Samtidig har de dog et sted Efterskole som overskrift og Orientering om efterskole som underpunkt. Vi undrer os over, at de har valgt et forskelligt sprogligt format på to områder, der minder så meget om hinanden. Vores første tiltag var derfor at opdatere retorikken i højre spalte, så den blev konsistent, klar og forståelig. Gruppering Et punkt, som relaterer sig til retorikken på skolesektionen, er gruppering. Skolesektionens højre spalte består af 8 links, som er lagt under 7 overskrifter. Desuden er der en Kontakt del, som adskiller sig i format. Stort set alle links har deres egen overskrift. Dette forekommer forvirrende og uoverskueligt. Vores andet tiltag var at gruppere relateret indhold under fælles overskrifter, så brugeren nemmere og hurtigere kan få et overblik over typen af indhold. Placering Vores sidste tiltag omhandlede prioriteringen af indholdet. Rækkefølgen af indholdet i den højre spalte er på nogle områder ulogisk og uhensigtsmæssig. Eksempelvis placeres én rapport midt i spalten, mens to andre rapporter placeres i bunden, hvilket man ikke kan finde nogen årsag til. Derudover er Kontakt delen placeret som det allerførste. Denne struktur er en standard, som Ballerup Kommune følger, men det forekommer uhensigtsmæssigt, da målet er, at brugerne skal kunne finde det, de søger på hjemmesiden frem for at kontakte den kommunale konsulent på mail eller telefon. Vores tredje tiltag var derfor at justere placeringen af indholdet, så det fremstår i den Side 7 af 26

9 korrekt prioriterede rækkefølge. Dette blev bestemt ud fra en kombination af, hvilke informationer Ballerup Kommune har fokus på at videregive, samt hvilke links borgerne anvender mest. Vi lavede yderligere en justering ved at placere Kontakt delen længere nede i spalten, for at tilbyde brugeren det højest prioriterede indhold inden muligheden for at ringe eller skrive en til Ballerup Kommune. Målsætning Da vores A/B test indeholder forskellige designændringer, ville det i princippet være relevant at teste resultatet af hver enkelt ændring. Ud fra scopet på dette projekt, har vi dog i vores analyse valgt at fokusere på målsætningen, at opnå flere klik på Skoledistrikter. Vi vil altså beregne, samt fortolke på, om det klikbare billede af skoledistrikterne på B siden konverterer bedre end linket på A siden, der hedder Folkeskoledistrikter. Valget er faldet på denne designændring, både fordi Skoledistrikter er et at de mest klikkede links på siden, og fordi vi her har mulighed for at lave et visuelt call-to-action, i form af et billede af skoledistrikterne. 3.2 Konfidensintervaller Vi har valgt at lave konfidensintervaller på vores konverteringer (Klik på linket skoledistrikter), på både A og B siden på totalniveau og nedbrudt på variablerne Nye besøgende og Tilbagevendende besøgende. Konfidensintervallerne kan vise os, hvad det er forventeligt, at populationen vil gøre på baggrund af vores stikprøve. I GA har vi udtrukket data fra A siden og B siden som antal eksperimentsessioner 1, der er henholdsvis nye og tilbagevendende for at se hvor mange af disse, som har konverteret. Dette illustreres i følgende to screenshots: 1 En bruger der kommer ind på siden Skoler og bliver sendt til enten a eller b-siden, vil tælle som 1 eksperimentsession, uanset hvor mange gange han klikker tilbage til Skolesiden. Side 8 af 26

10 Nye besøgende: Figur 6 - Antal eksperimentsessioner fordelt på nye besøgende Tilbagevendende besøgende: Figur 7 - Antal eksperimentsessioner fordelt på tilbagevendende besøgende Vi har opsamlet dataene i nedenstående tabel: A siden B siden A Total A Nye A Tilbage B Total B Nye B Tilbage n ! (konverteringsraten) 0,172 0,15 0,227 0,142 0,091 0,293 Tabel 1 Konverteringsraten nedbrudt på nye og tilbagevendende besøgende på A og B siden Vi ønsker at udregne et konfidensinterval på 95%. Vi tager udgangspunkt i følgende formel for konfidensintervaller. π ± 1.96!" For at udfylde denne må vi først udregne en standard error, hvilket gøres vha følgende formel: Side 9 af 26

11 !" = π (1 π)! Eksempel: Beregningen for A Total ser ud som følgende:!" = π (1 π)! = 0,172 (1 0,172) 151 = 0,031 Laveste intervalværdi: π 1.96!" = 0,172 1,96 0,031 = 0,112 Højeste intervalværdi: π !" = 0, ,96 0,031 = 0,232 Disse udregninger er gennemført for alle variable, hvilket giver følgende værdier: A siden B siden A Total A Nye A Tilbage B Total B Nye B Tilbage se 0,031 0,035 0,063 0,027 0,026 0,071 Laveste intervalværdi 0,112 0,082 0,103 0,088 0,040 0,154 Højeste intervalværdi 0,232 0,218 0,351 0,196 0,142 0,432 Tabel 2 Konfidensintervaller nedbrudt på nye og tilbagevendende besøgende på A og B siden Konfidensintervallerne (KI) for alle variable bliver derfor: A siden total: 95% KI mellem 11,2% og 23,2% A siden nedbrudt på nye besøgende: 95% KI mellem 8,2% og 21,8% A siden nedbrudt på tilbagevendende besøgende: 95% KI mellem 10,3% og 35,1% B siden total: 95% KI mellem 8,8% og 19,6% B siden nedbrudt på nye besøgende: 95% KI mellem 4,0% og 14,2% B siden nedbrudt på tilbagevendende besøgende: 95% KI mellem 15,4% og 43,2% Side 10 af 26

12 Refleksion Ud fra konfidensintervallerne kan vi aflæse, at de tilbagevendende besøgende konverterer mere end de nye besøgende på B siden. På A siden er der et overlap i konfidensintervallerne mellem de nye og tilbagevendende besøgende, og det kan derfor ikke konkluderes hvilken gruppe, der konverterer bedst her. At det netop er de tilbagevendende besøgende, der konverterer bedst på B siden, kan der være flere grunde til. I et scenarie med en forælder der har et barn, der skal begynde i skole, kan man forestille sig, at siden kræver flere besøg, og at skoledistrikter ikke naturligt er det første, man klikker på. Man kan også forestille sig, at det ikke er indlysende for brugeren, at kortet Skoledistrikter er klikbart - men at de ved gentagne besøg opdager denne funktion. Endvidere kan en del af de tilbagevendende besøgende være ansatte, der besøger siden flere gange og ofte har brug for informationen om skoledistrikter. 3.3 Hypotesetest for to andele (Bemærk: alle værdier er afrundet til 1 decimal for at hjælpe på overskuelighed, men i udregningen er de fulde værdier anvendt). Testperioden på 27 dage for de to sider gav følgende resultater ift. brugernes konvertering til siden Skoledistrikter (se figur 8). Figur 8 - Eksperiment data fra GA Side 11 af 26

13 n (sample size) Konvertering! (konverteringsrate) A-side ,1722 B-side ,142 Tabel 3 Konverteringsraten på A og B siden Med designændringerne ønskede vi at teste, om flere klikkede på linket skoledistrikter i form af billedet i stedet for det oprindelige link i tekstform. Testperioden gav et andet resultat, idet konverteringsraten er lavere på B siden end på A siden. Ud fra de umiddelbare data er det dog svært at konkludere, om det betyder, at A siden har været bedre designet end B siden. Vi vil derfor i det følgende undersøge, om der er en signifikant bedre konverteringsrate på A siden, hvilket vi vil gøre ved at udforme en hypotesetest, som består af 5 steps. Hypotesetesten 1) Antagelser Kategoriserede variabler Simple random sample Sample size: A side: 151 B side: 162. (Se tabel 3) 2) Hypotese H 0 :!! =!! H a :!!!! Vores nul hypotese er, at konverteringsraterne for side A og B er ens Vores alternative hypotese er, at raterne for side A og B afviger 3) Test statistik Vi tager udgangspunkt i nedenstående formel:! =!!!!!!!" For at udfylde denne, beregnes først en fælles! for a og b og herefter en standard error. Side 12 af 26

14 ! = = = 0,1565!"! =! 1! + 1!! + 1!! = 0, , = 0, = 0,1448 = 0,3806! =!!!!!!!" = 0,142 0, ,3806 = 0,0794 4) P-værdi P = 2P(! < 0,0794) = 2 x 0,4684 = 0,9367 Figur 9 Udregning af p-værdi i Excel Side 13 af 26

15 5) Konklusion På baggrund af testen med en p-værdi på 0,94 kan vi ikke afvise H 0. Selvom konverteringsraten på B siden viste en lavere konverteringsrate end på A siden har ændringerne ikke haft en effekt på konverteringsraten. På trods af den lavere konverteringsrate viser resultatet af testen, at B sidens konverteringsrate ikke er signifikant lavere end A sidens. Vi er 94 % usikre på vores konklusion. Hvis vi lavede testen 100 gange ville vi kun have ret 6 % af gangene. Vi er 6 % sikre på at der er en forskel, og 94 % sikre på at der ikke er en forskel. Chancen for at får et resultat der er større end (mindre end) end teststørrelsen er 94 % sikker. Refleksion Hvis man skal kigge på effekten af ændringen på årsbasis, skal vi beregne ud fra det fald, der har været i konverteringen i vores testperiode. På de 27 dage testen varede, var der et fald fra 26 konverteringer til 23, altså en difference på 3 konverteringer. Ud fra de tal kan man beregne effekten på årsbasis således: 365 dage/27 dage = 13,52. Effekten vil derfor svare til 3 x 13,52 = 40,5 færre konverteringer per år, hvis man kun tager højde for de tal testperioden gav. I vores tilfælde med et site som skolesiden er der dog flere faktorer, som kan have indflydelse på resultatet af testen, og testperioden er ikke repræsentativ for hele året. Længden på testperioden kan have betydning for resultatet, men vigtigst at påpege er, at skolesiden besøges mest fra september til december, da det er i denne periode, at forældre skal indmelde deres børn i skole. Hvis vi havde testet i denne periode, kan resultatet af konverteringer muligvis have set meget anderledes ud. Vi mener derfor ikke, man kan generalisere ud fra beregningen på de 40,5 færre konverteringer på årsbasis, da perioden ikke giver det sande billede af aktivitet på siden på hele året, og derfor ikke er repræsentativ. 4 Afvigelser på månedlig basis På trods af at A/B testen viste, at brugerne konverterede mere på A siden, kan vi ikke konkludere, at designændringerne har været mislykkede. Dette skyldes, at en række faktorer kan have betydning for, hvorvidt brugerne trykker på linket Skoledistrikter. Side 14 af 26

16 Den væsentligste faktor er, at vi ikke har mulighed for at vide, hvorvidt de besøgende faktisk har haft behov for at finde siden Skoledistrikter. Siden Skoler har mange forskellige links til undersider, som de besøgende kan have ønsket at finde, og siden er i sig selv også en informationskilde. Hvis vi antager, at det er en succes, at alle de besøgende finder siden Skoledistrikter, antager vi, at dette er deres behov. I A/B testen er det muligt, at flere besøgende på A siden end på B siden har haft behov for at finde siden Skoledistrikter. Hvis dette er tilfældet, vil designet af A siden ikke nødvendigvis være bedre end designet af B siden. For at fjerne denne faktor, ville det være nødvendigt at lave en kvalitativ undersøgelse angående brugernes behov, når de besøger siden Skoler. Den kvalitative undersøgelse kunne ligge til grund for et estimat af, hvor mange brugere der reelt har behov for at finde siden. Hvis eksempelvis 20% af brugerne leder efter siden Skoledistrikter, kan det være et mål, at 20% af de besøgende finder linket Skoledistrikter hurtigt. Derudover ville det være relevant at undersøge siden Skoler som en helhed, og se på alle de forskellige brugerbehov. For at undersøge betydningen af denne faktor yderligere, ønsker vi at udføre en hypotesetest for to middelværdier. Vi har valgt at lave en sammenligning af data fra december og januar, hvor designet af højrespalten var ens. Vi ønsker at undersøge, om den gennemsnitlige procentdel af de besøgende på Skoler siden, som trykker videre på Skoledistrikter, afviger fra måned til måned. Hvis vi kan konkludere, at det er forskelligt fra måned til måned, hvor stor en procentdel af de besøgende, der trykker på Skoledistrikter, selvom designet er ens, kan det tyde på, at de besøgendes behov for at besøge siden Skoledistrikter afviger. Dette kan være et argument for, at de besøgende på A siden og B siden i vores test også kan have haft forskellige behov. 4.1 Hypotesetest for to middelværdier Følgende er data fra december og januar, som giver et overblik over, hvor stor en procentdel af de besøgende, der har klikket på linket Skoledistrikter pr. dag. Tabellens forklarende variabel er måned, og respons variablen - som vi sammenligner ud fra - er procentdelen af de besøgende på Skoler siden, som trykker videre på Skoledistrikter. De to stikprøver er uafhængige af hinanden. I tabellen ses for hver måned, for den enkelte dato: Side 15 af 26

17 Antal klik på Skoledistrikter Antal sidevisninger på Skoler siden Procentdelen af de besøgende på Skoler siden, som klikker på Skoledistrikter Observationens afvigelse fra gennemsnittet, (y i ȳ) 2, udregnes i denne tabel, da værdierne skal bruges til at udregne en standard afvigelse DATO DECEMBER JANUAR klik sidevisninger y i (y i - ȳ) 2 klik sidevisninger y i (y i - ȳ) , , , ,7 0, ,4 3, ,3 2, ,7 0, , ,6 24, , , ,3 0, ,3 33, ,5 0, ,1 0, , ,3 45, ,6 61, , ,8 3, , ,8 323, , , ,2 11, ,7 0, ,3 663, ,8 1, , ,1 5, , ,9 0, , , ,4 192, , ,7 0, ,1 27, ,6 4, ,6 10, , , ,7 82, ,4 5, , , , , , ,5 313, ,7 82, ,6 0, ,1 12, ,6 5, ,1 12, ,8 15, ,7 82, ,3 6, ,3 0, ,3 0, ,5 24, ,6 Sum: ,7 2018, ,6 1111,4 ȳ: 7,6 5,8 Side 16 af 26

18 Tabel 4 Udregning af den gennemsnitlige procentdel af de besøgende som klikker på linket "Skoledistrikter" i december 13 og januar Procentdel af de besøgende som klikker på linket "Skoledistrikter" y i December Januar Dato Figur 10 - Procentdel af de besøgende som klikker på linket "Skoledistrikter" i december 13 og januar 14 Ud fra disse data kan vi opstille følgende tabel:! ((!!! )! ) n December 7,6 2018,7 31 Januar 5,8 1111,4 31 Tabel 5 Tal til videre beregning Hypotesetesten Vi vil nu gennemgå de 5 steps for en hypotesetest med to middelværdier: 1) Antagelser Kvantitative variabler Side 17 af 26

19 Simple random sample Sample size: December: 31, Januar: 31. (Se ovenstående tabel) 2) Hypotese H 0 : µ 1 = µ 2 Vores nul hypotese er at værdierne for to tilfældige måneder er de samme H a : µ 1 µ 2 Vores alternative hypotese er at værdierne for to tilfældige måneder afviger 3) Test statistik (Bemærk: alle værdier er skrevet op og afrundet til 1 decimaler for at hjælpe på overskuelighed, men i udregningen er de fulde værdier anvendt) Vi tager udgangspunkt i følgende formel, som vi deler op i mindre regnestykker:! =!!!!!!!" Estimate of parameter:!!!! = 5,82 7,57 = 1,7 Std. afvigelser: s! = (!!!)!! 1 = 2018, = 8,20!! = (!!!)!! 1 = 1111, = 6,09 Side 18 af 26

20 Std. error:!"! =!!! = 8,2 31 = 1,47!"! =!!! = 6,0 31 = 1,09!" = (!"! )! + (!"! )! = (1,47)! + (1,09)! = 1,83 Test statistik: 4) P-værdi! =!!!!!!!" = (5,82 7,57) 0 1,83 = 0,95 For at finde frem til p-værdien finder vi via excel standardnormalfordelingen for z = -0,95: (her har vi valgt ikke at afrunde, da dette ville give en p-værdi på 0) Standardnormalfordelingen = 0, P = 2P(z < -0,95) = 2 0,1706 = 0,3413 5) Konklusion Da P < 0,5 afvises H 0 Vi kan ikke afvise H 0 Vi kan ikke sige der er en forskel fra måned til måned på hvor mange der klikker på linket. Der er en forskel 66 % af i gangene i månerne men der er ikke en forskel 34 % af gange, altså hver 3 gang. Vi er 66 % sikre på at der vil være en forskel mellem månederne. 34 gange ud af 100 vil vi tage fejl og 66 % af gangene vil vi så have ret i vores hypotese, nemlig at der er en forskel mellem månederne. Vi er kun 66 % sikre på at der er en forskel, ikke 95 % sikre så derfor er vi 34 % sikre på at der ikke er en forskel Side 19 af 26

21 Refleksion Konklusion Der sker faktisk det, at P bliver over 0,05, og vi skal derfor opretholde H0 i stedet for at afvise den Det betyder, at der er så stor sandsynlighed for at værdierne for to forskellige måneder er det samme, at vi ikke kan afvise at de er det. - dermed ikke sagt, at vi er sikre på at det vil være det samme for to måneder, men vi er ikke sikre nok på at det vil være forskelligt. Ud fra disse data har vi altså ikke bevist, at det kan skyldes tilfældighed at side A har konverteret bedre end side B. - Men dermed ikke sagt at vi afviser denne tanke. 4.2 Kategoriserede variable Signifikanstest med to kategoriserede variable Ballerup Kommunes skolesektion besøges af mange forskellige borgere, som hver især har forskellige generelle it-kompetencer. Ved at kigge på hvilke besøgende på skolesektionen, der klikker på linket Skoledistrikter på den oprindelige udgave af hjemmesiden, kan vi afvise eller bekræfte en sammenhæng mellem browsertype og klik på linket. Vi har tidligere vist (se figur 4 side 6), at langt de fleste besøgende på skolesektionen besøger fra desktop. Derfor giver det god mening at vurdere, om de besøgendes browser har betydning for adfærd i forhold til linket. Da beregningerne for de forskellige celler er regnet ud fra de samme formler, har vi valgt at vise et eksempel på hver udregning, så det er tydeligt, hvilke tal der er indsat i formlen, men derudover har vi angivet de resterende tal i tabellerne. 1) Forudsætninger Simpel tilfældig udvælgelse Der skal være mindst 5 observationer i cellerne 2) Hypotese H 0 : De to variable er uafhængige H a : De to variable er afhængige Side 20 af 26

22 3) Teststørrelse Teststørrelsen beregnes ud fra følgende formel:!! = Σ (!!!! )!!! Inden vi kan udregne denne, bryder vi formlen ned på celleniveau: (!!!! )!!!!! er det observerede antal, som er kendt, mens!! er det forventede antal tallet vi ville forvente, hvis variablerne var uafhængige. Det forventede antal i hver enkelt celle beregnes efter formlen herunder, som tager udgangspunkt i det observerede antal klik: Forventet antal i cellen = række total kolonne total samlet stikprøvestørrelse Eksempel: Forventet antal i cellen (IE ja) = = 8,39 Tabel 6 Observerede og forventede antal konverteringer fordelt på browser type Når!! er kendt for alle celler, kan formlen udregnes. Eksempel: Beregning af forskellen mellem det observerede og forventede antal kliks på ja i IE. Forskellen kvadreres og divideres med den forventede værdi: Side 21 af 26

23 (!!! )! (7 8,39 )! = = 0, ! 8,39 Tabel 7 Chi-i-anden test nedbrudt på celleniveau Efter beregning af hver celle udregnes summen, hvilket giver os χ2. Denne teststørrelse sammenfatter, hvor langt de faktiske antal i hver celle ligger fra de forventede antal: 4) P-værdi!! = Σ (!!!! )!!! = 3, For at finde ud af om testresultatet viser H 0 eller H a skal man, sammen med antal frihedsgrader, anvende!2- værdien. Dette kan gøres manuelt og i Excel. Manuelt finder man!2-værdien i!2-fordelingstabellen ud fra antal frihedsgrader!. Vi finder vores frihedsgrad ved formlen:!" =!"#!$!æ!!"# 1!"#!$!"#"$$%& 1 = = 2 Ud fra den værdi der ligger tættest på ens χ2-værdi (i tabellen 3,22), kan man aflæse, at sandsynligheden for venstre hale er 0,8. Sandsynligheden for højre hale (p-værdien) er 1 0,8 = 0,2. For at finde den præcise p-værdi, kan vi alternativt anvende Excel. Omregning af teststørrelse til ssh sker ved hjælp af Excels CHI2.TEST. Resultatet af Chi-i-anden testen i Excel er 0,2094 altså tæt på den p-værdi vi også fandt manuelt ved tabelopslaget. Side 22 af 26

24 Figur 11 Udregning af p-værdi i Excel 5) Konklusion Vi afviser ikke H 0, da p-værdien er langt højere end de max 0,05. Dette betyder, at der ikke er sammenhæng mellem browsertype og konvertering. Hvis vi skulle have afvist H 0 skulle χ2- værdien have været større end 5,99 da denne værdi afspejler 95 % i venstre hale og 5 % i højre for 2 frihedsgrader. Vi er 80 % sikre på at der er en sammenhæng mellem browsertype og antal klik og vi 20 % sikre på at der ikke er en sammenhæng. Der er 20 % sandsynlighed for at få et resultat der er mere ekstremt (længere mod Ha) Standardiserede residualer Selvom konklusionen fra!2- testen overordnet ikke viste sammenhæng mellem variablene finder vi det interessant at se på sammenhængen mellem konverteringerne og hver enkelt browsertype, for at undersøge om der kan være en afhængighed på det enkelte celleniveau. Side 23 af 26

25 Dette gøres ved at beregne testværdier for hver enkelt browsertype, hvilket gøres igennem følgende formel:! =!!!!!" =!!!!!! 1!"#!"#!#"$%#& (1!"#$%&!"#!#"$%#&) Række- og kolonneandele For at kunne udfylde denne formel udregner vi først række- og kolonneandelene, hvilket gøres ved at dividere den totale observerede række-/kolonneværdi med den totale sum for rækkerne eller kolonnerne. Eksempel: IE total = = 0, Tabel 8 Observeret antal konverteringer Tabel 9 Andelen af rækker divideret med andelen af kolonner For at anvende dette på celleniveau udregnes parenteserne i den nederste del af z-formlen: 1!"#!"#!#"$%#& (1!"#$%&!"#!#"$%#&) Eksempel:!"!" = 1 0, , = 0, Side 24 af 26

26 Tabel 10 Beregning af parenteserne i den nederste del af z-formlen Beregning af standard error (se) Herefter kan vi udregne se for hver celle.!" =!! 1!"#!"#!#"$%#& (1!"#$%&!"#!#"$%#&) Eksempel:!" (!"!") = 8,39 0, = 2, Tabel 11 Standard error på celleniveau Beregning af f 0 - f e Herefter udregnes den øverste del af z-formlen Eksempel:!"!" =!!!! = 7 8,39 1,39 Side 25 af 26

27 Tabel 12 Observerede og forventede antal konverteringer fordelt på browser type Tabel 13 Det observerede antal minus det forventede antal konverteringer Beregning af z! =!!!!!" Eksempel:!!"!" = 1,39 2, = 0, Tabel 14 Z nedbrudt på celleniveau Refleksion Resultaterne stemmer overens med!2- testen. Ingen af værdierne er større end 3, som er den kritiske grænse for at der er en sammenhæng mellem en bestemt browser og konvertering. Alligevel Side 26 af 26

28 er det interessant, at der proportionelt er flere konverteringer blandt chromebrugere end de to andre browsertyper. 5 Konklusion Ballerup Kommunes skolesektion har en bred målgruppe. At lave en hjemmeside til en bred målgruppe er en udfordring, da individer i målgruppen kan have meget forskellige behov, forudsætninger og formål, når de besøger hjemmesiden. Ved hjælp af Google Analytics kan man opstille eksperimenter, som kan teste, om brugere af en hjemmeside ændrer adfærd, hvis man iværksætter nogle designjusteringer. I rapporten her har vi fokuseret på én af de centrale opgaver, som skolesektionen skal håndtere nemlig at skabe overblik over kommunens skoledistrikter. Vi har testet en ændret menustruktur på skoledistriktets hovedside op imod den originale version af siden. Vi har ikke kunnet registrere væsentligt ændret adfærd blandt brugerne af vores alternative design af siden, når vi har målt på klik videre til siden skoledistrikter. Vores eksperiment har ikke ændret ved de behov, som besøgende på skolesektionen har haft i testperioden. Det kan derfor ikke afvises at den ændrede retorik, grupperingen og placeringen af informationer på siden med alternativt design har forbedret brugernes oplevelse af skolesektionen. Hvis Ballerup Kommune i fremtiden vil undersøge om skolesektionen lever op til brugernes behov, så er det anbefalelsesværdigt at supplere Google Analytics med øvrige testværktøjer. Side 27 af 26

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af

Læs mere

C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b2.

C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b2. C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b. 5.000 4.800 4.600 4.400 4.00 4.000 3.800 3.600 3.400 3.00 3.000 1.19% 14.9% 7.38% 40.48% 53.57% 66.67% 79.76% 9.86% 010 011

Læs mere

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele Anvendt Statistik Lektion 4 Hypotesetest generelt Test for middelværdi Test for andele Hypoteser og Test Hypotese I statistik er en hypotese en påstand om en populationsparameter. Typisk en påstand om

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination

Læs mere

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0 Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt

Læs mere

Forelæsning 9: Inferens for andele (kapitel 10)

Forelæsning 9: Inferens for andele (kapitel 10) Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Mikro-kursus i statistik 1. del. 24-11-2002 Mikrokursus i biostatistik 1

Mikro-kursus i statistik 1. del. 24-11-2002 Mikrokursus i biostatistik 1 Mikro-kursus i statistik 1. del 24-11-2002 Mikrokursus i biostatistik 1 Hvad er statistik? Det systematiske studium af tilfældighedernes spil!dyrkes af biostatistikere Anvendes som redskab til vurdering

Læs mere

Normalfordelingen og Stikprøvefordelinger

Normalfordelingen og Stikprøvefordelinger Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning

Læs mere

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Statistik II Lektion 3 Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Setup: To binære variable X og Y. Statistisk model: Konsekvens: Logistisk regression: 2 binære var. e e X Y P

Læs mere

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Statistik i GeoGebra

Statistik i GeoGebra Statistik i GeoGebra Peter Harremoës 13. maj 2015 Jeg vil her beskrive hvordan man kan lave forskellige statistiske analyser ved hjælp af GeoGebra 4.2.60.0. De statistiske analyser svarer til pensum Matematik

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

χ 2 -test i GeoGebra Jens Sveistrup, Gammel Hellerup Gymnasium

χ 2 -test i GeoGebra Jens Sveistrup, Gammel Hellerup Gymnasium χ 2 -test i GeoGebra Jens Sveistrup, Gammel Hellerup Gymnasium Man kan nemt lave χ 2 -test i GeoGebra både goodness-of-fit-test og uafhængighedstest. Den følgende vejledning bygger på GeoGebra version

Læs mere

Projekt 1 Spørgeskemaanalyse af Bedst på Nettet

Projekt 1 Spørgeskemaanalyse af Bedst på Nettet Projekt 1 Spørgeskemaanalyse af Bedst på Nettet D.29/2 2012 Udarbejdet af: Katrine Ahle Warming Nielsen Jannie Jeppesen Schmøde Sara Lorenzen A) Kritik af spørgeskema Set ud fra en kritisk vinkel af spørgeskemaet

Læs mere

Statistik II 1. Lektion. Analyse af kontingenstabeller

Statistik II 1. Lektion. Analyse af kontingenstabeller Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression

Læs mere

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning

Læs mere

Kapitel 7 Forskelle mellem centraltendenser

Kapitel 7 Forskelle mellem centraltendenser Kapitel 7 Forskelle mellem centraltendenser Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 29 Indledning 1. z-test for ukorrelerede data 2. t-test for ukorrelerede data med ens

Læs mere

Statistik II 4. Lektion. Logistisk regression

Statistik II 4. Lektion. Logistisk regression Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:

Læs mere

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Stikprøver og stikprøve fordelinger Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Statistik Statistisk Inferens: Prediktere og forekaste værdier af

Læs mere

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen

Læs mere

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning 1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion

Læs mere

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Microsoft Excel har en del standard anvendelsesmuligheder i forhold til den beskrivende statistik og statistisk

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)

Læs mere

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05 Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Læs mere

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Statikstik II 2. Lektion Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Sandsynlighedsregningsrepetition Antag at Svar kan være Ja og Nej. Sandsynligheden for at Svar Ja skrives

Læs mere

Personlig stemmeafgivning

Personlig stemmeafgivning Ib Michelsen X 2 -test 1 Personlig stemmeafgivning Efter valget i 2005 1 har man udspurgt en mindre del af de deltagende, om de har stemt personligt. Man har svar fra 1131 mænd (hvoraf 54 % har stemt personligt

Læs mere

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan

Læs mere

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Introduktion Kursusholder: Kasper K. Berthelsen Opbygning: Kurset består af 5 blokke En blok består af: To normale

Læs mere

Vejledning til Google Analytics rapporter

Vejledning til Google Analytics rapporter Vejledning til Google Analytics rapporter Internet statistik kan godt være svært at forstå specielt hvis man ikke er vant til at arbejde med sådanne ting. For at gøre det nemmere for vores kunder at forstå

Læs mere

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

MATEMATIK A-NIVEAU. Anders Jørgensen & Mark Kddafi. Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012

MATEMATIK A-NIVEAU. Anders Jørgensen & Mark Kddafi. Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012 MATEMATIK A-NIVEAU Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012 Kapitel 4 Statistik & sandsynlighedsregning 2016 MATEMATIK A-NIVEAU Vejledende eksempler på eksamensopgaver

Læs mere

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger Program Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Analyse af ikke-parrede stikprøver: repetition of rettelse af fejl! Lidt

Læs mere

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet Matematik A Studentereksamen Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet stx11-matn/a-080501 Tirsdag den 8. maj 01 Forberedelsesmateriale til stx A Net MATEMATIK Der

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Uafhængighedstestet Eksempel: Bissau data Data kommer fra Guinea-Bissau i Vestafrika: 5273 børn blev undersøgt da de var yngre end 7 mdr og blev

Læs mere

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data Faculty of Life Sciences Program t-test Hypoteser, teststørrelser og p-værdier Claus Ekstrøm E-mail: ekstrom@life.ku.dk Resumé og hængepartier fra sidst. Eksempel: effekt af foder på hormonkoncentration

Læs mere

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test.

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test. Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ -test og Goodness of Fit test. Anvendelser af statistik Statistik er et levende og fascinerende emne, men at læse om det er alt

Læs mere

Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Dagens tema: Indfør centrale statistiske begreber. Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i

Læs mere

Note om Monte Carlo metoden

Note om Monte Carlo metoden Note om Monte Carlo metoden Kasper K. Berthelsen Version 1.2 25. marts 2014 1 Introduktion Betegnelsen Monte Carlo dækker over en lang række metoder. Fælles for disse metoder er, at de anvendes til at

Læs mere

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke

Læs mere

Schweynoch, 2003. Se eventuelt http://www.mathematik.uni-kassel.de/~fathom/projekt.htm.

Schweynoch, 2003. Se eventuelt http://www.mathematik.uni-kassel.de/~fathom/projekt.htm. Projekt 8.5 Hypotesetest med anvendelse af t-test (Dette materiale har været anvendt som forberedelsesmateriale til den skriftlige prøve 01 for netforsøget) Indhold Indledning... 1 χ -test... Numeriske

Læs mere

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136 Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 36 Det er besværligt at regne med binomialfordelingen, og man vælger derfor ofte at bruge en approksimation med normalfordeling. Man

Læs mere

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j Hypoteser om mere end to stikprøver ANOVA k stikprøver: (ikke ordinale eller højere) H 0 : 1 2... k gælder også for k 2! H 0ij : i j H 0ij : i j simpelt forslag: k k 1 2 t-tests: i j DUER IKKE! Bonferroni!!

Læs mere

1 Sammenligning af 2 grupper Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver... 2

1 Sammenligning af 2 grupper Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver... 2 Indhold 1 Sammenligning af 2 grupper 2 1.1 Responsvariabel og forklarende variabel......................... 2 1.2 Afhængige/uafhængige stikprøver............................ 2 2 Sammenligning af 2 middelværdier

Læs mere

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau... Indhold 1 Statistisk inferens: Hypotese og test 2 1.1 Nulhypotese - alternativ.................................. 2 1.2 Teststatistik........................................ 3 1.3 P-værdi..........................................

Læs mere

Løsning til eksaminen d. 29. maj 2009

Løsning til eksaminen d. 29. maj 2009 DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Hvad skal vi lave? Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver

Hvad skal vi lave? Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver Hvad skal vi lave? 1 Sammenligning af 2 grupper Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver 2 Sammenligning af 2 middelværdier Uafhængige stikprøver Uafhængige stikprøver -

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Skriftlig eksamen i samfundsfag

Skriftlig eksamen i samfundsfag OpenSamf Skriftlig eksamen i samfundsfag Indholdsfortegnelse 1. Introduktion 2. Præcise nedslag 3. Beregninger 3.1. Hvad kan absolutte tal være? 3.2. Procentvis ændring (vækst) 3.2.1 Tolkning af egne beregninger

Læs mere

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau Hvad skal vi lave? 1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ. Teststatistik P-værdi Signifikansniveau 2 t-test for middelværdi Tosidet t-test for middelværdi Ensidet t-test for middelværdi

Læs mere

Løsning til eksamen d.27 Maj 2010

Løsning til eksamen d.27 Maj 2010 DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1

Læs mere

Kapitel 8 Chi-i-anden (χ 2 ) prøven

Kapitel 8 Chi-i-anden (χ 2 ) prøven Kapitel 8 Chi-i-anden (χ 2 ) prøven Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 19 Indledning Forskelle mellem stikprøver undersøges med z-test eller t-test for data målt på

Læs mere

Fordeling af midler til specialundervisning

Fordeling af midler til specialundervisning NOTAT Fordeling af midler til specialundervisning Model for Norddjurs Kommune Søren Teglgaard Jakobsen December 2012 Købmagergade 22. 1150 København K. tlf. 444 555 00. kora@kora.dk. www.kora.dk Indholdsfortegnelse

Læs mere

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større

Læs mere

Spørgeskemaundersøgelser og databehandling

Spørgeskemaundersøgelser og databehandling DASG. Nye veje i statistik og sandsynlighedsregning. side 1 af 12 Spørgeskemaundersøgelser og databehandling Disse noter er udarbejdet i forbindelse med et tværfagligt samarbejde mellem matematik og samfundsfag

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 Indledning 2 Ensidet variansanalyse 3 Blokforsøg 4 Vekselvirkning 1 Indledning 2 Ensidet

Læs mere

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet Eksamen ved Københavns Universitet i Kvantitative forskningsmetoder Det Samfundsvidenskabelige Fakultet 14. december 2011 Eksamensnummer: 5 14. december 2011 Side 1 af 6 1) Af boxplottet kan man aflæse,

Læs mere

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede

Læs mere

Betinget fordeling Uafhængighed. Beregning af forventet tabel Chi-kvadrat teststatistik Chi-kvadrat test. Chi-kvadratfordelingen Agresti - Summary

Betinget fordeling Uafhængighed. Beregning af forventet tabel Chi-kvadrat teststatistik Chi-kvadrat test. Chi-kvadratfordelingen Agresti - Summary 1 Kontingenstabeller Betinget fordeling Uafhængighed 2 Chi-kvadrat test for uafhængighed Beregning af forventet tabel Chi-kvadrat teststatistik Chi-kvadrat test. Chi-kvadratfordelingen Agresti - Summary

Læs mere

Lineære sammenhænge, residualplot og regression

Lineære sammenhænge, residualplot og regression Lineære sammenhænge, residualplot og regression Opgave 1: Er der en bagvedliggende lineær sammenhæng? I mange sammenhænge indsamler man data som man ønsker at undersøge og afdække eventuelle sammenhænge

Læs mere

Forelæsning 11: Kapitel 11: Regressionsanalyse

Forelæsning 11: Kapitel 11: Regressionsanalyse Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

SILKEBORG KOMMUNE FORÆLDRETILFREDSHEDSUNDERSØGELSE 2018 SKOLE OG SFO

SILKEBORG KOMMUNE FORÆLDRETILFREDSHEDSUNDERSØGELSE 2018 SKOLE OG SFO SILKEBORG KOMMUNE FORÆLDRETILFREDSHEDSUNDERSØGELSE 2018 SKOLE OG SFO 1 INDHOLD Afsnit 01 Introduktion Side 03 Afsnit 02 Sammenfatning Side 05 Afsnit 03 Skoleresultater Side 07 Afsnit 04 SFO-resultater

Læs mere

Fig. 1 Billede af de 60 terninger på mit skrivebord

Fig. 1 Billede af de 60 terninger på mit skrivebord Simulation af χ 2 - fordeling John Andersen Introduktion En dag kastede jeg 60 terninger Fig. 1 Billede af de 60 terninger på mit skrivebord For at danne mig et billede af hyppighederne flyttede jeg rundt

Læs mere

Fordeling af midler til specialundervisning på baggrund af skoledistrikter

Fordeling af midler til specialundervisning på baggrund af skoledistrikter NOTAT Fordeling af midler til specialundervisning på baggrund af skoledistrikter Model for Norddjurs Kommune Søren Teglgaard Jakobsen Maj 2013 Indholdsfortegnelse FORMÅL... 1 METODE... 1 POPULATION...

Læs mere

Værktøjshjælp for TI-Nspire CAS Struktur for appendiks:

Værktøjshjælp for TI-Nspire CAS Struktur for appendiks: Værktøjshjælp for TI-Nspire CAS Struktur for appendiks: Til hvert af de gennemgåede værktøjer findes der 5 afsnit. De enkelte afsnit kan læses uafhængigt af hinanden. Der forudsættes et elementært kendskab

Læs mere

Analyse af en lineær regression med lav R 2 -værdi

Analyse af en lineær regression med lav R 2 -værdi Analyse af en lineær regression med lav R 2 -værdi Denne gennemgang omhandler figur 13 i Regn med biologi. Man kan sagtens lave beregninger på egne data. Forsøgsmæssigt kræver det bare en tommestok tapet

Læs mere

Metoder og produktion af data

Metoder og produktion af data Metoder og produktion af data Kvalitative metoder Kvantitative metoder Ikke-empiriske metoder Data er fortolkninger og erfaringer indblik i behov og holdninger Feltundersøgelser Fokusgrupper Det kontrollerede

Læs mere

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks

Læs mere

LUP læsevejledning til afdelingsrapporter

LUP læsevejledning til afdelingsrapporter Indhold Hvordan du bruger læsevejledningen... 1 Oversigtsfigur... 2 Temafigur... 3 Spørgsmålstabel... 4 Respondenter og repræsentativitet... 6 Oversigtsfigur for afsnit/underopdelinger... 8 Uddybende forklaring

Læs mere

Module 4: Ensidig variansanalyse

Module 4: Ensidig variansanalyse Module 4: Ensidig variansanalyse 4.1 Analyse af én stikprøve................. 1 4.1.1 Estimation.................... 3 4.1.2 Modelkontrol................... 4 4.1.3 Hypotesetest................... 6 4.2

Læs mere

Titel Overskrift. Hold den kort og præcis! Som Førtidspension & Skånejob. Andet relevant information skal stå i resumefeltet.

Titel Overskrift. Hold den kort og præcis! Som Førtidspension & Skånejob. Andet relevant information skal stå i resumefeltet. Oprettelse af Indholdsside fra a-z For at oprette en side skal du vælge en indholdstype, som i de fleste tilfælde er en Indholdsside. Herefter skal du udfylde felterne; på en indholdsside skal du koncentrere

Læs mere

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test Ikkeparametriske metoder Repetition Wilcoxon SignedRank Test KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet

Læs mere

IT/Regneark Microsoft Excel Grundforløb

IT/Regneark Microsoft Excel Grundforløb januar 2018 Indhold Opbygning af et regneark... 3 Kolonner, rækker... 3 Celler... 3 Indtastning af tekst og tal... 4 Tekst... 4 Tal... 4 Værdier... 4 Opbygning af formler... 5 Indtastning af formler...

Læs mere

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Kursus 02402: Besvarelser til øvelsesopgaver i uge 9 Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Som model benyttes en binomialfordeling, som beskriver antallet, X, blandt

Læs mere

Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning

Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning Side 1 af 6 Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning Litteratur: Kenneth Hansen & Charlotte Koldsø: Statistik I økonomisk perspektiv, Hans Reitzels Forlag 2012, 2. udgave,

Læs mere

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm. Multiple choice opgaver Der gøres opmærksom på, at ideen med opgaverne er, at der er ét og kun ét rigtigt svar på de enkelte spørgsmål. Endvidere er det ikke givet, at alle de anførte alternative svarmuligheder

Læs mere

Vejledende besvarelser til opgaver i kapitel 14

Vejledende besvarelser til opgaver i kapitel 14 Vejledende besvarelser til opgaver i kapitel 14 Opgave 1 a) Det første trin i opstillingen af en hypotesetest er at formulere to hypoteser, hvoraf den ene støtter den teori vi vil teste, mens den anden

Læs mere

Maple 11 - Chi-i-anden test

Maple 11 - Chi-i-anden test Maple 11 - Chi-i-anden test Erik Vestergaard 2014 Indledning I dette dokument skal vi se hvordan Maple kan bruges til at løse opgaver indenfor χ 2 tests: χ 2 - Goodness of fit test samt χ 2 -uafhængighedstest.

Læs mere

Punkt (1) graden af fan afhænger af hvor mange medier man bruger

Punkt (1) graden af fan afhænger af hvor mange medier man bruger Bilag H Test of Independence udregninger Note: Afhængig Uafhængig H a : x -> y H 0 : x y Punkt (1) graden af fan afhænger af hvor mange medier man bruger Stort udgangspunkt: de to variable hænger ikke

Læs mere

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse Afsnit 8.3 - E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse Først skal normalfordelingen lige defineres i Maple, så vi kan benytte den i vores udregninger. Dette gøres

Læs mere

Fokus på Forsyning. Datagrundlag og metode

Fokus på Forsyning. Datagrundlag og metode Fokus på Forsyning I notatet gennemgås datagrundlaget for brancheanalysen af forsyningssektoren sammen med variable, regressionsmodellen og tilhørende tests. Slutteligt sammenfattes analysens resultater

Læs mere

Forsøgsplanlægning Stikprøvestørrelse

Forsøgsplanlægning Stikprøvestørrelse Basal statistik Esben Budtz-Jørgensen 6. november 2007 Forsøgsplanlægning Stikprøvestørrelse 1 41 Planlægning af et studie Videnskabelig hypotese Endpoints Instrumentelle/eksponerings variable Variationskilder

Læs mere

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske

Læs mere

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Anvendt Statistik Lektion 7. Simpel Lineær Regression Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot

Læs mere

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Lineær regression. Simpel regression. Model. ofte bruges følgende notation: Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til

Læs mere

1 Regressionsproblemet 2

1 Regressionsproblemet 2 Indhold 1 Regressionsproblemet 2 2 Simpel lineær regression 3 2.1 Mindste kvadraters tilpasning.............................. 3 2.2 Prædiktion og residualer................................. 5 2.3 Estimation

Læs mere

University of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version

University of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version university of copenhagen University of Copenhagen Notat om statistisk inferens Larsen, Martin Vinæs Publication date: 2014 Document Version Peer-review version Citation for published version (APA): Larsen,

Læs mere

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3

Læs mere