Rygtespredning: Et logistisk eksperiment

Relaterede dokumenter
Projekt 6.1 Rygtespredning - modellering af logistisk vækst

Eksempel på logistisk vækst med TI-Nspire CAS

Kapitel 3: Modeller i Derive

To samhørende variable

Vejledning i brug af Gym-pakken til Maple

Lineære sammenhænge, residualplot og regression

Lineære modeller. Taxakørsel: Et taxa selskab tager 15 kr. pr. km man kører i deres taxa. Hvis vi kører 2 km i taxaen koster turen altså

Værktøjshjælp for TI-Nspire CAS Struktur for appendiks:

Stx matematik B december Delprøven med hjælpemidler

Eksponentiel regression med TI-Nspire ved transformation af data

Maple 11 - Chi-i-anden test

Opgave Opgave 2 Andengradsligningen løses, idet. Opgave er en løsning til ligningen, da:

Statistik med Boxplot

Maple på C-niveau. Indsættelse i formler

T A L K U N N E N. Datasæt i samspil. Krydstabeller Grafer Mærketal. INFA Matematik Allan C

Differentialligninger. Ib Michelsen

1 Start og afslutning. Help.

Formelsamling Matematik C

Newtons afkølingslov

sammenhänge for C-niveau i stx 2013 Karsten Juul

Dokumentation af programmering i Python 2.75

Note til styrkefunktionen

6. Regression. Hayati Balo,AAMS. 1. Nils Victor-Jensen, Matematik for adgangskursus, B-niveau 1

At lave dit eget spørgeskema

i x-aksens retning, så fås ). Forskriften for g fås altså ved i forskriften for f at udskifte alle forekomster af x med x x 0

Kvadratisk regression

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Kapitlet indledes med en beskrivelse af - og opgaver med - de tre former for sandsynlighed, som er omtalt i læseplanen for

Matematik og magi. eller Næste stop Las Vegas. 14 Anvendt matematik. Rasmus Sylvester Bryder

Matematik A studentereksamen

Gæste-dagplejen D a g p lejen Odder Ko Brugerundersøgelse 2006

Kort om Eksponentielle Sammenhænge

Kort gennemgang af Samfundsfaglig-, Naturvidenskabeligog

Opgaver til Maple kursus 2012

Transienter og RC-kredsløb

Kapitel 11 Lineær regression

Søren Christiansen

Evaluering af den skriftlige prøve i musik A-niveau studentereksamen maj/juni 2011

Vejledning til WordMat på Mac

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Supplerende opgaver til TRIP s matematiske GRUNDBOG. Forlaget TRIP. Opgaverne må frit benyttes i undervisningen.

Kasteparabler i din idræt øvelse 1

Simpel Lineær Regression

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration

Forelæsning 11: Kapitel 11: Regressionsanalyse

Sjov med pizza-stykker

Statistisk modellering og regressionsanalyse

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Websitet handler om websitet i sin helhed, dvs. hvor mange besøgende du har i alt osv.

1 Regressionsproblemet 2

Formler og diagrammer i OpenOffice Calc

På opdagelse i Mandelbrot-fraktalen En introduktion til programmet Mandelbrot

Matematik A-niveau STX 24. maj 2016 Delprøve 2 VUC Vestsjælland Syd.

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

a) For at bestemme a og b i y=ax+b defineres to lister med data fra opgaven År d 0, 1, 2, 3, 4, 5, 6 :

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Børne- og Undervisningsudvalget BUU Alm.del Bilag 51 Offentligt. De socioøkonomiske referencer for grundskolekarakterer 2014

De socioøkonomiske referencer for gymnasiekarakterer 2013

Residualer i grundforløbet

Løsning til opgave 7, 9, 10 og 11C Matematik B Sommer 2014

Generelt er korrelationen mellem elevens samlede vurdering i forsøg 1 og forsøg 2 på 0,79.

Statistik i basketball

1 Hb SS Hb Sβ Hb SC = , (s = )

BILAG 3: DETALJERET REDEGØ- RELSE FOR REGISTER- ANALYSER

Ligninger... 1 Funktioner & modeller... 3 Regression... 6 Sjove opgaver... 7

02402 Løsning til testquiz02402f (Test VI)

Allan C. Malmberg. Terningkast

ysikrapport: Maila Walmod, 1.3 HTX, Rosklide I gruppe med Morten Hedetoft, Kasper Merrild og Theis Hansen Afleveringsdato: 28/2/08

[jobsøgende] sådan gør du... [opret dit CV & jobønsker]

Peter Harremoës Mat A eksamen med hjælpemidler 15. december f (x) = 0. 2x + k 1 x = 0 2x 2 + k = 0 2x 2 = k x 2 = k 2. k 2.

Tallene angivet i rapporten som kronologiske punkter refererer til de i opgaven stillede spørgsmål.

Tjek. lønnen. Et værktøj til at undersøge lokal løndannelse og ligeløn på offentlige arbejdspladser udgave Varenr. 7520

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Beregning af usikkerhed på emissionsfaktorer. Arne Oxbøl

Matematik B-niveau STX 7. december 2012 Delprøve 1

Bachelorprojekt Bilag 4 fil nr. 3 Tysk Karin Rostgaard Henrichsen Studienummer:

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

En ny vej - Statusrapport juli 2013

Analyse af bivirkninger på besætningsniveau efter vaccination med inaktiveret BlueTongue Virus (BTV) serotype 8 i danske malkekvægsbesætninger

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

a) Har måleresultaterne for de 2 laboranter samme varians? b) Tyder resultaterne på, at nogen af laboranterne måler med en systematisk fejl?

Tjek. lønnen. Et værktøj til at undersøge ligeløn på arbejdspladser inden for det grønne område og transportsektoren udgave Varenr.

Notat. Gælder kun modul II (mangler afklaring om det kan laves) MODUL III Øvrige køer > 12 > 24

Algebra INTRO. I kapitlet arbejdes med følgende centrale matematiske begreber:

Økonometri Lektion 1 Simpel Lineær Regression 1/31

Rapport Bjælken. Derefter lavede vi en oversigt, som viste alle løsningerne og forklarede, hvad der gør, at de er forskellige/ens.

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller

for gymnasiet og hf 2016 Karsten Juul

Lineære ligningssystemer

Faktaark: Iværksættere og jobvækst

Some like it HOT: Højere Ordens Tænkning med CAS

Klasse Situation Observation 3. klasse Før spillet. Der bliver spurgt ind til hvad børnene

Tilfældige rektangler: Et matematikeksperiment Variable og sammenhænge

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Matematik projekt 4. Eksponentiel udvikling. Casper Wandrup Andresen 2.F Underskrift:

Regneark II Calc Open Office

Transkript:

Rygtespredning: Et logistisk eksperiment For at det nu ikke skal ende i en omgang teoretisk tørsvømning er det vist på tide vi kigger på et konkret logistisk eksperiment. Der er selvfølgelig flere muligheder, men et populært eksperiment går ud på at studere rygtespredning i en klasse. Alternativt kan det også tolkes som smittespredning i klassen afhængigt af klassens temperament. Alle de tilstedeværende i klassen tildeles et nummer, så med 28 elever i klassen uddeles numrene 1-29. Derefter trækkes en startperson ved hjælp af kommandoen RandInt(1,29). Lad os sige vi finder tallet 17. Person nr. 17 rejser sig op, og spillet er i gang. Der trækkes et nyt nummer for at se hvem der første gang hører rygtet fra person nr. 17. Det foregår nemmest i grafregner-værkstedet, hvor man kan pile op og hente den forrige kommando ved at taste ENTER. Lad os sige, at vi denne gang finder tallet 13. Person nr. 13 rejser sig op. Nu kender både 17 og 13 rygtet, så i næste runde trækker vi to numre ved at ændre kommandoen til RandInt(1,29,2). De inficerede personer, som har hørt rygtet fra person nr. 17 og person nr.13 rejser sig op. Vi trækker så igen numre svarende til det totale antal inficerede personer osv. indtil alle har hørt rygtet. Antallet af inficerede personer som funktion af antallet af rygtespredninger kan nu undersøges nærmere. I et konkret eksperiment udført på et T 3 -kursus med 32 tilstedeværende udviklede det sig således: 0 1 2 3 4 5 6 7 8 9 10 1 2 4 7 13 18 24 27 29 31 32 Tallene tastes ind i listerne runde og antal og vi er klar til at kigge på et statistisk plot. 1

Logistisk regression: Maskinens tur Det kunne godt ligne en logistisk vækst. For at undersøge det nærmere kan vi nu gå frem på flere forskellige måder. Vi kunne for eksempel starte med at tænke os om, men vi kan også bruge maskinens indbyggede logistiske vækstmodel. Lad os derfor vente lidt med at tænke og først kigge på maskinens indbyggede regressions model Logistisk vækst (d=0). Som alle andre regressionsmodeller ligger den under menuen Statistik > stat beregning. Vi udfører derfor kommandoen i lister og regnearkværkstedet, så vi også kan ligningen for regressionsfunktionen at se. Der er tale om en ikke-lineær regressionsmodel, så maskinen finder parametrene iterativt ved at lave løbende justeringer, hvorved summen af de kvadratiske afvigelser hele tiden søges nedbragt. Læg mærke til, at vi ikke får oplyst en forklaringsgrad. Til gengæld er grafen rimeligt overbevisende. Men selvfølgelig bør vi ikke bare lade os stille tilfredse med en pæn graf. Vi bør i det mindste checke residualerne for at se om vi skulle have overset systematiske variationer, der går udover den logistiske model: 2

Som det ses svinger residualerne tilfældigt op og ned, og da ydermere den største afvigelse er helt nede på ca. ½, må det siges at være et særdeles tilfredsstillende residualplot, i betragtning af at alle de observerede y-værdier er hele tal. Manuel fitning til en logistisk model Så er det vist på tide at vi også prøver at tænke os lidt om! Til at begynde med vil sandsynligheden for at vi rammer en genganger være meget lille, da antallet af inficerede elever er meget lille i forhold til det samlede antal. Den første må derfor forventes at smitte en ny. De to første må så forventes at smitte to nye. Disse fire må så forventes at smitte fire nye osv. Til at begynde med fordobles antallet derfor hver gang, indtil gengangerne begynder at optræde. I den ovenstående serie ser vi da også at antallet vokser som 1 2 4 7, så først i tredje runde dukker den første genganger op. Den eksponentielle vækst i den indledende fase er derfor simpelthen givet ved den eksponentielle vækstfunktion 2 x. En graf over fordoblingsfunktionen y = 2 x sammen med det statistiske plot for rygtespredningerne bekræfter da også dette: Dernæst bemærker vi, at mæthedsniveauet også er givet på forhånd idet der er 32 deltagere i alt, hvorfor M = 32. Vi forventer altså en logistisk vækst af formen: 32 y = 1+ c 2 x Bemærkning: Læg mærke til overensstemmelsen med det resultat vi fandt ved den logistiske regression. Her blev mætningsniveauet M estimeret til 32.13, altså en smule over de forventede 32. Tilsvarende blev vækstraten b estimeret til 0.7346, altså igen en smule over de forventede ln(2) = 0.6931. Men alt i alt peger det i den rigtige retning. 3

Der er altså reelt kun 1 parameter, der skal estimeres i vores teoretiske model, nemlig konstanten c, som kontrollerer den vandrette forskydning af grafen. Den er til gengæld sværere at forudsige teoretisk. Vi vil derfor estimere den ud fra det konkrete eksperiment. Hvis vi fx insisterer på startværdien 1, ser vi, at vi er nødt til at sætte c = 31. Hvis vi i stedet benytter vendepunktet, ser vi at antallet af smittede elever passerer halvdelen af de tilstedeværende, dvs. 16, et sted mellem 4 og 5 runder henne. Altså er konstanten givet ved c 2 4. 5 22. 6. Ingen af estimaterne er særligt præcise, men ved at se på graferne kan vi dog godt se, at de følger observationerne rimeligt, om end de ikke gengiver forskydningen i x-aksens retning helt præcist. Det ses dog klart ud fra graferne, at estimatet baseret på vendepunktet er væsentligt mere præcist end estimatet baseret på startpunktet! Da der kun er én fri parameter i vores model kan vi imidlertid nemt finde en rimelig værdi for denne. Fx kan vi udnytte at c er en konstant, men c er givet ved udtrykket: 32 1 2 x c = y 4

Listen givet ved udtrykket 32 1 2runde antal skal derfor med tilnærmelse være konstant. Ved indtastning i lister- og regneark-værkstedet fås da også: Specielt inde i midten giver det rimelige værdier for c, men stadig med en betydelig variation. Vi står os derfor ved at anvende medianen dvs. i dette tilfælde 24.9: median c_data 24.8888888889 5

Vi kan også finde den optimale værdi baseret på mindste kvadraters metode. Vi finder fx minimum for summen af de kvadratiske afvigelser ved at tegne grafen (idet vi omdøber den uafhængige c variabel til x!): sumlist((antal - 32/(1+X*2^-Runde)) 2 ). Grafen viser sig da at have et minimum ved x-værdien X = 24.48 med en minimal kvadratsum på Y = 2.96. Det er selvfølgelig lidt højere end det minimum vi fandt ved den logistiske regression, men det giver stadigvæk en imponerende god forklaringsgrad på 99.80% (hvilket udregnes som 1-2.9622/1480.9091). Der er altså ingen tvivl om, at den opstillede logistiske model på fornem vis gør rede for variationen i rygtespredningsdataene. Og denne gang har vi kunnet nøjes med at estimere én parameter! 6