Projekt 6.1 Rygtespredning - modellering af logistisk vækst



Relaterede dokumenter
Rygtespredning: Et logistisk eksperiment

Eksempel på logistisk vækst med TI-Nspire CAS

Lineære sammenhænge, residualplot og regression

Vejledning til WordMat på Mac

Modellering af elektroniske komponenter

Residualer i grundforløbet

Kapitel 3: Modeller i Derive

To samhørende variable

Eksponentielle funktioner for C-niveau i hf

Kvadratisk regression

Københavnske ejerlejlighedspriser en meget begrænset indikator for hele landets boligmarked

Vejledning i brug af Gym-pakken til Maple

Statistisk modellering og regressionsanalyse

Skriv punkternes koordinater i regnearket, og brug værktøjet To variabel regressionsanalyse.

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

Tilfældige rektangler: Et matematikeksperiment Variable og sammenhænge

Simpel Lineær Regression

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Værktøjshjælp for TI-Nspire CAS Struktur for appendiks:

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Bilag 7. SFA-modellen

Statistik med Boxplot

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Undervisningsbeskrivelse

Forelæsning 11: Kapitel 11: Regressionsanalyse

Løsning til opgave 7, 9, 10 og 11C Matematik B Sommer 2014

1 Hb SS Hb Sβ Hb SC = , (s = )

Vejledning til Gym18-pakken

Potensfunktioner samt proportional og omvent proportional. for hf Karsten Juul

Statistik med TI-Nspire CAS version 3.2. Bjørn Felsager September [Fjerde udgave]

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Økonometri Lektion 1 Simpel Lineær Regression 1/31

Stx matematik B december Delprøven med hjælpemidler

Opgaver til kapitel 3

Anvendt Statistik Lektion 7. Simpel Lineær Regression

I. Deskriptiv analyse af kroppens proportioner

Teori og opgaver med udgangspunkt i udvalgte områder i Køge Bugt regionen

for gymnasiet og hf 2016 Karsten Juul

Vejledning til GYM17 Copyright Adept Nordic 2013

Potens regression med TI-Nspire

Løsninger til matematik B-niveau HF maj 2016 April 2017

Arbejdet på kuglens massemidtpunkt, langs x-aksen, er lig med den resulterende kraft gange strækningen:

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

Tema. Dagens tema: Indfør centrale statistiske begreber.

Studieretningsprojekter i machine learning

Undervisningsbeskrivelse

Dansk Erhvervs gymnasieanalyse Sådan gør vi

Modelkontrol i Faktor Modeller

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Graph brugermanual til matematik C

Kapitel 11 Lineær regression

Projekt 8.3 Hvordan undersøges om et talmateriale normalfordelt?

Skriftlig Eksamen ST501: Science Statistik Mandag den 11. juni 2007 kl

Matematik A studentereksamen

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Undervisningsbeskrivelse

Mikro-kursus i statistik 1. del Mikrokursus i biostatistik 1

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Gratisprogrammet 27. september 2011

Velkommen til kurset. Teoretisk Statistik. Lærer: Niels-Erik Jensen

Brug af TI-83. Løsning af uligheder: Andre ikke simple uligheder løses ved følgende metode - skitseret ved et eksempel : Løs uligheden

(Projektets første del er rent deskriptiv, mens anden del peger frem mod hypotesetest. Projektet kan gemmes til dette emne, eller tages op igen der)

Undervisningsbeskrivelse

Opgave Opgave 2 Andengradsligningen løses, idet. Opgave er en løsning til ligningen, da:

Morten Frydenberg 14. marts 2006

Undervisningsbeskrivelse

Projekt 9.4 t-test som lineær regressionstest: Box s helikoptereksperiment

Transkript:

Projekt 6.1 Rygtespredning - modellering af logistisk vækst (Projektet anvender værktøjsprogrammet TI Nspire) Alle de tilstedeværende i klassen tildeles et nummer, så med 28 elever i klassen uddeles numrene 1-29. Derefter trækkes en startperson ved hjælp af kommandoen RandInt(1,29). Lad os sige vi finder tallet 17. Person nr. 17 rejser sig op, og spillet er i gang. Der trækkes et nyt nummer for at se hvem der første gang hører rygtet fra person nr. 17. Det foregår nemmest i grafregner-værkstedet, hvor man kan pile op og hente den forrige kommando ved at taste ENTER. Lad os sige, at vi denne gang finder tallet 13. Person nr. 13 rejser sig op. Nu kender både 17 og 13 rygtet, så i næste runde trækker vi to numre ved at ændre kommandoen til RandInt(1,29,2). De inficerede personer, som har hørt rygtet fra person nr. 17 og person nr.13 rejser sig op. Vi trækker så igen numre svarende til det totale antal inficerede personer osv. indtil alle har hørt rygtet. Antallet af inficerede personer som funktion af antallet af rygtespredninger kan nu undersøges nærmere. I et konkret eksperiment udført på et T 3 -kursus med 32 tilstedeværende udviklede det sig således: 0 1 2 3 4 5 6 7 8 9 10 1 2 4 7 13 18 24 27 29 31 32 Tallene tastes ind i listerne runde og antal og vi er klar til at kigge på et statistisk plot. Logistisk regression: Maskinens tur Det kunne godt ligne en logistisk vækst. For at undersøge det nærmere kan vi nu gå frem på flere forskellige måder. Vi kunne for eksempel starte med at tænke os om, men vi kan også bruge maskinens indbyggede logistiske vækstmodel. Lad os derfor vente lidt med at tænke og først kigge på maskinens indbyggede regressions model Logistisk vækst (d=0). Som alle andre regressionsmodeller ligger den under menuen Statistik > stat beregning. Vi udfører derfor kommandoen i lister og regnearkværkstedet, så vi også kan ligningen for regressionsfunktionen at se. Der er tale om en ikke-lineær regressionsmodel, så maskinen finder parametrene iterativt ved at lave løbende justeringer, hvorved summen af de kvadratiske afvigelser hele tiden søges nedbragt.

Læg mærke til, at vi ikke får oplyst en forklaringsgrad. Til gengæld er grafen rimeligt overbevisende. Men selvfølgelig bør vi ikke bare lade os stille tilfredse med en pæn graf. Vi bør i det mindste checke residualerne for at se om vi skulle have overset systematiske variationer, der går udover den logistiske model: Som det ses svinger residualerne tilfældigt op og ned, og da ydermere den største afvigelse er helt nede på ca. ½, må det siges at være et særdeles tilfredsstillende residualplot, i betragtning af at alle de observerede y-værdier er hele tal. Manuel fitning til en logistisk model Så er det vist på tide at vi også prøver at tænke os lidt om! Til at begynde med vil sandsynligheden for at vi rammer en genganger være meget lille, da antallet af inficerede elever er meget lille i forhold til det samlede antal. Den første må derfor forventes at smitte en ny. De to første må så forventes at smitte to nye. Disse fire må så forventes at smitte fire nye osv. Til at begynde med fordobles antallet derfor hver gang, indtil gengangerne begynder at optræde. I den ovenstående serie ser vi da også at antallet vokser som 1 2 4 7, så først i tredje runde dukker den første genganger op. Den eksponentielle vækst i den indledende fase er derfor simpelthen givet ved den eksponentielle vækstfunktion 2 x. En graf over fordoblingsfunktionen y = 2 x sammen med det statistiske plot for rygtespredningerne bekræfter da også dette:

Dernæst bemærker vi, at mæthedsniveauet også er givet på forhånd idet der er 32 deltagere i alt, hvorfor M = 32. Vi forventer altså en logistisk vækst af formen: 32 y 1 c 2 Bemærkning: Læg mærke til overensstemmelsen med det resultat vi fandt ved den logistiske regression. Her blev mætningsniveauet M estimeret til 32.13, altså en smule over de forventede 32. Tilsvarende blev vækstraten b estimeret til 0.7346, altså igen en smule over de forventede ln(2) = 0.6931. Men alt i alt peger det i den rigtige retning. Der er altså reelt kun 1 parameter, der skal estimeres i vores teoretiske model, nemlig konstanten c, som kontrollerer den vandrette forskydning af grafen. Den er til gengæld sværere at forudsige teoretisk. Vi vil derfor estimere den ud fra det konkrete eksperiment. Hvis vi fx insisterer på startværdien 1, ser vi, at vi er nødt til at sætte c = 31. Hvis vi i stedet benytter vendepunktet, ser vi at antallet af smittede elever passerer halvdelen af de tilstedeværende, dvs. 16, et sted mellem 4 og 5 runder henne. Altså er konstanten givet 2 4. 5 ved c 22. 6. Ingen af estimaterne er særligt præcise, men ved at se på graferne kan vi dog godt se, at de følger observationerne rimeligt, om end de ikke gengiver forskydningen i x-aksens retning helt præcist. x

Det ses dog klart ud fra graferne, at estimatet baseret på vendepunktet er væsentligt mere præcist end estimatet baseret på startpunktet! Da der kun er én fri parameter i vores model kan vi imidlertid nemt finde en rimelig værdi for denne. Fx kan vi udnytte at c er en konstant, men c er givet ved udtrykket: 32 1 2 x c y Listen givet ved udtrykket ( ) skal derfor med tilnærmelse være konstant. Ved indtastning i lister- og regneark-værkstedet fås da også:

Specielt inde i midten giver det rimelige værdier for c, men stadig med en betydelig variation. Vi står os derfor ved at anvende medianen median c_data 24.8888888889 dvs. i dette tilfælde 24.9: