The Kalman filter - and other methods
|
|
- Maria Mikkelsen
- 5 år siden
- Visninger:
Transkript
1 The Kalman filter - and other methods Anders Ringgaard Kristensen 1 Outline Filtering techniques applied to monitoring of daily gain in slaughter pigs: Introduction Basic monitoring Shewart control charts MA and EWMA techniques DLM and the Kalman filter Simple case Seasonailty Online monitoring 2 1
2 Tema: Tilvækst - kvartalsopgørelse E-kontrol, slagtesvin Kvartalsvis opgørelse af produktionsresultater Præsenteres som en tabel Der vises resultater for de sidste 4 kvartaler og totalt for året Der kan sammenlignes med forventede resultater Tilbydes af to hovedaktører: Dansk Landbrugsrådgivning, Landscentret (det viste) AgroSoft A/S Et af de vigtigste: Tilvækst 3 Tema: Tilvækst - kvartalsopgørelse Tilvækstresultater, slagtesvin Vi har: 4 kvartalsresultater 1 årsresultat 1 forventet resultat Hvordan tolker vi det? Spørgsmål 1: Hvordan fremkommer tallet? 4 2
3 Tema: Tilvækst - kvartalsopgørelse Hvordan fremkommer tallet? Grundprincippet er: Samlet vægt af leverede svin i perioden: xxxx * Samlet vægt af smågrise indsat i perioden: xxxx ** Statusvægt ved periodens afslutning: +xxxx *** Statusvægt ved periodens begyndelse: xxxx *** Total tilvækst i perioden yyyy Daglig tilvækst = (Total tilvækst)/(antal foderdage) Hvor kommer tallene fra? * Slagteri nogenlunde præcist ** Brovægt ganske præcist ***??? alt fra meget præcist til yderst usikkert 5 Tema: Tilvækst - kvartalsopgørelse Første iagttagelse: Målefejl Der er usikkerhed (fejl) på alle målingerne, men det er statusvægtene, der betyder noget. Vi opstiller en (uhyre simpel) model: t b = t s + e m, hvor: t b er den beregnede tilvækst (som den fremgår af tabellen) t s er den sande tilvækst (den vi egentlig er interesseret i) e m er målefejlen, som antages normalfordelt N(0, σm 2 ) Modellens struktur (kvalitativ viden) er selve ligningen Modellens parametre (kvantitativ viden) er værdien af σ m (spredningen på målefejlen). Den afhænger af målemetoden og må bestemmes i praksis. 6 3
4 Measurement error t s t b What we measure is t b What we wish to know is t s The difference between the two variables is undesired noise We wish to filter the noise away, i.e. we wish to estimate t s from t b 7 Tema: Tilvækst - kvartalsopgørelse Anden iagttagelse: Tilfældighed De sande tilvækstresultater, t s, varierer som følge af rene tilfældigheder. Selv om vi havde præcist de samme forhold i to på hinanden følgende kvartaler, kan vi ikke forvente samme resultat. Det kan vi kalde stikprøvefejl. Vi har, at t s = t u + e s, hvor e s er stikprøvefejlen, der udtrykker den tilfældige variation, som vi også antager er normalfordelt N(0, σ s 2) t u er det underliggende permanente sande niveau Denne yderligere kvalitative viden indbygger vi i modellens struktur: t b = t s + e m = t u + e s + e m Modellens parametre: σ s og σ m 8 4
5 Sample error and measurement error t u t s What we measure is t b What we wish to know is t u The difference between the two variables is undesired noise: Sample noise Measurement noise We wish to filter the noise away, i.e. we wish to estimate t u from t b t b 9 Tema: Tilvækst - kvartalsopgørelse Modellen i praksis, forudsætninger Modellen er en absolut forudsætning for meningsfyldt at kunne vurdere målte produktionsresultater. Spredningen på stikprøvefejlen, σ s, afhænger af hvor meget svins tilvækst varierer indbyrdes i en besætning og besætningens størrelse. Spredningen på målefejlen σ m afhænger af målemetoden for statusvejninger. For tolkningen af målte resultater, er det den samlede usikkerhed, σ, der betyder noget (σ 2 = σ m 2 + σ s 2 ) Kvalificerede gæt på σ ved forskellige målemetoder (1250 stipladser): Vejning af alle svin: σ = 3 g Stratificeret stikprøve: σ = 7g Tilfældig stikprøve: σ = 20 g Visuelt skøn: σ = 29 g 10 5
6 Different measurement methods t u t s t b t b t b t b σ =3 g σ =7 g σ =20g σ =29g 11 Tema: Tilvækst - kvartalsopgørelse Modellen i praksis: Tolkning En besætning har målt en daglig tilvækst på 750 g, hvor det forventede var 775 g. Skal vi være bekymrede? Det afhænger af målemetoden! En nedre bekymringsgrænse vil være det forventede minus 2 gange spredningen, altså 775 2σ Ved de 4 målemetoder fås følgende bekymringsgrænser : Vejning af alle svin: 775 g 2 x 3 g = 769 Stratificeret stikprøve: 775 g 2 x 7 g = 761 Tilfældig stikprøve: 775 g 2 x 20 g = 735 Visuelt skøn: 775 g 2 x 29 g =
7 Tema: Tilvækst analyse over tid Tredje iagttagelse: Forløb over tid Daglig tilvækst, slagtesvin g kvartal kvartal kvartal kvartal kvartal kvartal kvartal kvartal kvartal kvartal kvartal kvartal kvartal kvartal kvartal kvartal kvartal 01 Periode 4 års tilvækstresultater for en besætning. Er det godt eller skidt? 13 Tema: Tilvækst analyse over tid Modellering af tidsforløb Vi udbygger vores model til at inddrage tid. Til tiden n forklares det målte resultat således: t bn = t s + e mn = t u + e sn + e mn Eneste ændring er foreløbig, at vi opererer med en målt tilvækst for hvert kvartal. Vi kan beregne bekymringsgrænser for hvert kvartal og plotte det hele som kurver. t u1 t s1 t u2 t s2 t u3 t s3 t u4 t s4 t b1 t b2 t b3 t b4 14 7
8 Tema: Tilvækst analyse over tid Simpelt plot over tid, vejning af alle svin Daglig Daily gain, tilvækst, slaughter slagtesvin pigs kvartal kvartal kvartal kvartal kvartal kvartal kvartal kvartal kvartal kvartal kvartal kvartal kvartal kvartal 00 g 4. kvartal kvartal kvartal 01 Periode Observed Målt tilvækst gain Upper Øvre kontr. control grænse limit Expected Forventet Lower Nedre control kontr. Gr. limit 15 Tema: Tilvækst analyse over tid Simpelt plot over tid, visuelt skøn ved status Daglig Daily gain, tilvækst, slaughter slagtesvin pigs kvartal kvartal kvartal kvartal kvartal kvartal kvartal kvartal kvartal kvartal kvartal kvartal kvartal kvartal kvartal kvartal kvartal 01 g Periode Observed Målt tilvækst gain Upper Øvre kontr. control grænse limit Expected Forventet Lower Nedre control kontr. Gr. limit 16 8
9 Tema: Tilvækst analyse over tid Konklusion på tidsforløb Der er noget galt! Mulige forklaringer: Producenten har meget alvorlige problemer med svingende tilvækst. Modellen er forkert: Struktur vores kvalitative faglige viden Parametre den kvantitative viden (spredningen) 17 Tema: Tilvækst analyse som tidsserie Mange flere iagttagelser t bn = t u + e sn + e mn Den sande underliggende tilvækst t u i besætningen kan ændre sig over tid: Trend Sæsonvariation Stikprøvefejlen e s er muligvis autokorreleret: Midlertidige påvirkninger Målefejlen e m er helt sikkert autokorreleret: Statusvægt ultimo i kvartal n indgår direkte som statusvægt primo i kvartal n
10 Tema: Tilvækst hyppigere målinger Dynamisk e-kontrol Udviklet og beskrevet af Madsen & Ruby (2000). Principper: Undgå de arbejdskrævende statusvejninger. Beregne tilvæksten efter hver levering (d.v.s. typisk ugentligt) Benytte en simpel dynamisk lineær model til overvågningen t bn = t un + e sn + e mn = t un + v n, hvor v n N(0, σ v 2 ) t un = t u,n-1 + w n, hvor w n N(0, σ w 2 ) Filtrere resultaterne for at fjerne tilfældigt støj 19 Tema: Tilvækst hyppigere målinger Dynamisk E-kontrol, resultater Rå data til venstre filtrerede til højre Figurer fra Madsen & Ruby (2000) Stadig først resultater, når svinene er slagtet 20 10
11 The Dynamic Linear Model (DLM) Example Observation equation t bn = t un + v n, v n N(0, σ v 2 ) System equation t un = t u,n-1 + w n, w n N(0, σ w 2 ) General, first order Observation equation Y t = µ t + v t, v n N(0, σ v 2 ) System equation µ t = µ t-1 + w n, w n N(0,σ w 2 ) t u1 t u2 t u3 t u4 µ 1 µ 2 µ 3 µ 4 t s1 t s2 t s3 t s4 Y 1 Y 2 Y 3 Y 4 t b1 t b2 t b3 t b4 21 Tema: Tilvækst analyse som tidsserie Udbygning af model F n θ n er nu det sande niveau beskrevet som et vektorprodukt. Der indgår et samlet niveau + 4 årstidsparametre. Ud fra modellen kan vi beregne forventet tilvækst i næste kvartal! Så længe vi rammer præcist, forløber produktionen planmæssigt! 22 11
12 Tema: Tilvækst analyse som tidsserie Forventede og målte resultater Daglig tilvækst Blå: Målt Pink: Forventet g kvartal kvartal kvartal kvartal kvartal kvartal kvartal kvartal 00 Periode 23 Tema: Tilvækst analyse som tidsserie Analyse af fremskrivningsfejl Daglig tilvækst g kvartal kvartal kvartal kvartal kvartal kvartal kvartal kvartal 00 Periode 24 12
13 Tema: Tilvækst analyse som tidsserie Den sidste model Dynamisk lineær model Modellens struktur (kvalitativ viden): Påstand om, at der kan være sæsonvariation (derimod ingen påstand om størrelsen af denne). Påstand om, at såvel totalniveauet som sæsonvirkningerne kan ændre sig over tid. Er disse påstande fagligt korrekte? Modellens parametre: Først og fremmest de fra før kendte spredninger, men nu også systemvariansen. Modellen lærer undervejs og tilpasser sig til observationerne. Sæsonvariation kan modelleres noget mere sofistikeret, som Thomas Nejsum Madsen har demonstreret i FarmWatch 25 Tema: Tilvækst Morale Skal man analysere en besætnings tilvækst, skal man: Vide hvordan tallene fremkommer (målemetode) herunder hvad præcisionen er. Gøre sig overvejelser om, hvordan forløbet naturligt vil se ud (baseret på faglig viden). Uden faglig viden kan man nå frem til hvad som helst. Uden modeller risikerer man alvorlige fejlfortolkninger. Gennem modellens struktur lægger vi en faglig viden ned over problemet
14 Tema: Tilvækst on-line overvågning On-line overvågning af tilvækst: PigVision Innovationsprojekt ledet af Landsudvalget for Svin: Danmarks JordbrugsForskning (både Foulum & Bygholm) Firmaet Videometer (ekstern bistand) Firmaet Skov A/S KVL, IPH, Produktion & Sundhed Løbende overvågning af tilvæksten, mens svinene gror Mulighed for at reagere undervejs Mulighed for tilpasning af leveringsstrategier 27 Tema: Tilvækst on-line overvågning PigVision: Principper Der ophænges et kamera over stien. Ved bevægelse i synsfeltet, optages en serie billeder, der sendes til en computer. Computeren finder automatisk svinet på billedet (ved hjælp af en model) og beregner dets areal set fra oven. Hvis computeren ikke tror på, at billedet forestiller en gris (ud fra en model) kasseres det. Arealet omregnes til vægt (ved hjælp af en model). Ud fra mange billeder kan såvel gennemsnitsvægten som spredningen beregnes til enhver tid. Figur ved Teresia Heiskanen 28 14
15 Tema: Tilvækst on-line overvågning Hvad kan on-line vægtberegning bruges til? Overvågning af, om svinene vokser tilfredsstillende Opsamling af viden om holdets vækstevne (læring) Tilpasning af leveringsstrategi afhængigt af, Om svinene vokser hurtigt eller langsomt Om spredningen mellem de enkelte svin er stor eller lille Om der står et nyt hold smågrise og venter på pladsen Prisforholdene Konkret udmøntning af leveringer til slagteri 29 Tema: Tilvækst Beslutningstøtte vedrørende levering Beslutningsstøttemodellen Hver uge observeres middelvægt og spredning Efter hver observation opdateres estimaterne for Overordnet langsigtet vækstevne, L Midlertidig afvigelse, e(t) Vægtspredning i stien, ρ(t) Beslutninger baseres på Antal svin tilbage Estimaterne for de 3 parametre Beslutning udtrykkes som: Levér alle svin over en vis vægt Usikkerheden med hensyn til, hvad vi véd er direkte repræsenteret i modellen 30 15
16 PigVision On-line weight assessment Objectives: Optimal delivery of slaughter pigs Dynamic linear models Multi-level hierarchical Markov process Interaction with weiging equipment Illustration of results 31 On-line weight assessment Pen with n pigs is monitored. No identification of pigs. At any time t we have: The precision 1/σ 2 is assumed known 32 16
17 Objectives Given the on-line weight estimates to assign an optimal delivery policy for the pigs in the pen. Sequential (weekly) decision problem with decisions at two levels: Slaughtering of individual pigs (the price is highest in a rather narrow interval) Terminating the batch (slaughter all remaining pigs and insert a new batch of weaners) 33 Dynamic linear models 34 17
18 A dynamic linear weight model, I Known average herd specific growth curve: True weights at time t distributed as: 35 The scaling factor L In principle unknown and not directly observable Initial belief: The belief is updated each time we observe a set of live weights from the pen. Let be the true average weight Then 36 18
19 Observation & system equation 1 Full observation equation for mean: Auto-correlated sample error (system eq.): 37 Observation & system equation 2 Far more information available from the observed live weights Sample variance not normally distributed. Use the 0.16 sample quantile: The symbol ρ(t) is the standard deviation of the observed values. System equation: 38 19
20 Full equation set 39 Tema: Tilvækst Beslutningstøtte vedrørende levering Læring, langsigtet vækstevne L = 1,00 L= 0,85 1,15 1,15 1,05 1,05 0, , ,85 0,85 Sand værdi Lært værdi Sand værdi Lært værdi L = 1,07 L = 1,12 1,15 1,15 1,05 1,05 0, , ,85 0,85 Sand værdi Lært værdi Sand værdi Lært værdi 40 20
21 Tema: Tilvækst Beslutningstøtte vedrørende levering Læring, vægtspredning Spredning = 3 Spredning = Sand værdi Lært værdi Sand værdi Lært værdi 41 21
The Kalman filter - and other methods. Anders Ringgaard Kristensen
The Kalman filter - and other methods Anders Ringgaard Kristensen 1 Outline Filtering techniques applied to monitoring of daily gain in slaughter pigs: Introduction Basic monitoring Shewart control charts
Læs mereThe Kalman filter - and other methods
Outline The Kalman filter - and other methods Anders Rinaard Kristensen Filterin techniques applied to monitorin of daily ain in slauhter pis: Introduction Basic monitorin Shewart control charts MA and
Læs mereØvelser vedrørende nøgletal
Øvelser vedrørende nøgletal Tema: Husdyrproduktion 1. Ydelsesresultater. Et af de nøgletal, der optræder på nøgletalsudskriften fra Landskontoret for Kvæg, er "kg. EKM" pr. dag for de køer, der har afsluttet
Læs mereGeneralized Probit Model in Design of Dose Finding Experiments. Yuehui Wu Valerii V. Fedorov RSU, GlaxoSmithKline, US
Generalized Probit Model in Design of Dose Finding Experiments Yuehui Wu Valerii V. Fedorov RSU, GlaxoSmithKline, US Outline Motivation Generalized probit model Utility function Locally optimal designs
Læs mereBasic statistics for experimental medical researchers
Basic statistics for experimental medical researchers Sample size calculations September 15th 2016 Christian Pipper Department of public health (IFSV) Faculty of Health and Medicinal Science (SUND) E-mail:
Læs mereKursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher
Kursus 02323: Introducerende Statistik Forelæsning 12: Forsøgsplanlægning Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk
Læs mereNormalfordelingen og Stikprøvefordelinger
Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger
Læs merePRODUKTIONSOVERVÅGNING AF SLAGTESVIN
PRODUKTIONSOVERVÅGNING AF SLAGTESVIN NOTAT NR. 1606 Store afvigelser i daglig tilvækst hos slagtesvin kan vise sig som fejl i foderet. Det bør undgås med bedre styring og overvågning af foderlagrene. INSTITUTION:
Læs mereAnvendt Statistik Lektion 7. Simpel Lineær Regression
Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot
Læs mereEn Introduktion til SAS. Kapitel 5.
En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel
Læs mereMultipel Lineær Regression
Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer
Læs mere1 Regressionsproblemet 2
Indhold 1 Regressionsproblemet 2 2 Simpel lineær regression 3 2.1 Mindste kvadraters tilpasning.............................. 3 2.2 Prædiktion og residualer................................. 5 2.3 Estimation
Læs mereA multimodel data assimilation framework for hydrology
A multimodel data assimilation framework for hydrology Antoine Thiboult, François Anctil Université Laval June 27 th 2017 What is Data Assimilation? Use observations to improve simulation 2 of 8 What is
Læs mereMindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning
1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3
Læs mere3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve
Læs mereHvorfor er det lige at vi skal lære det her?
Lektion 8 Stokastiske variable En stokastisk variabel er en afbildning af udfaldsrummet ind i de reelle tal. Man benytter ofte store bogstaver som X, Y og Z til at betegne en stokastisk variabel. Ved at
Læs mereEpidemiologi og Biostatistik
Kapitel 1, Kliniske målinger Epidemiologi og Biostatistik Introduktion til skilder (varianskomponenter) måleusikkerhed sammenligning af målemetoder Mogens Erlandsen, Institut for Biostatistik Uge, torsdag
Læs mereTo samhørende variable
To samhørende variable Statistik er tal brugt som argumenter. - Leonard Louis Levinsen Antagatviharn observationspar x 1, y 1,, x n,y n. Betragt de to tilsvarende variable x og y. Hvordan måles sammenhængen
Læs mereForsøgsplanlægning Stikprøvestørrelse
Basal statistik Esben Budtz-Jørgensen 6. november 2007 Forsøgsplanlægning Stikprøvestørrelse 1 41 Planlægning af et studie Videnskabelig hypotese Endpoints Instrumentelle/eksponerings variable Variationskilder
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs merek UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test)
Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalse, ANOVA Peder Bacher DTU Compute, Dnamiske Sstemer Bgning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lngb Danmark e-mail:
Læs mereResumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se
Epidemiologi og biostatistik. Uge, torsdag 5. februar 00 Morten Frydenberg, Institut for Biostatistik. Type og type fejl Statistisk styrke Nogle speciale metoder: Normalfordelte data : t-test eksakte sikkerhedsintervaller
Læs mereIkke-parametriske tests
Ikke-parametriske tests 2 Dagens menu t testen Hvordan var det nu lige det var? Wilcoxson Mann Whitney U Kruskall Wallis Friedman Kendalls og Spearmans correlation 3 t-testen Patient Drug Placebo difference
Læs meremen nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller
Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =
Læs mereLøsning til eksaminen d. 14. december 2009
DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs mereLinear Programming ١ C H A P T E R 2
Linear Programming ١ C H A P T E R 2 Problem Formulation Problem formulation or modeling is the process of translating a verbal statement of a problem into a mathematical statement. The Guidelines of formulation
Læs mereKonfidensintervaller og Hypotesetest
Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller
Læs mereForelæsning 11: Envejs variansanalyse, ANOVA
Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalyse, ANOVA Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark
Læs mereEstimation og usikkerhed
Estimation og usikkerhed = estimat af en eller anden ukendt størrelse, τ. ypiske ukendte størrelser Sandsynligheder eoretisk middelværdi eoretisk varians Parametre i statistiske modeller 1 Krav til gode
Læs mereStatistik for MPH: 7
Statistik for MPH: 7 3. november 2011 www.biostat.ku.dk/~pka/mph11 Attributable risk, bestemmelse af stikprøvestørrelse (Silva: 333-365, 381-383) Per Kragh Andersen 1 Fra den 6. uges statistikundervisning:
Læs mereSkriftlig Eksamen Kombinatorik, Sandsynlighed og Randomiserede Algoritmer (DM528)
Skriftlig Eksamen Kombinatorik, Sandsynlighed og Randomiserede Algoritmer (DM58) Institut for Matematik og Datalogi Syddansk Universitet, Odense Torsdag den 1. januar 01 kl. 9 13 Alle sædvanlige hjælpemidler
Læs mereReeksamen i Statistik for Biokemikere 6. april 2009
Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for Biokemikere 6. april 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet er på
Læs mere1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ
Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen
Læs mereEksamen Bacheloruddannelsen i Medicin med industriel specialisering
Eksamen 2016 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 17-02-2015 Tid: kl. 09.00-11.00 Bedømmelsesform
Læs merePostoperative komplikationer
Løsninger til øvelser i kategoriske data, oktober 2008 1 Postoperative komplikationer Udgangspunktet for vurdering af den ny metode må være en nulhypotese om at der er samme komplikationshyppighed, 20%.
Læs mereOpgaver til kapitel 3
Opgaver til kapitel 3 3.1 En løber er interesseret i at undersøge om hendes løbeur er kalibreret korrekt. Hun udmåler derfor en strækning på præcis 1000 m og løber den 16 gange. For hver løbetur noterer
Læs mereEksamen i Statistik for Biokemikere, Blok januar 2009
Københavns Universitet Det Naturvidenskabelige Fakultet Eksamen i Statistik for Biokemikere, Blok 2 2008 09 19. januar 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet
Læs mere28 April 2003 Retrospective: Semicore Visit
28 April 2003 Retrospective: Semicore Visit What is highest growth Industry? Rebuild versus remanufacture Importance of Documentation, blueprinting, spares What are barriers to high uptime? Review Homeworks
Læs mereRegressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer.
Regressionsanalyser Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer. Hvilke faglige problemer kan man løse vha. regressionsanalyser? 1 Regressionsanalyser Det primære problem
Læs mereDoodleBUGS (Hands-on)
DoodleBUGS (Hands-on) Simple example: Program: bino_ave_sim_doodle.odc A simulation example Generate a sample from F=(r1+r2)/2 where r1~bin(0.5,200) and r2~bin(0.25,100) Note that E(F)=(100+25)/2=62.5
Læs mereStatistik for MPH: oktober Attributable risk, bestemmelse af stikprøvestørrelse (Silva: , )
Statistik for MPH: 7 29. oktober 2015 www.biostat.ku.dk/~pka/mph15 Attributable risk, bestemmelse af stikprøvestørrelse (Silva: 333-365, 381-383) Per Kragh Andersen 1 Fra den 6. uges statistikundervisning:
Læs mereProgram. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18
Program 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Fordeling af X Stikprøve X 1,X 2,...,X n stokastisk X stokastisk. Ex (normalfordelt stikprøve)
Læs mereSandsynlighedsfordelinger for kontinuerte data på interval/ratioskala
3 5% 5% 5% 0 3 4 5 6 7 8 9 0 Statistik for biologer 005-6, modul 5: Normalfordelingen opstår når mange forskellige faktorer uafhængigt af hinanden bidrager med additiv variation til. F.eks. Højde af rekrutter
Læs mereBilag 7. SFA-modellen
Bilag 7 SFA-modellen November 2016 Bilag 7 Konkurrence- og Forbrugerstyrelsen Forsyningssekretariatet Carl Jacobsens Vej 35 2500 Valby Tlf.: +45 41 71 50 00 E-mail: kfst@kfst.dk Online ISBN 978-87-7029-650-2
Læs mereProgram: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19
Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større
Læs mereLog-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres.
Log-lineære modeller Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres. Kontingenstabel Contingency: mulighed/tilfælde Kontingenstabel: antal observationer (frekvenser)
Læs mereIndhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9
Indhold 1 Ensidet variansanalyse 2 1.1 Estimation af middelværdier............................... 3 1.2 Estimation af standardafvigelse............................. 3 1.3 F-test for ens middelværdier...............................
Læs mereOverlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.
Overlevelse efter AMI Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Diabetes VF (Venticular fibrillation) WMI (Wall motion index) CHF (Cardiac Heart Failure) Køn og alder betragtes
Læs meregrupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
Læs mereI dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd
I dag Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik SaSt) Helle Sørensen Først lidt om de sidste uger af SaSt. Derefter statistisk analyse af en enkelt
Læs mereModellering af stoftransport med GMS MT3DMS
Modellering af stoftransport med GMS MT3DMS Formål Formålet med modellering af stoftransport i GMS MT3DMS er, at undersøge modellens evne til at beskrive den målte stoftransport gennem sandkassen ved anvendelse
Læs mereEnsidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese
Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet
Læs mereMikro-kursus i statistik 1. del. 24-11-2002 Mikrokursus i biostatistik 1
Mikro-kursus i statistik 1. del 24-11-2002 Mikrokursus i biostatistik 1 Hvad er statistik? Det systematiske studium af tilfældighedernes spil!dyrkes af biostatistikere Anvendes som redskab til vurdering
Læs mereHeuristics for Improving
Heuristics for Improving Model Learning Based Testing Muhammad Naeem Irfan VASCO-LIG LIG, Computer Science Lab, Grenoble Universities, 38402 Saint Martin d Hères France Introduction Component Based Software
Læs mereAnalysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17
nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse
Læs mereRestsaltmængdernes afhængighed af trafikken,
Restsaltmængdernes afhængighed af trafikken, Thomas Glue, marts 2. Trafikintensitet...2 Indledende definitioner...2 Regressionsanalyser på trafikintensiteten...6 Justering af restsaltmængder i henhold
Læs mereLøsning til eksaminen d. 29. maj 2009
DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Læs mereStatistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge
Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Estimation
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Estimation Eksempel: Bissau data Data kommer fra Guinea-Bissau i Vestafrika: 5273 børn blev undersøgt da de var yngre end 7 mdr og blev herefter
Læs mereq-værdien som skal sammenlignes med den kritiske Chi-i-Anden værdi p-værdien som skal sammenlignes med signifikansniveauet.
Introduktion: Chi-i-Anden test (Goodness of Fit) på computeren fungerer som en "black-boks"- kommando, hvor eleverne med udgangspunkt i en nulhypotese (H ) taster de forventede og de observerede talværdier
Læs mereKursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte
Læs mereGenerelle lineære modeller
Generelle lineære modeller Regressionsmodeller med én uafhængig intervalskala variabel: Y en eller flere uafhængige variable: X 1,..,X k Den betingede fordeling af Y givet X 1,..,X k antages at være normal
Læs mereNaturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1
Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen
Læs mere1 Hb SS Hb Sβ Hb SC = , (s = )
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.
Læs mereMuligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling.
Eksempel: dæktyper og brændstofforbrug (opgave 25 side 319) Program: cars 1 2 3 4 5... radial 4.2 4.7 6.6 7.0 6.7... belt 4.1 4.9 6.2 6.9 6.8... Muligheder: 1. vi starter med at gennemgå opgave 7 side
Læs mereInstitut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6
Institut for Matematiske Fag Matematisk Modellering 1 Aarhus Universitet Eva B. Vedel Jensen 25. februar 2008 UGESEDDEL 6 Forelæsningerne torsdag den 21. februar og tirsdag den 26. februar. Jeg har gennemgået
Læs mere(studienummer) (underskrift) (bord nr)
Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 14. december 2009 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)
Læs mereNews from the barn. by Nikolaj Stidsen and Michael Frederiksen. midtjysk svinerådgivning - vi flytter viden
News from the barn. by Nikolaj Stidsen and Michael Frederiksen Disposition The feed intake influence on farrowingrate and littersize Do I use to much sow food Polt feeding compared to age Number of born
Læs mereNormalfordelingen. Statistik og Sandsynlighedsregning 2
Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på
Læs mereEksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet
Eksamen ved Københavns Universitet i Kvantitative forskningsmetoder Det Samfundsvidenskabelige Fakultet 14. december 2011 Eksamensnummer: 5 14. december 2011 Side 1 af 6 1) Af boxplottet kan man aflæse,
Læs mereKursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S
Kursus i varians- og regressionsanalyse Data med detektionsgrænse Birthe Lykke Thomsen H. Lundbeck A/S 1 Data med detektionsgrænse Venstrecensurering: Baggrundsstøj eller begrænsning i måleudstyrets følsomhed
Læs mereRepetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable
Normal fordelingen Normal fordelingen Egenskaber ved normalfordelingen Standard normal fordelingen Find sandsynligheder ud fra tabel Transformation af normal fordelte variable Invers transformation Repetition
Læs meret-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.
t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program (8.15-10): 1. repetition: fordeling af observatorer X, S 2 og t. 2. konfidens-intervaller, hypotese test, type I og type II fejl, styrke,
Læs mereLineær regression. Simpel regression. Model. ofte bruges følgende notation:
Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til
Læs mereBinomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/
Program: 1. Repetition af vigtige sandsynlighedsfordelinger: binomial, (Poisson,) normal (og χ 2 ). 2. Populationer og stikprøver 3. Opsummering af data vha. deskriptive størrelser og grafer. 1/29 Binomial
Læs mereI dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)
I dag Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt) Helle Sørensen Repetition vha eksempel om dagligvarepriser Analyse med R: ttest
Læs mereEN Requirements for measurement sections and sites and for the measurement objective, plan and report. EN 15259:2007. Martin R.
EN 15259 Requirements for measurement sections and sites and for the measurement objective, plan and report. Martin R. Angelo EN15259 AF 2010 05 1 Indhold Standarden er primært for måleinstitutter, der
Læs mereTrængselsopgørelse Københavns Kommune 2013
Downloaded from orbit.dtu.dk on: Dec 21, 2017 Trængselsopgørelse Københavns Kommune 2013 Rasmussen, Thomas Kjær; Aabrink, Morten; Nielsen, Otto Anker Publication date: 2014 Document Version Publisher's
Læs mereNaturvidenskabelig metode
Naturvidenskabelig metode Introduktion til naturvidenskab Naturvidenskab er en betegnelse for de videnskaber der studerer naturen gennem observationer. Blandt sådanne videnskaber kan nævnes astronomi,
Læs mereRapport 23. november 2018
Rapport 23. november 2018 Proj.nr. 2004280 Version 1 EVO/MT Principper for og forslag til repræsentative stikprøveplaner til analyse af konsekvensen af produktionsændringer for værdi- og kvalitetsvurdering
Læs mere1. februar Lungefunktions data fra tirsdags Gennemsnit l/min
Epidemiologi og biostatistik Uge, torsdag 3. februar 005 Morten Frydenberg, Afdeling for Biostatistik. og hoste estimation sikkerhedsintervaller antagelr Normalfordelingen Prædiktion Statistisk test (ud
Læs mereEpidemiologi og Biostatistik
Epidemiologi og Biostatistik Kliniske målinger (Kapitel. +.1 + 11.-11 + 1.1-) Introduktion til skilder (varianskomponenter) måleusikkerhed sammenligning af målemetoder Mogens Erlandsen, Institut for Biostatistik
Læs mereBILAG 3: UDKAST TIL FREKVENSTILLADELSE
BILAG 3: UDKAST TIL FREKVENSTILLADELSE Foreløbigt udkast til frekvenstilladelse til en DAB-blok 1 senderettighed Kontor/afdeling Center for Tele Dato Kundenummer: Tilladelse [tilladelsesnummer] til anvendelse
Læs mere5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14
Module 5: Exercises 5.1 ph i blod.......................... 1 5.2 Medikamenters effektivitet............... 2 5.3 Reaktionstid........................ 3 5.4 Alkohol i blodet...................... 3 5.5
Læs mereCLASS temp medie; MODEL rate=temp medie/solution; RUN;
Ugeopgave 2.1 Bakterieprøver fra patienter transporteres ofte til laboratoriet ved stuetemperatur samt mere eller mindre udsat for luftens ilt. Dette er især uheldigt for prøver som indeholder anaerobe
Læs mereBenchmarking i svineproduktionen
Benchmarking i svineproduktionen Thomas Algot Søllested Dansk Landbrugsrådgivning Landscentret, Svin Hvem er jeg? Uddannet Agronom i 2001 Speciale i Advanced Herd Management Forskningsassistent, IHH, KVL
Læs mereMettler analysevægt 2,34 3,05 5,20 6,20 8,15 10,32 11,01 11,72 12,27 12,88 14,83 15,23 17,64
Opgave 1 (s1 opgave 38) To forskellige laboratorievægte ønskes sammenlignet. Man afvejer derfor en række prøver på begge vægte med følgende resultater (alle i gram): Sartorius analysevægt 2,36 3,05 5,19
Læs mereNoter til kursusgang 8, IMAT og IMATØ
Noter til kursusgang 8, IMAT og IMATØ matematik og matematik-økonomi studierne 1. basissemester Esben Høg 25. oktober 2013 Institut for Matematiske Fag Aalborg Universitet Esben Høg Noter til kursusgang
Læs mereTest for strukturelle ændringer i investeringsadfærden
d. 6.10.2016 De Økonomiske Råds Sekretariat Test for strukturelle ændringer i investeringsadfærden Dette notat redegør for de stabilitetstest af forskellige tidsserier vedrørende investeringsadfærden i
Læs mereNotat vedrørende projektet EFP06 Lavfrekvent støj fra store vindmøller Kvantificering af støjen og vurdering af genevirkningen
Notat vedrørende projektet EFP6 Lavfrekvent støj fra store vindmøller Kvantificering af støjen og vurdering af genevirkningen Baggrund Et af projektets grundelementer er, at der skal foretages en subjektiv
Læs mereOversigt. 1 Motiverende eksempel: Højde-vægt. 2 Lineær regressionsmodel. 3 Mindste kvadraters metode (least squares)
Kursus 02402/02323 Introducerende Statistik Forelæsning 8: Simpel lineær regression Oversigt Motiverende eksempel: Højde-vægt 2 Lineær regressionsmodel 3 Mindste kvadraters metode (least squares) Klaus
Læs mereKursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte
Læs mereMultivariate Extremes and Dependence in Elliptical Distributions
Multivariate Extremes and Dependence in Elliptical Distributions Filip Lindskog, RiskLab, ETH Zürich joint work with Henrik Hult, KTH Stockholm I II III IV V Motivation Elliptical distributions A class
Læs mereLogistisk regression. Statistik Kandidatuddannelsen i Folkesundhedsvidenskab
Logistis regression Statisti Kandidatuddannelsen i Folesundhedsvidensab Multipel logistis regression Antagelser: Binære observationer (Y i, i=,.,n) f.es Ja/Nej Høj/Lav Død/Levende Kodet: / 0 Y i uafhængige
Læs mere3. SPSS Output. Descriptives. [DataSet1] C:\Users\Thomas\Desktop\Eservice_i_produktgruppen_Bekldning.sav
3. SPSS Output DESCRIPTIVES VARIABLES=DEM DEM5 DEM10 DEM11 /STATISTICS=MEAN STDDEV MIN MAX. Descriptives [DataSet1] C:\Users\Thomas\Desktop\Eservice_i_produktgruppen_Bekldning.sav Descriptive Statistics
Læs mereProgram: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.
Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. 1/23 Opsummering af fordelinger X 1. Kendt σ: Z = X µ σ/ n N(0,1)
Læs mereForelæsning 4: Konfidensinterval for middelværdi (og spredning)
Introduktion til Statistik Forelæsning 4: Konfidensinterval for middelværdi (og spredning) Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark
Læs mereLøsning eksamen d. 15. december 2008
Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Læs mereAnvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af
Læs mere