Monte Carlo-metoder til fastlæggelse af måleusikkerhed i forbindelse med flowmåling

Relaterede dokumenter

Måleusikkerhed. FVM temadag, 1. oktober 2015, Hotel Koldingfjord

Måleusikkerhed, datahåndtering og dataanalyse i smarte systemer

Analyse af måledata II

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Produkt og marked - matematiske og statistiske metoder

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Naturstyrelsens Referencelaboratorium for Kemiske Miljømålinger NOTAT

Normalfordelingen og Stikprøvefordelinger

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Forelæsning 11: Kapitel 11: Regressionsanalyse

Løsning til eksaminen d. 14. december 2009

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Kalibrering af mikroflow med afsæt i sporbare referencer

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Estimation

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Paradigmeskifte mod robuste bygningssimuleringer

Produkt og marked - matematiske og statistiske metoder

Måleteknik best practice om løbende verificering gennem diagnosedata. John Frederiksen, Ingeniør

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Modul 7: Eksempler. 7.1 Beskrivende dataanalyse Diagrammer. Bent Jørgensen. Forskningsenheden for Statistik ST501: Science Statistik

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag)

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Måleusikkerhed. Laboratoriedag 9. juni 2011

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Konfidensintervaller og Hypotesetest

Stokastiske processer og køteori

Undervisningsbeskrivelse

Note om Monte Carlo metoden

Oversigt. Kursus Introduktion til Statistik. Forelæsning 10: Statistik ved hjælp af simulering. Per Bruun Brockhoff.

Statistiske modeller

Perspektiver i Matematik-Økonomi: Linær regression

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

Kvadratisk regression

Bilag 7. SFA-modellen

Statistik viden eller tilfældighed

Tema. Dagens tema: Indfør centrale statistiske begreber.

Normalfordelingen. Statistik og Sandsynlighedsregning 2

1 Hb SS Hb Sβ Hb SC = , (s = )

Kalibrering af mikroflow og nanoflow - udfordringer i den mikroskopiske verden. Claus Melvad

Løsning til eksaminen d. 29. maj 2009

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

2. Ved et roulettespil kan man vinde 0,10,100, 500 og 1000 kr. Sandsynligheden for gevinsterne ses af følgende skema:

Modul opbygget usikkerhedsberegning for afprøvning af VA-komponenter. Nordtest, projektnr.: Teknologisk Institut, projektnr.

To samhørende variable

Susanne Ditlevsen Institut for Matematiske Fag susanne

Preben Blæsild og Jens Ledet Jensen

Skråplan. Esben Bork Hansen Amanda Larssen Martin Sven Qvistgaard Christensen. 2. december 2008

Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning

Økonometri 1. Inferens i den lineære regressionsmodel 25. september Økonometri 1: F6 1

Oversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Fagplan for statistik, efteråret 2015

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup)

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

Simpel Lineær Regression

Multipel Lineær Regression

Transkript:

Monte Carlo-metoder til fastlæggelse af måleusikkerhed i forbindelse med flowmåling Temadag: Flow og energimåling til forsyningerne, 3. dec. 2013 Morten Karstoft Rasmussen, Kalibrering, Energi og Klima, Teknologisk Institut i Aarhus

Morten Karstoft Rasmussen Fysiker (Aarhus Universitet 2011) Faglig ansvarlig i tryklaboratoriet, sektion for kalibrering, Teknologisk Institut i Århus Begrænset praktisk erfaring med flowmåling Arbejder på tværs af kalibreringslaboratorierne Indenfor måleteknologi, herunder usikkerhedsberegning, dataopsamling, dataanalyse og kalibreringssoftware Deltagelse i forskellige F&U projekter indenfor metrologi i samarbejde med andre europæiske institutter Fx Metrologi ifm. sensornetværk Herudover deltagelse i nationale projekter indenfor energi og klima Fx projekter indenfor energilagring

Indhold Hvad er usikkerhedsberegning? Monte Carlo-metode vs. traditionel usikkerhedsberegning Hvad er fordelene ved MCM, hvordan og hvor kan den anvendes? Traditionel usikkerhedsberegning: Evaluation of measurement data Guide to the expression of uncertainty in measurement (herefter GUM) Hvad er en Monte Carlo-metode? Illustrativt eksempel på implementering af en Monte Carlo-metode Hvordan anvendes Monte Carlo-metoden til usikkerhedsberegning? Hvad giver Monte Carlo-metoden af information, og hvor nøjagtig er den? Hvorfor er traditionelle metoder ikke altid tilstrækkelige? Monte Carlo-metoden anvendt i den virkelige verden 1. Validering af usikkerhedsbudget for afvejning af 30 kg vand i en 100 kg vejetank 2. Beregning af den samlede usikkerhed på en temperaturmåling (dynamisk MCM) 3. Dynamisk flowmåling mikroflow setup (1 ml/h 6 L/h) Beregning af usikkerhed på regressions-parametre

Hvad er en Monte Carlo-metode? Anvendelig når: Der ikke eksisterer en analytisk løsning En traditionel numerisk løsningsmetode er utilstrækkelig eller vanskelig at implementere Usikkerhedsberegninger skal valideres Fremgangsmåde: 1. Opstil en model der beskriver den størrelse du vil beregne, og definer de relevante inputvariable. 2. Udtag repræsentative stikprøver fra de stokastiske variable 3. Disse stikprøver anvendes herefter sammen med modellen i den videre analyse til at opnå et numerisk estimat på den ønskede størrelse. Navnet refererer til the Monte Carlo Casino på grund af metodens analogi til roulettens stikprøveudtagning

Hvorfor er bestemmelse af usikkerheden vigtig? EnergyFlexHouse - kogepeak Er tidsforskydning signifikant? Andre eksempler: Lækage i vandrør? Er ind/ud flow signifikant forskellige? 1 minut/døgn

Usikkerhedsberegning En målestørrelse, Y, kan sjældent bestemmes direkte Men bestemmes ofte indirekte ud fra en række målinger beskrevet ved X i Modelligning, f, beskriver hvordan den relevante målestørrelse afhænger af målingerne x 1 og x 2 er estimater på hhv. X 1 og X 2 u(x 1 ) og u(x 2 ) er standardusikkerheden på inputestimaterne y er et estimatet på Y, dvs. måleresultatet med en tilhørende standardusikkerhed u(y) R M Vægt med 1g opløsning Eksempel, bestemmelse af lod-masse ved vejning kan fx beskrives således: M = A + R M: Massen af loddet der skal bestemmes A: Aflæst masseforskel R: Referenceloddets masse Estimat på A fås ved vejning: a = 10 g u a = 1 g 2 3 0.29 g Et estimat på R fås fra kalibreringscertifikat r = 100.01 g u r = 0.30 g 2 = 0.15 g Måleresultatet (estimat på M): m = a + r = 110.01 g GUM metode til beregning af usikkerhed (law of propagation) u m = u r 2 + u a 2 = 0.33 g

Usikkerhedsberegning vha. Monte Carlo-metoden Monte Carlo metoden er en computerimplementeret algoritme der beror på gentagen tilfældig stikprøveudtagning (random sampling) til at beregne resultatet Altså, generering af stokastiske (random) værdier, i stedet for analytiske beregninger MCM til beregning af usikkerhed bliver mere og mere udbredt 2 (egentlig opfundet i 1940 erne men først rigtig anvendeligt siden sidst I 80 erne) GUM og MCM er begge approximative metoder Dog er MCM er mere valid end GUM (under bestemte forudsætninger), hvilket retfærdiggør anvendelse til validering Deterministisk model (GUM): et sæt input parametre projekteres direkte over på et sæt output variable: Kombinering af sandsynlighedsfordelinger er generelt meget vanskeligt, dette er muligt med MCM (til en vilkårlig nøjagtighed afhængig af sampling-størrelse) hermed propageres mere end blot et statisisk sammendrag (ophobningsloven som beskrevet I GUM) MCM er et værdifuldt alternativ til GUM når Modelligningen er ikke-lineær i inputvariablene Målestørrelsens sandsynlighedsfordeling afviger fra en normalfordeling (eller en t-fordeling) Propagering af fordelinger (MCM): modellens egenskaber bestemmes uden statistisk bias 1 JCGM (2008). JCGM 100:2008 - Evaluation of measurement data Guide to the expression of uncertainty in measurement. 2 JCGM (2008). JCGM 101:2008 Evaluation of measurement data Propagation of distributions using a Monte Carlo method.

Eksempel: estimering af π vha. en Monte Carlo-metode Fremgangsmåde og antagelser: Kast en håndfuld riskorn ind i kvadratet til højre Sandsynligheden for at ramme et givent areal er propertionalt til størrelsen af dette areal. X 2 4 A cirkel A kvadrat = π 4 N cirkel N total π Tæl antallet af riskorn inden for kvadratet, og noter hvor mange af disse der også er inden for cirklensradius. 1. Opstil model: Y 2 = X 1 2 + X 2 2 R y X 1 og X 2 er uniform fordelte med samme bredde (R) og middelværdi (x 1, x 2 ) 2. Udtag stikprøve: Brug en computer til at udtage N stikprøver fra en bivariat uniform fordeling 3. Analyser udfaldet: X 1 Undersøg modellens fordeling (Y < R) 4 N cirkel = 4 1 = 4 (π = 3.14159) N total 1

Eksempel: estimering af π Sampling, N=10 4 N cirkel N total = 4 7 10 = 2. 80 (π = 3.14159) X 2 R < Y R y 7 3 X 1 0 R R 2 Y

Eksempel: estimering af π Sampling, N=100 4 N cirkel N total = 4 74 100 = 2. 96 (π = 3.14159) X 2 (π = 3.14159) R < Y 74 26 X 1 0 R R 2 Y

Eksempel: estimering af π Sampling, N=1000 4 N cirkel N total = 4 771 1000 = 3. 08 (π = 3.14159) X 2 R < Y 771 229 X 1 0 R R 2 Y

Eksempel: estimering af π Sampling, N=10 7 4 N cirkel N total = 4 7853864 10 7 = 3. 14154 (π = 3.14159) 2146136 R < Y 7853864 0 R R 2 Y

Eksempel: estimering af π Konklusion Generelt for MCM kan man sige at: Resultatets kvalitet øges med antallet af samples Antal stikprøver N total Så er resultatet eksakt Man får et nøjagtigt billede af måleresultatets (modellens) fordeling Antal stikprøver Fejl i % 10 1-11 10 2 8.2 500-1.5 10 3-0.43 10 4-0.089 10 5-0.041 10 6 0.0042 Y = f(x) 10 7-0.0020 Antallet af stikprøver vs. fejl i resultatet (beregning af π) Skitsering af modellens sandsynglighedsfordeling

MCM til usikkerhedsberegning Monte Carlo-metode ( ) Middelværdi, median og typetal beregnes Konfidensinterval beregnes (95 %) Hvad betyder dette? Usikkerhedsfordelingen til højre giver sandsynligheden for at finde et riskorn i et kvadrat i en given afstand fra centrum. Eksempel: sandsyndligheden for at finde et riskorn i det angivne bælte kan aflæses på histogrammet til højre Histogrammets søjlebredde er angivet som dr Middelværdi (mean) 2.5 % percentil median Typetal (mode) 97,5 % percentil 2R R r dr dr 0 r R R 2 Y Histogram angiver sandsynligheden for at finde et riskorn i et kvadrat i en given afstand fra centrum

GUM til usikkerhedsberegning GUM metoden (----) Modelligning: Y = X 1 2 + X 2 2 u c 2 y = N i=1 f x i 2 u xi 2 De partielle afledte giver: u 2 c Y = X 1 2 X 2 1 +X2 u X 2 1 + X 2 2 2 2 X 2 1 +X2 u X 2 2 I dette tilfælde gælder: X 1 = X 2 og u X 1 = u X 2 = R 3 Ekspanderet usikkerhed kan beregnes som: R U = k u c Y = 2 u X 1 = 2 = 1.15 R 3 Middelværdi (mean) 2.5 % percentil median Typetal (mode) 97,5 % percentil Sammenligning GUM vs. MCM: U MCM = 1.27 R Dvs. GUM underestimerer usikkerheden GUM angiver en sandsynlighed for Y < 0 dr 0 r R R 2 Histogram angiver sandsynligheden for at finde et riskorn i et kvadrat i en given afstand fra centrum Y

Hvorfor er der forskel på GUM og MCM metoden? Y f E Y = E f X 1, X 2 f E X 1, E X 2 Modelligningen evalueret i inputvariablernes middelværdi er generelt forskellig fra modelligningens middelværdi u c 2 y = N i=1 f x i 2 u xi 2 Linearisering af f Beregning af ændringen i y når inputestimatet x i ændrer sig med u(x i ) Hvis modelligningen er simpel dvs. inputvariablene: Er nogenlunde ukorrelerede Indgår lineært i modellen (f) x i u(x i ) u y X i Skitseret eksempel på en ikke lineær modelfunktion og dennes afvigelse fra GUM-lineariseringen (angivet med rød pil) Og hvis målestørrelsen Y er nogenlunde normalfordelt (den centrale grænseværdisætning) Så giver GUM-metoden ofte et tilstrækkelig godt estimat på usikkerheden

GUM vs. MCM Volumen, 100 kg vejetank Estimering af volumen af en nominel vandmængde på 30 kg, ved en temperatur på 80 C afvejet på en 100 kg vejecelle Model-ligning består af 30 konstanter og 15 input variable, og inddrager bl.a. korrektioner og usikkerheder forårsaget af: Omgivelsernes temperatur, luftfugtighed og barometerstand Drift og kalibreringsusikkerhed på referencelodder Vandets temperatur Vægtens aflæsningsusikkerhed, gentagelsesusikkerhed, linearitet, temperaturkoefficient, langtidsstabilitet Luftfigtighed i vejetank Beregning af usikkerhed: Gå i krig med matematikken (GUM) Anvende beregnings-software GUM Workbench Excel Eller, anvend Monte Carlo-metode Y = f(x 1, X 2, X 3, X 4,, X 15 ; C 1, C 2, C 3,, C 30 ) Vejetank til afvejning af op til 100 kg vand anvendes ifm. flowmåling

GUM vs. MCM Volumen, 30 kg vejecelle MCM parametre 10 6 samples (N = 10 6 ) per inputvariabel Alle inputvariable er samplet udfra de relevante fordelinger MCM (m 3 ) Y = 0.0309571 σ = 5.55 10-6 GUM (m 3 ) Y= 0.0309575 σ = 6.59 10-6 Konklusion GUM er 19% mere konservativ end MCM mht den beregede usikkerhed Iht. JCGM 101:2008 kan GUFmetoden altså ikke valideres Pga. modellens ulinearitet samt den statiske usikkerhed ifm. MCM er estimatet på Y en smule forskellig for de 2 metoder, forskellen er dog ikke signifikant

Dynamisk Monte Carlo-metode NI LabVIEW implementering (eksempel) Monte Carlo-metode implementeret som et sæt funktioner i et LabVIEW bibliotek, metoden kan dermed anvendes: Direkte i dataopsamlings-softwaren Til en visualisering af målestørrelsens fordeling mens man måler Til estimering af målestørrelse og tilhørende usikkerhed mens man måler u(t t ) = 2.2 C (simuleres) u(t a ) =? C (måles) Eksempel: måling af temperatur med en type K thermocouple Usikkerhed på aflæsning (bestemmes eksperimentelt) Usikkerhed pga. udsving i materialesammensætning (simuleres) angives i datablad som tolerancen Modelligning: Forsimplet skitsering af de forskellige komponenter der udgør et thermocouple målesystem Usikkerheden beregnes iht. GUM således: T = T a + T t u T = u T a 2 + u T t 2 = u T a 2 + 2.2 C 3 2 =?

Beregning af usikkerhed på regressions-parametre Lineær regression (fx polynomieregression) bygger på et velbeskrevet statistisk fundament Estimat på regressionsparametre og deres usikkerheder kan bestemmes analytisk og er alle sammen veldefinerede størrelser Ikke-lineær regression udføres vha. iterativ algoritme Dvs. der eksisterer ikke en traditionel modelligning som beskriver målestørrelsen (Y = f(x 1, X 2,, X n )) GUM kan dermed ikke anvendes her Men det kan Monte Carlo-metoden y = a 0 + a 1 x + a 2 x 2 + + a n x n Polynomisk regressionsmodel (lineær) y = a o 1 e a 1x+a 2 Exponentiel regressionsmodel (ikke lineær) Modelligningen bestemmer hvordan inputfordelingerne propagerer og tilsammen danner den resulterende sandsynlighedsfordeling.

Dynamisk flow Deming regression Implementeret i praksis for at validere estimaterne på regressionsusikkerheden ifm. en såkaldt Deming-regression Anvendes i dataopsamlingssoftwaren på vores mikroflow setup ned til 1 µl/h Q = dv = dm dt dt 1 (flow) ρ Dvs 2 regressionsparametre med tilhørende usikkerhed (hældning og offset) Usikkerhed på bestemmelse af masse, tid, og densitet MCM fremgangsmåde Måledata opsamles Hver måling af masse og tid behandles som en inputparameter X i med en tilhørende sandsynlighedsfordeling Der udtages stikprøver fra alle X i, og for hver stikprøve udføres regressionen. Regressionen giver to output variable Y 1 og Y 2 som beskriver hældning og offset og fordelingen af disse beskriver usikkerheden på disse estimater m Mindste kvadraters metode: bedste rette linie som kun tager højde for usikkerhed i m m Deming regression: bedste rette linie som tager højde for usikkerhed i både m og t t t

Flow [ml/h] u(flow) [ppm] Mass [g] Dynamisk flow Deming regression Regressionsanalyse laves mens der måles Dvs. flow og tilhørende usikkerhed beregnes dynamisk Giver fordele ift. vurdering af systemets stabilitet Sjældent nødvendigt at gentage de tidskrævende målinger, da datakvaliteten evalueres dynamisk. 10 9,5 9 8,5 8 7,5 7 6,5 6 5,5 5 Mass 0 200 400 600 800 1000 time [s] 15,08 15,06 15,04 15,02 15 14,98 14,96 14,94 14,92 14,9 Flow (Deming) ml/h U(Flow) (Deming) ppm 21,35 21,3 21,25 21,2 21,15 21,1 21,05 20,95 20,9 0 200 400 600 800 1000 time [s] 21

Konklusion MCM er mere retvisende end traditionelle metoder Anvendes til validering af usikkerhedsberegninger Er forholdsvis ligetil at implementere De anvendte statistikfunktioner er efterhånden indbygget i det meste software (fx også Excel) MCM kan anvendes på alle systemer Dvs usikkerheder kan beregnes hvor den traditionelle tilgang ikke er mulig Og hvor der ikke eksisterer en egentlig modelligning, fx sensornetværk (analyse af smart meter data)