Referencelaboratoriet for måling af emissioner til luften



Relaterede dokumenter
Referencelaboratoriet for måling af emissioner til luften Titel Præstationsprøvning 2013 Undertitel

Referencelaboratoriet for måling af emissioner til luften

1 Indledning Baggrund og formål Eksempel på problematikken (spørgsmål og svar i ref-labs svartjeneste)... 2

Referencelaboratoriet for måling af emissioner til luften

Præstationsprøvning 2006

1 Indledning Kort beskrivelse af projektet Gennemførelse Dokumentation af de nominelle værdier... 3

1 Baggrund Kort beskrivelse af projektet Gennemførelse Dokumentation af de nominelle værdier... 3

Præstationsprøvning 2010

Rapport nr.: 64. Indholdsfortegnelse

1 Indledning Kort beskrivelse af projektet Gennemførelse Dokumentation af de nominelle værdier... 3

Beregning af usikkerhed på emissionsfaktorer. Arne Oxbøl

Referencelaboratoriet for måling af emissioner til luften

Referencelaboratoriet for måling af emissioner til luften

1 Indledning Kort beskrivelse af projektet Gennemførelse Dokumentation af de nominelle værdier... 3

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Præstationsprøvning NO x, CO, O 2, H 2 O, HCl, HF, SO 2 og volumenstrøm i strømmende gas

Naturstyrelsens Referencelaboratorium for Kemiske Miljømålinger NOTAT

Naturstyrelsens Referencelaboratorium for Kemiske og Mikrobiologiske Miljømålinger NOTAT

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Test for strukturelle ændringer i investeringsadfærden

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

By- og Landskabsstyrelsens Referencelaboratorium Interferens fra chlorid ved bestemmelse af COD med analysekit

By- og Landskabsstyrelsens Referencelaboratorium for Kemiske Miljøanalyser NOTAT

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup)

Måleusikkerhed. Laboratoriedag 9. juni 2011

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Eksamen i Statistik for biokemikere. Blok

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.

Vurdering af to metoder til lugtanalyse

DAKOFA LUGT. Kasper Rovsing Olsen FORCE Technology. 21. maj 2019

Notat om metaller og beregning af skorstenshøjder for affaldsforbrændingsanlæg og kulfyrede

Styringsgruppen for Miljøstyrelsen Referencelaboratorium

RINGANALYSE FINDER GOD ANALYSESIKKERHED FOR JODTAL

Mikro-kursus i statistik 1. del Mikrokursus i biostatistik 1

Vejledende løsninger kapitel 8 opgaver

Præstationsprøvning metaller på/i filtre og væsker

1 Hb SS Hb Sβ Hb SC = , (s = )

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Besvarelser til øvelsesopgaver i uge 6

By- og Landskabsstyrelsens Referencelaboratorium. Aggressiv carbondioxid. By- og Landskabsstyrelsen. Vurdering af analysemetodens detektionsgrænse

Multiple choice opgaver

Udmøntning af principper for fastlæggelse af krav til analysekvalitet

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

NEXT IV VOC er i drikkevand

1 Indledning Formål Test af DAHS Test af DAHS ved funktionstest Test af DAHS... 4

Sammenlignende prøvning for: Oplukning og analyse af simulerede filtre fra prøvetagning for spormetaller. Prøvning gennemført: Første halvår 1998

Produkt og marked - matematiske og statistiske metoder

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

NÆRINGSINDHOLD I HVEDE OG RUG FRA EGEN BEDRIFT VARIERER KUN LIDT

Forelæsning 9: Inferens for andele (kapitel 10)

Analyse af måledata II

2 X 2 = Antal mygstik på enpersoniløbetaf1minut

Rapport. Weifa AS Måling for emission af organiske opløsningsmidler. Sagsnr Februar 2013

Miljøstyrelsens Referencelaboratorium for Kemiske Miljøanalyser NOTAT

NEXT IV VOC er i drikkevand

Supplerende PCB-målinger efter iværksættelse

Handicaprevisionen (HR) forklaret

Løsning til eksamen d.27 Maj 2010

Flambering af taphaner ved udtagning af vandprøver

2 X 2 = gennemsnitligt indhold af aktivt stof i én tablet fra et glas med 200 tabletter

DANISH METEOROLOGICAL INSTITUTE MINISTRY OF TRANSPORT TECHNICAL REPORT KLIMAGRID - DANMARK

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Mettler analysevægt 2,34 3,05 5,20 6,20 8,15 10,32 11,01 11,72 12,27 12,88 14,83 15,23 17,64

Betydning af erstatning af DS metoder med EN metoder - Bestemmelse af uklarhed (turbiditet) Miljøstyrelsens Referencelaboratorium

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136

Naturstyrelsens Referencelaboratorium for Kemiske og Mikrobiologiske Miljømålinger NOTAT

TOTALVÆRDI INDEKLIMA DOKUMENTATION

Rapport December Miljøstyrelsen. BOD 5 på lavt niveau. Evaluering af BOD 5 metoder til anvendelse på detektionsgrænseniveau i spildevand

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

Et firma tuner biler. Antallet af en bils cylindere er givet ved den stokastiske variabel X med massetæthedsfunktionen

Test nr. 4 af centrale elementer 02402

Kapitel 12 Variansanalyse

Løsning til eksaminen d. 14. december 2009

Statistisk proceskontrol

Opgaver til kapitel 3

Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

Valgkampens og valgets matematik

HANDICAPREVISIONEN (HR) FORKLARET

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test.

Projekt 1 Spørgeskemaanalyse af Bedst på Nettet

Ringanalyse for de autoriserede foderlaboratorier

Præstationsprøvning 2010

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion

Dig og din puls Lærervejleding

Appendiks 3 Beregneren - progression i de nationale matematiktest - Vejledning til brug af beregner af progression i matematik

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Bestemmelse af koncentrationen af lugt i strømmende gas

Konfidensintervaller og Hypotesetest

Kontrolvilkår for absolutfiltre. Forslag til supplement til Luftvejledningen

Ammoniak i flyveaske Vejledning til betonproducenter

NEXT IV VOC er i drikkevand

JI og CDM kreditters andele af reduktionsindsatsen i EU's klima- og energipakke i 20 % reduktionsscenariet.

Bilag 1 Costdriversammensætning

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

Referencelaboratoriet for måling af emissioner til luften Beregning af SO2 emission fra fyringsanlæg Undertitel

Statistik viden eller tilfældighed

Transkript:

Referencelaboratoriet for måling af emissioner til luften Rapport nr.: 77 Titel Hvordan skal forekomsten af outliers på lugtmålinger vurderes? Undertitel - Forfatter(e) Arne Oxbøl Arbejdet udført, år 2015 Udgivelsesdato 10. oktober 2015 Revideret, dato - Indholdsfortegnelse 1 Baggrund... 2 2 Vurdering... 2 2.1 Grubbs test... 4 2.2 Andre testmuligheder... 6 2.3 Alternativ til outliertest... 6 Miljøstyrelsens Referencelaboratorium for Måling af Emissioner til Luften FORCE Technology, Park Alle 345, 2605 Brøndby Web: www.ref-lab.dk - E-mail: info@ref-lab.dk Telefon: +45 4326 7000

1 Baggrund Flere myndigheder har tidligere indskrevet i vilkår om lugtmålinger, at spredningen mellem de fremkomne måleresultater skal være mindre end en vis størrelse. Hvis ikke den var det, skulle de højeste resultater anvendes (f.eks. to af tre resultater) uden hensyn til, om det evt. var den højeste værdi, der afveg fra de andre. Formålet har været at sikre en konservativ vurdering af lugtemissionen, så virksomheden ikke drog fordel af et evt. fejlagtigt lavt resultat. Den anvendte model er formuleret således (bl.a. i spørgsmål til Referencelaboratoriets svartjeneste nr. 775, 2008): "Hvis den geometriske spredning på et prøvesæt er <50% af den geometriske middelværdi, benyttes den geometriske middelværdi af enkeltprøverne ved OML-beregningerne. Hvis den geometriske spredning er >50 % af den geometriske middelværdi af enkeltprøverne, skal den geometriske middelværdi af de to højeste enkeltprøver benyttes ved OML-beregningerne." 2 Vurdering I svaret til spørgsmålet i afsnit 1 anbefaler Referencelaboratoriet, at lugtmålinger ikke behandles anderledes end andre målinger. Hvis der er meget stor forskel mellem resultater, er det for alle målinger god praksis at vurdere, om en afvigelse evt. kan forklares ved atypiske variationer i processen eller fejl i prøvetagning eller analyse. Der er dog i dag et ønske hos Miljøstyrelsen både om at kunne identificere evt. stærkt afvigende resultater og om at erstatte 50 % reglen med en beregningsformel for outliere. Det er målet at finde en beregningsmetode, som på enkel vis kan bruges i vurderingen af, om evt. tilsyneladende afvigere kan skyldes analysevariation eller med stor sikkerhed skyldes f.eks. fejl i prøvetagningen eller utilsigtet procesvariation. Det er ikke defineret med hvor stor sikkerhed, vurderingen ønskes. Det giver ikke mening at tale om en procentvis geometrisk spredning, og den kan ikke umiddelbart beregnes. Når resultater - som for lugt - er geometrisk normalfordelt, skal afvigelsernes størrelse beskrives ved en faktor til hver side for middelværdien og ikke ved en procentværdi. Hvis man imidlertid tolker kravet således, at forskellen mellem den geometriske middelværdi (beregnet ved 10 middel af logværdier (middel af logværdier + ) og 10 geometrisk spredning) ikke må overstige 50 %, giver det en vis mening. 10(middel af logværdier + geome- Forskellen mellem den geometriske middelværdi (beregnet ved 10 middel af logværdier ) og trisk spredning) betragtes i denne sammenhæng som et estimat af den geometriske spredning udtrykt i OU/m³. Nedenstående eksempel illustrerer beregningen. Side 2 af 7

Resultat log(resultat) OU/m³ Prøve 1 10.000 4,000 Prøve 2 11.000 4,041 Prøve 3 5.300 3,724 Geometrisk spredning 0,172 Geometrisk middel 8.354 3,922 Middel + spredning 12.424 4,094 Estimat af geometrisk spredning 4.070 Estimat i % af middel 49 (middel + spredning)/middel 1,5 Middel spredning 5.617 3,750 Estimat af geometrisk spredning 2.737 Estimat i % af middel 33 * spredningen på 0,172 er den maksimalt tilladelige spredning på n-butanol målinger, jf. DS/EN 13725 Problemet i at estimere en geometrisk spredning udtrykt i OU/m³ ses af, at estimatet for spredningen afhænger af, om man regner på middel + spredning eller middel spredning. I standarden for lugtanalyser (DS/EN 13725) kræves, at et lugtlaboratorium kan præstere gentagne målinger af referencestoffet n-butanol med en geometrisk spredning på mindre end 0,172. Det betyder netop, at den geometriske gennemsnitsværdi af alle værdier plus én gange spredningen omregnet til LE/m³ er 1,5 gange gennemsnitsværdien 1 (se eksempel ovenfor, hvor den geometriske spredning netop er 0,172 ved en afvigelse på 49%). Hvis den største værdi er mindre end gennemsnitsværdien gange 1,5 (eller den mindste værdi er større end gennemsnitsværdien divideret med 1,5) overholder målingen derfor kravene i DS/EN 13725. Der er således en god regnemæssig overensstemmelse mellem kravet og standarden, hvis standardens 0,172 er et udtryk for en accepteret usikkerhed på lugtanalyser. Spredningen på <0,172 dokumenteres ved analyser af prøver af n-butanol. Der er imidlertid intet belæg for, at spredningen på n-butanolanalyser giver et retvisende billede af spredningen på almindelige prøver. Lugten af n-butanol bliver over tid kendt for panelisterne, hvilket måske fører til en større ensartethed i deres svar og dermed en mindre spredning. Erfaringsmæssigt har de danske laboratorier en spredning, der er væsentligt lavere end 0,172. Der er således intet grundlag for at betragte det enkelte laboratoriums spredning på n-butanolprøver som retvisende for dets arbejde med andre prøver. Det vurderes derfor, at standardens 0,172 indtil videre er det bedste bud på en beskrivelse af usikkerheden i analysen. Det skitserede krav vurderes at være et skrapt krav, idet 95% af en række gentagelser af lugtanalyse af den samme prøve vil ligge i et interval, der går fra gennemsnitsværdien - 1,96 * spredningen til gennemsnitsværdien + 1,96 * spredningen. Med spredningen fra standarden (0,172) svarer det til, at intervallet målt i OU/m³ går fra gennemsnitsværdien/2,17 til gennemsnitsværdien * 2,17 2. Forholdet mellem højeste og laveste intervalgrænse er således 2,17 * 2,17 = 4,6. Hvis man begrænser sig til én gange spredningen (eller en faktor 1,5), ligger kun 67% af resultaterne i intervallet. 1 10 0,172 = 1,49 2 10 (1,96*0,172) = 2,17 Side 3 af 7

På grund af den ikke korrekte håndtering af procentvise afvigelser for den logaritmiske normalfordeling af lugtresultater ønskes en mere anerkendt testmetode. 2.1 Grubbs test Grubbs test er en velkendt test for outliers. Grubb s teststørrelse for en suspekt værdi beregnes af G p hvor X suspekt X middel s X suspekt er den formodede outlier X middel er middelværdien af samtlige resultater s er spredningen Grubbs test er beskrevet i ISO 5725-2 3, og i denne publikations tabel 5 findes de kritiske værdier for hhv. 5% konfidensniveau og 1% konfidensniveau. Hvis en teststørrelse er mindre end eller lig med 5% værdien, kan resultatet accepteres. Hvis teststørrelsen er større end 5% værdien og mindre end eller lig med 1% værdien, kaldes resultatet en straggler, som bør underkastes nærmere undersøgelse. Hvis teststørrelsen er større end 1% værdien, er resultatet en outlier og bør forkastes. Testen anvender den spredning, der kan beregnes mellem de aktuelle resultater. Spredningen skyldes bl.a. variationer i både materialet/produktionen, prøveudtagningen og analysen. Det betyder, at tilstedeværelsen af en outlier øger spredningen. Da outlieren således påvirker både tæller og nævner i ovenstående formel, bliver G p aldrig særlig stor, og konsekvensen er, at en outlier skal ligge meget langt fra de øvrige værdier for at blive betragtet som outlier. Testen kan karakteriseres som svag især for få prøver. Konkret gælder det for tre prøver, at det tilsyneladende ikke kan lade sig gøre at opnå en testværdi højere end den kritiske værdi, hvilket illustreres nedenfor for både en lav og en høj afvigende værdi. Der er foretaget flere beregningseksempler uden at opnå en testværdi højere end den kritiske værdi. 3 Accuracy (trueness and precision) of measurement methods and results Basic methods for the determination of repeatability and reproducibility of a standard measurement method Side 4 af 7

Måling Resultat Log(resultat) Måling Resultat Log(resultat) 1 10.000 4,000 1 10.000 4,000 2 11.000 4,041 2 11.000 4,041 3 100 2,000 3 200.000 5,301 4 4 Antal 3 Antal 3 Spredning, s 1,167 Spredning, s 0,739 Middel 2.224 3,347 Middel 28.020 4,447 Høj værdi Lav værdi Høj værdi Lav værdi Beregnet teststørrelse 0,595 1,1545 Beregnet teststørrelse 1,1542 0,605 Outlier Outlier 5% kritisk værdi 1,155 5% kritisk værdi 1,155 1% kritisk værdi 1,155 1% kritisk værdi 1,155 Teststørrelse nærmer sig, men når aldrig, den kritiske værdi, når det laveste resultat bliver lavere hhv. når det høje resultat bliver højere. Når det gælder en myndigheds ønske om at teste tre lugtresultater, er det oftest en præmis for undersøgelsen, at prøverne er udtaget under konstant produktion, dvs. lugten bør ikke ændres som følge af ændret produktion. Myndigheden ønsker derfor at sikre sig med en vis sandsynlighed, at prøverne er taget under de ønskede, konstante forhold og, at evt. variationer kan tilskrives variationen i analysen. Det kunne derfor foreslås at benytte Grubbs test modificeret således, at standardens krævede, maksimale spredning på 0,172 anvendes i beregningen af teststørrelsen. Beregninger med denne spredning illustreres nedenfor. Måling Resultat Log(resultat) Måling Resultat Log(resultat) 1 10.000 4,000 1 10.000 4,000 2 11.000 4,041 2 11.000 4,041 3 5.200 3,716 3 20.900 4,320 4 4 Antal 3 Antal 3 Spredning, s 0,172 Spredning, s 0,172 Middel 8.301 3,919 Middel 13.198 4,121 Høj værdi Lav værdi Høj værdi Lav værdi Beregnet teststørrelse 0,71 1,181 Beregnet teststørrelse 1,16 0,701 Outlier Ja Outlier Ja 5% kritisk værdi 1,155 5% kritisk værdi 1,155 1% kritisk værdi 1,155 1% kritisk værdi 1,155 Det ses af eksemplet, at en værdi, der er ca. halvt så stor som den højeste værdi, bliver dømt som outlier. Set i lyset af, at 95% af en serie analyseresultater af den samme prøve vil ligge i et interval fra gennemsnittet/2,17 til gennemsnittet * 2,17 (se tidligere i teksten) giver det ingen mening at forkaste 5.200 som outlier i det viste eksempel. Side 5 af 7

Grubbs test forekommer derfor ikke anvendelig, når det gælder få prøver (typisk tre ved lugtprøvninger), hverken i sin oprindelige form eller modificeret med værdien for spredning fra EN 13.725. 2.2 Andre testmuligheder Nair s test har tidligere været diskuteret og illustreret. Den er i sin grundform identisk med Grubbs test, men bruger nogle andre kritiske værdier. Således er den kritiske 5% værdi for tre prøver lig med 1,74. Det betyder, at hvis en prøve afviger mere end 1,74 gange spredningen fra middelværdien dømmes den som outlier. En prøve skal derfor i denne test afvige mere fra middelværdien for at blive dømt som outlier end i Grubbs test. Testen er mindre kendt og vil ikke blive diskuteret yderligere. Der findes en relativt simpel test for outliers, der er kendt som Dixon s test eller Q-test. Ved test af, om den mindste værdi i en serie er en outlier, beregnes teststørrelsen, Q, som æ ø (og tilsvarende for den højeste værdi). Teststørrelsen beregner således, hvor stor forskellen mellem den lille, formodede outlier og den nærmest liggende værdi er i forhold til hele måleseriens interval. Denne test lider af den samme svaghed som Grubbs test, at både tæller og nævner i formlen påvirkes i samme retning, når den mindste værdi bliver mindre. Stor spredning mellem værdierne gør det vanskeligt at udpege en outlier. Særligt i forhold til ønsket om at teste, om en tilsyneladende afvigende værdi skyldes noget andet end analyseusikkerhed, er testens anvendelighed tvivlsom. 2.3 Alternativ til outliertest Referencelaboratoriet vurderer, at vi ikke kan finde en tilstrækkeligt god outliertest, men må ty til en anden måde at vurdere en måleserie på. Som tidligere nævnt ligger 95% af resultaterne af gentagne målinger af den samme prøve inden for et interval, hvor øvre intervalgrænse/nedre intervalgrænse = 4,6 under forudsætning af, at spredningen er mindre end eller lig med 0,172. Hvis forholdet mellem højeste og laveste værdi i en måleserie er større end 4,6, er der stor sandsynlighed for, at resultaterne ikke tilhører samme (analyse)fordeling (ved antaget konstant produktion og ens prøver). Risikoen for fejlagtigt at drage denne konklusion er 5%. I Holland beskriver den hollandske lugtvejledning, NTA9065 4, at en måleserie kan betragtes som valid, hvis forholdet mellem højeste og laveste resultat i serien er mindre end 5. Det er ikke bekræftet, om denne faktor er et resultat af samme overvejelser som ovenfor, der fører til en faktor 4,55. Det er imidlertid sandsynligt. Når en måleserie skal vurderes, er der to situationer: Hensigten med målingerne er at dokumentere emissionen i en konstant driftssituation: Hvis forholdet mellem højeste og laveste værdi er større end 4,55, kan myndigheden med rimelig sikkerhed sige, at enten er der lavet en prøvetagningsfejl, eller produktion har ændret sig væsentligt. Det vil herefter være et skøn, om målingerne skal tages om, eller om én af værdierne skal bortkastes. Det gælder dog altid, at laboratoriet 4 NTA9065:2012, Air quality - Odour measurements Odour measurement and calculation, december 2013 Side 6 af 7

skal vurdere den afvigende prøve for evt. at finde de omstændigheder, der forårsager afvigelsen (fortyndingsfejl, defekt prøveemballage, regnefejl, evt. oplysninger om produktionen). Hvis hensigten med målingerne er at dokumentere en gennemsnitlig emission i en periode med varierende produktion, gælder betragtningerne om evt. afvigende værdier ikke. Side 7 af 7