Udvikling af en metode til effektvurdering af Miljøstyrelsens Kemikalieinspektions tilsyn og kontrol

Relaterede dokumenter

Lineær regressionsanalyse8

Beregning af strukturel arbejdsstyrke

Binomialfordelingen. Erik Vestergaard

Binomialfordelingen: april 09 GJ

Fagblok 4b: Regnskab og finansiering 2. del Hjemmeopgave kl til kl

Prøveeksamen Indtjening, konkurrencesituation og produktudvikling i danske virksomheder Kommenteret vejledende besvarelse

Note til Generel Ligevægt

Indtjening, konkurrencesituation og produktudvikling i danske virksomheder

Økonometri 1. Heteroskedasticitet 27. oktober Økonometri 1: F12 1

Sandsynlighedsregning og statistik med binomialfordelingen

Tabsberegninger i Elsam-sagen

TALTEORI Følger og den kinesiske restklassesætning.

Kvantitative metoder 2

Bilag 6: Økonometriske

Erhvervsstyrelsen og Ernst & Young. 26. februar 2014

Landbrugets efterspørgsel efter Kunstgødning. Angelo Andersen

Statistik II Lektion 5 Modelkontrol. Modelkontrol Modelsøgning Større eksempel

Opsamling. Simpel/Multipel Lineær Regression Logistisk Regression Ikke-parametriske Metoder Chi-i-anden Test

Nøglebegreber: Objektivfunktion, vægtning af residualer, optimeringsalgoritmer, parameterusikkerhed og korrelation, vurdering af kalibreringsresultat.

Forberedelse til den obligatoriske selvvalgte opgave

Økonometri 1. Lineær sandsynlighedsmodel. Hvad nu hvis den afhængige variabel er en kvalitativ variabel (med to kategorier)?

PRODUKTIONSEFFEKTEN AF AVL FOR HANLIG FERTILITET I DUROC

6. SEMESTER Epidemiologi og Biostatistik Opgaver til 3. uge, fredag

10. Usikkerhed og fejlsøgning

Kreditrisiko efter IRBmetoden

Økonometri 1. Test for heteroskedasticitet. Test for heteroskedasticitet. Dagens program. Heteroskedasticitet 26. oktober 2005

FTF dokumentation nr Viden i praksis. Hovedorganisation for offentligt og privat ansatte

FOLKEMØDE-ARRANGØR SÅDAN!

Kvantitative metoder 2 Forår 2007 Ugeseddel 9

Vægtet model. Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl. Vægte. Vægte: Eksempel. Definition: Vægtrelationen

Vestbyskolen Tlf.: Fax:

Økonometri 1 Efterår 2006 Ugeseddel 9

Fastlæggelse af strukturel arbejdsstyrke

HVIS FOLK OMKRING DIG IKKE VIL LYTTE, SÅ KNÆL FOR DEM OG BED OM TILGIVELSE, THI SKYLDEN ER DIN. Fjordor Dostojevskij

Europaudvalget EUU alm. del Bilag 365 Offentligt

Handlingsplan om bedre overvågning af biologiske lægemidler, biosimilære lægemidler og vacciner

Kvantitative metoder 2

Kvantitative metoder 2

Kvantitative metoder 2

DLU med CES-nytte. Resumé:

Nim Skole og Børnehus

SERVICE BLUEPRINTS KY selvbetjening 2013

Husholdningsbudgetberegner

Bilag 1: Projektbeskrivelse

Handleplan for Myndighed (Handicap og Socialpsykiatri)

Statistik Lektion 15 Mere Lineær Regression. Modelkontrol Prædiktion Multipel Lineære Regression

EKSAMEN I MATEMATIK-STATISTIK, 27. JANUAR 2006, KL 9-13

Ugeseddel 8. Gruppearbejde:

Statistisk mekanik 13 Side 1 af 9 Faseomdannelse. Faseligevægt

Aftale om generelle vilkår for tillidsrepræsentanter -^ i Magistratsafdelingen for Sundhed og Omsorg

Validering og test af stokastisk trafikmodel

Luftfartens vilkår i Skandinavien

BLÅ MEMOSERIE. Memo nr Marts Optimal adgangsregulering til de videregående uddannelser og elevers valg af fag i gymnasiet.

Kulturel spørgeguide. Psykiatrisk Center København. Dansk bearbejdelse ved Marianne Østerskov. Januar udgave. Kulturel spørgeguide Jan.

Inertimoment for arealer

Salg af kirkegrunden ved Vejleå Kirke - opførelse af seniorboliger. hovedprincipper for et salg af kirkegrunden, som vi drøftede på voii møde.

Miljø- og Fødevareudvalget MOF Alm.del Bilag 16 Offentligt

Antag X 1,..., X n stokastiske variable med fælles middelværdi µ og varians σ 2. Hvis µ er ukendt estimeres σ 2 ved 1/36.

Almindelige bemærkninger

Kvantitative metoder 2 Forår 2007 Ugeseddel 10

Økonometri 1 Efterår 2006 Ugeseddel 13

G Skriverens Kryptologi

Forberedelse INSTALLATION INFORMATION

Anvendt Statistik Lektion 10. Regression med både kvantitative og kvalitative forklarende variable Modelsøgning Modelkontrol

Støbning af plade. Køreplan Matematik 1 - FORÅR 2005

Vejledning om kontrol med krydsoverensstemmelse 2007

Udviklingen i de kommunale udligningsordninger

Rettevejledning til Økonomisk Kandidateksamen 2007I, Økonometri 1

Samarbejdet mellem jobcentre og a-kasser inden for FTFområdet

Måleusikkerhed i kalibrering Nr. : AB 11 Dato : Side : 1/3

TO-BE BRUGERREJSE // Personligt tillæg

NOTAT:Benchmarking: Roskilde Kommunes serviceudgifter i regnskab 2014

Morten Frydenberg Biostatistik version dato:

Morten Frydenberg Biostatistik version dato:

Regressionsanalyse. Epidemiologi og Biostatistik. 1.Simpel lineær regression (Kapitel 11) systolisk blodtryk og alder

Fysik 3. Indhold. 1. Sandsynlighedsteori

Skemaet integreres i brugerfladen i monitoreringen i Rambøll Results og udfyldes af projektlederen.

Erhvervs- og Selskabsstyrelsen:

Indledning ELEVPLAN FOR [NAVN] CPR [ ]

Anvendt Statistik Lektion 10. Regression med både kvantitative og kvalitative forklarende variable Modelkontrol

Statistik II Lektion 4 Generelle Lineære Modeller. Simpel Lineær Regression Multipel Lineær Regression Flersidet Variansanalyse (ANOVA)

NOTAT: Benchmarking: Roskilde Kommunes serviceudgifter i regnskab 2013

Erhvervs- og Selskabsstyrelsen:

Statikstik II 3. Lektion. Multipel Logistisk regression Generelle Lineære Modeller

Stadig ligeløn blandt dimittender

Evaluering af vedligehold af 3-registreringen

Statistik II Lektion 5 Modelkontrol. Modelkontrol Modelsøgning Større eksempel

TO-BE BRUGERREJSE // Tænder

Fra små sjove opgaver til åbne opgaver med stor dybde

Statikstik II 4. Lektion. Generelle Lineære Modeller

Scorer FCK "for mange" mål i det sidste kvarter?

Notat om porteføljemodeller

Økonometri 1. Avancerede Paneldata Metoder II Introduktion til Instrumentvariabler 27. november 2006

KOMMISSIONENS DELEGEREDE FORORDNING (EU) / af

DCI Nordsjælland Helsingrsgade SiR 3400 Hillerød Telefon Fax

½ års evaluering af projekt Praktisk Pædagogisk Funktionsstøtte

Pas på dig selv, mand

Medarbejderhåndbog. Velkommen som medarbejder i SIKA Rengøring A/S

Organisationsmanual. Organisationen bag SIKA Rengøring A/S

Brugerhåndbog. Del IX. Formodel til beregning af udlandsskøn

Transkript:

Udvklng af en metode tl effektvurderng af Mljøstyrelsens Kemkalenspektons tlsyn og kontrol Orenterng fra Mljøstyrelsen Nr. 10 2010

Indhold 1 FORORD 5 2 EXECUTIVE SUMMARY 7 3 INDLEDNING 11 3.1 AFGRÆNSNING 11 3.2 VURDERING AF NUVÆRENDE TILGANG 11 3.3 DATAANALYSE 13 4 PROCESBESKRIVELSE AF STATISTISK METODE 15 5 MÅLRETNING AF TILSYN OG KONTROL 17 5.1 SEGMENTERING 17 5.2 UDVÆLGELSESKRITERIER 18 5.3 IMPLEMENTERING 18 6 STIKPRØVEMETODIK 21 6.1 ESTIMERING AF ANDELE MED 95 % KONFIDENS 21 6.2 STRATIFIKATION 23 7 ESTIMAT FOR DET SAMLEDE ANTAL PRODUKTER 25 8 STATISTISK MODEL 27 8.1 GENERELT 27 8.2 SIMPEL MODEL 28 8.3 MODEL MED STRATIFIKATION 30 8.4 STIKPRØVESTØRRELSE I MODEL MED STRATIFIKATION 30 8.5 ANALYSE AF STIKPRØVE 31 8.6 STATISTISK KONKLUSION 32 8.7 SAMLET FREMGANGSMÅDE 32 8.8 EXCEL-VÆRKTØJ 34 9 OMKOSTNINGER VED IMPLEMENTERING AF NYT FRAMEWORK 37 10 KONKLUSION OG ANBEFALINGER 39 11 DEFINITIONER 41 12 APPENDIKS 43 12.1 MATERIALE MODTAGET FRA MST 43 12.2 KONTAKTPERSONER I MST 43 12.3 UDLEDNING AF FEJLLEDDET 43 12.4 STIKPRØVESTØRRELSER FOR HYPOTESETEST 44 12.5 UDLEDNING AF DEN STATISTISKE MODEL 45 3

4

1 Forord Projektet med ttlen Udvklng af en metode tl effektvurderng af Mljøstyrelsens Kemkalenspektons tlsyn og kontrol er gennemført af PrcewaterhouseCoopers (PwC) på opdrag fra Mljøstyrelsen (MST) peroden oktober 2008 tl aprl 2009. Det har været projektets overordnede formål at udvkle en stabl, robust og gennemskuelg metode tl at opgøre effekten af Kemkalenspektonens tlsyn og kontrol. MST har sammenfattet projektets formål følgende hovedpunkter: 1) Analyse af den nuværende metodk for tlsyn og kontrol med henblk på vdereudvklng af tlgangen og mplementerngen af en statstsk metode. 2) Dokumentaton af en statstsk metode, der kan opgøre antallet af ulovlge produkter på det danske marked, baseret på a. et estmat for det samlede antal forbrugerprodukter b. en metodk for udtagelse af stkprøver og vurderng af antallet af prøver, der kke overholder gældende regler. 3) Oplæg tl samlet framework for stkprøvemetodk, datandsamlng, effektberegnng og rapporterng, herunder vurderng af omkostnnger og rsc. En følgegruppe bestående af repræsentanter fra MST og PwC har haft tl opgave at vurdere projektets planlægnng, forløb og resultater. Rapporten er udarbejdet af PwC på baggrund af møder med MST s Kemkalenspekton og udleveret materale. Projektet blev færdggjort med afleverngen af denne rapport 14. aprl 2009. Efterfølgende har PwC redgeret afsnttet executve summary på baggrund af nput fra MST. Denne endelge udgave forelå 10. jul 2009. 5

6

2 Executve summary Det har været projektets overordnede formål at udvkle en stabl, robust og gennemskuelg metode tl at opgøre effekten af Kemkalenspektonens tlsyn og kontrol. Der fndes kke på nuværende tdspunkt en struktureret metode for opsamlng af data. Der fndes dog megen nformaton gemt rapporter, årsberetnnger og kortlægnnger, som vl kunne bruges en statstsk model. For fremtdg datandsamlng foreslås det, at der oprettes en database, hvor al relevant nformaton samles på et sted struktureret form. Der fndes på nuværende tdspunkt kke en konsstent proces tl at vurdere antallet af ulovlge produkter på baggrund af et estmat for det totale antal produkter. Der vl nogle tlfælde af mplementerng af en model være behov for ndsamlng af data, specelt omkrng det totale antal produkter. Nedenstående fgur llustrerer de ndvduelle elementer en fremtdg samlet løsnng: Udvælgelse Datandsamlng Modellerng Rapporterng Segmenterng Stkprøveanalyse Ulovlge produkter pr. segment Effekt Rangordnng af segmenter Antal produkter alt Grupperng af nformaton Ulovlge produkter pr. segment Estmerng Overordnet Formålet med formulerngen af en statstsk model er at kunne beskrve det samlede antal ulovlge produkter ud fra: Et estmat for det samlede antal produkter på markedet Antallet af ulovlge produkter fundet ved stkprøve. En stabl model kræver ensartede og konsstente processer omkrng datandsamlng og modellerng. I forhold tl ndsamlngen af nformaton foreslås det, at der oprettes en database med nformaton omkrng de enkelte segmenter for at kunne opbygge et landkort over markedet. I første omgang vl fokus være på en segmenterng af markedet. Fremadrettet skal der opsamles nformaton om antallet af ulovlge produkter (er dog også en mulg segmenterngsvarabel) og totale antal produkter. 7

Der fndes dag nformaton fra allerede gennemførte kampagner, som dog skal struktureres. Der fndes mange mulgheder for ndhentnng af nformaton, som allerede er brugt hos MST dag. Der kan eventuelt suppleres med nye dataklder enten form af andre dataudbydere, spørgeskemaundersøgelser faclteret af MST eller drekte spørgsmål tl vrksomhederne under kampagnerne. Specelt for det samlede antal produkter skal der lægges ressourcer, da der kke fndes en ndsamlngsproces dag. På kort sgt kan mplementerngen af den statstske model underbygge og dokumentere den nuværende tlgang tl udtagnng og analyse af stkprøver. På ldt længere sgt kan udvklngen af en metode, hvor der er sammenhæng mellem omkostnnger og dverse beslutnngsvarable, fx hvlke områder skal udvælges tl kampagner? Hvor mange stkprøver skal udtages hver kampagne? Hvlket statstsk konfdensnveau skal anvendes? Hvor mange kampagner kan/skal gennemføres årlgt? Det er rapportens vurderng, at en model, der både nddrager datandsamlng, stkprøveudtagelse, statstsk analyse og omkostnnger tl dsse, kan skabe et robust grundlag for prorternger. Idet estmerngen af de totale antal produkter kke har været en naturlg del af arbejdet med tlsyn og kontrol dag, vl det være her, hvor den største forandrng og ndsats skal lægges forhold tl ndsamlng af nformaton tl modellen. Det er vgtgt, at man fra starten får udformet en metode, som er konsstent for kke at øge uskkerheden af estmaterne for det totale antal ulovlge produkter. Ved gennemførelse af kontrol vl det være nødvendgt, at MST forbndelse med planlægnng af stkprøvekontroller fastlægger, med hvlken procent konfdenskontroller skal udmøntes. Det vl sge, med hvor stor skkerhed er resultatet af kontrollen vald. For at operatonalsere arbejdet med stkprøver kan det endvdere anbefales, at de udvalgte populatoner stratfceres og opdeles homogene grupper. Der er en tæt sammenhæng mellem det statstske konfdensnveau, stkprøvestørrelsen og udfaldsrummet af ulovlge produkter. Det er således kke mulgt soleret at forudbestemme eller generelt fastlægge en fornuftg stkprøvestørrelse, det denne både afhænger af det valgte konfdensnveau og den ønskede præcson af udfaldsrummet, dvs. hvor stort et nterval, der accepteres. Det er PwC s umddelbare vurderng, at der bør anvendes et konfdensnveau på mndst 80 %. Gvet et konfdensnveau, et estmat for det samlede antal produkter på markedet og en stratfkaton af populatonen, vl der være gvet en entydg fastlagt sammenhæng mellem stkprøvestørrelse og udfaldsrum. Ved udtagelse af stkprøver er udfordrngen at opnå et repræsentatvt sample. På den baggrund bør eventuelle overvejelser forbndelse med segmenterngen af markedet udnyttes planlægnngen af stkprøveudtagelsen. Selve modellen stller kke særlge krav derudover. 8

Der stlles heller kke nogle særlge krav tl stratfkaton af populatonen, men det bemærkes at udgangspunktet er, at jo flere strata, der anvendes, des flere stkprøver vl være nødvendge for at opnå samme præcson af udfaldsrummet. Det er PwC s umddelbare vurderng, at de fleste tlfælde vl 2-3 strata være praktsk at arbejde med. Det er PwC s umddelbare vurderng, at MST som udgangspunkt bør tlstræbe samme relatve præcson rapporterngen af kampagneresultater, fx ±20 %. Ved formulerng af eventuelle tommelfngerregler tl at fastlægge fornuftge stkprøvestørrelser bør alle ovenstående overvejelser tages betragtnng. Den statstske model er blevet mplementeret et Excel-regneark. Der er tale om en prototype, der prmært skal llustrere de mulgheder, som en t-løsnng kan levere. Det anbefales, at regnearket eller en tlsvarende løsnng løbende udbygges og kvaltetsskres. I den forbndelse vurderes det, at følgende elementer kunne være relevante at modellere yderlgere: Sammenhæng mellem stkprøvestørrelser og omkostnnger. Hvs modellen udvdes med oplysnnger om stkprøveomkostnnger de forskellge strata, så vl modellen kunne påbegynde at levere cost/beneft -nput tl planlægnngen af stkprøveudtagnng. Sammenhæng mellem stkprøvestørrelser og konfdens. Modellen vl forholdsvs let kunne udvdes tl at omfatte en funkton, der kan optmere stkprøvestørrelser forhold tl gvne konfdensnveauer. Sammenlgnng af kampagner. Det vl kunne være relevant at foretage opfølgnng på tdlgere udførte kampagner for eksempelvs at vurdere eventuelt ændret adfærd de tlsynsbelagte vrksomheder. I den forbndelse vl decderede hypotesetest være et relevant værktøj. Hjørnestenene et framework er en segmenterng af markedet, en struktureret datandsamlng og en dokumenteret statstsk model. Implementerngen af ovenstående skal prorteres. Det er rapportens umddelbare vurderng, at følgende prorterng af opgaver er hensgtsmæssg: 1. Implementere den statstske model 2. Påbegynde segmenterngsanalyser 3. Strukturere fremtdg datandsamlng 4. Analysere gamle kampagner mv. med henblk på dataopsamlng 5. Integrere økonomske beslutnngsvarable modellen. 9

10

3 Indlednng 3.1 Afgrænsnng Projektets overordnede formål har været at udvkle en stabl, robust og gennemskuelg metode tl at opgøre effekten af Kemkalenspektonens tlsyn og kontrol. Med effekten af tlsynet menes de konklusoner vedrørende det totale antal af ulovlge produkter på markedet, som kan udledes på baggrund af de enkelte kampagner. Tl dette formål er der udvklet en statstkmodel, der beskrver markedet as-s, dvs. grundlæggende en statsk ( pont n tme analyse). Det kunne også være nteressant for MST at undersøge de dynamske vrknnger af tlsynet, dvs. de ændrnger antallet af ulovlge produkter på markedet, der sker over td. En forudsætnng for en sådan dynamsk analyse er, at man kan beskrve før og efter -tlstandene ( en statsk model). Umddelbart vl det mest relevante statstske værktøj tl dynamske analyser være hypotesetesten, der er smpelt beskrevet appendks (afsnt 12.4, Stkprøvestørrelser for hypotesetest, sde 44). Hvs der eksempelvs udføres analyser både før og efter en kampagne, så kan det testes, om man statstsk kan se en nedgang antallet af ulovlge produkter. Modellerng af dynamske effekter af tlsyn og kontrol er kke yderlgere behandlet denne rapport. Fokus for effektvurderngen er de fre områder: Kosmetk, elektronk, legetøj samt klassfcerng og mærknng af kemske stoffer og produkter. Der vl dog blve taget udgangspunkt én fælles model for alle områder. Ved vurderng af produktets lovlghed skelnes der modellen mellem lovlg og kke-lovlg (0 eller 1 varabel), hvormod der ved en almndelg vurderng ndgår subjektve forhold omkrng lovlgheden. Specelt ved mærknng af kemske stoffer fndes der bagatelgrænser for, hvornår et produkt erklæres ulovlgt. Der vl blve gvet forslag tl dataklder forbndelse med nformaton tl brug for den statstske model. Dette er dog kke hovedformålet, og det må forventes, at der afsættes ressourcer tl dentfkaton af relevante dataklder ved mplementerng af modellen. Endvdere skal dybden af projektets resultater ses under agttagelse af de tlstedeværende allokerede ressourcer/mdler tl projektets gennemførelse. 3.2 Vurderng af nuværende tlgang MST admnstrerer kemkaleloven, som ndeholder bestemmelser om klassfcerng, mærknng, ndhold, anvendelse, godkendelse, salg og opbevarng af kemske stoffer og produkter. En særlg enhed MST - Kemkalenspektonen 11

- udfører tlsynet og kontrollen med, at mportører, producenter og forhandlere af kemske stoffer og produkter overholder reglerne. Kemkalenspektonen fører tlsyn med overholdelsen af reglerne kemkalelovgvnngen og de regler, der er knyttet tl denne lovgvnng alt ca. 50 forskellge bekendtgørelser, forordnnger og crkulærer. Kemkalelovgvnngen er fortrnsvs baseret på EU-drektver og forordnnger. Tlsynsområdet spænder vdt fra kosmetk tl bly og bekæmpelsesmdler. Kemkalenspektonen gennemfører kampagner, som er tdsbegrænsede tlsyn på afgrænsede områder. Områderne skfter fra år tl år. Kampagnerne gennemføres på de områder, der prorteres højest det pågældende år. Kampagner kan fx omfatte regler en bekendtgørelse, en produktgruppe, en branche eller et geografsk område. Kemkalenspektonens placerng MST: For at få ndblk MST s nuværende tlgang tl tlsyn og kontrol er denne gennemgået med henblk på vdereudvklng af tlgangen og mplementerng af en statstsk metode. Gennemgangen er baseret på møder med nøglepersoner MST 1 samt materale fra MST, herunder årsstatus, faktaark, projektbeskrvelser, kortlægnnger mv. Den nuværende tlgang ndeholder mange gode elementer form af kortlægnnger, stkprøveudvælgelser og samarbejder med andre lande. Den er dog noget ustruktureret. Formålet med en ny metode er at bevare de allerede gode elementer, samtdg med at der kommer mere struktur over hele processen. Selve udvælgelsen af stkprøverne blver dag gjort ad hoc og er baseret på nformaton om nye regler, sundhedsmæssge konsekvenser, uopfordrede anmeldelser, nformaton om ulovlge produkter fra kortlægnnger osv. Det er 1 Se appendks, afsnt 12.2, Kontaktpersoner MST, sde 43. 12

efter vores opfattelse relevante elementer at nddrage beslutnngsprocessen, og der vl den statske model blve taget udgangspunkt dsse. Foruden dsse elementer foreslås det, at der nddrages andre elementer beslutnngsprocessen om, hvlke produkter der udtages tl kontrol. En mulg forbedrng vl være at segmentere området, der kontrolleres, og se på, hvlke segmenter kampagnerne skal målrettes mod samt at få kvantfceret fokusværden for hvert segment. Ved at tllægge beslutnngsvarable en foruddefneret værd og tlsvarende vægt vl man med et tal kunne sammenlgne fokus de enkelte segmenter. På den måde vl man kunne få et bedre overblk over de krtske segmenter og prortere netop dsse forbndelse med stkprøver (dette er nærmere beskrevet kaptel 5). 3.3 Dataanalyse En model er en smplfcerng af vrkelgheden. For at kunne nddrage de parametre, der bedst beskrver antallet af ulovlge produkter en model, er det underlggende datagrundlag fra MST blevet analyseret. Blledet omkrng processerne går gen ved opsamlng af data, og der fndes kke en struktureret metode for opsamlng af data. Der fndes dog megen nformaton gemt rapporter, årsberetnnger og kortlægnnger, som vl kunne bruges en statstsk model. Resultaterne af stkprøverne ndeholder nformaton om lovlghed, hvor stkprøven er taget, hvornår stkprøven er taget samt nformaton omkrng produktet. Derudover fndes nformaton omkrng tdsforbrug allerede gennemførte budgetter. Dette er brugbart forhold tl at vurdere de ekstra omkostnnger, den udvdede stkprøveanalyse vl koste. Der har kke været en naturlg proces for at vurdere antallet af ulovlge produkter ved estmerngen af det totale antal produkter. Der vl nogle tlfælde af mplementerng af modellen være behov for ndsamlng af data, specelt omkrng det totale antal produkter. En løsnng kunne være at spørge drekte butkken, hvor stkprøven blver taget, omkrng deres lager, antallet af solgte produkter osv. Desuden kan andre dataklder anvendes, fx Reach-IT, WEEE- System, produktregsteret, CVR-regsteret og SKAT. For fremtdg datandsamlng foreslås det, at der oprettes en database, hvor al relevant nformaton samles på et sted struktureret form. 13

14

4 Procesbeskrvelse af statstsk metode Dette afsnt ndeholder en beskrvelse af de processer, der skaber en statstsk metode. Planlægnng nden for statstk omhandler metoder, som gør målnger mere præcse. Hvs man bruger de korrekte metoder, kan måleuskkerheden for en stkprøve eller et eksperment mnmeres. Formålet med denne statstske metode er at kunne måle effekten af Kemkalenspektonens tlsyn og kontrol nden for de fre tdlgere nævnte områder. Dette kan opdeles to dele; estmat for antallet af ulovlge produkter og uskkerheden omkrng dette estmat. Med effekt menes effekten af de enkelte tlsyn og kontroller forhold tl uskkerheden resultaterne. Endvdere, hvor dækkende de gennemførte kampagner er - målt mod hele markedet. De enkelte processer denne statske metode kan opdeles fre områder; udvælgelse, datandsamlng, modellerng og rapporterng. Processen kan llustreres således: Udvælgelse Datandsamlng Modellerng Rapporterng Segmenterng Stkprøveanalyse Ulovlge produkter pr. segment Effekt Rangordnng af segmenter Antal produkter alt Grupperng af nformaton Ulovlge produkter pr. segment Estmerng Overordnet Udvælgelse Udvælgelsesprocessen er en systematsk måde at fnde de områder, som de næste kampagner skal rettes mod. Det første skrdt er at segmentere markedet logske grupper set forhold tl modellen, praktk og ekssterende processer. Med praktk menes, at det skal være smpelt at kunne dentfcere den gvne gruppe. Flydende defntoner som butkker der sælger bamser er svære at defnere. Legetøjsbutkker og elektronkbutkker stormagasner er en lettere defnerbar gruppe. Samtdg skal der tages højde for ekssterende tlgang, fx vl det være logsk at foretage segmenterngen baseret på de fre tlsynstyper. Der 15

skal desuden tages højde for, at segmenterngen ndeholder samme dmensoner som parametrene modellen. Med det menes, at man skal være konsstent med de varable/parametre, man bruger alle trn processen for at estmere det samlede antal ulovlge produkter på markedet. Når segmenterngen er på plads, vl der nden for hvert segment - ud fra foruddefnerede beslutnngsvarable - blve vurderet på fokusværden. Fokusværden er beregnet ud fra en værd og vægt tldelt hver beslutnngsvarabel. Værden vl blve tldelt ved hjælp af nogle krterer eller oversættelsestabeller og blve vægtet bestemt ud fra vgtgheden på den gvne beslutnngsvarabel sammenlgnet med de resterende. Datandsamlng Datandsamlngen dækker ndsamlngen af nformaton - både form af stkprøveanalyse og det totale antal produkter. Stkprøveanalysen er en ekssterende proces hos Kemkalenspektonen dag, som kunne fortsætte sn nuværende form. Desuden skal der opsættes processer for det totale antal produkter for at bestemme størrelsen af de gennemførte kampagner forhold tl helheden. Det vl være logsk at opdele både det totale antal produkter og stkprøver samme segmenter som udvælgelsesprocessen. Modellerng Selve modellerngen ndeholder mange aspekter, men generelt anvendes der som standard statstske metoder tlpasset problemstllngen MST. Resultatet af modellen er en forudsgelse af det totale antal ulovlge produkter samt uskkerheden af dette estmat. Modellen bygges på ndsamlet nformaton og opererer de samme opdelnger, som fndes datagrundlaget. Rapporterng Det, man skal være opmærksom på rapporterngen, er, at der vl være forskellge måder at rapportere på, afhænggt af hvlken af de fre produkttyper der konkluderes på samt målgruppen for rapporterngen. Den statstske formulerng på baggrund af resultatet fra modellen vl dog altd være den samme, og der vl rapporten blve gvet forslag tl drekte formulernger, der kan anvendes. 16

5 Målretnng af tlsyn og kontrol For at kunne målrette Kemkalenspektonens tlsyn og kontrol foreslås en segmenterng af markedet for hver af tlsynstyperne. De enkelte segmenter vurderes derefter ud fra nogle foruddefnerede krterer, hvor alle krterer vægtes for at få den samlede score eller fokusværd. Målretnngen af kampagnerne vurderes så på baggrund af de enkelte scores segmenterne. 5.1 Segmenterng De enkelte tlsynstyper foreslås segmenteret med relevante grupper forhold tl tlsyn og kontrol. Processen vedrørende estmerngen af det totale antal produkter vl på sgt blve lettere, det arbejdet blver struktureret. Det vurderes derudover, at der vl være behov for forskellge processer tl de enkelte segmenter. Samtdg vl det mndske uskkerheden estmaterne for antallet af ulovlge produkter, da segmenterngen vl gøre det mulgt at gruppere på baggrund af, hvor meget nformaton der fndes på de enkelte områder. Mulge segmenterngsvarable kunne være: Tlsynstype Produkt Vrksomhed (NACE-koder) eller andre nddelnger, fx størrelse Opdelng forhold tl produkt-flow, kan der ndhentes nformaton tdlgere processen form af toldpaprer eller lgnende? Geograf Karakterstka på vrksomheder, eventuelt størrelse, eller om vrksomheden er en del af en kæde. For at ndhente nformaton tl segmenterngen kan der udsendes spørgeskemaer tl vrksomhederne vedrørende deres håndterng af produkterne forhold tl lovgvnngen. Man skal dog være opmærksom på de specelle lovkrav, der ekssterer omkrng ndhentnng af nformaton. Det skal endvdere forsøges at stlle neutrale spørgsmål, så selvnkrmnerng undgås. Fx vl spørgsmålet: Sælger I ulovlge produkter henhold tl Kemkalenspektonens kontrol? være et spørgsmål, der kke er neutralt. I medfør af kemkalelovens 39 (jf. lovbemærknngerne fra 1978) kan MST ndhente oplysnnger tl brug for den kortlægnng og planlægnng, som forudsættes at skulle værksættes forud for en nærmere regulerng. På den baggrund kan MST bede om vsse data tl brug for selve kampagnen. Dog skal det være nformaton, der er need to know, herunder hvorledes stkprøvestrategen udføres. Ud fra svarene scores/rangordnes de enkelte vrksomheder forhold tl sandsynlgheden for, at de har ulovlge produkter. På den måde kan krtske segmenter dentfceres, allerede nden kampagnerne påbegyndes. 17

5.2 Udvælgelseskrterer For at kunne vurdere de enkelte segmenter skal der opstlles et antal krterer tl vurderng af fokus. Samtdg skal krtererne tldeles en foruddefneret vægt, for at kunne fnde en samlet score det gvne segment. Scoren hvert segment beregnes som følger: score n 1 w k, hvor w = vægten for krterum, dsse skal for alle n summe tl 1 k = værden for krterum For at fnde værden af krtererne, k kan de fx alle vurderes på en skala fra 1 tl 4. Der behøver kke være så mange grader at specfcere krteret, k på. Skalaen bør ndeholde et lge antal grader for at undgå for mange neutrale valg. Skalaen af scoren vl følge vurderngsskalaen, forudsat at vægtene, w summer tl en. Der fndes mange kanddater tl udvælgelseskrtererne, k, og de kan være forskellge samt have forskellge vægte, w tlsynstyperne mellem. Her er nogle eksempler på krterer, k: Poltsk fokus Medefokus Nye regler/regelændrnger Informaton fra kortlægnnger Indberetnnger fra brancheforennger Indberetnnger fra sundhedsvæsen Sundhedsskadelge konsekvenser Mljøskadelge konsekvenser Effekt (beskrevet modelkaptel) Informaton fra andre lande Antallet af uopfordrede anmeldelser fra prvatpersoner eller lgnende Område, som hstorsk set har haft mange ulovlge produkter. 5.3 Implementerng En metode tl at målrette tlsyn og kontrol skal bdrage med overblk over markedet, og det foreslås derfor, at der kke anvendes mere end to varable segmenterngen. Dermed vl segmenterngen altd kunne llustreres vsuelt. En smpel model vl dog oftest være dårlgere tl at forklare vrkelgheden, men stadg utrolg brugbar på grund af overblkket den gver. Det er vgtgt, at man fra starten gør klart, hvordan man vl bruge modellen for at bedømme antallet af varable, men også specfkatonen af dem, altså hvor mange grupper hver enkelt varabel skal tldeles. Nogle valg kan være åbenlyse og bør udelukkes af modellen, fx kan det antages, at der altd gennemføres kampagner på områder med nye regler, og det vl derfor være naturlgt kke at have en model ndeholdende nye regler som beslutnngsvarabel. 18

Forholdet mellem segmenterngsvarable og udvælgelseskrterer, k kan varere meget forhold tl, hvlken segmenterngsmetode der bruges. Med segmenterngsmetode menes detaljerngsgraden segmenterngen. Der kan også, før segmenterng påbegyndes, foretages en opspltnng af produkterne, hvor de enkelte tlsynstyper vl være et oplagt valg. Det kan llustreres således: Totale marked kemske stoffer Legetøj Kosmetk Elektronk Der vl også kunne bruges yderlgere opspltnnger før segmenterngen, eksempelvs kan der efter valg af tlsynstype, opsplttes yderlgere en varabel, som er forskellg pr. type. Det kan llustreres således: Totale marked kemske stoffer Legetøj Kosmetk Elektronk Her foretages en opspltnng - først på type og derefter på andre varable - hvorefter segmenterngen udføres. 19

En tredje mulghed kunne være at foretage segmenterngen af flere omgange, dvs. først foretages en segmenterng på to varable, hvorefter der for hvert segmenterngsalternatv segmenteres på to varable. Det kan llustreres således: Totale marked kemske stoffer Legetøj Kosmetk Elektronk En sdste mulghed vlle være at foretage segmenterngen ndeholdende flere end to varable, hvor mulgheden for grafsk fremstllng dog forsvnder. Det kan llustreres således: Segmenterngsvarabel 1 Segmenterngsvarabel 2 Segmenterngsvarabel 3 Segmenterngsvarabel 4 Score Segment 1 Segment 1 Segment 1 Segment 1 Segment 2 Segment 2 Segment 1 Segment 2 Segment 2 Segment 1 Segment 1 Segment 2 Segment 2 Segment 1 Segment 2 Segment 2 Segment 1 Segment 1 Segment 1 Segment 2 Segment 2 Segment 1 Segment 2 Segment 2 Segment 1 Segment 1 Segment 2 Segment 2 Segment 1 Segment 2 Resultatet alle metoder er den samme, men selve tankegangen omkrng opsætnngen vl være forskellg. 20

6 Stkprøvemetodk Stkprøver bruges, når hele populatonen kke kan undersøges. Det kan være, at det er dyrt at foretage målngerne, eller at det kke er fyssk mulgt at undersøge mere end et udsnt af populatonen. For eksempel er det kke mulgt at undersøge alt vandet verdenshavene. Et andet problem, som statstk tager hensyn tl, er, at målnger ofte er behæftet med uskkerhed, fejl eller mangler. Det kan for eksempel være målnger af den samme tng, hvor resultatet varerer for hver målng, men gennemsnt har den korrekte (sande) værd. Stkprøvestørrelsen en statstsk stkprøve er antallet af observatoner. Det er typsk betegnet, n et postvt heltal (naturlge tal). Alt andet lge fører en større stkprøvestørrelse tl øget præcson forbndelse med vurderng af forskellge egenskaber af populatonen. Dette kan ses statstske resultater som de store tals lov og den centrale grænseværdsætnng. Gentagne målnger og replkaton af uafhængge prøver er ofte påkrævet forsøg på at nå den ønskede præcson. Et typsk eksempel vlle være, at man ønsker at bestemme gennemsnttet af en kontnuert stokastsk varabel (fx højden af en person). Hvs det antages, at der fndes en stkprøve med uafhængge observatoner, og varatonen af populatonen (målt ved standardafvgelsen ) er kendt, så er fejlleddet stkprøven gvet ved formlen: n Det ses, at hvs stkprøvens størrelse stger, så går fejlleddet mod 0. 6.1 Estmerng af andele med 95 % konfdens Et typsk statstsk formål er at demonstrere, at den sande værd af en parameter er nden for en afstand B af den estmerede værd med 95 % sandsynlghed: B er fejlleddet, der mndsker med større stkprøvestørrelse, n. Værden af B betegnes som 95 % konfdensnterval. Det er ofte et ønske at estmere andele af den samlede populaton. I den sammenhæng vurderer v grænserne for et 95 % konfdensnterval omkrng den ukendte andel. Ved et anvende et forsgtgt estmat, der er nærmere beskrevet appendks (afsnt 12.3, Udlednng af fejlleddet, sde 43), kan v opstlle følgende smple sammenhæng (tommelfngerregel) mellem størrelsen på vores stkprøve og fejlleddet. 21

Tommelfngerregel: Fejlleddet eller uskkerheden for den ukendte andel er: 1 1 n B 2 B n Størrelsen på fejlleddet er derfor: n = 100 <=> B = 10 % n = 400 <=> B = 5 % n = 1.000 <=> B 3 % n = 10.000 <=> B = 1 % Man ser ofte dsse tal cteret nyhedsndslag med opnonsundersøgelser og andre stkprøveundersøgelser. Gvet et gennemsnt på 42 stkprøver pr. kampagne 2, vl man med et 95 % konfdensnveau kunne sge, at estmatet baseret på stkprøven kke afvger mere end ca. 15 % fra det sande gennemsnt. Lad os udvde eksemplet tl at lgne en kampagne. V har et segment, hvor v ved, der er 10.000 forskellge produkter totalt. Der er kampagnen testet 50 produkter, og der er fundet 15 ulovlge produkter. Det forventede antal ulovlge produkter på markedet er: Først vl v se på, hvad v har fundet kampagnen. V har testet 50 produkter og fundet 15 ulovlge produkter. Dette gver en andel på 30 % ulovlge produkter kampagnen. Overføres dette tl det totale marked, ved v, at der forventes 30 % * 10.000 = 3.000 ulovlge produkter på markedet. 1 Uskkerheden for dette estmat er så 14 %. 50 Dvs. at v med 95 % konfdens kan sge, at det sande antal ulovlge produkter er mellem (30 %-14 %) * 10.000 = 1.600 og (30 %+14 %) * 10.000 = 4.400 enheder. Hvlket samtdg betyder, at v med 97,5 % konfdens sger, at antallet af ulovlge produkter kke overstger 4.400 enheder. Hvs man stedet havde testet 100 produkter og fundet 30 ulovlge produkter, så andelen af ulovlge produkter stadg var 30 %, vlle det forventede antal ulovlge produkter på hele markedet stadg være 1.000. Uskkerheden vlle dog være blevet reduceret tl 10 %. 2 Gennemsnttet af de stkprøver, som ndgår tlsendt materale omkrng tdsforbrug 22

Konklusonen vl så være, at med 95 % sandsynlghed vl det sande antal ulovlge produkter være mellem (30 %-10 %) * 10.000 = 2.000 og (30 %+10 %) * 10.000 = 4.000 enheder. Eller med 97,5 % sandsynlghed vl der være højst 4.000 ulovlge produkter. Som nævnt er tommelfngerreglen, der er anvendt de ovenstående beregnnger, et estmat, der benytter den størst mulge uskkerhed (opnås for andelen 50 %) uafhænggt af den konkrete andel. På den baggrund kan man tale om et forsgtgt eller konservatvt skøn. 6.2 Stratfkaton Ved stratfkaton nddeles populatonen nogle (gensdgt udelukkende) dele - strata, og stkprøvestørrelser bestemmes for hvert stratum. Stratfkaton kan være en fordelagtg metode, når der er stor forskel på varatonen de enkelte strata. Eller med andre ord, hvs varatonen er mndre nden for de enkelte strata end varatonen mellem strataene. Et eksempel på stratfkaton kunne være, at en vælgerundersøgelse deles op på beboere parcelhuse, andelsbolger, lejlgheder og andre boformer. Der kan også gennemføres efterstratfkaton ved hjælp af regstrerede baggrundsvarable. I forbndelse med tlsyn og kontrol vlle det være en mulghed at segmentere kunderne efter forventet uskkerhed. Hvs der fx testes store kædebutkker, må der forventes ensartede resultater de enkelte butkker (lav varaton), hvormod små specalbutkker er svære at defnere som en homogen gruppe, og generelt må der forventes flere ulovlge produkter og mere varaton dette stratum. Er specalbutkker en meget llle del af det samlede marked, kan der argumenteres for, at de udelades eller behandles homogent modellen tl estmerng af de samlede antal ulovlge produkter på markedet. Ved gennemførelse af kontrol vl det være nødvendgt, at MST forbndelse med planlægnng af stkprøvekontroller fastlægger, med hvlken procent konfdenskontroller skal udmøntes. Det vl sge, med hvor stor skkerhed er resultatet af kontrollen vald. For at operatonalsere arbejdet med stkprøver kan det endvdere anbefales, at de udvalgte populatoner stratfceres og opdeles homogene grupper. 23

24

7 Estmat for det samlede antal produkter For at kunne opskalere eller ekstrapolere resultaterne fra stkprøver skal der anvendes et estmat for det samlede antal produkter på markedet. Ved anvendelse af stratfcerede stkprøver skal antallet af produkter alle strata estmeres. For bedste resultat skal dette gøres på samme segmenterng som udvælgelsesprocessen for tlsynsaktvteterne. Har der stkprøveanalysen været flere perspektver, skal dsse overvejes forbndelse med estmatet. Der fndes dag en god beskrvelse af, hvordan nformaton kan ndhentes Kortlægnngshåndbogen 3, som nddrager mange nteressante aspekter. Det foreslås at bruge samme metode som beskrevet der. I afsnt 5.1, Segmenterng, sde 17 er gvet forslag tl varable. Ved opgørelse af det totale antal produkter er det vgtgt at have en klar defnton af, hvad der skal opgøres. Er det salget, lagerbeholdnngen eller noget tredje? Rent ntutvt må det være det totale antal produkter, som blver anvendt af forbrugere, da eksponerngen mod de farlge stoffer fndes der. Det vlle kunne opgøres ved at tage salget den sdste perode. Længden af peroden afhænger af den forventede levetd for det enkelte produkt. Med hensyn tl uskkerheden omkrng det totale antal produkter vl en mulghed være at henføre det drekte tl dataklden. Har man en gang analyseret uskkerheden for en dataklde, vl uskkerheden kunne antages at være den samme fremover. Detaljerede analyser vl have llle uskkerhed. Tal fra Danmarks Statstk, Reach-IT, WEEE-System, produktregsteret, CVR-regsteret og SKAT samt nformaton fra brancheforennger vl have ldt større uskkerhed, men stadg llle. Dataklder som De Gule Sder og Google vl have stor uskkerhed og bør undgås ved estmerngen af det totale antal produkter. Da estmerngen af de totale antal produkter kke har været en naturlg del af arbejdet med tlsyn og kontrol dag, vl det være her, hvor den største forandrng og ndsats skal lægges forhold tl ndsamlng af nformaton tl modellen. Det er vgtgt, at man fra starten får udformet en metode, som er konsstent for kke at øge uskkerheden af estmaterne for det totale antal ulovlge produkter. For at mnmere ndsatsen ved ndsamlng af nformatonen kan der eventuelt spørges drekte butkken, hvor stkprøven blver taget, omkrng antallet af 3 Manual tl kortlægnng af producenter, mportører og forhandlere, Mljøprojekt Nr. 1242 2008 25

dette produkt. Det kunne fx være antallet af produkter på lager, hvor mange styk butkken har solgt af dette produkt, og hvad de forventer af salg og køb fremtden. Denne rapport vl kke anføre konkrete forslag tl dataklder. 26

8 Statstsk model Formålet med formulerngen af en statstsk model er at kunne beskrve det samlede antal ulovlge produkter ud fra et estmat for det samlede antal produkter på markedet antallet af ulovlge produkter fundet ved stkprøve. V vl først præsentere en generel tlgang tl statstsk modellerng. Derefter vl v beskrve en smpel model med to sandsynlghedsfordelnger, som kan udvdes tl en stratfceret model. 8.1 Generelt Udgangspunktet for den statstske analyse er et sæt af observatoner. Dette kunne fx være resultatet af en undersøgelse af et antal legetøjsprodukter for ndhold af ftalater. Hvs observatonen er gvet ved {0, 0, 0, 1, 0, 0, 0, 1, 1, 0}, betyder det, at det fjerde, det ottende og det nende produkt havde udfaldet succes (hér: ndhold af ftalater, dvs. ulovlgt produkt). V vl almndelghed bare tale om én observaton, selv om det kan dreje sg om mange målnger. En observaton er således en vektor x x, 1, x n af tal. Observatonen antages formelt at være en realsaton af en stokastsk varabel X X 1,, X n. X s værder tlhører udfaldsrummet E, mængden af mulge udfald. Idéen med at ndføre den stokastske varabel X er, at v sammen med vores observaton X betragter alle de andre udfald, v kunne have fået. Ved hjælp af den statstske model prøver v så at beskrve uskkerheden omkrng udfaldet ved en eller flere sandsynlghedsfordelnger. Ofte har man et vst kendskab tl fordelngen for X. Måske ved man, at X s fordelng er en bnomalfordelng, men ved kke hvad sandsynlghedsparameteren er. På grundlag af en eller flere observatoner vl v så prøve at skønne over, hvlken bnomalfordelng der er den rgtge. Det, v kalder den statstske model, er mængden af de mulge sandsynlghedsfordelnger. For at holde rede på dem ndcerer man dem. Dette sker så vdt mulgt på en naturlg måde. En sådan mængde af sandsynlgheder plejer man statstkken at kalde en famle af sandsynlgheder. P Formelt sger v, at en statstsk model er en ndceret famle af sandsynlghedsfordelnger på E, således at for hvert er P en mulg fordelng af X. Indeksmængden kaldes parameterområdet, og kaldes parameteren. At vælge en fordelng på grundlag af observatonen X kaldes at estmere. Man plejer her at dentfcere fordelngen P med dens parameter og taler så om at estmere parameteren. Hvs man ved 100 kast med en skummel og skævt udseende mønt har fået krone 33 gange og blver bedt om at gve et skøn over, hvad sandsynlgheden for krone p er, vl det være nærlggende at vælge p 0,33, hvs man øvrgt kke ved noget om mønten. Estmaton betyder altså, 27

at v ud fra observatonen x prøver at bestemme den fordelng, som v tror x kommer fra. Ser v gen på bnomalfordelngen, er der selvfølgelg ngen grund tl at tro, at p netop er 0,33, men nok at p lgger nær 0,33. Havde udsagnet været baseret på 330 kroner ud af 1.000 kast, vlle man nok have været mere overbevst om, at 0,33 kunne være det rgtge. Der fndes mange forskellge estmerngsmetoder, dvs. forskrfter, der fortæller, hvordan man en gven model vælger en fordelng på grundlag af et sæt af observatoner. En sådan forskrft, der altså er en funkton af observatonerne, kaldes en estmator. V vl holde os tl den såkaldte maksmalserngsmetode. Denne metode gver almndelghed fornuftge estmatorer. Det engelske ord for maksmalserngsestmator er maxmum lkelhood estmator. Derfor bruges forkortelsen ML-estmator ofte for maksmalserngsestmatoren. X ~ bn( n, p), da er maksmalserngsest- x p entydgt bestemt og gvet ved pˆ ( x) n Hvs X er bnomalfordelt, dvs. matoren pˆ for sandsynlgheden 8.2 Smpel model V vl tage udgangspunkt en model uden stratfkaton. V betragter således populatonen af produkter som en helhed uden underopdelng. Tl at beskrve antallet af ulovlge produkter populatonen vl v anvende to sandsynlghedsfordelnger: bnomalfordelngen og normalfordelngen. V antager, at antallet af ulovlge produkter U ~ er bnomalfordelt med antalsparameter N ~ og sandsynlghedsparameter p, og v antager, at antalsparameteren N ~ 2 er normalfordelt med mddelværd og varans. Idet antalsparameteren bnomalfordelngen skal være et naturlgt tal, vl v prakss anvende afrundede værder af normalfordelngen. Den statstske betydnng af at anvende afrundede værder er denne sammenhæng bagatelagtg. Formelt har v: ~ ~ U ~ bnn, p ~ 2 og N ~ N, I forbndelse med stkprøveudtagnng betegnes antallet af observatoner stkprøven n og antallet af succeser (ulovlge produkter). u 28

Notatonen kan llustreres nedenstående fgur: Den yderste crkel repræsenterer hele markedet, og den nderste mørke crkel repræsenterer den udtagne stkprøve. Idet andelen af ulovlge produkter stkprøven (u/n) antages at svare tl andelen af ulovlge produkter på hele markedet (U/N), kan U bestemmes ud fra N, n og u. I appendks er de væsentlgste statstske egenskaber for U ~ udledt, og det fremgår, at mddelværd og varans af den stokastske varabel er gvet ved: ~ u E( U ) n ~ 2 2 2 2 2 2 VAR( U ) pˆ 2 hvor er varansen af ML-estmatoren pˆ. Eksempel I (smpel model): V forventer, at det samlede antal produkter på markedet er 10.000 med standardafvgelse på 15 % (dvs. med 95 procents konfdens forventes det, at antallet af produkter tlhører ntervallet 7000,13000, svarende tl 10000 2 1500 ). V udtager en stkprøve på 50 produkter. Lad stkprøvens resultat være 15 ulovlge produkter. V har således n 50 og u 15. MLestmatet for sandsynlghedsparameteren bnomalfordelngen baseret på vores observaton (stkprøve) vl være 15 0,3, og på den baggrund vl v 50 skønne, at der er 10000 0,3 3000 ulovlge produkter på markedet. Men uskkerheden af vores skøn vl afhænge, dels af varansen på vores estmat af 2 det samlede antal produkter på markedet (gvet ved 2 1500 ), og dels af varansen af vores estmat for succes -sandsynlgheden (gvet ved 2 p(1 p) / n 0,0042 ). Den samlede uskkerhed af vores skøn er gvet ~ ved standardafvgelsen for U, der dette eksempel udgør ~ VAR( U ) 0, 0042 1500 2 10000 2 0,0042 0,3 2 1500 2 631950 795 svarende tl 26,5 %. Konklusonen er således, at det forventede antal ulovlge produkter på markedet med 95 procents konfdens tlhører ntervallet 1410, 4590, svarende tl 3000 2 795. 29

8.3 Model med stratfkaton Formålet med at ndføre stratfkaton modellen er at reducere uskkerheden (målt ved standardafvgelsen) på estmatet af antallet af ulovlge produkter. Stratfkaton er således et mddel tl at optmere udnyttelsen af ressourcer forbndelse med stkprøveudtagnng. Den smple model, der blev beskrevet forrge afsnt, udvdes nu tl også at omfatte stratfkaton, dvs. at populatonen af produkter underopdeles lag (strata). V vl stadg anvende bnomalfordelngen og normalfordelngen tl at beskrve antallet af ulovlge produkter populatonen, men nu antager v, at populatonen er nddelt k uafhængge strata. V antager, at antallet af ulovlge produkter det te strata U ~ er bnomalfordelt med antalsparameter N ~ og sandsynlghedsparameter p, og v antager, at antalsparameteren 2 med mddelværd og varans. N ~ er normalfordelt I forhold tl Kemkalenspektonens nuværende tlgang er det nye, at der skal estmeres (antages) en varans/standardafvgelse af populatonernes størrelse de enkelte strata. Som et nput tl bestemmelse af varans-estmatet en normalfordelng kan det udnyttes, at følgende gælder: Ca. 70 % af sandsynlghedsmassen fndes ntervallet, og ca. 95 % af sandsynlghedsmassen fndes det dobbelt så store nterval 2 ). ( Formelt har v: ~ ~ U ~ bn N, p ~ 2 og N ~ N, for 1,2,, k Og antallet af ulovlge produkter hele populatonen fås ved at summere over alle strata: ~ U ~ k U 1 8.4 Stkprøvestørrelse model med stratfkaton Tl at bestemme de optmale stkprøvestørrelser en stratfceret model anvender v Neymans allokerngsmetode 4. Metoden gver en optmal stkprøveallokerng baseret på mddelværder og standardafvgelser de enkelte strata. Lad * n betegne den optmale stkprøvestørrelse fra det te strata: 4 J. Neyman: On two dfferent aspects of the representatve method: the method of stratfed samplng and the method of purposve selecton, J. R. Statst. Soc. 97 (1934), 558-606. 30

n * n k 1 Antallet af stkprøver fra de enkelte strata kan llustreres nedenstående fgur: Crklen venstre sde repræsenterer beskrvelsen af hele populatonen, hvor farven, hørende tl de enkelte strata, er en llustraton af varansen (jo større varans desto mørkere farve). Crklen højre sde repræsenterer stkprøven baseret på Neymans allokerngsmetode. Det ses af fguren, at metoden medfører, at der udtages relatvt flest stkprøver fra strata med størst varans. Hvs antallet af stkprøver fra den samlede populaton er gvet, så er den optmale allokerng af stkprøvestørrelser fra de enkelte strata entydgt gvet ud fra mddelværder og standardafvgelser de k forskellge normalfordelnger, der beskrver det samlede antal produkter hvert stratum. 8.5 Analyse af stkprøve På baggrund af resultatet af stkprøverne kan den mest sandsynlge frekvens af ulovlge produkter bestemmes for hvert stratum, hér anvendes MLestmatoren, der sg selv er en stokastsk varabel med en standardafvgelse, der afhænger af u og n. Næste skrdt er at kombnere stkprøveanalysen med estmatet for det samlede antal produkter. Formelt haves nu for alle strata: ~ u E( U ) n ~ 2 2 2 2 VAR U ) pˆ 2 2 ( Alle resultater modellen bygger på den antagelse, at de normalfordelnger, der beskrver den samlede populaton de enkelte strata, er uafhængge. Der kan argumenteres for, at der vl være tendens tl, at man enten konsekvent over- eller undervurderer mddelværd og varans de forskellge strata, og at fordelngerne dermed kke er uafhængge. Hvs uafhængghedsantagelsen kke holder, vl den stratfcerede model undervurdere uskkerheden, og det er på den baggrund afgørende for den statstske models relevans at skre, at de normalfordelnger, som beskrver de enkelte strata, er uafhængge. 31

8.6 Statstsk konkluson Der er umddelbart tre typer af konklusoner, som kan foretages på baggrund af den statstske model. 1. På baggrund af estmatet for det samlede antal produkter på markedet og den udtagne stkprøve kan MST med {konfdensnveau} procents skkerhed sge, at antallet af ulovlge produkter på markedet udgør mellem {mn} og {max}. 2. På baggrund af estmatet for det samlede antal produkter på markedet og den udtagne stkprøve kan MST med {konfdensnveau} procents skkerhed sge, at antallet af ulovlge produkter på markedet udgør mndst {mn}. 3. På baggrund af estmatet for det samlede antal produkter på markedet og den udtagne stkprøve kan MST med {konfdensnveau} procents skkerhed sge, at antallet af ulovlge produkter på markedet udgør højst {max}. Konkluson 1 er tosdet, mens konkluson 2 og 3 er ensdede. Der gælder følgende sammenhæng: ~ P( U mn, max) 1 fejlled ~ ~ P( U mn) 1 ( fejlled / 2) P( U max) 1 ( fejlled Hvor fejlled 1 konfdensnveau. / 2) 8.7 Samlet fremgangsmåde Den samlede fremgangsmåde forbndelse med planlægnng, udtagnng, analyse og konkluson af stkprøver kan opsummeres følgende punkter: 1. Estmér det samlede antal produkter hvert stratum, N ~, gvet ved k-normalfordelnger og dsses parametre og. 2. Udtag stkprøve(r) på baggrund af Neymans allokerngsmetode. 3. Beregn pˆ samt standardafvgelsen af pˆ s fordelng ( ). 4. Konsoldér uskkerhederne på N ~ hhv. pˆ tl et samlet mål (standardafvgelsen ) for uskkerheden på U ~. 5. Konkludér på baggrund af den statstske model. 32

Eksempel II (stratfceret model): Lad gen estmatet for det samlede antal produkter på markedet være gvet ved 10.000, men nu er markedet underopdelt tre uafhængge strata. For hvert stratum skal der estmeres mddelværd og varans/standardafvgelse. Lad dsse være gvet ved følgende tabel: Stratum, 1 2 3 Mddelværd, 5.000 3.000 2.000 Standardafvgelse, 10 % 15 % 27,5 % Bemærk, at det vægtede gennemsnt af de anvendte standardafvgelser er 15 %, dvs. lg med standardafvgelsen eksempel I. Det skal dog vse sg, at standardafvgelsen af det samlede antal produkter på markedet dette eksempel kun udgør 8,7 %! Der gælder nemlg, at standardafvgelsen omkrng summen af uafhængge normalfordelte varable er mndre end summen af standardafvgelserne på de enkelte varable. V udtager gen alt 50 produkter, men denne gang underopdeles stkprøven tre del-stkprøver. For at mnmere den forventede varans af det samlede estmat anvendes Neymans allokerngsmetode, der medfører, at der skal udtages 25 stkprøver fra det første stratum. 50 5000 500 5000 500 3000 450 2000 550 Tlsvarende beregnnger gennemføres for det andet og tredje stratum. Lad resultatet af stkprøverne være gvet ved følgende tabel: Stratum, 1 2 3 Stkprøve, n 25 14 11 Ulovlge, u 8 4 3 V kan nu beregne ML-estmaterne for pˆ erne, der sammenholdt med erne gver os de forventede værder af det samlede antal ulovlge produkter 8 hvert stratum. For det første stratum forventes således 5000 1600 25 ulovlge produkter. V kan også beregne pˆ -estmatorernes standardafvgelser. For det første stratum fås således: ˆ ˆ p (1 p ) n 0,32 (1 0,32) / 25 0,0086 0,0926. Ved at sammenholde standardafvgelserne på pˆ erne med standardafvgelserne på N ~ erne kan v beregne standardafvgelserne på estmatet af det samlede antal ulovlge produkter det te stratum. Lad betegne standardafvgelsen på U ~. V har således: Stratum, 1 2 3 Mddelværd, pˆ 1.584 880 540 Standardafvgelse, 491 397 314 Varans 2 491 2 397 2 314 33

Næste skrdt analysen er at konsoldere resultaterne fra de enkelte strata tl den samlede populaton. V udnytter, at varansen af uafhængge normalfordelnger er addtv, dvs. at summen af varanserne er lg med varansen af summen. V får således, at varansen af U ~, dvs. det samlede antal ulovlge 2 2 2 produkter hele populatonen er lg med 491 397 314 491624, og standardafvgelsen af det samlede antal ulovlge produkter hele populatonen er dermed gvet ved: 491624 701. Det kan ses, at denne standardafvgelse er 12 % mndre end den tlsvarende standardafvgelse eksempel I. Reduktonen skyldes, at en del af varatonen, der er nden for de enkelte strata, udjævnes, når man betragter hele populatonen. Med mddelværd og standardafvgelse på plads kan v foretage statstske konklusoner på baggrund af forskellge konfdensnveauer. I tabellen nedenfor er konfdensntervallerne angvet for en række ofte anvendte konfdensnveauer. Konfdensnterval Konfdensnveau Nedre grænse Forventet værd Øvre grænse 80 % 2.414 3.004 3.594 90 % 2.105 3.004 3.903 95 % 1.851 3.004 4.157 97,5 % 1.630 3.004 4.378 Ved anvendelse af 95 procents konfdens ses det, at konfdensntervallet udgør 1851, 4157, dvs. at på baggrund af estmatet for det samlede antal produkter på markedet og den udtagne stkprøve kan v med 95 procents skkerhed sge, at antallet af ulovlge produkter på markedet udgør mellem 1851 og 4157. 8.8 Excel-værktøj Den statstske model er blevet mplementeret et Excel-regneark. Der er tale om en prototype, der prmært skal llustrere de mulgheder, som en t-løsnng kan levere. I første omgang leverer regnearket den optmale allokerng af del-stkprøver på baggrund af en række nput om den samlede populaton og stkprøvestørrelse. På baggrund af faktske stkprøveresultater leverer regnearket mddelværd og standardafvgelse af den stokastske varabel, der beskrver det samlede antal ulovlge produkter. I et særsklt faneblad oversættes resultaterne vedrørende mddelværd og standardafvgelse tl konfdensntervaller ved anvendelse af forskellge konfdensnveauer. 34

Herunder er ndsat eksempler på skærmblleder fra Excel-modellens to nuværende faneblade: Model nput output strata 1 2 3 samlet beskrvelse af populaton (N) my_ 5000 3000 2000 10000 sgma(n_) (%) 10,0% 15,0% 27,5% var(n_) 250000 202500 302500 755000 sgma(n_) 500 450 550 868,91 stkprøve-allokerng (n) n 50 my_*sgma(n_) 2500000 1350000 1100000 4950000 n*_ 25 14 11 50 stkprøve resultat (u) u_ 8 4 3 15 frekvens af ulovlge produkter (p) p_ 0,3168 0,2933 0,2700 0,3004 rho(p_) 0,0926 0,1233 0,1332 0,0648 rho(p_) (%) 29,2% 42,0% 49,3% 21,6% antal ulovlge produkter (U) my_*p_ 1584 880 540 3004 tau(my_*p_) 491 397 314 701 tau(my_*p_) (%) 31,0% 45,1% 58,1% 23,3% Konfdensntervaller konfdensnterval konfdens-nveau 1 2 3 samlet 80,0% mn 1170 546 276 2414 80,0% max 1998 1214 804 3594 90% mn 954 372 138 2105 90% max 2214 1388 942 3903 95% mn 776 228 24 1851 95% max 2392 1532 1056 4157 97,5% mn 621 103-75 1630 97,5% max 2547 1657 1155 4378 Det anbefales, at regnearket eller en tlsvarende løsnng løbende udbygges og kvaltetsskres. I den forbndelse vurderes det, at følgende elementer kunne være relevante at modellere yderlgere: Sammenhæng mellem stkprøvestørrelser og omkostnnger. Hvs modellen udvdes med oplysnnger om stkprøveomkostnnger de forskellge strata, så vl modellen kunne påbegynde at levere cost/beneft -nput tl planlægnngen af stkprøveudtagnng. Sammenhæng mellem stkprøvestørrelser og konfdens. Modellen vl forholdsvs let kunne udvdes tl at omfatte en funkton, der kan optmere stkprøvestørrelser forhold tl gvne konfdensnveauer. Sammenlgnng af kampagner. Det vl kunne være relevant at foretage opfølgnng på tdlgere udførte kampagner for eksempelvs at vurdere 35

36 En fuldt udbygget model vl således samlet kunne vurdere stkprøvestørrelser (fordelt på strata), konfdens af resultater og omkostnnger forbundet med udtagelsen. Dsse nput kan sammenhæng med den overordnede segmenterng (beskrevet afsnt 5, Målretnng af tlsyn og kontrol, sde 17) gve værdfuldt nput tl udvælgelse og prorterng af Kemkalenspektonens fremtdge kampagner.