IMM Statistical Consulting Center Technical University of Denmark ISCC Brugervejledning til beregningsmodul til robust estimation af nugget effect Endelig udgave til Eurofins af Christian Dehlendorff 15. juni, 2007 Christian Dehlendorff IMM, building 321, Technical University of Denmark 2800 Kgs. Lyngby www.imm.dtu/iscc Telefax : +45 4525 2673 E-mail : cd@imm.dtu.dk Telefon : +45 4525 3363
1 Indledning Dette dokument omhandler brugen af Beregningsmodulet til estimation af nugget effekten i tidsserier med ækvidistante målinger. Programmet er et Visual Basic Program implementeret i Excel. Programmets kode er beskyttet med en kode for at sikre mod ændringer. Det skal desuden understreges, at selvom programmet kan håndtere manglende observationer, må observationerne ikke mangle på en struktureret måde. 2 Brugervejledning 2.1 Start For at bruge modulet startes BeregningsModul.xls op i Excel. Det er vigtigt, at Makroer er tilladt, hvilket enten gøres ved at tillade det, når Excel spørger om det, eller ved at sætte security/sikkerhed til lav/low eller eller medium i Funktioner/Tools -> Makro/Makro -> Sikkerhed/Security. Modulet består af 4 ark: Input, Output, Figurer samt VariogramData, og disse navne må ikke ændres. Endvidere er Input, Output samt VariogramData arkene låste ark, således at Input arket kun kan modificeres i de 3 første kolonner, mens output samt VariogramData arkene slet ikke kan modificeres. De interessante ark for brugeren er input, output samt figurarkene. 2.2 Input I input-arket ses 4 kolonner med overskrifter. Tidspunkt angiver tid for måling og bruges i plot af den observerede tidsserie. Programmet bygger på ækvidistante målinger. Er data ikke stammer fra ækvidistante målinger, skal programmet ikke bruges. Programmet forventer en tidsserie uden for mange eller systematisk manglende observationer (programmet er testet på tidsserier af en længde på 24, hvorfor det må anbefales ikke at bruge det på meget færre end dette). Indsæt observerede værdier er kolonnen, hvor data skal indsættes (kopieres fra et regneark til beregningsmodulet), data skal være ækvidistante målinger. Manglende målinger skal angives med en tom celle. Ved indsættelsen bør brugeren lave en tom celle efter de indsatte data for at sikre en korrekt indlæsning. I Indsæt replikater for stikprøve kan en evt. stikprøve for analysekvalitet (s(analysis)) indsættes i kolonne C (eksempelvis i Celleområde C2:C30). Data skal sættes ind i input-arket før programmet køres. Alternativt kan s(analysis) angives som en absolut værdi eller som en procent af middelværdien under beregning. I Indsæt sted, parameter, enhed og tidsenhed indsættes de informationer, der bruges i Output 1
arket samt i figurerne til identifikation af data. I arket er der 6 knapper. Output skifter til Output-arket, hvis beregning har været kørt. Output knappen virker således ikke, hvis der er sat ny data ind i kolonne A, B, C eller E før en ny beregning er kørt. Figurer skifter til Figurer-arket (hvis ny data skal beregning trykkes først), Beregning starter selve beregningsmodulet og Fjern figurer fjerner eksisterende figurer i Figurer-arket. Endelig er der en Gem-knap, der starter en Gem som dialog med default filnavn sat til Stednavn-Parameter-dagsdato.xls, hvor Stednavn og Parameter er som specificeret i Input-arket. Med Gem-metoden gemmes hele Work-booken, dvs. alle 4 ark samt selve programmet. Fjern Input fjerner data fra kolonne 1, 2, 3 samt 4, en dialogboks til bekræftelse vises inden sletning. 2
Tidspunkt Indsæt observerede værdier Indsæt replikater for stikprøve Indsæt sted, parameter og enhed 2,5 8,7 Sted Lynetten 5 8,6 Parameter Total phosphor 7,5 8,8 Enhed mg/l 10 8,7 Tidsenhed min 12,5 8,8 15 8,9 17,5 9,3 20 9,7 22,5 9,4 25 9,8 27,5 9,5 30 9,2 32,5 9,3 35 9,6 37,5 9,5 40 8,9 42,5 9,5 45 9,6 47,5 9,4 50 9,5 52,5 9,8 55 8,5 57,5 9,9 60 10 Output Figurer Beregning Fjern Figurer Gem Fjern input Figur 1: Inputark 3
2.3 Output Outputarket modtager resultater fra beregningsmodulet. De to første kolonner er kopier af input-arket, dvs. de specificerede observerede data og evt. analyse data. Dernæst følger en ramme med resultaterne. Rammen indeholder en kolonne med beskrivelse af typen af output, dernæst en kolonne med resultater. I den tredje kolonne angives information om, hvorledes s(analysis) er fremkommet i rækkerne med s(analysis). I tredje og fjerde kolonne for V(0) og s(measurement) er nedre og øvre grænse i et 95 % konfidensinterval angivet. Rækkerne i resultatdelen er, som følger Stednavn - angiver stednavn, parameter og enhed (kopi af cellerne fra input arket) Middelværdi - middelværdien for observeret data s(analysis) - absolut værdi af s(analysis) (kan være beregnet eller angivet som absolut værdi eller beregnet udfra en angivet procent af middelværdi) s(analysis) i % af middelværdien (enten beregnet udfra de to celler ovenfor eller angivet ved input) Dernæst følger to identiske afsnit (en for j=1 (robust) og en for j=0) med følgende rækker V(0) - estimat for V(0) på dimensionsløs skala s(measurement) - på samme skala som observeret data (hvis V (0) > 0) s(measurement) i % af middelværdi - som ovenstående men som procent af middelværdi (dimensionsløs) s(sampling) - beregnet s(sampling) hvis mulig. Estimering kræver, (1) at s(analysis) er givet (2) at V (0) > 0 samt (3) at s(measurement) > s(analysis) s(sampling) i % af middelværdi - som ovenstående men som procent af middelværdi Den sidste række indeholder et tidsstempel for kørsel. Der er desuden 5 knapper: En skifter til Input, en til Figurer, en fjerner figurer, en starter programmet og en gemmer Work-booken. Knapperne er beskrevet under Input. 4
Observeret data Analyse data Type Resultater 8,7 Stednavn Lynetten-Total phosphor 8,6 Middelværdi 9,2875 8,8 s(analysis) ikke angivet 8,7 s(analysis) i % af middelværdi ikke angivet 8,8 Estimater for j=1 (anbefalet) Nedre 95 % konfidens grænse Øvre 95 % konfidens grænse 8,9 V(0) 0,000962221 < 0 0,004578328 9,3 s(measurement) 0,288095314 < 0 0,628423297 9,7 s(measurement) i % af middelværdi 3,101968384 9,4 s(sampling) s(sampling) ikke angivet 9,8 s(sampling) i % af middelværdi s(sampling) ikke angivet 9,5 Estimater for j=0 Nedre 95 % konfidens grænse Øvre 95 % konfidens grænse 9,2 V(0) 0,001025375 < 0 0,00707628 9,3 s(measurement) 0,29739952 < 0 0,781270331 9,6 s(measurement) i % af middelværdi 3,202148262 9,5 s(sampling) s(sampling) ikke angivet 8,9 s(sampling) i % af middelværdi s(sampling) ikke angivet 9,5 Tid for sidste beregning 14-06-2007 10:24 9,6 9,4 9,5 9,8 Input Figurer 8,5 9,9 10 Beregning Fjern Figurer Gem Figur 2: Outputark 5
2.4 Figurer I dette ark bliver figurerne fra programmet placeret. Der er tre mulige figurer: Variogram med fittet linie, skaleret variogram med fittet linie samt plot af tidsserien med observeret data. Figurerne bliver lagt øverst i hver kørsel, og der kan derfor være figurer fra tidligere kørsler. Det anbefales at fjerne figurerne inden kørsel af programmet (brug knappen). Der er desuden 5 knapper: En skifter til Input, en til Output, en fjerner figurer, en starter programmet og en gemmer Work-booken. Knapperne er beskrevet nærmere under Input. 6
Variogram for Total Variogram phosphor, for Lynetten, Total phosphor, indløb Lynetten gafgdsfgsdfgdsg dfgsdfg 0,004 0,0035 0,003 0,0025 0,002 0,0015 0,001 0,0005 0 0 2 4 6 8 10 12 14 0,4 0,4 0,35 0,3 0,3 0,25 0,2 0,2 0,15 0,1 0,1 0,05 Skaleret Skaleret Variogram Variogram for Total for phosphor, Total phosphor, Lynetten, Lynetten indløb gafgdsfgsdfgdsg (Skalering=100) dfgsdfg (Skalering=100) 0 0 2 2 4 6 8 10 12 14 Estimeret Fittet Estimeret Estimeret Fittet Fittet 10,5 10,5 10 10 9,5 9,5 9 8,5 8 Input Output Beregning Fjern Figurer Gem Observerede værdier værdier for Total for Total phosphor, Lynetten, indløb gafgdsfgsdfgdsg dfgsdfg 0 10 20 30 40 50 60 70 Tid (min) j j j V(j) V(j) V(j) Total phosphor (mg/l) 0 0 0 Figur 3: Figurark 7
2.5 Variogramdata Dette ark indeholder data fra beregningerne af variogrammet. Figurarket bruger data fra dette ark som datagrundlag, hvorfor arket er låst. VariogramData arket indeholder ikke relevant information for brugeren. Lag Variogram Fittet Variogram Skaleret Variogram Fittet Skaleret Variogram Skaleringsfaktor Residualer LC UC Tid Observeret 0,001025375 0,102537535 100-0,001025375-0,005026 0,007076 8,7 0 2,5 Lynetten 1 0,000962221 0,096222079 1,21628E-05-0,002654 0,004578 5 8,6 Total phosphor 0,000974384 0,097438361 2 0,000874741 0,000944764 0,087474056 0,094476368-7,00231E-05-0,000267 0,002156 7,5 8,8 mg/l 3 0,000848074 0,001217309 0,084807449 0,12173093-0,000369235 0,000442 0,001993 10 8,7 min 4 0,001229732 0,001281168 0,122973164 0,128116762-5,1436E-05 0,000647 0,001915 12,5 8,8 5 0,002159616 0,001561008 0,215961618 0,156100768 0,000598608 0,000414 0,002708 15 8,9 6 0,001293675 0,002033138 0,129367523 0,203313764-0,000739462 0,001096 0,00297 17,5 9,3 7 0,002646122 0,002342846 0,264612152 0,234284634 0,000303275-0,001227 0,005913 20 9,7 8 0,003088742 0,002740312 0,308874225 0,274031207 0,00034843 0,000695 0,004786 22,5 9,4 9 0,002486072 0,002359503 0,248607244 0,235950341 0,000126569 0,000169 0,00455 25 9,8 10 0,00142895 0,002501281 0,142894985 0,250128051-0,001072331 0,00144 0,003563 27,5 9,5 11 0,002147631 0,002520689 0,214763096 0,252068932-0,000373058 0,000985 0,004056 30 9,2 12 0,003355007 0,003273558 0,335500706 0,327355789 8,14492E-05-0,007366 0,013913 32,5 9,3 35 9,6 37,5 9,5 40 8,9 42,5 9,5 45 9,6 47,5 9,4 50 9,5 52,5 9,8 55 8,5 57,5 9,9 60 10 Figur 4: Variogram data 8
3 Programmet I dette afsnit bliver selve programmet beskrevet. 3.1 Input Ved tryk på knappen Beregning, fremkommer der først en dialog, hvor der mindes om, at data skal være sat ind. Hvis der vælges Ja/Yes, fortsætter programmet med at indlæse de observerede målinger. Mangler et eller flere identifikationsfelter, bliver de indlæst. Dialogen til indlæsning af tidsserien med målinger kræver en specifikation af et kolonneområde, hvor de observerede målinger er indtastet (per default sat til B2:B25 i Input-arket, dette kan ændres ved at lave en markering i arket, trykkes cancel/fortryd bruges B2:B25). Manglende observationer skal angives med tom celle allerede ved indsættelse af data. Markeringen af de observerede værdier skal være maksimum en kolonne og skal udelukkende indeholde numeriske værdier. Der skal desuden være mindst 8 observationer i markeringen. Det er vigtigt at understrege, at data ikke må mangle systematisk. Eksempelvis giver programmet en fejl og afsluttes, hvis variogrammet er udefineret i et lag (kan f.eks. ske hvis hver anden observation mangler). 3.2 Parameter settings Efter indlæsning af observerede værdier kan brugeren vælge default-værdier eller vælge at sætte værdierne selv. Vælges default viser en dialog default-parametrene. Er brugeren ikke tilfreds med de valgte parametre eller med de valgte observationer vælges nej/no og programmet går tilbage til indlæsning af observations data. Indlæsning af parametre starter med angivelse af maksimal afstand i variogrammet, dernæst kan brugeren vælge om, der skal laves et plot af variogrammet og evt. det skalerede variogram. Vælges det skalerede variogram, skal en skaleringsfaktor angives, programmet beregner selv en rimelig faktor. Igen fremkommer en dialog med de valgte settings, som kan accepteres eller afvises. 3.3 Beregning Efter indlæsning beregnes variogrammet, samt fittede og skalerede variogrammer. Alt efter settings plottes derefter de relevante figurer. 9
3.4 Analyse kvalitet Til sidst kan brugeren angive, om der skal angives en s(analysis). Der er 4 mulige valg, 0: ingen s(analysis); 1: et dataområde til beregning af s(analysis) (f.eks. C2:C11, C2:C7 eller C4:C36); 2: en absolut værdi af s(analysis), der angives som et tal input i en dialog eller 4: en relativ værdi (i %), der angives som et tal input i en dialog. Vælges en af mulighederne 1-3 beregnes s(sampling), såfremt det er muligt ellers afsluttes programmet. s(sampling) kan beregnes, hvis s(measurement) > s(analysis) 0. 10