Udvikling af prognoseværktøj til fjernvarmeforbrug

AAMS Udvikling af prognoseværktøj til fjernvarmeforbrug Med grundlag i forbrugerdata fra fjernaflæste varmemålere i Skæring forsøgsområde Lars Linnet 06-06-2012

TITELBLAD Forfatter Lars Linnet Titel Udvikling af prognoseværktøj til fjernvarmeforbrug Bachelorprojekt Automation og Energi Aarhus Maskinmesterskole Vejleder Henrik Kerstens 6. juni 2012 24 Antal normsider á 2400 tegn Lars Linnet maskinmesterstuderende 1 S ide

Ordforklaring AVA, Affaldvarme Aarhus FJVV, Fjernvarmevandet Forbruger, dette udtryk dækker over en varmemåler uanset om den sidder i et parcel hus eller som indgangsmåler i et etagebyggeri. Samplingsperiode, ved dette udtryk forstås det tidsrum som måleperioden dækker over Samplingstid, forstås den tid der går imellem to indlæsninger fra processen Morgenspids, Dette begreb bliver anvendt ved AVA og karakteriser det markant fjernvarme forbrug, der opstår i morgentimerne om hverdagene, typisk fra klokken 6:00 til klokken 9:00, om weekenden forskudt et par timer imod formiddagen. Stamdata, begrebet henviser til de ubehandlede forbrugerdata som blev udleveret af AVA til brug i denne rapport Data series, En række målinger, der er samplet indenfor et vilkårligt tidsrum. Termis, et anerkendt program i branchen, der benyttes til at foretage analyser og beregninger af fjernvarmesystemer. Programmet gør det muligt for brugeren at bygge en detaljeret model af fjernvarmenettet, med rørdimensioner, pumper, ventiler osv. samt håndtere forbrugeroplysninger ved hjælp af databaser. Programmet kan beregne, hvorledes nettet reagerer i forhold til tryk, temperatur og strømningshastigheder. Dette er et værdifuldt dimensionerings- og fejlfindingsværktøj for brugeren (7- Technologies A/S, 2009). Varmtvandseffekt, begrebet dækker over det forbrug der opstår ved forbrug af varmtvand hos forbrugeren. Opvarmningseffekt, den del af fjernvarmeforbruget der bliver anvendt til opvarmningen af ejendommen og har typisk dette forbrug en flad profil i forhold til varmtvandseffekten. 2 S ide

3 S ide

ABSTRACT The subject of this thesis is the conceptual development of a forecast method, that can be used to forecast the load on a district heating distribution network. Though there is nothing new in this capability on a generel level, the innnovating feature of this forecast model is the degree of detail. Meaning that it is possible to forecast the precise load for each consumer connect to a DH network, within a 4 hour periode. The forecast model uses historic data collected from each consumer using WiFi enabled heat meters. The benefits, that could be achieved by using this forecast method a numerous, e.g improved customer support and an greater understanding of the conditions under which the DH operates. The forecast model uses different methods to makes it possible for the forecast to run with a acceptable margin of error. By using the confidence interval of the measurments, as a criteria for validation, the model is able to improve the precision of the forecast as only validated data is allowed to be included in the forecasts pool of historic data. While the model itself is not weather dependent or takes the weather into acount, while calculating the forecast, it is able to make an small adjustment to the forecast by using the degree of error on the first step of the forecast, to correct the rest. The forecast described is at its current stage still incomplete and while initial testing shows promises, there are still many unanswered questions e.g how does the forecast perform during a large scale test and how can overall accuracy be improved. 4 S ide

INDHOLD TitelBlad... 1 Ordforklaring... 2 Abstract... 4 Indhold... 5 Forord... 7 INDLEDNING... 7 Formål... 8 Baggrund... 8 Problemstilling... 9 Problemformulering... 10 Metode... 10 Måleperiode... 11 Klimadata... 12 Målepunkter... 13 Sortering af målepunkter... 13 Reliabilitet og validitet... 15 Reliabilitet... 15 Den grundlæggende prognose model... 16 Påvirkning af korrektionens størrelse... 19 Samplingstid... 20 Statistisk behandling... 23 Middelværdien... 23 Varians... 24 Konfidensinterval... 24 Statistisk analyse... 26 Vejledning til Excel ark... 27 Analyse af samplingstid med konfidensinterval... 28 Pooled data... 30 Samling af tidsserier... 30 Sammenligning af forbrugere på baggrund af konfidensinterval... 31 Analyse af mandagens karakteristik i forhold til andre hverdage... 32 Anvendelse af konfidensinterval som et værktøj i prognosen... 33 5 S ide

Konklusion... 36 Håndtering og validering af dataserier... 36 Prognoseberegningen... 37 Vurdering af prognosemodellen... 37 Perspektivering... 38 Bibliografi... 39 Bilag 6 S ide

FORORD Denne rapport er skrevet som afsluttende bachelorprojekt på Aarhus Maskinmesterskole. Rapporten er blevet udarbejdet i forlængelse af et praktikforløb hos AffaldVarme Aarhus 1 fra februar til april 2012 Jeg vil gerne takke følgende personer i AVA. Maskinmester John Helligsø og Maskinmester Kim Therkildsen for med stor faglig passion, at fortælle om den daglige drift hos AVA og om fjernvarme generelt. Ingeniør Mads Vinge Muff, for inspiration og sparring og for at fremlægge problemstillingen for mig. Ingeniør Allan Jessen, der løbende at udleveret forbrugerdata. INDLEDNING AVA er i gang med at udskifte varmemålerne i Aarhus kommune. I flere tilfælde er der tale om mere end 15 år gamle og udtjente målere, der udskiftes til såkaldte intelligente varmemålere (Hay, 2012). Forventningen er ifølge AVA, at man i 2012 vil kunne installere 13.300 varmemålere hos kunderne (Affaldvarme Aarhus, 2012). Der er omtrentlig 50.000 varmemålere totalt i AVA forsyningsområdet. Forslaget blev behandlet af byrådet den 1. februar, og er nu videresendt til Teknisk udvalg og Teknik og miljø rådmanden Laura Hay, der har følgende forventninger til fordelene ved at overgå til fjernaflæsning. Det nye system giver ikke blot bedre kundeservice og forbedringer for miljøet, det vil også over en årrække give en bedre varmeøkonomi for den enkelte borger. Med fjernaflæsning og lækagekontrol hos samtlige kunder forventes det også, at vandtabet i ledningsnettet kan reduceres med op til 50 procent, hvilket svarer til 360 husstandes årlige vandforbrug. Opgraderingen af målerparken til fjernaflæsning har den store fordel, at varmekunderne får mulighed for at følge deres daglige forbrug på internettet eller mobilen og kan umiddelbart ændre adfærd til gavn for varmeforbruget og en øget miljøbevidsthed. (Hay, 2012) Rådmanden redegør i sin udtalelse for de umiddelbare fordele, man ønsker at opnå ved implementeringen af fjernaflæsning, nemlig lækagekontrol og forbedret kundeservice. Forventningerne til besparelserne ved AVA selv er, at der kan opnås en reducering af administrationsomkostningerne, da AVA udfaser aflæsningskort. Derudover forventes det, at man kan opnå driftmæssige besparelser i form af reducerede udgifter til spædevand, grundet forbedret lækagekontrol og reduceret varmetab, samt opnå en forbedret kundetilfredshed. (Affaldvarme Aarhus, 2012) Som det fremgår, er der altså ingen konkrete planer for, hvordan forbrugermålinger skal eller kan anvendes mere progressivt i forhold til optimering af den daglige drift i AVA. 1 AffaldVarme Aarhus vil fremover i rapport blive benævnt med forkortelsen AVA 7 S ide

Formål Formålet med denne rapport er at udarbejde et forslag til en prognosemodel, som kan anvendes af AVA til at give et mere detaljeret billede af belastningsforholdende i fjernvarmenettet. Særligt belastningen hos de enkelte forbrugere søges at blive belyst mere detaljeret. Baggrund AVA etablerede i 2011 to forsøgsområder i Aarhus. Det ene område er placeret i Risskov og det andet, som denne rapport beskæftiger sig med, er placeret i Skæring. Skæring-Risskov projektets formål er at undersøge, hvorvidt der kan fortages en temperatur sænkning i vinterperioden, samt hvilke udfordringer dette måtte medføre. Den forventede gevinst er, at AVA kan opnå et overblik over omløbenes energibelastning samt mulige driftsbesparelser (Affaldvarme Aarhus, 2012). Overvejelserne omkring valg af forsøgsområderne var følgende. Begrundelse for at vælge området i Skæring var at husene alle er bygget i slutningen af 90 erne og primært har gulvarme. Modsat området i Risskov hvor bygningerne er opført i 60 erne og 70 erne og næsten udelukkende har radiatorer installeret. Så det var ud fra et ønske om at fortage en undersøgelse imellem to meget forskellige forbrugertyper. (Jessen, 2012) For at indsamle data til Skæring-Risskov projektet, installerede AVA intelligente varmemålere hos alle forbrugere i de to områder. Altså er det her værd at bemærke, at forsøgsområderne ikke oprindeligt var udlagt med henblik på test af intelligente varmemålere, men ikke desto mindre giver det adgang til en stor mængde af forbrugerdata, der danner det empiriske grundlag for analysen i denne rapport. 8 S ide

Problemstilling I skrivende stund er det ikke muligt at foretage en analyse af belastningen af en rørstrækning i Termis, når der er mindre end 8 huse, uden at foretage antagelser omkring belastningsforholdende forbrugerne imellem. (Muff, 2012) Dette skyldes, at man ikke har haft nogen fyldestgørende værktøjer til at bestemme eller beregne belastningen fra de enkelte huse. Samtidighedsfaktor De værktøjer, der er til rådighed, er formlerne for Samtidighed imellem flere forbrugere og Samtidighed af tillæg for brugsvand (Lauritsen, 2009), vist nedenfor. Formler for samtidighed s = 0,62 + 0,38 n s = 1,0n 0,5 (51 n) 50 s = samtidighedsfaktoren for tilslutningseffekter s Δ = Samtidighed af tillæg for brugsvand n = er antal boliger I branchen er der en igangværende diskussion omkring validiteten af disse formler, og om de kan erstattes af en bedre metode, når intelligente varmemålere bliver installeret hos forbrugerne (Muff, 2012). Fjernvarmens Udviklingscenter afholdte i samarbejde med Lean Energy Cluster og Design 2 Innovate d. 14. marts en workshop om projektidéer inden for 4. generations fjernvarme. Ved denne workshop blev der fremført følgende betragtninger. (Fjernvarmens udviklings center, 2012) Forbrugsdata anvendt i net-modeller er typisk et årsforbrug. Tidligere forsøg på anvendelse af afkølingsmodeller har ikke været succesfulde. Derfor anvendes typisk samme afkøling i alle forbrugsknuder. Eksisterende net-modeller har en meget forsimplet beskrivelse af forbrugere. Behov for forbedring af grundlaget for dimensionering af fjernvarmenet især i nye udstykninger. (Andersen, 2012) I skrivende stund forefindes der forbrugsprofiler for boliger, men der er her tale om profiler udarbejdet på baggrund af middel belastninger fra større fjernvarmeområder. I denne analyse tages derimod udgangspunkt i den enkelte forbruger, og med reelle forbrugsprofiler tilsigtes der, at udvikle et værktøj, der gør det muligt, at beregne belastningen ud til den enkelte forbruger. Fordele for AVA Fordelen for AVA vil være en forbedret kundeservice. Et mere detaljeret billede af driftsforholdende vil kunne resultere i, at man, f.eks. ved udfald, kan oplyse kunderne mere præcist om, hvornår forsyningen vil 9 S ide

blive genoptaget. Man vil også kunne vejlede drift og vedligeholdelsespersonalet bedre under fejlfindingssituationer. (Muff, 2012) Problemformulering Kan en prognosemodel udarbejdes, der anvender forbrugerdata fra intelligente varmemålere, og hvilke specifikationer skal en sådan prognosemodel opfylde, for at sikre et så præcist billede af belastningen som muligt. Metode I denne rapport anvendes den hypotetisk-deduktive metode som grundlag. Først formuleres en hypotese på basis af formodninger og eksisterende viden, derefter søges der at afkræfte eller bekræfte hypotesens udsagn ved at anvende empirisk data. Denne fremgangsmåde kan, i de fleste tilfælde, ikke endegyldigt bevise eller modbevise, at en hypotese er korrekt, men kan sandsynliggøre den. Hypoteserne eller antagelserne, som efterprøves, vil blive nævnt ved de respektive beregninger. Beregningerne Beregningerne udført i denne rapport bygger på en iterative arbejdsgang. Excel anvendes til at regne et forslag til prognosemodellen eller delresultatet ud, hvorefter der foretages en evaluering af resultatet. Beregningen gentages herefter med ændrede forudsætninger. Hypoteser For at strukturere analysearbejdet og udviklingen af prognosemodelen er der, med udgangspunkt i samtaler foretaget med drift personale og ingeniører ved AVA, blevet formuleret en række hypoteser. a. Varmvandseffekten er uafhængig af udetemperatur, derfor er det ikke nødvendigt at inddrage klimadata i prognosemodellen b. Det er muligt at sammenligne forbrugere og derved inddele dem i forbruger klasser. Dette vil medføre, at der kan anvendes den samme prognose til flere forbrugere c. Fjernvarmeforbruget er markant større i morgentimerne og særligt mandag morgen har en særlig stor forbrugsprofil. d. Der vil være dage, hvor forbruget er unormalt, det vil sige, at morgenspidsen er rykket eller udebliver. e. Nogle forbruger har et meget uregelmæssigt forbrug, hvilket øger risikoen for en misvisende prognose. 10 S ide

MÅLEPERIODE Der er blevet indhentet forbrugerdata af to omgange til dette projekt, begrundelsen for dette er beskrevet i detaljer nedenfor. Udgangspunktet var et ønske om at undersøge to yderpunkter af belastningen, en periode hvor belastningen var meget lav, altså en sommerperiode, og en periode med høj belastning, altså en vinter periode. Men senere i processen, blev det besluttet at fokusere på vinterperioden, dette grunder i flere forhold. 1. Det antages, at sommerperioden ikke er direkte sammenlignelig med vinterperioden, da sommerdrift har en markant anderledes driftskarakteristik end vinterdrift. Analyse af sommerdriften vil derfor være et studie i sig selv 2. Det blev vurderet at ved en fokusering på en periode med høj belastning, bliver prognosen mere anvendelig 3. Kvaliteten af målingerne fra sommerperioden var utilfredsstillende, se afsnittet Reliabilitet og validitet Skæring-Risskov projekt blev iværksat 2011, hvilket betyder, at der er en begrænsning på mængden af tilgængeligt historiske data til analysen. Den varmeste dag i 2011 var den 30. juli, hvilket betyder, at forbruget var på et absolut minimum den dag. Der er udvalgt dage umiddelbart efter og inden til brug i analysearbejdet, altså den 29., 30. og den 31. juli. Det er her værd bemærke sig, at der er tale om fredag, lørdag og søndag og derved adskiller den sig fra vinterperioden, hvor alle måledagene er hverdage. Disse tre sommerdage bliver ikke anvendt i analysen og vil derfor ikke blive behandlet nærmere. Forbrugerdata for vinterperioden var i første omgang 20., 21., 22. og 23. februar 2012. Dette var en periode, hvor temperaturen var over det normale for februar måned (Danmarks Meteorologiske Institut, 2012). Senere i forløbet blev der indhentet supplerende data til analysen, det gælder følgende datoer 30/1, 31/2, 6/2, 7/2, 13/2, 14/2 og 27/2. Disse supplerende datoer blev udvalgt på det grundlag, at det var ønskeligt, at undersøge ugedagen mandag separat og samtidig sammenligne den med en anden hverdag, i dette tilfælde tirsdag. 11 S ide

Klimadata Der anvendes klimadata til at udarbejde en produktionsprognose i AVA, denne prognose anvendes til at koordinere de varmeproducerende aktører, som AVA køber fjernvarme fra. Når klimadata kan anvendes til produktionsprognosen, hvorfor ikke anvende de samme data til en prognose hos den enkelte forbruger? Begrundelsen for ikke at indarbejde vejrdata i prognose værktøjet er sket ud fra flere overvejelser. 1. Klimaprognoser er meget komplicerede og skulle det indgå i forbrugsprognosen, foreligger risikoen at inddragelsen af flere variabler på dette tidlige stadie af prognosens tilblivelse, vil gør modellen vanskelig at evaluere korrekt 2. Den betragtning, at varmvandseffekten med rimelighed kan antages, at være uafhængig af udetemperaturen 3. Det må formodes, at en analyse om klimavariationer i et distrikt, ville skulle foretages, da f.eks. vindforhold antages at variere lokalt alt efter, om bebyggelserne ligger i læ af beplantning eller placeringen i forhold til kysten osv. Nedenfor er en opsummering af datoerne anvendt i rapporten med ugedage, temperatur og soltimer. Dette er inkluderet til trods for, at prognosen er klima uafhængig, men har det formål at give et overblik af klimaet i måleperioden. Dermed kan det bruges til at sandsynliggøre hypotesen om lige netop prognosens klimauafhængig. Se validering. Tabel 1 (Danmarks Meteorologiske Institut, 2012) Temperatur C⁰ Dato Ugedag Nat Dag Soltimer 29. juli 2011 fredag 14 27 9 30. juli 2011 lørdag 15 27,1 12 31. juli 2011 søndag 13 27 7 30. januar 2012 mandag -5 1 7 31. januar 2012 tirsdag -5 0 7 6. februar 2012 mandag -19-1 6 7. februar 2012 tirsdag -19 0 7 13. februar 2012 mandag -10 5 2 14. februar 2012 tirsdag -7 5 0 20. februar 2012 mandag -2 7 4 21. februar 2012 tirsdag -1 8 2 22. februar 2012 onsdag 2 9 0 23. februar 2012 torsdag 3 10 4 27. februar 2012 mandag -2 10 0 12 S ide

Målepunkter Forbrugerdata indhentes fra følgende målere i forsøgsområdet. Blandeskabet Er placeret ved tilslutningen til området, herfra foretages der justering af fremløbstemperaturen, hvilket simuler temperaturoptimering. Omløbsskabe Er placeret for enden af rørstrækningerne. Disse er benævnt numerisk med referencerne 156, 157, 158 og 159. Omløbsskabene tjener det formål, at sikre en minimums temperatur i hovedledningen, således at forbrugeren konstant har den fornødne energi tilrådighed. Dette reguleres med en temperaturstyret ventil. Forbrugere Forsøget omfatter 33 hustande, som alle har en varmemåler installeret, der muligør en fjernaflæsning af deres forbrug. Sortering af målepunkter Forbrugere Det var opgivet følgende oplysninger ved hver husstandsmåler: 1. Kunde ID 2. Vejnavn 3. Hus Nr 4. GPRS Nr 5. Måler Nr 6. Målertype Nr 7. Beskrivelse 8. Placering (Fremløb) 9. Vandflow (m 3 /h) 10. Vandmængde (m 3 ) 11. Temperatur Fremløb(C⁰) 12. Temperatur Retur(C⁰) 13. Energi (Wh) 14. Effekt (W) 15. Datotid 16. Drifttid og Drifttid fejl. Af disse 16 målepunkter er følgende anvendt i denne rapport (vist med fed skrift foroven). Hus Nr, denne betegnelse var tilstrækkelig til at inddele forbrugerne. Vandflowmålingen er bibeholdt i time værdier. Vandmængde og Energi er fra akkumulerende tællere, og disse tællere foretager en afrunding til henholdsvis nærmeste 1000 og 100 enhed, derfor er de ikke blevet anvendt. Der anvendes, som erstatning beregnede effektværdier af Flow og differens temperaturen i analysen, se formler anvendt nedenfor. 13 S ide

Der er ikke tryk målinger ved de individuelle husstande. Omløbsskabene kan anvendes til at give en indikation af trykforholdende i rørstrækningen, se nedenfor. Blande og omløbsskabe De samme målinger var opgivet for blande- og omløbsskabene som for forbrugerne. Med den tilføjelse at omløbsskabene indeholder en tryk måling på fremløbssiden og blandeskabet trykmålinger på fremløb- og retursiden. Blandeskabet har to beregnede værdier, differenstryk og effekt. Blandeskabet har i denne rapport følgende målepunkter: 1. Datotid, Flow (m 3 /h) 2. Tryk Frem (Bar) 3. Tryk retur (Bar) 4. Temperatur Frem (C⁰) 5. Temperaur Retur (C⁰) 6. Difference Tryk (Bar), benævnt DP CNT 7. Effekt (kw). Der er anvendt følgende formler til disse beregninger (Aage Eriksen, 2007) Differenstryk DP CNT = P frem P Retur DP CNT = Differenstryk Central (Bar) P frem & P retur = Trykket på forholdsvis fremløb og retursiden (Bar) Effektforbrug Effekt = Vandflow ρ h Cp (T Frem T Retur ) Effekt = Varmeeffekt (kw) ρ =Massefylde (kg/m 3 ), der regnes med en konstant massefylde på 1000 kg/m 3 for FJVV Cp = Vandets varmefylde (J/(K*kg) der regnes med en konstant varmefylde på 4.19 T frem & T retur = FJVV temperatur (⁰C) for Fremløb og retursiden forholdsvis Forfatteren er bekendt med, at der er en unøjagtighed behæftet med resultatet, når der anvendes konstant Cp og massefylde i beregningerne, men det vurderes, at unøjagtigheden er tæt på ubetydelig, når der ikke er større temperaturdifferens end det er tilfældet i denne analyse. 14 S ide

Reliabilitet og validitet Reliabilitet De historiske målinger er foretaget med en samplingstid på 1 minut, og hver forbruger har på et døgn totalt 1440 målinger. = 0 = 2 60 For at undersøge reliabiliteten af målingerne, er der foretaget en beregning af manglende målinger i procent for hver enkelte forbruger. Formålet er at skabe et overblik over reliabilitet, særligt siden værdier på tværs af forbrugere og datoer vil blive anvendt i nogle af beregninger. Undersøgelsen afdækker ikke tidspunket for udfaldende. Den nedenstående tabel viser gennemsnittet af manglede målinger for alle huse fordelt på de enkelte dage. For den komplette tabel henvises til regnearket Afvigelse Frontend, fane afvigelse. Tabel 2 Hus # 30-jan 31-jan 06-feb 07-feb 13-feb 14-feb 20-feb 21-feb 22-feb 23-feb 29-jul 30-jul 31-jul Afv. % 0 0 0 0 0 0 0 1 7 6 32 34 32 Ved at aflæse tabellen vurderes det, at reliabiliteten er tilfredstillende i januar og februar måned. Den 22. og 23. februar har beskedne udfald, og de vil derfor kunne blive anvendt. Juli perioden er utilfredstillende, da gennemsnitsprocenten er på 32,6 %. Her af tegner 10 huse sig for størstedelen af udfaldende med udfald på over 70 % og kun 14 huse med 0 %. Af denne grund vil juli perioden ikke blive anvendt i analyse arbejdet. Nedenstående tabel viser manglende målinger for blandeskabet, vist i procent for de enkelte dage. Tabel 3 Bl. Skb. 30-jan 31-jan 06-feb 07-feb 13-feb 14-feb 20-feb 21-feb 22-feb 23-feb 29-jul 30-jul 31-jul Afv. % 0 0 0 0 0 0 0 0 0 0 0 0 0 Som det ses på ovenstående, er der ingen manglende data fra blandeskabet. Der er ikke udført nogen beregning for omløbsskabene, da de ikke bliver anvendt i analysen. Validitet For at måleværdier kan anvendes i beregninger, hvor der udregnes effektforbrug, middelværdier og differenstryk, opstilles følgende krav: 1. Kun positive værdier bliver accepteret (X i 0). Negative tal bliver sat til værdien 0 2. Manglende værdier erstattes med et middeltal af det forrige og næste tal, hvis fejlperioden er mindre end 10 minutter 3. Manglende stamdata over 10 minutter ignoreres og vil ikke indgår i beregningerne Validering af forbrugerdata beskrives yderligere i afsnittet Statistisk behandling 15 S ide

DEN GRUNDLÆGGENDE PROGNOSE MODEL Dette kapitel beskriver konceptet for prognose modellen og med udvalgte eksempler søges det, at eftervise konceptets anvendelighed. Indledningsvis anvendes værdier fra blandeskabet med en samplingstid på 30 minutter. Der henvises til regnearket Blandeskab under fanen Eksempel på effektfaktor. Grundide for prognosen Ud fra de historiske data kan en faktor beregnes, som er udtryk for tendensen af forbruget og ikke nødvendigvis belastningens numeriske størrelse. Denne Effektfaktor bygger på to værdier, den gennemsnitlige effekt for alle valide målinger i prognose perioden og den gennemsnitlige øjebliksværdi for alle valide målinger i prognose perioden. Værdierne divideres med hinanden, og resultatet er en faktor serie, som ganges på den seneste effektmåling fra forbrugeren for herved at udarbejde en prognose. Ved at tilsigte en dimensionsløs faktor, kan prognosen flyttes til andre forbrugere relativt nemt, hvis dette skulle blive aktuelt. Tabel 4 Formel for effektfaktor EF x = x i.a + x i.b + x i.c + x i.d x a + x b + x c + x d Hvor EF x = Effekfaktor x i.x = Øjebliksværdier for den pågældende dato ẋ.x = Middelværdi for den pågældende dato Index a, b, c, d = Dato a, dato b osv. Beregningseksempel for effektfaktor Dato tid X i20/2 X i21/2 X i22/2 X i23/2 Midlet kw EF x 05:00:00 180 141 108 120 123 123/155 0,79 05:30:00 182 139 138 136 138 138/155 0,89 06:00:00 246 156 167 133 152 152/155 0,98 06:30:00 222 172 198 178 182 185/155 1,18 07:00:00 284 195 174 152 173 173/155 1,12 07:30:00 205 177 166 145 162 162/155 1,05 08:00:00 196 169 134 148 150 150/150 0,97 08:30:00 200 138 137 134 136 136/155 0,88 09:00:00 183 133 139 117 130 130/155 0,84 09:30:00 222 138 129 112 127 127/155 0,82 10:00:00 188 124 131 98 118 118/155 0,76 10:30:00 156 116 149 103 123 123/155 0,79 11:00:00 137 100 128 91 106 106/155 0,69 ẋ xx/2 200 146 146 128 155 16 S ide

Der ønskes en prognose udført ved blandeskabet fra klokken 5:00 til 11:00 den 27. februar. Prognosen beregnes på følgende måde, øjebliksmålingen fra klokken 5:00 multipliceres med effektfaktoren. Prognose formel Prog X = EF X x i27/2 Tabel 5 Prog X = Effekt værdien beregnet til X klokkeslæt EF X = Effektfaktoren for pågældende X klokkeslæt X i27/2 =Målt effekt ved prognosestart Beregningseksempel for effektfaktor og prognose Dato tid X i20/2 X i21/2 X i22/2 X i23/2 ẋ EF X X i27/2 (5:00) Prog x X i27/2 afv.% 05:00:00 180 141 108 120 123 123/155 0,79 157 125 157-26,1 05:30:00 182 139 138 136 138 138/155 0,89 157 140 166-18,8 06:00:00 246 156 167 133 152 152/155 0,98 157 153 204-32,9 06:30:00 222 172 198 178 182 185/155 1,18 157 185 201-8,8 07:00:00 284 195 174 152 173 173/155 1,12 157 176 217-23,6 07:30:00 205 177 166 145 162 162/155 1,05 157 164 214-30,1 08:00:00 196 169 134 148 150 150/150 0,97 157 152 188-23,5 08:30:00 200 138 137 134 136 136/155 0,88 157 138 166-20,3 09:00:00 183 133 139 117 130 130/155 0,84 157 131 189-43,8 09:30:00 222 138 129 112 127 127/155 0,82 157 128 163-27,1 10:00:00 188 124 131 98 118 118/155 0,76 157 119 162-36,1 10:30:00 156 116 149 103 123 123/155 0,79 157 124 152-22,3 11:00:00 137 100 128 91 106 106/155 0,69 157 108 152-41,2 ẋ xx/2 200 146 146 128 155 Det ses i den yderste røde kolonne og på diagrammet nedenfor, at der er en stående afvigelse imellem prognosen og det reelle forbrug. Prognosen ligger gennemsnitligt 27,3% under det reelle forbrug, det fremgår også, at prognosen er dæmpet i forhold til det reelle forbrug. Dette tilskrives aliasfænomentet, hvilket er beskrevet i afsnit Samplingstid. Diagram 1 250 Diagram over prognose eksempel 200 150 100 04:48:00 06:00:00 07:12:00 08:24:00 09:36:00 10:48:00 12:00:00 Progx Xi27/2 17 S ide

Det er muligt at korrigere for den stående afvigelse, under den antagelse at afvigelsen kan tilskrives en difference imellem opvarmningseffekten for real værdierne og prognosens grundlag. I eksemplet starter prognosen klokken 5:00 og på dette tidspunkt af døgnet, er det sandsynligt, at belastningen udgøres af opvarmningseffekten. På dette grundlag er følgende formel udviklet til korrigering af effektfaktoren. Metode til korrigering af effektfaktor EF k = EF x ( x i27/2 ) prog x(5:00) EF k = korrigeret effektfaktor EF x = effektfaktor X i27/2 = reelt effektforbrug, X klokkeslæt ved prognosens start Tabel 6 Prog X(5:00) = den Prognose effekten klokken 5:00 Korrigeret effektfaktor Dato tid EF X i27/2 (5:00) Prog x X i27/2 afv.% EF k Prog x(k) Afv.% 05:00:00 0,79 157 125 157-26,1 1,05 165 5,1 05:30:00 0,89 157 140 166-18,8 1,15 181 8,1 06:00:00 0,98 157 153 204-32,9 1,24 194-4,9 06:30:00 1,18 157 185 201-8,8 1,44 226 10,9 07:00:00 1,12 157 176 217-23,6 1,38 216-0,2 07:30:00 1,05 157 164 214-30,1 1,31 205-4,2 08:00:00 0,97 157 152 188-23,5 1,23 193 2,7 08:30:00 0,88 157 138 166-20,3 1,14 179 7,2 09:00:00 0,84 157 131 189-43,8 1,10 172-9,7 09:30:00 0,82 157 128 163-27,1 1,08 169 3,6 10:00:00 0,76 157 119 162-36,1 1,02 160-1,3 10:30:00 0,79 157 124 152-22,3 1,05 165 8,0 11:00:00 0,69 157 108 152-41,2 0,95 149-2,3 I yderste højre kolonne er afvigelsen for den korrigeret prognose listet med index (k), som det ses, er der opnået en væsentlig forbedring af prognosens nøjagtighed, der nu ligger 1.8 % over det reelle belastningsniveau. Grafisk er det vist nedenfor. Diagram 2 250 Diagram over korregeret prognose eksempel 200 150 100 04:48:00 06:00:00 07:12:00 08:24:00 09:36:00 10:48:00 12:00:00 Progx(k) Xi27/2 18 S ide

Påvirkning af korrektionens størrelse Der kan justeres på afvigelsens indvirkning på prognosen ved at ændre på 1 tallets numeriske værdi. Derved er det muligt at foretage en tilpasning af korrektionsfaktoren, hvilket kunne være ønskeligt, hvis korrektionsfaktoren kontinuerligt er for aggressiv eller for dæmpet ved en individuel forbruger. Delkonklusion Ovenstående beregninger viser, at der er et potentiale i prognose modellen, men der er dog en række forhold, som ikke er taget med i denne model. 1. Der er ikke taget hensyn til validiteten af de historiske data, som effektfaktoren er beregnet udfra eller om den 27. februar i sig selv er valid 2. Modellen er beregnet på grundlag af den samlede belastning fra alle forbrugere i området. På enkelt forbruger niveau er processen meget mere dynamisk med kortvarige, markante belastningsændringer, som et resultat af varmtvandsforbruget 3. Samplingstiden er meget lav for modellen, 30 minuter kontra stamdataens samplingstid på 1 minut. Dette kan accepteres på blandeskabet, men hos de enkelte forbrugere vil dette resultere i en misvisning. 4. Det fremgår af tabellen, at forbruget mandag er højere end hos nogle af de andre dage. Er dette så udpræget, at der skal tages særligt hensyn? 19 S ide

SAMPLINGSTID Samplingstiden er en vigtig parameter, hvor der i traditionel forstand forstås den tid, der går imellem to indlæsninger, fra et målepunkt til en PLC f.eks. (Heilman, 1998). Samplingstiden på varmemålerne i forsøgsområdet er fastsat til 1 minut, derfor skal begrebet i denne rapport forstås således, at det er tiden der går imellem læsning af historisk data fra serveren til prognosemodellen. Dette medfører, at der maksimalt kan samples 60 gange i timen. Betydningen af samplingstid Effektmålingerne fra målepunktet har en samplingstid på 1 minut, det gør målingerne sårbare i forhold til stabilitet, hvis der er mange mindre udsving i løbet af måleperioden, eller signalet er påvirket af interferens. Hvis prognosemodellen anvender en højere samplingstid, f.eks. 5 minutter, som grundlag for effektfaktoren, kan det resultere i en afvigelse. Begrebet kaldes Aliasfænomenet eller Nedfoldning og dækker over det, der sker, når et signal bliver samplet for sjældent, og derfor bliver misfortolket som en svingning med lavere frekvens. For at undgå dette fænomen skal samplingstiden mindst være det dobbelte af den højeste frekvens, som dataopsamlingen foregår ved. (Heilman, 1998) Diagram 3 Eksempel på Aliasfænomenet Historisk Data Sampling 1,5 0,75 0-0,75-1,5 1 3 5 7 9 11 At bruge en samplingstid på 30 sekunder til prognosemodellen er ikke muligt, da den som nævnt er fastlåst til 1 minut. Alternativt kan de historiske data efterbehandles, inden de bliver indlæst i prognosemodellen. Dette kunne løses ved at anvende et glidende gennemsnit, på engelsk kaldet Simple moving average (SMA). Resultatet af en sådan matematisk behandling ville være en udglatning af målingerne. Tilnærmet kan man sammenligne SMA med at anvende et 1.ordens filter på signalet, som f.eks. et RC led, selvom matematikken bag ikke er identisk, så er resultatet sammenligneligt. SMA er defineret som følgende: Analyseværktøjet glidende gennemsnit beregner værdier i prognoseperioden på grundlag af variablens gennemsnitsværdi i et bestemt antal foregående perioder. Et bevægeligt gennemsnit frembringer tendensoplysninger, som ikke kan aflæses ud fra et simpelt gennemsnit af alle historiske data. (Microsoft.com, 2012) 20 S ide

Den udglattende egenskab vises i nedenstående Diagram 4, hvor hus nummer 21 anvendes som eksempel. Der er anvendt en samplingstid på 1 minut og SMA er beregnet med 11 samplinger (n) og 6 samplinger. Diagram 4 Eksempel på SMA 40,00 35,00 30,00 25,00 20,00 15,00 10,00 5,00 0,00 04:48:00 06:00:00 07:12:00 08:24:00 09:36:00 Effekt kw SMA n=11 SMA n=6 Som det fremgår af Diagram 4, opnås der en udglatning af effektmålingen, når der anvendes SMA (rød kurve) i forhold til den ubehandlede måling (blå kurve). Der sker en forskydning af den røde kurve, således at den ved måleændringer er bagefter den blå kurve. SMA beregnet med 6 samplinger (grøn kurve) nedbringer denne forskydning til omtrentlig det halve. Varmtvandseffekten, der udgør de markante og pludselige udsving, bliver delvist udglattet med SMA og når ikke samme niveau. Dette medfører, at en eventuel analyse af spidsbelastninger, foretaget på grundlag af SMA behandlet værdier, ikke vil vise et retvisende billede af spidsbelastningen. Siden det er interessant at undersøge varmtvandsbelastning i forhold til fjernvarmenettes kapacitet, er det hensigtsmæssigt at disse målinger vises med så reelle værdier som muligt. Derfor anbefales det, at SMA ikke anvendes, medmindre der kompenseres for denne misvisning på en af to måder. 1. SMA ændres til Eksponentielt vægtet glidende gennemsnit, forkortet EXMA 2. Der anvendes et filter, der lader de store værdier passere forbi SMA, et varmtvandseffekt filter forkortet VVEF. EXMA er en variation af SMA, hvor værdiernes bidrag til gennemsnittet aftager eksponentiel jo ældre værdierne bliver, dette betyder at nyere målinger har større betydning end i SMA. SMA anvender til sammenligning alle værdier ligeligt. Dette vil forbedre visningen af spidsbelastningssituationer, men vil stadig resultere i en misvisning. Den optimale løsning imellem de to muligheder vil derfor være, at lade spidsbelastningsværdier passere SMA beregningen og blive vist ubehandlet. Dette vil eliminere misvisningen fra SMA, imens den dæmpende virkning bibeholdes. 21 S ide

Implementeres denne løsning med det kriterium, at effekter kw > 15 med VVEF passere udenom SMA funktionen, opnås der en udglatning af signalet, uden at der opstår en misvisning af varmtvandseffekten. Dette fremgår af Diagram 5 nedenfor. De 15 kw er sat som grænse for filteret, da værdien er omtrentligt det dobbelte af opvarmningseffekten. Diagram 5 Eksempel på SMA med effekt gennemgang 40,00 35,00 30,00 25,00 20,00 15,00 10,00 5,00 0,00 04:48:00 06:00:00 07:12:00 08:24:00 09:36:00 Effekt kw SMA n=11 SMA n=6 Problemet ved at vælge en samplingstid der er højere end 1 minut er, at en stor del af varmtvandsbelastningen typisk har en varighed på under 10 minutter og ofte under 5 minutter. Dette varier selvfølgelig med den individuelle forbruger, men kan godt anvendes som en tommelfingerregel. Dette betyder, at for eksempel en samplingstid på 5 minutter kan overse meget markante belastninger, selvom der anvendes ovennævnt metoder. Der henvises til afsnittet Analyse af 5 minutters samplingstid og SMA behandlingens indvirkning på konfidensintervallet. for nærmere om dette fænomen. 22 S ide

STATISTISK BEHANDLING For at opbygge et prognose værktøj er det nødvendigt at få en forståelse for, at forbrugsmønstre afhænger af mange faktorer såsom årstid, solskin, vind, bygningstype og vigtigst, de mennesker som bor i ejendommen eller er brugere heraf. Indtil videre er der, i denne rapport blevet anvendt grafiske kurver til at sammenligne forbrugsmønstre. Dette er velegnet til hurtigt at kunne vurdere om en metodes grundlæggende koncept er brugbar, en såkaldt back off the envelope beregning. Dog kan en sådan metode ikke regnes som fyldestgørende for at danne grundlag til en endelig løsningsmodel, derfor anvendes statistiske værktøjer til behandle den store mængde data fra varmemålerne. Antagelser Den statistiske behandling bygger på en række antagelser, som vil blive gennemgået under de respektive metoder. En besvarelse på følgende spørgsmål søges igennem den statistiske beregning: Hvor stor variation forefindes der hos de forskellige forbrugere og kan man inddele døgnet i nogle belastningsscenarier ud fra disse variationer Kan man gruppere forbrugere sammen efter deres forbrugsprofil Validering af data, hvornår er afvigelsen af måledata så stor, at man kan/skal se bort fra den i relation til prognosen For at besvare disse tre spørgsmål beregnes middelværdien og variansen (eller spredningen) af data fra samme population. På grundlag af de to værdier beregnes konfidensintervallet for værdierne. Nedenfor bliver disse begreber uddybet. Middelværdien Dette er gennemsnittet af dataserien, og det antages, at der er tale om, at værdierne fordeler sig ligeligt i forhold til middelværdien, altså en normalfordeling. Normalfordelingskurven kaldes også en klokkekurve og har to parametre, nemlig middelværdien og spredningen. Jo mindre variansen er jo smallere bliver klokkekurven og modsat Normalfordeling bliver den bredere, når variansen er større. Kurven er symmetrisk omkring middelværdien, og hvis middelværdien ændres, så fører det til, at kurven bliver parallel forskudt i x aksens retning. (vestergaard, 2008) Denne antagelse har betydning i de efterfølgende beregninger af konfidensintervallet, hvor en distributionsfaktor bliver valgt efter, hvordan værdierne fordeler sig i forhold til middelværdien. Hvis kurven f. eks. er usymmetrisk, så skal en anden beregning eller tabelværdi for distributionsfaktoren anvendes. Hvis der fortages en analyse af forbruget over et døgn, er det tydeligt, at der ikke er tale om normalfordeling og en sådan antagelse vil være uforsvarlig. Derfor inddeles døgnet i mindre perioder, hvor det antages, at forbruget forløber efter normalfordeling, f. eks. i løbet af morgenspidsen. Dette åbner også for den mulighed, at når forbrug skal sammenlignes, sammenlignes det i 23 S ide

mindre perioder, således at hus A og B eventuelt har samme forbrugsmønster om morgenen, men om aftenen er der sammenfald imellem hus A og C. Nedenfor er formlen for beregning af middelværdien (Pharmpress, 2002): Formel for middelværdi x = n n x i i=1 Hvor n = antal samplinger x i = øjebliksværdi x = middelværdi Varians Det er interessant at undersøge, hvor stor variation der er i forhold til middelværdien, da dette kan give et overblik over stabiliteten af de målingerne, der foretages. Varians beregnes på følgende måde: Formel for varians n σ = n (x i x ) 2 i=1 Hvor n = antal samplinger x i = øjebliksværdi x = middelværdi σ = varians Konfidensinterval Konfidensintervallet angiver usikkerheden på en målt værdi og beregnes ud fra middelværdien, varians og distributionsfaktoren. Distributionsfaktoren er i denne rapport en tabelværdi, som vælges ud fra fordelingenskurven (normalfordeling) og den ønskede procentmæssige størrelse af intervallet, typisk 90, 95 eller 99 %. Intervallets størrelse repræsenter sandsynligheden for, at en måling er inden for populationens middelværdi. Det er vigtigt, at man er opmærksom på forskellen imellem populationens middelværdi og dataseriens middelværdi, for selvom de ofte numeriske vil have tilsvarende samme værdi, vil de aldrig være ens, dette faktum tilskrives variationen. (Pharmpress, 2002) 24 S ide

Man skal også være opmærksom på, at konfidensintervallet også vil variere i størrelse. Dette skyldes, at intervallet beregnes ud fra dataseriens variation, og derfor vil forskelle i variation også resultere i forskellige intervalstørrelser. Distributionsfaktoren afgør også størrelsen af intervallet og skal tolkes på følgende måde. Hvis 90 % vælges som en parametre, så vil 90 % af dataserierne være indenfor populationsmiddelværdien. Et eksempel på dette vises nedenfor, hvor konfidensintervallet på 10 dataserier er blevet beregnet med en distributionsfaktor svarende til 90 %. Populations middelværdien, den stiplede linje, er beregnet til 50 enheder og middelværdierne for dataserierne er vist med den sorte bjælke og de respektive konfidensintervaller er visuelt vist med en grå, lodrette linje. Dataserien med * er ikke indenfor populationsmiddelværdien, hvilket stemmer overens med en distributionsfaktoren på 90 %, altså at i en population på 10 dataserier vil en dataserie være udenfor populations middelværdien. Derfor er distributionsfaktoren en vigtig parameter i beregning af konfidensintervallet, men fastsættelse af værdien, om det skal være 80 % eller 95 %, er en beslutning, som tages af beregneren eller modeludvikleren. Der vælges, i denne analyse en distributionsfaktor på 1,96, hvilket svarer til 95 %. Det er vigtigt at pointere, at distributionsfaktoren er afhængig af antallet af samplinger (n). Ændringen sker på 3. decimal, så længe at samplingsantallet er over 30, derfor anses det i denne forbindelse at være ubetydeligt. For at undersøge påvirkningen, hvis 99 % vælges som distributionsfaktor, er der udført beregninger med den pågældende faktor. Konfidensintervallet er tosidet og giver derfor to resultater, en positive og en negative værdi benævnt Maks og min. Inden for dette interval kan de indsamlede data valideres. Intervallet beregnes på følgende måde. Formel for Konfidensinterval μ = x ± σ F n hvor x = middelværdi n = antal samplinger σ = varians F = distributionsfaktor μ = konfidensinterval 25 S ide

Statistisk analyse Analysen tager udgangspunkt i data fra Excel arket Klynge 1 mandag og der anvendes ovenstående formler til beregningen. Der er foretaget flere beregninger med forskellige parametre. Det er gjort for at undersøge, hvilke der er optimale. Analysen arbejder næsten udelukkende med morgenspidsperioden. Dette er valgt som fokuspunkt, da det er varmtvandseffekten, der er vanskeligt at modellere tilfredsstillende. Morgenspidsen inddeles i en 6 eller 4 timers periode. Nedenstående Diagram 6 viser forbruget fra fem mandage ved hus nr. 21 i tidsrummet kl. 5 til kl. 9. Som det fremgår, sker varmtvandsforbruget indenfor dette tidsrum. Diagram 6 40,00 30,00 "Morgenspidser" 20,00 10,00 0,00 04:48:00 06:00:00 07:12:00 08:24:00 09:36:00 Begrundelsen for at undersøge en 6 timers samplingsperiode sideløbende med en 4 timers periode er at undersøge, hvilken indvirkning det har på konfidensintervallet. Målet med rapporten er at formulere et værktøj, der kan udarbejde en prognose på 6 timer. En kortere prognoseperiode er acceptabel, hvis man derved opnår en forbedring af nøjagtigheden på prognosen. Det er nødvendigt, at knytte prognosemodellen til konfidensintervallets antal samplinger (n), for at kunne anvende intervallet, som en indikator for prognosens validitet. 26 S ide

Vejledning til Excel ark Beregningsgennemgangene er i vist detaljeret i Excel projektmappen klynge 1 mandage og er inddelt i to sektioner. Beregninger udført med de enkelte forbrugere er på fanerne benævnt efter deres respektive husnummer og beregninger udført for de syv huse samlet, fordelt efter datoerne, er vist under fanerne med datomærkning. Under hus fanerne, markeret med rødt foroven, er følgende beregninger. Forbrug målt med et minuts samplingstid for 30/1, 6/2, 13/2, 20/2 og 27/2. a. SMA behandlet effektmåling med gennemgang af værdier over 8 kw. Derefter er der samplet med et 5 minutters interval fra den behandlede værdi. Efterfølgende er værdierne blevet hentet til Dato fanerne b. Konfidensinterval beregnet fra kl. 5:00 til 8:59 med 1 minutters samplingstid, dette giver ƞ=240 samplinger. Distributionsfaktoren er beregnet med både 95 % og 99 % for at sammenligne c. Ovenstående beregning er gentaget med 50 % flere målinger. Fra kl. 5:00 til 10:59, hvilket er ƞ=360 samplinger. Distributionsfaktoren er regnet med 95 % værdien d. En prognose er beregnet fra kl. 5:00 og indtil kl. 8:59, der er anvendte Korrigeret effektfaktor og de historiske data, som danner grundlag for prognosen, er valideret ud fra de beregnede konfidensinterval. Kriteriet for valideringen var at de valgte dage, ud fra konfidensintervallet, skulle have samme driftsforhold. Datofanerne har alle huse listet med den pågældende dato. Der er tale om effektværdier med samplingstid på 5 minutter. Beregningerne foretaget på disse ark er: e. En beregning af konfidensinterval med en samplingstid på 5 minutter af ubehandlede kw målinger i tidsrummet kl.5:00 til kl. 10:55, hvilket giver ƞ=72 samplinger. f. Ovenstående beregning er gentaget, men med de SMA behandlede data fra punkt a. under hus fanerne 27 S ide

Analyse af samplingstid med konfidensinterval 4 timers samplingsperiode i forhold til 6 timers Ved beregning af konfidensintervallet har antallet af samplinger en stor betydning, der som forklaret i forrige afsnit beregner, i hvilket spænd 95 % af målingerne befinder sig. Derfor vil en forøgelse af antal målinger med værdier tæt på middel resultere i, at konfidensintervallet bliver mindre, da flere af de store varmtvandseffekter bliver frasorteret i beregningen. Som det ses på formlen, er konfidensintervallet funktionen af variansen divideret med antal samplinger, og siden variansen er et produkt af den målte værdi minus middelværdien i anden potens, så vil det fører til, at intervallet bliver mindre. Det er tydeligt ved alle beregninger udført i regnearket klynge 1. Som eksempel ses nedenfor to tabeller med hus nummer 25, hvor samplingsperioden er forskellig. Tabel 7 4 timers periode fra kl 5:00 til 8:59, 1 minuts samplingstid Konfidens 2,65 1,73 0,08 3,10 3,50 Hus # 25 30-jan 06-feb 13-feb 20-feb 27-feb Maks 10,20 9,03 5,74 9,44 8,30 Middel 7,55 7,30 5,66 6,34 4,80 Min 4,90 5,57 5,58 3,24 1,30 Tabel 8 6 timers periode fra kl 5:00 til 10:59, 1 minuts samplingstid Konfidens 1,51 0,94 0,05 1,72 1,96 Hus # 25 30-jan 06-feb 13-feb 20-feb 27-feb Maks 8,50 8,33 5,90 7,65 6,27 Middel 6,98 7,38 5,85 5,92 4,32 Min 5,47 6,44 5,80 4,20 2,36 Der ses en tydelig forskel på Tabel 7 og Tabel 8. Konfidensintervallet ved 4 timers perioden er omtrentlig en halv gange større end ved en 6 timers periode. Dette skyldes, den før nævnte, forøgede samplings mængde. Man kan altså derfor konkludere, at en samplingsperiode på 4 timer giver det bedste resultat og burde vælges som en standard, hvis det er muligt at have en høj samplingstid. I forhold til at anvende en højere distributionsfaktor på f.eks. 99 %, så er det blevet undersøgt med en 4 timers periode. Generelt er resultatet som ventet, nemlig at konfidensintervallet er steget sammen med forøgelsen af distributionsfaktoren, hvilket stemmer overens med det faktum, at den inkluderer 99 ud af 100 målinger, kontra 19 ud af 20 målinger ved 95 %. Der er ikke fundet belæg for at fravælge 95 % som standard, dette skyldes, at middelværdien forbliver uændret og det forøgede konfidensinterval giver ikke i sig selv en større indsigt i driftssituationen sammenlignet med 95 %. Forneden er vist et eksempel med hus nummer 25. Tabel 9 4 timers periode fra kl 5:00 til 8:59, 1 minuts samplingstid Distributions Faktor 99 % Konfidens 3,49 2,27 0,11 4,08 4,61 Hus # 25 30-jan 06-feb 13-feb 20-feb 27-feb Maks 11,04 9,57 5,77 10,42 9,41 Middel 7,55 7,30 5,66 6,34 4,80 Min 4,06 5,03 5,56 2,26 0,19 28 S ide

Analyse af 5 minutters samplingstid og SMA behandlingens indvirkning på konfidensintervallet. At anvende glidende gennemsnit (SMA) og effekt gennemgang er forklaret i forrige afsnit, der er to formål med at gentage en analyse. Det første, ud fra et ønske om at påvise metodens anvendelighed hos specifikke forbrugere, hvor den tidligere beregning byggede på data fra blandeskabet. For det andet at afdække SMA metodens indvirkning på konfidensintervallet og derved afklare om det er en metode, som kan anbefales at anvende i prognosemodellen. Som eksempel er datoen 30. januar udvalgt. Tabel 10 med blå bjælke vises det intervallet for de syv hus beregnet uden SMA metoden. Tabel 11 med den grønne bjælke viser samme beregning udført med SMA og hvor effektværdier over 8 kw er overført direkte. 8 kw er valgt, da det var omtrentlig 1.3 gange middelværdien. Tabel 10 6 timers periode, 5 minutters samplingsfrekvens, ingen databehandling Konfidens 2,384 3,987 4,673 12,807 0,673 1,881 0,516 30. januar 2012 21 23 25 27 29 31 33 Maks 9,20 9,15 11,91 18,35 5,20 6,25 5,19 Middel 6,81 5,16 7,23 5,54 4,52 4,37 4,67 Min 4,43 1,18 2,56-7,27 3,85 2,49 4,16 Tabel 11 6 timers periode, 5 minutters samplingsfrekvens, SMA Effekt gennemgang >8kW Konfidens ± 2,50 4,11 5,26 6,03 0,66 2,35 6,23 30. januar 2012 21 23 25 27 29 31 33 Maks 9,51 9,42 12,72 11,78 5,20 6,93 11,07 Middel 7,01 5,30 7,46 5,76 4,54 4,58 4,84 Min 4,51 1,19 2,21-0,27 3,89 2,23-1,38 Det fremgår, at der ved flere forbrugere, er markant forskel på konfidensintervallet imellem de to beregninger. Det er differensen af spredningen på intervallet, der er markant, middelværdien er uden samme grad af variation. Dette billede stemmer overens med den tendens, som kunne aflæses af diagrammerne i afsnit Betydningen af samplingstid, at en høj samplingstid medfører den risiko, at kortvarige, markante varmvandseffekter kan blive overset af prognosemodellen. Denne konklusion bliver også bekræftet, når man sammenligner konfidensintervallet beregnet i ovenstående Tabel 11, med konfidensintervallet beregnet i Tabel 8 fra afsnit 4 timers samplingsperiode i forhold til 6 timers. Sammenfattet i nedenstående tabel. Tabel 12 Forbruger# 25 5 min, SMA 1 minut Δ Konfidens ± 5,26 1,51 3,74 Maks 12,72 8,50 4,22 Middel 7,46 6,98 0,48 Min 2,21 5,47-3,27 29 S ide

Delkonklusion Det kan konkluderes ud fra den gennemførte analyse, at højere samplingstid vil medføre forhøjet risiko for markante misvisninger af forbruget, selv når der udføres databehandling af værdierne. Pooled data Samling af tidsserier Det er muligt at sammenligne og samle dataserie fra f.eks. forskellige dage og/eller forbrugere, hvis de opfylder en række betingelser. De skal være i samme population, det vil sige, er indsamlet indenfor samme driftsforhold. Definitionen Samme driftsforhold antages i denne analyse at være opfyldt, når middelværdien A ligger indenfor intervallet af dataserie B og modsat. Dette kaldes Pooled data sampling og der beregnes en middelværdi, varians og konfidensinterval med index p for pooled. Følgende formler anvendes til pooled værdier. Det antages, at distributionsfaktoren er uændret. Middelværdien p Varians p Konfidensinterval p x p = x 1 n 1 + x 2 n 2 n 1 + n 2 σ p 2 = n 1 σ 1 2 + n 2 σ 2 2 n 1 + n 2 μ p = x p ± F σ 1 2 2 n 1 + σ 2 n 2 Grafisk fortolket kan denne regel ses med et eksempel, som vist på nedenstående diagram. A & B opfylder kravet om samme driftsforhold og kan derfor samles til et konfidensinterval. De to røde og blå streger viser det interval, som Middelværdierne A og B forholdsvis skal ligge indenfor. Bemærk at C ikke opfylder kravet til at blive lagt sammen med A, men kunne teoretisk ligges sammen med B. Det betyder, at når man beslutter at anvende konfidensintervallet til dette, så er det nødvendigt at afklare, hvilken type konfidensinterval der er mest repræsentativ for driften. Alle sammenligninger af konfidensintervaller skal tage udgangspunkt i de originale grunddata, det medfører, at hvis AB var indenfor C så var det ikke tilladt at samle de to værdier. Diagram 7 30 S ide