Statistik for ankomstprocesser

Størrelse: px
Starte visningen fra side:

Download "Statistik for ankomstprocesser"

Transkript

1 Statistik for ankomstprocesser Anders Gorst-Rasmussen 20. september 2006 Resumé Denne note er en kortfattet gennemgang af grundlæggende statistiske værktøjer, man kunne tænke sig brugt til at vurdere rimeligheden af og sidenhen til at fastlægge en fornyelsesmodel for ankomstprocessen i et køsystem. Vi betragter et ikke nærmere specificeret køsystem, hvori {T n : n = 1,2,...} er en følge af ankomsttider (ankomstproces), og {U n : n N} er den tilhørende følge af interankomsttider, dvs. U 1 := T 1, U n := T n T n 1, n = 2,3,... I denne note skal vi udelukkende se på statistisk inferens for ankomstprocessen på baggrund af interankomsttider. Nærmere bestemt koncentrerer vi os i dette kursus om ankomstprocesser, som er fornyelsesprocesser, dvs. interankomsttider er uafhængige og identisk fordelte. I mindre tekniske termer kan disse antagelser formuleres som følger: 1. Hver kunde vælger sin ankomsttid uafhængig af de forudgående kunder. 2. Ankomstprocessen ser ens ud til alle tidspunkter, specielt er ankomstraten (gennemsnitligt antal ankomster per tidsenhed) er konstant over tid (stationaritet). Disse antagelser er typisk kun er grove approksimationer i dagligdags køsystemer. I et supermarked har folk tendens til at ankomme i klynger, alt imens ankomstraten varierer betydeligt i løbet af dagen; i et produktionssystem kan interankomsttiderne bedre antages uafhængige, men ofte vil ankomstraten variere i tid. På trods af den slags mangler, vil man ikke desto mindre ofte insistere på at anvende en fornyelsesmodel for ankomstprocessen, eksempelvis over tilpas små tidsrum, hvis der er tvivl om stationaritet. Begrundelsen er rimelig nok: fornyelsesmodellen er simplest mulige stokastiske model for ankomstprocessen i den forstand, at det er tilstrækkeligt at specificere interankomstfordelingen. Med en så simpel model er det 1

2 særligt let at simulere køsystemet mhp. at vurdere diverse performanceparametre. Endvidere rummer klassen af fornyelsesankomstprocesser den helt centrale stationære Poisson ankomstproces, under hvilken man i mange tilfælde kan udføre delvis eksakte analyser af køsystemet. Givet observationer fra en konkret ankomstproces er det derfor naturligt at undersøge vha. statistiske metoder, hvorvidt en fornyelsesmodel er en god model for ankomstprocessen og i bekræftende fald hvordan fornyelsesmodellen bør se ud i detaljer. Der skal tages stilling til følgende fire punkter: 1. Er stationaritetsantagelsen rimelig? 2. Er uafhængighedsantagelsen for interankomsttider rimelig? 3. Hvilken parametrisk klasse af fordelinger stammer interankomsttider fra? 4. Givet en rimelig parametrisk klasse af fordelinger, hvad er det bedste bud på parameterværdien for fordelingen af interankomsttider på baggrund af observationerne? I det følgende beskrives en række grundlæggende statistiske værktøjer til at håndtere hvert enkelt af ovenstående punkter. 1 Stationaritet Lad x 1,...,x n være observationer af en stokastisk proces {X n : n N}. En simpel men effektiv måde hvorpå man kan undersøge for stationaritet er ved at plotte observationer (i nærværende sammenhæng givet ved interankomsttider) mod deres indeks, dvs. plotte punkterne (i,x i ) for i = 1,...,n. Følgende er tegn på ikkestationaritet: 1. Trends eller skift i lokation over observationsnummer. 2. Skift i variation over observationsnummer. Hvis data er spredt jævnt omkring gennemsnittet uden af de ovenstående afvigelser, vil man typisk acceptere stationaritetsantagelsen. Se Figur 1 for eksempler. Man bør altid tage datakilden ind i overvejelserne, når man vurderer stationaritet. Ofte vil man på forhånd have en klar idé om, hvorvidt en ankomstproces er ikkestationær over et længere tidsinterval. Hvis det er tilfældet, bør man overveje at splitte datasættet af ankomsttider op i flere datasæt over mindre tidsintervaller, over hvilke man forventer stationaritet. Observationsfølgerne hørende til hvert tidsinterval kan derpå undersøges enkeltvis. 2

3 Stat. proces Ikkestat. proces Observation Observation Observationsnummer Observationsnummer FIGUR 1. Eksempler på plot af observationer mod indeks i en stationær (venstre) og ikkestationær (højre) stokastisk proces. Processen til venstre udviser ingen tydelige tegn på skift i lokation eller variation. Processen til højre udviser derimod periodisk trend. Endvidere er der et skift i variation omkring de sidste 20 observationer. 2 Uafhængighed af interankomsttider Et udbredt mål for afhængigheden mellem stokastiske variable er deres korrelation. Vi genkalder os først, at variansen af en stokastisk variabel X, hhv. kovariansen for to stokastiske variable X,Y, defineres som Var(X) := E(X EX) 2 = E(X 2 ) (E(X)) 2 ; Cov(X,Y) := E ( (X E(X))(Y EY) ) = E(XY) E(X)E(Y). Korrelationen mellem X,Y er da defineret som følger: (1) ρ(x,y) := Cov(X,Y) Var(X)Var(Y). Det kan vises, at korrelationen besidder følgende egenskaber: 1. ρ(x,y) ρ(x,y) = 1 Y = ax + b for konstanter a > 0 og b R. 3. ρ(x,y) = 1 Y = ax + b for konstanter a < 0 og b R. Iht. punkt 2-3 måler korrelationen den lineære afhængighed mellem X og Y : jo større (numerisk) korrelation, jo nærmere perfekt lineær er sammenhængen mellem X og Y. Negativ korrelation betyder, at X og Y har negativ samvariation jo større værdi af X, jo mindre værdi af Y. Positiv korrelation betyder, at X og Y har positiv samvariation jo større værdi af X, jo større værdi af Y. Hvis ρ(x,y) = 0, kaldes X og Y ukorrelerede. 3

4 y y x x2 y y x x4 FIGUR 2. Figurerne viser plot af observationer af stokastiske vektorer (X,Y). I alle tilfælde er ρ(x,y) = Kvalitativt forskellige former for afhængighed kan altså lede til samme korrelationskoefficient. Endvidere kan korrelationskoefficienten være stor, selvom afhængigheden er langt fra lineær (figuren nederst til højre) eller omvendt, korrelationskoefficienten kan være lille, selvom afhængigheden er meget tæt på lineær (figuren nederst til højre). Tommelfingerreglen at stor korrelation lineær sammenhæng bør anvendes varsomt i praksis. Som vist i Figur 2 kan andre og mere komplicerede sammenhænge end linearitet give anledning til stor korrelation. Bemærk at hvis X og Y er uafhængige, gælder E(XY) = E(X)E(Y) og dermed ρ(x,y) = 0 ifølge (1), dvs. X og Y er ukorrelerede. Det omvendte gælder ikke ukorrelerede variable er generelt ikke uafhængige (tjek selv ved at udregne korrelationen mellem stokastiske variable X og Y = X 2, når E(X) = 0). Til gengæld er korrelationen et meget parsimonisk mål for afhængighed (vi kan nøjes med ét tal), og giver sædvanligvis en rimelig idé om graden af afhængighed. Hvordan estimeres korrelationer ud fra data? Givet uafhængige observationer x 1,...,x n af en stokastisk variabel X kan variansen af X estimeres ved følgende: Var(X) = n 1 n (x i x i ) 2, x = n 1 n Hvis Y er en anden stokastisk variabel, fra hvilken vi har uafhængige observationer y 1,...,y n, kan kovariansen mellem X og Y estimeres ved Ĉov(X,Y) = n 1 n (x i x)(y i y), x = n 1 n Følgelig kan korrelationen mellem X og Y estimeres ved x i. x i, y = n 1 n y i. Ĉov(X,Y) n (2) ˆρ(X,Y) = = (x i x)(y i y) Var(X) Var(Y) n (x i x) 2 n (y i ȳ) 2. 4

5 Det kan vises, at ˆρ(X,Y) nærmer sig den sande korrelation ρ(x,y), når antallet af observationer går mod uendelig, dvs. ˆρ er en såkaldt konsistent estimator. Vi er interesserede i at anvende korrelationer til at vurdere afhængigheder i en følge af stokastisk variable, dvs. en stokastisk proces. Lad X := {X n : n N} være en sådan stokastisk proces. Til X knytter vi autokorrelationsfunktionen ρ(m,n) := ρ(x m,x n ), m,n N. Autokorrelationsfunktionen beskriver graden af afhængighed mellem givne observationer X m og X n i processen. Vi kan i princippet estimere ρ(m,n) ved estimatoren (2); det kræver imidlertid, at vi kan observere den stokastiske proces til samme tidspunkt mange gange, uafhængigt af hinanden. I praksis har man kun én observation for hvert tidspunkt, og man vil derfor typisk antage, at X er svagt stationær. Ved dette forstås, at E(X n ) og E(X n ) 2 er uafhængige af n. I så fald følger det af definitionen på korrelation og autokorrelation, at ρ(m, n) kun afhænger af differensen m n. Det kan så vises, at ρ(n) kan estimeres ved den empiriske autokorrelation givet ved (3) ˆρ(k) = n k (x i+k x)(x i x) n (x i x) 2, k = 0,1,...,n. Bemærk at ˆρ(0) = ρ(0) = 1 (en observation er altid perfekt korreleret med sig selv). Den uafhængige variabel k i (3) kaldes lag. Det gælder, at ˆρ(k) nærmer sig den sande lag-k autokorrelation ρ(k), når antallet af observationer n går mod uendelig. Bemærk at hvis lag k er tæt på antal observationer n, er der kun få observationer (n k sådanne) til at fastlægge ˆρ(k), jf. (3). De empiriske autokorrelationer for sådanne høje lags bør derfor tolkes varsomt. To eksempler på empiriske autokorrelationsfunktioner er givet i Figur 3. Når vi undersøger ankomstprocesser mhp. at opstille fornyelsesmodeller herfor, ønsker vi at vurdere, hvorvidt der er uafhængighed mellem interankomsttider. Generelt kan det vises, at hvis {X n : n N} er en (svagt stationær) stokastisk proces bestående af lutter uafhængige observationer, så gælder (4) n 1/2 ˆρ(k) approx N(0,1), for n stor, hvor N(0, 1) betegner standardnormalfordelingen. Denne normalapproksimation kan bruges til at konstruere konfidensgrænser for autokorrelationsfunktionen: givet n uafhængige observationer er et approksimativt (1 α)% konfidensinterval for ˆρ(k) givet ved [ z 1 α/2 n 1/2,z 1 α/2 n 1/2 ], hvor z a er a-fraktilen i standardnormalfordelingen, dvs. z a = Φ 1 (a), med Φ fordelingsfunktionen for standardnormalfordelingen. Af definitionen på et konfidensinterval (intervallet indeholder den sande parameter i (1 α) 100% af tilfældene) forventer vi i snit, at (1 α) 100% af de beregnede empiriske autokorrelationer ˆρ(k) for k > 0 ligger inden for konfidensgrænserne. Hvis det omtrentligt er tilfældet, vil vi typisk acceptere antagelsen om uafhængighed. 5

6 ACF IID obs ACF random walk ACF ACF Lag Lag FIGUR 3. Figuren til venstre viser et plot af ρ(k), når X består af uafhængigt standardnormalfordelte observationer. Figuren til højre viser et plot af ρ(k) for den stokastiske proces fastlagt iid ved X 0 = 0, X n = X n 1 + ε n, n > 1, ε n N(0,1) (random walk). I begge tilfælde er 95% konfidensbånd angivet ved de stiplede linier, beregnet ud fra sammenhængen i (4). I figuren til venstre accepteres antagelsen om uafhængighed (én ud af 20 autokorrelationer, dvs. præcis 5%, overskrider konfidensgrænsen). I figuren til højre afvises antagelsen om uafhængighed; observationerne er tydeligvis positivt korrelerede. 3 Fordeling af interankomsttider Forudsat at ankomstprocessen er stationær, og følgen af interankomsttiderne er blevet fundet uafhængige, er næste skridt at bestemme en model for fordelingen af interankomsttiderne. Vi forestiller os, at vi blandt en række forskellige fordelingstyper (eksponentialfordelingen, Erlangfordelingen etc.) ønsker at bestemme den type, som matcher data bedst. Til dette formål er den simpleste og ofte også mest informative metode at benytte en eller anden form for grafisk kontrol. Et formelt statistisk test for fordelingstype (goodness-of-fit test) kan være nyttigt i tvivlstilfælde og diskuteres kort til sidst i dette afsnit. Lad Y være en stokastisk variabel med fordelingsfunktion F, dvs. F(y) = P(Y y). Antag for nemheds skyld, at F er en kontinuert funktion. Så er fraktilfunktionen for F defineret som Q(p) := F 1 (p) for p [0,1], dvs. Q(p) er den værdi af den uafhængige variabel, for hvilken F krydser p. En sammenligning af Q med den empiriske fraktilfunktion beregnet ud fra data kan bruges til at vurdere, om data stammer fra F. Lad x 1,...,x n være en samling af uafhængige observationer af en stokastisk variabel X. Den empiriske fraktilfunktion for observationerne er defineret som Q n (p) := min{x : p F n (x)}, 6

7 hvor F n (x) er den empiriske fordelingsfunktion for x 1,...,x n, dvs. (5) F n (x) := antal observationer mindre end eller lig x. I fald X har fordelingsfunktion F, kan det vises, at Q n (x) nærmer sig Q(x) for ethvert x når n. Dvs. for n tilstrækkelig stor gælder, at Q n (x) Q(x). Under antagelsen at X har fordelingsfunktion F, vil punkterne i et plot af Q n (x) mod Q(x) ligge på tæt på linien y = x, uden systematiske afvigelser. Et sådant plot kaldes et QQ-plot (Quantile-Quantile plot). Konkret konstrueres QQ-plottet som et plot af punkterne (Q(i/n),y i ) for i = 1,...,n, hvor y 1 y n er observationerne x 1,...,x n ordnet efter størrelse. QQ plot Empiriske fraktiler Teoretiske fraktiler FIGUR 4. Et eksempel på et QQ-plot af interankomsttider mod fraktilerne i en eksponentialfordeling. Punkterne ligger tæt op ad og jævnt spredt om linien y = x. Vi slutter, at en eksponentialfordeling er en acceptabel model for disse data. Almindeligvis kender vi ikke F eksakt, men kun op til en eller flere ukendte parametre (parameteren i en eksponentialfordeling, middelværdi og varians i en normalfordeling etc.). I den slags tilfælde er det generelt nødvendigt at estimere parametre ud fra data, før man konstruerer sit QQ-plot. Der er dog visse vigtige undtagelser. Antag nemlig at punkterne i QQ-plottet af Q n (x) mod Q ligger omkring en rette linie y = ax+b. Dette gælder, hvis X har fordelingsfunktion F((x b)/a), dvs. X er fordelt som F pånær et skift i lokation b og skala a. Resultatet kan bruges til at vurdere visse fordelingstyper, uden at man behøver at estimere ukendte parametre for F. Her er to vigtige eksempler: 1. Antag at X eksponentialfordelt med parameter a. Hvis F er fordelingsfunktionen for en eksponentialfordelt stokastisk variabel med parameter 1, så har X fordelingsfunktion F(ax). Dvs. punkterne i et plot af Q n mod fraktilerne for F ligger omkring linien y = x/a. 7

8 2. Antag at X er normalfordelt med middelværdi b og varians a 2. Hvis F betegner fordelingsfunktionen for en standardnormalt stokastisk variabel, så har X fordelingsfunktion F((x b)/a). Dvs. punkterne i et plot af Q n mod fraktilerne hørende til F vil ligge omkring linien y = ax+b. Resultatet kan også bruges til at undersøge for lognormalfordelte observationer her skal logaritmen til observationerne ligge omkring linien y = ax + b. Et alternativ til QQ-plots er PP-plots (Probability-Probability plots). Her plottes den empiriske fordelingsfunktion F n (x) mod en teoretisk fordelingsfunktion F, hvis parametre evt. er estimeret på baggrund af data. Også her skal punkterne ligge omtrentligt på linien y = x, såfremt X er fordelt som F. I praksis konstrueres PPplottet som et plot af punkterne (i/n,f(y i )) for i = 1,...,n, hvor y 1 y n er observationerne x 1,...,x n ordnet efter størrelse. PP-plots diskriminerer bedst i områder, hvor der er meget sandsynlighedsmasse (dvs. omkring middelværdien) og dårligere i halen af fordelingen (hvor sandsynlighederne er meget tæt på 0 hhv. 1). QQ-plots diskriminerer derimod bedst i halerne af en fordeling og ringere i områder med høj sandsynlighedsmasse (hvor der er mange observationer klumpet sammen ). Valget af plot til at undersøge fordelingstype afhænger altså af, hvilket område af fordelingen, det er vigtigst at beskrive præcist. QQ plot PP plot Teoretiske fraktiler Teoretisk sandsynlighed Empiriske fraktiler Empirisk sandsynlighed FIGUR 5. QQ-plot og PP-plot af observationer fra en Erlangfordeling med formparameter 2 og skalaparameter 1/2 mod de teoretiske fraktiler/sandsynligheder i en eksponentialfordeling med parameter 1. Bemærk de systematiske afvigelser fra den rette linie y = x i begge plots observationerne er tydeligvis ikke eksponentialfordelte. Som et alternativ til QQ- og PP-plots, kan man udføre et formelt statistisk test for fordelingstype, et såkaldt goodness-of-fit test. Et sådant test kan være nyttigt i situationer, hvor det synes vanskeligt at afgøre fordelingstypen, eller hvor man ønsker præcis afklaring i form af en p-værdi snarere end mere løse overvejelser baseret på plots. I er formentlig stødt på dette test i et tidligere statistikkursus: givet 8

9 uafhængige observationer x 1,...,x n af en stokastisk variabel X ønsker vi at teste hypotesen H 0 mod alternativet H 1, hvor H 0 : observationerne stammer fra fordelingsfunktionen Fˆθ H 1 : observationerne stammer ikke fra Fˆθ. Her er Fˆθ en fordelingsfunktion, hvis parameter er estimeret ved ˆθ på baggrund af data, f.eks. ved maksimaliseringsestimation (se næste afsnit). Hypotesen H 0 kan undersøges ved først at definere intervaller [a j 1,a j ), j = 1,...,k, således at samtlige observationer er indeholdt i foreningsmængden af [a j 1,a j ) erne og derpå beregne det forventede antal observationer E i i hver [a j 1,a j ) under Fˆθ, dvs. E i = n ( Fˆθ (a j) Fˆθ (a j 1) ). Antag at parameteren for fordelingsfunktionen F har dimension c. Lad endvidere O j være antal observationer i intervallet [a j 1,a j ). Der gælder følgende X 2 := k (O i E i ) 2 approx χ 2 (k c 1), E i når n samt det forventede antal observationer per celle er tilstrækkelig stort. Teststørrelsen X 2 kaldes goodness-of-fit teststørrelsen. Som en tommelfingerregel kræves E i 5, for at ovenstående approksimation er gyldig. Ud fra teststørrelsen X 2 kan vi konstruere det ønskede test. Store værdier af X 2 er kritiske for H 0, dvs. med signifikansniveau α afvises hypotesen H 0, såfremt X 2 > χ 2 (α,k c 1), hvor χ 2 (α,k c 1) er (1 α) 100%-fraktilen i χ2 (k c 1)-fordelingen. Det er ikke muligt at angive generelt, hvor mange intervaller, som bør anvendes for at sikre den mest pålidelige testprocedure for goodness-of-fit testet. Tabel 1 er en oversigt over anbefalet størrelsesorden for antal intervaller for et givet antal observationer n. Tabellen er en gengivelse af tabellen p. 329 i Banks et. al. (2005), Discrete Event System Simulation, Prentice-Hall. Stikprøvestørrelse Antal intervaller 20 Brug ikke χ 2 -test >100 n n/5 TABEL 1. Anbefalet antal intervaller til brug ifm. χ 2 -testet for fordelingstype. 9

10 4 Parameterestimation Lad os antage, at stationaritetsantagelsen samt uafhængighedsantagelsen for interankomster er afklaret, samt at man har besluttet sig for en klasse af fordelinger for interankomsttiderne, dvs. man har besluttet sig for en statistisk model. Antag at den statistiske model kan beskrives ved en klasse af tæthedsfunktioner { f θ : θ Θ}, hvor θ er en ukendt parameter (f.eks. raten i en eksponentialfordeling eller vektoren bestående af middelværdi og varians i en normalfordeling). Vi ønsker nu at estimere værdien af θ på baggrund af data. En særligt udbredt form for estimation er maksimaliseringsestimation (eng: maximum likelihood estimation). Givet uafhængige observationer x 1,x 2,...,x n af en stokastisk variabel X og en samling af tæthedsfunktioner { f θ : θ Θ} er likelihoodfunktionen for θ defineret som L(θ) := n f θ (t i ). Maksimaliseringsestimatet for θ er defineret som den værdi af θ, der maksimaliserer likehoodfunktionen for data under den givne statistiske model, dvs. ˆθ ML := arg maxl(θ). Maksimaliseringsestimatet er altså den værdi af θ, som tildeler størst sandsynlighed til de observerede data under modellen. Maksimaliseringsestimatorer er særligt pæne estimatorer. Det kan f.eks. vises, at de under ganske generelle betingelser er approksimativt normalfordelte når n (muliggør konstruktion af konfidensintervaller for en parameter). Desuden spiller maksimaliseringsestimatorer en helt central rolle i konstruktionen af de såkaldte likelihood ratio tests til sammenligning af delmodeller i en givet statistisk model. Tabel 2 er en liste over maksimaliseringsestimatorer 1 for en række fordelingstyper, som man typisk støder på ifm. analyse af ankomstprocesser. Generelt er det ikke muligt at opskrive maksimaliseringsestimatorer på lukket form, og man må i stedet anvende numeriske metoder til maksimering af likelihoodfunktionen. Dette er eksempelvis påkrævet for Erlangfordelingen med ukendt form- og skalaparameter. 5 Opsummering hvad skal I huske? Følgende er en trin-for-trin oversigt over analyser, I bør udføre, når I forsøger at fitte fornyelsesmodeller til ankomstprocesser. 1 Det bemærkes, at maksimaliseringsestimatoren for variansen σ 2 i en normalfordeling faktisk er givet ved ˆσ 2 ML = (n 1)/n ˆσ 2 ; denne estimator er imidlertid ikke middelværdiret, forstået således at E( ˆσ ML ) = (n 1)/nσ 2 σ 2. Estimatoren ˆσ 2 er derimod middelværdiret og er derfor at foretrække. 10

11 Fordeling Tæthed Param. Maksimaliseringsestimator Eksponentialfordeling f(x) = ae ax a â = 1/ x Erlangfordeling f(x) = β r /(n 1)!x r 1 e x/β β ˆβ = x/r (kendt formparam.) Normalfordeling f(x) = (σ 2π) 1 e (x µ)2 /(2σ 2 ) µ,σ 2 ˆµ = x ˆσ 2 = (n 1) 1 n (x i x) 2 Lognormalfordeling f(x) = (xσ 2π) 1 e (ln(x) µ)2 /(2σ 2 ) µ,σ 2 Som for normalfordelingen; efter at have taget ln af data. TABEL 2. Liste over maksimaliseringsestimatorer for fordelinger, man typisk anvender for interankomsttider 1. Tjek stationaritet ved at plotte observationer (dvs. interankomsttider) mod observationsnummer. Hvis der ej er synlige skift i lokation eller variation, accepteres normalt antagelsen om stationaritet. Hvis ankomstprocessen ikke er stationær over hele det betragtede tidsinterval, gennemgå da punkt 2-4 over et eller flere mindre tidsintervaller, hvor processen kan antages approksimativt stationær. 2. Tjek uafhængighed vha. autokorrelationsplot. Brug konfidensbånd til at vurdere uafhængighedsantagelsen. Hvis ca. 5% eller færre af de estimerede autokorrelationer for lag større end 0 overskrider konfidensgrænsen, accepteres normalt antagelsen om uafhængighed. 3. Undersøg fordelingstype for interankomsttider. Det er en god idé først at undersøge, om eksponentialfordelingen kan bruges, da det leder til en særligt simpel og let fortolkelig ankomstproces, den stationære Poissonproces. Brug QQ-plots (eller PP-plots) hertil. Hvis punkterne i QQ-plottet ligger tæt op ad en ret linie med skæring i 0 uden systematiske afvigelser, kan observationerne antages at stamme fra en eksponentialfordeling. Hvis en eksponentialfordeling passer dårligt på data, kan det undersøges hvorvidt Erlang-, lognormalfordelingen eller en normalfordeling passer med data. Evt. kan andre fordelingstyper undersøges om nødvendigt. 4. Estimér parametre i fordelingen, f.eks. vha. maksimaliseringsestimation. Når tjeklisten er vel overstået, kan I bruge den estimerede ankomstproces i simulationsøjemed eller i nogle tilfælde til eksakte beregninger, i fald I kan beskrive køsystemet i termer af en passende analytisk håndtérbar model. 6 Statistik for ankomstprocesser i R Hverken Excel eller Matlab er specielt velegnede til at udføre de statistiske beregninger, som er beskrevet i denne note. Selv om de beskrevne plots principielt 11

12 kan laves i disse to programmer, bliver parameterestimation i unødvendigt teknisk. Til slige problemer er statistikværktøjet R et både bedre og nemmere valg. I kan hente programmet gratis på hjemmesiden Dokumentation for hovedfunktionerne i R kan findes på f.eks. følgende adresse: Følgende er et eksempel på, hvordan man kan udføre de fleste af analyserne i denne note givet data i en tekstfil data.txt, hvor hver række indeholder netop én ankomsttid. # Indlæs datasæt ank <- read.table("data.txt") # Antal observationer n<-nrow(ank) # Beregn interankomsttider inter.ank <- c(ank[1,1], diff(ank[,1])) # Plot af observationer for undersøgelse af stationaritet plot(1:n,inter.ank,xlab="observationsnummer", ylab="observation",type="l") # Plot af autokorrelation (m. 95% konfidensbånd) acf(inter.ank) # QQ-plot mod eksponentialfordeling teo<-qexp((1:n)/n) plot(sort(inter.ank),teo,xlab="observerede fraktiler", ylab="teoretiske fraktiler") abline(0,1) # PP-plot mod eksponentialfordeling teo<-pexp(sort(inter.ank)) plot((1:n)/n,teo,xlab="observerede sandsynligheder", ylab="teoretiske sandsynligheder") abline(0,1) # Parameterestimation for eksponentialfordeling. # Kræver at I har installeret biblioteket MASS library(mass) fitdistr(inter.ank,"exponential") 12

Stokastiske processer og køteori

Stokastiske processer og køteori Stokastiske processer og køteori 9. kursusgang Anders Gorst-Rasmussen Institut for Matematiske Fag Aalborg Universitet 1 OPSAMLING EKSAKTE MODELLER Fordele: Praktiske til initierende analyser/dimensionering

Læs mere

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i. Repetition af vektor-regning Økonometri: Lektion 3 Matrix-formulering Fordelingsantagelse Hypotesetest Antag vi har to n-dimensionelle (søjle)vektorer a 1 b 1 a 2 a =. og b = b 2. a n b n Tænk på a og

Læs mere

Simpel Lineær Regression

Simpel Lineær Regression Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Vi antager at sammenhængen mellem y og x er beskrevet ved y = β 0 + β 1 x + u. y: Afhængige

Læs mere

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0 Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt

Læs mere

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Statikstik II 2. Lektion Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Sandsynlighedsregningsrepetition Antag at Svar kan være Ja og Nej. Sandsynligheden for at Svar Ja skrives

Læs mere

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x) Formelsamlingen 1 Regneregler for middelværdier M(a + bx) a + bm X M(X+Y) M X +M Y Spredning varians og standardafvigelse VAR(X) 1 n n i1 ( X i - M x ) 2 Y a + bx VAR(Y) VAR(a+bX) b²var(x) 2 Kovariansen

Læs mere

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater Økonometri: Lektion 4 Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater 1 / 35 Hypotesetest for én parameter Antag vi har model y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi

Læs mere

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Statistik II Lektion 3 Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Setup: To binære variable X og Y. Statistisk model: Konsekvens: Logistisk regression: 2 binære var. e e X Y P

Læs mere

Statistik II 4. Lektion. Logistisk regression

Statistik II 4. Lektion. Logistisk regression Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:

Læs mere

Introduktion til Statistiske Modeller for Finansielle Tidsserier. Forelæsningsnoter til Finansiel Økonometri

Introduktion til Statistiske Modeller for Finansielle Tidsserier. Forelæsningsnoter til Finansiel Økonometri Introduktion til Statistiske Modeller for Finansielle Tidsserier Forelæsningsnoter til Finansiel Økonometri Jesper Lund mail@jesperlund.com http://www.jesperlund.com 14. marts 2006 1 Indledning Formålet

Læs mere

Oversigt. Kursus 02402 Introduktion til Statistik. Forelæsning 10: Statistik ved hjælp af simulering. Per Bruun Brockhoff.

Oversigt. Kursus 02402 Introduktion til Statistik. Forelæsning 10: Statistik ved hjælp af simulering. Per Bruun Brockhoff. Kursus 02402 Introduktion til Statistik Forelæsning 10: Statistik ved hjælp af simulering Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Schweynoch, 2003. Se eventuelt http://www.mathematik.uni-kassel.de/~fathom/projekt.htm.

Schweynoch, 2003. Se eventuelt http://www.mathematik.uni-kassel.de/~fathom/projekt.htm. Projekt 8.5 Hypotesetest med anvendelse af t-test (Dette materiale har været anvendt som forberedelsesmateriale til den skriftlige prøve 01 for netforsøget) Indhold Indledning... 1 χ -test... Numeriske

Læs mere

Supplement til kapitel 4 Om sandsynlighedsmodeller for flere stokastiske variable

Supplement til kapitel 4 Om sandsynlighedsmodeller for flere stokastiske variable IMM, 00--6 Poul Thyregod Supplement til kapitel 4 Om sandsynlighedsmodeller for flere stokastiske variable Todimensionale stokastiske variable Lærebogens afsnit 4 introducerede sandsynlighedsmodeller formuleret

Læs mere

Program. 1. Varianskomponent-modeller (Random Effects) 2. Transformation af data. 1/12

Program. 1. Varianskomponent-modeller (Random Effects) 2. Transformation af data. 1/12 Program 1. Varianskomponent-modeller (Random Effects) 2. Transformation af data. 1/12 Dæktyper og brændstofforbrug Data fra opgave 10.43, side 360: cars 1 2 3 4 5... radial 4.2 4.7 6.6 7.0 6.7... belt

Læs mere

Statistik i GeoGebra

Statistik i GeoGebra Statistik i GeoGebra Peter Harremoës 13. maj 2015 Jeg vil her beskrive hvordan man kan lave forskellige statistiske analyser ved hjælp af GeoGebra 4.2.60.0. De statistiske analyser svarer til pensum Matematik

Læs mere

Kapitel 4 Sandsynlighed og statistiske modeller

Kapitel 4 Sandsynlighed og statistiske modeller Kapitel 4 Sandsynlighed og statistiske modeller Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 Indledning 2 Sandsynlighed i binomialfordelingen 3 Normalfordelingen 4 Modelkontrol

Læs mere

statistik statistik viden fra data statistik viden fra data Jens Ledet Jensen Aarhus Universitetsforlag Aarhus Universitetsforlag

statistik statistik viden fra data statistik viden fra data Jens Ledet Jensen Aarhus Universitetsforlag Aarhus Universitetsforlag Jens Ledet Jensen på data, og statistik er derfor et nødvendigt værktøj i disse sammenhænge. Gennem konkrete datasæt og problemstillinger giver Statistik viden fra data en grundig indføring i de basale

Læs mere

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data Faculty of Life Sciences Program t-test Hypoteser, teststørrelser og p-værdier Claus Ekstrøm E-mail: ekstrom@life.ku.dk Resumé og hængepartier fra sidst. Eksempel: effekt af foder på hormonkoncentration

Læs mere

Forelæsning 9: Inferens for andele (kapitel 10)

Forelæsning 9: Inferens for andele (kapitel 10) Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

CIVILINGENIØREKSAMEN. Side 1 af 18 sider. Skriftlig prøve, den: 2. juni 2009 Kursus nr : 02405. Kursus navn: Sandsynlighedsregning

CIVILINGENIØREKSAMEN. Side 1 af 18 sider. Skriftlig prøve, den: 2. juni 2009 Kursus nr : 02405. Kursus navn: Sandsynlighedsregning CIVILINGENIØREKSAMEN Side 1 af 18 sider Skriftlig prøve, den: 2. juni 2009 Kursus nr : 02405 Kursus navn: Sandsynlighedsregning Tilladte hjælpemidler: Alle Dette sæt er besvaret af: (navn) (underskrift)

Læs mere

STATISTIKNOTER Simple binomialfordelingsmodeller

STATISTIKNOTER Simple binomialfordelingsmodeller STATISTIKNOTER Simple binomialfordelingsmodeller Jørgen Larsen IMFUFA Roskilde Universitetscenter Februar 1999 IMFUFA, Roskilde Universitetscenter, Postboks 260, DK-4000 Roskilde. Jørgen Larsen: STATISTIKNOTER:

Læs mere

Gennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP()

Gennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP() Gennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP() John Andersen, Læreruddannelsen i Aarhus, VIA Et kast med 10 terninger gav følgende udfald Fig. 1 Result of rolling 10 dices

Læs mere

Projekt 8.3 Hvordan undersøges om et talmateriale normalfordelt?

Projekt 8.3 Hvordan undersøges om et talmateriale normalfordelt? Projekt 8.3 Hvordan undersøges om et talmateriale normalfordelt? Projektet drejer sig om at udvikle en metode, til at undersøge om et givet talmateriale med rimelighed kan siges at være normalfordelt.

Læs mere

Skriftlig Eksamen ST501: Science Statistik Mandag den 11. juni 2007 kl. 15.00 18.00

Skriftlig Eksamen ST501: Science Statistik Mandag den 11. juni 2007 kl. 15.00 18.00 Skriftlig Eksamen ST501: Science Statistik Mandag den 11. juni 2007 kl. 15.00 18.00 Forskningsenheden for Statistik IMADA Syddansk Universitet Alle skriftlige hjælpemidler samt brug af lommeregner er tilladt.

Læs mere

Epidemiologi og Biostatistik

Epidemiologi og Biostatistik Kapitel 1, Kliniske målinger Epidemiologi og Biostatistik Introduktion til skilder (varianskomponenter) måleusikkerhed sammenligning af målemetoder Mogens Erlandsen, Institut for Biostatistik Uge, torsdag

Læs mere

µ = κ (θ); Kanonisk link, θ = g(µ) Poul Thyregod, 9. maj Specialkursus vid.stat. foraar 2005

µ = κ (θ); Kanonisk link, θ = g(µ) Poul Thyregod, 9. maj Specialkursus vid.stat. foraar 2005 Hierarkiske generaliserede lineære modeller Lee og Nelder, Biometrika (21) 88, pp 987-16 Dagens program: Mandag den 2. maj Hierarkiske generaliserede lineære modeller - Afslutning Hierarkisk generaliseret

Læs mere

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet Eksamen ved Københavns Universitet i Kvantitative forskningsmetoder Det Samfundsvidenskabelige Fakultet 14. december 2011 Eksamensnummer: 5 14. december 2011 Side 1 af 6 1) Af boxplottet kan man aflæse,

Læs mere

Program. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen)

Program. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen) Faculty of Life Sciences Program Logistisk regression Claus Ekstrøm E-mail: ekstrom@life.ku.dk Odds og odds-ratios igen Logistisk regression Estimation og inferens Modelkontrol Slide 2 Statistisk Dataanalyse

Læs mere

CIVILINGENIØREKSAMEN. Side 1 af 19 sider. Skriftlig prøve, den: 20. december 2006 Kursus nr : 02405. Kursus navn: Sandsynlighedsregning

CIVILINGENIØREKSAMEN. Side 1 af 19 sider. Skriftlig prøve, den: 20. december 2006 Kursus nr : 02405. Kursus navn: Sandsynlighedsregning CIVILINGENIØREKSAMEN Side af 9 sider Skriftlig prøve, den: 0. december 006 Kursus nr : 0405 Kursus navn: Sandsynlighedsregning Tilladte hjælpemidler: Alle Dette sæt er besvaret af: navn underskrift bord

Læs mere

Undervisningsbeskrivelse

Undervisningsbeskrivelse Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Institution Uddannelse Fag og niveau Lærer(e) Hold Termin hvori undervisningen afsluttes: Juni 2013 Roskilde

Læs mere

Teoretisk Statistik, 2. december 2003. Sammenligning af poissonfordelinger

Teoretisk Statistik, 2. december 2003. Sammenligning af poissonfordelinger Uge 49 I Teoretisk Statistik, 2. december 2003 Sammenligning af poissonfordelinger o Generel teori o Sammenligning af to poissonfordelinger o Eksempel Opsummering om multinomialfordelinger Fishers eksakte

Læs mere

Statistik noter - Efterår 2009 Keller - Statistics for management and economics

Statistik noter - Efterår 2009 Keller - Statistics for management and economics Statistik noter - Efterår 2009 Keller - Statistics for management and economics Jonas Sveistrup Hansen - stud.merc.it 22. september 2009 1 Indhold 1 Begrebsliste 3 2 Forelæsning 1 - kap. 1-3 3 2.1 Kelvin

Læs mere

Indblik i statistik - for samfundsvidenskab

Indblik i statistik - for samfundsvidenskab Indblik i statistik - for samfundsvidenskab Læs mere om nye titler fra Academica på www.academica.dk Nikolaj Malchow-Møller og Allan H. Würtz Indblik i statistik for samfundsvidenskab Academica Indblik

Læs mere

Introduktion til GLIMMIX

Introduktion til GLIMMIX Introduktion til GLIMMIX Af Jens Dick-Nielsen jens.dick-nielsen@haxholdt-company.com 21.08.2008 Proc GLIMMIX GLIMMIX kan bruges til modeller, hvor de enkelte observationer ikke nødvendigvis er uafhængige.

Læs mere

Spar Nord Banks ansøgningsscoremodel. - et ekspertbaseret ratingsystem for nye udlånskunder

Spar Nord Banks ansøgningsscoremodel. - et ekspertbaseret ratingsystem for nye udlånskunder Spar Nord Banks ansøgningsscoremodel - et ekspertbaseret ratingsystem for nye udlånskunder Mål for ansøgningsscoremodel Rating af nye udlånskunder som beskrives vha. en række variable: alder, boligform,

Læs mere

Personlig stemmeafgivning

Personlig stemmeafgivning Ib Michelsen X 2 -test 1 Personlig stemmeafgivning Efter valget i 2005 1 har man udspurgt en mindre del af de deltagende, om de har stemt personligt. Man har svar fra 1131 mænd (hvoraf 54 % har stemt personligt

Læs mere

1 enote 1: Simple plots og deskriptive statistik. 2 enote2: Diskrete fordelinger. 3 enote 2: Kontinuerte fordelinger

1 enote 1: Simple plots og deskriptive statistik. 2 enote2: Diskrete fordelinger. 3 enote 2: Kontinuerte fordelinger Kursus 02402/02323 Introduktion til statistik Forelæsning 13: Et overblik over kursets indhold Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Building 324, Room 220 Danish Technical University

Læs mere

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M. Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 9, 2015 Sandsynlighedsregning og lagerstyring Normalfordelingen

Læs mere

Vejledning til Gym18-pakken

Vejledning til Gym18-pakken Vejledning til Gym18-pakken Copyright Maplesoft 2014 Vejledning til Gym18-pakken Contents 1 Vejledning i brug af Gym18-pakken... 1 1.1 Installation... 1 2 Deskriptiv statistik... 2 2.1 Ikke-grupperede

Læs mere

Skriftlig Eksamen ST501: Science Statistik Mandag den 11. juni 2007 kl. 15.00 18.00

Skriftlig Eksamen ST501: Science Statistik Mandag den 11. juni 2007 kl. 15.00 18.00 Skriftlig Eksamen ST501: Science Statistik Mandag den 11. juni 2007 kl. 15.00 18.00 Forskningsenheden for Statistik IMADA Syddansk Universitet Alle skriftlige hjælpemidler samt brug af lommeregner er tilladt.

Læs mere

Dig og din puls Lærervejleding

Dig og din puls Lærervejleding Dig og din puls Lærervejleding Indledning I det efterfølgende materiale beskrives et forløb til matematik C, hvori eleverne skal måle hvilepuls og arbejdspuls og beskrive observationerne matematisk. Materialet

Læs mere

Stokastiske processer og køteori

Stokastiske processer og køteori Stokastiske processer og køteori 6. kursusgang Anders Gorst-Rasmussen Institut for Matematiske Fag Aalborg Universitet 1 KØSYSTEMER NOTATION Notation for parallelforbundne ekspeditionssystemer X/Y(m, q).

Læs mere

Kønsproportion og familiemønstre.

Kønsproportion og familiemønstre. Københavns Universitet Afdeling for Anvendt Matematik og Statistik Projektopgave forår 2005 Kønsproportion og familiemønstre. Matematik 2SS Inge Henningsen februar 2005 Indledning I denne opgave undersøges,

Læs mere

Program. Sammenligning af grupper Ensidet ANOVA. Case 3, del II: Fiskesmag i lammekød. Case 3, del I: A-vitamin i leveren

Program. Sammenligning af grupper Ensidet ANOVA. Case 3, del II: Fiskesmag i lammekød. Case 3, del I: A-vitamin i leveren Faculty of Life Sciences Program Sammenligning af grupper Ensidet ANOVA Claus Ekstrøm E-mail: ekstrom@life.ku.dk Sammenligning af to grupper: tre eksempler Sammenligning af mere end to grupper: ensidet

Læs mere

Undervisningsbeskrivelse

Undervisningsbeskrivelse Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Sommer 2015 Institution Campus vejle Uddannelse Fag og niveau Lærer(e) Hold HHX Matematik B (Valghold) PEJE

Læs mere

IDRÆTSSTATISTIK BIND 2

IDRÆTSSTATISTIK BIND 2 IDRÆTSSTATISTIK BIND 2 ii Det Naturvidenskabelige Fakultet Aarhus Universitet Reprocenter Preben Blæsild og Jørgen Granfeldt 2001 ISBN 87-87436-07-8 Bd.2 iii Forord Denne bog er skrevet til brug i et statistikkursus

Læs mere

Statistik med TI-Nspire CAS version 3.2. Bjørn Felsager September 2012. [Fjerde udgave]

Statistik med TI-Nspire CAS version 3.2. Bjørn Felsager September 2012. [Fjerde udgave] Statistik med TI-Nspire CAS version 3.2 Bjørn Felsager September 2012 [Fjerde udgave] Indholdsfortegnelse Forord Beskrivende statistik 1 Grundlæggende TI-Nspire CAS-teknikker... 4 1.2 Lister og regneark...

Læs mere

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Microsoft Excel har en del standard anvendelsesmuligheder i forhold til den beskrivende statistik og statistisk

Læs mere

Stokastiske processer og køteori

Stokastiske processer og køteori Stokastiske processer og køteori 8. kursusgang Anders Gorst-Rasmussen Institut for Matematiske Fag Aalborg Universitet 1 HVAD ER KØNETVÆRK? Åbent kønetværk Lukket kønetværk HVAD ER KØNETVÆRK? 2 Vi skal

Læs mere

Undervisningsbeskrivelse

Undervisningsbeskrivelse Undervisningsbeskrivelse Termin Efterår 2014 Institution Niels Brock Uddannelse Fag og niveau Lærer Hold HHX Matematik - Niveau A Peter Harremoës GSK hold t14gymaau1o2 Oversigt over gennemførte undervisningsforløb

Læs mere

Matrix Algebra med Excel Forelæsningsnoter til FR86. Jesper Lund mail@jesperlund.com http://www.jesperlund.com

Matrix Algebra med Excel Forelæsningsnoter til FR86. Jesper Lund mail@jesperlund.com http://www.jesperlund.com Matrix Algebra med Excel Forelæsningsnoter til FR86 Jesper Lund mail@jesperlund.com http://www.jesperlund.com 28. august 2002 1 Indledning Matrix algebra er et uundværligt redskab til økonometri, herunder

Læs mere

Undervisningsbeskrivelse

Undervisningsbeskrivelse Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Institution Uddannelse Fag og niveau Lærer(e) Hold Termin hvori undervisningen afsluttes: maj-juni 2014 IBC-Kolding

Læs mere

Temaopgave i statistik for

Temaopgave i statistik for Temaopgave i statistik for matematik B og A Indhold Opgave 1. Kast med 12 terninger 20 gange i praksis... 3 Opgave 2. Kast med 12 terninger teoretisk... 4 Opgave 3. Kast med 12 terninger 20 gange simulering...

Læs mere

GPS stiller meget præcise krav til valg af målemetode

GPS stiller meget præcise krav til valg af målemetode GPS stiller meget præcise krav til valg af målemetode 1 Måleteknisk er vi på flere måder i en ny og ændret situation. Det er forhold, som påvirker betydningen af valget af målemetoder. - Der er en stadig

Læs mere

En statistikstuderendes bekendelser Søren Wengel Mogensen

En statistikstuderendes bekendelser Søren Wengel Mogensen Oplysning 23 En statistikstuderendes bekendelser Søren Wengel Mogensen Om at skrive BSc-opgave i anvendt statistik. Der findes matematikere (i hvert fald matematikstuderende), der mener, at den rene matematik

Læs mere

Et matematikeksperiment: Bjørn Felsager, Haslev Gymnasium & HF

Et matematikeksperiment: Bjørn Felsager, Haslev Gymnasium & HF Sammenligning af to måleserier En af de mest grundlæggende problemstillinger i statistik består i at undersøge om to forskellige måleserier er signifikant forskellige eller om forskellen på de to serier

Læs mere

Eksempel: PEFR. Epidemiologi og biostatistik. Uge 1, tirsdag. Erik Parner, Institut for Biostatistik.

Eksempel: PEFR. Epidemiologi og biostatistik. Uge 1, tirsdag. Erik Parner, Institut for Biostatistik. Epidemiologi og biostatistik. Uge, tirsdag. Erik Parner, Institut for Biostatistik. Generelt om statistik Dataanalysen - Deskriptiv statistik - Statistisk inferens Sammenligning af to grupper med kontinuerte

Læs mere

ISCC. IMM Statistical Consulting Center. Brugervejledning til beregningsmodul til robust estimation af nugget effect. Technical University of Denmark

ISCC. IMM Statistical Consulting Center. Brugervejledning til beregningsmodul til robust estimation af nugget effect. Technical University of Denmark IMM Statistical Consulting Center Technical University of Denmark ISCC Brugervejledning til beregningsmodul til robust estimation af nugget effect Endelig udgave til Eurofins af Christian Dehlendorff 15.

Læs mere

matx.dk Enkle modeller

matx.dk Enkle modeller matx.dk Enkle modeller Dennis Pipenbring 28. juni 2011 Indhold 1 Indledning 4 2 Funktionsbegrebet 4 3 Lineære funktioner 8 3.1 Bestemmelse af funktionsværdien................. 9 3.2 Grafen for en lineær

Læs mere

Byggeøkonomuddannelsen

Byggeøkonomuddannelsen Byggeøkonomuddannelsen Risikoanalyse Successiv kalkulation Ken L. Bechmann 18. november 2013 1 Dagens emner Risikoanalyse og introduktion hertil Kalkulation / successiv kalkulation Øvelser og småopgaver

Læs mere

Statistik. Deskriptiv statistik, normalfordeling og test. Karsten Juul

Statistik. Deskriptiv statistik, normalfordeling og test. Karsten Juul Statistik Deskriptiv statistik, normalfordeling og test Karsten Juul Intervalhyppigheder En elevgruppe på et gymnasium har spurgt 100 tilfældigt valgte elever på gymnasiet om hvor lang tid det tager dem

Læs mere

Skriv punkternes koordinater i regnearket, og brug værktøjet To variabel regressionsanalyse.

Skriv punkternes koordinater i regnearket, og brug værktøjet To variabel regressionsanalyse. Opdateret 28. maj 2014. MD Ofte brugte kommandoer i Geogebra. Generelle Punktet navngives A Geogebra navngiver punktet Funktionen navngives f Funktionen navngives af Geogebra Punktet på grafen for f med

Læs mere

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer. Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2008 En gruppe bestående af 45 patienter med reumatoid arthrit randomiseres til en af 6 mulige behandlinger, nemlig placebo, aspirin eller

Læs mere

Lær nemt! Statistik - Kompendium

Lær nemt! Statistik - Kompendium David Brink Lær nemt! Statistik - Kompendium Ventus wwwventusdk Lær nemt! Statistik - Kompendium 005 David Brink Nielsen og Ventus Download kompendiet gratis på wwwventusdk ISBN 87-7681-01-7 Ventus Falkoner

Læs mere

Undervisningsbeskrivelse

Undervisningsbeskrivelse Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Institution Uddannelse Fag og niveau Lærer(e) Hold Termin hvori undervisningen afsluttes: maj-juni, 2014 IBC-Kolding

Læs mere

matx.dk Undersøgelsesdesign Statistik Dennis Pipenbring

matx.dk Undersøgelsesdesign Statistik Dennis Pipenbring matx.dk Undersøgelsesdesign Statistik Dennis Pipenbring 7. april 2011 Indhold 1 Undersøgelsesdesign 5 1.1 Kausalitet............................. 5 1.2 Validitet og bias......................... 6 1.3

Læs mere

Eksempel I. Tiden mellem kundeankomster på et posthus er eksponential fordelt med middelværdi µ =2minutter.

Eksempel I. Tiden mellem kundeankomster på et posthus er eksponential fordelt med middelværdi µ =2minutter. Eksempel I Tiden mellem kundeankomster på et posthus er eksponential fordelt med middelværdi µ =2minutter. Per Bruun Brockhoff IMM DTU 02402 Eksempler 1 Eksempel I Tiden mellem kundeankomster på et posthus

Læs mere

Undervisningsbeskrivelse

Undervisningsbeskrivelse Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Maj/Juni 2014 Institution Vejen Business College Uddannelse Fag og niveau Lærer(e) Hold HHX Matematik niveau

Læs mere

Sandsynlighedsbaserede metoder

Sandsynlighedsbaserede metoder Metodeartikel 29 Sandsynlighedsbaserede metoder Monte Carlo-metoden Daniel Kjær I sidste udgave af Famøs kunne læseren finde første halvdel af en todelt artikelserie om sandsynlighedsbaserede metoder under

Læs mere

INDLEDNING...2 DATAMATERIALET... 2 KARAKTERISTIK AF POPULATIONEN... 4

INDLEDNING...2 DATAMATERIALET... 2 KARAKTERISTIK AF POPULATIONEN... 4 Indholdsfortegnelse INDLEDNING...2 DATAMATERIALET... 2 KARAKTERISTIK AF OULATIONEN... 4 DELOGAVE 1...5 BEGREBSVALIDITET... 6 Differentiel item funktionsanalyser...7 Differentiel item effekt...10 Lokal

Læs mere

Grupperede observationer et eksempel. (begreber fra MatC genopfriskes og varians og spredning indføres)

Grupperede observationer et eksempel. (begreber fra MatC genopfriskes og varians og spredning indføres) Grupperede observationer et eksempel. (begreber fra MatC genopfriskes og varians og spredning indføres) Til Gribskovløbet 006 gennemførte 118 kvinder 1,4 km distancen. Fordelingen af kvindernes løbstider

Læs mere

MønsterGenkendelse Forår 2001. S. I. Olsen

MønsterGenkendelse Forår 2001. S. I. Olsen MønsterGenkendelse Forår 2001 S. I. Olsen Dette skrift er 3. udkast til et notesæt til brug i kurset Mønstergenkendelse. Noterne dækker primært områderne: Statistiske mønstergenkendelse, Klyngeanalyse,

Læs mere

Simpsons Paradoks. Et emnearbejde om årsag og sammenhæng i kvantitative undersøgelser. Inge Henningsen

Simpsons Paradoks. Et emnearbejde om årsag og sammenhæng i kvantitative undersøgelser. Inge Henningsen Simpsons Paradoks Et emnearbejde om årsag og sammenhæng i kvantitative undersøgelser Afdeling for Anvendt Matematik og Statistik Københavns Universitet 1 Simpsons Paradoks -Et emnearbejde om årsag og sammenhæng

Læs mere

Spørgeskemaundersøgelser og databehandling

Spørgeskemaundersøgelser og databehandling DASG. Nye veje i statistik og sandsynlighedsregning. side 1 af 12 Spørgeskemaundersøgelser og databehandling Disse noter er udarbejdet i forbindelse med et tværfagligt samarbejde mellem matematik og samfundsfag

Læs mere

Oversigt. Kursus 02402 Introduktion til Statistik. Forelæsning 1: Intro og beskrivende statistik. Per Bruun Brockhoff. Praktisk Information

Oversigt. Kursus 02402 Introduktion til Statistik. Forelæsning 1: Intro og beskrivende statistik. Per Bruun Brockhoff. Praktisk Information Kursus 02402 Forelæsning 1: Intro og beskrivende statistik Oversigt 1 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Undervisningsbeskrivelse

Undervisningsbeskrivelse Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Sommer 2014 Institution Campus Vejle Uddannelse HHX Fag og niveau Matematik B ( Valghold ) Lærer(e) LSP (

Læs mere

Ny karakterskala nye mål?

Ny karakterskala nye mål? Ny karakterskala nye mål? Workshop Camilla Rump Lene Møller Madsen Mål for workshoppen Efter workshoppen skal deltagerne kunne Lave en operationel mål- og kriteriebeskrivelse af 12-tallet og 2-tallet for

Læs mere

IDRÆTSSTATISTIK BIND 1

IDRÆTSSTATISTIK BIND 1 IDRÆTSSTATISTIK BIND 1 ii Det Naturvidenskabelige Fakultet Aarhus Universitet Reprocenter Preben Blæsild og Jørgen Granfeldt 2001 ISBN 87-87436-05-1 Bd.1 iii Forord Denne bog er skrevet til brug i et statistikkursus

Læs mere

IMFUFA TEKST NR 435 2004. TEKSTER fra ROSKILDE UNIVERSITETSCENTER BASISSTATISTIK. Jørgen Larsen 2004, 2005

IMFUFA TEKST NR 435 2004. TEKSTER fra ROSKILDE UNIVERSITETSCENTER BASISSTATISTIK. Jørgen Larsen 2004, 2005 TEKST NR 435 2004 BASISSTATISTIK Jørgen Larsen 2004, 2005 TEKSTER fra IMFUFA INSTITUT ROSKILDE UNIVERSITETSCENTER FOR STUDIET AF MATEMATIK OG FYSIK SAMT DERES FUNKTIONER I UNDERVISNING, FORSKNING OG ANVENDELSER

Læs mere

Iteration af et endomorft kryptosystem. Substitutions-permutations-net (SPN) og inversion. Eksklusiv disjunktion og dens egenskaber

Iteration af et endomorft kryptosystem. Substitutions-permutations-net (SPN) og inversion. Eksklusiv disjunktion og dens egenskaber Produktsystemer, substitutions-permutations-net samt lineær og differentiel kryptoanalyse Kryptologi, fredag den 10. februar 2006 Nils Andersen (Stinson 3., afsnit 2.7 3.4 samt side 95) Produkt af kryptosystemer

Læs mere

Statistisk bearbejdning af overvågningsdata - Trendanalyser

Statistisk bearbejdning af overvågningsdata - Trendanalyser Danmarks Miljøundersøgelser Miljøministeriet Teknisk anvisning fra DMU nr. 4, 006 Statistisk bearbejdning af overvågningsdata - Trendanalyser NOVANA (Tom side) Danmarks Miljøundersøgelser Miljøministeriet

Læs mere

Undervisningsbeskrivelse

Undervisningsbeskrivelse Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Institution Uddannelse Fag og niveau Lærer(e) Hold Termin hvori undervisningen afsluttes: Maj-juni, 2013/14

Læs mere

Skolesektionen på www.ballerup.dk

Skolesektionen på www.ballerup.dk Skolesektionen på www.ballerup.dk Louise Callisen Dyhr (ldyh) Marie Louise Gottlieb Frederiksen (mgfr) Janus Askø Madsen (jaam) Nanna Petersen (nshy) Antal tegn: 28319 Afleveringsdato: 21. maj 2014 1 Indledning...

Læs mere

Fagligt samspil mellem Ma-B og SA-A Lisbeth Basballe, Mariagerfjord Gymnasium og Marianne Kesselhahn, Egedal Gymnasium og HF

Fagligt samspil mellem Ma-B og SA-A Lisbeth Basballe, Mariagerfjord Gymnasium og Marianne Kesselhahn, Egedal Gymnasium og HF Fagligt samspil mellem Ma-B og SA-A Lisbeth Basballe, Mariagerfjord Gymnasium og Marianne Kesselhahn, Egedal Gymnasium og HF Vi ønskede at planlægge og afprøve et undervisningsforløb, hvor anvendelse af

Læs mere

Projekt 1 Spørgeskemaanalyse af Bedst på Nettet

Projekt 1 Spørgeskemaanalyse af Bedst på Nettet Projekt 1 Spørgeskemaanalyse af Bedst på Nettet D.29/2 2012 Udarbejdet af: Katrine Ahle Warming Nielsen Jannie Jeppesen Schmøde Sara Lorenzen A) Kritik af spørgeskema Set ud fra en kritisk vinkel af spørgeskemaet

Læs mere

Baggrundsnotat: Modelteknisk

Baggrundsnotat: Modelteknisk Sekretariatet for Energitilsynet Baggrundsnotat: Modelteknisk materiale Store forskelle i varmepriserne hvorfor? Center for Varme Tekniske bilag I dette baggrundsnotat gennemgås de økonometriske forhold

Læs mere

t a l e n t c a m p d k Matematiske Metoder Anders Friis Anne Ryelund 25. oktober 2014 Slide 1/42

t a l e n t c a m p d k Matematiske Metoder Anders Friis Anne Ryelund 25. oktober 2014 Slide 1/42 Slide 1/42 Hvad er matematik? 1) Den matematiske metode 2) Hvad vil det sige at bevise noget? 3) Hvor begynder det hele? 4) Hvordan vælger man et sæt aksiomer? Slide 2/42 Indhold 1 2 3 4 Slide 3/42 Mængder

Læs mere

Undervisningsbeskrivelse

Undervisningsbeskrivelse Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Maj / juni 2014 Institution Campus Vejle Uddannelse Fag og niveau Lærer(e) Hold HHX Matematik C Lene Thygesen

Læs mere

Hvad er meningen? Et forløb om opinionsundersøgelser

Hvad er meningen? Et forløb om opinionsundersøgelser Hvad er meningen? Et forløb om opinionsundersøgelser Jette Rygaard Poulsen, Frederikshavn Gymnasium og HF-kursus Hans Vestergaard, Frederikshavn Gymnasium og HF-kursus Søren Lundbye-Christensen, AAU 17-10-2004

Læs mere

Stokastiske processer og køteori

Stokastiske processer og køteori Info Stokastiske processer og køteori 1. kursusgang Jesper Møller Institut for Matematiske Fag Aalborg Universitet http://www.math.aau.dk/ jm JM (I17) VS7-1. minimodul 1 / 40 Info Praktisk information

Læs mere

01017 Diskret Matematik E12 Alle bokse fra logikdelens slides

01017 Diskret Matematik E12 Alle bokse fra logikdelens slides 01017 Diskret Matematik E12 Alle bokse fra logikdelens slides Thomas Bolander 1 Udsagnslogik 1.1 Formler og sandhedstildelinger symbol står for ikke eller og ( A And) hvis... så... hvis og kun hvis...

Læs mere

Undervisningsbeskrivelse

Undervisningsbeskrivelse Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin maj-juni 11/12 Institution VUC Holstebro-Lemvig-Struer Uddannelse Fag og niveau Lærer(e) Hold Hf/hfe Matematik

Læs mere

MOGENS ODDERSHEDE LARSEN. VIDEREGÅENDE STATISTIK II Regressionsanalyse (TI-89 og Statgraphics)

MOGENS ODDERSHEDE LARSEN. VIDEREGÅENDE STATISTIK II Regressionsanalyse (TI-89 og Statgraphics) MOGENS ODDERSHEDE LARSEN VIDEREGÅENDE STATISTIK II Regressionsanalyse (TI-89 og Statgraphics) DANMARKS TEKNISKE UNIVERSITET 6 udgave 005 FORORD Dette notat kan læses på baggrund af en statistisk viden

Læs mere

Maple. Skærmbilledet. Vi starter med at se lidt nærmere på opstartsbilledet i Maple. Værktøjslinje til indtastningsområdet. Menulinje.

Maple. Skærmbilledet. Vi starter med at se lidt nærmere på opstartsbilledet i Maple. Værktøjslinje til indtastningsområdet. Menulinje. Maple Dette kapitel giver en kort introduktion til hvordan Maple 12 kan benyttes til at løse mange af de opgaver, som man bliver mødt med i matematiktimerne på HHX. Skærmbilledet Vi starter med at se lidt

Læs mere

R i 02402: Introduktion til Statistik

R i 02402: Introduktion til Statistik R i 02402: Introduktion til Statistik Per Bruun Brockhoff DTU Informatik, DK-2800 Lyngby 20. juni 2011 Indhold 1 Anvendelse af R på Databar-systemet på DTU 5 1.1 Adgang......................................

Læs mere

Persistens. 1. Generelt

Persistens. 1. Generelt Persistens 1. Generelt Persistens er en beskrivelse af laktationskurvens form. Køer med høj persistens, vil have en fladere laktationskurve og dermed en lavere ydelse end forventet i den første del og

Læs mere

Statistisk beskrivelse og test

Statistisk beskrivelse og test Statistisk beskrivelse og test 005 Karsten Juul Kapitel 1. Intervalhyppigheder Afsnit 1.1: Histogram En elevgruppe på et gymnasium har spurgt 100 tilfældigt valgte elever på gymnasiet om hvor lang tid

Læs mere

hvor i er observationsnummeret, som løber fra 1 til stikprøvestørrelsen n, X i

hvor i er observationsnummeret, som løber fra 1 til stikprøvestørrelsen n, X i Normalfordeliger For at e stokastisk variabel X ka være ormalfordelt, skal X agive værdie af e eller ade målig, f.eks. tid, lægde, vægt, beløb osv. Notatioe er: Xi ~ N( μ, σ hvor i er observatiosummeret,

Læs mere

Bilag 1: Beregning af omkostningsækvivalenter

Bilag 1: Beregning af omkostningsækvivalenter Bilag 1: Beregning af omkostningsækvivalenter Bilaget indeholder den tekniske beregning af omkostningsækvivalenterne til brug for benchmarkingen 2013. FORSYNINGSSEKRETARIATET FEBRUAR 2013 INDLEDNING...

Læs mere

ANALYSE AF DET DANSKE, TYSKE OG HOLLANDSKE SMÅGRISEMARKED

ANALYSE AF DET DANSKE, TYSKE OG HOLLANDSKE SMÅGRISEMARKED Støttet af: ANALYSE AF DET DANSKE, TYSKE OG HOLLANDSKE SMÅGRISEMARKED NOTAT NR. 147 Den danske puljenotering følger den tyske Nord-West notering med 4 ugers forsinkelse i gennemsnit. Drivkræfterne bag

Læs mere