Stokastiske processer og køteori
|
|
- Marie Carlsen
- 7 år siden
- Visninger:
Transkript
1 Stokastiske processer og køteori 3. kursusgang Anders Gorst-Rasmussen Institut for Matematiske Fag Aalborg Universitet 1
2 SIDSTE GANG Ankomstproces T 1, T 2,... (ankomsttid per kunde) til køsystem. Modellér kumulativt antal ankomster (tælleproces) N(t) := max{n T T n t}. Fuldst. tilfældige ankomster N en stationær Poissonproces antal ankomster i disjunkte tidsintervaller er uafhængige; N(t) Poisson(λt), λ > 0 intensitet. Mere generelt, fornyelsesprocesser for ankomstttider: T n = n U i, i=1 U i uafhængige og identisk fordelte. Hvordan tjekkes, om en ankomstproces er en fornyelsesproces? SIDSTE GANG 2
3 HVORFOR ER DET RELEVANT? I mange modelleringssituationer kan vi observere ankomstprocessen før selve modelkonstruktionen. Modeller for ankomstprocessen nødvendige ifm. Simulation valg af fordeling for interankomsttider? Teoretiske beregninger kan vi bruge simpel Markovmodel (dvs. er interankomsttider eksponentialfordelte)? Statistisk inferens hvordan ser ankomstprocessen ud? Det er generelt ikke nok blindt at antage eksponentialfordeling! HVORFOR ER DET RELEVANT? 3
4 FORNYELSESEGENSKABEN HVAD BETYDER DET? Fornyelsesmodel for ankomstproces interankomsttider uafhængige og identisk fordelte. I knap så tekniske termer 1. Hver kunde vælger ankomsttid uafh. af tidligere kunder. 2. Ankomstprocessen ser ens ud til alle tidspunkter. Specielt er ankomstraten konstant over tid (stationaritet). Givet observerede interankomsttider, tjek følgende: 1. Stationaritet af interankomsttider. 2. Uafhængighed af interankomsttider. 3. Hvilken klasse af fordelinger (eksponential, Erlang etc.) 4. Hvilke parametre i den givne klasse af fordelinger? FORNYELSESEGENSKABEN HVAD BETYDER DET? 4
5 ROUTER LØBENDE DATAEKSEMPEL Ankomsttider for pakker til New Zealandsk router ankomster (del af 188 gb stort datasæt). Detaljer: Antal pakker Tid/ms ROUTER LØBENDE DATAEKSEMPEL 5
6 STATIONARITET Stokastisk proces X = {X n : n N} stationær, hvis X ser ens ud, uanset hvornår man starter med at se på den. I praksis, tjek om middelværdi og varians uafhængige af t. Plot (i, x i ) for i = 1,...,n og se efter Trends/skift i gnsntl. værdi (plot fx løbende gennemsnit), Skift i variation. Stat. proces Ikkestat. proces Observation Observation Observationsnummer Observationsnummer STATIONARITET 6
7 ROUTER STATIONARITET? Interankomsttid/ms Pakkenummer R-kode: plot(int.ank,xlab="pakkenummer",ylab="interankomsttid/ms") lines(filter(int.ank,rep(1/50,50)),col=2,lwd=2) ROUTER STATIONARITET? 7
8 KORRELATION Korrelationen mellem stokastiske variable X og Y ρ(x, Y) := Cov(X, Y) Var(X)Var(Y). Der gælder følgende ρ(x, Y) > 0: positiv samvariation (X stor Y stor); ρ(x, Y) < 0: negativ samvariation (X stor Y lille); ρ(x, Y) = 1 Y = ax + b for konstanter a, b. Hvis X og Y er uafhængige, vil ρ(x, Y) = 0. Dvs. korrelationen er et mål for (lineær) afhængighed. KORRELATION 8
9 Advarsel: Korrelation er ikke det samme som uafhængighed. Tag fx X Unif[ 1, 1] og sæt Y = X 2. Så er ρ(x, Y) = 0. Problemet? Sammenhæng ml. X og Y ikke-lineær. Ligefordeling, [ 1,1] Y=X^ X (ligefordelt, [ 1,1]) Plot evt. observationer af X mod observationer af Y for at afsløre mere kompliceret sammenhæng end lineær. KORRELATION 9
10 KORRELATION FOR STOKASTISKE PROCESSER X = {X n : n N} er (svagt) stationær. Autokorrelationsfkt. ρ(k) := ρ(x n, X n+k ) (uafh. af n pga. stationaritet) k = 0, 1,... ρ(k) fortæller noget om afhængigheden mellem observationer, som er k tidsenheder fra hinanden. X n er uafhængige ρ(k) = 0 for k > 0 (bemærk, ρ(0) = 1). Estimér ρ(k) ved empirisk autokorrelation ^ρ(k) = n k i=1 (x i+k x)(x i x) n i=1 (x i x) 2, k = 0, 1,..., n. Ved uafhængighed skal ^ρ(k) være numerisk lille. Plot ^ρ(k) mod k og tjek det! KORRELATION FOR STOKASTISKE PROCESSER 10
11 approx Hvad betyder lille? Kan vise n 1/2^ρ(k) N(0, 1) for n stor. Dvs. et approksimativt 95%-konfidensinterval for ^ρ(k) er [ 1.96n 1/2, 1.96n 1/2 ], (1.96 er 97.5% fraktilen i N(0, 1)). Tommelfingerregel: Uafhængighed ρ(k) 2/ n for ca. 95% af k > 0. ACF IID obs ACF random walk ACF ACF Lag Lag KORRELATION FOR STOKASTISKE PROCESSER 11
12 ROUTER UAFHÆNGIGHED? Autokorrelationsfunktion, interankomsttider ACF Lag R-kode: acf(int.ank) ROUTER UAFHÆNGIGHED? 12
13 FORDELINGSTYPE PP-PLOT Uafhængige observationer x 1,...,x n fra en ukendt fordeling. Stammer disse fra (kendt) fordelingsfunktion F? Idé sammenlign teoretisk F m. empirisk fordelingsfunktion F n F n (x) := antal obs. mindre end eller lig x. Empirisk fordelingsfkt. Teoretisk fordelingsfkt FORDELINGSTYPE PP-PLOT 13
14 Kan vise, at lim n F n (x) = F(x) med sandsynlighed 1 for alle x. Dvs. for n stor, plot af F n mod F ligger langs linien y = x. Kaldes et PP-plot (Probability-Probability plot). I praksis, plot (i/n, F(y i )) for i = 1,...,n (y i er ordnede x i er). Empiriske sandsynligheder Teoretiske sandsynligheder FORDELINGSTYPE PP-PLOT 14
15 FORDELINGSTYPE QQ-PLOT Problem: PP-plots viser afvigelser i områder med stor sandsynlighed. Hvad med opførslen i halen af fordelingen? Benyt QQ-plots: Fraktilfunktion for p [0, 1] Q(p) := F 1 (p) (teoretisk) Q n (p) := min{x : p F n (x)} (empirisk) Hvis obs. fra F, lim n Q n (p) = Q(p) m. sandsynlighed 1. Dvs. for n stor ligger plot af Q n (p) mod Q(p) langs linien y = x. Kaldes QQ-plot (Quantile-Quantile plot). I praksis, plot (y i, Q(i/n)), i = 1,...,n (y i er ordnede x i er). FORDELINGSTYPE QQ-PLOT 15
16 Empiriske fraktiler Teoretiske fraktiler Empiriske fraktiler Teoretiske fraktiler FORDELINGSTYPE QQ-PLOT 16
17 MERE OM QQ-PLOTS Normalt kender vi kun F op til én eller flere parametre. Man kan estimere disse fra data og benytte QQ/PP-plots. Et alternativ: Antag at (Q(x), Q n (x)) ligger omkring en ret linie y = ax + b. Gælder hvis data stammer fra fordelingsfunktion F((x b)/a). Kan bruges til fordelingstjek m. QQ-plot uden estimation: Hvis data fra N(b, a 2 ), og F er fordelingsfunktion for N(0, 1), så har data fordelingsfunktion F((x b)/a). Hvis data fra Exp(a), og F er fordelingsfunktion for Exp(1), så har data fordelingsfunktion F(ax). Virker ikke for PP-plots og ikke med alle fordelinger. MERE OM QQ-PLOTS 17
18 ROUTER FORDELINGSTYPE Empiriske fraktiler Empiriske sandsynligheder R-kode: Teoretiske fraktiler Teoretiske sandsynligheder plot(qexp((1:n)/n),sort(int.ank),ylab="empiriske fraktiler", xlab="teoretiske fraktiler") abline(0,mean(int.ank)) plot(pexp(sort(int.ank),1/mean(int.ank)),(1:n)/n, ylab="empiriske sandsynligheder",xlab="teoretiske sandsynligheder") abline(0,1) ROUTER FORDELINGSTYPE 18
19 FORDELINGSTYPE GOODNESS-OF-FIT-TEST Benyt et formelt for test for hypotesen H 0 : Data stammer fra F. Opskrift på goodness-of-fit-test: 1. Inddel [min i x i, max i x i ] i intervaller (a i 1, a i ], i = 1,...,k. 2. Bestem forventet antal observationer i (a i 1, a i ] E i = n(f^θ (a i) F^θ (a i 1)), hvor F fordelingsfkt. med estimeret parameter ^θ (dimension c). 3. Udregn χ 2 -teststørrelse X 2 = k i=1 (E i O i ) 2 O i. 4. Hvis data fra F^θ, så gælder X2 χ 2 (k c 1) approksimativt. Med signifikansniveau (1 α) 100%, afvis H 0 hvis X 2 > χ 2 (α,k c 1) (hvor χ2 (α,k c 1) er 1 α fraktil i χ2 (k c 1)). FORDELINGSTYPE GOODNESS-OF-FIT-TEST 19
20 ANBEFALINGER, GOODNESS-OF-FIT-TEST Goodness-of-fit-test følsomt overfor valg af antal intervaller k. Ej muligt at vælge optimalt antal intervaller. Stikprøvestørrelse Antal intervaller 20 Brug ikke χ 2 -test >100 n n/5 Tommelfingerregel: Antal obs./interval 5 for χ 2 -test. Repetition + opgaver næste gang eksempel på beregninger. Typisk er formelle tests for fordelingstype mest interessante i tvivlssituationer eller særlige beslutningssituationer. Overvejelser ud fra QQ-plots og PP-plots er at foretrække. ANBEFALINGER, GOODNESS-OF-FIT-TEST 20
21 ESTIMATION AF PARAMETRE Antag at vi har besluttet fordelingstype. Vi er givet 1. Uafh. observationer x 1,...,x n. 2. Parametrisk klasse F = {f θ : θ Θ} af tætheder. Hvad er bedste bud på θ, når vi tror på model i F? Maksimaliseringsestimation: Vælg et θ, som maksimerer likelihooden for at have observeret x 1,...,x n. ^θ = arg maxl(θ) = arg max n f θ (x i ) i=1 (maksimaliseringsestimat). Praksis; udregn og maksimér l(θ) = log L(θ) = n i=1 log f θ(x i ). Kan sommetider udregnes analytisk sommetider numerisk. Maksimaliseringsestimatorer har særligt pæne egenskaber. ESTIMATION AF PARAMETRE 21
22 EKSEMPLER PÅ MAKSIMALISERINGSESTIMATORER Fordeling Tæthed Param. Maksimaliseringsestimator Poisson e λ λ n /n! λ ^λ = x. Eksponential f(x) = ae ax a ^a = 1/ x Erlang (kendt r) β r /(n 1)!x r 1 e x/β β ^β = x/r Normal (σ 2π) 1 e (x µ)2 /(2σ 2 ) µ,σ 2 ^µ = x ^σ 2 = (n 1) 1 n i=1 (x i x) 2 Lognormal (xσ 2π) 1 e (ln(x) µ)2 /(2σ 2 ) µ,σ 2 Som for normalfordelingen; efter at have taget ln af data. Generelt er det nødvendigt at udregne estimater numerisk. R kan beregne maksimaliseringsestimater for mange univariate fordelinger m. kommando fitdistr i pakken MASS. EKSEMPLER PÅ MAKSIMALISERINGSESTIMATORER 22
23 ROUTER ESTIMAT I EKSPONENTIALFORDELINGEN Antag at interankomsttider er Exp(a)-fordelt (omend tvivlsomt). Vi finder, at ^a = Standardfejl 2.29 (estim. varians på ^a). Approksimativt 95% konfidensinterval for ^a R-kode: [^a 1.96 ^ SE, ^a ^ SE] = [ , ]. fitdistr(int.ank,"exponential") ROUTER ESTIMAT I EKSPONENTIALFORDELINGEN 23
24 I skal tjekke REKAPITULATION HVAD SKAL I HUSKE stationaritet, fx vha. plots (evt. glidende gennemsnit) uafhængighed, fx vha. autokorrelationsplots fordelingstype, fx vha. QQ/PP-plots, evt. goodness-of-fit-test. Estimér dernæst parametre i den relevante fordeling. Et godt råd: Hvis den stationære Poissonproces (eksponentialfordelte interankomsttider) er en acceptabel model, hold jer til den. Det gør typisk fortolkning, teori og beregninger noget simplere. REKAPITULATION HVAD SKAL I HUSKE 24
Statistik for ankomstprocesser
Statistik for ankomstprocesser Anders Gorst-Rasmussen 20. september 2006 Resumé Denne note er en kortfattet gennemgang af grundlæggende statistiske værktøjer, man kunne tænke sig brugt til at vurdere rimeligheden
Læs mereStokastiske processer og køteori
Stokastiske processer og køteori 2. kursusgang Anders Gorst-Rasmussen Institut for Matematiske Fag Aalborg Universitet 1 STOKASTISK MODEL FOR KØSYSTEM Population Ankomst Kø Ekspedition Output Ankomstproces
Læs mereMatematisk model for køsystem
Matematisk model for køsystem Ankomstproces T 1, T 2,... (ankomsttid per kunde). Kødisciplin (rækkefølge for service). Ekspeditionstidsproces S 1, S 2,... (servicetid per kunde). Dagens emne: ankomstprocesser.
Læs mereTema. Dagens tema: Indfør centrale statistiske begreber.
Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i
Læs mereStokastiske processer og køteori
Stokastiske processer og køteori 9. kursusgang Anders Gorst-Rasmussen Institut for Matematiske Fag Aalborg Universitet 1 OPSAMLING EKSAKTE MODELLER Fordele: Praktiske til initierende analyser/dimensionering
Læs mereTeoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.
Teoretisk Statistik, 9 marts 2005 Empiriske analoger (Kap. 3.7) Normalfordelingen (Kap. 3.12) Opsamling på Kap. 3 nb. Det forventes ikke, at alt materialet dækkes d. 9. marts. 1 Empiriske analoger Betragt
Læs merePraktiske ting og sager: Forelæsninger tirsdag og torsdag kl i Kirkesalen, Studiestræde 38 Øvelser
Uge 36 Velkommen tilbage Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl. -2 i Kirkesalen, Studiestræde 38 Øvelser Hold -4 og 6: mandag og onsdag kl. 8-; start 3. september Hold 5: tirsdag
Læs mereI dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd
I dag Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik SaSt) Helle Sørensen Først lidt om de sidste uger af SaSt. Derefter statistisk analyse af en enkelt
Læs mereOverheads til forelæsninger, mandag 5. uge På E har vi en mængde af mulige sandsynlighedsfordelinger for X, (P θ ) θ Θ.
Statistiske modeller (Definitioner) Statistik og Sandsynlighedsregning 2 IH kapitel 0 og En observation er en vektor af tal x (x,..., x n ) E, der repræsenterer udfaldet af et (eller flere) eksperimenter.
Læs mereIntroduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher
Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk
Læs mereenote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions
Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 33B, Rum 9 Danmarks Tekniske Universitet 28 Lyngby Danmark e-mail: pbac@dtu.dk Efterår
Læs mereKvantitative Metoder 1 - Efterår Dagens program
Dagens program Afsnit 6.1. Ligefordelinger, fra sidst Den standardiserede normalfordeling Normalfordelingen Beskrivelse af normalfordelinger: - Tæthed og fordelingsfunktion - Middelværdi, varians og fraktiler
Læs mereKursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte
Læs mereKursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte
Læs mereProgram. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18
Program 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Fordeling af X Stikprøve X 1,X 2,...,X n stokastisk X stokastisk. Ex (normalfordelt stikprøve)
Læs mereProdukt og marked - matematiske og statistiske metoder
Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring
Læs mereI dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)
I dag Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt) Helle Sørensen Repetition vha eksempel om dagligvarepriser Analyse med R: ttest
Læs mereUge 10 Teoretisk Statistik 1. marts 2004
1 Uge 10 Teoretisk Statistik 1. marts 004 1. u-fordelingen. Normalfordelingen 3. Middelværdi og varians 4. Mere normalfordelingsteori 5. Grafisk kontrol af normalfordelingsantagelse 6. Eksempler 7. Oversigt
Læs mereKvantitative Metoder 1 - Forår Dagens program
Dagens program Afsnit 6.1 Den standardiserede normalfordeling Normalfordelingen Beskrivelse af normalfordelinger: - Tæthed og fordelingsfunktion - Middelværdi, varians og fraktiler Lineære transformationer
Læs mereKursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet March 1, 2013 Sandsynlighedsregning og lagerstyring Normalfordelingen
Læs mereTema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.
Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller
Læs mereForelæsning 3: Kapitel 5: Kontinuerte fordelinger
Kursus 02402 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs mereLandmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen
Landmålingens fejlteori Lektion Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet En stokastisk variabel er en variabel,
Læs mereStokastiske processer og køteori
Stokastiske processer og køteori 8. kursusgang Anders Gorst-Rasmussen Institut for Matematiske Fag Aalborg Universitet 1 HVAD ER KØNETVÆRK? Åbent kønetværk Lukket kønetværk HVAD ER KØNETVÆRK? 2 Vi skal
Læs mereForelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)
Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske
Læs mereStokastiske processer og køteori
Stokastiske processer og køteori 7. kursusgang Anders Gorst-Rasmussen Institut for Matematiske Fag Aalborg Universitet 1 OVERBLIK Sidste gang: M/M/(m, n m)-køsystemet: ligevægtsfordeling; performancestørrelser;
Læs mereAgenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede
Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede fordelinger (kap. 4) Middelværdi og varians (kap. 3-4) Fordelingsresultater
Læs mereBinomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/
Program: 1. Repetition af vigtige sandsynlighedsfordelinger: binomial, (Poisson,) normal (og χ 2 ). 2. Populationer og stikprøver 3. Opsummering af data vha. deskriptive størrelser og grafer. 1/29 Binomial
Læs meret-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.
t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program (8.15-10): 1. repetition: fordeling af observatorer X, S 2 og t. 2. konfidens-intervaller, hypotese test, type I og type II fejl, styrke,
Læs mereHvad er kønetværk? AGR/PSE (I17) VS7-8. minimodul 1 / 17
Hvad er kønetværk? AGR/PSE (I17) VS7-8. minimodul 1 / 17 Hvad er kønetværk? Vi skal kun se på åbne kønetværk (ankomst fra eksterne kilder, hver kunde forlader systemet med sandsynlighed 1). Ideelt vil
Læs mereProgram: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.
Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. 1/23 Opsummering af fordelinger X 1. Kendt σ: Z = X µ σ/ n N(0,1)
Læs mere02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4
02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4 Vejledende løsning 5.46 P (0.010 < error < 0.015) = (0.015 0.010)/0.050 = 0.1 > punif(0.015,-0.025,0.025)-punif(0.01,-0.025,0.025) [1] 0.1
Læs mereStatistiske principper
Statistiske principper 1) Likelihood princippet - Maximum likelihood estimater - Likelihood ratio tests - Deviance 2) Modelbegrebet - Modelkontrol 3) Sufficient datareduktion 4) Likelihood inferens i praksis
Læs mereProgram. Statistik og Sandsynlighedsregning. Eksempler. Sandsynlighedstæthed og sandsynlighedsmål
Program Statistik og Sandsynlighedsregning Sandsynlighedstætheder og kontinuerte fordelinger på R Varians og middelværdi Normalfordelingen Susanne Ditlevsen Uge 48, tirsdag Tætheder og fordelingsfunktioner
Læs mereKræver generelt at diverse ventetider er eksponentialfordelte. Faste rammer for serverdiscipliner mv. Svært at modellere ikke-standard køsystemer.
Opsamling eksakte modeller Fordele Praktiske til initierende analyser/dimensionering Ofte nemme at regne på. Kan bruges til at løse optimeringsopgaver, som ellers ville kræve snedige simulationsdesigns.
Læs mereForelæsning 11: Kapitel 11: Regressionsanalyse
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs mereOversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.
Kursus 242 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik Bygning 35/324 Danmarks Tekniske Universitet 28 Lyngby Danmark e-mail:
Læs mereSusanne Ditlevsen Institut for Matematiske Fag susanne
Statistik og Sandsynlighedsregning 1 STAT kapitel 4.4 Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne 7. undervisningsuge, mandag 1 Estimation og konfidensintervaller
Læs mereProgram: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19
Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større
Læs mereEt statistisk test er en konfrontation af virkelighenden (data) med en teori (model).
Hypotesetests, fejltyper og p-værdier og er den nu også det? Søren Højsgaard Institut for Matematiske Fag, Aalborg Universitet (updated: 2019-03-17) 1 / 40 Statistisk test Et statistisk test er en konfrontation
Læs mere1 Palm teori. Palm teori 1
Palm teori 1 1 Palm teori Lad X = {X(t)} t 0 være en stokastisk proces defineret på et måleligt rum (Ω, F), og lad T = {T n } n N0 være en voksende følge af ikke-negative stokastiske variable herpå. Vi
Læs mereOversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse
Læs mereInstitut for Matematiske Fag Aalborg Universitet Specielt: Var(aX) = a 2 VarX 1/40. Lad X α, X β og X γ være stokastiske variable (vinkelmålinger) med
Repetition: Varians af linear kombination Landmålingens fejlteori Lektion 5 Fejlforplantning - rw@math.aau.dk Antag X 1, X,..., X n er uafhængige stokastiske variable, og Y er en linearkombination af X
Læs mereStokastiske processer og køteori
Stokastiske processer og køteori 6. kursusgang Anders Gorst-Rasmussen Institut for Matematiske Fag Aalborg Universitet 1 KØSYSTEMER NOTATION Notation for parallelforbundne ekspeditionssystemer X/Y(m, q).
Læs mereNormalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ
Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet
Læs mereEstimation og konfidensintervaller
Statistik og Sandsynlighedsregning STAT kapitel 4.4 Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne Estimation og konfidensintervaller Antag X Bin(n,
Læs mereDagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at
Likelihood teori Lineær regression (intro) Dagens Emner Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 1 ) = ( 2πσ 2)n/2 e 1 2 P n (xi µ)2 er tætheden som funktion af
Læs mereOversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger
Kursus 02402 Introduktion til Statistik Forelæsning 4: Kapitel 5: Kontinuerte fordelinger Rune Haubo B Christensen (based on slides by Per Bruun Brockhoff) DTU Compute, Statistik og Dataanalyse Bygning
Læs mereKursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff
Kursus 02402 Introduktion til Statistik Forelæsning 13: Summary Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:
Læs mereOversigt. Kursus 02402 Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Eksponential fordelingen
Kursus 02402 Introduktion til Statistik Forelæsning 4: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:
Læs mereAnalysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17
nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse
Læs mereNATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.
NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. Eksamen i Statistik 1TS Teoretisk statistik Den skriftlige prøve Sommer 2002 3 timer - alle hjælpemidler tilladt Det er tilladt at skrive
Læs mereDefinition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.
Landmålingens fejlteori Lektion 2 Transformation af stokastiske variable - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf12 Institut for Matematiske Fag Aalborg Universitet Repetition:
Læs mere1 Hb SS Hb Sβ Hb SC = , (s = )
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.
Læs mereHypotesetests, fejltyper og p-værdier
Hypotesetests, fejltyper og p-værdier Søren Højsgaard Institut for Matematiske Fag, Aalborg Universitet October 25, 2018 Søren Højsgaard Institut for Matematiske Fag, Aalborg Hypotesetests, Universitet
Læs mereTrin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse
Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ
Læs mereNanostatistik: Test af hypotese
Nanostatistik: Test af hypotese JLJ Nanostatistik: Test af hypotese p. 1/50 Repetition n uafhængige gentagne målinger: Fordelingsundersøgelse: Pindediagram / Histogram qq-plot Parameter: egenskab ved fordeling
Læs mereBetingede sandsynligheder Aase D. Madsen
1 Uge 12 Teoretisk Statistik 15. marts 2004 1. Betingede sandsynligheder Definition Loven om den totale sandsynlighed Bayes formel 2. Betinget middelværdi og varians 3. Kovarians og korrelationskoefficient
Læs mereTeoretisk Statistik, 13 april, 2005
Poissonprocessen Teoretisk Statistik, 13 april, 2005 Setup og antagelser Fordelingen af X(t) og et eksempel Ventetider i poissonprocessen Fordeling af ventetiden T 1 til første ankomst Fortolkning af λ
Læs mereStatistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge
Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange
Læs mereUge 43 I Teoretisk Statistik, 21. oktober Forudsigelser
Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier
Læs mereKvantitative Metoder 1 - Forår Dagens program
Dagens program Kontinuerte fordelinger Ventetider i en Poissonproces Beskrivelse af kontinuerte fordelinger: - Median og kvartiler - Middelværdi - Varians Simultane fordelinger 1 Ventetider i en Poissonproces
Læs mereNATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.
NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. Eksamen i Statistik 1TS Teoretisk statistik Den skriftlige prøve Sommer 2003 3 timer - alle hjælpemidler tilladt Det er tilladt at skrive
Læs mereNATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.
NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. Eksamen i Statistik 1TS Teoretisk statistik Den skriftlige prøve Sommer 2005 3 timer - alle hjælpemidler tilladt Det er tilladt at skrive
Læs mereOpgaver til kapitel 3
Opgaver til kapitel 3 3.1 En løber er interesseret i at undersøge om hendes løbeur er kalibreret korrekt. Hun udmåler derfor en strækning på præcis 1000 m og løber den 16 gange. For hver løbetur noterer
Læs mereNanostatistik: Opgavebesvarelser
Nanostatistik: Opgavebesvarelser JLJ Nanostatistik: Opgavebesvarelser p. 1/16 Pakkemaskine En producent hævder at poserne indeholder i gennemsnit 16 ounces sukker. Data: 10 pakker sukker: 16.1, 15.8, 15.8,
Læs mereLandmålingens fejlteori - Repetition - Kontinuerte stokastiske variable - Lektion 3
Landmålingens fejlteori Repetition - Kontinuerte stokastiske variable Lektion 4 - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf10 Institut for Matematiske Fag Aalborg Universitet 29. april
Læs mereProgram. Statistik og Sandsynlighedsregning 2 Middelværdi og varians. Eksempler fra sidst. Sandsynlighedstæthed og sandsynlighedsmål
Program Statistik og Sandsynlighedsregning 2 Middelværdi og varians Helle Sørensen Uge 6, onsdag I formiddag: Tætheder og fordelingsfunktioner kort resume fra i mandags og et par eksempler mere om sammenhængen
Læs mereElementær sandsynlighedsregning
Elementær sandsynlighedsregning Sandsynlighedsbegrebet Et udfaldsrum S er mængden af alle de mulige udfald af et eksperiment. En hændelse A er en delmængde af udfaldsrummet S. Den hændelse, der ikke indeholder
Læs mereStatistik og Sandsynlighedsregning 2
Statistik og Sandsynlighedsregning 2 Middelværdi og varians Helle Sørensen Uge 6, onsdag SaSt2 (Uge 6, onsdag) Middelværdi og varians 1 / 18 Program I formiddag: Tætheder og fordelingsfunktioner kort resume
Læs mereKvantitative Metoder 1 - Forår Dagens program
Dagens program Kontinuerte fordelinger Simultane fordelinger Kovarians og korrelation Uafhængighed Betingede fordelinger - Middelværdi og varians - Sammenhæng med uafhængighed 1 Figur 1: En tæthedsfunktion
Læs mereLandmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable
Landmålingens fejlteori Lektion 2 Transformation af stokastiske variable - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf12 Institut for Matematiske Fag Aalborg Universitet 1/31 Repetition:
Læs mereNote om Monte Carlo metoden
Note om Monte Carlo metoden Kasper K. Berthelsen Version 1.2 25. marts 2014 1 Introduktion Betegnelsen Monte Carlo dækker over en lang række metoder. Fælles for disse metoder er, at de anvendes til at
Læs mereStatikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression
Statikstik II 2. Lektion Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Sandsynlighedsregningsrepetition Antag at Svar kan være Ja og Nej. Sandsynligheden for at Svar Ja skrives
Læs mereMatematisk Modellering 1 Cheat Sheet
By a team of brave computer scientists: Mads P. Buch, Tobias Brixen, Troels Thorsen, Peder Detlefsen, Mark Gottenborg, Peter Krogshede - 1 Contents 1 Basalt 3 1.1 Varianser...............................
Læs mereHvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05
Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ
Læs mereStatistik II 4. Lektion. Logistisk regression
Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:
Læs mereLogistisk Regression. Repetition Fortolkning af odds Test i logistisk regression
Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π
Læs mereStatDataN: Test af hypotese
StatDataN: Test af hypotese JLJ StatDataN: Test af hypotese p. 1/69 Repetition n uafhængige gentagne målinger: Fordelingsundersøgelse: Pindediagram / Histogram qq-plot Parameter: egenskab ved fordeling
Læs mereKonfidensintervaller og Hypotesetest
Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller
Læs mereNotation for parallelforbundne ekspeditionssystemer
Køsystemer notation Notation for parallelforbundne ekspeditionssystemer X /Y (m, q). Ankomstproces X og ekspeditionstidsproces Y kan antage værdier: M: Uafhængige og eksponentialfordelte ventetider. Dvs.
Læs meremen nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller
Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =
Læs mereModeller for ankomstprocesser
Modeller for ankomstprocesser Eric Bentzen Institut for Produktion og Erhvervsøkonomi Handelshøjskolen i København November 2007 1 . Afsnit Indhold Side 1 Indledning 3 2 Ankomstprocessen 3 3 Servicesystemet
Læs mereHvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm
Kon densintervaller og vurdering af estimaters usikkerhed Claus Thorn Ekstrøm KU Biostatistik ekstrom@sund.ku.dk Marts 18, 2019 Slides @ biostatistics.dk/talks/ 1 Population og stikprøve 2 Stikprøvevariation
Læs mereStatistik og Sandsynlighedsregning 2
Statistik og Sandsynlighedsregning 2 Normalfordelingen og transformation af kontinuerte fordelinger Helle Sørensen Uge 7, mandag SaSt2 (Uge 7, mandag) Normalford. og transformation 1 / 16 Program Paretofordelingen,
Læs mereLandmålingens fejlteori - Repetition - Fordeling af slutfejl - Lektion 8
Landmålingens fejlteori Repetition - Fordeling af slutfejl Lektion 8 - tvede@math.aau.dk http://www.math.aau.dk/ tvede/teaching/l4 Institut for Matematiske Fag Aalborg Universitet 15. maj 2008 1/13 Fordeling
Læs mere02402 Vejledende løsninger til Splus-opgaverne fra hele kurset
02402 Vejledende løsninger til Splus-opgaverne fra hele kurset Vejledende løsning SPL3.3.1 Der er tale om en binomialfordeling med n =10ogp=0.6, og den angivne sandsynlighed er P (X =4) som i bogen også
Læs mereStatistik og Sandsynlighedsregning 2
Statistik og Sandsynlighedsregning 2 Normalfordelingens venner og bekendte Helle Sørensen Uge 9, onsdag SaSt2 (Uge 9, onsdag) Normalfordelingens venner 1 / 20 Program Resultaterne fra denne uge skal bruges
Læs mereEn Introduktion til SAS. Kapitel 5.
En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel
Læs mereDANMARKS TEKNISKE UNIVERSITET Side 1 af 18 sider. Skriftlig prøve, den: 16. december 2003 Kursus nr : (navn) (underskrift) (bord nr)
DANMARKS TEKNISKE UNIVERSITET Side 1 af 18 sider Skriftlig prøve, den: 16. december 2003 Kursus nr : 02405 Kursus navn: Sandsynlighedsregning Varighed : 4 timer Tilladte hjælpemidler: Alle Dette sæt er
Læs mereLøsning til eksaminen d. 29. maj 2009
DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Læs mere1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...
Indhold 1 Statistisk inferens: Hypotese og test 2 1.1 Nulhypotese - alternativ.................................. 2 1.2 Teststatistik........................................ 3 1.3 P-værdi..........................................
Læs mere3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve
Læs mereStatistik og Sandsynlighedsregning 2
Statistik og Sandsynlighedsregning 2 Lineære transformationer, middelværdi og varians Helle Sørensen Uge 8, onsdag SaSt2 (Uge 8, onsdag) Lineære transf. og middelværdi 1 / 15 Program I formiddag: Fordeling
Læs mereProdukt og marked - matematiske og statistiske metoder
Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 11, 2016 1/22 Kursusindhold: Sandsynlighedsregning og lagerstyring
Læs mereDen lineære normale model
Den lineære normale model Ingredienser: V : N-dimensionalt vektorrum. X : Ω V : stokastisk variabel. L : ægte underrum af V, dimension k., : fundamentalt indre produkt på V. Vi laver en hel familie af
Læs mereProgram. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter
Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs merehvor a og b er konstanter. Ved middelværdidannelse fås videre
Uge 3 Teoretisk Statistik. marts 004. Korrelation og uafhængighed, repetition. Eksempel fra sidste gang (uge ) 3. Middelværdivektor, kovarians- og korrelationsmatrix 4. Summer af stokastiske variable 5.Den
Læs mereHvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau
Hvad skal vi lave? 1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ. Teststatistik P-værdi Signifikansniveau 2 t-test for middelværdi Tosidet t-test for middelværdi Ensidet t-test for middelværdi
Læs mere