Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger. Peder Bacher
|
|
|
- Jonas Bech
- 9 år siden
- Visninger:
Transkript
1 Introduktion til Statistik Forelæsning 2: Stokastisk variabel og diskrete fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark Efterår 2016 DTU Compute Introduktion til Statistik Efterår / 57
2 enote2: Diskrete fordelinger Engelsk Grundlæggende koncepter: Stokastisk variabel (værdi afhængig af udfald af endnu ikke udført eksperiment) Tæthedsfunktion: f (x) = P(X = x) (pdf) Fordelingsfunktion: F(x) = P(X x) (cdf) Middelværdi: µ = E(X) Standard afvigelse: σ Varians: σ 2 Specifikke distributioner: Binomial (terningekast) Hypergeometrisk (trækning uden tilbagelægning) Poisson (antal hændelser i interval) DTU Compute Introduktion til Statistik Efterår / 57
3 enote 2: Discrete Distributions Dansk General concepts: Random variable (value dependent on outcome of yet not carried out experiment) Density function: f (x) = P(X = x) (pdf) Distribution function: F(x) = P(X x) (cdf) Mean: µ = E(X) Standard deviation: σ Variance: σ 2 Specific distributions: The binomial distribution (dice roll) The hypergeometric distribution (draw without replacement) The Poisson distribution (number of events in interval) DTU Compute Introduktion til Statistik Efterår / 57
4 Oversigt 1 Stokastisk variabel 2 Tæthedsfunktion 3 Fordelingsfunktion 4 Konkrete statistiske fordelinger Binomialfordelingen Hypergeometrisk fordeling Eksempler Eksempel 1 Eksempel 2 Poissonfordelingen Eksempel 3 5 Middelværdi og varians Middelværdi og varians for kendte diskrete fordelinger DTU Compute Introduktion til Statistik Efterår / 57
5 Praktisk information SE PRAKTISK INFORMATION PÅ HJEMMESIDEN OG I STARTEN AF SLIDES FRA UGE 1 DTU Compute Introduktion til Statistik Efterår / 57
6 Stokastisk variabel Stokastisk variabel En stokastisk variabel (random variable) tildeler en værdi til udfaldet af et eksperiment der endnu ikke er udført Et terningekast Antallet af seksere i 10 terningekast Hvor stor en andel svarer ja til et spørgsmål km/l for en bil Måling af sukkerniveau i blodprøve... DTU Compute Introduktion til Statistik Efterår / 57
7 Stokastisk variabel Diskret eller kontinuert Vi skelner mellem diskret og kontinuert Diskret (kan ofte tælles): Hvor mange der bruger briller herinde Antal mange flyvere letter den næste time... Kontinuert: Vindmåling Tiden det tog at komme til DTU... Der er en gråzone, f.eks. for observationer målt med lav opløsning. I dag er det diskret og i næste uge er det kontinuert. DTU Compute Introduktion til Statistik Efterår / 57
8 Stokastisk variabel Stokastisk variabel Før eksperimentet er udført haves stokastisk variabel noteret med stort bogstav Så udføres eksperimentet, og vi har da en realisation eller observation X 1 noteret med småt bogstav. x 1 DTU Compute Introduktion til Statistik Efterår / 57
9 Stokastisk variabel Stokastisk variabel og stikprøve Før eksperimentet er udført haves stikprøven som n stokastiske variable noteret med stort bogstav X 1,X 2,...,X n Så udføres eksperimentet, og vi har da realisationer eller observationer noteret med småt bogstav x 1,x 2,...,x n Dvs. vi udfører eksperimentet n gange for at lave stikprøven DTU Compute Introduktion til Statistik Efterår / 57
10 Stokastisk variabel Eksempel: Simuler et terningekast Vælg et tal fra (1,2,3,4,5,6) med lige stor sandsynlighed for hvert udfald Simuler i R ## Simuler et terningekast ## Vælg et tal fra (1,2,3,4,5,6) med lige sandsynlighed for hvert udfald sample(1:6, size=1) ## Antal simulerede realiseringer n <- 30 ## Træk uafhængigt fra mængden (1,2,3,4,5,6) med ens sandsynlighed sample(1:6, size=n, replace=true) DTU Compute Introduktion til Statistik Efterår / 57
11 Diskrete fordelinger Stokastisk variabel Hvordan kan vi regne på eksperimentet før det er udført? Hvad kan vi gøre når vi endnu ikke kender udfaldet!? Løsning: brug en tæthedsfunktion DTU Compute Introduktion til Statistik Efterår / 57
12 Tæthedsfunktion Tæthedsfunktion En stokastisk variabel har en tæthedsfunktion (probability density function (pdf)) Definition f (x) = P(X = x) Sandsynligheden for at X antager værdien x når eksperimentet udføres DTU Compute Introduktion til Statistik Efterår / 57
13 Tæthedsfunktion Tæthedsfunktion En fair ternings tæthedsfunktion DTU Compute Introduktion til Statistik Efterår / 57
14 tæthedsfunktion Tæthedsfunktion En unfair ternings tæthedsfunktion f X unfair(x) f (1) = 1 7 f (6) = x DTU Compute Introduktion til Statistik Efterår / 57
15 Tæthedsfunktion Spørgsmål om unfair terning (socrative.com, room: PBAC) Find nogle sandsynligheder for X unfair : Sandsynligheden for at få en fire? Svar: E Sandsynligheden for at få en femmer eller en sekser? Svar: A Sandsynligheden for at få mindre end tre? Svar: D f X unfair(x) f (1) = 1 7 f (6) = 2 7 Svarmuligheder: A: 7 3 B: 1 6 C: 7 4 D: x E: 1 7 DTU Compute Introduktion til Statistik Efterår / 57
16 Stikprøve Tæthedsfunktion Vi har en terning og vil nu undersøge om en terningen er fair. Hvis vi kun har en observation kan vi da se fordelingen? Nej men hvis vi har n observationer, så har vi en stikprøve (sample) {x 1,x 2,...,x n } og da kan vi begynde at se fordelingen. DTU Compute Introduktion til Statistik Efterår / 57
17 Tæthedsfunktion Simuler n kast med en fair terning: ## Simuler en fair terning ## Antal simulerede realiseringer n <- 30 ## Træk uafhængigt fra mængden (1,2,3,4,5,6) med ens sandsynlighed xfair <- sample(1:6, size=n, replace=true) ## Tæl antallet af hvert udfald table(xfair) ## Plot den empiriske tæthedsfunktion (pdf), altså et density histogram plot(table(xfair)/n, ylim=c(0,1), lwd=10, xlab="x", ylab="f(x)") ## Tilføj den rigtige tæthedsfunktion til plottet lines(rep(1/6,6), type="h", lwd=3, col="red") ## legend legend("topright", c("empirical pdf","pdf"), lty=1, col=c(1,2), lwd=c(5,2)) DTU Compute Introduktion til Statistik Efterår / 57
18 Tæthedsfunktion Simuler n kast med en ikke-fair terning: ## Simuler en ikke-fair terning ## Antal simulerede realiseringer n <- 30 ## Træk uafhændigt fra mængden (1,2,3,4,5,6) med højere sandsynlighed for en sekser xunfair <- sample(1:6, size=n, replace=true, prob=c(rep(1/7,5),2/7)) ## Plot den empiriske tæthedsfunktion plot(table(xunfair)/n, lwd=10, ylim=c(0,1), xlab="x", ylab="density") ## Tilføj den rigtige tæthedsfunktion lines(c(rep(1/7,5),2/7), lwd=4, type="h", col=2) ## En legend legend("topright", c("empirical pdf","pdf"), lty=1, col=c(1,2), lwd=c(5,2)) DTU Compute Introduktion til Statistik Efterår / 57
19 Fordelingsfunktion Fordelingsfunktion (distribution function eller cumulative density function (cdf)) Definition Fordelingsfunktionen (cdf) er tæthedsfunktionen akkumuleret F(x) = P(X x) = j hvor x j x f (x j ) Der gælder for en fordelingsfunktion (cdf): Den er en ikke-aftagende funktion Den akkumuleres (assymtotisk) til 1 når x DTU Compute Introduktion til Statistik Efterår / 57
20 Fordelingsfunktion Fair terning eksempel Lad X repræsentere værdien af et kast med en fair terning Udregn sandsynligheden for at få udfald under 3: P(X < 3) = P(X 2) = F(2) fordelingsfunktionen = P(X = 1) + P(X = 2) = f (1) + f (2) tæthedsfunktionen = = 1 3 DTU Compute Introduktion til Statistik Efterår / 57
21 Fordelingsfunktion Fair terning eksempel Udregn sandsynligheden for at få udfald over eller lig 3: P(X 3) = 1 P(X 2) = 1 F(2) fordelingsfunktionen = = 2 3 DTU Compute Introduktion til Statistik Efterår / 57
22 Fordelingsfunktion Spørgsmål om cdf (socrative.com, room: PBAC) F(x) A F(x) B x x F(x) C F(x) D x Hvilket et af ovenstående plots kan være en fordelingsfunktion (akkumuleret tæthedsfunktion, cdf)? A, B, C eller D? Svar: C DTU Compute Introduktion til Statistik Efterår / 57 x
23 Konkrete statistiske fordelinger Konkrete statistiske fordelinger Der findes en række statistiske fordelinger, som kan bruges til at beskrive og analysere forskellige problemstillinger med I dag er det diskrete fordelinger: Binomialfordelingen Den hypergeometriske fordeling Poissonfordelingen DTU Compute Introduktion til Statistik Efterår / 57
24 Konkrete statistiske fordelinger Binomialfordelingen En handling (eksperiment) med to udfald (succes eller ikke-succes) gentages Eksperiment med udfald: Tæl antal succeser Lad X repræsentere antal succeser efter n gentagelser X følger binomialfordelingen X B(n,p) med parametre n antal gentagelser p sandsynligheden for succes i hver gentagelse DTU Compute Introduktion til Statistik Efterår / 57
25 Konkrete statistiske fordelinger Binomialfordelingen Binomialfordelingens tæthedsfunktion giver sandsynligheden for x antal succeser ( ) n f (x;n,p) = P(X = x) = p x (1 p) n x x Eksempel: Sandsynlighed for 2 plat ved 5 plat-eller-krone kast med mønt f (2;5,0.5) = P(X = 2) = ( ) (1 0.5) 5 2 = DTU Compute Introduktion til Statistik Efterår / 57
26 Konkrete statistiske fordelinger Binomialfordelingen Binomialfordeling eksempel i R: ## Simuler en binomialfordeling ## Sandsynlighed for success p <- 0.1 ## Antal gentagelser af succes og ikke-succes eksperimentet nrepeat <- 30 ## Simuler Bernoulli eksperiment nrepeat gange tmp <- sample(c(0,1), size=nrepeat, prob=c(1-p,p), replace=true) ## x er nu sum(tmp) ## Lav tilsvarende med funktion til simulering af binomialfordeling rbinom(1, size=30, prob=p) Binomialfordeling med terning i R: ## Fair terning eksempel ## Antal simulerede realiseringer n <- 30 ## Træk uafhængigt fra mængden (1,2,3,4,5,6) med ens sandsynlighed xfair <- sample(1:6, size=n, replace=true) ## Tæl sammen hvor mange seksere sum(xfair == 6) ## Lav tilsvarende med rbinom() rbinom(n=1, size=30, prob=1/6) DTU Compute Introduktion til Statistik Efterår / 57
27 Konkrete statistiske fordelinger Hypergeometrisk fordeling Hypergeometrisk fordeling X er igen antal succeser, men nu er det uden tilbagelægning ved gentagelsen X følger den hypergeometriske fordeling X H(n,a,N) med parametrene n er antallet af trækninger a er antallet af succeser i populationen N elementer store population DTU Compute Introduktion til Statistik Efterår / 57
28 Konkrete statistiske fordelinger Hypergeometrisk fordeling Hypergeometrisk fordeling Sandsynligheden for at få x succeser er f (x;n,a,n) = P(X = x) = ( a N a ) x)( n x ( N n) hvor n er antallet af trækninger a er antallet af succeser i populationen N elementer stor population DTU Compute Introduktion til Statistik Efterår / 57
29 Konkrete statistiske fordelinger Binomial vs. hypergeometrisk Hypergeometrisk fordeling Binomialfordelingen anvendes også for at analysere stikprøver med tilbagelægning (tænk på en terningekast) Når man vil analysere stikprøver uden tilbagelægning anvendes den hypergeometriske fordeling (tænk på træk fra en hat) DTU Compute Introduktion til Statistik Efterår / 57
30 Konkrete statistiske fordelinger Pause PAUSE DTU Compute Introduktion til Statistik Efterår / 57
31 Konkrete statistiske fordelinger Distributioner i R R Betegnelse binom Binomial hyper hypergeometrisk d Tæthedsfunktion f (x) (probability density function). p Fordelingsfunktion F(x) (cumulative distribution function). r Tilfældige tal fra den anførte fordeling. (Forelæsning 10) q Fraktil (quantile) i fordeling. Husk at hjælp til funktion mm. fåes ved at sætte? foran navnet. Eksempel binomialfordelt: P(X 5) = F(5; 10, 0.6) ## Binomialfordelingsfunktion pbinom(q=5, size=10, prob=0.6) ## Få hjælpen med?pbinom DTU Compute Introduktion til Statistik Efterår / 57
32 Konkrete statistiske fordelinger Eksempler Eksempel 1 I et kundecenter i et telefonselskab søger man at forbedre kundetilfredsheden. Især er det vigtigt, at når der indrapporteres en fejl, bliver fejlen udbedret i løbet af samme dag. Antag at sandsynligheden for at en fejl bliver udbedret i løbet af samme dag altid er 0.7. I løbet af en dag indrapporteres 6 fejl. Hvad er sandsynligheden for at samtlige fejl udbedres? Step 1) Hvad skal repræsenteres: X er antal udbedrede fejl Step 2) Fordeling: X følger A: binomial, B: hypergeometrisk? binomialfordelingen Step 3) Hvilken sandsynlighed: P(X??) P(X = 6) = f (6;n,p) Step 4) Hvad er antal trækninger? n = 6 Hvad er succes-sandsynligheden? p = 0.7 Udregn i R DTU Compute Introduktion til Statistik Efterår / 57
33 Konkrete statistiske fordelinger Eksempler Eksempel 1 Hvad er sandsynligheden for at 2 eller færre fejl bliver udbedret samme dag? Step 1) Hvad skal repræsenteres: X er antal udbedrede fejl Step 2) Hvilken fordeling: X følger binomialfordelingen Step 3) Hvilken sandsynlighed: A: P(X < 2) B: P(X 1) C: P(X < 3) D: 1 P(X 2) P(X < 3) = P(X 2) = F(2;n,p) Step 4) Hvad er antal trækninger? n = 6 Hvad er succes-sandsynligheden? p = 0.7 Udregn i R DTU Compute Introduktion til Statistik Efterår / 57
34 Konkrete statistiske fordelinger Eksempler Eksempel 2 I bankoklubben trækkes der lod om 5 flasker Gammel Dansk. Der er udstedt 50 lodder og du har 3 lodder (der er altså 50 sedler med numrene fra 1 til 50 og der er 3 af de numre som du vinder på). Hvad er sandsynligheden for at du vinder præcis en flaske Gammel Dansk? Step 1) Hvad skal repræsenteres: X er antal flasker du vinder Step 2) Hvilken fordeling: X følger den hypergeometriske fordeling Step 3) Hvilken sandsynlighed: P(X??) P(X = 1) = f (1;n,a,N) Step 4) Hvad er antal trækninger? n = 5 Hvor mange succeser er der? a = 3 Hvor mange er der i alt? N = 50 Udregn i R DTU Compute Introduktion til Statistik Efterår / 57
35 Poissonfordelingen Konkrete statistiske fordelinger Poissonfordelingen Poissonfordelingen anvendes ofte som en fordeling (model) for tælletal, hvor der ikke er nogen naturlig øvre grænse Poissonfordelingen karakteriseres ved en intensitet, dvs. på formen antal/enhed Parameteren λ angiver intensiteten λ er typisk hændelser per tidsinterval Intervallerne mellem hændelserne er uafhængige, dvs. processen er hukommelsesløs DTU Compute Introduktion til Statistik Efterår / 57
36 Poissonfordelingen Konkrete statistiske fordelinger Poissonfordelingen X følger Poissonfordelingen X P(λ) Tæthedsfunktion f (x) = P(X = x) = λ x x! e λ DTU Compute Introduktion til Statistik Efterår / 57
37 Konkrete statistiske fordelinger Eksempel 3.1: Poissonfordelingen Poissonfordelingen Det antages, at der i gennemsnit bliver indlagt 0.3 patienter pr. dag på københavnske hospitaler som følge af luftforurening. Hvad er sandsynligheden for at der på en vilkårlig dag bliver indlagt højst 2 patienter som følge af luftforurening? Step 1) Hvad skal repræsenteres: X er antal patienter pr. dag Step 2) Hvilken fordeling: X følger Poissonfordelingen Step 3) Hvilken sandsynlighed: P(X??) P(X 2) Step 4) Hvad er raten: Udregn i R λ = 0.3 patienter per dag DTU Compute Introduktion til Statistik Efterår / 57
38 Konkrete statistiske fordelinger Eksempel 3.2: Poissonfordelingen Poissonfordelingen Det antages, at der i gennemsnit bliver indlagt 0.3 patienter pr. dag på københavnske hospitaler som følge af luftforurening. Hvad er sandsynligheden for at der på en vilkårlig dag bliver indlagt præcis 2 patienter? Step 3) Hvilken sandsynlighed: P(X??) P(X = 2) Udregn i R DTU Compute Introduktion til Statistik Efterår / 57
39 Konkrete statistiske fordelinger Eksempel 3.3: Poissonfordelingen Poissonfordelingen Det antages, at der i gennemsnit bliver indlagt 0.3 patienter pr. dag på københavnske hospitaler som følge af luftforurening. Hvad er sandsynligheden for at der på en vilkårlig dag bliver indlagt mindst 2 patienter? Step 3) Hvilken sandsynlighed: P(X??) P(X 2) = 1 P(X 1) Udregn i R DTU Compute Introduktion til Statistik Efterår / 57
40 Konkrete statistiske fordelinger Poissonfordelingen Eksempel 3.4: Skalering af intensiteten i Poissonfordeling Hvad er sandsynligheden for at der i en periode på 3 dage bliver indlagt præcis 1 patient? Step 1) Hvad skal repræsenteres: Fra X som er patienter per dag Til X 3dage som er patienter per 3 dage Step 2) Hvilken fordeling følger X 3dage : Poissonfordelingen Step 3) Hvilken sandsynlighed: P(X 3dage??) P(X 3dage = 1) Step 4) Skaler raten Fra λ dag = 0.3 patient/dag til λ 3dage = 0.9 patient/3 dag Udregn i R DTU Compute Introduktion til Statistik Efterår / 57
41 Middelværdi og varians Middelværdi (mean) og forventningsværdi (expectation) Definition: Middelværdi af stokastisk variabel µ = E(X) = x f (x) alle x Det rigtige gennemsnit eller populationens gennemsnit Fortæller hvor midten af X er DTU Compute Introduktion til Statistik Efterår / 57
42 Middelværdi eksempel Middelværdi og varians Middelværdi af et terningekast µ = E(X) = = = 3.5 DTU Compute Introduktion til Statistik Efterår / 57
43 Middelværdi og varians ## Simuler en fair terning ## Antal simulerede realiseringer n <- 30 ## Træk uafhængigt fra mængden (1,2,3,4,5,6) med ens sandsynlighed xfair <- sample(1:6, size=n, replace=true) ## Udregn gennemsnit (empirisk middelværdi, sample mean, læg mærke til ## at i R hedder funktionen 'mean') mean(xfair) DTU Compute Introduktion til Statistik Efterår / 57
44 Middelværdi og varians Spørgsmål om stikprøvevarians (socrative.com, room: PBAC) Hvad sker der generelt med gennemsnittet af en stikprøve når man får flere observationer? A: Gennemsnittet er uafhængigt af antal observationer B: Gennemsnittet kommer generelt længere væk fra middelværdien C: Gennemsnittet kommer generelt tættere på middelværdien Svar C: Des flere observationer, des tættere kommer man generelt på middelværdien. Prøv at lege med det i ved simulering i R DTU Compute Introduktion til Statistik Efterår / 57
45 Varians (variance) Middelværdi og varians Definition: Varians af stokastisk variabel σ 2 = Var(X) = (x µ) 2 f (x) alle x Et mål for spredningen Den rigtige spredning af X (modsat empirisk varians (sample variance)) DTU Compute Introduktion til Statistik Efterår / 57
46 Varians eksempel Middelværdi og varians Varians af terningekast σ 2 = E[(X µ) 2 ] = = (1 3.5) (2 3.5) (3 3.5) (4 3.5) (5 3.5) (6 3.5) DTU Compute Introduktion til Statistik Efterår / 57
47 Varians eksempel Middelværdi og varians ## Simuler en fair terning ## Antal simulerede realiseringer n <- 30 ## Træk uafhængigt fra mængden (1,2,3,4,5,6) med ens sandsynlighed xfair <- sample(1:6, size=n, replace=true) ## Udregn empirisk varians (sample variance, læg mærke til ## at i R hedder funktionen 'var') var(xfair) DTU Compute Introduktion til Statistik Efterår / 57
48 Middelværdi og varians Middelværdi og varians for kendte diskrete fordelinger Middelværdi og varians for kendte diskrete fordelinger Binomialfordelingen: Middelværdi: µ = n p Varians: σ 2 = n p (1 p) DTU Compute Introduktion til Statistik Efterår / 57
49 Middelværdi og varians Middelværdi og varians for kendte diskrete fordelinger Middelværdi og varians for kendte diskrete fordelinger Den hypergeometriske fordeling: Middelværdi: µ = n an Varians: σ 2 = na (N a) (N n) N 2 (N 1) DTU Compute Introduktion til Statistik Efterår / 57
50 Middelværdi og varians Middelværdi og varians for kendte diskrete fordelinger Middelværdi og varians for kendte fordelinger Poissonfordelingen: Middelværdi: µ = λ Varians: σ 2 = λ DTU Compute Introduktion til Statistik Efterår / 57
51 Terninge eksempel Middelværdi og varians Middelværdi og varians for kendte diskrete fordelinger Se forskel på stikprøvegennemsnittet (sample mean) og middelværdi (mean): ## Simuler en binomialfordeling, terninge eksempel ## Gentag 10 gange: Tæl sammen for mange seksere på 30 slag antalseksere <- rbinom(n=10, size=30, prob=1/6) ## Endelig kan vi se på empirisk middelværdi (sample mean) mean(rbinom(n=10, size=30, prob=1/6)) ## Den (rigtige) middelværdi (mean) n * 1/6 DTU Compute Introduktion til Statistik Efterår / 57
52 Oversigt Middelværdi og varians Middelværdi og varians for kendte diskrete fordelinger 1 Stokastisk variabel 2 Tæthedsfunktion 3 Fordelingsfunktion 4 Konkrete statistiske fordelinger Binomialfordelingen Hypergeometrisk fordeling Eksempler Eksempel 1 Eksempel 2 Poissonfordelingen Eksempel 3 5 Middelværdi og varians Middelværdi og varians for kendte diskrete fordelinger DTU Compute Introduktion til Statistik Efterår / 57
Oversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger
Introduktion til Statistik Forelæsning 2: og diskrete fordelinger Oversigt 1 2 3 Fordelingsfunktion 4 Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 017 Danmarks Tekniske Universitet 2800
Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger
Course 02402/02323 Introducerende Statistik Forelæsning 2: Stokastisk variabel og diskrete fordelinger Klaus K. Andersen og Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Danmarks Tekniske Universitet
Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable
Kursus 02402 Introduktion til Statistik Forelæsning 2: Kapitel 4, Diskrete fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher
Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: [email protected]
Forelæsning 3: Kapitel 5: Kontinuerte fordelinger
Kursus 02402 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Kvantitative Metoder 1 - Efterår Dagens program
Dagens program Approksimation af binomialsandsynligheder, Afsnit 4.5 Multinomial fordeling, Afsnit 4.8 Negativ binomialfordeling, Afsnit 4.4 Poisson fordeling og Poisson process, Afsnit 4.6 Kontinuerte
Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen
Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen Repetition Lov om total sandsynlighed Bayes sætning P( B A) = P(A) = P(AI B) + P(AI P( A B) P( B) P( A B) P( B) +
Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/
Program: 1. Repetition af vigtige sandsynlighedsfordelinger: binomial, (Poisson,) normal (og χ 2 ). 2. Populationer og stikprøver 3. Opsummering af data vha. deskriptive størrelser og grafer. 1/29 Binomial
Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher
Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: [email protected]
Oversigt. Kursus 02402 Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Eksponential fordelingen
Kursus 02402 Introduktion til Statistik Forelæsning 4: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:
Elementær sandsynlighedsregning
Elementær sandsynlighedsregning Sandsynlighedsbegrebet Et udfaldsrum S er mængden af alle de mulige udfald af et eksperiment. En hændelse A er en delmængde af udfaldsrummet S. Den hændelse, der ikke indeholder
Kursus 02402/02323 Introduktion til statistik. Forelæsning 13: Et overblik over kursets indhold. Klaus K. Andersen og Per Bruun Brockhoff
Kursus 02402/02323 Introduktion til statistik Forelæsning 13: Et overblik over kursets indhold Klaus K. Andersen og Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Danmarks Tekniske Universitet
Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)
Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske
Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher
Kursus 02323: Introducerende Statistik Forelæsning 12: Forsøgsplanlægning Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: [email protected]
Elementær sandsynlighedsregning
Elementær sandsynlighedsregning Sandsynlighedsbegrebet Et udfaldsrum S er mængden af alle de mulige udfald af et eksperiment. En hændelse A er en delmængde af udfaldsrummet S. Et sandsynlighedsmål er en
Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte
Produkt og marked - matematiske og statistiske metoder
Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring
Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet March 1, 2013 Sandsynlighedsregning og lagerstyring Normalfordelingen
1 enote 1: Simple plots og deskriptive statistik. 2 enote2: Diskrete fordelinger. 3 enote 2: Kontinuerte fordelinger
Kursus 02402/02323 Introduktion til statistik Forelæsning 13: Et overblik over kursets indhold Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Building 324, Room 220 Danish Technical University
Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 3: Kontinuerte fordelinger. Per Bruun Brockhoff
Course 242/2323 Introducerende Statistik Forelæsning 3: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 22 Danmarks Tekniske Universitet 28 Lyngby Danmark
Kvantitative Metoder 1 - Forår 2007
Dagens program Kapitel 4: Diskrete fordelinger Hypergeometrisk fordeling, Afsnit 4.3 Multinomial fordeling, Afsnit 4.8 Geometrisk fordeling og Negativ binomialfordeling (Inverse Sampling), Afsnit 4.4 Approksimation
Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable
Normal fordelingen Normal fordelingen Egenskaber ved normalfordelingen Standard normal fordelingen Find sandsynligheder ud fra tabel Transformation af normal fordelte variable Invers transformation Repetition
Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen
Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen Anvendt Matematik og Computer Science Danmarks Tekniske Universitet 2800 Kgs. Lyngby Danmark Email: [email protected] Dagens emner: Afsnit 3.3 og 3.4 Varians/standardafvigelse
Modul 2: Sandsynlighedsmodeller og diskrete stokastiske variable
Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 2: Sandsynlighedsmodeller og diskrete stokastiske variable 2.1 Sandsynlighedsbegrebet............................... 1 2.1.1
1 enote 1: Simple plots og deskriptive statistik. 2 enote 2: Diskrete fordelinger. 3 enote 2: Kontinuerte fordelinger
Kursus 02402/02323 Introduktion til statistik Forelæsning 13: Et overblik over kursets indhold Peder Bacher DTU Compute, Dynamiske Systemer Building 303B, Room 017 Danish Technical University 2800 Lyngby
Kvantitative Metoder 1 - Forår 2007
Dagens program Kapitel 8.7, 8.8 og 8.10 Momenter af gennemsnit og andele kap. 8.7 Eksempel med simulationer Den centrale grænseværdisætning (Central Limit Theorem) kap. 8.8 Simulationer Normalfordelte
1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable
Landmålingens fejlteori - lidt om kurset Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable - [email protected] Institut for Matematiske Fag Aalborg Universitet Kursusholder
Produkt og marked - matematiske og statistiske metoder
Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 11, 2016 1/22 Kursusindhold: Sandsynlighedsregning og lagerstyring
Note om Monte Carlo metoden
Note om Monte Carlo metoden Kasper K. Berthelsen Version 1.2 25. marts 2014 1 Introduktion Betegnelsen Monte Carlo dækker over en lang række metoder. Fælles for disse metoder er, at de anvendes til at
Statistik Lektion 2. Betinget sandsynlighed Bayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV Binomialfordelingen
Statistik Lektion etinget sandsynlighed ayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV inomialfordelingen Repetition Udfaldsrum S Hændelse S Simpel hændelse O i 1, 3 4,
Binomialfordelingen. X ~ bin(n,p): X = antal "succeser" i n uafhængige forsøg, der alle har samme sandsynlighed p for at ende med succes.
Uge 9 Teoretisk Statistik 23. februar 24 1. Binomialfordelingen 2. Den hypergeometriske fordeling 3. Poissonfordelingen 4. Den negative binomialfordeling 5. Gammafordelingen Binomialfordelingen X ~ bin(n,p):
Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 9, 2015 Sandsynlighedsregning og lagerstyring Normalfordelingen
Vejledende løsninger til opgaver i kapitel 6
Vejledende løsninger til opgaver i kapitel Opgave 1: a) Den stokastiske variabel, X, der angiver, om en elev består, X = 1, eller dumper, X =, sin eksamen i statistik. b) En binomialfordelt variabel fremkommer
Grundlæggende statistik Lektion 2 Indhold Diskrete fordelinger Binomial fordelingen Poisson fordelingen Hypergeometrisk fordeling Data typer el. typer af tilfældige variable Diskrete variable > Kategoriseres
Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable
Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable - [email protected] Institut for Matematiske Fag Aalborg Universitet 1/41 Landmålingens fejlteori - lidt om kurset
Diskrete fordelinger. Fire vigtige diskrete fordelinger: 1. Uniform fordeling (diskret) 2. Binomial fordeling. 3. Hyper-geometrisk fordeling
Disrete fordelinger Fire vigtige disrete fordelinger: 1. Uniform fordeling (disret) 2. Binomial fordeling 3. Hyper-geometris fordeling 4. Poisson fordeling 1 Uniform fordeling Definition Esperiment med
Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff
Kursus 02402 Introduktion til Statistik Forelæsning 13: Summary Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:
02402 Vejledende løsninger til hjemmeopgaver og øvelser i kapitel 4
0202 Vejledende løsninger til hjemmeopgaver og øvelser i kapitel Hjemmeopgaver Vejledende løsning.2 Eksperimentet kan beskrives ved binomialfordelingen, X b(x; n, p), hvor n = og p = 1 2. Dermed kan man
Uge 10 Teoretisk Statistik 1. marts 2004
1 Uge 10 Teoretisk Statistik 1. marts 004 1. u-fordelingen. Normalfordelingen 3. Middelværdi og varians 4. Mere normalfordelingsteori 5. Grafisk kontrol af normalfordelingsantagelse 6. Eksempler 7. Oversigt
Løsning eksamen d. 15. december 2008
Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Løsninger til kapitel 5
1 Løsninger til kapitel 5 Opgave 51 Det nemmeste er her at omskrive alle sandsynlighederne til differenser mellem kumulerede sandsynligheder, dvs af sandsynligheder af formen, og derefter beregne disse
Sandsynlighedsregning
Mogens Bladt www2.imm.dtu.dk/courses/02405 21. September, 2007 Lidt om binomialkoefficienter n størrelsen af en mængde/population. Vi ønsker at udtage en sub population af størrelse r. To sub populationer
Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger
Anvendt Statistik Lektion 2 Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Sandsynlighed: Opvarmning Udfald Resultatet af et eksperiment kaldes et udfald. Eksempler:
Statistik noter - Efterår 2009 Keller - Statistics for management and economics
Statistik noter - Efterår 2009 Keller - Statistics for management and economics Jonas Sveistrup Hansen - stud.merc.it 22. september 2009 1 Indhold 1 Begrebsliste 3 2 Forelæsning 1 - kap. 1-3 3 2.1 Kelvin
Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen
Statistik Lektion 3 Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen Repetition En stokastisk variabel er en funktion defineret på S (udfaldsrummet, der antager
Normalfordelingen og Stikprøvefordelinger
Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger
Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.
Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. 1/23 Opsummering af fordelinger X 1. Kendt σ: Z = X µ σ/ n N(0,1)
1 Sandsynlighed Sandsynlighedsbegrebet Definitioner Diskret fordeling Betinget sandsynlighed og uafhængighed...
Indhold 1 Sandsynlighed 1 1.1 Sandsynlighedsbegrebet................................. 1 1.2 Definitioner........................................ 2 1.3 Diskret fordeling.....................................
Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede
Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede fordelinger (kap. 4) Middelværdi og varians (kap. 3-4) Fordelingsresultater
Sandsynlighedsregning 3. forelæsning Bo Friis Nielsen
Sandsynlighedsregning 3. forelæsning Bo Friis Nielsen Anvendt Matematik og Computer Science Danmarks Tekniske Universitet 28 Kgs. Lyngby Danmark Email: [email protected] Dagens emner Stokastiske variable: udfald
Kapitel 4 Sandsynlighed og statistiske modeller
Kapitel 4 Sandsynlighed og statistiske modeller Peter Tibert Stoltze [email protected] Elementær statistik F2011 1 / 22 Generalisering fra stikprøve til population Idé: Opstil en model for populationen
Statistik Lektion 2. Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var.
Statistik Lektion Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var. Repetition Stikprøve Stikprøvestørrelse n Stikprøvemiddelværdi Stikprøvevarians s Population
Forelæsning 11: Envejs variansanalyse, ANOVA
Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalyse, ANOVA Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark
Løsning til eksaminen d. 29. maj 2009
DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Sandsynlighedsregning: endeligt udfaldsrum (repetition)
Program: 1. Repetition: sandsynlighedsregning 2. Sandsynlighedsregning fortsat: stokastisk variabel, sandsynlighedsfunktion/tæthed, fordelingsfunktion. 1/16 Sandsynlighedsregning: endeligt udfaldsrum (repetition)
Kapitel 4 Sandsynlighed og statistiske modeller
Kapitel 4 Sandsynlighed og statistiske modeller Peter Tibert Stoltze [email protected] Elementær statistik F2011 1 Indledning 2 Sandsynlighed i binomialfordelingen 3 Normalfordelingen 4 Modelkontrol
Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1)
; C ED 6 > Billedbehandling og mønstergenkendelse Lidt elementær statistik (version 1) Klaus Hansen 24 september 2003 1 Elementære empiriske mål Hvis vi har observationer kan vi udregne gennemsnit og varians
Teoretisk Statistik, 16. februar Generel teori,repetition
1 Uge 8 Teoretisk Statistik, 16. februar 2004 1. Generel teori, repetition 2. Diskret udfaldsrum punktssh. 3. Fordelingsfunktionen 4. Tæthed 5. Transformationer 6. Diskrete vs. Kontinuerte stokastiske
Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.
Landmålingens fejlteori Lektion 2 Transformation af stokastiske variable - [email protected] http://people.math.aau.dk/ kkb/undervisning/lf12 Institut for Matematiske Fag Aalborg Universitet Repetition:
Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader
Stikprøver og stikprøve fordelinger Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Statistik Statistisk Inferens: Prediktere og forekaste værdier af
INSTITUT FOR MATEMATISKE FAG c
INSTITUT FOR MATEMATISKE FAG c AALBORG UNIVERSITET FREDRIK BAJERS VEJ 7 G 9220 AALBORG ØST Tlf.: 96 35 89 27 URL: www.math.aau.dk Fax: 98 15 81 29 E-mail: [email protected] Dataanalyse Sandsynlighed og stokastiske
Forelæsning 10: Statistik ved hjælp af simulering
Kursus 02402 Introduktion til Statistik Forelæsning 10: Statistik ved hjælp af simulering Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18
Program 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Fordeling af X Stikprøve X 1,X 2,...,X n stokastisk X stokastisk. Ex (normalfordelt stikprøve)
Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136
Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 36 Det er besværligt at regne med binomialfordelingen, og man vælger derfor ofte at bruge en approksimation med normalfordeling. Man
Oversigt. Kursus 02402 Introduktion til Statistik. Forelæsning 10: Statistik ved hjælp af simulering. Per Bruun Brockhoff.
Kursus 02402 Introduktion til Statistik Forelæsning 10: Statistik ved hjælp af simulering Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Løsning til eksaminen d. 14. december 2009
DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,
Kvantitative Metoder 1 - Forår Dagens program
Dagens program Kapitel 8.1-8.3 Tilfældig stikprøve (Random Sampling) Likelihood Eksempler på likelihood funktioner Sufficiente statistikker Eksempler på sufficiente statistikker 1 Tilfældig stikprøve Kvantitative
Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse
Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ
02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4
02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4 Vejledende løsning 5.46 P (0.010 < error < 0.015) = (0.015 0.010)/0.050 = 0.1 > punif(0.015,-0.025,0.025)-punif(0.01,-0.025,0.025) [1] 0.1
Statistiske modeller
Statistiske modeller Statistisk model Datamatrice Variabelmatrice Hændelse Sandsynligheder Data Statistiske modeller indeholder: Variable Hændelser defineret ved mulige variabel værdier Sandsynligheder
