Statistiske modeller
|
|
|
- Kristen Mortensen
- 10 år siden
- Visninger:
Transkript
1 Statistiske modeller Statistisk model Datamatrice Variabelmatrice Hændelse Sandsynligheder Data Statistiske modeller indeholder: Variable Hændelser defineret ved mulige variabel værdier Sandsynligheder Mængden af sandsynligheder omtales som variablenes fordeling 1
2 Data fra de europæiske værdiundersøgelser 1999 V234 = Holdning til abort (1 = kan aldrig accepteres, 10 = kan altid accepteres To typer af variable Design-variable (land) (varierer ikke tilfældigt) Stokastiske variable (ser ud til at variere tilfældigt: Køn, Holdning til abort) 2
3 Den statistiske model indeholder sandsynligheder for hændelser defineret ved Køn (K) og Holdning til abort (H): Simultan sandsynlighed: P(H=7, K=mand) Marginal sandsynlighed: P(H=8-10) Betinget sandsynlighed: P(H<5 K = Kvinde) Den statistiske model forenkler modelen ved at påstå nogle ting om disse sandsynligheder. F.eks.: Køn og Holdning er uafhængige P(H,K)=P(H)P(K) Holdningen til abort er normalfordelt, med middelværdi og varians, der afhænger af køn Holdningen til abort er normalfordelt, med middelværdi og varians, der ikke afhænger af køn Modelproblemet: Disse påstande kan være forkerte. 3
4 Stokastisk uafhængige variable Stokastisk uafhængige begivenheder P(A,B) = P(A)P(B) Stokastisk uafhængige variable To variable, X og Y, siges at være stokastisk uafhængige, hvis enhver hændelse defineret ved variablen, X, er stokastisk uafhængig af enhver hændelse defineret ved variablen Y. To variable X og Y er stokastisk uafhængige hvis, P(Y=y X=x) = P(Y=y) P(X=x,Y=y) = P(X=x)P(Y=y) for alle mulige værdier af de to variable 4
5 Stokastisk uafhængige identisk fordelte individer Stokastisk uafhængige individer To individer er stokastisk uafhængige, hvis samtlige hændelser defineret ved variablene for det ene individ er uafhængige af samtlige hændelser defineret ved variablene for det andet individ. Identisk fordelte individer Person nr. a og b er identisk fordelte hvis P(X ai =x) = P(X bi =x) Det er en forudsætning for alle de statistiske metoder, der vil blive omtalt på dette kursus, at der er tale om identisk fordelte stokastisk uafhængige individer P( X = x,..., X = x ) = P( X = x,... X = x ) nk nk 1 i1 k ik i 5
6 Reference mellem empiriske og teoretiske begreber Karakterer i statistik for 10 tilfældigt udvalgte studerende: Middelværdi = ( )/10 = 7.4 = ( )/10 = 7.4 Den empiriske middelværdi 1 1 nx x = xn = x = xh n n n i x x i= 1,.., n x= 0,..,13 x= 0,..,13 x= 0,..,13 Den relative hyppighed, h x, er tal mellem 0 og 1. Sandsynlighedsregningen er konstrueret således at der er en høj grad af korrespondance mellem sandsynligheder og relative frekvenser. 6
7 Empiriside n observationer: x 1,,x n Den absolutte fordeling: n x = antal personer med værdien x Den relative fordeling: h x = n x /n Den kumulerede fordeling: x x 1 ni = hx n i= 1 i= 1 Percentiler defineret ud fra den kumulerede fordeling Empirisk middelværdi: M X = x xh Empirisk varians: n VAR( X ) = hx ( x M X ) n 1 x x 2 Modelside Én stokastisk variabel, X Det forventede antal med en bestemt værdi: e x = np x Sandsynligheden for at X=x: p x = P(X=x) Fordelingsfunktionen: x F( x) = p = P( X x) i= 1 i Percentiler defineret ud fra fordelingsfunktionen Teoretisk middelværdi: (forventet værdi) E( X ) = xp x Teoretisk varians: 2 σ X = p x x E X 2 x x ( ( )) Variablens fordeling = mængden af sandsynligheder, der kan defineres for de hændelser, der kan defineres ud fra variables forskellige mulige værdier. 7
8 Nogle tatistiske standardfordelinger 1) Bernoullifordelingen sandsynligheden svarende til en enkelt binær variabel. 2) Binomialfordelingen sandsynlighederne for antallet af positive udfald på et vist antal Bernoullifordelte variable. 3) Polynomialfordelingen sandsynligheder for antallet af forekomne værdier af kategorivariable med mere end to forskellige udfald. 4) Normalfordelingen en symmetrisk fordeling af en ubegrænset kontinuert intervalskalavariabel. Er entydigt fastlagt af middelværdi og varians. 5) Den standardiserede normalfordeling. En normalfordeling med middelværdi lig med 0 og varians lig med 1. 6) Chi-i-anden fordelingen. En fordeling på den positive talakse. kan defineres som summen af et vist antal standardiserede normalfordelinger. 8
9 Bernoulli fordelingen: En fordeling af en variabel, X, med to forskellige udfald: X = 0 X = 1 En bestemt begivenhed forekommer ikke E bestemt begivenhed forekommer Fordelingen indeholder én sandsynlighed: p = P(X=1) Sandsynligheden for at begivenheden ikke forekommer er lig med P(X=0) = 1-p 9
10 Fordelingsindikatorer for Bernoullifordelingen E(X) = Σ x (xp x )= 0 (1-p) + 1 p = p σ 2 (X) = Σ x [(x-e(x)) 2 p x ] = (0-p)²(1-p) + (1-p)²p = p²(1-p) + (1-p)²p = p(1-p)(p+1-p) = p(1-p) 10
11 Fordelingsindikatorer efter omkodning Samme regneregler som for empiriske fordelingsindikatorer med én nyttig forskel S = X + Y E(S) = E(X) + E(Y) σ 2 (S) = Σ s p s (s-e(s))² =Σ xy p xy (x+y-e(x)-e(y))² = Σ xy p xy ((x-e(x))+(y-e(y)))² = Σ xy p xy ((x-e(x))²+(y-e(y))²+2(x-e(x))(y-e(y))) = Σ xy p xy (x-e(x))² + Σ xy p xy (y-e(y))² + 2Σ xy p xy (x-e(x))(y-e(y)) = σ 2 (X) + σ 2 (Y) + 2σ 2 (X,Y) Hvis X og Y er stokastisk uafhængige, er den kovarians, σ 2 (X,Y) lig med nul σ 2 (X+Y) = σ 2 (X) + σ 2 (Y) 11
12 Binomialfordelingen Y er binomialfordelt, Y ~ Bin(n,p), hvis den er lig med summen af n indbyrdes uafhængige identisk fordelte Bernoulli fordelte variable med sandsynligheden p: Dvs. Y = i=1..n X i Hvor X i er en Bernoulli-fordelt variabel med sandsynlighed p. Teoretisk middelværdi = E(Y) = n p Teoretisk varians = σ 2 (Y) = n p (1-p) Teoretisk standardafvigelse = σ(y) = n p (1-p) 12
13 Standardiserede variable Variable, der er omkodet, således at middelværdien er lig nul og variansen er lig med 1 Z = X E( X ) σ ( X ) hvor σ(x) er variablens standardafvigelse Z E( X ) 1 = + ix σ ( X ) σ ( X ) E( X ) σ ( X ) og 1 σ ( X ) er konstanter. I flg. regnereglerne for middelværdier og varianser er E(Z) = 0 og σ 2 (Z) = 1. 13
14 Hvor stor usikkerhed er der på en middelværdiberegning? Teoretisk middelværdi og varians for den empiriske middelværdi E(M x ) = E(X) σ 2 (M x ) = σ 2 (X)/n σ ( M ) σ ( X ) n x = Fordelingsindikatorer for binomialfordelingen E(S) = np σ 2 (S) = np(1-p) E S = p σ 2 S p( 1 p) = n n n 14
15 Fordelingsindikatorer for politisk opinionsundersøgelse i september Undersøgelsen antages at omfatte 900 personer. S = Absolut fordeling E(S) Relativ fordeling σ 2 (S) E(S/900) σ 2 (S/900) Ej stemt+ugyldig A. Socialdemokratiet B. Radikale C. Konservative D. Centrum demokrater F. Socialistisk folkeparti Q. Kristeligt folkeparti V. Venstre Z. Fremskridtspartiet Ø. Enhedslisten * Udenfor parti
16 Om tætheder for kontinuerte variable Et histogram over tiden til en hændelse målt i femårsgrupper 600 Frequency Mean =4,90 Std. Dev. =5,025 N = ,00 5,00 10,00 15,00 20,00 25,00 30,00 35,00 40,00 COMPUTE x5 = RV.EXP(0.2) Søjlens højde/1000 er et estimat af en sandsynlighed 16
17 Frequency Mean =4,90 Std. Dev. =5,025 N = ,00 10,00 20,00 30,00 40,00 COMPUTE x5 = RV.EXP(0.2) To-års alders intervaller Højden af søjlen/1000 er et estimat af sandsynligheden Søjlerne er mindre, fordi sandsynlighederne er mindre, fordi intervallerne er mindre 17
18 Frequency Mean =4,90 Std. Dev. =5,025 N = ,00 10,00 20,00 30,00 40,00 COMPUTE x5 = RV.EXP(0.2) 1-års intervaller Søjlerne er ca. halvt så høje som for to-års intervallerne fordi sandsynlighederne er ca. halvt så store 18
19 Frequency Mean =4,90 Std. Dev. =5,025 N = ,00 10,00 20,00 30,00 40,00 COMPUTE x5 = RV.EXP(0.2) ½ års intervaller 19
20 Når intervalbredden nærmer sig nul kommer toppen af histogrammet til at ligne en kontinuert kurve, der omtales som fordelingens tæthed 0,20 0,15 density 0,10 0,05 0,00 0,00 10,00 20,00 X 30,00 40,00 I dette tilfælde f(x) = λ e λx hvor λ = 0.2 Eksponential fordelingen 20
21 Sandsynligheder og tætheder Hvis er et meget lille tal vil sandsynligheden næsten være lig med P(x - < X x + ) 2 f(x) P(x < X x + ) f(x+ /2) f(x) Samme regneregler for tætheder som for sandsynligheder, men summation skal erstattes af integration P (x1 < X x 2 ) = f(x) dx x 2 x 1 21
22 Tætheder, fordelingsfunktioner og overlevelsesfunktioner Fordelingsfunktionen F (x) = P(X f (x) = x) d dx = x F(x) f(x)dx 22
23 Normalfordelingen Figur 4.3 Tre normalfordelinger 0 5 Standardiseret normalfordeling P(Z < -1.96) = P(Z > +1.96) = P( Z >1.96) = % af værdierne af en normalt fordelt variabel med middelværdi,ξ, og standardafvigelse,σ, vil ligge inden for intervallet ξ ± 1.96σ 23
24 Udvalgte sandynligheder fra den standardiserede normalfordeling: Tabel 4.3 Udvalgte sandsynligheder defineret ved en standardiseret normalfordelt variabel, Z Udfald Sandsynlighed Z Z Z Z Z Z Z Z Z Z
25 Er variable nogensinde normalfordelte? Venstre-højre position Tilfredshed med livet 25
26 Middelværdisætningen Antag, at X 1,..,X n er n identisk fordelte uafhængige variable med middelværdi, E(X), og varians, σ X2, og at M X 1 er den empiriske middelværdi. = X n i i Lad endvidere ε være et vilkårlig positivt tal. Når antallet af observationer forøges, vil sandsynligheden for at forskellen på den empiriske og teoretiske middelværdi er mindre end ε nærme sig 1, P( M E( X ) < ε) 1 når n X 26
27 De store tals lov Antag, at X 1,..,X n er n identisk Bernoullifordelte uafhængige variable med sandsynlighed, p, for et positivt udfald. Lad endvidere h X være den relative hyppighed af positive udfald, mens ε er et vilkårlig positivt tal. Når antallet af observationer forøges vil sandsynligheden for at forskellen på sandsynligheden og den relative hyppighed er mindre end ε nærme sig 1, P( h p < ε) X 1 når n 27
28 Den centrale grænseværdisætning Antag, at X 1,..,X n er n identisk fordelte uafhængige variable med middelværdi, E(X), og varians, σ X 2. Under denne forudsætning vil den empiriske middelværdi, M X 1 i, altid være approksimativt normalt i = X n fordelt med middelværdi, E(X), og varians, σ X 2 /n. Approksimationen vil blive bedre og bedre, jo flere observationer, der indsamles. 28
29 Figur 4.5 Fordeling af svarene på spørgsmålet om den generelle tilfredshed med livet. Kurven svarer til en normalfordeling med samme middelværdi og spredning som i fordelingen af tilfredsheden. Figur 4.6 Fordeling af den gennemsnitlige tilfredshed med livet i 220 tilfældigt udvalgte grupper på 10 personer. Kurven svarer til en normalfordeling med samme middelværdi og samme varians som fordelingen af gennemsnitsværdierne. 29
30 Figur 4.7 Fordeling af den gennemsnitlige tilfredshed med tilværelsen i 88 tilfældigt sammensatte grupper med 25 personer. Kurven svarer til en normalfordeling med samme middelværdi og samme spredning som i fordelingen af gennemsnitsværdierne Figur 4.8 Fordeling af den gennemsnitlige tilfredshed med tilværelsen i 44 tilfældigt sammensatte grupper med 50 personer. Kurven svarer til en normalfordeling med samme middelværdi og samme spredning som i fordelingen af gennemsnitsværdierne 30
31 Sandsynlighed Figur 4.9 Eksakt og approksimativ fordeling af antallet af socialdemokrater i en Gallup undersøgelse omfattende 900 personer. Trappefunktionen angiver de eksakte sandsynligheder Figur 4.10 Fordelingen af tilslutningen til Socialdemokratiet blandt alle gyldige stemmer i 1994 i 200 simulerede opinionsundersøgelser, der hver omfattede 900 personer. 31
32 Regnereglen for normalfordelinger: En hvilken som helst lineær funktion af k normalfordelte variable, (X 1,..,X k ) er selv normalfordelt: Y = a 0 + a 1 X a k X k er normalfordelt Y s middelværdien og variansen skal beregnes ud fra de sædvanlige regneregler for middelværdier og varianser. 32
33 χ 2 fordelingen Antag, at Z er en variabel med en standardiseret normalfordeling. X = Z 2 er en variabel, der kun kan have positive værdier. Fordelingen af X kan beregnes og kortlægges. Denne fordeling omtales som en χ 2 fordelingen med 1 frihedsgrad. χ 2 fordelingen optræder i en lang række forskellige situationer og har en række bekvemme egenskaber. Bl.a. gælder, at fordelingen af summen af k uafhængige χ 2 fordelte variable kan beregnes. Den omtales som en χ 2 fordeling med k frihedsgrader (df = k). 33
34 df=1 df=5 df=10 Tæthedsfunktionen for tre forskellige χ 2 fordelinger 34
Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)
Formelsamlingen 1 Regneregler for middelværdier M(a + bx) a + bm X M(X+Y) M X +M Y Spredning varians og standardafvigelse VAR(X) 1 n n i1 ( X i - M x ) 2 Y a + bx VAR(Y) VAR(a+bX) b²var(x) 2 Kovariansen
Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.
Landmålingens fejlteori Lektion 2 Transformation af stokastiske variable - [email protected] http://people.math.aau.dk/ kkb/undervisning/lf12 Institut for Matematiske Fag Aalborg Universitet Repetition:
Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable
Landmålingens fejlteori Lektion 2 Transformation af stokastiske variable - [email protected] http://people.math.aau.dk/ kkb/undervisning/lf12 Institut for Matematiske Fag Aalborg Universitet 1/31 Repetition:
Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen
Statistik Lektion 3 Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen Repetition En stokastisk variabel er en funktion defineret på S (udfaldsrummet, der antager
Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte
Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable
Normal fordelingen Normal fordelingen Egenskaber ved normalfordelingen Standard normal fordelingen Find sandsynligheder ud fra tabel Transformation af normal fordelte variable Invers transformation Repetition
Produkt og marked - matematiske og statistiske metoder
Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring
Elementær sandsynlighedsregning
Elementær sandsynlighedsregning Sandsynlighedsbegrebet Et udfaldsrum S er mængden af alle de mulige udfald af et eksperiment. En hændelse A er en delmængde af udfaldsrummet S. Den hændelse, der ikke indeholder
Elementær sandsynlighedsregning
Elementær sandsynlighedsregning Sandsynlighedsbegrebet Et udfaldsrum S er mængden af alle de mulige udfald af et eksperiment. En hændelse A er en delmængde af udfaldsrummet S. Et sandsynlighedsmål er en
Forelæsning 3: Kapitel 5: Kontinuerte fordelinger
Kursus 02402 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet March 1, 2013 Sandsynlighedsregning og lagerstyring Normalfordelingen
Normalfordelingen og Stikprøvefordelinger
Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger
1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable
Landmålingens fejlteori - lidt om kurset Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable - [email protected] Institut for Matematiske Fag Aalborg Universitet Kursusholder
Kvantitative Metoder 1 - Forår 2007
Dagens program Kapitel 8.7, 8.8 og 8.10 Momenter af gennemsnit og andele kap. 8.7 Eksempel med simulationer Den centrale grænseværdisætning (Central Limit Theorem) kap. 8.8 Simulationer Normalfordelte
Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen
Landmålingens fejlteori Lektion Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ - [email protected] Institut for Matematiske Fag Aalborg Universitet En stokastisk variabel er en variabel,
Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable
Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable - [email protected] Institut for Matematiske Fag Aalborg Universitet 1/41 Landmålingens fejlteori - lidt om kurset
Vejledende løsninger til opgaver i kapitel 6
Vejledende løsninger til opgaver i kapitel Opgave 1: a) Den stokastiske variabel, X, der angiver, om en elev består, X = 1, eller dumper, X =, sin eksamen i statistik. b) En binomialfordelt variabel fremkommer
Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher
Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: [email protected]
Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved
Matematisk Modellering 1 (reeksamen) Side 1 Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved { 1 hvis x {1, 2, 3}, p X (x) = 3 0 ellers,
INSTITUT FOR MATEMATISKE FAG c
INSTITUT FOR MATEMATISKE FAG c AALBORG UNIVERSITET FREDRIK BAJERS VEJ 7 G 9220 AALBORG ØST Tlf.: 96 35 89 27 URL: www.math.aau.dk Fax: 98 15 81 29 E-mail: [email protected] Dataanalyse Sandsynlighed og stokastiske
Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede
Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede fordelinger (kap. 4) Middelværdi og varians (kap. 3-4) Fordelingsresultater
Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen
Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen Anvendt Matematik og Computer Science Danmarks Tekniske Universitet 2800 Kgs. Lyngby Danmark Email: [email protected] Dagens emner: Afsnit 3.3 og 3.4 Varians/standardafvigelse
Kvantitative Metoder 1 - Efterår Dagens program
Dagens program Approksimation af binomialsandsynligheder, Afsnit 4.5 Multinomial fordeling, Afsnit 4.8 Negativ binomialfordeling, Afsnit 4.4 Poisson fordeling og Poisson process, Afsnit 4.6 Kontinuerte
Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/
Program: 1. Repetition af vigtige sandsynlighedsfordelinger: binomial, (Poisson,) normal (og χ 2 ). 2. Populationer og stikprøver 3. Opsummering af data vha. deskriptive størrelser og grafer. 1/29 Binomial
Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala
3 5% 5% 5% 0 3 4 5 6 7 8 9 0 Statistik for biologer 005-6, modul 5: Normalfordelingen opstår når mange forskellige faktorer uafhængigt af hinanden bidrager med additiv variation til. F.eks. Højde af rekrutter
Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1)
; C ED 6 > Billedbehandling og mønstergenkendelse Lidt elementær statistik (version 1) Klaus Hansen 24 september 2003 1 Elementære empiriske mål Hvis vi har observationer kan vi udregne gennemsnit og varians
Sandsynlighedsregning 11. forelæsning Bo Friis Nielsen
Sandsynlighedsregning 11. forelæsning Bo Friis Nielsen Matematik og Computer Science Danmarks Tekniske Universitet 28 Kgs. Lyngby Danmark Email: [email protected] Dagens nye emner afsnit 6.3 (og 6.4 Betingede
Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger
Anvendt Statistik Lektion 2 Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Sandsynlighed: Opvarmning Udfald Resultatet af et eksperiment kaldes et udfald. Eksempler:
Program. Statistik og Sandsynlighedsregning. Eksempler. Sandsynlighedstæthed og sandsynlighedsmål
Program Statistik og Sandsynlighedsregning Sandsynlighedstætheder og kontinuerte fordelinger på R Varians og middelværdi Normalfordelingen Susanne Ditlevsen Uge 48, tirsdag Tætheder og fordelingsfunktioner
3 Stokastiske variable 3.1 Diskrete variable
3 Stokastiske variable 3.1 Diskrete variable Punktsandsnligheden benævnes P(x) = P(X = x). {x, P(x)} er en sandsnlighedsfordeling for den stokastiske variabel, X, hvis 1) P(x) $ 0 for alle værdier af x.
Sandsynlighedsregning Oversigt over begreber og fordelinger
Tue Tjur Marts 2007 Sandsynlighedsregning Oversigt over begreber og fordelinger Stat. MØK 2. år Kapitel : Sandsynlighedsfordelinger og stokastiske variable En sandsynlighedsfunktion på en mængde E (udfaldsrummet)
Skriftlig eksamen Science statistik- ST501
SYDDANSK UNIVERSITET INSTITUT FOR MATEMATIK OG DATALOGI Skriftlig eksamen Science statistik- ST501 Torsdag den 21. januar Opgavesættet består af 5 opgaver, med i alt 13 delspørgsmål, som vægtes ligeligt.
Uge 10 Teoretisk Statistik 1. marts 2004
1 Uge 10 Teoretisk Statistik 1. marts 004 1. u-fordelingen. Normalfordelingen 3. Middelværdi og varians 4. Mere normalfordelingsteori 5. Grafisk kontrol af normalfordelingsantagelse 6. Eksempler 7. Oversigt
Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18
Program 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Fordeling af X Stikprøve X 1,X 2,...,X n stokastisk X stokastisk. Ex (normalfordelt stikprøve)
Sandsynlighedsregning: endeligt udfaldsrum (repetition)
Program: 1. Repetition: sandsynlighedsregning 2. Sandsynlighedsregning fortsat: stokastisk variabel, sandsynlighedsfunktion/tæthed, fordelingsfunktion. 1/16 Sandsynlighedsregning: endeligt udfaldsrum (repetition)
Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable
Kursus 02402 Introduktion til Statistik Forelæsning 2: Kapitel 4, Diskrete fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium
Deskriptiv (beskrivende) statistik er den disciplin, der trækker de væsentligste oplysninger ud af et ofte uoverskueligt materiale. Det sker f.eks. ved at konstruere forskellige deskriptorer, d.v.s. regnestørrelser,
Preben Blæsild og Jens Ledet Jensen
χ 2 Test Preben Blæsild og Jens Ledet Jensen Institut for Matematisk Fag Aarhus Universitet Egå Gymnasium, December 2010 Program 8.15-10.00 Forelæsning 10.15-12.00 Statlab: I arbejder, vi cirkler rundt
Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen
Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen Repetition Lov om total sandsynlighed Bayes sætning P( B A) = P(A) = P(AI B) + P(AI P( A B) P( B) P( A B) P( B) +
Statistik og Sandsynlighedsregning 2
Statistik og Sandsynlighedsregning 2 Uafhængighed og reelle transformationer Helle Sørensen Uge 8, mandag SaSt2 (Uge 8, mandag) Uafh. og relle transf. 1 / 16 Program I dag: Uafhængighed af kontinuerte
hvor a og b er konstanter. Ved middelværdidannelse fås videre
Uge 3 Teoretisk Statistik. marts 004. Korrelation og uafhængighed, repetition. Eksempel fra sidste gang (uge ) 3. Middelværdivektor, kovarians- og korrelationsmatrix 4. Summer af stokastiske variable 5.Den
Konfidensintervaller og Hypotesetest
Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller
Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1
Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen
Sandsynlighedsregning 3. forelæsning Bo Friis Nielsen
Sandsynlighedsregning 3. forelæsning Bo Friis Nielsen Anvendt Matematik og Computer Science Danmarks Tekniske Universitet 28 Kgs. Lyngby Danmark Email: [email protected] Dagens emner Stokastiske variable: udfald
Tema. Dagens tema: Indfør centrale statistiske begreber.
Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i
Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007
Rettevejledning til eksamen i Kvantitative metoder 1,. årsprøve. januar 007 I rettevejledningen henvises der til Berry and Lindgren "Statistics Theory and methods"(b&l) hvis ikke andet er nævnt. Opgave
Statistik Lektion 2. Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var.
Statistik Lektion Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var. Repetition Stikprøve Stikprøvestørrelse n Stikprøvemiddelværdi Stikprøvevarians s Population
Løsning eksamen d. 15. december 2008
Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Sandsynlighedsregning 10. forelæsning Bo Friis Nielsen
Sandsynlighedsregning 10. forelæsning Bo Friis Nielsen Matematik og Computer Science Danmarks Tekniske Universitet 2800 Kgs. Lyngby Danmark Email: [email protected] Dagens emner afsnit 6.1 og 6.2 Betingede diskrete
Statistik og Sandsynlighedsregning 2
Statistik og Sandsynlighedsregning 2 Normalfordelingen og transformation af kontinuerte fordelinger Helle Sørensen Uge 7, mandag SaSt2 (Uge 7, mandag) Normalford. og transformation 1 / 16 Program Paretofordelingen,
Oversigt. Kursus 02402 Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Eksponential fordelingen
Kursus 02402 Introduktion til Statistik Forelæsning 4: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:
Opgaver i sandsynlighedsregning
Afdeling for Teoretisk Statistik STATISTIK Institut for Matematiske Fag Preben Blæsild Aarhus Universitet 9. januar 005 Opgaver i sandsynlighedsregning Opgave Lad A og B være hændelser således at P(A)
Note om Monte Carlo metoden
Note om Monte Carlo metoden Kasper K. Berthelsen Version 1.2 25. marts 2014 1 Introduktion Betegnelsen Monte Carlo dækker over en lang række metoder. Fælles for disse metoder er, at de anvendes til at
Teoretisk Statistik, 16. februar Generel teori,repetition
1 Uge 8 Teoretisk Statistik, 16. februar 2004 1. Generel teori, repetition 2. Diskret udfaldsrum punktssh. 3. Fordelingsfunktionen 4. Tæthed 5. Transformationer 6. Diskrete vs. Kontinuerte stokastiske
Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm
Kon densintervaller og vurdering af estimaters usikkerhed Claus Thorn Ekstrøm KU Biostatistik [email protected] Marts 18, 2019 Slides @ biostatistics.dk/talks/ 1 Population og stikprøve 2 Stikprøvevariation
2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900.
2 -fordeling og 2 -test Generelt om 2 -fordelingen 2 -fordelingen er en kontinuert fordeling, modsat binomialfordelingen som er en diskret fordeling. Fordelingen er særdeles kompleks at beskrive med matematiske
Oversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger
Introduktion til Statistik Forelæsning 2: og diskrete fordelinger Oversigt 1 2 3 Fordelingsfunktion 4 Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 017 Danmarks Tekniske Universitet 2800
Gennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP()
Gennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP() John Andersen, Læreruddannelsen i Aarhus, VIA Et kast med 10 terninger gav følgende udfald Fig. 1 Result of rolling 10 dices
Statistik. Hjemmeside: kkb. Statistik - lektion 1 p.1/22
Statistik Kursets omfang: 2 ECTS Inklusiv mini-projekt! Bog: Complete Business Statistics, AD Aczel & J. Sounderpandian Software: SPSS eller Excel?? Forelæser: Kasper K. Berthelsen E-mail: [email protected]
