Fordelinger. En oversigt over de vigtigste sandsynlighedsteoretiske fordelinger Anden udgave. Udvidet version. Ulrich Fahrenberg uli@math.auc.



Relaterede dokumenter
Elementær sandsynlighedsregning

Karakteristiske funktioner og Den Centrale Grænseværdisætning

Elementær sandsynlighedsregning

En oversigt over udvalgte kontinuerte sandsynlighedsfordelinger

Sandsynlighedsregning Oversigt over begreber og fordelinger

Kvantitative Metoder 1 - Efterår Dagens program

Sandsynlighedsregning 6. forelæsning Bo Friis Nielsen

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

Sandsynlighedsregning

Sandsynlighedsregning 6. forelæsning Bo Friis Nielsen

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Binomialfordelingen. X ~ bin(n,p): X = antal "succeser" i n uafhængige forsøg, der alle har samme sandsynlighed p for at ende med succes.

Matematisk model for køsystem

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Oversigt over nyttige fordelinger

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Vejledende løsninger til opgaver i kapitel 6

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Teoretisk Statistik, 16. februar Generel teori,repetition

Stokastiske processer og køteori

Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1)

Statistik og Sandsynlighedsregning 2

Kvantitative Metoder 1 - Forår 2007

Forelæsning 2: Kapitel 4, Diskrete fordelinger

DANMARKS TEKNISKE UNIVERSITET Side?? af?? sider. Skriftlig prøve, den: 18. december 2014 Kursus nr : (navn) (underskrift) (bord nr)

Program. Statistik og Sandsynlighedsregning. Eksempler. Sandsynlighedstæthed og sandsynlighedsmål

Program. Statistik og Sandsynlighedsregning 2 Middelværdi og varians. Eksempler fra sidst. Sandsynlighedstæthed og sandsynlighedsmål

Landmålingens fejlteori - Repetition - Kontinuerte stokastiske variable - Lektion 3

DANMARKS TEKNISKE UNIVERSITET Side 1 af 16 sider. Skriftlig prøve, den: 27. maj 2019 Kursus nr : (navn) (underskrift) (bord nr)

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kvantitative Metoder 1 - Forår Dagens program

Kvantitative Metoder 1 - Forår 2007

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable

DANMARKS TEKNISKE UNIVERSITET Side 1 af 16 sider. Skriftlig prøve, den: 28. maj 2014 Kursus nr : (navn) (underskrift) (bord nr)

INSTITUT FOR MATEMATISKE FAG c

Lidt om fordelinger, afledt af normalfordelingen

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 19. december 2018 Kursus nr : (navn) (underskrift) (bord nr)

Statistik og Sandsynlighedsregning 2

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Eksponential fordelingen

Løsning til eksamen 16/

CIVILINGENIØREKSAMEN. Side 1 af 19 sider. Skriftlig prøve, den: 20. december 2006 Kursus nr : Kursus navn: Sandsynlighedsregning

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

Løsning til prøveeksamen 1

Teoretisk Statistik, 13 april, 2005

Almindelige kontinuerte fordelinger

Sandsynlighedsregning 9. forelæsning Bo Friis Nielsen

CIVILINGENIØREKSAMEN Side 1 af 16 sider. Skriftlig prøve, den: 16. december 2010 Kursus nr : (navn) (underskrift) (bord nr)

CIVILINGENIØREKSAMEN Side 1 af 16 sider. Skriftlig prøve, den: 28. maj 2010 Kursus nr : (navn) (underskrift) (bord nr)

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 3: Kontinuerte fordelinger. Per Bruun Brockhoff

Definition. Definitioner

Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 2)

Sandsynlighedsteori

Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 2)

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 29. maj 2015 Kursus nr : (navn) (underskrift) (bord nr)

DANMARKS TEKNISKE UNIVERSITET Side 1 af 16 sider. Skriftlig prøve, den: 17. december 2015 Kursus nr : (navn) (underskrift) (bord nr)

Produkt og marked - matematiske og statistiske metoder

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Uge 10 Teoretisk Statistik 1. marts 2004

Sandsynlighedsregning 5. forelæsning Bo Friis Nielsen

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Statistiske modeller

Hvad skal vi lave i dag?

CIVILINGENIØREKSAMEN Side?? af?? sider. Skriftlig prøve, den: 16. december 2004 Kursus nr : (navn) (underskrift) (bord nr)

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Sandsynlighedsregning 11. forelæsning Bo Friis Nielsen

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Højde af kvinder 2 / 18

Produkt og marked - matematiske og statistiske metoder

Kvantitative Metoder 1 - Forår Dagens program

MM501 forelæsningsslides

hvor a og b er konstanter. Ved middelværdidannelse fås videre

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4

Hvad skal vi lave i dag?

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger

4 Oversigt over kapitel 4

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Statistik og Sandsynlighedsregning 2

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 18. august 2016 Kursus nr : (navn) (underskrift) (bord nr)

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Kvantitative Metoder 1 - Forår Dagens program

DANMARKS TEKNISKE UNIVERSITET Side 1 af 18 sider. Skriftlig prøve, den: 16. december 2003 Kursus nr : (navn) (underskrift) (bord nr)

Modul 2: Sandsynlighedsmodeller og diskrete stokastiske variable

Oversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Sandsynlighedsregning 7. forelæsning Bo Friis Nielsen

Kvantitative Metoder 1 - Efterår Dagens program

Teoretisk Statistik, 2. december Sammenligning af poissonfordelinger

Sandsynlighedsregning 7. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 7. forelæsning Bo Friis Nielsen

Transkript:

Fordelinger En oversigt over de vigtigste sandsynlighedsteoretiske fordelinger Anden udgave Udvidet version Ulrich Fahrenberg uli@math.auc.dk Da denne fordelingsoversigt's første udgave så verdens lys i oktober 998, var det egentlig kun meningen, at den skulle bruges som et hurtigt opslagsværk til vores projektarbejde i statistik. Tingene udviklede sig, og oversigten blev en del mere omfangsrig. Denne anden udgave foreligger i to versioner, en normal og en udvidet. Den normale dækker alle de fordelinger, der almindeligvis bliver omtalt i et første kursus i sandsynlighedsteori. I den udvidede version er der et ekstra kapitel, hvor der omtales nogle af de mindre almindelige fordelinger. Meningen med oversigten er stadig, at den skal være et hurtigt opslagsværk til fordelinger. Den går således ikke ret meget i dybden, og man vil heller ikke kunne nde denitioner på de bagvedliggende sandsynlighedsteoretiske begreber. Fejl og unøjagtigheder bedes rapporteret til uli@math.auc.dk. Tak til Bo Rosbjerg, Dennis Nilsson, Søren L. Buhl, Henrik V. Christensen, Tina Madsen og Bjarne Pedersen for råd, vejledning og kritik. For en god ordens skyld skal det nævnes, at N = {,,... } betegner mængden af de naturlige tal. N 0 = N {0} betegner mængden af de naturlige tal sammen med tallet 0. R betegner mængden af reelle tal og R + mængden af positive reelle tal. [a, b] betegner det lukkede interval fra a til b og ]a, b[ det åbne interval fra a til b. Ulrich Fahrenberg,. august 00

Indhold Diskrete fordelinger 4. Den diskrete ligefordeling..................... 4. Binomialfordelingen........................ 5.3 Multinomialfordelingen...................... 5.4 Den geometriske fordeling.................... 7.5 Den negative binomialfordeling................. 8.6 Poisson-fordelingen........................ 0.7 Den hypergeometriske fordeling................. Kontinuerte fordelinger 3. Den kontinuerte ligefordeling................... 4. Eksponentialfordelingen..................... 5.3 Normalfordelingen........................ 6.4 Gammafordelingen........................ 7.5 χ -fordelingen........................... 8.6 t-fordelingen............................ 9.7 F-fordelingen........................... 0.8 Ikke-centrale χ -, t- og F-fordelinger...............9 Betafordelingen.......................... 3.0 Den logaritmiske normalfordeling................ 4 3 Vigtige sætninger 5 4 Flere fordelinger 6 4. Den logaritmiske fordeling.................... 6 4. Zeta- eller Zipf-fordelingen.................... 6 4.3 Naor's fordeling.......................... 8 4.4 Den inverse Gauss-fordeling................... 9 4.5 Pareto-fordelingen......................... 30 4.6 Den logistiske fordeling...................... 30 4.7 Ekstremværdi-fordelingen.................... 3

4.8 Weibull-fordelingen........................ 3 4.9 Laplace-fordelingen........................ 3 4.0 χ-fordelingen........................... 34 4. Cauchy-fordelingen........................ 35 3

Kapitel Diskrete fordelinger En stokastisk variabel X kaldes diskret fordelt, hvis den kan antage tælleligt mange værdier x i, hver med en sandsynlighed p i = P(X = x i ), så i p i =.. Den diskrete ligefordeling En diskret stokastisk variabel, der kan antage værdierne x, x,..., x n (n N), kaldes ligefordelt, hvis der gælder Middelværdien er P(X = x k ) = n EX = n (k =,,..., n) n x k. Variansen beregnes direkte af formlen VarX = E(X ) (EX) og kan ikke forenkles: VarX = n k= n x k k= ( n ) n x k k= 4

. Binomialfordelingen En binomialfordelt stokastisk variabel kan antage heltalsværdier mellem 0 og et fast tal n N. Fordelingens anden parameter er en sandsynlighed p (0 < p < ), og der gælder: P(X = x) = ( n x ) p x ( p) n x (x = 0,,..., n) At en stokastisk variabel X er binomialfordelt med parametrene n og p skrives også X b(n, p). En model for en binomialfordelt stokastisk variabel er følgende: Et forsøg med sandsynligheden p for at en hændelse A indtræer gentages n gange. Er de enkelte forsøg uafhængige af hinanden, og angiver den stokastiske variabel X antallet af forsøg, der resulterer i hændelsen A, da er X b(n, p). I stedet for ovennævnte formel kan man for n også benytte en rekursionsformel, der har følgende form: P(X = 0) = ( p) n P(X = x) = n x x p P(X = x ) x =,..., n p Binomialfordelingens momentfrembringende funktion er M(t) = (pe t + p) n, og middelværdi og varians har formlerne EX = np VarX = np( p). For binomialfordelte stokastiske variable gælder følgende additionssætning: Er X og Y uafhængige stokastiske variable med X b(m, p) og Y b(n, p), da er X + Y b(m + n, p)..3 Multinomialfordelingen Lad der blive udført et stokastisk eksperiment, der kan have r forskellige udfald A,..., A r med respektive sandsynligheder p,..., p r (0 < p i <, p + + p r = ). Lad eksperimentet blive udført et antal n gange, og lad de stokastiske variable X i (i =,..., r) betegne det antal forsøg, der resulterer i udfaldet A i. Da siges X,..., X r at være multi- eller polynomialfordelte, og der gælder 5

P ((X,..., X r ) = (x,..., x r )) = r n! x i! (i =,,..., r, i= r i= p x i i r x i = n) Der gælder X i b(n, p i ), hvilket giver følgende formler for middelværdierne og varianserne: i= EX i = np i VarX i = np i ( p i ) (i =,..., r) Desuden gælder der for kovarianserne: Cov(X i, X j ) = np i p j i, j =,..., r i j 6

.4 Den geometriske fordeling En stokastisk variabel X siges at være geometrisk fordelt med parameter p (0 < p < ), hvis der for sandsynlighederne gælder følgende formel: P(X = x) = p( p) x (x =,,... ) Et eksperiment, hvori en hændelse A har en fast sandsynlighed p for at indtræe, udføres ere gange efter hinanden, og de enkelte udførelser er uafhængige af hinanden. Den stokastiske variabel, der betegner det antal forsøg, der skal udføres, indtil hændelsen A indtræer første gang, er da geometrisk fordelt. Den geometriske fordelings momentfrembringende funktion har følgende udseende: M(t) = + p (e t ), og formlerne for middelværdi og varians er EX = p VarX = p p. Bemærk dog den afvigende denition, der omtales i afsnit.5 på side 9. 7

.5 Den negative binomialfordeling Et eksperiment, hvori en hændelse A har den faste sandsynlighed p for at indtræe, udføres ere gange efter hinanden. De enkelte forsøg er uafhængige, og den stokastiske variabel X betegner det antal forsøg, der udføres, indtil hændelsen A er indtruet et antal k gange. Da siges X at have en negativ binomialfordeling. For k = er X dermed geometrisk fordelt, og for vilkårligt k N gælder ( ) x P(X = x) = p k ( p) x k (x = k, k +,... ) k Fordelingens momentfrembringende funktion ser ud som følger: M(t) = ( + p (e t )) k, og formlerne for middelværdi og varians er EX = k p VarX = k p p. Den negative binomialfordeling kan ses som et forbindelsesled mellem binomialfordelingen og den geometriske fordeling: Er den diskrete stokastiske variabel X negativt binomialfordelt, udtrykker hændelsen X = x, at der måtte blive udført x forsøg, indtil en hændelse A var indtruet k gange. Dette er det samme som at hændelsen A blandt de første x forsøg indtraf k gange, og at det x-te forsøg resulterede i hændelsen A. Det førstnævnte er en binomialfordelt hændelse, og af denne grund gælder der P(X = x) = ( ) x p k ( p) x k p = k ( ) x p k ( p) x k. k Sammenhængen til den geometriske fordeling er givet ved, at det at vente på, at hændelsen A indtræer k gange, er det samme som k gange at vente på, at A indtræer én gang. Det vil sige, en negativt binomialfordelt stokastisk variabel X med parametrene k og p kan skrives som en sum af k stokastiske variable X,..., X k, hvor X angiver det antal forsøg, der skulle udføres indtil A indtraf første gang, X angiver det antal forsøg, der herefter skulle udføres indtil A indtraf anden gang og så videre. Variablerne X i er uafhængige og geometrisk fordelte med parameter p. 8

Dette giver for eksempel en nem måde at beregne middelværdien på, idet ( k ) EX = E X i = i= k EX i = i= k i= p = k p Der er i litteraturen delte meninger om denitionen af den geometriske og den negative binomialfordeling. Jeg har holdt mig til denitionerne i [Ross, 998] og [Grinstead og Snell, 997], mens [Johnson et al., 99] giver en anden denition, hvor man ikke tæller alle udførelser af forsøget, indtil hændelsen er indtruet k gange, men kun de forsøg, hvor A ikke indtræer. Hvis X betegner det antal forsøg, der udføres indtil hændelsen A er indtruet k gange, og Y antallet af forsøg, der ikke resulterede i A, gælder der således Y = X k, hvilket fører frem til følgende udtryk for denne form af den negative binomialfordeling: og For Y gælder ( y + k P(Y = y) = y ) p k ( p) y (y = 0,,... ) EY = E(X k) = EX k = k p p VarY = Var(X k) = VarX = k p p. Denitionen af denne form af den negative binomialfordeling udvides ofte til at omfatte vilkårlige reelle parametre k (i stedet for kun naturlige), idet binomialkoecienten for α R og m N deneres som ( ) α = m (α i). m m! Der gælder følgende sætning om sammenhængen mellem denne form af den negative binomialfordeling og Poisson- og gammafordelingen (se afsnittene.6 på den følgende side og.4 på side 7): Hvis X og Λ er stokastiske variable med (X Λ = λ) Poi(λ) og Λ Gamma(α, β), da er X negativt binomialfordelt med k = α og p = β i=0 +β. 9

.6 Poisson-fordelingen En diskret stokastisk variabel X kaldes Poisson-fordelt med parameter λ R, hvis der gælder P(X = x) = e λ λ x x! (x = 0,,... ) At en stokastisk variabel X er Poisson-fordelt med parameter λ skrives X Poi(λ). Poisson-fordelingens momentfrembringende funktion har formlen og middelværdi og varians fås til M(t) = e λ(et ), EX = λ VarX = λ. Poisson-fordelingen bruges, hvis et forsøg med en lille sandsynlighed for, at en hændelse A indtræer, udføres et stort antal gange, og de enkelte forsøg er uafhængige. X angiver da antallet af forsøg, der resulterer i hændelsen A. Af denne grund kan en binomialfordeling b(n, p) approksimeres med Poissonfordelingen Poi(np) for store n og små p. Som for binomialfordelingen, så ndes der også en additionssætning for Poisson- fordelingen: Er X og Y uafhængige stokastiske variable med X Poi(λ ) og Y Poi(λ ), da er X + Y Poi(λ + λ ). 0

.6. Poisson-processen Poisson-fordelingens hyppigste anvendelse er Poisson-processen. Denne opstår, hvis man ser på stokastiske begivenheders fordeling over tid. Hvis N(t) betegner antallet af begivenheder i tidsrummet [0, t], skal der være opfyldt følgende fem betingelser:. N(0) = 0. P(N(h) = ) = λh + o(h) for tilstrækkeligt lille h 3. Hændelser i disjunkte tidsrum er uafhængige 4. N(t 0 +t) N(t 0 ) = N(t) hvornår man starter med at tælle, har ingen betydning 5. P(N(h) ) = o(h) i et tilstrækkeligt lille tidsrum h sker der højst én hændelse f(h) (her er o(h) et symbol for en (vilkårlig) funktion f(h) med lim = h 0 0). h Er disse 5 aksiomer opfyldt, kan det vises, at N(t) Poi(λt). Det vil sige, der gælder P(N(t) = k) = e λt (λt) k k! (k = 0,,... ) Der er en interessant sammenhæng mellem Poisson-processen og eksponentialfordelingen (se afsnit. på side 5): Hvis den stokastiske variabel T betegner ventetiden fra Poisson-processens start til det første indtræen af hændelsen (eller fra at hændelsen er indtruet, til den indtræer igen ), gælder der F T (t) = P(T t) = P(T > t) = P(N(t) = 0) = e λt. Ventetiden T er således eksponentialfordelt med parameter λ. Det omvendte gælder ligeledes: Hvis ventetiden er exponentialfordelt, da er processen en Poisson-proces. Ovenstående kan udvides på følgende måde: Hvis T n betegner den tid i en Poisson-proces, der går, indtil hændelsen er indtruet n gange, da er T n Gamma(n, λ). 3 Dette er efter aksiom 4 det samme. 3Gammafordelingen se afsnit.4 på side 7.

.7 Den hypergeometriske fordeling En hypergeometrisk fordelt stokastisk variabel med parametrene N, M og n er en diskret stokastisk variabel, der opfylder formlen ( M )( N M ) ( n N n ) x n x P(X = x) = ( N = x)( M x ( N n) M) (x = max{0, n (N M)},..., min{n, M}) At en stokastisk variabel X er hypergeometrisk fordelt med de ovennævnte parametre skrives som X hyp(n, M, n), og af ovenstående ses, at der gælder hyp(n, M, n) = hyp(n, n, M). En model for en hypergeometrisk fordelt stokastisk variabel er følgende: I en urne er der N kugler, hvoraf M er sorte og resten hvide. Af urnen udtages i alt n kugler, og den stokastiske variabel X angiver antallet af sorte blandt de udtagne kugler. Da er X hyp(n, M, n). Formlerne for middelværdi og varians kan forenkles ved at indføre p = M N. (Dermed er p sandsynligheden for ved ét forsøg at udtage en sort kugle.) Middelværdien af X hyp(n, M, n) er da og variansens formel er VarX = EX = n M N = np, nm(n M)(N n) N (N ) ( = np( p) n ). N Ligheden med binomialfordelingen i de ovenstående formler er ikke tilfældig. For n N kan den hypergeometriske fordeling nemlig approksimeres med binomialfordelingen: Den stokastiske variabel X er binomialfordelt, hvis kuglerne i det ovenstående eksempel udtages enkeltvis og lægges tilbage, før den næste trækkes. Jo større antallet af kugler er i forhold til antallet af udtagninger, jo mindre betydning har det, om man lægger kuglerne tilbage eller ej.

Kapitel Kontinuerte fordelinger En sandsynlighedsfordeling kaldes kontinuert, hvis den kan beskrives ved en kontinuert tæthedsfunktion f X : I [0, ], så der gælder P(X x) = x f X (x) for alle x I. Her er I et generaliseret reelt interval det vil sige, I er et interval mellem a og b, hvor a, b R eller a = eller b =. Funktionen F X med F X (x) = P(X x) kaldes fordelingens fordelingsfunktion. Et ofte benyttet værktøj i undersøgelsen af kontinuerte stokastiske variable er standardisering: Er X en kontinuert stokastisk variabel med middelværdi EX og varians VarX, da deneres den tilhørende standardiserede stokastiske variabel U ved Der gælder ( ) x EX F X (x) = F U VarX U = X EX VarX. f X (x) = ( ) x EX f U. VarX VarX U er ofte nemmere at håndtere end den oprindelige variabel X, og der gælder EU = 0 og VarU =. 3

. Den kontinuerte ligefordeling En kontinuert stokastisk variabel X siges at være ligefordelt på intervallet ]a, b[ R, hvis der for dens tæthed gælder f X (x) = { b a for a < x < b 0 ellers. At en kontinuert stokastisk variabel X er ligefordelt på intervallet ]a, b[, skrives også på følgende måde: Fordelingsfunktionen er Der gælder X Unif(a, b) 0 for x a x a F X (x) = for a < x < b b a for x b. EX = a + b VarX = (b a). En kontinuert standard-ligefordeling er en ligefordeling på intervallet ]0, [, og for en standard-ligefordelt stokastisk variabel Y gælder: f Y (y) = { for 0 < y < 0 ellers Middelværdi og varians til Y er EY = 0 for y 0 F Y (y) = y for 0 < y < for y. VarY =. Bemærk, at en standard-ligefordeling ikke er en standardiseret fordeling. 4

. Eksponentialfordelingen En kontinuert stokastisk variabel X siges at være eksponentialfordelt med parameter λ R +, hvis der for dens tæthed gælder { λe λx for x 0 f X (x) = 0 for x < 0 At X er eksponentialfordelt med parameter λ kan forkortes ved Fordelingsfunktionen er F X (x) = X Exp(λ). { e λx for x 0 0 for x < 0 Fordelingens momentfrembringende funktion er M(t) = λ λ t og formlerne for middelværdi og varians ser således ud: EX = λ VarX = λ Eksponentialfordelingen har ikke nogen hukommelse. Det vil sige, der gælder P(X D + x X > D) = P(X x) = F X (x) for alle x, D 0. Billedligt talt betyder dette, at ligegyldigt hvor længe man venter med at gå over vejen, da forbliver sandsynligheden for at blive kørt over den samme (forudsat at trakkens intensitet forbliver den samme). 5

.3 Normalfordelingen En kontinuert stokastisk variabel X kaldes normalfordelt med parametrene µ og σ (µ R, σ R + ), hvis dens tæthedsfunktion har formlen f X (x) = πσ e (x µ) σ (x R) En sådan stokastisk variabel siges at have fordelingen N(µ, σ ) (betegnelsen N(µ, σ) bruges dog også). Normalfordelingen kaldes også Gaussfordelingen. Formlerne for den momentfrembringende funktion, middelværdi og varians er σ µt+ M(t) = e t EX = µ VarX = σ..3. Standardnormalfordelingen Er den kontinuerte stokastiske variabel X N(µ, σ ), da er U = X µ N(0, ). Den standardiserede stokastiske variabel U har middelværdi 0 og varians, og for dens tætheds- og fordelingsfunktion gælder f U (u) = φ(u) = e u π σ F U (u) = Φ(u) = π u e t dt Funktionerne φ og Φ er tabellagte, og tætheds- og fordelingsfunktionen til en vilkårlig stokastisk variabel X N(µ, σ ) kan således beregnes som f X (x) = σ φ ( x µ σ ) ( x µ F X (x) = Φ σ For normalfordelingen gælder der en vigtig additionssætning: Er X N(µ, σ ) og Y N(µ, σ ) med Cov(X, Y ) = σ, da er X + Y N(µ + µ, σ + σ + σ ) Bemærk, at der gælder φ( u) = φ(u) og Φ( u) = Φ(u). 6 ).

.4 Gammafordelingen Gammafunktionen er deneret på følgende måde: og Der gælder Γ(α) = 0 t α e t dt (α R + ) Γ(α + ) = αγ(α) Γ(n) = (n )! (n N) samt Γ ( ) = π og Γ ( 3 ) = π 4. En kontinuert stokastisk variabel X siges at være gammafordelt med parametre α, λ R +, hvis dens tæthedsfunktion har formlen med f X (x) = 0 for x 0. Man skriver i så fald f X (x) = Γ(α) λα x α e λx (x > 0) X Gamma(α, λ), betegnelsen X Gamma(α, ) bruges dog også. λ α kaldes fordelingens formparameter, og λ kaldes fordelingens skalaparameter. kaldes fordelingens intensitet; for λ = kaldes fordelingen også en λ standard-gammafordeling. Middelværdi og varians til X Gamma(α, λ) har formlerne EX = α λ VarX = α λ Der gælder Gamma(, λ) = Exp(λ), og en gammafordeling Gamma(α, λ), hvor α er et positivt heltal, kaldes også en Erlang-fordeling. Desuden har også gammafordelingen sin additionssætning: Er X og Y uafhængige stokastiske variable med X Gamma(α, λ) og Y Gamma(β, λ), da er X + Y Gamma(α + β, λ). 7

.5 χ -fordelingen Lad U,..., U n være stokastiske variable med U i N(0, ), og lad X betegne deres kvadratsum: X = n i= Da siges X at være χ -fordelt med n frihedsgrader. Man kommer frem til, at χ (n) = Gamma U i ( n, ), hvormed χ -fordelingens tæthedsfunktion har følgende udseende: f X (x) = For x 0 er f X (x) = 0. Specielt gælder altså χ () = Gamma n Γ ( )e x n n x (x > 0) (, ) = Exp ( ). Fordelingens momentfrembringende funktion, middelværdi og varians har følgende formler: M(t) = ( t) n EX = n VarX = n Som specialtilfælde af en Gammafordeling har også χ -fordelingen sin additionssætning: Hvis de to stokastiske variable X χ (m) og Y χ (n) er uafhængige, da er X + Y χ (m + n). Desuden gælder følgende sætning: Givet n uafhængige stokastiske variable X, X,..., X n med X i N(µ, σ ), lad X = n n i= X i og S = S uafhængige, og der gælder X N(µ, σ n ) samt S σ n n i= (X i X). Da er X og n χ (n ). Umiddelbart giver udtrykket n frihedsgrader således kun mening for n N, men der viser sig også at være brug for χ -fordelinger med et ikke-naturligt antal frihedsgrader. 8

.6 t-fordelingen Lad U og Z være to uafhængige kontinuerte stokastiske variable, og lad U N(0, ) og Z χ (n) for n R +. Da siges den stokastiske variabel X = U Z n at være t-fordelt med n frihedsgrader. Det udledes, at X har følgende tæthedsfunktion: f X (x) = nb ( n, ) = Γ ( ) n+ ( nπ Γ n ) ( + x n ( + x n ) n+ ) n+ (x R) For store n kan t-fordelingen med n frihedsgrader approksimeres med standard-normalfordelingen. t-fordelingen med frihedsgrad har ingen middelværdi. Det kan imidlertid vises, at integralet t f X (t)dt eksisterer for n >, og siden f X er en lige funktion, gælder der Ligeledes kan det vises, at EX = 0 (n > ) VarX = n n (n > ) 9

.7 F-fordelingen Lad Y og Z være uafhængige kontinuerte stokastiske variable, og lad Y χ (m) og Z χ (n) for m, n R +. Da siges den stokastiske variabel X = Y m Z n = ny mz at være F-fordelt med tællerfrihedsgrad m og nævnerfrihedsgrad n. X har følgende tæthedsfunktion: f X (x) = Γ ( ) m+n m m n n Γ ( ) ( m Γ n ) x m (mx + n) m+n = m m n n B ( m, ) n x m (mx + n) m+n For x 0 er f X (x) = 0. Middelværdi og varians har følgende formler: EX = n (n > ) n VarX = n (m + n ) (n > 4) m(n ) (n 4) (x > 0) Det udledes umiddelbart af denitionen, at hvis X er F-fordelt med frihedsgrader m og n, da er F-fordelt med frihedsgrader n og m. X Desuden gælder der, at hvis X er t-fordelt med n frihedsgrader, da er X F-fordelt med tæller- og n nævnerfrihedsgrader. 0

.8 Ikke-centrale χ -, t- og F-fordelinger.8. Den ikke-centrale χ -fordeling Normalfordelte variable, der ikke er standardnormalfordelte, har i almindelighed ikke en kvadratsum, der har central χ -fordeling. Af denne grund deneres den ikke-centrale χ -fordeling med n frihedsgrader og parameter λ som χ (n, λ) = n Xi, hvor X i N(µ i, ) (i =,..., n) og λ = n i= i. Som det implicit allerede er indeholdt i ovenstående µ formel, er fordelingen χ (n, λ) ikke afhængig af de enkelte middelværdier µ i, men kun af deres kvadratsum λ. Fordelingens momentfrembringende funktion samt middelværdi og varians har følgende udseende: i= M(t) = ( t) n e λt t EX = n + λ VarX = n + 4λ Endvidere gælder der, at hvis Y,..., Y n er uafhængige stokastiske variable med Y i N(µ i, σ ), og S deneres som da er S = n n i= (Y i Y ) (med Y = n n i= Y i), S σ n χ (n, λ) med λ = n σ i= (µ i µ) (hvor µ = n n i= µ i)..8. Den ikke-centrale t-fordeling Hvor en stokastisk variabel Y siges at have central t-fordeling (med n frihedsgrader), hvis den kan skrives som Y = U(Z/n) /, hvor U N(0, ) og Z χ (n), da siges en stokastisk variabel X at have ikke-central t-fordeling med n frihedsgrader, hvis

X = V, Z n hvor V N(µ, ) og Z χ (n). Den ikke-centrale t-fordeling har dermed en ekstra parameter µ, der er middelværdi til normalfordelingen i nævneren. Middelværdi og varians til den stokastiske variabel X har formlerne VarX = n Γ ( ) n EX = Γ ( ) µ (n > ) n der for store n kan approksimeres ved n n ( + µ ) (EX) (n > ), EX µ VarX + µ n.8.3 Den ikke-centrale F-fordeling Den centrale F-fordeling er deneret som kvotient af to uafhængige χ - fordelinger, hver divideret med antallet af dens frihedsgrader. Erstattes de centrale χ -fordelinger med ikke-centrale χ -fordelinger, da kaldes fordelingen en dobbelt ikke-central F-fordeling. Således siges en stokastisk variabel X at have dobbelt ikke-central F- fordeling med m og n frihedsgrader og parametrene λ og ξ, hvis den kan skrives som X = Y n Zm, hvor Y χ (m, λ) og Z χ (n, ξ). Er ξ = 0, er altså χ -fordelingen i nævneren central, da kaldes fordelingen enkelt ikke-central, og i dette tilfælde beregnes middelværdi og varians til EX = n n m + λ m (n > ) ( n ) (m + λ) + (m + λ)(n ) VarX = m (n ) (n 4) (n > 4)

.9 Betafordelingen Betafunktionen B(a, b) deneres på følgende måde: B(a, b) = 0 t a ( t) b dt (a, b R + ) Man kommer rimeligt hurtigt frem til, at der gælder B(a, b) = B(b, a), og desuden er B(a, ) = a samt B(a, b) = Γ(a)Γ(b) Γ(a + b). En kontinuert stokastisk variabel X siges at være betafordelt med parametre a, b R +, hvis dens tæthedsfunktion er f X (x) = I så fald skriver man også B(a, b) xa ( x) b (0 < x < ) X Beta(a, b). Middelværdien er og variansen har formlen EX = a a + b, VarX = ab (a + b) (a + b + ). Desuden gælder der, at Beta(, ) = Unif(0, ). 3

.0 Den logaritmiske normalfordeling Hvis der til en stokastisk variabel X ndes et tal θ R, så log(x θ) er normalfordelt, da siges X at have logaritmisk normalfordeling. Den almindelige denition er, at X er logaritmisk normalfordelt med parametrene µ, σ og θ, hvis den stokastiske variabel U = log(x θ) µ σ er standardnormalfordelt. Det udledes, at X har følgende tæthedsfunktion: f X (x) = For x θ er f X (x) = 0. For middelværdi og varians gælder (x θ) (log(x θ) µ) πσ e σ (x > θ) EX = θ + e µ+ σ VarX = e µ+σ (e σ ). Af normalfordelingens additionssætning udledes, at produktet af to logaritmisk normalfordelte stokastiske variable med parametrene (µ, σ, 0) og (µ, σ, 0) (θ = θ = 0) igen er logaritmisk normalfordelt, med parametrene (µ + µ, σ + σ, 0). 4

Kapitel 3 Vigtige sætninger De store tals svage lov: X, X,... uafhængige og ensfordelte med middelværdi EX i = µ, X n = n n i= X i: ɛ R + lim P( X n µ < ɛ) = n De store tals stærke lov: X, X,... uafhængige og ensfordelte med middelværdi EX i = µ, X n = n n i= X i: P( lim n X n = µ) = Den centrale grænseværdisætning: X, X,... uafhængige og ensfordelte med middelværdi EX i = µ og varians VarX i = σ : a R lim P n ( σ n [ n ] ) x i nµ a = Φ(a) i= 5

Kapitel 4 Flere fordelinger Dette kapitel omhandler sandsynlighedsfordelinger, der er mindre benyttede end de i kapitlerne og opførte. Kapitlet omfatter både diskrete og kontinuerte fordelinger. 4. Den logaritmiske fordeling En diskret stokastisk variabel X, der kan antage positive heltalsværdier, siges at have logaritmisk fordeling med en parameter θ R, 0 < θ <, hvis der gælder P(X = x) = a θ θ x med a θ = log( θ). Dens momentfrembringende funktion er da x (x =,,... ) M(t) = a θ log( θe t ), og middelværdi og varians fås ved formlerne EX = a θθ θ VarX = a θθ( a θ θ) ( θ). 4. Zeta- eller Zipf-fordelingen En diskret stokastisk variabel X, der kan antage positive heltalsværdier, siges at være zeta- eller Zipf-fordelt med parameter α R +, hvis der gælder P(X = x) = C α+ x α+ (x =,,... ) Denne fordeling må ikke forveksles med den logaritmiske normal fordeling (se afsnit.0) 6

C α+ er da en konstant med formlen C α+ = k=. k α+ Fordelingen kaldes zeta-fordelingen, da funktionen ζ(s) = for s R, s >, er kendt som Riemanns zeta-funktion. Fordelingen anvendes i linguistikken, da man har fundet frem til, at antallet n x af ord, der i en længere tekst forekommer x gange, nogenlunde kan udtrykkes ved formlen n x = cx (α+), med c som proportionalitetsfaktor og α > 0. Antallet af ord, der forekommer x gange, er dermed zeta-fordelt. Zeta-fordelingens middelværdi er k= k s og variansen har formlen EX = C α+ C α (α > ) VarX = C α+ C α C α+ C α (α > ) Zeta-fordelingen kaldes også den diskrete Pareto-fordeling (se afsnit 4.5 på side 30) på grund af ligheden i tæthederne. 7

4.3 Naor's fordeling Naor's fordeling fremkommer ved eksperimenter, der kan beskrives ved følgende urnemodel: En urne indeholder n kugler, deraf rød og n hvide. En kugle bliver taget ud. Er denne hvid, erstattes den i urnen med en rød kugle, hvorefter der trækkes igen. Eksperimentet slutter, når der bliver trukket en rød kugle. Den stokastiske variabel Y betegner da antallet af kugler, der i alt blev taget ud af urnen. Der gælder P(Y = y) = (n )!y (n y)!n y (y =,,... ) I praksis har det vist sig at være nemmere at arbejde med en stokastisk variabel X = n Y. X angiver da antallet af kugler, der er tilbage i urnen ved eksperimentets afslutning, og der gælder P(X = x) = (n )!(n x) x!n n x (x = 0,,..., n ) Middelværdi og varians kan for store n approksimeres ved EX n + 3 nπ EY nπ 3 VarX = VarY n + 8 3 n + 3 (n + ) nπ En anden anvendelse af Naor's fordeling er følgende: Man har et nøglebundt med et antal nøgler på samt en lås, som der er en og kun en af nøglerne på bundtet, der passer til. Man vælger en nøgle tilfældigt og afprøver denne, hvis den ikke passer, tager man en anden, og så videre. Den mest eciente måde at afprøve nøglerne på (den måde, man hurtigst nder frem til den rigtige nøgle på) er uden tilbagelægning, det vil sige, man husker, hvilke nøgler man allerede har afprøvet. Hvis man afprøver nøglerne med tilbagelægning, vil der gå længere tid, indtil man nder den rette nøgle, da man risikerer at afprøve nogle af nøglerne to gange. Antallet af forsøg, der udføres, indtil den første nøgle bliver afprøvet to gange, er da Naor-fordelt. På denne måde giver Naor's fordeling et mål for, hvornår tilbagelægning begynder at få indydelse på antallet af nødvendige afprøvninger. 8

4.4 Den inverse Gauss-fordeling En kontinuert stokastisk variabel X siges at have invers Gauss-fordeling med parametrene µ og λ, hvis dens tæthedsfunktion er givet ved f X (x) = λ πx 3 e For x 0 er f X (x) = 0. Fordelingsfunktionen beregnes til F X (x) = Φ λ µ x (x µ) (x > 0) ( ( ) ) λ x x µ + e λ µ Φ ( λ x ( ) ) x µ +, med Φ som standardnormalfordelingens fordelingsfunktion. Fordelingens momentfrembringende funktion har formlen M(t) = e og middelværdi og varians fås til q «λ µ t µ λ, EX = µ VarX = µ3 λ. Den inverse Gauss-fordeling med µ = kaldes også Wald-fordeling, og en model for denne er følgende: Lad Z, Z,... være uafhængige stokastiske variable, der er ensfordelte med middelværdi EZ i > 0 og varians VarZ i > 0. For et fast tal k > 0, lad da den stokastiske variabel N være deneret ved, at følgende skal være opfyldt: j i= Z i < k for alle j =,..., N samt N i= Z i k. N er da Wald-fordelt med λ = k EZ i VarZ i. 9

4.5 Pareto-fordelingen Pareto-fordelingen udspringer af Paretos lov, der konstruerer en sammenhæng mellem antallet af personer med en vis indkomst og denne indkomst. Hvis N er antallet af personer med en indkomst, der er højere end eller lig med en givet indkomst x, gælder der efter Paretos lov N = Ax a, hvor A, a > 0 er parametre. En kontinuert stokastisk variabel X siges at være Pareto-fordelt med parametre a, k > 0, hvis dens fordelingsfunktion er { ( k a F X (x) = x) for x k 0 for x < k Tæthedsfunktionens formel er da { ak a x (a+) for x k f X (x) = 0 for x < k Fordelingens middelværdi og varians eksisterer kun for henholdsvis a > og a > og har formlerne EX = k a (a > ) a VarX = k a (a > ) (a ) (a ) 4.6 Den logistiske fordeling En kontinuert stokastisk variabel X siges at være logistisk fordelt med parametrene α R og β R +, hvis der for dens fordelingsfunktion gælder F X (x) = + e x α β Tæthedsfunktionen har da formlen f X (x) = β e x α β ( + e x α β For middelværdi og varians gælder der (x R) ) (x R) EX = α VarX = π 3 β. 30

Er X logistisk fordelt med parametrene α og β, da kan det skrives som hvor U Unif(0, ). X = α + β log ( U U 4.7 Ekstremværdi-fordelingen En kontinuert stokastisk variabel X siges at være ekstremværdi-fordelt med parametrene ξ R og θ R +, hvis dens fordelingsfunktion er x ξ F X (x) = e e θ ), (x R) På grund af denne formel kaldes fordelingen også dobbelt-eksponential-fordelingen, hvilket er lidt uheldigt, da dette navn ligeledes bruges til Laplace-fordelingen (se afsnit 4.9 på næste side). Et tredje navn til fordelingen er log-weibull, da log X er Weibull-fordelt (se afsnit 4.8 på den følgende side; parametrene er v = ξ, a = θ og b = ). Fordelingen kaldes ekstremværdi-fordelingen, da den opstår som grænsefordeling for n, når det er fordelingen af den største værdi blandt n uafhængige stokastiske variable med samme individuelle fordeling, der efterspørges. Fordelingens tæthedsfunktion har formlen f X (x) = θ x ξ e θ e e x ξ θ Dens momentfrembringende funktion er (x R) og middelværdi og varians fås til hvor γ er Euler's konstant: γ = lim n M(t) = e tξ Γ( θt), EX = ξ + γθ ( n k= VarX = π 6 θ, ) k log n 0.57756649 3

4.8 Weibull-fordelingen En kontinuert stokastisk variabel X siges at være Weibull-fordelt med parametrene v R og a, b R +, hvis dens tæthedsfunktion er givet ved f X (x) = { b a ( x v ) b a e ( x v a ) b for x > v 0 for x v Er X Weibull-fordelt med parametre v, a, b, da gælder der ( ) b X v Exp(). Fordelingsfunktionen til Weibull-fordelingen er { x v e ( a ) b for x > v F X (x) = a 0 for x v 4.8. Standard-Weibullfordelingen Weibull-fordelingens standardform fås med v = 0 og a =. Dens fordelingsfunktion er { bx b e for xb x > 0 f X (x) = og middelværdi og varians har formlerne EX = Γ ( + ) b 0 for x 0 VarX = Γ For store b kan dette approksimeres ved EX γ b + b hvor γ er Euler's konstant. ( π 6 + γ ( + ) ( ( Γ + )). b b ) VarX π 6b, 4.9 Laplace-fordelingen En kontinuert stokastisk variabel X siges at være Laplace-fordelt med parametrene θ R og φ R +, hvis dens tæthedsfunktion har formlen f X (x) = x θ φ e φ (x R) 3

Sættes θ = 0 og φ =, fås en standardform med tæthedsfunktionen f Y (y) = e x (x R) Dennes momentfrembringende funktion er M Y (t) = t, og middelværdi og varians fås til EY = 0 VarY =. Dermed gælder der for den oprindelige variabel X EX = θ VarX = φ. Der gælder, at hvis V, V Exp(φ) er uafhængige, da er V V Laplacefordelt med parameter φ (og θ = 0). En sammenhæng mellem Laplace- og standardnormalfordelingen er følgende: Hvis U, U, U 3, U 4 N(0, ) er uafhængige, da er U U U 3 U 4 = U U 4 U U 3 Laplace-fordelt med parametrene θ = 0 og φ =. 33

4.0 χ-fordelingen Hvis en kontinuert stokastisk variabel Y er (centralt) χ -fordelt med n frihedsgrader (se afsnit.5), da siges den stokastiske variabel X = Y at være χ-fordelt med n frihedsgrader. Tæthedsfunktionen har følgende formel: f X (x) = n Γ ( n )e x x n (x > 0) For x 0 er f X (x) = 0. For n = kaldes denne fordeling også halvnormalfordelingen, for n = kaldes den Rayleigh-fordelingen og for n = 3 Maxwell-Boltzmann-fordelingen Ḟordelingsfunktionen har følgende udseende: F X (x) = Γ ( ) n x (for x 0 er igen F X (x) = 0). For middelværdi og varians gælder der 0 e t t n dt (x > 0) EX = Γ ( ) n+ π Γ ( ) = n B ( ) n, ( ( Γ n+ )) VarX = n Γ ( ) = n n π ( ( B n, Da Γ (z+ ) Γ(z) z for store z, kan EX approksimeres med n for store n. 4.0. Rayleigh-fordelingen Rayleigh-fordelingen er som sagt det samme som χ-fordelingen med frihedsgrader, og dens tætheds- samt fordelingsfunktion har dermed formlerne )) f X (x) = xe x F X (x) = e x (x > 0) For x 0 er f X (x) = F X (x) = 0. Middelværdi og varians fås til følgende: EX = π 34 VarX = π

Hvis X er Rayleigh-fordelt, da er X Exp ( ), og desuden gælder der følgende sætning: Lad X, Y være uafhængige standardnormalfordelte stokastiske variable, der betragtes som koordinater i et retvinklet koordinatsystem. Da fås ved at gå over til polære koordinater to nye stokastiske koordinater, radius R R (R 0) og vinklen Θ [0, π[. Der gælder X = R cos Θ og Y = R sin Θ, og R og Θ er uafhængige med Θ Unif(0, π) og R Rayleigh. 4. Cauchy-fordelingen En kontinuert stokastisk variabel X siges at være Cauchy-fordelt med parameter θ R, hvis dens tæthed er givet ved f X (x) = Fordelingsfunktionen er da π ( + (x θ) ) F X (x) = + arctan(x θ) π (x (x R) R Det specielle ved Cauchy-fordelingen er, at den ikke har nogen middelværdi. For at have en sådan, kræves det, at integralet t f X (t)dt eksisterer, hvilket for Cauchy-fordelingen ikke er tilfældet. En momentfrembringende funktion eksisterer af samme årsager heller ikke, men man kan dog nde en formel for fordelingens karakteristiske funktion ϕ(t): ϕ(t) = E ( e itx) = e itθ t Cauchy-fordelingen med θ = 0 er det samme som t-fordelingen med frihedsgrad. 35

Litteratur [Grinstead og Snell, 997] Charles M. Grinstead og J. Laurie Snell. Introduction to Probability. American Mathematical Society, 997. ISBN 0-88-0749-8 se også http://dartmouth.edu/ chance/jlsnell.html. [Johnson et al., 99] Norman L. Johnson, Samuel Kotz, og Adrienne W. Kemp. Univariate Discrete Distributions. Wiley Interscience,. edition, 99. ISBN 0-47-58494-0. [Johnson et al., 994] Norman L. Johnson, Samuel Kotz, og N. Balakrishnan. Continuous Univariate Distributions, volume. Wiley Interscience,. edition, 994. ISBN 0-47-58495-9. [Johnson et al., 995] Norman L. Johnson, Samuel Kotz, og N. Balakrishnan. Continuous Univariate Distributions, volume. Wiley Interscience,. edition, 995. ISBN 0-47-58494-0. [Ross, 998] S. Ross. A First Course in Probability. Prentice Hall International, 998. ISBN 0-3-89653-4. 36