4 Stokastiske variabler

Størrelse: px
Starte visningen fra side:

Download "4 Stokastiske variabler"

Transkript

1 4 Stokastiske variabler I kapitel 3 viste vi, hvordan man kan tilskrive sandsynligheder til forskellige hændelser, der knytter sig til et eksperiment. I praksis vil et eksperiment ofte involvere mange forskellige hændelser, som vi ønsker at tilskrive sandsynligheder til. Selv i det relativt simple eksperiment fra tabel 3.1 var der således otte forskellige hændelser, som alle fik forskellige betegnelser. Det gør derfor hurtigt notationen besværlig og omfangsrig, hvis man skal finde på navne og symboler til alle de forskellige hændelser, der knytter sig til et eksperiment. Det er heldigvis muligt at definere en funktion, der kaldes en stokastisk variabel, som gør det meget nemmere at arbejde med hændelser og deres sandsynligheder. Hvor vi i kapitel 3 skulle bruge et symbol til hver hændelse, kan en stokastisk variabel med et enkelt symbol repræsentere mange forskellige hændelser. Stokastiske variabler bygger på sandsynlighedsmo dellen fra kapitel 3, og de er særdeles anvendelige, når vi i praksis skal undersøge sammenhænge, der involverer usikkerhed. I afsnit 4.1 definerer vi en stokastisk variabel. Man skelner i denne forbindelse mellem diskrete og kontinuerte stokastiske vari abler. Vi starter med at behandle de diskrete stokastiske variabler i afsnit 4.2, og i afsnit 4.3 kigger vi på sammenhænge mellem diskrete stokastiske varia bler. Tilsvarende ser vi i afsnit 4.4 og 4.5 på kontinuerte stokastiske variabler og sammenhænge mellem disse. 4.1 Definition af en stokastisk variabel En stokastisk variabel er en funktion, som til ethvert udfald af et eksperiment forbinder en talværdi: Eksempel 4.1: Et terningkast I eksperimentet at kaste en terning er udfaldsrummet: Ω = {ener, toer, treer, firer, femmer, sekser}. Her kan man definere en stokastisk variabel, X, som tæller antallet af øjne: X(ener) = 1, X(toer) = 2, X(treer) = 3, X(firer) = 4 X(femmer) = 5, X(sekser) = Definition af en stokastisk variabel 73

2 Hvis udfaldet af eksperimentet bliver en ener, så antager den stokastiske va riabel, X, værdien 1. På samme måde antager den værdien 6, hvis man slår en sekser. Eksempel 4.2: Salg af paraplyer del 1 I eksemplet fra kapitel 3 med paraplybutikken kan man defi nere en stokastisk variabel, X, der antager en værdi svarende til antallet af pa raplyer, som en kunde køber. Dvs: X(0 paraplyer) = 0, X(1 paraply) = 1, X(2 paraplyer) = 2. Bemærk, at vi bruger store bogstaver som X og Y til at betegne en stokastisk variabel. Små bogstaver, x og y, bruger vi derimod til at angive spe cifikke værdier, som den stokastiske variabel antager. Kaster man fx en ter ning, som i eksempel 4.1, så vil det resultere i, at den stokastiske variabel, X, antager en bestemt værdi, x, som kan være enten 1, 2, 3, 4, 5 eller 6. Ofte giver definitionen af en stokastisk variabel sig selv, som tilfældet er i de ovenstående eksempler. Hvis udfaldene af eksperimentet er målt kvalitativt, kan det imidlertid være knapt så indlysende, hvordan den stokastiske variabel skal de fineres. I disse tilfælde laver man en kodning af udfaldene som i det føl gende eksempel. Eksempel 4.3: Plat og krone I eksperimentet at kaste en mønt er der to mulige udfald: Plat og krone. Man kan her definere en stokastisk variabel, X, ved at kode plat til 0 og krone til 1. Dermed er den stokastiske variabel, X, givet ved: X(plat) = 0, X(krone) = 1 Det står én helt frit for at vælge talværdierne, som den stokastiske variabel skal antage. I eksempel 4.3 kunne man derfor lige så godt have defineret X til at antage værdien 4 i tilfælde af plat og værdien 13,2 i tilfælde af krone. Hvis man efterfølgende skal have gavn af at have indført en stokastisk variabel, skal værdierne dog vælges med en vis omhu, således at de passer til den problemstilling, man vil studere. Til et givet eksperiment kan man definere mange forskellige stokastiske varia bler, som hver repræsenterer et aspekt eller karakteristikum ved udfaldet af eksperimentet. Dette er illustreret i eksempel 4.4. Eksempel 4.4: To stokastiske variabler Et eksperiment består i at udvælge en person tilfældigt fra den danske befolkning og dernæst observere vedkommendes køn og alder. Et muligt udfald af dette eksperiment er således: (mand, 43 år). Her kan man definere en sto 74 Stokastiske variabler

3 kastisk variabel, X, der antager værdien 0, hvis den udtrukne person er en mand, og værdien 1, hvis det er en kvinde. Tilsvarende kan man definere en stokastisk va riabel, Y, som antager en værdi svarende til alderen (målt i år) på den udtrukne person. Udtrækker man derfor en mand på 43 år, er X = 0 og Y = 43. I eksempel 4.4 er der knyttet to forskellige stokastiske variabler til ethvert udfald af eksperimentet: Alderen og kønnet. Ofte er det denne type af eksperimenter, som er interessante inden for samfundsvidenskab. Fx kunne eksperimentet bestå i at udtrække en person tilfældigt og observere vedkommendes indtægt og for brug af en given vare. Sådanne eksperimenter kan bruges til at bestemme ef terspørgslen efter varen. Det skal vi se nærmere på senere i bogen To typer af stokastiske variabler Stokastiske variabler kan være enten diskrete eller kontinuerte, og det har betydning for den måde, hvorpå man tilskriver sandsynligheder til deres værdier. Det, der afgør, om en stokastisk variabel er diskret eller kontinuert, er, hvorvidt der er et tælleligt eller et utælleligt antal mulige udfald. Den stokasti ske variabel, X, i eksempel 4.3, som angav udfaldene plat og krone med hen holdsvis værdien 0 og værdien 1, er en diskret stokastisk variabel. Det er den, fordi den kun kan antage et tælleligt antal værdier (0 og 1). Når der er et endeligt antal udfald af et eksperiment, så er de stokastiske variabler, der er defineret ud fra eksperimentet, altid diskrete. En stokastisk variabel, Z, der angiver vandhøjden i en havn på et givet tidspunkt, er en kontinuert stokastisk variabel. Antag, at vandhøjden kan lig ge mellem 0 og 12 meter. Den kan fx være 10, meter. Den præcise vandhøjde har uendeligt mange decimaler (selvom man i praksis ikke kan måle den så præcist). Man kan derfor ikke udelukke nogen vandhøjde mellem 0 og 12 meter på forhånd alle de uendeligt mange værdier mellem 0 og 12 meter er i princippet mulige udfald. Faktisk er der så mange tal mellem 0 og 12, at de ikke engang kan tæl les. Derfor siges den stokastiske variabel at være kontinuert i dette tilfælde Bemærk, at der er en forskel på uendelig og utællelig. En stokastisk variabel kan godt an tage uendeligt mange værdier uden at disse af den grund er utællelige. Hvis fx den stokastiske variabel, X, kan antage værdierne 1, 2, 3, osv., så er der uendeligt mange værdier, den kan an tage. Imidlertid kan disse tælles systematisk, startende fra fx 1. Derfor er X en diskret stoka stisk variabel. En stokastisk variabel, der angiver vanddybden har derimod utælleligt mange værdier, idet disse ikke kan opstilles og tælles på en systematisk måde. 4.1 Definition af en stokastisk variabel 75

4 Det samme eksperiment kan sagtens lede til både en diskret og en kontinuert stokastisk variabel. I eksempel 4.4 er Y en diskret stokastisk variabel, fordi den angiver alderen på en person målt i hele antal år. Hvis man i stedet måler alderen uendeligt fint (nanosekunder eller finere) og definerer en stokastisk variabel, Z, for denne måling, så er Z en kontinuert stokastisk variabel. Om man i en given situation vælger at bruge den ene eller den anden variabel, hvis man overhovedet har et valg, vil bl.a. afhænge af den præcision, man ønsker eller har mulighed for at lave i sin måling, samt af de metoder, man efterfølgende ønsker at anvende til at analysere den givne problemstilling. Som det vil fremgå af resten af bogen, så er der forskel på, hvilke metoder man har til rådighed ved henholdsvis diskrete og kontinuerte stokastiske variabler. Sandsynligheden for en kontinuert stokastisk variabel er vanskeligere at beskrive end sandsynligheden for en diskret stokastisk variabel. Derfor opdeler vi den føl gende diskussion i to dele. Først behandler vi de mere håndgribelige diskrete stokastiske variabler i afsnit 4.2 og 4.3, og dernæst udvider vi til de kontinu erte stokastiske variabler i afsnit 4.4 og Diskret stokastisk variabel En af fordelene ved stokastiske variabler er, at deres værdier svarer til hændelser i sandsynlighedsmodellen. Vi kan derfor bruge sandsynlighedsmålet for hændelser i kapitel 3 til at tilskrive en sandsynlighed til enhver værdi af en stokastisk variabel. I dette afsnit gøres det for diskrete stokastiske variabler. Eksempel 4.5: Salg af paraplyer del 2 For den stokastiske variabel, X, der angiver antallet af købte paraplyer i eksempel 4.2, kan man finde sandsynlighederne for dens værdier direkte fra sandsynlighedsmålet i kolonne 3 i tabel 3.2. Således er sandsynligheden 1/4 for, at X er lig med 0. Dette skrives: P(X = 0) = 1/4. Tilsvarende er P(X = 1) = 1/2 og P(X = 2) = 1/4. Bemærk, at den stokastiske variabel, X, i dette eksempel kun kan antage tre værdier, nemlig 0, 1 og 2. Den samlede sandsynlighed for disse udfald er P(X = 0) + P(X = 1) + P(X = 2) = 1/4 + 1/2 + 1/4 = 1. Sandsynlighederne summerer til én, da værdierne 0, 1 og 2 udgør alle de mulige værdier af X. Det er værd at understrege, at værdierne af en stokastisk variabel svarer til hændelser i et eksperiment. Når vi kender sandsynlighederne for de forskellige værdier, som en stokastisk variabel kan antage, så behøver vi ikke længere bekymre os om sandsynlighederne for de hændelser, der leder til en bestemt værdi af den sto kastiske variabel. Eksperimentet og dermed sandsynlighedsmodellen er trådt i baggrunden for den stokastiske variabel og dens fordeling. 76 Stokastiske variabler

5 4.2.1 Sandsynlighedsfunktionen Sandsynlighederne for de forskellige værdier, som en diskret stokastisk variabel kan antage, er opsummeret i dens Sandsynlighedsfunktionen sandsynlighedsfunktion: Sandsynlighederne for de forskellige værdier, som en diskret stokastisk variabel kan antage, er opsummeret i dens sandsynlighedsfunktion: Sandsynlighedsfunktionen,, for en diskret stokastisk variabel,, er defineret som: Sandsynlighedsfunktionen, f(x), for en diskret stokastisk variabel, X, er defineret som: Eksempel 4.6: Salg af paraplyer del 3 f(x) = P(X = x) Arbejder man med flere stokastiske variabler, kan det være en fordel at sætte fodtegn på sandsynlighedsfunktionen, så man ved, hvilken Arbejder sandsynlighedsfunktion, man med flere stokastiske der variabler, hører til kan hvilken det være stokastisk en fordel variabel. at sætte Fx fodtegn kan på sandsynlighedsfunktionen, være sandsynlighedsfunktionen så man ved, hvilken for sandsynlighedsfunktion, variabel, der hører. til hvilken stokastisk variabel. Fx kan f Y (y) være sandsyn den stokastiske lighedsfunktionen for den stokastiske variabel, Y. Eksempel 4.6: Salg af paraplyer ñ del 3 Den stokastiske Den stokastiske variabel, X, fra variabel, eksempel, 4.5 fra har eksempel følgende sandsynlighedsfunktion: sandsynlighedsfunktion: 4.5 har f lgende En sandsynlighedsfunktion,, har følgende egenskaber: For det første En sandsynlighedsfunktion, f, har følgende egenskaber: For det første antager antager den kun værdier mellem 0 og 1. Vi kan ikke have hverken den kun værdier mellem 0 og 1. Vi kan ikke have hverken negative sandsynligheder eller negative sandsynligheder, sandsynligheder der overstiger eller sandsynligheder, 1. For det andet der skal overstiger sum men 1. af For det andet skal summen af sandsynlighederne for alle værdier af den Egenskaber sandsynlighederne for alle værdier af den stokastiske variabel være lig med 1: Egenskaber ved sandsynlighedsfunktionen, stokastiske ved variabel sandsynlighedsfunktionen,, for en være lig med 1:, diskret for en diskret stokastisk Egenskaber variabel, stokastisk ved : variabel, sandsynlighedsfunktionen, :,, for en diskret i) 0 stokastisk Egenskaber variabel, i) 1 ved sandsynlighedsfunktionen, : : f(x), for en diskret stokastisk variabel, X: 0 1 i) i) ii) ii) 1 1 ii) ii) 1 hvor hvor er de forskellige er de forskellige værdier, som værdier, kan som antage. kan antage. hvor hvor x 1, x 2,, x er N er de de N forskellige værdier, som X kan antage. Sumtegnet, Sumtegnet,, betyder, at, betyder, man skal at at man summere man skal skal summere over f(x) over alle over de alle mulige, betyder, at man skal summere over alle de mulige værdier de mulige af værdier. x. Derfor af. Derfor er de mulige værdier af.. Derfor lig med f(x 1 lig ) + med f(x 2 ) + + f(x N ), hvor x 1, lig med, x 2 hvor,, x N er, de hvor N forskellige er de værdier, de som forskellige X kan antage. værdier, 2,, hvor er de forskellige værdier, som kan som kan antage. 2 antage. antage. 2 2 Med Med sandsynlighedsfunktionen Med sandsynlighedsfunktionen kan kan man man finde finde kan man sandsynligheden finde sandsynligheden for for forskellige forskellige forskellige sammensatte sammensatte sammensatte hændelser. hændelser. hændelser. Det Det er blot er blot Det et er spørgsmål blot et spørgsmål om om at om at lægge 2. Hvis sandsynlighederne X kan antage uendeligt sammen mange for de (tællelige) værdier værdier, af,, som så skriver svarer vi til N =. lægge sandsynlighederne lægge sandsynlighederne sammen for sammen de værdier for de af værdier, som af svarer, som til den hændelse, man er interesseret i. svarer til den hændelse, den man hændelse, er interesseret man interesseret i. i. 4.1 Definition af en stokastisk variabel 77 Eksempel 4.7: Salg af paraplyer ñ ñ del 4 Eksempel 4.7: Eksempel Salg af 4.7: paraplyer Salg af ñ paraplyer del 4 Lad vê re defineret som i eksempel ñ del og 4.6. Ved hjê lp af Lad sandsynlighedsfunktionen vê Lad re defineret vê re som for defineret i eksempel kan vi finde som i 4.5 sandsynlighederne eksempel og Ved og hjê for 4.6. lp de Ved af hjê lp af sandsynlighedsfunktionen forskel lige hê ndelser sandsynlighedsfunktionen for fra paraplyeksemple kan for vi finde t fra kan sandsynlighederne kapitel 3: vi finde sandsynlighederne for de for de forskellige hê forskel ndelser "købe "købe lige én hê fra paraply" paraply" paraplyeksemple ndelser fra 1 1 paraplyeksemple 1/2 t fra kapitel 3: t fra kapitel 3:

6 Med sandsynlighedsfunktionen kan man finde sandsynligheden for forskellige sammensatte hændelser. Det er blot et spørgsmål om at lægge sandsynlighederne sammen for de værdier af X, som svarer til den hændelse, man er interesseret i. Eksempel 4.7: Salg af paraplyer del 4 Lad X være defineret som i eksempel 4.5 og 4.6. Ved hjælp af sandsynlighedsfunktionen for X kan vi finde sandsynlighederne for de forskellige hændelser fra paraplyeksemplet fra kapitel 3: P( købe én paraply ) = f(1) = 1/2 P( købe to paraplyer ) = f(2) = 1/4 P( ingen køb ) = f(0) = 1/4 P( køb ) = f(1) + f(2) = 1/2 + 1/4 = 3/4 P( højst købe én paraply ) = f(0) + f(1) = 1/4 + 1/2 = 3/4 hvor fx sandsynligheden for den sidste hændelse er fundet ved at lægge sandsynlighederne for X = 0 og X = 1 sammen, da disse værdier svarer til hændelsen højst købe én paraply Den kumulative Den sandsynlighedsfunktion kumulative sandsynlighedsfunktion Sandsynligheden for, for, at at den den stokastiske variabel antager en værdi, som er mindre som end er mindre eller lig end med eller en lig bestemt med en bestemt værdi, værdi, x, er kendt, er kendt som som den den kumulative sandsynlighed. kumulative Den sandsynlighed. kumulative Den sandsynlighedsfunktion, kumulative sandsynlighedsfunktion, som også kaldes fordelingsfunktionen, som også kaldes betegnes fordelingsfunktionen, ofte med et stort betegnes bogstav, ofte fx F(x): med et stort bogstav, fx : Den kumulative Den kumulative sandsynlighedsfunktion, sandsynlighedsfunktion, F(x), for en diskret, stokastisk for en variabel, diskret X, er defineret som: stokastisk variabel,, er defineret som: Den kumulative sandsynlighed findes ved, at man summerer Den kumulative sandsynlighed findes ved, at man summerer sandsynlighedsfunktionen, f(x), over alle de værdier, x i, som er mindre end eller lig med x. sandsynlighedsfunktionen,, over alle de værdier,, som er mindre end eller lig med. Det er præcis dette, som sumtegnet Det er præcis dette, som sumtegnet Σ xi x f(x i ) angiver. Lad os tage et eksempel: angiver. Lad os tage et eksempel: Eksempel 4.8: Salg af paraplyer ñ del 5 For den stokastiske variabel,, i eksempel 4.6 er /4 1/ 3/4. Sandsynligheden for, at antager en vê rdi mindre end 78 Stokastiske eller lig variabler med 1, er lig med sandsynligheden for 1 plus sandsynligheden for 0. Vi har tegnet grafen for den kumulative sandsynlighedsfunktion for i figur 4.1. Det ses, at er lig med 0 for vê rdier af mindre end 0, da i dette eksempel ikke kan antage negative vê rdier. I punktet 0 springer til vê rdien 1/4, fordi man i dette punkt lê gger sandsynligheden 0 til den kumulative sandsynlighed. Sandsynligheden for at fâ en vê rdi mindre

7 Eksempel 4.8: For den stokastiske variabel, X, i eksempel 4.6 er F(1) = f(0) + f(1) = 1/4 + 1/2 Salg af para- = 3/4. Sandsynligheden for, at X antager en værdi mindre end eller lig med 1, plyer del 5 er lig med sandsynligheden for X = 1 plus sandsynligheden for X = 0. Vi har teg net grafen for den kumulative sandsynlighedsfunktion for X i figur 4.1. Det ses, at F er lig med 0 for værdier af x mindre end 0, da X i dette eksempel ikke kan antage negative værdier. I punktet x = 0 springer F til værdien 1/4, fordi man i dette punkt lægger sandsynligheden P(X = 0) til den kumulative sandsynlighed. Sandsynligheden for at få en værdi mindre end eller lig med nul er altså 1/4. Tilsvarende springer F fra 1/4 til 3/4 i punktet x = 1, fordi man her lægger P(X = 1) = 1/2 til den kumulative sandsyn lighed. Mellem 0 og 1 sker der ingen stigninger i den kumulative sandsynlig hed, fordi sandsynligheden for, at X antager en værdi i dette interval, er nul. Figur 4.1: Den kumula - tive sandsynlighedsfunktion for X F(x) F(x) 1 1 3/4 3/4 f(2) f(2) F(x) F(x) f(1) f(1) 1/4 1/4 f(0) f(0) x x Som eksemplet viser, så er den kumulative sandsynlighedsfunktion, F, en trappefunktion for en diskret stokastisk variabel. Afstanden mel lem to trin er lig med værdien af sandsynlighedsfunktionen, f, i punktet mellem de to trin. Den kumulative sandsynlighedsfunktion kan også bruges til at finde sandsynligheden for, at X antager en værdi i et givet interval, fx mellem a og b. Denne sandsynlighed er givet ved: P(a < X b) = F(b) F(a) 4.1 Definition af en stokastisk variabel 79

8 Sandsynligheden for, at X er større end a, men mindre end eller lig med b, er lig med sandsynligheden for, at X er mindre end eller lig med b, som er F(b), fratrukket sandsynligheden for, at X er mindre end eller lig med a, som er F(a). Dette er illustreret i figur 4.2. Når vi kommer til kontinuerte stokastiske variabler, viser det sig, at denne formel er særdeles anvendelig til at beregne sandsynligheder. Figur 4.2: Intervalsandsynligheden, P(a < X b) F(b) a b x F(a) P(a<X b)=f(b) F(a) I formlen ovenfor er sandsynligheden for X = a ikke inkluderet. Hvis man i stedet vil udregne sandsynligheden P(a X b), så er denne givet ved: P(a X b) = F(b) F(a) + f(a) Sandsynlighedsfunktioner og andelsfunktioner I kapitel 3 argumenterede vi for, at man i nogle situationer kan bruge andelsfunktionen til at tilskrive sandsynligheder til udfald af et eksperiment. Dette er tilfældet, når eksperimentet består i at udtrække et element fra en virkelig population med N pop elementer, og hvor udfaldet af eksperimentet er lig med værdien af et givet karakteristikum for det udtrukne element. Hvis alle elementer i populationen har lige stor chance for udvælgelse, så er sandsynligheden for udfaldet z givet ved andelen af elementer i populationen med værdien z af dette karakteristikum. Sandsynligheden er derfor lig med g(z), hvor g er andelsfunktionen. Dette kan uden videre overføres til stokastiske variabler. Lad Z være en stokastisk variabel, hvis værdi er givet ved værdien af karakteristikummet for det ele ment, der udtrækkes. Hvis udvælgelsesmekanismen er således, at alle elementer i populationen har samme chance for at blive udvalgt, så er sand synlighedsfunktionen for Z lig med andelsfunktionen for populationen, dvs. f(z) = g(z). Vi opsummerer denne egenskab i boksen nedenfor: 80 Stokastiske variabler

9 Forbindelse mellem andelsfunktion og sandsynlighedsfunktion: Lad en virkelig population have andelsfunktionen g(z), hvor egenskaben z er en talværdi. Lad Z være en diskret stokastisk variabel, hvis værdi er givet ved værdien af det element, der udtrækkes. Hvis alle elementer i populationen har samme chance for udvælgelse, så er sandsynlighedsfunktionen, f(z), givet ved: f(z) = g(z) og den kumulative sandsynlighedsfunktion, F(z), er givet ved: F(z) = G(z) hvor G(z) er den kumulative andelsfunktion. Eksempel 4.9: Mænd og kvinder I eksempel 4.4 udtrak vi en person fra en population, hvor en andel af denne var mænd, og en andel var kvinder. Den stokastiske variabel, X, antog værdien 0, hvis resultatet af udtræk ningen blev en mand, og værdien 1, hvis det blev en kvinde. Hvis populatio nen består af 49 % mænd og 51 % kvinder, så er andelsfunktionen for denne population givet ved: g(0) = 0,49 g(1) = 0,51 Hvis alle personer har lige stor chance for at blive udtrukket, så er der 49 % sandsynlighed for, at udtrækningen resulterer i en mand, dvs. for at X antager værdien 0. Derfor bliver sandsynlighedsfunktionen for X: f(0) = 0,49 f(1) = 0,51 Altså nøjagtig den samme som andelsfunktionen. Sammenhængen mellem sandsynlighedsfunktioner og andelsfunktioner er en stor hjælp, når vi skal specificere en sandsynlighedsfunktion for en sto kastisk variabel, som repræsenterer de mulige værdier i en virkelig population. Det gør også, at vi ofte taler om andelsfunktionen, som var den en sandsynlighedsfunktion. Ofte taler vi også om sandsynlighedsfunktionen, som var den en andelsfunktion. Det gør vi, når den stokastiske variabel (jf. eksemplet oven 4.1 Definition af en stokastisk variabel 81

10 for) er defineret ud fra en virkelig population, således at dens værdi er lig med værdien af det element, der udvælges, og udvælgelsesmekanismen indebærer samme chance for udvælgelse for alle elementerne i populationen. 4.3 Sammenhænge mellem diskrete stokastiske variabler Vi er ofte interesserede i at undersøge sammenhænge, fx mellem et barns opvækstvilkår og dets uddannelsesvalg eller mellem pris og forbrug af en vare. Med stokastiske variabler kan vi nemmere håndtere mere omfattende problemstillinger end dem, vi behandlede i kapitel 3. For at finde og beskrive sammenhænge under usikkerhed bruger man to eller flere stokastiske variabler. I det følgende præsenterer vi nogle vigtige redskaber til at karakterisere sammenhænge mellem stoka stiske variabler Simultan sandsynlighed Lad os forestille os en situation, hvor en bank skal vurdere kreditværdighe den af en virksomhed. For at gøre eksemplet så simpelt som muligt antager vi, at der i vurderingen indgår to aspekter: i) risikoen for fallit; og ii) markedsudviklingen. Begge disse forhold er forbundet med usikkerhed. Vi har altså et statistisk eksperiment, som kan modelleres med to stokastiske variabler: X, som vil antage værdien 0, hvis virksomheden går fallit, og værdien 1, hvis den ikke gør det, og Y, som er lig 1, hvis markedsudviklingen viser sig at blive gunstig, og 0 i modsat fald. Banken ved af erfaring med tilsvarende virksom heder, at sandsynlighederne for de forskellige udfald er som i tabel 4.1: Tabel 4.1: Simultane sandsynligheder X = 0 (fallit) X = 1 (ej fallit) Y = 0 (ugunstigt marked) 0,2 0,2 Y = 1 (gunstigt marked) 0,1 0,5 Sandsynligheden i det nederste højre hjørne i tabel 4.1 er sandsynligheden for, at både markedsudviklingen bliver gunstig og virksomheden ikke går fallit. Dette kaldes en simultan sandsynlighed, fordi det er en både og sandsynlighed. Sandsynlighedsfunktionen, som giver sandsynligheden for bestemte kombinationer af værdier af X og Y, kalder man den simultane sandsynlighedsfunktion. Den er defineret i følgende boks: 82 Stokastiske variabler

11 Den simultane sandsynli Den simultane sandsynlighedsfunktion,,,,, for to diskrete stokastiske variabler, og Den stokastiske simultane sandsynlighedsfunktion, f(x, y), for to diskrete stokastiske varia bler, X og variabler, og,, er defineret som:, Y, er defineret som:,, f(x, y) = P(X = x og Y = y) Sandsynligheden for en ugu Sandsynligheden for en ugunstig markedsudvikling og en fallit er således 0, 0 0,. Vi Sandsynligheden for en ugunstig markedsudvikling og en fallit er således således 0, 0, 0 0 0,. 0,. Vi bemærker, at de fire simultane sandsynligheder i tabel 4.1 s f(0, sandsynligheder 0) = 0,2. Vi bemærker, at de fire simultane sandsynligheder i tabel 4.1 i tabel 4.1 summerer til 1, fordi der i alt er 4 mulige udfald, og summen af sandsy summerer udfald, til 1, fordi der i alt er 4 mulige udfald, og summen af sandsynlighe og summen af sandsynlighederne skal, som i tilfældet med én stokastisk variabel, være lig m derne stokastisk skal, som i tilfældet med én stokastisk variabel, være lig med 1. variabel, være lig med 1. Generelt gælder det, at Generelt gælder gælder det, det, at når at man når summerer man summerer den simultane den simultane sandsynlighedsfunktion sandsynlighedsfunktion over alle værdier over af de involverede alle værdier stokastiske af de variabler, involverede skal stokastiske resulta variabler, skal res sandsynlighedsfunktion ove tet stokastiske være lig med variabler, 1. skal resultatet være lig med 1. Egenskaber ved den simu Egenskaber ved den ved simultane den simultane sandsynlighedsfunktion, sandsynlighedsfunktion, f(x, y), for to diskrete,,,, stokastiske for to diskrete stokastiske var for variabler, to diskrete X, og s Y: t okas tiske variabler,,, og : : i) 0, 1 i) 0, 0, 1 1 ii), ii),,,,,,,, 1 1 hvor y 1, y 2,, y NY er de N Y mulige værdier, som Y kan antage, og x 1, x 2,, hvor x NX er,,, er de hvor de N X mulige,,,,,, værdier, er som de X kan mulige antage. værdier, som kan antage, og,,, er de mulig,,,,,, er de mulige værdier, som kan antage Marginal sandsyn Marginal sandsynlighed Marginal sandsynlighed Hvis man er interesseret i sa Hvis man er interesseret i sandsynligheden for, at virksomheden ikke går fallit, Hvis uanset man hvordan er interesseret markedet i sandsynligheden udvikler sig, for, så kan at virksomheden man udregne ikke går fallit, uanset hvordan ma denne sandsynlighed går fallit, ved uanset at summere hvordan markedet sandsyn udvikler lighederne sig, for så kan alle man de udfald udregne denne sandsynlighed ved at i tabel 4.1, denne hvor sandsynlighed virksomheden ved ikke at går summere fallit. sandsynlighederne Virksomheden for kan undgå alle de fallit, udfald i tabel 4.1, hvor virk både når udfald markedet i tabel er 4.1, gunstigt hvor virksomheden og når ikke det er ugunstigt. går fallit. Dermed Virksomheden kan undgå fallit, både når ma er den samlede sandsynlighed undgå fallit, kan for både at undgå når markedet fallit er givet ved gunstigt og f(1, 0) + når f(1, det 1) er = ugunstigt. 0,2 Dermed er den samlede san + 0,5 = 0,7. Rent Dermed er den samlede sandsynlighed for at undgå fallit givet ved 1, 0 1, 1 0, 0, mekanisk findes dette tal ved at summere sandsynlighederne i kolonnen med 1, 1, 0 01, 1, 1 1 0, 0, 0, 0, 0,. 0,. Rent mekanisk findes dette tal overskriften ej fallit. Dette er gjort i tabel 4.2 neden for. Når der som i bankeksemplet er mere end én stokastisk variabel, så kaldes sandsynlighederne for hver af de stokastiske variabler for de marginale sandsynligheder. Den marginale sandsynlighedsfunktion for X benævnes f x (x) og er defineret i nedenstående boks: 4.3 Sammenhænge mellem diskrete stokastiske variabler 83

12 fallit". Dette er gjort i tabel 4.2 nedenfor. Når der som i bankeksemplet er mere end én stokastisk variabel, så Når der som i bankeksemplet er mere end én stokastisk variabel, så kaldes sandsynlighederne for hver af de stokastiske variabler for de kaldes sandsynlighederne for hver af de stokastiske variabler for de marginale marginale sandsynligheder. sandsynligheder. Den Den marginale marginale sandsynlighedsfunktion sandsynlighedsfunktion for for benævnes benævnes og og er er defineret i i nedenstående boks: boks: Den marginale Den marginale sandsynlighedsfunktion, sandsynlighedsfunktion, f x (x), for en diskret stokastisk,, for for variabel, en en diskret X, er defineret stokastisk ved: variabel, variabel,,, er er defineret stokastisk ved:,,,,,,,, y,,, er de mulige værdier, som kan antage. 1, y 2,, y NY er de N Y mulige værdier, som Y kan antage.,,, er de mulige værdier, som kan antage. Populært sagt finder vi den marginale sandsynlighed ved at summere Populært den simultane sagt finder sandsynlighed vi den marginale over alle sandsynlighed mulige y-værdier ved at summere for en Populært den bestemt simultane sagt finder værdi sandsynlighed vi af den, præcis marginale som over vi sandsynlighed gjorde alle ovenfor, mulige ved da y-værdier at vi summere skulle finde for den en simultane bestemt den sandsynlighed værdi marginale af, sandsynlighed præcis over alle som mulige for vi at gjorde y-værdier undgå ovenfor, fallit. Tilsvarende da bestemt vi skulle er værdi den finde af x, præcis den marginale som marginale vi gjorde sandsynlighedsfunktion sandsynlighed ovenfor, da vi for skulle for at undgå finde defineret den fallit. marginale ved at Tilsvarende sandsynlighed summere er den over alle væ rdier af : for marginale at undgå fallit. sandsynlighedsfunktion Tilsvarende er den marginale for defineret sandsynlighedsfunktion ved at summere for Y defineret over alle ved væ at rdier summere af : over alle værdier af x:,,,,,,,, I tabel 4.2 findes den marginale sandsynlighed for Y ved at summere horisontalt. For eksempel er sandsynligheden for et ugunstigt marked I tabel I tabel 4.2 (uanset findes 4.2 findes om den virksomheden marginale marginale sandsynlighed går sandsynlighed fallit eller for ej) Y ved for givet at Y summere ved: at summere 0 horisontalt. horisontalt. For 1, eksempel 0 0, For eksempel er 0 sandsynligheden 0, 0, 0,. er sandsynligheden for Tilsvarende et ugunstigt er for et marked den marginale ugunstigt (uanset marked om virksomheden sandsynlighed går fallit for eller et ej) gunstigt givet ved: marked f (uanset om virksomheden går fallit Y (0) lig = f(1, med 0) + eller ej) givet 1 f(0, 1, 0) = 0,2 1+ 0,2 = ved: 0 0,4. Tilsvarende 0, 1 0, er den 0,1marginale 0,. De sandsynlighed marginale sandsynligheder for et gunstigt summerer marked lig 1, 0 0, 0 0, 0, 0,. Tilsvarende er den marginale med f Y (1) også = til f(1, 1. 1) De + er f(0, nemlig 1) = lig 0,5 med + 0,1 de = sandsynligheder, 0,6. De marginale man sandsynligheder ville have i sandsynlighed for et gunstigt marked lig med 1 1, 1 summerer en situation også til med 1. De blot er nemlig en enkelt lig stokastisk med de sandsynligheder, variabel. Man kan man altså ville sige, have i en 0, situation 1 man 0, splitter med 0,1 blot de marginale en 0,. enkelt De sandsynligheder stokastisk marginale variabel. sandsynligheder op i mindre Man kan "bidder" altså summerer (de sige, at man også splitter til 1. de De marginale er nemlig sandsynligheder med de sandsynligheder, op i mindre bidder man ville (de have simultane en sandsynligheder), situation med blot når en man enkelt inddrager stokastisk en anden variabel. stokastisk Man kan variabel altså i sige, analy i sen. at man splitter de marginale sandsynligheder op i mindre "bidder" (de Tabel 4.2: Simultane og marginale sandsynligheder X = 0 (fallit) X = 1 (ej fallit) Marginal sandsynlighed for Y: f Y (y) Y = 0 (ugunstigt marked) 0,2 0,2 0,4 Y = 1 (gunstigt marked) 0,1 0,5 0,6 Marginal sandsynlighed for X: f X (x) 0,3 0,7 84 Stokastiske variabler

13 4.3.3 Betinget sandsynlighed Man kan direkte overføre definitionen af betinget sandsynlighed mellem to hændelser fra afsnit 3.5 til stokastiske variabler. Som vi skal se, så er den grundlæggende ide og fortolkning fuldstændig den samme. Forskellen er, at vi med stokastiske variabler lettere kan håndtere mere komplicerede situationer, som man ofte støder på i praksis. I eksemplet fra afsnit kan man tænke sig den situation, at banken af en eller anden grund ved (eller tror), at markedet bliver gunstigt. Spørgsmålet er da, hvordan den kan bruge denne information til bedre at forudsige sandsynligheden for, at virksomheden ikke går fallit. Da banken ved, at markedet er gunstigt (Y = 1), så er der kun usikkerhed om udfaldet af X tilbage. Af tabel 4.2 ses det, at den simultane sandsynlighed for et gunstigt marked og ej fallit er 0,5, hvorimod den simultane sandsynlighed for et gunstigt marked og fallit er 0,1. Der er altså 5 gange så stor sandsynlighed for ikke at gå fallit som for at gå fallit i et gunstigt marked. Man kan bevare forholdet mellem disse sandsynligheder og samtidig justere dem, så de summerer til 1, ved at dividere dem med den marginale sandsynlighed for et gunstigt marked. Man kalder disse justerede sandsynligheder (som her skyldes, at man ved, at markedet bliver gunstigt) for betingede sandsynligheder: P(X = 0,Y =1) 0,1 P(X = 0 Y = 1) = = = 0,167 P(Y = 1) 0,6 P(X = 1,Y =1) 0,5 P(X = 1 Y = 1) = = = 0,833 P(Y = 1) 0,6 hvor den lodrette streg ligesom i kapitel 3 læses som givet eller betinget på. De to betingede sandsynlighe der summerer til 1, og forholdet mellem dem er stadig en faktor 5. Sagt på en anden måde: Sandsynligheden for, at virksomheden får succes, givet at vi ved, at markedet er gunstigt, er 0,833. Dermed har vores viden om, at marke det er gunstigt, ændret vores vurdering af sandsynligheden for, at virksom heden får succes. Uden informationen om, at Y er lig med 1, ville vi have anvendt den marginale sandsynlighed for X = 1, som ifølge tabel 4.2 er 0,7. I dette eksempel er det altså mere sandsynligt, at virksomheden undgår en fal lit, når vi ved, at markedsudviklingen er gunstig. Dette må for modes også at være tilfældet i virkeligheden! En anden måde, hvorpå man kan motivere formlen for betinget sandsynlighed, er ved at sige, at vores kendskab til Y gør, at vi ikke længere skal anvende hele den simultane fordeling for X og Y. Nogle af udfaldene i den simultane fordeling er blevet elimineret, nemlig dem, hvor Y = 0. Tilbage er kun 4.3 Sammenhænge mellem diskrete stokastiske variabler 85

14 de udfald, hvor Y = 1, og det er disse udfalds indbyrdes sandsynligheder, som nu er relevante. Derfor dividerer vi dem med deres sum, således at de kom mer til at summere til 1. Det var også den måde, vi motiverede betingede sandsynligheder på i kapitel 3. Formelt er den betingede sandsynlighedsfunktion for X, givet at Y = y, defineret i følgende boks: Den betingede sandsynlighedsfunktion, f X Y (x y), for en diskret stokastisk variabel, X, givet at Y = y, er defineret som: f(x, y) f X Y (x y) =, hvis f Y (y) > 0 f Y (y) Bemærk, at den betingede sandsynlighed for X givet Y = y kun er defineret for værdier af y med en positiv marginal sandsynlighed. I ovenståen de eksempel kan Y kun antage værdierne 0 og 1. Det giver derfor ingen me ning at tale om den betingede sandsynlighed for X givet Y = 3, da dette er en umulig situation. I modsætning til definitionen af betinget sandsynlighed for to hændelser i afsnit 3.5, så holder definitionen af betinget sandsynlighed for to stokastiske variabler for mange forskellige hændelser, fordi hver stokastisk variabel kan antage mange værdier, og til hver værdi svarer en hændelse. Fortolkningen af betinget sandsynlighed er dog nøjagtig den samme som i afsnit Bayes formel I praksis hænder det, at man kender den betingede sandsynlighed for Y givet X, men at man gerne vil kende den betingede sandsynlighed for X givet Y. Populært sagt skal man have vendt betingelsen. Et eksempel er et nyt varslingssystem ved stormflod. Man kan i et laboratorium finde ud af sandsynligheden for, at varslingssystemet virker, når man simulerer en stormflod, og ligeledes om varslingssystemet virker, når man simulerer, at der ikke er en stormflod. Man kan altså beregne sandsynlighederne for varsling givet stormflodssituationen. I praksis er vi derimod interesserede i, om vi får våde fødder. Udtrykt i sandsynligheder vil vi altså gerne vide, hvad sandsynligheden er for en stormflod, givet at der udsendes et varsel, men også hvad sandsynligheden er for stormflod, givet at der ikke udsendes et varsel. Vi skal derfor have vendt de sandsynligheder, man finder i laboratoriet. Man kan bruge følgende regneregler til at vende en betinget sandsynlighed: 86 Stokastiske variabler

15 sandsynlighed: sandsynlighed: Man kan bruge følgende regneregler til at vende en betinget Regneregler for Regneregler betingede for sands betyn inglighe ede d saer nds : ynlighed er : sandsynlighed: Regneregler for betingede sandsynlighed er : Regneregler for betingede sandsynligheder: og: og: f X (x) f X Y (x y) = f Y X (y x) fy (y) og: og: En kort En og kort teknisk teknisk og forklaring, på hvilket på formlerne: vi, har hvilket Den fra første definitionen vi formel har fra følger af følger definitionen den af, af, at at den af den betingede simultane den simultane sandsynlighed, betingede sandsynlighed, i afsnit f(x, y), er lig i Sætter, afsnit med erbåde vi lig med f Y X Sætter (y både x) vi f X (x) og lig f X Y (x y) lig med f Y (y), hvilket og med vi har fra og definitionen dividerer, hvilket og med af dividerer den har betingede fra på med definitionen begge sandsynlighed sider på af af begge den i afsnit sider af lighedstegnet, betingede Sætter lighedstegnet, så vi sandsynlighed får f Y X (y vi den x) første fså X (x) i får afsnit lig formel vi med den i første f X Y boksen Sætter (x formel y) vi ovenfor. f Y (y) i boksen og Den dividerer anden ovenfor. lig med Den f Y (y) anden formel på begge med (Bayes' sider formel) af lighedstegnet, (Bayes' følger og formel) af, dividerer at så den får følger vi marginale med den af, at første den sandsynlighed på formel marginale begge i boksen sider sandsynlighed for af oven for. for, Den, lighedstegnet, anden kan, formel findes, så (Bayes ved får kan vi at den findes formel) summere første ved følger formel de at simultane summere af, i boksen at den ovenfor. de sandsynligheder marginale simultane Den sandsynlig anden sandsynligheder over for alle Y, formel f Y de (y), (Bayes' mulige kan over findes formel) alle værdier de ved mulige af at følger summere af, at den for værdier en given af simultane marginale værdi for en af given, sandsynligheder for dvs.: værdi af, dvs.: over alle de mulige,, værdier kan findes af x for ved en at given summere værdi de af y, simultane dvs.: sandsynligheder over alle de mulige værdier af for en given værdi af, dvs.: f Y (y) = f(x i, y) = f Y X (y x i ) f X (x i ) (Bayes' formel) (Bayes' formel) (Bayes (Bayes' formel) formel) En kort teknisk En forklaring kort teknisk på formlerne: forklaring på Den formlerne: første formel Den følger første af, formel at følger af, at den simultane den sandsynlighed, simultane sandsynlighed,, er lig med, både er lig med både = f Y X (y x 1 ) f X (x 1 ) + f Y X (y x 2 ) f X (x 2 ) + + f Y X (y x NX ) f X (x NX ) hvor hvor er de værdier, er som de værdier, kan antage. som kan antage. hvor hvor x 1, x 2,, x NX, er de er de værdier, som som X kan kan antage. Eksempel 4.10: Eksempel Et varslingssystem 4.10: Et varslingssystem Eksempel 4.10: Lad den Eksempel stokastiske 4.10: Et variabel, varslingssystem X, angive om der opstår stormflod, dvs. X = 1, Et varslingssystebel, Y, angive om varslingssystemet udsender et varsel, dvs. Y = 1, hvis det gør hvis der gør, og X = 0, hvis der ikke gør. Lad tilsvarende den stokastiske varia og Y = 0, hvis det ikke gør. Antag, at man i laboratoriet har fundet ud af, at der udsendes varsel i 90 % af de tilfælde, hvor der opstår stormflod. Tilsvarende udsendes der (falske) varsler i 2 % af de tilfælde, hvor der ikke er stormflod. De betingede sandsynligheder er altså: f Y X (1 1) = 0,90, f Y X (0 1) = 0,10 f Y X (1 0) = 0,02, f Y X (0 0) = 0,98 Endelig ved man fra historiske erfaringer med stormfloder, at der er 5 % risiko for stormflod. Den marginale sandsynlighed for en stormflod er altså: 4.3 Sammenhænge mellem diskrete stokastiske variabler 87

16 hvor der er stormflod. Tilsvarende udsendes der (falske) varsler i 2% af de tilfê lde, hvor der ikke er 1 1 stormflod. 0,0, De be tingede 0 1sandsyn 0,10 ligheder er altsâ : ,0, 0,0, , 0,10 Endelig ved man fra historiske 1 0 0,0, erfaringer med 0 0stormfloder, 0, at der er 5% risiko Endelig for ved stormflod man fra i historiske en sê son. erfaringer Den marginale med stormfloder, sandsynlighed at der for er 5% en stormflod risiko for er stormflod altsâ : i en f X (1) sê= son. 0,05, Den fmarginale X (0) = 0,95sandsynlighed for en stormflod er altsâ : 1 0,05, 0 0,5 Den betingede sandsynlighed for, at der kommer en stormflod, givet at der Den betingede sandsynlighed 1 for, 0,05, at der kommer 0 0,5 en stormflod, givet at der udsendes et varsel, kan nu udregnes ved blot at indsætte Bayes formel: udsendes Den betingede varsel, sandsynlighed kan nu udrefor, gnes at ved der blot kommer a t inds en Ê stormflod, tte i Bayes' givet formel: at der udsendes et varsel, kan nu udregnes ved blot a t inds 1 Ê tte i Bayes' formel: ,05 0, ,0 0,5 0,0 0,05 0,0 1 0,05 0, Der er sâ ledes ca. 70% sandsynlighed 0,0 0,5 for, at 0,0 der kommer 0,05 en 0,0 stormflod, hvis Der er således ca. 70 % sandsynlighed for, at der kommer en stormflod, hvis systemet Der er sâ ledes udsender ca. 70% et sandsynlighed varsel. Tilsvarende for, at der er kommer sandsynligheden en stormflod, for hvis en systemet stormflod, udsender n  rder ikke et varsel. u dsende Tilsvarende s et varsel: er sandsynligheden for en stormflod, systemet udsender et varsel. Tilsvarende er sandsynligheden for en når der ikke udsendes et varsel: stormflod, n  rder ikke u dsende s et varsel: ,05 0, ,1 0,05 0, 0,5 0, ,05 0,1 Hvis man er nerv s for, at en 0,1 stormflod 0,05 0, kommer 0,5 uden 0,005 varsel, sâ er sandsynligheden Hvis man er nerv for dette s for, altsâ at en meget stormflod lille med kommer et sâ dant uden varslingssystem. varsel, sâ er Hvis Prisen man er, er at der nervøs ca. for, 30 at % en chance stormflod for et kommer falsk varsel. uden varsel, så er sandsynligheden for dette altså meget lille med et sådant varslingssystem. Prisen er, sandsynligheden for dette altsâ meget lille med et sâ dant varslingssystem. Prisen er, at der er ca. 30 % chance for et falsk varsel. at der er ca. 30 % risiko for et falsk varsel. Bemærk, at den betingede sandsynlighed for givet kun i særlige tilfælde Bemærk, er at lig den den betingede sandsynlighed for givet. kun i særlige Bemærk, tilfælde at er den lig den betingede betingede sandsynlighed sandsynlighed for X for givet givet Y kun. i særlige tilfæl de er lig den betingede sandsynlighed for Y givet X Uafhængighed I afsnit 3.6 diskuterede vi statistisk uafhængighed mellem to hændelser. Nu vil vi udvide dette til statistisk uafhængighed mellem mange hændelser. Dette gøres relativt let ved hjælp af stokastiske variabler. I eksemplet ovenfor om banken kan man sammenligne den marginale sandsynlighed for X, f X (x), med den betingede sandsynlighed for X, f X Y (x y), når man ved, at Y antager en bestemt værdi, y. Hvis de to sandsynligheder er forskellige, så har informationen om Y ændret vores viden om X. Dog ikke således, at vi kender udfaldet af X, men på den måde, at nogle værdier af X er ble vet mere eller mindre sandsynlige end da vi ikke kendte udfaldet af Y. Vores forudsigelser om X ændrer sig altså, fordi vi nu kender udfaldet af Y. Hvis information om Y ikke ændrer fordelingen af X, så siges X og Y at være uafhængige. Formelt kan dette skrives som: 88 Stokastiske variabler

17 Uafhængighed: To diskrete stokastiske variabler, X og Y, er uafhængige, hvis og kun hvis: hvilket er det samme som: f X (x) = f X Y (x y) for alle værdier af x og y, f(x, y) = f X (x) f Y (y) for alle værdier af x og y. Når X og Y er uafhængige, så er den marginale fordeling for X, f x (x), lig med den betingede fordeling for X givet Y, f X Y (x y). Det vil sige, at informationen om Y ikke ændrer vores opfattelse af sandsynlighederne for de forskellige værdier af X. Man kan derfor ikke bruge Y til at forudsige noget om X. Uafhængighed mellem X og Y betyder også, at den simultane sandsynlighed kan skrives som produktet af de marginale sandsynligheder: f(x, y) = f X (x) f Y (y). Dette følger umiddelbart, hvis man indsætter f X (x) = f X Y (x y) i definitionen af den betingede sandsynlighedsfunktion fra ovenfor. Princippet er illustreret i det følgen de eksempel. Eksempel 4.11: Antag, at vi kaster en mønt to gange og definerer den stokastiske variabel, X, To møntkast som værende lig med 1, hvis det første kast viser krone, og 0, hvis det vi ser plat. Lad Y være defineret tilsvarende for det andet kast. Der er fire mu lige kombinationer af X og Y s værdier. Da vi ikke kan argumentere for, at én kombination er mere sandsynlig end en anden, så er sandsynligheden for hver kombination lig med 0,25 ifølge symmetriargumentet fra afsnit Vi kan udlede samme resultat ved at tage udgangspunkt i, at der ingen sammenhæng er mellem Xog Y. Derfor må X og Y være uafhængige. Sand synlighedsfunktionen for X er f X (0) = 0,5 og f X (1) = 0,5. Tilsvarende er sand synlighedsfunktionen for Y: f Y (0) = 0,5 og f Y (1) = 0,5. Da X og Y er uafhængi ge, så er f(x, y) = f X (x) f Y (y) = 0,5 0,5 = 0,25 for x = 0 eller 1 og y = 0 eller 1. I tabel 4.2 kan det tydeligt ses, at X og Y ikke er uafhængige. Tag fx den simultane sandsynlighed for et ugunstigt marked og fallit: f(0, 0) = 0,2. Denne sandsynlighed er ikke lig med produktet af de to marginale sandsynligheder: f X (0) f Y (0) = 0,3 0,4 = 0, Kontinuert stokastisk variabel For at behandle sandsynligheder for stokastiske variabler, som kan antage utælleligt mange værdier, er det nødvendigt at bruge lidt andre matemati ske redskaber end dem, vi anvendte i afsnit 4.2 og 4.3. Forskellen i forhold til di 4.4 Kontinuert stokastisk variabel 89

18 skrete stokastiske variabler er, at det er nødvendigt at erstatte sandsynlighedsfunktionen med en såkaldt tæthedsfunktion. Derefter følger begre berne om simultane og betingede sandsynligheder nøjagtig samme recept som for de diskrete stokastiske variabler. Lad os illustrere problematikken omkring tilskrivning af sandsynligheder til en kontinuert stokastisk variabel med et eksempel: Eksempel 4.12: Vareproduktion del 1 En virksomhed skal vurdere, hvad dens vareproduktion (målt i tons) vil være til næste år. Den har imidlertid ikke nogen specielt god infor mation om dette, da produktionen afhænger af vejret og priser på råvarer. Den antager derfor, at alle mængder mellem 10 og 20 tons har lige stor sand synlighed for at blive produceret. Dog forudsætter den, at der vil blive produ ceret mindst 10 og maksimalt 20 tons. Derfor er sandsynligheden for, at den producerede mængde er mellem 10 og 20 tons lig med 1. Men hvad er sand synligheden for, at der vil blive produceret nøjagtigt 14,55325 tons? Svaret er 0. Det måske endnu mere overraskende er, at sandsynligheden også er 0 for enhver anden mængde mellem 10 og 20 tons. Sandsynligheden for, at en kontinuert stokastisk variabel antager en specifik værdi, er nul, fordi der er utælleligt (og dermed uendeligt) mange værdier, den kan antage. Hvis sandsynligheden for enhver af disse værdier er større end 0, så vil den samlede sandsynlighed være uendeligt stor. Men vi ved jo, at den samlede sandsynlighed skal være lig med 1. Derfor er det nødvendigt at finde en ny måde at beskrive usikkerheden på, når den stokastiske variabel er kontinuert. Det gøres ved hjælp af den kumulative sandsyn lighedsfunktion Den kumulative sandsynlighedsfunktion Den kumulative sandsynlighedsfunktion (fordelingsfunktionen) er defineret præcis som i afsnit 4.2.2: Den kumulative sandsynlighedsfunktion, F(x), for en kontinuert stokastisk va riabel, X, er defineret som: F(x) = P(X x) Denne definition kan vi altså bruge, både når X er diskret, og når X er kontinuert. Det næste eksempel viser, hvordan man kan ræsonnere omkring den kumulative sandsynlighedsfunktion. 90 Stokastiske variabler

19 Eksempel 4.13: I eksempel 4.12 var X den producerede varemængde. Vi antog, at denne var Vareproduktion del 2 da der ingen sandsynlighed er for en produceret mængde på under 10 tons. mindst 10 tons. Derfor må F(x) = 0 for alle værdier af x mindre end 10 tons, Til gengæld er F(x) = 1 for x 20 tons, da vi også antog, at der ikke ville blive produceret en mængde over 20 tons. Nu har vi altså to holdepunkter: F(10) = 0 og F(20) = 1. Spørgsmålet er så, hvilke værdier F(x) antager, når x er mellem 10 og 20 tons? Virksomheden antog, at alle værdier mellem 10 og 20 tons var lige sandsynlige, men dette førte ikke til noget meningsfyldt om sandsynligheden for en bestemt værdi, da alle værdier har sandsynlighed 0 for at forekomme. For at fange hensigten med, at alle værdier har lige stor sandsynlighed, kan vi i stedet forsøge at udtale os om et interval af værdier. Man kan nemlig opdele intervallet mellem 10 og 20 i et tælleligt antal intervaller. Dermed kan vi bruge tilgangen fra en diskret stokastisk variabel, hvis vi fokuserer på et interval af værdier i stedet for på en bestemt værdi af den kontinuerte stokastiske variabel. Da udgangspunktet er, at alle værdier er lige sandsynlige, kan dette overføres på intervaller af samme længde, som da også skal have samme sandsynlighed. For eksempel skal sandsynligheden for at få en værdi i intervallet 10 til 11 tons være den samme som sandsynligheden for at få en værdi i inter vallet 11 til 12 tons. Da de mulige værdier ligger mellem 10 og 20 tons, kan dette interval deles i 10 mindre intervaller, hver med en længde på 1 ton. Da alle disse intervaller skal være lige sandsynlige, så må sandsynligheden for en værdi i hvert interval være 0,1. Vi har dermed, at fx P(10 < X 11) = 0,1. Fra afsnit ved vi endvidere, at denne sandsynlighed kan skrives ved hjælp af den kumulative sandsynlighedsfunktion på følgende vis: P(10 < X 11) = 0,1 = F(11) F(10) = 0,1 Da F(10) = 0, så må F(11) nødvendigvis være lig med 0,1: F(11) = P(10 < X 11) + F(10) = 0,1 + 0 = 0,1 På denne måde kan vi finde den kumulative sandsynlighedsfunktion, F(x), for dette specifikke eksempel. Den er vist i figur 4.3. Grafen for en kumulativ sandsynlighedsfunktion for en kontinuert stoka stisk variabel kan have mange forskellige former. Fælles for dem alle er dog, at de er kontinuerte (ubrudte). 4.4 Kontinuert stokastisk variabel 91

20 4.4.2 Tæthedsfunktionen I afsnit viste vi, at den kumulative sandsynlighedsfunktion for en di skret stokastisk variabel var en trappefunktion, hvor afstanden mellem to trin svarede til sandsynligheden for værdien i punktet mellem trinnene. Den kumulative sandsynlig hedsfunktion, F, er derimod kontinuert (ubrudt) for kontinuerte stokastiske variabler. Til gengæld kan vi bruge hældningen af F til at sige noget om, hvor meget den kumulative sandsynlighed ændrer sig, når x øges. Hældningen af F(x) beteg nes med f(x) og kaldes tæthedsfunktionen. Her er der en oplagt mulighed for forvirring, fordi vi også brugte f(x) til at betegne sandsynlighedsfunktionen for en diskret stokastisk variabel. Traditionen foreskriver imidlertid denne notation, og som regel er det ikke noget problem, fordi man i et givet tilfælde er klar over, om en stokastisk variabel er diskret eller kontinuert, og dermed om f(x) er en sandsynlighedsfunktion eller en tæthedsfunktion. Eksempel 4.14: Vareproduktion del 3 I figur 4.3 har vi også afbildet tæthedsfunktionen for vareeksemplet. Da tæthedsfunktionen er lig med hældningen af F(x), og da denne er konstant lig med 0,1, så er tæthedsfunktionen flad mellem 10 og 20. Dette skyldes, at vi antog, at alle intervaller af samme længde skulle være lige sandsynlige. Bemærk, at are alet under tæthedsfunktionen er lig med 0,1 10 = 1. Dette er ikke tilfældigt. Arealet under en tæthedsfunktion er altid lig med 1, nøjagtigt som summen af sandsynligheder for en diskret stokastisk variabel skal være 1. Figur 4.3: Tæthedsfunktion og kumulativ sandsynlighedsfunktion 1 1 0,1 F(x) 0,1 f(x) x Stokastiske variabler

Sandsynlighedsregning Stokastisk variabel

Sandsynlighedsregning Stokastisk variabel Sandsynlighedsregning Stokastisk variabel I eksperimenter knyttes ofte en talværdi til hvert udfald. S s X(s) R Definition: En stokastisk variabel X er en funktion defineret på S, der antager værdier på

Læs mere

3 Usikkerhed og sandsynligheder

3 Usikkerhed og sandsynligheder 3 Usikkerhed og sandsynligheder De fleste samfundsvidenskabelige problemstillinger involverer usikkerhed. For at kunne analysere disse er det nødvendigt med en dybere forståelse af begrebet usikkerhed

Læs mere

Sandsynlighedsregning: endeligt udfaldsrum (repetition)

Sandsynlighedsregning: endeligt udfaldsrum (repetition) Program: 1. Repetition: sandsynlighedsregning 2. Sandsynlighedsregning fortsat: stokastisk variabel, sandsynlighedsfunktion/tæthed, fordelingsfunktion. 1/16 Sandsynlighedsregning: endeligt udfaldsrum (repetition)

Læs mere

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Introduktion Kasper K. Berthelsen, Inst f. Matematiske Fag Omfang: 8 Kursusgang I fremtiden

Læs mere

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium Deskriptiv (beskrivende) statistik er den disciplin, der trækker de væsentligste oplysninger ud af et ofte uoverskueligt materiale. Det sker f.eks. ved at konstruere forskellige deskriptorer, d.v.s. regnestørrelser,

Læs mere

Hvad skal vi lave i dag?

Hvad skal vi lave i dag? p. 1/2 Hvad skal vi lave i dag? Eksempler på stokastiske variable. Ventetid på krone ved møntkast. Antal plat ved n kast. Antal radioaktive henfald. Ventetiden på en flyulykke. Udtrækning af tal i et interval.

Læs mere

Dagens program. Afsnit Diskrete stokastiske variable Sandsynlighedsfunktioner Simultane fordelinger Betingede sandsynligheder

Dagens program. Afsnit Diskrete stokastiske variable Sandsynlighedsfunktioner Simultane fordelinger Betingede sandsynligheder Dagens program Afsnit 2.1-2.3 Diskrete stokastiske variable Sandsynlighedsfunktioner Simultane fordelinger Betingede sandsynligheder 1 Stokastiske variable (diskrete) Et eksperiment med usikkerhed beskrives

Læs mere

Allan C. Malmberg. Terningkast

Allan C. Malmberg. Terningkast Allan C. Malmberg Terningkast INFA 2008 Programmet Terning Terning er et INFA-program tilrettelagt med henblik på elever i 8. - 10. klasse som har særlig interesse i at arbejde med situationer af chancemæssig

Læs mere

Kapitlet indledes med en beskrivelse af - og opgaver med - de tre former for sandsynlighed, som er omtalt i læseplanen for 7.- 9.

Kapitlet indledes med en beskrivelse af - og opgaver med - de tre former for sandsynlighed, som er omtalt i læseplanen for 7.- 9. Kapitlet indledes med en beskrivelse af - og opgaver med - de tre former for sandsynlighed, som er omtalt i læseplanen for 7.- 9. klassetrin: statistisk sandsynlighed, kombinatorisk sandsynlighed og personlig

Læs mere

Kombinatorik. Eksempel 2: En mand har 7 par bukser og 10 skjorter. Skal han både vælge en skjorte og et par bukser, så har han 10. 7=70 mulige valg.

Kombinatorik. Eksempel 2: En mand har 7 par bukser og 10 skjorter. Skal han både vælge en skjorte og et par bukser, så har han 10. 7=70 mulige valg. Noter til Biomat, 005. Kombinatorik. - eller kunsten at tælle. Alle tal i kombinatorik-afsnittet er hele og ikke-negative. Additionsprincippet enten - eller : Antag vi enten skal lave et valg med m muligheder

Læs mere

{ } { } {( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )}

{ } { } {( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )} Stokastisk eksperiment Et stokastisk eksperiment er et eksperiment, hvor vi fornuftigvis ikke på forhånd kan have en formodning om resultatet af eksperimentet. Til gengæld kan vi prøve at sige noget om,

Læs mere

Elementær sandsynlighedsregning

Elementær sandsynlighedsregning Elementær sandsynlighedsregning Sandsynlighedsbegrebet Et udfaldsrum S er mængden af alle de mulige udfald af et eksperiment. En hændelse A er en delmængde af udfaldsrummet S. Den hændelse, der ikke indeholder

Læs mere

Elementær sandsynlighedsregning

Elementær sandsynlighedsregning Elementær sandsynlighedsregning Sandsynlighedsbegrebet Et udfaldsrum S er mængden af alle de mulige udfald af et eksperiment. En hændelse A er en delmængde af udfaldsrummet S. Et sandsynlighedsmål er en

Læs mere

Lineære modeller. Taxakørsel: Et taxa selskab tager 15 kr. pr. km man kører i deres taxa. Hvis vi kører 2 km i taxaen koster turen altså

Lineære modeller. Taxakørsel: Et taxa selskab tager 15 kr. pr. km man kører i deres taxa. Hvis vi kører 2 km i taxaen koster turen altså Lineære modeller Opg.1 Taxakørsel: Et taxa selskab tager 15 kr. pr. km man kører i deres taxa. Hvis vi kører 2 km i taxaen koster turen altså Hvor meget koster det at køre så at køre 10 km i Taxaen? Sammenhængen

Læs mere

Kvantitative Metoder 1 - Efterår 2006. Dagens program

Kvantitative Metoder 1 - Efterår 2006. Dagens program Dagens program Afsnit 1.7-1.8 Fødselsdagseksemplet, fra sidst Eksperimenterikkealleerligesandsynlige Diskrete sandsynlighedsfordelinger -Definition af sandsynligheder - Regneregler Hvad er sandsynligheder?

Læs mere

Statistik Lektion 2. Betinget sandsynlighed Bayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV Binomialfordelingen

Statistik Lektion 2. Betinget sandsynlighed Bayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV Binomialfordelingen Statistik Lektion etinget sandsynlighed ayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV inomialfordelingen Repetition Udfaldsrum S Hændelse S Simpel hændelse O i 1, 3 4,

Læs mere

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen Statistik Lektion 3 Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen Repetition En stokastisk variabel er en funktion defineret på S (udfaldsrummet, der antager

Læs mere

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Anvendt Statistik Lektion 2 Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Sandsynlighed: Opvarmning Udfald Resultatet af et eksperiment kaldes et udfald. Eksempler:

Læs mere

Sandsynlighedsregning 10. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 10. forelæsning Bo Friis Nielsen Sandsynlighedsregning 10. forelæsning Bo Friis Nielsen Matematik og Computer Science Danmarks Tekniske Universitet 2800 Kgs. Lyngby Danmark Email: bfni@dtu.dk Dagens emner afsnit 6.1 og 6.2 Betingede diskrete

Læs mere

Maple 11 - Chi-i-anden test

Maple 11 - Chi-i-anden test Maple 11 - Chi-i-anden test Erik Vestergaard 2014 Indledning I dette dokument skal vi se hvordan Maple kan bruges til at løse opgaver indenfor χ 2 tests: χ 2 - Goodness of fit test samt χ 2 -uafhængighedstest.

Læs mere

Sandsynlighedsregning 10. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 10. forelæsning Bo Friis Nielsen Sandsynlighedsregning 10. forelæsning Bo Friis Nielsen Matematik og Computer Science Danmarks Tekniske Universitet 2800 Kgs. Lyngby Danmark Email: bfni@dtu.dk Dagens emner afsnit 6.1 og 6.2 Betingede diskrete

Læs mere

Sandsynlighedsregning 10. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 10. forelæsning Bo Friis Nielsen Sandsynlighedsregning 0. forelæsning Bo Friis Nielsen Matematik og Computer Science Danmarks Tekniske Universitet 800 Kgs. Lyngby Danmark Email: bfni@dtu.dk Dagens emner afsnit 6. og 6. Betingede diskrete

Læs mere

Statistik Lektion 2. Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var.

Statistik Lektion 2. Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var. Statistik Lektion Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var. Repetition Stikprøve Stikprøvestørrelse n Stikprøvemiddelværdi Stikprøvevarians s Population

Læs mere

Lad os som eksempel se på samtidigt kast med en terning og en mønt:

Lad os som eksempel se på samtidigt kast med en terning og en mønt: SANDSYNLIGHEDSREGNING Stokastisk eksperiment Et stokastisk eksperiment er et eksperiment, hvor vi fornuftigvis ikke på forhånd kan have en formodning om resultatet af eksperimentet Til gengæld kan vi prøve

Læs mere

Tjek. lønnen. Et værktøj til at undersøge ligeløn på arbejdspladser inden for det grønne område og transportsektoren. 2007 udgave Varenr.

Tjek. lønnen. Et værktøj til at undersøge ligeløn på arbejdspladser inden for det grønne område og transportsektoren. 2007 udgave Varenr. Tjek lønnen Et værktøj til at undersøge ligeløn på arbejdspladser inden for det grønne område og transportsektoren 2007 udgave Varenr. 7522 Indholdsfortegnelse Forord... 3 Teknisk introduktion... 4 Indledning...

Læs mere

Nanostatistik: Stokastisk variabel

Nanostatistik: Stokastisk variabel Nanostatistik: Stokastisk variabel JLJ Nanostatistik: Stokastisk variabel p. 1/34 Repetition Ω: udfaldsrummet: alle de mulige udfald af et experiment P(A): ss for hændelsen A = frekvens i uafhængige gentagelser

Læs mere

Nanostatistik: Stokastisk variabel

Nanostatistik: Stokastisk variabel Nanostatistik: Stokastisk variabel JLJ Nanostatistik: Stokastisk variabel p. 1/29 Repetition Ω: udfaldsrummet: alle de mulige udfald af et experiment P(A): ss for hændelsen A = frekvens i uafhængige gentagelser

Læs mere

Valgkampens og valgets matematik

Valgkampens og valgets matematik Ungdommens Naturvidenskabelige Forening: Valgkampens og valgets matematik Rune Stubager, ph.d., lektor, Institut for Statskundskab, Aarhus Universitet Disposition Meningsmålinger Hvorfor kan vi stole på

Læs mere

i x-aksens retning, så fås ). Forskriften for g fås altså ved i forskriften for f at udskifte alle forekomster af x med x x 0

i x-aksens retning, så fås ). Forskriften for g fås altså ved i forskriften for f at udskifte alle forekomster af x med x x 0 BAndengradspolynomier Et polynomium er en funktion på formen f ( ) = an + an + a+ a, hvor ai R kaldes polynomiets koefficienter. Graden af et polynomium er lig med den højeste potens af, for hvilket den

Læs mere

Normalfordelingen og Stikprøvefordelinger

Normalfordelingen og Stikprøvefordelinger Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger

Læs mere

Kvantitative Metoder 1 - Forår 2007. Dagens program

Kvantitative Metoder 1 - Forår 2007. Dagens program Dagens program Hypoteser: kap: 10.1-10.2 Eksempler på Maximum likelihood analyser kap 9.10 Test Hypoteser kap. 10.1 Testprocedure kap 10.2 Teststørrelsen Testsandsynlighed 1 Estimationsmetoder Kvantitative

Læs mere

Dokumentation af programmering i Python 2.75

Dokumentation af programmering i Python 2.75 Dokumentation af programmering i Python 2.75 Af: Alexander Bergendorff Jeg vil i dette dokument, dokumentere det arbejde jeg har lavet i løbet opstarts forløbet i Programmering C. Jeg vil forsøge, så vidt

Læs mere

Repetition Stokastisk variabel

Repetition Stokastisk variabel Repetition Stokastisk variabel Diskret stokastisk variabel Udfaldsrum endelige eller tællelige mange antal elementer Sandsynlighedsfunktion f(x) er ofte tabellagt Udregning af sandsynligheder P( a < X

Læs mere

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Anvendt Statistik Lektion 2 Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Sandsynlighed: Opvarmning Udfald Resultatet af et eksperiment kaldes et udfald. Eksempler:

Læs mere

Note om Monte Carlo metoden

Note om Monte Carlo metoden Note om Monte Carlo metoden Kasper K. Berthelsen Version 1.2 25. marts 2014 1 Introduktion Betegnelsen Monte Carlo dækker over en lang række metoder. Fælles for disse metoder er, at de anvendes til at

Læs mere

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable Landmålingens fejlteori - lidt om kurset Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet Kursusholder

Læs mere

Kapitel 4 Sandsynlighed og statistiske modeller

Kapitel 4 Sandsynlighed og statistiske modeller Kapitel 4 Sandsynlighed og statistiske modeller Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 Indledning 2 Sandsynlighed i binomialfordelingen 3 Normalfordelingen 4 Modelkontrol

Læs mere

Simulering af stokastiske fænomener med Excel

Simulering af stokastiske fænomener med Excel Simulering af stokastiske fænomener med Excel John Andersen, Læreruddannelsen i Aarhus, VIA Det kan være en ret krævende læreproces at udvikle fornemmelse for mange begreber fra sandsynlighedsregningen

Læs mere

Øvelse 10. Tobias Markeprand. 11. november 2008

Øvelse 10. Tobias Markeprand. 11. november 2008 Øvelse 10 Tobias Markeprand 11. november 2008 Kapitel 10 i Blanchard omhandler vækst, dvs. økonomien på det lange sigt. For at kunne foretage analyser af vækst og dets årsager må man kunne sammenligne

Læs mere

Kvantitative Metoder 1 - Efterår 2006. Dagens program

Kvantitative Metoder 1 - Efterår 2006. Dagens program Dagens program Afsnit 2.4-2.5 Bayes sætning Uafhængige stokastiske variable - Simultane fordelinger - Marginale fordelinger - Betingede fordelinger Uafhængige hændelser - Indikatorvariable Afledte stokastiske

Læs mere

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet 1/41 Landmålingens fejlteori - lidt om kurset

Læs mere

Gennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP()

Gennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP() Gennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP() John Andersen, Læreruddannelsen i Aarhus, VIA Et kast med 10 terninger gav følgende udfald Fig. 1 Result of rolling 10 dices

Læs mere

Statistik i basketball

Statistik i basketball En note til opgaveskrivning jerome@falconbasket.dk 4. marts 200 Indledning I Falcon og andre klubber er der en del gymnasieelever, der på et tidspunkt i løbet af deres gymnasietid skal skrive en større

Læs mere

Indblik i statistik - for samfundsvidenskab

Indblik i statistik - for samfundsvidenskab Indblik i statistik - for samfundsvidenskab Læs mere om nye titler fra Academica på www.academica.dk Nikolaj Malchow-Møller og Allan H. Würtz Indblik i statistik for samfundsvidenskab Academica Indblik

Læs mere

For nemheds skyld: m = 2, dvs. interesseret i fordeling af X 1 og X 2. Nemt at generalisere til vilkårligt m.

For nemheds skyld: m = 2, dvs. interesseret i fordeling af X 1 og X 2. Nemt at generalisere til vilkårligt m. 1 Uge 11 Teoretisk Statistik 8. marts 2004 Kapitel 3: Fordeling af en stokastisk variabel, X Kapitel 4: Fordeling af flere stokastiske variable, X 1,,X m (på en gang). NB: X 1,,X m kan være gentagne observationer

Læs mere

Tjek. lønnen. Et værktøj til at undersøge lokal løndannelse og ligeløn på offentlige arbejdspladser. 2007 udgave Varenr. 7520

Tjek. lønnen. Et værktøj til at undersøge lokal løndannelse og ligeløn på offentlige arbejdspladser. 2007 udgave Varenr. 7520 Tjek lønnen Et værktøj til at undersøge lokal løndannelse og ligeløn på offentlige arbejdspladser 2007 udgave Varenr. 7520 Indholdsfortegnelse Forord... 3 Teknisk introduktion... 4 Indledning... 5 Introduktion

Læs mere

Monotoniforhold Der gælder følgende sætninger om en differentiabel funktions monotoniforhold:

Monotoniforhold Der gælder følgende sætninger om en differentiabel funktions monotoniforhold: Side 21 Oversigt over undervisningen i matematik - 2x 05/06 Der undervises efter: Claus Jessen, Peter Møller og Flemming Mørk : Tal, Geometri og funktioner. Gyldendal 1997 Claus Jessen, Peter Møller og

Læs mere

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 19. december 2012 Kursus nr : 02405. (navn) (underskrift) (bord nr)

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 19. december 2012 Kursus nr : 02405. (navn) (underskrift) (bord nr) DANMARKS TEKNISKE UNIVERSITET Side af 7 sider Skriftlig prøve, den: 9. december 0 Kursus nr : 0405 Kursus navn: Sandsynlighedsregning Varighed : 4 timer Tilladte hjælpemidler: Alle Dette sæt er besvaret

Læs mere

Algebra INTRO. I kapitlet arbejdes med følgende centrale matematiske begreber:

Algebra INTRO. I kapitlet arbejdes med følgende centrale matematiske begreber: INTRO Kapitlet sætter fokus på algebra, som er den del af matematikkens sprog, hvor vi anvender variable. Algebra indgår i flere af bogens kapitler, men hensigten med dette kapitel er, at eleverne udvikler

Læs mere

Differentialligninger. Ib Michelsen

Differentialligninger. Ib Michelsen Differentialligninger Ib Michelsen Ikast 203 2 Indholdsfortegnelse Indholdsfortegnelse Indholdsfortegnelse...2 Ligninger og løsninger...3 Indledning...3 Lineære differentialligninger af første orden...3

Læs mere

Sandsynlighedsregning & Statistik

Sandsynlighedsregning & Statistik Jørgen Larsen Sandsynlighedsregning & Statistik for matematikstuderende 2006 Indhold Forord 5 Del I Sandsynlighedsregning 7 Indledning 9 Endelige udfaldsrum. Grundlæggende definitioner.....................

Læs mere

Modul 2: Sandsynlighedsmodeller og diskrete stokastiske variable

Modul 2: Sandsynlighedsmodeller og diskrete stokastiske variable Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 2: Sandsynlighedsmodeller og diskrete stokastiske variable 2.1 Sandsynlighedsbegrebet............................... 1 2.1.1

Læs mere

Kvantitative Metoder 1 - Forår 2007

Kvantitative Metoder 1 - Forår 2007 Dagens program Afsnit 3.3-3.5 Varians Eksempel: Forventet nytte Kovarians og korrelation Middelværdi og varians af summer af stokastiske variabler Eksempel: Porteføljevalg 1 Beskrivelse af fordelinger

Læs mere

Vejledende løsninger til opgaver i kapitel 6

Vejledende løsninger til opgaver i kapitel 6 Vejledende løsninger til opgaver i kapitel Opgave 1: a) Den stokastiske variabel, X, der angiver, om en elev består, X = 1, eller dumper, X =, sin eksamen i statistik. b) En binomialfordelt variabel fremkommer

Læs mere

Kapitel 4 Sandsynlighed og statistiske modeller

Kapitel 4 Sandsynlighed og statistiske modeller Kapitel 4 Sandsynlighed og statistiske modeller Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 22 Generalisering fra stikprøve til population Idé: Opstil en model for populationen

Læs mere

Note til styrkefunktionen

Note til styrkefunktionen Teoretisk Statistik. årsprøve Note til styrkefunktionen Først er det vigtigt at gøre sig klart, at når man laver statistiske test, så kan man begå to forskellige typer af fejl: Type fejl: At forkaste H

Læs mere

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable Normal fordelingen Normal fordelingen Egenskaber ved normalfordelingen Standard normal fordelingen Find sandsynligheder ud fra tabel Transformation af normal fordelte variable Invers transformation Repetition

Læs mere

Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1)

Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1) ; C ED 6 > Billedbehandling og mønstergenkendelse Lidt elementær statistik (version 1) Klaus Hansen 24 september 2003 1 Elementære empiriske mål Hvis vi har observationer kan vi udregne gennemsnit og varians

Læs mere

Fig. 1 Billede af de 60 terninger på mit skrivebord

Fig. 1 Billede af de 60 terninger på mit skrivebord Simulation af χ 2 - fordeling John Andersen Introduktion En dag kastede jeg 60 terninger Fig. 1 Billede af de 60 terninger på mit skrivebord For at danne mig et billede af hyppighederne flyttede jeg rundt

Læs mere

Definition. Definitioner

Definition. Definitioner Definition Landmålingens fejlteori Lektion Diskrete stokastiske variable En reel funktion defineret på et udfaldsrum (med sandsynlighedsfordeling) kaldes en stokastisk variabel. - kkb@math.aau.dk http://people.math.aau.dk/

Læs mere

Kvantitative Metoder 1 - Efterår Dagens program

Kvantitative Metoder 1 - Efterår Dagens program Dagens program Afsnit 3.1-3.2 Middelværdi -Definition - Regneregler Betinget middelværdi Middelværdier af funktioner af stokastiske variable Loven om den itererede middelværdi Eksempler 1 Beskrivelse af

Læs mere

Hvad skal vi lave i dag?

Hvad skal vi lave i dag? p. 1/1 Hvad skal vi lave i dag? Repeterer lidt om diskrete sv. Standardfordelinger (binomial, Poisson, geometrisk) Stokastiske vektorer Diskrete stokastiske vektorer p. 2/1 Repetition Heltallige sv er

Læs mere

Differentialregning Infinitesimalregning

Differentialregning Infinitesimalregning Udgave 2.1 Differentialregning Infinitesimalregning Noterne gennemgår begreberne differentialregning, og anskuer dette som et derligere redskab til vækst og funktioner. Noterne er supplement til kapitel

Læs mere

Kvantitative Metoder 1 - Forår Dagens program

Kvantitative Metoder 1 - Forår Dagens program Dagens program Afsnit 3.1-3.2 Middelværdi -Definition - Regneregler Betinget middelværdi Middelværdier af funktioner af stokastiske variabler Loven om den itererede middelværdi Eksempler 1 Beskrivelse

Læs mere

3 Stokastiske variable 3.1 Diskrete variable

3 Stokastiske variable 3.1 Diskrete variable 3 Stokastiske variable 3.1 Diskrete variable Punktsandsnligheden benævnes P(x) = P(X = x). {x, P(x)} er en sandsnlighedsfordeling for den stokastiske variabel, X, hvis 1) P(x) $ 0 for alle værdier af x.

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination

Læs mere

Værktøjshjælp for TI-Nspire CAS Struktur for appendiks:

Værktøjshjælp for TI-Nspire CAS Struktur for appendiks: Værktøjshjælp for TI-Nspire CAS Struktur for appendiks: Til hvert af de gennemgåede værktøjer findes der 5 afsnit. De enkelte afsnit kan læses uafhængigt af hinanden. Der forudsættes et elementært kendskab

Læs mere

SANDSYNLIGHED FACIT SIDE 154-155

SANDSYNLIGHED FACIT SIDE 154-155 SIDE 154-155 Opgave 1 A. Data (x) h(x) f(x) 2 1 0,042 3 3 0,125 4 6 0,25 5 3 0,125 6 4 0,16 7 1 0,042 8 2 0,0833 9 1 0,042 10 2 0,0833 11 1 0,042 B. C. Diagrammet (et søjlediagram) er lavet ud fra hyppigheden,

Læs mere

INSTITUT FOR MATEMATISKE FAG c

INSTITUT FOR MATEMATISKE FAG c INSTITUT FOR MATEMATISKE FAG c AALBORG UNIVERSITET FREDRIK BAJERS VEJ 7 G 9220 AALBORG ØST Tlf.: 96 35 89 27 URL: www.math.aau.dk Fax: 98 15 81 29 E-mail: bjh@math.aau.dk Dataanalyse Sandsynlighed og stokastiske

Læs mere

Simulering af stokastiske fænomener med Excel

Simulering af stokastiske fænomener med Excel Simulering af stokastiske fænomener med Excel John Andersen, Læreruddannelsen i Aarhus, VIA Det kan være en ret krævende læreproces at udvikle fornemmelse for mange begreber fra sandsynlighedsregningen

Læs mere

Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen

Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen Repetition Lov om total sandsynlighed Bayes sætning P( B A) = P(A) = P(AI B) + P(AI P( A B) P( B) P( A B) P( B) +

Læs mere

Først falder den med 20% af 100 = 20 kr, dernæst stiger den med 30% af 80 = 24 kr. Der er 91 dage mellem datoerne, svarende til 13 uger.

Først falder den med 20% af 100 = 20 kr, dernæst stiger den med 30% af 80 = 24 kr. Der er 91 dage mellem datoerne, svarende til 13 uger. ud af deltagere må være børn, da der er dobbelt så mange børn som voksne. Derfor er der i alt børn med på skovturen. ud af børn må være piger, da der er dobbelt så mange piger som drenge. Det vil sige,

Læs mere

Forelæsning 2: Kapitel 4, Diskrete fordelinger

Forelæsning 2: Kapitel 4, Diskrete fordelinger Kursus 02402 Introduktion til Statistik Forelæsning 2: Kapitel 4, Diskrete fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Kvantitative Metoder 1 - Forår 2007. Dagens program

Kvantitative Metoder 1 - Forår 2007. Dagens program Dagens program Approksimation af binomialsandsynligheder, Afsnit 4.5 Poisson fordeling og Poisson process, Afsnit 4.6 Kontinuerte fordelinger, Afsnit 5.1-5.2: - Fordelingsfunktion - Tæthedsfunktion - Eksempel:

Læs mere

Sandsynlighedsregning 2. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 2. forelæsning Bo Friis Nielsen Vigtigste nye emner i.,. og.5 Sandsynlighedsregning. forelæsning Bo Friis Nielsen Anvendt Matematik og Computer Siene Danmarks Tekniske Universitet 800 Kgs. Lyngby Danmark Email: bfni@dtu.dk Binomialfordelingen

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable Kursus 02402 Introduktion til Statistik Forelæsning 2: Kapitel 4, Diskrete fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Rapport Bjælken. Derefter lavede vi en oversigt, som viste alle løsningerne og forklarede, hvad der gør, at de er forskellige/ens.

Rapport Bjælken. Derefter lavede vi en oversigt, som viste alle løsningerne og forklarede, hvad der gør, at de er forskellige/ens. Rapport Bjælken Indledning Vi arbejdede med opgaverne i grupper. En gruppe lavede en tabel, som de undersøgte og fandt en regel. De andre grupper havde studeret tegninger af bjælker med forskellige længder,

Læs mere

4 Oversigt over kapitel 4

4 Oversigt over kapitel 4 IMM, 2002-09-14 Poul Thyregod 4 Oversigt over kapitel 4 Introduktion Hidtil har vi beskæftiget os med data. Når data repræsenterer gentagne observationer (i bred forstand) af et fænomen, kan det være bekvemt

Læs mere

enige i, at der er et godt psykisk arbejdsmiljø. For begge enige i, at arbejdsmiljøet er godt. Hovedparten af sikkerhedsrepræsentanterne

enige i, at der er et godt psykisk arbejdsmiljø. For begge enige i, at arbejdsmiljøet er godt. Hovedparten af sikkerhedsrepræsentanterne 3. ARBEJDSMILJØET OG ARBEJDSMILJØARBEJDET I dette afsnit beskrives arbejdsmiljøet og arbejdsmiljøarbejdet på de fem FTF-områder. Desuden beskrives resultaterne af arbejdsmiljøarbejdet, og det undersøges

Læs mere

Nanostatistik: Middelværdi og varians

Nanostatistik: Middelværdi og varians Nanostatistik: Middelværdi og varians JLJ Nanostatistik: Middelværdi og varians p. 1/28 Repetition Stokastisk variabel: funktion fra udfaldsrum over i de hele tal eller over i de reelle tal Ex: Ω = alle

Læs mere

Et oplæg til dokumentation og evaluering

Et oplæg til dokumentation og evaluering Et oplæg til dokumentation og evaluering Grundlæggende teori Side 1 af 11 Teoretisk grundlag for metode og dokumentation: )...3 Indsamling af data:...4 Forskellige måder at angribe undersøgelsen på:...6

Læs mere

Statistik. Hjemmeside: kkb. Statistik - lektion 1 p.1/22

Statistik. Hjemmeside:  kkb. Statistik - lektion 1 p.1/22 Statistik Kursets omfang: 2 ECTS Inklusiv mini-projekt! Bog: Complete Business Statistics, AD Aczel & J. Sounderpandian Software: SPSS eller Excel?? Forelæser: Kasper K. Berthelsen E-mail: kkb@math.aau.dk

Læs mere

TØ-opgaver til uge 46

TØ-opgaver til uge 46 TØ-opgaver til uge 46 Først laver vi en liste over de ligninger med mere i [ITP], der skal bruges: [1]: Ligning (2.5) på side 4. [2]: Sætning 3.1, ligning (3.3) på side 7. [3]: Sætning 3.1, ligning (3.4)

Læs mere

Vinderseminar 2007. Diskret matematik. Kirsten Rosenkilde. 1. Diskret matematik.

Vinderseminar 2007. Diskret matematik. Kirsten Rosenkilde. 1. Diskret matematik. Vinderseminar 2007. Diskret matematik. Kirsten Rosenkilde. 1 1 Paritet Diskret matematik. I mange matematikopgaver er det en god ide at se på paritet dvs. hvornår en bestemt størrelse er henholdsvis lige

Læs mere

L Æ R I N G S H I S T O R I E

L Æ R I N G S H I S T O R I E LÆRINGS HISTORIE LÆRINGS HISTORIE Kom godt i gang Før I går i gang med at arbejde med dokumentationsmetoderne, er det vigtigt, at I læser folderen Kom godt i gang med værktøjskassen. I folderen gives en

Læs mere

7 QNL 2PYHQGWSURSRUWLRQDOLWHW +27I\VLN. 1 Intro I hvilket af de to glas er der mest plads til vand?: Hvorfor?:

7 QNL 2PYHQGWSURSRUWLRQDOLWHW +27I\VLN. 1 Intro I hvilket af de to glas er der mest plads til vand?: Hvorfor?: 1 Intro I hvilket af de to glas er der mest plads til vand?: Hvorfor?: Angiv de variable: Check din forventning ved at hælde lige store mængder vand i to glas med henholdsvis store og små kugler. Hvor

Læs mere

6. Regression. Hayati Balo,AAMS. 1. Nils Victor-Jensen, Matematik for adgangskursus, B-niveau 1

6. Regression. Hayati Balo,AAMS. 1. Nils Victor-Jensen, Matematik for adgangskursus, B-niveau 1 6. Regression Hayati Balo,AAMS Følgende fremstilling er baseret på 1. Nils Victor-Jensen, Matematik for adgangskursus, B-niveau 1 6.0 Indledning til funktioner eller matematiske modeller Mange gange kan

Læs mere

Store gevinster af at uddanne de tabte unge

Store gevinster af at uddanne de tabte unge Store gevinster af at uddanne de tabte unge Gennem de senere år har der været stor diskussion om, hvor stor gevinsten vil være ved at uddanne den gruppe af unge, som i dag ikke får en uddannelse. Nye studier

Læs mere

Kom i gang-opgaver til differentialregning

Kom i gang-opgaver til differentialregning Kom i gang-opgaver til differentialregning 00 Karsten Juul Det er kortsigtet at løse en opgave ved blot at udskifte tallene i en besvarelse af en tilsvarende opgave Dette skyldes at man så normalt ikke

Læs mere

Betingede sandsynligheder Aase D. Madsen

Betingede sandsynligheder Aase D. Madsen 1 Uge 12 Teoretisk Statistik 15. marts 2004 1. Betingede sandsynligheder Definition Loven om den totale sandsynlighed Bayes formel 2. Betinget middelværdi og varians 3. Kovarians og korrelationskoefficient

Læs mere

Varmeligningen og cosinuspolynomier.

Varmeligningen og cosinuspolynomier. Varmeligningen og cosinuspolynomier. Projekt for MM50 Marts 009 Hans J. Munkholm 0. Praktiske oplysninger Dette projekt besvares af de studerende, som er tilmeldt eksamen i MM50 uden at være tilmeldt eksamen

Læs mere

Oversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Oversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger Introduktion til Statistik Forelæsning 2: og diskrete fordelinger Oversigt 1 2 3 Fordelingsfunktion 4 Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 017 Danmarks Tekniske Universitet 2800

Læs mere

Faglig læsning i matematik

Faglig læsning i matematik Faglig læsning i matematik af Heidi Kristiansen 1.1 Faglig læsning en matematisk arbejdsmåde Der har i de senere år været sat megen fokus på, at danske elever skal blive bedre til at læse. Tidligere har

Læs mere

Uendelige rækker og Taylor-rækker

Uendelige rækker og Taylor-rækker Uendelige rækker og Taylor-rækker Thomas Bolander, DTU Informatik Matematik: Videnskaben om det uendelige Folkeuniversitetet i København, efteråret 200 Thomas Bolander, FUKBH 0 s. /24 Forhold mellem endelighed

Læs mere

4. september 2003. π B = Lungefunktions data fra tirsdags Gennemsnit l/min

4. september 2003. π B = Lungefunktions data fra tirsdags Gennemsnit l/min Epidemiologi og biostatistik Uge, torsdag 28. august 2003 Morten Frydenberg, Institut for Biostatistik. og hoste estimation sikkerhedsintervaller antagelr Normalfordelingen Prædiktion Statistisk test (udfra

Læs mere

Om at løse problemer En opgave-workshop Beregnelighed og kompleksitet

Om at løse problemer En opgave-workshop Beregnelighed og kompleksitet Om at løse problemer En opgave-workshop Beregnelighed og kompleksitet Hans Hüttel 27. oktober 2004 Mathematics, you see, is not a spectator sport. To understand mathematics means to be able to do mathematics.

Læs mere

At lave dit eget spørgeskema

At lave dit eget spørgeskema At lave dit eget spørgeskema 1 Lectio... 2 2. Spørgeskemaer i Google Docs... 2 3. Anvendelighed af din undersøgelse - målbare variable... 4 Repræsentativitet... 4 Fejlkilder: Målefejl - Systematiske fejl-

Læs mere

Talrækker. Aktivitet Emne Klassetrin Side

Talrækker. Aktivitet Emne Klassetrin Side VisiRegn ideer 3 Talrækker Inge B. Larsen ibl@dpu.dk INFA juli 2001 Indhold: Aktivitet Emne Klassetrin Side Vejledning til Talrækker 2-4 Elevaktiviteter til Talrækker 3.1 Talrækker (1) M-Æ 5-9 3.2 Hanoi-spillet

Læs mere

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007 Rettevejledning til eksamen i Kvantitative metoder 1,. årsprøve. januar 007 I rettevejledningen henvises der til Berry and Lindgren "Statistics Theory and methods"(b&l) hvis ikke andet er nævnt. Opgave

Læs mere