Supplement til kapitel 4 Om sandsynlighedsmodeller for flere stokastiske variable

Størrelse: px
Starte visningen fra side:

Download "Supplement til kapitel 4 Om sandsynlighedsmodeller for flere stokastiske variable"

Transkript

1 IMM, Poul Thyregod Supplement til kapitel 4 Om sandsynlighedsmodeller for flere stokastiske variable Todimensionale stokastiske variable Lærebogens afsnit 4 introducerede sandsynlighedsmodeller formuleret ved stokastiske variable. I afsnittet betragtede man også fordelinger for flere end én stokastisk variabel (fx når man betragtede fordelingen af summer mv), men kun under antagelse af at de indgående stokastiske variable var uafhængige. I denne note vil vi udvide nogle af betragtningerne fra afsnit 4 til at omfatte fordelinger af flere stokastiske variable, der ikke nødvendigvis er uafhængige. Vi vil fortrinsvis betragte fordelinger af to stokastiske variable, X og Y. Simultan tæthedsfunktion I analogi med tæthedsfunktionen (probability density function, side 75) for en endimensional kontinuert stokastisk variabel, kan man indføre den simultane tæthedsfunktion for en flerdimensional stokastisk variabel. Den simultane tæthedsfunktion for en todimensional stokastisk variabel (X, Y ) er en funktion, p X,Y (x, y), defineret for alle reelle talpar (x, y) som opfylder p X,Y (x, y) 0 p X,Y (x, y)dydx =

2 For to vilkårlige talpar, (a, b) og(c, d) meda<bog c<dgælder b [ d P[{a <X b} {c<y d}= p X,Y (x, y)dy dx Sandsynligheden bestemmes altså som et volumen under den flade, der er angivet ved tæthedsfunktionen. Specielt har man de marginale sandsynligheder for X, b [ P[a <X b=p[{a<x b} {<Y < } = og den marginale tæthedsfunktion for X p X (x) = a p X,Y (x, y)dy c a p X,Y (x, y)dy som fås ved at flytte den todimensionale sandsynlighedsmasse ud i margenen. dx Stokastisk uafhængighed Definitionen på stokastisk uafhængighed (Petrucelli side 80) udtrykker, at stokastiske variable er uafhængige, hvis man kan bestemme sandsynligheder i den simultane fordeling ud fra de marginale sandsynlighedsfordelinger. Momenter Det følger af betragtningerne om de marginale sandsynligheder, at det er underordnet om man bestemmer middelværdier og varianser for X og Y (µ X,σX og µ Y,σY ) i den simultane fordeling, eller i de marginale fordelinger. Man indfører kovariansen (covariance) mellem X og Y som COV[X, Y =E[(X µ X )(Y µ Y ) = Ofte bruges symbolet σ XY for kovariansen mellem X og Y. (x µ X )(y µ Y )p X,Y (x, y)dydx

3 Vi bemærker, at kovariansen mellem X og Y er den samme som kovariansen mellem Y og X. Kovariansen måles i enheden for X gange enheden for Y. Hvis Xog Y er uafhængige, er kovariansen mellem dem nul (men det omvendte gælder ikke nødvendigvis) Undertiden opstilles varianser og kovarianser på matrixform i en såkaldt kovariansmatrix (eller dispersionsmatrix) ([ ) [( )( ) [ X X µx X µx V[X Cov[X, Y Σ = E = Y Y µ Y Y µ Y Cov[X, Y V[Y hvor angiver den transponerede (se side 5). Udtrykket generaliseres let til flere end to stokastiske variable. For vilkårlige stokastiske variable, X og Y gælder V[X ± Y =V[X+V[Y±Cov[X, Y Såfremt X og Y er uafhængige fås netop resultaterne på side 6. Korrelationskoefficient Undertiden betragtes et dimensionsløst mål for samvariationen mellem to variable, den såkaldte korrelationskoefficient. Korrelationskoefficienten, ρ (ro) mellem to stokastiske variable, X og Y defineres som ρ = Cov[X, Y = σ XY V[XV[Y σ X σ Y Det kan vises, at ρ. Den todimensionale normalfordeling Den endimensionale normalfordeling kan generaliseres til flerdimensionale variable. Lige som den endimensionale normalfordeling er parametriseret ved middelværdi og varians er den flerdimensionale normalfordeling parametriseret ved middelværdier, varianser og kovarianser for de betragtede variable. 3

4 Den todimensionale normalfordeling har tæthedsfunktionen p X,Y (x, y) = [ { π σ X σ exp (x µx ) Y ρ ( ρ ) σx ρ (x µ X)(y µ Y ) + (y µ } Y ) σ X σ Y σy hvor ρ = σ XY σ X σ Y Middelværdien for X og Y er hhv µ X og µ Y og kovariansmatricen er [ σ Σ = X σ XY σ XY Det gælder, at de betingede fordelinger (af Y givet en værdi X = x, og analogt af X givet en værdi Y = y) også er normalfordelinger. For den betingede fordeling af Y givet en værdi X = x gælder σ Y E[Y X = x = µ Y +ρ σ Y (x µ X ) σ X V[Y X = x = σy ( ρ ) Udtrykket for den betingede middelværdi knytter forbindelsen mellem korrelationskoefficienten og regressionen af Y på X. Udtrykket for den betingede varians viser, at i den todimensionale normalfordelingsmodel er variansen omkring regressionslinien konstant (den afhænger således ikke af værdien af x), og endvidere genfinder vi forklaringsgraden ( ρ ), der netop udtrykker den del af den marginale varians, σy for Y, som er forklaret af samvariationen mellem X og Y. Den k-dimensionale normalfordeling Betragt nu en k-dimensional stokastisk variabel (skrevet som søjlevektor), Y = 4 Y. Y k

5 Y siges at følge en k-dimensional normalfordeling med (den k-dimensionale) middelværdivektor µ og (den k k-dimensionale) kovariansmatrix Σ, hvis tætheden for Y kan skrives på formen p Y (y) = ( π) k Σ exp hvor Σ angiver determinanten af Σ. [ (y µ) Σ (y µ) Lineære transformationer af flerdimensionale variable Lad Y være en k-dimensional stokastisk variabel med middelværdivektor µ og kovariansmatrix Σ og lad A være en p k-dimensional matrix af konstanter, da gælder E[AY=AE[Y=Aµ og endvidere gælder, at kovariansmatricen for AY er AΣA Disse resultater benyttes i Appendix 8. Såfremt specielt Y følger en k-dimensional normalfordeling gælder at AY vil følge en p-dimensional normalfordeling med middelværdivektor og kovariansmatrix bestemt som ovenfor. Det gælder derfor specielt for den multiple regressionsmodel, µ = Xβ, at estimatoren β =(X X) X Y(8.5) følger en normalfordeling med kovariansmatricen σ( β) =σ (X X) som anført nederst på side 56. 5

µ = κ (θ); Kanonisk link, θ = g(µ) Poul Thyregod, 9. maj Specialkursus vid.stat. foraar 2005

µ = κ (θ); Kanonisk link, θ = g(µ) Poul Thyregod, 9. maj Specialkursus vid.stat. foraar 2005 Hierarkiske generaliserede lineære modeller Lee og Nelder, Biometrika (21) 88, pp 987-16 Dagens program: Mandag den 2. maj Hierarkiske generaliserede lineære modeller - Afslutning Hierarkisk generaliseret

Læs mere

Differential- regning

Differential- regning Differential- regning del () f () m l () 6 Karsten Juul Indhold Tretrinsreglen 59 Formler for differentialkvotienter64 Regneregler for differentialkvotienter67 Differentialkvotient af sammensat funktion7

Læs mere

Lær nemt! Statistik - Kompendium

Lær nemt! Statistik - Kompendium David Brink Lær nemt! Statistik - Kompendium Ventus wwwventusdk Lær nemt! Statistik - Kompendium 005 David Brink Nielsen og Ventus Download kompendiet gratis på wwwventusdk ISBN 87-7681-01-7 Ventus Falkoner

Læs mere

Arealet af en trekant Der er mange formler for arealet af en trekant. Den mest kendte er selvfølgelig

Arealet af en trekant Der er mange formler for arealet af en trekant. Den mest kendte er selvfølgelig Arealet af en trekant Der er mange formler for arealet af en trekant. Den mest kendte er selvfølgelig som også findes i en trigonometrisk variant, den såkaldte 'appelsin'-formel: Men da en trekants form

Læs mere

En Introduktion til Statistik

En Introduktion til Statistik En Introduktion til Statistik Bind 1A Knut Conradsen 7. udgave Lyngby 1999 IMM 2 Forord Med denne (foreløbige) udgave af En Introduktion til Statistik er der påbegyndt en mere gennemgribende revision af

Læs mere

Mini-formelsamling. Matematik 1

Mini-formelsamling. Matematik 1 Indholdsfortegnelse 1 Diverse nyttige regneregler... 1 1.1 Regneregler for brøker... 1 1.2 Potensregneregler... 1 1.3 Kvadratsætninger... 2 1.4 (Nogle) Rod-regneregler... 2 1.5 Den naturlige logaritme...

Læs mere

Grupperede observationer et eksempel. (begreber fra MatC genopfriskes og varians og spredning indføres)

Grupperede observationer et eksempel. (begreber fra MatC genopfriskes og varians og spredning indføres) Grupperede observationer et eksempel. (begreber fra MatC genopfriskes og varians og spredning indføres) Til Gribskovløbet 006 gennemførte 118 kvinder 1,4 km distancen. Fordelingen af kvindernes løbstider

Læs mere

Maple. Skærmbilledet. Vi starter med at se lidt nærmere på opstartsbilledet i Maple. Værktøjslinje til indtastningsområdet. Menulinje.

Maple. Skærmbilledet. Vi starter med at se lidt nærmere på opstartsbilledet i Maple. Værktøjslinje til indtastningsområdet. Menulinje. Maple Dette kapitel giver en kort introduktion til hvordan Maple 12 kan benyttes til at løse mange af de opgaver, som man bliver mødt med i matematiktimerne på HHX. Skærmbilledet Vi starter med at se lidt

Læs mere

En differentiabel funktion hvis afledte ikke er kontinuert Søren Knudby

En differentiabel funktion hvis afledte ikke er kontinuert Søren Knudby 24 En differentiabel funktion hvis afledte ikke er kontinuert Søren Knudby Det er velkendt for de fleste, at differentiabilitet af en reel funktion f medfører kontinuitet af f, mens det modsatte ikke gælder

Læs mere

Skriv punkternes koordinater i regnearket, og brug værktøjet To variabel regressionsanalyse.

Skriv punkternes koordinater i regnearket, og brug værktøjet To variabel regressionsanalyse. Opdateret 28. maj 2014. MD Ofte brugte kommandoer i Geogebra. Generelle Punktet navngives A Geogebra navngiver punktet Funktionen navngives f Funktionen navngives af Geogebra Punktet på grafen for f med

Læs mere

Bevægelse i to dimensioner

Bevægelse i to dimensioner Side af 7 Bevægelse i to dimensioner Når man beskriver bevægelse i to dimensioner, som funktion af tiden, ser man bevægelsen som var den i et almindeligt koordinatsystem (med x- og y-akse). Ud fra dette

Læs mere

Den harmoniske svingning

Den harmoniske svingning Den harmoniske svingning Teori og en anvendelse Preben Møller Henriksen Version. Noterne forudsætter kendskab til sinus og cosinus som funktioner af alle reelle tal, dvs. radiantal. I figuren nedenunder

Læs mere

Uafhængighed et eksempel på en rød tråd i statistikken

Uafhængighed et eksempel på en rød tråd i statistikken Uafhængighed et eksempel på en rød tråd i statistikken Statistiknoter til TI-Nspire CAS version 3.1 Bjørn Felsager Revideret November 2011 329 Uafhængighed et eksempel på en rød tråd i statistikken Chi-i-anden-testen

Læs mere

MATINTRO FUNKTIONER AF FLERE VARIABLE

MATINTRO FUNKTIONER AF FLERE VARIABLE MATINTRO FUNKTIONER AF FLERE VARIABLE Tore August Kro Matematisk Institutt Universitetet i Oslo 5.kapitel skrevet af: Jan Philip Solovej Institut for de Matematiske Fag Københavns Universitet Forår 3 På

Læs mere

En statistikstuderendes bekendelser Søren Wengel Mogensen

En statistikstuderendes bekendelser Søren Wengel Mogensen Oplysning 23 En statistikstuderendes bekendelser Søren Wengel Mogensen Om at skrive BSc-opgave i anvendt statistik. Der findes matematikere (i hvert fald matematikstuderende), der mener, at den rene matematik

Læs mere

INDHOLDSFORTEGNELSE. Side Indledning 2. Kapitel 1 Introduktion til funktioner af 2 variable 3 Niveaukurver 5

INDHOLDSFORTEGNELSE. Side Indledning 2. Kapitel 1 Introduktion til funktioner af 2 variable 3 Niveaukurver 5 INDHOLDSFORTEGNELSE Side Indledning Kapitel 1 Introduktion til funktioner af variable 3 Niveaukurver 5 Kapitel Partiel differentiation og gradienten 7 Kapitel 3 Differentialet 1 Fejlvurdering 13 Tangentplan

Læs mere

Kom i gang med JMP. Jens E. Overø. Gorm Gabrielsen. Statistik og analyse for økonomistuderende. Lektor i statistik. Lektor i statistik

Kom i gang med JMP. Jens E. Overø. Gorm Gabrielsen. Statistik og analyse for økonomistuderende. Lektor i statistik. Lektor i statistik Gorm Gabrielsen Lektor i statistik Jens E. Overø Lektor i statistik Kom i gang med JMP Statistik og analyse for økonomistuderende Copyright 2011 SAS Institute A/S, Copenhagen Denmark ISBN 978-87-984612-1-0

Læs mere

Om brugen af matematiske tegn og objekter i en god matematisk fremstilling

Om brugen af matematiske tegn og objekter i en god matematisk fremstilling Om brugen af matematiske tegn og objekter i en god matematisk fremstilling af Petur Birgir Petersen Et særpræg ved matematik som videnskab er den udstrakte brug af symboler. Det er vigtigt at symbolerne

Læs mere

Oversigt over Procent, absolut og relativ tilvækst samt indekstal

Oversigt over Procent, absolut og relativ tilvækst samt indekstal Oversigt over Procent, absolut og relativ tilvækst samt indekstal Indhold Oversigt over Procent, absolut og relativ tilvækst samt indekstal... 1 Procent... 1 Hvad er én procent?... 1 Procentsatser over

Læs mere

Kapital- og rentesregning

Kapital- og rentesregning Rentesregning Rettet den 28-12-11 Kapital- og rentesregning Kapital- og rentesregning Navngivning ved rentesregning I eksempler som Niels Oles, hvor man indskyder en kapital i en bank (én gang), og banken

Læs mere

Om tastaturgenveje i Noter

Om tastaturgenveje i Noter Om tastaturgenveje i Noter Lad os starte med at præcisere, hvad det er vi har I tankerne: Tastaturgenveje er genveje til at frembringe særlige symboler, særlige skabeloner, særlig layout og særlige handlinger

Læs mere

Løs nu opgaverne i a) brug alt materialet her samt evt. regnearkene i Fronter som hjælp.

Løs nu opgaverne i a) brug alt materialet her samt evt. regnearkene i Fronter som hjælp. Udarbejdet af Thomas Jensen og Morten Overgård Nielsen Indhold Introduktion til materialet. s. 2 Introduktion til chi i anden test. s. 4 Et eksempel hastighed og ulykker på motorveje s. 8 Sådan udregnes

Læs mere

Den lille hjælper. Positionssystem...3. Positive tal...3. Negative tal...3. Hele tal...3. Potenstal...3. Kvadrattal...3

Den lille hjælper. Positionssystem...3. Positive tal...3. Negative tal...3. Hele tal...3. Potenstal...3. Kvadrattal...3 Den lille hjælper Positionssystem...3 Positive tal...3 Negative tal...3 Hele tal...3 Potenstal...3 Kvadrattal...3 Parentes...4 Parentesregler...4 Primtal...4 Addition (lægge sammen) også med decimaltal...4

Læs mere

Hvad er meningen? Et forløb om opinionsundersøgelser

Hvad er meningen? Et forløb om opinionsundersøgelser Hvad er meningen? Et forløb om opinionsundersøgelser Jette Rygaard Poulsen, Frederikshavn Gymnasium og HF-kursus Hans Vestergaard, Frederikshavn Gymnasium og HF-kursus Søren Lundbye-Christensen, AAU 17-10-2004

Læs mere

De socioøkonomiske referencer for gymnasiekarakterer 2014

De socioøkonomiske referencer for gymnasiekarakterer 2014 De socioøkonomiske referencer for gymnasiekarakterer 2014 Indhold Sammenfatning... 5 Indledning... 7 Datagrundlag... 9 Elever... 9 Fag, prøveform og niveau... 9 Socioøkonomiske baggrundsvariable... 10

Læs mere

Excel-6: HVIS-funktionen

Excel-6: HVIS-funktionen Excel-6: HVIS-funktionen Regnearket Excel indeholder et væld af "funktioner" som kan bruges til forskellige ting indenfor f.eks. finans, statistik, logiske beregninger, beregninger med datoer og meget

Læs mere

Funktion af flere variable

Funktion af flere variable Funktion af flere variable Preben Alsolm 24. april 2008 1 Funktion af flere variable 1.1 Differentiabilitet for funktion af én variabel Differentiabilitet for funktion af én variabel f kaldes differentiabel

Læs mere

Vektorregning. Vektorer som lister

Vektorregning. Vektorer som lister 10 Vektorregning Vektorer som lister En vektor laves nemmest som en liste på TI-89 Titanium / Voyage 200. I nedenstående skærmbillede ser du, hvordan man definerer vektorer og laver en simpel udregning

Læs mere

Løsning af tredjegradsligningen Jens Siegstad, Kasper Fabæch Brandt og Jingyu She

Løsning af tredjegradsligningen Jens Siegstad, Kasper Fabæch Brandt og Jingyu She Substitutionernes fest 53 Løsning af tredjegradsligningen Jens Siegstad, Kasper Fabæch Brandt og Jingyu She Substitution en masse Vi vil i denne artikel vise, hvorledes man kan løse den generelle tredjegradsligning

Læs mere

Grupperet materiale kan f.eks. være befolkningsdata eller indkomstfordelinger.

Grupperet materiale kan f.eks. være befolkningsdata eller indkomstfordelinger. Thomas Jensen & Morten Overgård Nielsen At bestemme kvartilsæt Indhold - At finde kvartilsæt i ikke-grupperet datamateriale (link til dokumentet her) - At bestemme kvartilsæt ved hjælp af Excel (link til

Læs mere