Noter i fejlteori. Kasper Klitgaard Berthelsen Poul Winding & Jens Møller Pedersen. Version 1.1

Størrelse: px
Starte visningen fra side:

Download "Noter i fejlteori. Kasper Klitgaard Berthelsen Poul Winding & Jens Møller Pedersen. Version 1.1"

Transkript

1 Noter i fejlteori Kasper Klitgaard Berthelsen Poul Winding & Jens Møller Pedersen Version 1.1 April 2013

2 2

3 Indhold 1 Motivation 3 2 Det matematiske fundament Lidt sandsynlighedsregning Stokastiske variable Middelværdi og varians Normalfordelingen Tilfældig fejl Linearisering Kovarians Korrelation Matrix formulering Estimation Estimation af middelværdi og varians Estimation af kovarians og korrelation Konfidensinterval Fejlforplantning ved geometrisk nivellement Geometisk nivellement Vægte Det vægtede gennemsnit Fordeling af slutfejl Dobbeltmålinger Fejlforplantning Uafhængige stokastiske variable Linearisering Den generelle fejlforplantningslov Matrix formulering Tabeller 65 3

4 4 INDHOLD

5 Forord Denne note er en omarbejdning og udvidelse af en mere end 20 år gammel note Noter i fejlteori af Poul Winding og Jens Møller Pedersen. En særlig tak skal gå til Daniel Philip Holt for at have assisteret med konverteringen af den orginale note fra fotokopi til L A TEX. Kasper K. Berthelsen Aalborg,

6 2 INDHOLD

7 Kapitel 1 Motivation {ch:intro} Antag vi er interesserede i arealet af trekanten i Figur 1.1. Hvis vi kender vinklen α og længderne s b og s c, så kan vi bestemme arealet, A, af trekanten vha. arealformlen A = s b s c sin(α). (1.1) {eq:arealtrkant} γ s b s a α s c β Figur 1.1: En trekant. fig:trekant For at gøre situationen lidt simplere, antager vi, at vi kender længderne s b og s c. Det eneste vi skal måle er således vinklen α. Antag vi har følgende 25 målinger af α: , , , , , , , , , , , , , , , , , , , , , , , , Målingerne er også illustreret i histogrammet i figur 1.2. Gennemsnittet af de 25 målinger er Bemærk hvordan målingerne er koncentreret omkring gennemsnittet. På baggrund af målingerne hvad er da et godt bud på den sande vinkel? Det viser sig, at gennemsnittet er af målingerne er et godt bud. Som det tydeliget fremgår, så er målingen af α forbundet med en vis usikkerhed. Hvordan 3

8 4 KAPITEL 1. MOTIVATION Figur 1.2: Histogram for de 25 målinger af α. fig:alpha skal vi opgøre denne usikkerhed? Kan vi sige noget om, hvor tæt gennemsnittet er på den sande vinkel? Da bestemmelsen af α på baggrund af målinger er forbundet med en vis usikkerhed, vil areal af trekanten også være forbundet af en vis usikkerhed. Spørgmålet er hvordan usikkerheden for α påvirker usikkerheden af arealet?

9 Kapitel 2 Det matematiske fundament 2.1 Lidt sandsynlighedsregning {ch:fundament} Når man foretager en måling af fx. en længde er det forbundet med en vis usikkerhed. Et naturligt spørgsmål er, hvor stor sandsynligheden er for at målingen ligger indenfor en vis fejlmargin fra den sande længde. For at kunne svare på dette må vi starte med at præcisere hvad vi mener med sandsynlighed. Desuden skal det formuleres præcist, på hvilken måde målingerne er usikre. Betragt et eksperiment, der kan ende i et eller flere udfald. Eksperimentet kunne være at måle en given længe, hvorved udfaldet er den faktisk målte længde. Et andet eksperiment kunne være at kaste en mønt, hvor de mulige udfald er plat og krone. Vi starter med det simple tilfælde, hvor eksperimentet har to udfald, som vi betegner som succes og fiasko. Eksperimentet kunne være, at kaste med en mønt, hvor krone svarer til en succes og plat svarer til fiasko. Antag at vi gentager nøjagtigt det samme eksperiment igen og igen, og hvert eksperiment udføres uafhængigt af tidligere eksperimenter. Sandsynligheden for succes er da andelen af succeser i det lange løb. Sandsynligheden for succes betegnes P(succes). Det ses umiddelbart, at 0 P(succes) 1. Figur 2.1 viser to eksempler på, hvordan andelen af krone løbende udvikler sig efterhånden som den fair mønt kastes flere og flere gange. Da mønten er fair er andelen af krone i det lange løb 0,5, dvs. P(krone) = 0,5. Af figuren ses det, at i begge tilfælde nærmer den observerede andel sig 0,5. Da hvert eksperiment enten er en succes eller en fiasko, følger det, at sandsynligheden for fiasko er P(fiasko) = 1 P(succes). Mere generelt kan vi antage, at et eksperiment kan resulterer i en lang række udfald. Som nævnt kunne eksperimentet være at måle en længde. De mulige udfald er da alle positive reelle tal. En hændelse er en mængde af udfald. Fx. kunne en hændelse være, at den målte længde er mellem 4,71 og 4,73 meter. Sandsynligheden for denne hændelse betegnes P(måling ligger mellem 4,71 og 4,73 meter). Sandsynligheden betegner andelen af målinger, der ligger inden mellem 4,71 og 4,73, hvis vi bliver ved med 5

10 6 KAPITEL 2. DET MATEMATISKE FUNDAMENT Andel krone Antal kast Figur 2.1: Løbende andel af krone i to følger af uafhængige kast med en fair mønt. fig:ssh m:sandsynlighed} at måle længden igen og igen. Hver måling skal være foretaget under nøjagtig samme betingelser og upåvirket af tidligere målinger. Sætning 1 (Egenskaber for sandsynligheder) Lad H være en vilkårlig hændelse, da gælder der følgende regler 1. 0 P(H) 1 2. P(ej H) = 1 P(H). Hændelse ej H betegnes den komplimentære hændelsen til H, da hændelse ej H er indtræffer, hvis H ikke indtræffer. 2.2 Stokastiske variable {def:dens} I det følgende er udgangspunktet, at vi udfører et eksperiment, hvor udfaldet af eksperimentet har konverteres til et reelt tal X. Som eksempel, kunne eksperimentet være at måle vinklen α og lade X betegne målingen. Som indikeret af målingerne i Kapitel 1 er X tilfældig. Vi betegner derfor X en stokastisk variabel. Vi vil betragte en stokastisk variabel som en matematisk model for en måling der er behæftet med en (tilfældig) fejl. I denne note vil vi kun betragte stokastiske variable, der kan tage alle værdier i et interval på den reelle akse. Fx. hvis X svarer til måling af en længde, da er X [0, ). Hvis X er en vinkel målt i gon, da er X [0,400). For at beskrive på hvilken måde målingen X er tilfældig har vi brug for at definere en såkaldt tæthedsfunktion. Definition 1 (Tæthedsfunktion) En tæthedsfunktion f(x) er en reel funktion, der opfylder

11 2.2. STOKASTISKE VARIABLE 7 1. f(x) 0 for alle x R. 2. f(x)dx = 1. En tæthedsfunktion er altså en ikke-negativ funktion, hvor det totale areal under funktionen er 1. Figur 2.2 viser et eksempel på en tæthedsfunktion f(x) 2 1 x Figur 2.2: Eksempel på tæthedsfunktion. fig:density Tæthedsfunktioner bruges til at beskrives fordelingen af en stokastisk variabel: Definition 2 (Tæthedsfunktion og stokastisk variabel) En stokastisk variabel X har tæthedsfunktion f, hvis for alle par af reelle konstanter a og b, hvor a b, gælder, at sandsynligheden for, at X ligger i intervallet fra a til b er givet ved {def:sv:dens} P(a X b) = b a f(x)dx. (2.1) {eq:prob:ab} Da f(x) er ikke-negativ er sandsynligheden for at X ligger mellem a og b givet ved arealet under grafen f(x) (og over første-aksen). Arealet af det skraverede områder til venstre i Figur 2.2 svarer til sandsynligheden for at X ligger i intervallet mellem 1 og 2. Ligeledes svarer det skraverede område til højre i Figur 2.2 til sandsynligheden for at X ligger i intervallet mellem 4 og 5. Med udgangspunkt i Figur 2.2 er det klart, at P(1 X 2) er større end P(4 X 5), dvs. der er større sandsynlighed for at X ligger mellem 1 og 2 end at X ligger mellem 4 og 5. Typisk er det vanskeligt at udregne integraler som i (2.1). I stedet benytter man fordelingsfunktionen. Definition 3 (Fordelingsfunktionen) Hvis X er en stokastisk variabel med tæthedsfunktion f, så er den tilsvarende fordelingsfunktion givet ved F(x) = P(X x) = x f(t)dt.

12 8 KAPITEL 2. DET MATEMATISKE FUNDAMENT Figur 2.3 viser et eksempel på en tæthedsfunktion og den tilsvarende fordelingsfunktion. Fordelingsfunktionen F(x) svarer til det grå område i det venstre plot i figur 2.3. Da fordelingsfunktionen er et integral af en ikke-negativ funktion, følger det, at fordelingfunktionen F(x) er en ikke-aftagende funktion. Desuden gælder der at lim x F(x) = 1 og lim x = 0. f(x) F(x) 1 F(x) x x Figur 2.3: Til venstre: eksempel på tæthedsfunktion f(x). Til højre: tilsvarende fordelingsfunktion F(x). fig:densdist Sandsynligheden (2.1) kan nu skrives som {eq:prob:ab2} P(a X b) = F(b) F(a). (2.2) Fordelen ved denne formel fremfor (2.1) er at F(x) ofte er tilgængelig enten i tabelform eller vha. software. At (2.2) er korrekt ses af følgende udregning P(a X b) = = b a b f(x)dx a f(x)dx f(x)dx = F(b) = F(a). {def:uafh} I de fleste praktiske problemstillinger består en måleopgave i mere end en måling. Vi vil i det efterfølgende ofte antage at den tilfældige fejl i en måling ingen indflydelse har på den tilfældige fejl i en anden måling. Mere præcist antager vi at to målinger er uafhængige: Definition 4 (Uafhængighed) To stokastiske variable X og Y kaldes uafhængige, hvis og kun hvis P(X a,y b) = P(X a)p(y b) for alle reelle konstanter a og b. Øvelse 1 Betragte følgende funktion x når 0 x 1 f(x) = 2 x når 1 < x 2 0 ellers.

13 2.3. MIDDELVÆRDI OG VARIANS 9 1. Skitser funktionen f(x). 2. Opfylder f(x) kravene til en tæthedsfunktion? 2.3 Middelværdi og varians To vigtige karakteristika for alle stokastiske variabel, er deres middelværdi og varians. Hvis man tænker på den stokastiske variabel X som en model for en måling, så er middelværdien for den stokastisk variabel X gennemsnittet af målingerne i det lang løb. Variansen er et udtryk for hvor meget den stokastiske variabel varierer omkring middelværdien. Hvis X repræsenterer en måling, så kan variansen ses som en mål for kvaliteten af målingen Jo mindre varians jo mindre variation fra måling til måling, hvilket kan tages som et udtryk for en højere kvalitet af målingen. Definition 5 (Middelværdi) Middelværdien for en stokastiske variabel X betegnes E[X] og er givet ved E[X] = xf(x)dx. (2.3) {eq:ex} Nogle gange omtales middelværdien for en stokastisk variabel også forventningen eller den forventede værdi. På engelsk bliver det til expectation, hvilket er forklaringen på, at bogstavet E benyttes til at betegne middelværdi for en stokastisk variabel. I mange tilfælde er vi ikke interesseret i middelværdien for X, men derimod for middelværdien af en anden størrelse, som er en funktion af X: Definition 6 Hvis h(x) er en reel funktion, så er middelværdien af h(x) givet ved {def:ehx} E[h(X)] = h(x)f(x)dx. (2.4) {eq:ehx} Bemærk, at integralerne i (2.3) og (2.4) typisk ikke kan udregnes. I denne note vil vi aldrig få brug for at udregne (2.3). Derimod vil vi ofte have brug for at udregne E[h(X)], hvilket generelt er problematisk på nær i de tilfælde, hvor h(x) er en lineær funktion Sætning 2 (Middelværdien for en lineær transformation) Antag X er en stokastisk variabel med middelværdi E[X] = µ. Da er den middelværdien for transformationen a + bx givet ved {thm:aeb} E[aX +b] = ae[x]+b = aµ+b.

14 10 KAPITEL 2. DET MATEMATISKE FUNDAMENT Bevis Antag at X er en stokastisk variabel med tæthedsfunktion f og h(x) = ax+b. Da følger E[aX +b] af (2.4): E[aX +b] = = a = aµ+b, (ax+b)f(x)dx xf(x)dx+b f(x)dx hvor vi har benyttet definition 6 og egenskab 2 i definition 1. {thm:elinkomb} Hvis vi kender E[X] er det med andre ord en simpel opgave at finde E[a + bx]. Formelt set er det ikke helt korrekt, at betegne h(x) = ax + b som en lineære funktion på nær hvis b = 0. Den korrekte term er en affin funktion. Det er nemt at udvide sætning 2 til middelværdien for en linearkombination af flere stokastiske variable: Sætning 3 Lad X 1,X 2,...,X n være n stokastiske variable med middelværdierne µ 1,...,µ n, dvs. E[X i ] = µ i. For alle reelle tal a 0,a 1,a 2,...,a n gælder at middelværdien af linearkombinationen a 0 +a 1 X 1 +a 2 X 2 + +a n X n er givet ved E[a 0 +a 1 X 1 +a 2 X 2 + +a n X n ] = a 0 +a 1 µ 1 +a 2 µ 2 + +a n µ n. {def:varians} {eq:var} Bemærk at der ikke er nogen antagelser om at X 1,...,X n er indbyrdes uafhængige stokastiske variable. Variansen for en stokastisk variable X er et udtryk for hvor meget en stokastisk variabel varierer omkring middelværdien. Mere præcist definerer vi variasen som: Definition 7 (Variansen) Variansen for en stokastisk variabel X med middelværdi µ er defineret som Var[X] = E[(X µ) 2 ], (2.5) dvs. middelværdien af den kvadrede afstand mellem X og middelværdien µ. Bemærk, at definition af varians svarer til (2.4), hvor h(x) = (x µ) 2. Hvis X har tæthedsfunktion f(x), så kan variansen for X udregnes vha. Var[X] = (x µ) 2 f(x)dx. I forbindelse med praktiske udregninger af variansen er det ofte bekvemt at benytte følgende omskrivning af (2.5): {eq:altvar} Var[X] = E[X 2 ] µ 2. (2.6)

15 2.3. MIDDELVÆRDI OG VARIANS 11 Denne sammenhæng kan nemt udledes: Var[X] = E[(X µ) 2 ] = E[X 2 +µ 2 2µX] = E[X 2 ]+µ 2 2µE[X] = E[X 2 ] µ 2. Definition 8 (Standardafvigelsen) Standardafvigelsen σ er kvadratroden af variansen. Dvs. hvis den stokastiske variabel X har varians σ 2, så er standardafvigelsen for X givet ved σ = σ 2. Det er generelt svært at finde variansen for h(x) på nær når h(x) = ax+b: Sætning 4 Antag X er en stokastisk variabel med middelværdi E[X] = µ og varians Var[X] = σ 2. Da er variansen af transformationen ax +b givet ved {thm:vaxb} Var[aX +b] = a 2 V[X]. (2.7) {eq:vaxb} Bevis Husk at Var[h(X)] = E[(h(X) E[h(X)]) 2 ]. Hvis vi antager, at h(x) = ax +b og bemærk, at E[aX +b] = aµ+b så har vi Var[aX +b] = E[(aX +b E[aX +b]) 2 ] = E[(aX +b (aµ+b)) 2 ] = E[(aX aµ) 2 ] = E[a 2 (X µ) 2 ] = a 2 E[(X µ) 2 ] = a 2 Var[X]. Bemærk at konstanten b ikke optræder i resultatet (2.7). Intuitionen er, at b blot bidrager med en forskydning af X og dermed ikke påvirker variationen. Sætning 4 kan udvides til at gælde en generel linearkombination af flere stokastiske variable: Sætning 5 Lad X 1,X 2,...,X n være n uafhængige stokastiske variable med varianser σ 2 1,...,σ2 n, dvs. Var[X i ] = σ 2 i. For alle reelle tal a 0,a 2,...,a n gælder, at variansen af linearkombinationen a 0 +a 1 X 1 +a 2 X 2 + +a n X n er givet ved {thm:vlinkomb} Var[a 0 +a 1 X 1 +a 2 X 2 + +a k X k ] = a 2 1σ 2 1 +a 2 2σ a 2 k σ2 k. (2.8) {eq:vlinkomb} Bemærk: en forudsætning for sætning 5 er at de n stokastiske variable er indbyrdes uafhængige. Denne begrænsning vil vi rode bod på senere.

16 12 KAPITEL 2. DET MATEMATISKE FUNDAMENT Eksempel 1 Fridjof er verdens kedeligste frugthandler! Kan sælger kun æbler og pærer fra sin lille bod på torvet. For hvert æble tjener han 1,27 kr og for hvert pære tjener han 0,87. Desuden koster det ham 119 kr. om dagen i faste udgifter at drive boden på torvet. Vi ved desuden, at det forventede antal solgte æbler og pærer er hhv. 97,3 og 63,4. Hvad er den forventede daglige overskud for Fridjof? Løsning: Lad X og Y være stokastiske variable, der svarer til det solgte antal hhv. æbler og pærer. Dvs. E[X] = 97,3 og E[Y] = 63,4. Det dagelige overskud betegner vi S = 1,27X +0,87Y 119. Det forventede overskud er derfor E[S] som vi udregner: E[S] = E[1,27X +0,87Y 119] = 1,27E[X]+0,87E[Y] 119 = 1,27 97,3+0,87 63,4 119 = 59,729. Dvs. det forventede daglige overskud er knap 60kr. malfordelingen} 2.4 Normalfordelingen Den måske vigtigste fordeling af alle fordelinger er normalfordelingen. Definition 9 (Normalfordelingen) En stokastisk variabel med tæthedsfunktion f(x) = ( ) 1 exp (x µ)2 2πσ 2 2σ 2 kaldesnormalfordeltmedmiddelværdiµogvariansσ 2.NotationX N(µ,σ 2 ). {thm:anb} Figur 2.4 viser tre eksempler på normalfordelinger. Bemærk at tæthedsfunktionen er symmetrisk omkring middelværdien µ. Ud over at være en god beskrivelse af mange virkelige problemstillinger, så har normalfordelingen mange nyttig egenskaber. En egenskab er at en lineær transformation af en normalfordelt stokastisk variabel også er normalfordelt: Sætning 6 Antag a og b er reelle konstanter, og X N(µ,σ 2 ) og Y = ax + b. Da gælder Y N(aµ+b,a 2 σ 2 ). At Y har middelværdi aµ + b og varians a 2 σ 2 er ikke overraskende, da det følger at sætningerne 2 og 4. Det interessante er at en lineær transformation af X også er normalfordelt.

17 2.4. NORMALFORDELINGEN 13 µ = 5 σ = 2 µ = 0 σ = 1 µ = 3 σ = Figur 2.4: Tre eksempler på normalfordelinger. fig:normex 95% 80% µ 1,96σ µ µ+1,96σ µ 1,28σ µ µ+1,28σ Figur 2.5: Venstre plot: Tæthedsfunktion for normalfordelt stokastisk variabel med forventning µ og varians σ 2. Den normalfordelte stokastiske variabel ligger med 95% sandsynlighed i intervallet µ±1,96σ svarende til arealet af det grå område i figuren. Højre plot: Som venstre plot, men her illustrerer det grå område, at der er 80% sandsynlighed for, at den normalfordelte stokastiske variabel ligger i intervallet µ±1,28σ. fig:normex2 f(z) Φ(z) 1.00 Φ(z) z Figur 2.6: Venstre plot: Tæthedsfunktionen for en standard normalfordelt stokastisk variabel. Det grå område illustrerer fordelingenfunktionen Φ(z) = P(Z z). Højre plot: Fordelingsfunktionen for en standard normalfordelt stokastisk variabel. fig:normex3 z

18 14 KAPITEL 2. DET MATEMATISKE FUNDAMENT standardisering} Eksempel 2 Antag X N(µ;σ 2 ) og definer Z = X µ. σ Hvilken fordeling følger Z? Bemærk at Z kan skrives som Z = 1 σ X µ σ. Sætter vi a = 1 σ og b = µ σ følger det af Sætning 6, at Z er normalfordelt med middelværdi 0 og varians 1. {eks:stdnorm} Normalfordelingen med middelværdi 0 og varians 1 betegnes en standard normalfordelingen. En stokastisk variabel, der følger en standard normalfordeling betegnes typisk Z, dvs. Z N(0; 1). Desuden betegnes fordelingsfunktionen for standard normalfordelingen typisk Φ(z). Hvis Z N(µ;σ 2 ), så har vi P(Z z) = Φ(x). Tæthedsfunktionen for standard normalfordelingen og dens fordelingsfunktionen Φ er illustreret på figur 2.6. Desuden er Φ tabellagt på side 66. Desuden har de fleste typer software der kan benyttes til statistik funktioner indbygget, der kan udregne Φ(x), fx. Matlab. Eksempel 3 Antag Z er standard normalfordelt, dvs. Z N(0,1). Vi ønsker nu at finde følgende sandsynligheder P(Z 1,17) og P(Z 1,82). Løsning: Den første sandsynlighed finde umiddelbart vha. normalfordelingstabellen: P(Z 1,17)Φ(1,17) = 0,8790. Den næste sandsynlighed kan ikke umiddelbart slås op da Φ(z) kun er tabellagt for positive værdier af z. Da standard normalfordelingen er symmetrisk omkring nul, så gælder P(Z 1,82) = P(Z 1,82). Ifølge egenskab 2 ved sandsynligheder har vi P(Z 1,82) = 1 P(Z 1,82) = 1 Φ(1,82) = 1 0,9656 = 0,0344. Dvs. P(Z 1,82) = 0,0344. Vha. tabel for Φ kan manfor en standard normalfordelt stokastisk variabel Z gælder, at P( 1,96 Z 1,96) = 0,95. Dvs. Z med 95% sandsynlighed ligger i intervallet fra-1,96 til 1,96. Da standard normalfordelingen er symmetrisk omkring nul gælder der desuden, at P(Z 1,96) = 0,025 og P(Z 1,96) = 0,025. Der gælder således Φ( 1,96) = 0,025 og Φ(1,96) = 0,975. Eksempel 4 Hvis X N(µ,σ 2 ), så gælder der, at P(µ 1,96σ X µ + 1,96σ) = 0,95. Dvs. med 95% sandsynlighed ligger X i intervallet µ±1,96σ. Eller med andre ord: X ligger med 95% sandsynlighed højst 1, 96 standardafvigelser fra middelværdien. Dette gælder for alle valg af standardafvigelse (helt præcist skal der gælde 0 < σ < ). Hvorfor? Vi starter med at omskrive sandsynligheden: ( P (µ 1,96σ X µ+1,96σ) = P 1,96 X µ ) 1,96. (2.9) σ

19 2.4. NORMALFORDELINGEN 15 følger en standard normalfordeling. Sandsynlig- Jf. eksempel 2 gælder at X µ σ heden kan derfor skrives som P(µ 1,96σ X µ+1,96σ) = P( 1,96 Z 1,96) = 0,95, hvor den sidste lighed følger af egenskaben for en standard normalfordelt stokastisk variabel. På side 66 i kapitel 6 er fordelingsfunktionen for standard normalfordelingen tabellagt. I denne note tager vi udgangspunkt i denne tabel eller Matlab. Eksempel 5 (Matlab) Hvis X er normalfordelt med middelværdi mu og standardafvigelse sigma, så kan man finde P(X x) i Matlab vha. kommandoen normcdf(x,mu,sigma). Antag X følger en standard normalfordeling, dvs. X N(0,1). Bestem følgende sandsynlighed P(X 1,4). Løsning: Ifølge tabel 6.1 er P(X 1,4) = 0,9192. I Matlab får vi (ikke overraskende) det samme svar: >> normcdf(1.4,0,1) ans = Den inverse fordelingsfunktion er implementeret i Matlab som norminv. Find x så P(X x) = 0,7. Løsning: Ifølge tabel 6.1 har vi P(X 0,52) = 0,6985 og P(X 0,53) = 0,7019, dvs. x ligger et sted mellem 0,52 og 0,53. Vha. Matlab finder finder vi, at svaret er x = 0,5244: >> norminv(0.7,0,1) ans = Generelt er en linearkombination af normalfordelte stokastiske variable normalfordelt: Sætning 7 Antag at X 1,X 2,...,X n er normalfordelte stokastiske variable og a 0,a 1,a 2,...,a n er reelle konstanter, da er linearkombinationen a 0 + a 1 X 1 + a 2 X a n X n også normalfordelt. {thm:normlinkomb} Øvelse 2 Antag at X er standard normalfordelt, dvs. X N(0,1). Bestem følgende sandsynligheder 1. P(X 0,6) 2. P(X 1,5) 3. P( 1 X 2)

20 16 KAPITEL 2. DET MATEMATISKE FUNDAMENT Øvelse 3 Antag at højeden blandt værnepligtige mænd kan betragtes som værende normalfordelt med middelværdi 173,3 cm og varians 6,4 cm 2. Antag vi har en stikprøve på 1000 værnepligtige mænd. Af disse 1000, hvor mange vil vi (ca.) forvente er over 170cm højde? 2....over 180cm højde? 3....over 190cm højde? 4....over 200cm højde? Øvelse 4 Antag X N(µ,σ 2 ). Bestem følgende sandsynligheder 1. P(µ σ X µ+σ) 2. P(2µ σ X µ+2σ) 3. P(3µ σ X µ+3σ) Øvelse 5 Antag vægten en kylling øges med over en uge er normalfordelt med middelværdi 350g og varians 30 g Hvad er sandsynligheden for en tilvækst på mere end 300g? Antag vi har målt vægtforøgelsen på to kyllinger. Antag desuden, at vægtforøgelsen på de to kyllinger er uafhængig af hinanden. 2. Hvad er sandsynligheden for at begge kyllinger har en vægtforøgelse mindre end 300g? 3. Hvad er sandsynligheden for at mindst en af de to kyllinger har en vægtforøgelse på mere end 300g? 2.5 Tilfældig fejl Som nævnt i indledning til dette kapitel er formålet med dette kapitel at formulere en matematisk model for måling af fx. vinkler. Lad µ betegne en sand vinkel i trekanten i Figur 1.1 og lad X være en måling af denne vinkel. I almindelighed vil målingen X afvige fra µ. Vi betegner fejlen ǫ, dvs. X = µ+ǫ. Vi vil betragte ǫ som en tilfældig fejl, vi vil derfor tænke på ǫ som en stokastisk variabel. Specifikt vil vi antage, at ǫ N(0,σ 2 ), dvs. fejlen ǫ er normalfordelt med middelværdi nul og varians σ 2. Jf. sætning 2 og 4, så har vi E[X] = E[µ+ǫ] = E[µ]+E[ǫ] = µ+0.

21 2.6. LINEARISERING 17 og Var[X] = Var[µ+ǫ] = Var[ǫ] = σ 2. Dvs. at i middel så er vores måling X lig den sande vinkel µ. Af sætning 6 følger det, at målingen X desuden er normalfordelt: X N(µ,σ 2 ). Fra teorien om normalfordelingen har vi at 95% af målingerne vil ligge i intervallet µ±1,96σ. I udgangspunktet kender vi ikke σ Linearisering Vi har i forrige afsnit se på, hvordan man finder middelværdi og varians for en lineær transformation af en stokastisk variabel. Antag at vi for trekanten i figur 1.1 har målt vinklen α og sidelængerne S b og S c. Man kan da udregne arealet vha. A = sin(α)s b S c. I praksis har vi en ide om, hvor usikre vores målinger af vinkeler og afstande er, men hvordan påvirker det usikkerheden på arealet A? Vi starter med et lidt simplere eksempel. Antag X N(µ,σ 2 ), dvs. X er normalfordelt stokastisk variabel med middelværdi µ og varians σ 2. Definer en ny stokastiske Y = h(x), hvor h er en differentiabel funktion. Med mindre h(x) er en lineær funktion kan vi ikke umiddelbart sige, hvilken fordeling Y følger eller bare, hvilken middelværdi og varians Y har. Løsningen er at approksimere h(x) med en lineær funktion. Denne fremgangmåde kaldes, at man lineariserer h(x). I det følgende betegner h (x) den afledte af h(x) mht. x, dvs. h (x) = dh(x)/dx. Lineariseringen består i at approksimere h(x) med en funktion, der svarer til tangentlinjen til funktionen h(x) i punktet (µ,h(µ)). Linjen har hældning h (µ) = dh(x)/dx x=µ og går igennem punktet (µ,h(µ)). Det er let at vise, at {sec:lin} h(x) = h(µ)+(x µ)h (µ) = h(µ) µh (µ)+xh (µ). Eksempel 6 Figur 2.7 viser et eksempel på linearisering, hvor h(x) = ln(x) og µ = 2. I dette tilfælde er h (x) = 1/x, og h (µ) = 1/2. Lineariseringen af h(x) er derfor h(x) = ln(2) x1 2 = ln(2) x. I dette eksempel er det lidt problematisk at antag, at X er normalfordelt, hvorfor?

22 18 KAPITEL 2. DET MATEMATISKE FUNDAMENT h(x) h(x) h(µ) µ x Figur 2.7: Et eksempel på linearisering, hvor h(x) = ln(x) og µ = 2. fig:lin Middelværdien og variansen for Y = h(x) kan nu approksimeres ved E[Y] h(µ) og Var[Y] (h (µ)) 2 σ 2. Approksimationen af middelværdien E[Y] følger af: E[Y] = E[h(X)] E[h(µ) µh (µ)+xh (µ)] = h(µ) µh (µ)+µh (µ) = h(µ) og approksimationen for variansen Var[Y] kan udledes vha. Var[Y] = Var[h(X)] Var[h(µ) µh (µ)+xh (µ)] = (h (µ)) 2 σ 2. Lineariseringen h(x) er en god approksimation of h(x) så længe x er tæt på µ. Derfor er approksimationerne af E[Y] og V[Y] også kun gode, hvis X med stor sandsynlighed er tæt på µ. Dette er tilfældet, hvis X s varians ikke er for stor. Det illustreres i næste eksempel. Eksempel 7 Antag X N(µ,σ 2 ) og h(x) = exp(x). I dette tilfælde er h (x) = exp(x) og lineariseringen af h(x) er h(x) = exp(µ) µexp(µ)+xexp(µ). E[Y] exp(µ) og V[Y] exp(µ) 2 σ 2 = exp(2µ)σ 2. Figur 2.8 viser situationen for to forskellige valg af standardafvigelse σ. I det venstre plot i figur 2.8 er σ 2 = 0.5. I det højre plot er σ = 0,1. I begge tilfælde er µ = 4. I det venstre plot er der en tydelig forskel mellem sande tæthedsfunktion (tynd linje) og tæthedsfunktionen, der er et resultat af lineariseringen (tyk linje). Man kan vise at den sande middelværdi og varians er E[Y] = exp(µ+σ 2 /2) og Var[Y] = (exp(σ 2 ) 1)exp(2µ+σ 2 ). Hvis variansen σ 2 er lille i forhold til middelværdien µ, så er de tilnærmede udtryk ovenfor tæt på de sande værdier.

23 2.7. KOVARIANS 19 Tæthedsfunktion for h(x) og ilde h(x) Tæthedsfunktion for h(x) og ilde h(x) Tæthedsfunktion for X Tæthedsfunktion for X Figur 2.8: Linearisering af log-normalfordelte stokastiske variable. fig:linex 2.7 Kovarians Indtil nu har vi beskæftiget os med uafhængige stokastisk variable. Fra sætning 3 ved vi, at udregning af middelværdien for en linearkobinationer af stokastiske variable ikke forudsætter uafhængighed mellem de enkelte stokastiske variable. I sætning 5 er det derimod forudsætning af de stokastiske variable er indbyrdes uafhængige. I dette afsnit vil vi indføre begrebet kovarians for at kunne håndtere variansen af en linearkombination af indbyrdes afhængige stokastiske variable. Definition 10 (Kovarians) Antag X og Y er to stokastiske variabel med middelværdier µ X og µ Y. Kovariansen mellem de stokastiske variable X og Y er da defineret som {def:kovarians} Cov(X,Y) = E[(X µ X )(Y µ Y )]. Kovariansen kan tage både negative og positive værdier. Kovariansen er positiv hvis store værdier af X generelt følges med storeværdier af Y. Ligedes er kovariansen negativ, hvis store værdier af X generelt følges med små værdier af Y. Her skal stor værdi af X forstås som en værdi større end µ X. Tilsvarende er en lille værdi af X en værdi mindre end µ X. Bemærk at Cov(X,X) = Var[X] idet Cov(X,X) = E[(X µ X )(X µ X )] = E[(X µ X ) 2 ] = Var[X], hvor det sidste lighedstegn følger af definitionen på varians.

24 20 KAPITEL 2. DET MATEMATISKE FUNDAMENT Eksempel 8 Fridjof oplyser at kovariansen mellem antal solgte æbler og pærer er 139,5. Det tyder på, at antallet af solgte æbler og pærer følges ad. Hvor stærk denne sammenhæng er, er svært at sige, men det vender vi tilbage til. Sætning 8 (Kovarians og uafhængighed) Hvis X og Y er uafhængige stokastiske variable, så er Cov(X,Y) = 0. Det modsatte gælder generelt ikke. Dvs. hvis Cov(X,Y) = 0 kan vi ikke konkluderer at X og Y er uafhængige. {thm:vxy} Vha. kovarianser er det muligt at udregne variansen af linearkombinationer af stokastiske variable uden at antage uafhængighed. Vi starter med variansen for summen af to stokastiske variable: Sætning 9 Summen af to stokastiske variable X og Y har variansen Var[X +Y] = Var[X]+Var[Y]+2Cov(X,Y). Bevis: Var[X +Y] = E[(X +Y E[X +Y]) 2 ] = E[(X +Y (µ X +µ Y )) 2 ] = E[((X µ X )+(Y µ Y )) 2 ] = E[(X µ X ) 2 +(Y µ Y ) 2 +2(X µ X )(Y µ Y )] = E[(X µ X ) 2 ]+E[(Y µ Y ) 2 ]+2E[(X µ X )(Y µ Y )] = Var[X]+Var[Y]+2Cov(X,Y). Eksempel 9 Fridjof fra før oplyser, at variansen for antal solgte æbler og pærer er hhv. 121,4 og 327,2. Hvad er variansen af det samlede antal solgte stykker frugt? Løsning: Vi definerer X og Y som i det første eksempel og lader M betegne det samlede antal solgte stykker frugt, dvs. M = X +Y. Variansen for M finder vi ved: Var[M] = Var[X +Y] = Var[X]+Var[Y]+2Cov(X,Y) = 121,4+327, ,5 = 727,6. Bemærk at variansen af summen (727,6) er meget større end summen af de to varianser (121, ,2 = 448,6). Regneregel for variansen af summen af to stokastiske variable kan udvides til en generel linearkombination af to stokastiske variable:

25 2.7. KOVARIANS 21 {thm:vaxbyc} Sætning 10 Variansen af linearkombinationen ax +by +c af de stokastiske variable X og Y er givet ved Var[aX +by +c] = a 2 Var[X]+b 2 Var[Y]+2abCov(X,Y). Bevis Beviset tager udgangspunkt i definitionen 7 for varians: Var[aX +by +c] = E[(aX +by +c E[aX +by c]) 2 ] = E[(aX +by +c (aµ X +bµ Y c)) 2 ] = E[(a(X µ X )+b(y µ Y )) 2 ] = E[a 2 (X µ X ) 2 +b 2 (Y µ Y ) 2 +2ab(X µ X )(Y µ Y )] = a 2 E[(X µ X ) 2 ]+b 2 E[(Y µ Y ) 2 ]+2abE[(X µ X )(Y µ Y )] = a 2 Var[X]+b 2 Var[Y]+2abCov(X,Y), hvor sidste ligehed følger af definitionen 7 for varians og definition 10 for kovarians. Eksempel 10 Hvad er variansen af Fridjof daglige overskud? Løsning: Husk at overskudet er givet ved S = 1,27X +0,87Y 119. Vi kan nu finde variansen for S: Var[S] = Var[1,27X +0,87Y 119] = 1,27 2 V[X]+0,87 2 V[Y]+2 1,27 0,87Cov(X,Y) = 1, ,4+0, ,2+2 1,27 0,87 139,5 = 751,73. Fortolkning: Hvis vi antager, at overskudet er normalfordelt så vil 95% af alle dage generere et overskud i intervallet E[S] ± 1,96 Var[S] = 59,729 ± 1,96 751,73 59,729 ± 53,74 [5,88;113,47]. Dvs. de fleste dage ligger Fridjofs overskud mellem ca. 6kr og 113 kr. Hvor urimelig er normalfordelingsantagelsen? Bemærk at variansen for differencen X Y er givet ved Var[X Y] = Var[X]+( 1) 2 Var[Y]+1 ( 1)2Cov(X,Y) = Var[X]+Var[Y] 2Cov(X,Y). Sætning 10 kan udviddes til et udtryk for variansen af en linearkombinationer af et vilkårligt antal stokastiske variable: {thm:vlinkomb2}

26 22 KAPITEL 2. DET MATEMATISKE FUNDAMENT Sætning 11 (Varians for linearkombinationer) Antag X 1,...,X n er n stokastiske variablen og a 0,a 1,...,a n er reelle konstanter. Da er variansen af linearkombinationen a 0 +a 1 X a n X n givet ved Var[a 0 +a 1 X 1 +a 2 X 2 + +a n X n ] = n n 1 a 2 ivar[x i ]+2 n j=i+1 a i a j Cov(X i,x j ). (2.10) {eq:vlinkomb2} Det er ofte bekvemt at benytte følgende notation for varians og kovarians: Var[X i ] = σ 2 i og Cov(X i,x j ) = σ ij. Bemærk at Cov(X i,x j ) = Cov(X i,x j ), dvs. σ ij = σ ji. Med denne notation kan (2.10) omskrives til {eq:vlinkomb3} 2.8 Korrelation [ n ] Var a i X i = n a 2 iσ 2 i +2 i<j a i a j σ ij. (2.11) Kovariansen kan være svær at fortolke, da den afhænger af den enhed X og Y er målt i. Hvis X og Y er fortjenesten på hhv. æbler og pærer, så vil størrelsen af Cov(X,Y) afhænge af hvilken valuta de to fortjenester opgøres i. For at afhjælpe dette problem indfører vi korrelationen. Definition 11 (Korrelation) Korrelation Corr(X, Y) mellem stokastiske variable X og Y er defineret som Corr(X,Y) = Cov(X,Y) Var[X]Var[Y]. Korrelationen er et tal mellem -1 og 1 og kan ses som et udtryk for graden af lineær sammenhæng. Hvis Corr(X,Y) = 1 er der perfekt positiv lineær sammenhæng. Det betyder at X og Y følges mekanisk ad. Hvis X og Y er uafhængige er Corr(X,Y) = 0. Bemærk, at Corr(X,y) = 0 ikke er ensbetydende med uafhængighed. Eksempel 11 Antag vi har to stokastiske variable X og Y og to reelle konstanter a og b. Hvad er da korrelationen mellem ax og by? Løsning: Vi starter med at bemærke, at Var[aX] =a 2 Var[X] Var[bY] =b 2 Var[Y].

27 2.8. KORRELATION 23 Eksempel 12 Antag X er en stokastisk variabel og Y = ax+b, 0. Hvad er da korrelationen mellem X og Y? For at finde korrelationen skal vi finde variansen for Y samt kovariansen mellem X og Y. Det følger af Sætning 4, at Kovariansen mellem X og Y er Var[Y] = a 2 Var[X]. Cov(X,Y) = Cov(X,aX +b) Korrelationen er da givet ved = E[(X E[X])(aX +b ae[x] b)] = E[a(X E[X])(X E[X])] = avar[x]. Corr(X,Y) = Cov(X,Y)/ Var[X]Var[Y] = avar[x]/ Var[X]a 2 Var[X] = a/ a 2. Hvis a > 0, så får vi Corr(X,Y) = 1, og hvis a < 0 får vi Corr(X,Y) = 1. Dvs. der er en perfekt lineær sammenhæng mellem X og Y. Korrelationen mellem to stokastiske variable betegnes ofte ved det græske bogstav ρ [rho]. Dvs. ρ = Corr(X,Y). Bemærk, at Corr(aX,bY) = Corr(X,Y). Dvs. en skallering af X og Y ikke påvirker korrelationen. Hvis vi tænker på a og b konverteringsfaktorer når vi skifter valuta, understreger denne regneregel, at valg af valuta er irrelevant, når vi udregner korrelationen mellem fortjenesten på æbler og pærer. Eksempel 13 Find korrelationen mellem antallet af solgte æbler og pærer. Løsning:Korrelationenerρ = Cov(X,Y)/ V[X]V[Y] = 139,5/ 121,4 327,2 0,70. Med en korrelation på 0,7 er der en tydelig sammenhæng mellem salget af æbler og pærer. Øvelse 6 Lad X være en kontinuert stokastisk variabel, der angiver målingen af en længde, og antag X N(10,0.04). Bestem a således, at P(10 a < X < 10+a) = 0.95 Antag Y har samme fordeling som X, samt at X og Y er uafhængige. Bestem b således, at P(10 b < X +Y < 10+b) = Fortolk resultaterne.

28 24 KAPITEL 2. DET MATEMATISKE FUNDAMENT ρ = 1 r = ρ = 0.9 r = ρ = 0 r = ρ = 0.4 r = ρ = 0 r = ρ = 0 r = Figur 2.9: Seks plots af stikprøver fra populationer, hvor korrelationen er ρ som angivet over hvert plot. Over hvert plot er er desuden angivet stikprøvekorrelationen r, der er et estimat af ρ, se afsnit 3.2. fig:korrelation 2.9 Matrix formulering {sec:matrix} Når der er mange stokastiske variable i sving samtidigt kan det hjælpe, at reformulere problemet i termer af vektorer og matricer. Hvis X 1,...,X n er stokastiske variable da er X 1 X 2 X =. X n en (n dimensional) stokastisk vektor. Antag at X i har middelværdi E[X i ] = µ i og varians Var[X i ] = σi 2. Da er middelværdien for den stokastiske vektor X givet ved X 1 X 2 X n E[X] = E. = µ 1 µ 2. µ n = µ. kovariansmatrix} Definition 12 (Kovariansmatrix) Variansen for X er en n n matrix, der betegnes kovariansmatricen og er givet

29 2.9. MATRIX FORMULERING 25 som Var[X] = E [ (X µ) T (X µ) ] σ 2 1 σ 12 σ 1n σ 21 σ2 2 σ 2n =..... σ n1 σ n2 σn 2 = K X, hvor vi, som i Sætning 11, har at σ 2 i = Var[X i] og σ ij = Cov(X i,x j ), i j. Bemærk, at kovariansmatricen K X er symmetrisk da σ ij = σ ji og K X har varianserne på diagonalen. Eksempel 14 AntagX 1 ogx 2 ertostokastiskevariable,hvormiddelværdierneerhhv.e[x 1 ] = 1.7 og E[X 2 ] = 2.3, varianserne er Var[X 1 ] = 7.2 og Var[X 2 ] = 6.4, og sluttelig er kovariansen mellem de to stokastiske variable Cov(X 1,X 2 ) = 5.2. I dette tilfælde er middelværdivektoren og kovariansmatricen givet ved µ = [ ] og K X = [ ] {eks:matrix1} Sætningerne 2 og 4 angiver regneregler for middelværdi og varians for en lineær transformation ax + b af én stokastisk variabel X. Følgende sætning opsummerer tilsvarende regneregler for en stokastisk vektor. Sætning 12 Antag at X er en n dimensional stokastisk (søjle)vektor med middelværdi µ and kovarians matrix K X. Lad A være en vilkårlig m n matrix og b en vilkårlig m dimensional søjlevektor. Middelværdien af den linære transformation AX + b er {thm:evaxb} E[AX+b] = AE[X]+b = Aµ+b. På tilsvarende vis er kovariansen for den linære transformation AX + b givet ved Var[AX+b] = AVar[X]A T = AK X A T. Eksempel 15 Antag X 1 og X 2 er givet som i eksempel 14. Antag desuden, at A = og b =

30 26 KAPITEL 2. DET MATEMATISKE FUNDAMENT Da er E[X] og Var[X] givet ved E[AX+b] = Aµ+b [ ] = = Var[AX+b] = AK X A T [ ][ ] = = (2.12) {eq:kovy} Definer en stokastisk vektor Y 1 Y = Y 2, Y 3 som er givet ved Y = AX+b, hvor A, X og b er som givet ovenfor. Varianser og kovarianser for Y 1, Y 2 og Y 2 kan nu aflæses i kovariansmatricen (2.12). Fx. er variansen Var[Y 1 ] = 86,160 og kovariansen mellem Y 2 og Y 3 er Cov(Y 1,Y 2 ) = Korrelationen mellem Y 2 og Y 3 er Cov(Y 2,Y 3 ) Var[Y2 ]Var[Y 3 ] = = , dvs. Y 2 og Y 3 er næsten perfekt korrelerede.

31 Kapitel 3 Estimation Ved hjælp af en teodolit måles en bestemt vinkel n gange. Vinklens sande værdi er µ gon. Vinkelmålingerne foregår uafhængigt af hinanden og under samme omstændigheder. Det antages videre, at de tilfældige målefejl, der begås, følger en normalfordeling. Målingerne resulterer i et datamateriale: x 1,...,x n. Eksempel 16 Vinklen er målt med 10 satser. Følgende værdier er observeret: {sec:estimation} {sec:eksempel1} x 1 = 164,508 gon x 2 =,509 x 3 =,511 x 4 =,507 x 5 =,510 x 6 =,511 x 7 =,517 x 8 =,510 x 9 =,514 x 10 =,513 Med henblik på at gennemføre en detaljeret analyse af det foreliggende datamateriale formuleres en statistisk model for, hvordan vi mener, data er fremkommet. Det antages således, at der i n forsøg(de n vinkelmålinger) observeres n stokastiske variable X 1,...,X n, der er uafhængige og normalfordelte N(µ,σ 2 ). Det antages således, at de n vinkelmålinger er n værdier antaget af n stokastiske variable X 1,...,X n, der er uafhængige og normalfordelte. Dvs. X 1,...,X n (3.1) {eq:stok_var} x 1,...,x n 27

32 28 KAPITEL 3. ESTIMATION uafhængige og N(µ,σ 2 ). Bemærk, at (X 1,...,X n ) betegner en stikprøve på normalfordelingen N(µ,σ 2 ), og (x 1,...,x n ) betegner en observeret stikprøve på normalfordelingen N(µ,σ 2 ). De ovenfor betragtede målinger af vinklen µ resulterer altså i en observeret stikprøve på normalfordelingen N(µ,σ 2 ). Som mål for målingernes nøjagtighed anvendes variansen σ 2. Den observerede stikprøve er altså (x 1,...,x n ) = ( , ,..., ) Det er nu opgaven ved hjælp af den observerede stikprøve (x 1,...,x n ) at skønne - estimere - den givne normalfordelings middelværdi µ (dvs. den sande vinkel) og samme fordelings varians σ 2 (dvs. målet for målenøjagtigheden). 3.1 Estimation af middelværdi og varians Til at estimere µ benyttes almindeligvis stikprøvegennemsnittet: {eq:obs_middel} x = 1 n (x x n ) = 1 n n x i. (3.2) Til at estimere σ 2 anvendes normalt stikprøvevariansen: {eq:stik_var} s 2 = 1 n 1 n (x i x) 2. (3.3) På baggrund af vores stikprøve får vi: x = 164,511 gon og s 2 = (0,003) 2 {mod:stok_var} Med hensyn til s 2 viser et tilsvarende argument, at for n stor er s 2 = σ 2. Det forekommer umiddelbart mærkeligt, at man ved definitionen af s 2 anvender faktoren 1 n 1 og ikke 1 n. En forklaring herpå gives nedenfor. Vi skal herefter ved hjælp af den formulerede statistiske model indse, at estimaterne x og s 2 er gode estimater for hhv. µ og σ 2. Vi vil desuden angive en metode til at afgøre, hvor nøjagtige estimaterne x og s 2 er. Model: X 1,...,X n X = 1 n n X i S 2 = 1 n 1 n (X i X) 2 x 1,...,x n x = 1 n x i s 2 = 1 n (x i x) 2 (3.4) n n 1

33 3.1. ESTIMATION AF MIDDELVÆRDI OG VARIANS 29 {sec:setning1} {eq:mid_x} Sætning 13 Antag (X 1,...,X n ) er en stikprøve fra en fordeling, der har middelværdi µ og varians σ 2. Da gælder og E[ X] = µ (3.5) Var[ X] = σ2 n. Hvis X 1,...,X n desuden er normalfordelte N(µ,σ 2 ), da er X normalfordelt N(µ, σ2 n ). Bevis Vi starter med at bemærke at gennemsnittet kan skrives som X = 1 n X n X n X n. Gennemsnittet er således en linearkombination af stokastiske variable. Det følger derfor af sætning 3 og sætning 5 at [ ] E[ X] 1 n = E X i = 1 n E[X i ] = 1 n n n nµ = µ og Var[ X] = Var [ 1 n ] n X i = 1 n n 2 Var[X i ] = 1 n 2nσ2 = σ2 n. Her har vi desuden brugt, at X 1,...,X n har samme middelværdi og varians, og at X 1,...,X n er uafhængige. At stikprøvegennemsnittet er normalfordelt når stikprøven er fra en normalfordelingen er en konsekvens af Sætning 7. (3.6) {eq:var_x} Hvis vores stikprøve er fra en normalfordeling, så har vi X N(µ,σ 2 ). Fra afsnittet om normalfordelingen ved vi at X med 95% sandsynlighed vil ligge i intervallet µ±1.96σ/ n. Jo større stikprøve (dvs. jo større n) jo oftere vil x ligge tæt på n. Et tilsvarende resultat for fordelingen af X gælder, selvom X 1,...,X n ikke er normalfordelt, når blot n er tilstrækkelig stor: Sætning 14 (Central grænseværdisætning) Antag X 1,...,X n er uafhængige og identisk fordelte stokastiske variable med middelværdi µ og varians σ 2. Da følger X µ σ/ n approksimativt en normalfordeling med middelværdi 0 og varians 1. Jo større stikprøvestørrelse n, jo bedre er approksimationen. Mere præcist, antag Z N(0, 1) da gælder, at ( ) X µ lim P n σ/ n x = P(Z x) for alle x R. {thm:clt}

34 30 KAPITEL 3. ESTIMATION Dvs. fordelingsfunktionen for en standard normalfordeling. X µ σ/ n ligner mere og mere fordelingsfunktionen for {sec:setning2} Af den centrale grænseværdisætning fås, at hvis X 1,...,X n er uafhængige og ensfordelte, og n er tilstrækkelig storm så er gennemsnittet approksimativt normalfordelt X N(µ, σ2 n ). Vi vender nu tilbage tilbage til det oprindelige eksempel vedrørende vinkelmåling. Da vi har antaget af fejlene er normalfordelte har vi, at X er normalfordelt N(µ, σ2 n ). Det betyder, at X er en stokastisk variabel, der har µ centralt placeret i sin sandsynlighedsfordeling, idet E[ X] = µ. Desuden er X s sandsynlighedmasse samlet omkring µ, idet Var[ X] = σ2 n er lille. Vi kan altså forvente, at en observeret værdi af X ligger tæt på µ. Bemærk: Estimatoren X kaldes en central estimator for µ, fordi E[ X] = µ. Tilsvarende kaldes x et centralt estimat for µ. Analogt til sætning 13 kan vi vise, at S 2 er en central estimator for σ 2 : Sætning 15 Lad (X 1,...,X n ) være en stikprøve af en stokastisk variabel med middelværdi µ og varians σ 2. Da gælder, at E[S 2 ] = σ 2 (3.7) dvs. S 2 er en central estimator for σ 2, og s 2 er et centralt estimat for σ 2. Desuden gælder der (i de tilfælde vi betragter), at Var[s 2 ] 0 for n. {eq:bevis_set2} Bevis [ ] E[S 2 1 n ] = E (X i n 1 X) 2 [ n ] = 1 n 1 E (Xi 2 2X i X + X2 ) [ n = 1 n 1 E Xi 2 2 X n n X i + 1 X 2 ] (3.8) Vi anvender nu følgende omskrivninger og n X i = n 1 n n X i = n X, n X 2 = n X 2.

35 3.1. ESTIMATION AF MIDDELVÆRDI OG VARIANS 31 Ved indsætning heraf i (3.8) fås [ n ] E[S 2 ] = 1 n 1 E Xi 2 2nX 2 +nx 2 [ n ] = 1 n 1 E Xi 2 nx 2. Hermed Fra omskrivningen (2.6) har vi hvor vi isolerer E[X 2 i ]: ( n ) E(S 2 ) = 1 E(X 2 n 1 i) ne[ X 2 ]. (3.9) {eq:mid_estimat_s σ 2 = Var(X i ) = E(X 2 i) (E(X i )) 2 = E(X 2 i) µ 2, E(X 2 i) = σ 2 +µ 2 (3.10) {eq:exi} På tilsvarende vis finder vi følgende omskrivning: E[ X 2 ] = σ2 n +µ2 (hvorfor?) Ved indsætning af (3.10) og (3.11) i (3.9) får vi ( 2 E[S 2 ] = 1 ( ) ) σ (σ 2 +µ 2 2 ) n n 1 n +µ2 = x 1 n 1 (nσ2 +nµ 2 σ 2 nµ 2 ) = σ 2 (3.11) {eq:exbar2} Dvs. E[S 2 ] = σ 2. Dette afslutter beviset. Estimatoren S 2 er altså en stokastisk variabel med σ 2 centralt placeret i sin sandsynlighedsfordeling. Ydermere er for n stor sandsynlighedsmassen for S 2 samlet omkring σ 2 (fordi Var[S 2 ] 0 for n ). Vi kan altså forvente, at en observeret værdi af S 2 er et godt estimat for σ 2. Bemærkning: Hvis vi som estimator for σ 2 havde valgt: 1 n n (X i X) 2,

36 32 KAPITEL 3. ESTIMATION ville vi få Dvs. E [ 1 n ] [ n (X i X) 2 1 = E n n 1 n 1 [ E [ 1 n = n 1 n E = n 1 n σ2 ] n (X i X) 2 ) n (X i X) 2 1 n 1 ] n (X i X) 2 = n 1 n σ2 σ 2 Estimatoren 1 n n (X i X) 2 er hermed ikke en central estimator for σ 2. Opsummering subsec:oevelse1} Som estimat for den sande vinkel µ benyttes x. Som estimat for σ 2 benyttes s 2. Begge estimater er centrale. Som estimat for spredningen σ på den enkelte vinkel benyttes s = s 2. Som estimat for spredningen σ n for gennemsnittet X benyttes s n. For en god ordens skyld skal bemærkes, at ovenstående resultater vedrørende estimater for middelværdi µ og variansen σ 2 naturligvis også gælder, selv om der ikke er tale om måling af en vinkel. Det afgørende er, om den omtalte statistiske model 3.4 gælder, dvs. at data kan antages at være observationer af uafhængige stokastiske variable, der er normalfordelte N(µ,σ 2 ). Øvelse 7 Estimer middelværdi og spredning for vinkelmålingen, hvis resultater er givet i eksempel 16. Foretag beregningen på grundlag af: 1. X 1, X 2 og X 3 2. X 1, X 2, X 3 og X 4 3. tilføj X 5 osv. Bemærk variationen i X og s. Hvornår virker estimaterne pålidelige? Spredningen estimeret på alle 10 observationer giver s v = 0,0030 gon σ v (spredningen på den enkelte måling, dvs. spredningen på vinklen målt i 1 sats). Som bekendt dannes en vinkel som differens mellem to retninger. Benyt resultatet til at estimere spredningen på en retning målt med 1 sats (s r σ r ).

37 3.1. ESTIMATION AF MIDDELVÆRDI OG VARIANS 33 Øvelse 8 Betragt en vinkel, som vi kan måle med spredning 5 mgon. Antag at målingen er normalfordelt. Antag, at vi foretager n uafhængige målinger (satser) af vinklen β, og lad X betegne gennemsnittet af disse. Bestem n, således at Fortolk resultaterne. P( X β < 3 mgon) = Estimation af varians: Kendt middelværdi Ud over estimaterne nævnt ovenfor får vi i det følgende i ét tilfælde brug for estimatet ŝ 2, der er defineret ved ŝ 2 = 1 n (x i µ) 2 (3.12) {eq:shat_estimat} n Estimatet ŝ 2 anvendes til at estimere σ 2, når µ er kendt. (Bemærk: s 2 = 1 n n 1 (x i x) 2 udnytter ikke kendskab til µ!). Begrundelsen for at benytte ŝ 2 fremfor s 2 når µ er kendt fremgår af følgende sætning: Sætning 16 Antag, at vi i n forsøg har observeret n stokastiske variable X 1,...,X n, der er uafhængige og normalfordelte N(µ,σ 2 ). Da er Ŝ 2 = 1 n (X i µ) 2 n en central estimator for σ 2. Desuden gælder der, at Bevis E[Ŝ2 ] = E [ 1 n Var[Ŝ2 ] < Var[S 2 ] ] n (X i µ 2 ) = 1 n Af definitionen på varians (2.5) følger, at Dvs. n E[(X i µ) 2 ] E[(X i µ) 2 ] = σ 2 for alle i = 1,...,n. E(Ŝ2 ) = 1 n Sætningens anden påstand vises ikke. n σ 2 = 1 n nσ2 = σ 2. Er µ kendt foretrækker vi såldes ŝ 2 fremfor s 2, da Ŝ2 er en bedre estimator end S 2 idet Var[Ŝ2 ] < Var[S 2 ]. {sec:setning3}

38 34 KAPITEL 3. ESTIMATION 3.2 Estimation af kovarians og korrelation {sec:estimation:ko Antag vi har en stikprøve bestående af n par af observationer (x 1,y 1 ),...,(x n,y n ). Som eksempel kunne x i være antal solgte æbler den ite dag og y i er antallet af solgte pærer på den ite dag. Definition: Stikprøvekovariansen for stikprøven (x 1,y 1 ),...,(x n,y n ) betegnes s XY og er givet ved n (x i x)(y i ȳ) s XY =. n 1 Definition: Stikprøve korrelationen betegnes r og er givet ved r = s XY s 2 X s2 Y = n (x i x)(y i ȳ) n (x i x) 2 n (y i ȳ) 2. I figur 2.9 på side 24 ses seks eksempler på stikprøver af parvise observationer og de tilhørende stikprøvekorrelationer. Over hvert plot står stikprøvekorrelationen r sammen med den sande korrelation ρ. Bemærk hvordan data med meget systematiske sammenhænge mellem x og y kan have en stikprøvekorrelation tæt på nul. nfidensinterval} {eq:genm95} 3.3 Konfidensinterval I dette afsnit antyde, hvordan man kan vurdere et givet estimats godhed. Antag igen, at vi har observeret n stokastiske variable X 1,...,X n, der er normalfordelte N(µ,σ 2 ) og uafhængige. Det skal videre antages for ikke at skabe unødvendige komplikationer at variansen σ 2 er kendt. Ifølge Sætning 13 gælder, at X normalfordelt med middelværdi µ og varians σ 2 /n, i kort notation X N(µ, σ2 n ). Fra afsnit 2.4 har vi derfor, at P (µ 1,96 n σ X µ+1,96 n σ ) = 0,95, (3.13) Dvs. med 95% sandsynlighed ligger stikprøve gennesnittet x i intervallet µ ± 1,96 σ n. Bemærk at uligheden µ 1,96 σ n X 1,96 σ n i (3.13) kan omskrives til X 1,96 σ n µ X +1,96 σ n.

39 3.3. KONFIDENSINTERVAL 35 {eq:intprob} Sandsynligheden (3.13) kan derfor omskrives til ( P X 1,96 σ µ X +1,96 σ ) = 0,95. (3.14) n n Man kan tillægge formel (3.14) følgende fortolkning. Sandsynligheden for, at X antager en værdi x, således at intervallet givet ved x ± 1,96 σ n indeholder µ, er 95%. Definition 13 (Konfidensinterval) Intervallet [ x 1,96 σ n, x+1,96 σ n ] betegnes et 95% konfidensinterval for µ. De 95% omtales også som konfidensniveauet. Bemærk at i (3.15) benytter vi estimatet x og ikke estimatoren X som i (3.14). Konfidensintervallet i (3.15) kan tolkes på følgende måde. Antag vi observerer de n stokastiske variable k gange, dvs. vi får k observationsrækker med hver n tal. Hvermed fås k gennemsnit x 1,..., x k og k konfidensintervaller hørende til de k middelværdier. For k stor kan vi da forvente, at 95% af intervallerne indeholder µ. På helt analog måde kan man konstruere konfidensintervaller med andre konfidensnevauer (fx. 99%). (3.15) {eq:konfint}

40 36 KAPITEL 3. ESTIMATION

41 Kapitel 4 Fejlforplantning ved geometrisk nivellement 4.1 Geometisk nivellement Figur 4.1 illustrerer et geometrisk nivellement over en strækning l bestående af n opstillinger. {formler_geoniv} s t 1 f 1 t 2 f t 2 3 f 3 t 4 f 4 h t n f n l Figur 4.1: Principskitse af et geometrisk nivellement over en strækning l bestående af n opstillinger. fig:nivellement I den i te opstilling foretages der en stadieaflæsning ved tilbagesigte og fremsigte: t i er stadieaflæsningen ved tilbagesigtet. f i er stadieaflæsningen ved fremsigtet. Højdeforskel h fremkommer som: h = t i f 1 +t 2 f t n f n = [t f] (4.1) {eq:h_geoniv} 37

Noter i fejlteori. Kasper Klitgaard Berthelsen Poul Winding & Jens Møller Pedersen. Diverse opdateringer ved Rasmus Waagepetersen. Version 1.

Noter i fejlteori. Kasper Klitgaard Berthelsen Poul Winding & Jens Møller Pedersen. Diverse opdateringer ved Rasmus Waagepetersen. Version 1. Noter i fejlteori Kasper Klitgaard Berthelsen Poul Winding & Jens Møller Pedersen Diverse opdateringer ved Rasmus Waagepetersen. Version 1.3 April 2016 2 Indhold 1 Motivation 3 2 Det matematiske fundament

Læs mere

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet 1/41 Landmålingens fejlteori - lidt om kurset

Læs mere

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable Landmålingens fejlteori - lidt om kurset Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet Kursusholder

Læs mere

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable Landmålingens fejlteori Lektion 2 Transformation af stokastiske variable - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf12 Institut for Matematiske Fag Aalborg Universitet 1/31 Repetition:

Læs mere

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0. Landmålingens fejlteori Lektion 2 Transformation af stokastiske variable - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf12 Institut for Matematiske Fag Aalborg Universitet Repetition:

Læs mere

Noter i fejlteori. Kasper Klitgaard Berthelsen Poul Winding & Jens Møller Pedersen. Version 1.2

Noter i fejlteori. Kasper Klitgaard Berthelsen Poul Winding & Jens Møller Pedersen. Version 1.2 Noter i fejlteori Kasper Klitgaard Berthelsen Poul Winding & Jens Møller Pedersen Version 1.2 April 2014 2 Indhold 1 Motivation 3 2 Det matematiske fundament 5 2.1 Lidt sandsynlighedsregning......................

Læs mere

Note om Monte Carlo metoden

Note om Monte Carlo metoden Note om Monte Carlo metoden Kasper K. Berthelsen Version 1.2 25. marts 2014 1 Introduktion Betegnelsen Monte Carlo dækker over en lang række metoder. Fælles for disse metoder er, at de anvendes til at

Læs mere

Repetition Stokastisk variabel

Repetition Stokastisk variabel Repetition Stokastisk variabel Diskret stokastisk variabel Udfaldsrum endelige eller tællelige mange antal elementer Sandsynlighedsfunktion f(x) er ofte tabellagt Udregning af sandsynligheder P( a < X

Læs mere

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen Landmålingens fejlteori Lektion Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet En stokastisk variabel er en variabel,

Læs mere

Antag X 1, X 2,..., X n er n uafhængige stokastiske variable, hvor Var(X 1 )=σ 2 1,..., Var(X n )=σ 2 n.

Antag X 1, X 2,..., X n er n uafhængige stokastiske variable, hvor Var(X 1 )=σ 2 1,..., Var(X n )=σ 2 n. Simple fejlforplantningslov Landmålingens fejlteori Lektion 6 Den generelle fejlforplantningslov Antag X, X,, X n er n uafhængige stokastiske variable, hvor Var(X )σ,, Var(X n )σ n Lad Y g(x, X,, X n ),

Læs mere

Institut for Matematiske Fag Aalborg Universitet Specielt: Var(aX) = a 2 VarX 1/40. Lad X α, X β og X γ være stokastiske variable (vinkelmålinger) med

Institut for Matematiske Fag Aalborg Universitet Specielt: Var(aX) = a 2 VarX 1/40. Lad X α, X β og X γ være stokastiske variable (vinkelmålinger) med Repetition: Varians af linear kombination Landmålingens fejlteori Lektion 5 Fejlforplantning - rw@math.aau.dk Antag X 1, X,..., X n er uafhængige stokastiske variable, og Y er en linearkombination af X

Læs mere

Fejlforplantning. Landmålingens fejlteori - Lektion 5 - Fejlforplantning. Repetition: Varians af linear kombination. Eksempel: Vinkelberegning

Fejlforplantning. Landmålingens fejlteori - Lektion 5 - Fejlforplantning. Repetition: Varians af linear kombination. Eksempel: Vinkelberegning Fejlforplantning Landmålingens fejlteori Lektion 5 Fejlforplantning - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf13 Landmåling involverer ofte bestemmelse af størrelser som ikke kan

Læs mere

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M. Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet March 1, 2013 Sandsynlighedsregning og lagerstyring Normalfordelingen

Læs mere

Landmålingens fejlteori - Lektion 5 - Fejlforplantning

Landmålingens fejlteori - Lektion 5 - Fejlforplantning Landmålingens fejlteori Lektion 5 Fejlforplantning - kkb@math.aau.dk Institut for Matematiske Fag Aalborg Universitet 1/30 Fejlforplantning Landmåling involverer ofte bestemmelse af størrelser som ikke

Læs mere

Kvantitative Metoder 1 - Forår 2007

Kvantitative Metoder 1 - Forår 2007 Dagens program Afsnit 3.3-3.5 Varians Eksempel: Forventet nytte Kovarians og korrelation Middelværdi og varians af summer af stokastiske variabler Eksempel: Porteføljevalg 1 Beskrivelse af fordelinger

Læs mere

Landmålingens fejlteori - Lektion 3. Estimation af σ Dobbeltmålinger Geometrisk nivellement Linearisering

Landmålingens fejlteori - Lektion 3. Estimation af σ Dobbeltmålinger Geometrisk nivellement Linearisering Landmålingens fejlteori Lektion 3 Estimation af σ Dobbeltmålinger Geometrisk nivellement Linearisering - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet 1/31 Repetition: Middelværdi og

Læs mere

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen Statistik Lektion 3 Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen Repetition En stokastisk variabel er en funktion defineret på S (udfaldsrummet, der antager

Læs mere

Elementær sandsynlighedsregning

Elementær sandsynlighedsregning Elementær sandsynlighedsregning Sandsynlighedsbegrebet Et udfaldsrum S er mængden af alle de mulige udfald af et eksperiment. En hændelse A er en delmængde af udfaldsrummet S. Den hændelse, der ikke indeholder

Læs mere

Elementær sandsynlighedsregning

Elementær sandsynlighedsregning Elementær sandsynlighedsregning Sandsynlighedsbegrebet Et udfaldsrum S er mængden af alle de mulige udfald af et eksperiment. En hændelse A er en delmængde af udfaldsrummet S. Et sandsynlighedsmål er en

Læs mere

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 3: Kontinuerte fordelinger. Per Bruun Brockhoff

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 3: Kontinuerte fordelinger. Per Bruun Brockhoff Course 242/2323 Introducerende Statistik Forelæsning 3: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 22 Danmarks Tekniske Universitet 28 Lyngby Danmark

Læs mere

Produkt og marked - matematiske og statistiske metoder

Produkt og marked - matematiske og statistiske metoder Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring

Læs mere

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model Reminder: Hypotesetest for én parameter Antag vi har model Økonometri: Lektion 4 F -test Justeret R 2 Aymptotiske resultater y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi ønsker at teste hypotesen H

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Kombinatorik. Eksempel 2: En mand har 7 par bukser og 10 skjorter. Skal han både vælge en skjorte og et par bukser, så har han 10. 7=70 mulige valg.

Kombinatorik. Eksempel 2: En mand har 7 par bukser og 10 skjorter. Skal han både vælge en skjorte og et par bukser, så har han 10. 7=70 mulige valg. Noter til Biomat, 005. Kombinatorik. - eller kunsten at tælle. Alle tal i kombinatorik-afsnittet er hele og ikke-negative. Additionsprincippet enten - eller : Antag vi enten skal lave et valg med m muligheder

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Sandsynlighedsregning Oversigt over begreber og fordelinger

Sandsynlighedsregning Oversigt over begreber og fordelinger Tue Tjur Marts 2007 Sandsynlighedsregning Oversigt over begreber og fordelinger Stat. MØK 2. år Kapitel : Sandsynlighedsfordelinger og stokastiske variable En sandsynlighedsfunktion på en mængde E (udfaldsrummet)

Læs mere

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x) Formelsamlingen 1 Regneregler for middelværdier M(a + bx) a + bm X M(X+Y) M X +M Y Spredning varians og standardafvigelse VAR(X) 1 n n i1 ( X i - M x ) 2 Y a + bx VAR(Y) VAR(a+bX) b²var(x) 2 Kovariansen

Læs mere

Nanostatistik: Middelværdi og varians

Nanostatistik: Middelværdi og varians Nanostatistik: Middelværdi og varians JLJ Nanostatistik: Middelværdi og varians p. 1/28 Repetition Stokastisk variabel: funktion fra udfaldsrum over i de hele tal eller over i de reelle tal Ex: Ω = alle

Læs mere

Et eksempel på en todimensional normalfordeling Anders Milhøj September 2006

Et eksempel på en todimensional normalfordeling Anders Milhøj September 2006 Et eksempel på en todimensional normalfordeling Anders Milhøj September 006 I dette notat gennemgås et eksempel, der illustrerer den todimensionale normalfordelings egenskaber. Notatet lægger sig op af

Læs mere

Middelværdi og varians. Kovarians. korrelation = 0.02 korrelation = 0.7 korrelation = 1.0

Middelværdi og varians. Kovarians. korrelation = 0.02 korrelation = 0.7 korrelation = 1.0 Middelværdi og varians Middelværdien af en diskret skalarfunktion f(x), for x = 0, N er: µ = N f(x) N x=0 For vektorfuktioner er middelværdivektoren tilsvarende: µ = N f(x) N x=0 Middelværdien er en af

Læs mere

Definition. Definitioner

Definition. Definitioner Definition Landmålingens fejlteori Lektion Diskrete stokastiske variable En reel funktion defineret på et udfaldsrum (med sandsynlighedsfordeling) kaldes en stokastisk variabel. - kkb@math.aau.dk http://people.math.aau.dk/

Læs mere

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006 PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006 I dag: To stikprøver fra en normalfordeling, ikke-parametriske metoder og beregning af stikprøvestørrelse Eksempel: Fiskeolie

Læs mere

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium Deskriptiv (beskrivende) statistik er den disciplin, der trækker de væsentligste oplysninger ud af et ofte uoverskueligt materiale. Det sker f.eks. ved at konstruere forskellige deskriptorer, d.v.s. regnestørrelser,

Læs mere

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Introduktion Kasper K. Berthelsen, Inst f. Matematiske Fag Omfang: 8 Kursusgang I fremtiden

Læs mere

Landmålingens fejlteori - Repetition - Kontinuerte stokastiske variable - Lektion 3

Landmålingens fejlteori - Repetition - Kontinuerte stokastiske variable - Lektion 3 Landmålingens fejlteori Repetition - Kontinuerte stokastiske variable Lektion 4 - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf10 Institut for Matematiske Fag Aalborg Universitet 29. april

Læs mere

Statistiske modeller

Statistiske modeller Statistiske modeller Statistisk model Datamatrice Variabelmatrice Hændelse Sandsynligheder Data Statistiske modeller indeholder: Variable Hændelser defineret ved mulige variabel værdier Sandsynligheder

Læs mere

Kvantitative Metoder 1 - Forår Dagens program

Kvantitative Metoder 1 - Forår Dagens program Dagens program Kontinuerte fordelinger Simultane fordelinger Kovarians og korrelation Uafhængighed Betingede fordelinger - Middelværdi og varians - Sammenhæng med uafhængighed 1 Figur 1: En tæthedsfunktion

Læs mere

Teoretisk Statistik, 16. februar Generel teori,repetition

Teoretisk Statistik, 16. februar Generel teori,repetition 1 Uge 8 Teoretisk Statistik, 16. februar 2004 1. Generel teori, repetition 2. Diskret udfaldsrum punktssh. 3. Fordelingsfunktionen 4. Tæthed 5. Transformationer 6. Diskrete vs. Kontinuerte stokastiske

Læs mere

Note til styrkefunktionen

Note til styrkefunktionen Teoretisk Statistik. årsprøve Note til styrkefunktionen Først er det vigtigt at gøre sig klart, at når man laver statistiske test, så kan man begå to forskellige typer af fejl: Type fejl: At forkaste H

Læs mere

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede fordelinger (kap. 4) Middelværdi og varians (kap. 3-4) Fordelingsresultater

Læs mere

Motivation. Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser

Motivation. Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser Motivation Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser Rasmus Waagepetersen October 26, 2018 Eksempel: En landmåler får til opgave at måle længden λ fra A til B. Entreprenøren

Læs mere

Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl

Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl Landmålingens fejlteori Lektion 4 Vægtet gennemsnit Fordeling af slutfejl - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet 1/36 Estimation af varians/spredning Antag X 1,...,X n stokastiske

Læs mere

hvor a og b er konstanter. Ved middelværdidannelse fås videre

hvor a og b er konstanter. Ved middelværdidannelse fås videre Uge 3 Teoretisk Statistik. marts 004. Korrelation og uafhængighed, repetition. Eksempel fra sidste gang (uge ) 3. Middelværdivektor, kovarians- og korrelationsmatrix 4. Summer af stokastiske variable 5.Den

Læs mere

3 Stokastiske variable 3.1 Diskrete variable

3 Stokastiske variable 3.1 Diskrete variable 3 Stokastiske variable 3.1 Diskrete variable Punktsandsnligheden benævnes P(x) = P(X = x). {x, P(x)} er en sandsnlighedsfordeling for den stokastiske variabel, X, hvis 1) P(x) $ 0 for alle værdier af x.

Læs mere

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

StatDataN: Middelværdi og varians

StatDataN: Middelværdi og varians StatDataN: Middelværdi og varians JLJ StatDataN: Middelværdi og varians p. 1/33 Repetition Stokastisk variabel: funktion fra udfaldsrum over i de hele tal eller over i de reelle tal Ex: Ω = alle egetræer,

Læs mere

Supplement til kapitel 4 Om sandsynlighedsmodeller for flere stokastiske variable

Supplement til kapitel 4 Om sandsynlighedsmodeller for flere stokastiske variable IMM, 00--6 Poul Thyregod Supplement til kapitel 4 Om sandsynlighedsmodeller for flere stokastiske variable Todimensionale stokastiske variable Lærebogens afsnit 4 introducerede sandsynlighedsmodeller formuleret

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på

Læs mere

Statistik og Sandsynlighedsregning 2

Statistik og Sandsynlighedsregning 2 Statistik og Sandsynlighedsregning 2 Lineære transformationer, middelværdi og varians Helle Sørensen Uge 8, onsdag SaSt2 (Uge 8, onsdag) Lineære transf. og middelværdi 1 / 15 Program I formiddag: Fordeling

Læs mere

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable Normal fordelingen Normal fordelingen Egenskaber ved normalfordelingen Standard normal fordelingen Find sandsynligheder ud fra tabel Transformation af normal fordelte variable Invers transformation Repetition

Læs mere

Normalfordelingen og Stikprøvefordelinger

Normalfordelingen og Stikprøvefordelinger Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger

Læs mere

Produkt og marked - matematiske og statistiske metoder

Produkt og marked - matematiske og statistiske metoder Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 11, 2016 1/22 Kursusindhold: Sandsynlighedsregning og lagerstyring

Læs mere

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks

Læs mere

Kvantitative Metoder 1 - Forår Dagens program

Kvantitative Metoder 1 - Forår Dagens program Dagens program Afsnit 6.1 Den standardiserede normalfordeling Normalfordelingen Beskrivelse af normalfordelinger: - Tæthed og fordelingsfunktion - Middelværdi, varians og fraktiler Lineære transformationer

Læs mere

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M. Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 9, 2015 Sandsynlighedsregning og lagerstyring Normalfordelingen

Læs mere

4 Oversigt over kapitel 4

4 Oversigt over kapitel 4 IMM, 2002-09-14 Poul Thyregod 4 Oversigt over kapitel 4 Introduktion Hidtil har vi beskæftiget os med data. Når data repræsenterer gentagne observationer (i bred forstand) af et fænomen, kan det være bekvemt

Læs mere

Kvantitative Metoder 1 - Forår 2007

Kvantitative Metoder 1 - Forår 2007 Dagens program Kapitel 8.7, 8.8 og 8.10 Momenter af gennemsnit og andele kap. 8.7 Eksempel med simulationer Den centrale grænseværdisætning (Central Limit Theorem) kap. 8.8 Simulationer Normalfordelte

Læs mere

INSTITUT FOR MATEMATISKE FAG c

INSTITUT FOR MATEMATISKE FAG c INSTITUT FOR MATEMATISKE FAG c AALBORG UNIVERSITET FREDRIK BAJERS VEJ 7 G 9220 AALBORG ØST Tlf.: 96 35 89 27 URL: www.math.aau.dk Fax: 98 15 81 29 E-mail: bjh@math.aau.dk Dataanalyse Sandsynlighed og stokastiske

Læs mere

i x-aksens retning, så fås ). Forskriften for g fås altså ved i forskriften for f at udskifte alle forekomster af x med x x 0

i x-aksens retning, så fås ). Forskriften for g fås altså ved i forskriften for f at udskifte alle forekomster af x med x x 0 BAndengradspolynomier Et polynomium er en funktion på formen f ( ) = an + an + a+ a, hvor ai R kaldes polynomiets koefficienter. Graden af et polynomium er lig med den højeste potens af, for hvilket den

Læs mere

Kvantitative Metoder 1 - Efterår Dagens program

Kvantitative Metoder 1 - Efterår Dagens program Dagens program Afsnit 6.1. Ligefordelinger, fra sidst Den standardiserede normalfordeling Normalfordelingen Beskrivelse af normalfordelinger: - Tæthed og fordelingsfunktion - Middelværdi, varians og fraktiler

Læs mere

Vægte motiverende eksempel. Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl. Vægtet model. Vægtrelationen

Vægte motiverende eksempel. Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl. Vægtet model. Vægtrelationen Vægte motiverende eksempel Landmålingens fejlteori Lektion 4 Vægtet gennemsnit Fordeling af slutfejl - kkb@mathaaudk Institut for Matematiske Fag Aalborg Universitet Højdeforskellen mellem punkterne P

Læs mere

Susanne Ditlevsen Institut for Matematiske Fag susanne

Susanne Ditlevsen Institut for Matematiske Fag     susanne Statistik og Sandsynlighedsregning 1 Repetition MS kapitel 1 3 Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne Hvad er sandsynlighed? - beskriver systemer

Læs mere

Sandsynlighedsregning Stokastisk variabel

Sandsynlighedsregning Stokastisk variabel Sandsynlighedsregning Stokastisk variabel I eksperimenter knyttes ofte en talværdi til hvert udfald. S s X(s) R Definition: En stokastisk variabel X er en funktion defineret på S, der antager værdier på

Læs mere

Betingede sandsynligheder Aase D. Madsen

Betingede sandsynligheder Aase D. Madsen 1 Uge 12 Teoretisk Statistik 15. marts 2004 1. Betingede sandsynligheder Definition Loven om den totale sandsynlighed Bayes formel 2. Betinget middelværdi og varians 3. Kovarians og korrelationskoefficient

Læs mere

Statistik. Hjemmeside: kkb. Statistik - lektion 1 p.1/22

Statistik. Hjemmeside:  kkb. Statistik - lektion 1 p.1/22 Statistik Kursets omfang: 2 ECTS Inklusiv mini-projekt! Bog: Complete Business Statistics, AD Aczel & J. Sounderpandian Software: SPSS eller Excel?? Forelæser: Kasper K. Berthelsen E-mail: kkb@math.aau.dk

Læs mere

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 33B, Rum 9 Danmarks Tekniske Universitet 28 Lyngby Danmark e-mail: pbac@dtu.dk Efterår

Læs mere

Kvantitative Metoder 1 - Efterår Dagens program

Kvantitative Metoder 1 - Efterår Dagens program Dagens program Afsnit 3.1-3.2 Middelværdi -Definition - Regneregler Betinget middelværdi Middelværdier af funktioner af stokastiske variable Loven om den itererede middelværdi Eksempler 1 Beskrivelse af

Læs mere

Kvantitative Metoder 1 - Forår Dagens program

Kvantitative Metoder 1 - Forår Dagens program Dagens program Afsnit 3.1-3.2 Middelværdi -Definition - Regneregler Betinget middelværdi Middelværdier af funktioner af stokastiske variabler Loven om den itererede middelværdi Eksempler 1 Beskrivelse

Læs mere

Komplekse Tal. 20. november 2009. UNF Odense. Steen Thorbjørnsen Institut for Matematiske Fag Århus Universitet

Komplekse Tal. 20. november 2009. UNF Odense. Steen Thorbjørnsen Institut for Matematiske Fag Århus Universitet Komplekse Tal 20. november 2009 UNF Odense Steen Thorbjørnsen Institut for Matematiske Fag Århus Universitet Fra de naturlige tal til de komplekse Optælling af størrelser i naturen De naturlige tal N (N

Læs mere

Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne

Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne Statistik og Sandsynlighedsregning 1 Indledning til statistik, kap 2 i STAT Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne 5. undervisningsuge, onsdag

Læs mere

4. september 2003. π B = Lungefunktions data fra tirsdags Gennemsnit l/min

4. september 2003. π B = Lungefunktions data fra tirsdags Gennemsnit l/min Epidemiologi og biostatistik Uge, torsdag 28. august 2003 Morten Frydenberg, Institut for Biostatistik. og hoste estimation sikkerhedsintervaller antagelr Normalfordelingen Prædiktion Statistisk test (udfra

Læs mere

Sandsynlighedsregning: endeligt udfaldsrum (repetition)

Sandsynlighedsregning: endeligt udfaldsrum (repetition) Program: 1. Repetition: sandsynlighedsregning 2. Sandsynlighedsregning fortsat: stokastisk variabel, sandsynlighedsfunktion/tæthed, fordelingsfunktion. 1/16 Sandsynlighedsregning: endeligt udfaldsrum (repetition)

Læs mere

MM501 forelæsningsslides

MM501 forelæsningsslides MM501 forelæsningsslides uge 40, 2010 Produceret af Hans J. Munkholm bearbejdet af JC 1 Separabel 1. ordens differentialligning En generel 1. ordens differentialligning har formen s.445-8 dx Eksempler

Læs mere

Bilag A. Dexia-obligationen (2002/2007 Basis)

Bilag A. Dexia-obligationen (2002/2007 Basis) Bilag A Dexia-obligationen (2002/2007 Basis) Også kaldet A.P. Møller aktieindekseret obligation (A/S 1912 B). Dette værdipapir som i teorien handles på Københavns Fondsbørs (omend med meget lille omsætning)

Læs mere

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen Anvendt Matematik og Computer Science Danmarks Tekniske Universitet 2800 Kgs. Lyngby Danmark Email: bfni@dtu.dk Dagens emner: Afsnit 3.3 og 3.4 Varians/standardafvigelse

Læs mere

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts. Teoretisk Statistik, 9 marts 2005 Empiriske analoger (Kap. 3.7) Normalfordelingen (Kap. 3.12) Opsamling på Kap. 3 nb. Det forventes ikke, at alt materialet dækkes d. 9. marts. 1 Empiriske analoger Betragt

Læs mere

Statistik Lektion 2. Betinget sandsynlighed Bayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV Binomialfordelingen

Statistik Lektion 2. Betinget sandsynlighed Bayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV Binomialfordelingen Statistik Lektion etinget sandsynlighed ayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV inomialfordelingen Repetition Udfaldsrum S Hændelse S Simpel hændelse O i 1, 3 4,

Læs mere

Kvantitative Metoder 1 - Forår 2007

Kvantitative Metoder 1 - Forår 2007 Dagens program Estimation: Kapitel 9.1-9.3 Estimation Estimationsfejlen Bias Eksempler Bestemmelse af stikprøvens størrelse Konsistens De nitioner påkonsistens Eksempler på konsistente og middelrette estimatorer

Læs mere

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen Anvendt Matematik og Computer Science Danmarks Tekniske Universitet 2800 Kgs. Lyngby Danmark Email: bfni@dtu.dk Dagens emner: Afsnit 3.3 og 3.4 Varians/standardafvigelse

Læs mere

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen Anvendt Matematik og Computer Science Danmarks Tekniske Universitet 2800 Kgs. Lyngby Danmark Email: bfni@dtu.dk Dagens emner: Afsnit 3.3 og 3.4 Varians/standardafvigelse

Læs mere

Note om Monte Carlo eksperimenter

Note om Monte Carlo eksperimenter Note om Monte Carlo eksperimenter Mette Ejrnæs og Hans Christian Kongsted Økonomisk Institut, Københavns Universitet 9. september 003 Denne note er skrevet til kurset Økonometri på. årsprøve af polit-studiet.

Læs mere

Sandsynlighedsregning 11. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 11. forelæsning Bo Friis Nielsen Sandsynlighedsregning 11. forelæsning Bo Friis Nielsen Matematik og Computer Science Danmarks Tekniske Universitet 28 Kgs. Lyngby Danmark Email: bfni@imm.dtu.dk Dagens nye emner afsnit 6.3 (og 6.4 Betingede

Læs mere

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd I dag Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik SaSt) Helle Sørensen Først lidt om de sidste uger af SaSt. Derefter statistisk analyse af en enkelt

Læs mere

Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl

Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl Landmålingens fejlteori Lektion 4 Vægtet gennemsnit Fordeling af slutfejl - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf13 Institut for Matematiske Fag Aalborg Universitet 1/1 Vægtet

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

Kapitel 4 Sandsynlighed og statistiske modeller

Kapitel 4 Sandsynlighed og statistiske modeller Kapitel 4 Sandsynlighed og statistiske modeller Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 Indledning 2 Sandsynlighed i binomialfordelingen 3 Normalfordelingen 4 Modelkontrol

Læs mere

Program. Statistik og Sandsynlighedsregning. Eksempler. Sandsynlighedstæthed og sandsynlighedsmål

Program. Statistik og Sandsynlighedsregning. Eksempler. Sandsynlighedstæthed og sandsynlighedsmål Program Statistik og Sandsynlighedsregning Sandsynlighedstætheder og kontinuerte fordelinger på R Varians og middelværdi Normalfordelingen Susanne Ditlevsen Uge 48, tirsdag Tætheder og fordelingsfunktioner

Læs mere

Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen

Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen Repetition Lov om total sandsynlighed Bayes sætning P( B A) = P(A) = P(AI B) + P(AI P( A B) P( B) P( A B) P( B) +

Læs mere

Sandsynlighedsregning 2. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 2. forelæsning Bo Friis Nielsen Vigtigste nye emner i.,. og.5 Sandsynlighedsregning. forelæsning Bo Friis Nielsen Anvendt Matematik og Computer Siene Danmarks Tekniske Universitet 800 Kgs. Lyngby Danmark Email: bfni@dtu.dk Binomialfordelingen

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Anvendt Statistik Lektion 2 Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Sandsynlighed: Opvarmning Udfald Resultatet af et eksperiment kaldes et udfald. Eksempler:

Læs mere

Landmålingens fejlteori - Repetition - Fordeling af slutfejl - Lektion 8

Landmålingens fejlteori - Repetition - Fordeling af slutfejl - Lektion 8 Landmålingens fejlteori Repetition - Fordeling af slutfejl Lektion 8 - tvede@math.aau.dk http://www.math.aau.dk/ tvede/teaching/l4 Institut for Matematiske Fag Aalborg Universitet 15. maj 2008 1/13 Fordeling

Læs mere

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som MLR antagelserne Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + u, hvor β 0, β 1, β 2,...,β k er ukendte parametere,

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Eksempel på logistisk vækst med TI-Nspire CAS

Eksempel på logistisk vækst med TI-Nspire CAS Eksempel på logistisk vækst med TI-Nspire CAS Tabellen herunder viser udviklingen af USA's befolkning fra 1850-1910 hvor befolkningstallet er angivet i millioner: Vi har tidligere redegjort for at antallet

Læs mere

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i. Repetition af vektor-regning Økonometri: Lektion 3 Matrix-formulering Fordelingsantagelse Hypotesetest Antag vi har to n-dimensionelle (søjle)vektorer a 1 b 1 a 2 a =. og b = b 2. a n b n Tænk på a og

Læs mere

Monotoniforhold Der gælder følgende sætninger om en differentiabel funktions monotoniforhold:

Monotoniforhold Der gælder følgende sætninger om en differentiabel funktions monotoniforhold: Side 21 Oversigt over undervisningen i matematik - 2x 05/06 Der undervises efter: Claus Jessen, Peter Møller og Flemming Mørk : Tal, Geometri og funktioner. Gyldendal 1997 Claus Jessen, Peter Møller og

Læs mere

Modul 3: Kontinuerte stokastiske variable

Modul 3: Kontinuerte stokastiske variable Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 3: Kontinuerte stokastiske variable 3.1 Kontinuerte stokastiske variable........................... 1 3.1.1 Tæthedsfunktion...............................

Læs mere

Maple 11 - Chi-i-anden test

Maple 11 - Chi-i-anden test Maple 11 - Chi-i-anden test Erik Vestergaard 2014 Indledning I dette dokument skal vi se hvordan Maple kan bruges til at løse opgaver indenfor χ 2 tests: χ 2 - Goodness of fit test samt χ 2 -uafhængighedstest.

Læs mere

Lineære ligningssystemer

Lineære ligningssystemer enote 2 1 enote 2 Lineære ligningssystemer Denne enote handler om lineære ligningssystemer, om metoder til at beskrive dem og løse dem, og om hvordan man kan få overblik over løsningsmængdernes struktur.

Læs mere