Matematisk Modellering 1 Cheat Sheet

Relaterede dokumenter
Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

Tema. Dagens tema: Indfør centrale statistiske begreber.

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kvantitative Metoder 1 - Forår 2007

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Eksamen i Statistik for biokemikere. Blok

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Produkt og marked - matematiske og statistiske metoder

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm

Stastistik og Databehandling på en TI-83

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

Løsninger til kapitel 9

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Model. (m separate analyser). I vores eksempel er m = 2, n 1 = 13 (13 journalister) og

Note om Monte Carlo metoden

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Forelæsning 11: Kapitel 11: Regressionsanalyse

Module 12: Mere om variansanalyse

Uge 10 Teoretisk Statistik 1. marts 2004

En Introduktion til SAS. Kapitel 5.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Elementær sandsynlighedsregning

Statistik og Sandsynlighedsregning 2

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Elementær sandsynlighedsregning

a) Har måleresultaterne for de 2 laboranter samme varians? b) Tyder resultaterne på, at nogen af laboranterne måler med en systematisk fejl?

Løsning til eksaminen d. 29. maj 2009

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Sandsynlighedsregning

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Module 4: Ensidig variansanalyse

Løsning eksamen d. 15. december 2008

Skriftlig eksamen Science statistik- ST501

Forsøgsplanlægning Stikprøvestørrelse

Kvantitative metoder 2

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Løsninger til kapitel 6

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

Løsning til eksamen d.27 Maj 2010

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Opgaver til kapitel 3

Modul 12: Regression og korrelation

Løsning til eksaminen d. 14. december 2009

Forelæsning 11: Envejs variansanalyse, ANOVA

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Transkript:

By a team of brave computer scientists: Mads P. Buch, Tobias Brixen, Troels Thorsen, Peder Detlefsen, Mark Gottenborg, Peter Krogshede - 1

Contents 1 Basalt 3 1.1 Varianser............................... 3 1.2 Middelværdier............................ 3 1.3 α.................................... 3 1.4 β.................................... 3 1.5 F-test................................. 3 2 En observationsrække 3 2.1 Main points.............................. 3 2.2 Fraktildiagram............................ 3 2.3 Estimer varians og middelværdi................... 4 2.4 Konfidensinterval........................... 4 2.5 SAS.................................. 4 3 To observationsrækker 5 3.1 Main points.............................. 5 3.2 Homogenitet............................. 5 3.3 Estimater............................... 5 3.4 Konfidensintervaller......................... 5 3.5 SAS.................................. 6 4 Flere Observationsrækker 6 4.1 Main points.............................. 6 5 Lineær regression 6 5.1 Main points.............................. 6 5.2 Test.................................. 6 6 Multinomialfordelingen 7 6.1 Test.................................. 7 6.2 Likelihood............................... 7 7 Likelihood teori 7 7.1 Likelighood ligning.......................... 7 7.2 Handy formler............................ 7 7.3 Ln regneregler............................. 7 7.4 Maksumum likelihood........................ 7 7.5 Differentiering............................. 8 8 Lommeregner 8 9 Fordelinger 8 Side 2 af 8

1 Basalt 1.1 Varianser estimerede varians = emperisk varians, man siger σ 2 s 2 σ 2 χ 2 (frihedsgrader)/frihedsgrader Variansen er også kendt som mean square. se s. 78 og/eller 125.n 1.2 Middelværdier estimerede middelværdi µ x. N(µ, σ 2 /n) se side 78 1.3 α fordeling s. 155, gider ikke skrive den ind :/ 1.4 β Fordeling s. 155, gider ikke skrive den ind :/ 1.5 F-test tester hvor langt to fordelinger er fra hinanden P obs = 1 F (f 02 f 01, f 01 ) hvor f 02 er fra framodellen og f 01 er fra tilmodellen 2 En observationsrække 2.1 Main points Findes på side 78. Her er lidt ekstra facts: S er sum af observationer s 2 er estimat af varians (empiriske varians) σ er spredning σ 2 er varians 2.2 Fraktildiagram Beregningsskema på s. 31. OBS! Det p 1 der bruges i Φ 1 er p 1 i den forgående søjle divederet med 100. Side 3 af 8

Virtuel test for normaldata Det kan antages at data er normalfordelte hvis de ikke afviger systematisk fra en ret linje på sandsynlighedspapir. Middelværdien kan ca aflæses som x værdien ved y = 0. Her ca 10 (beregnet til 10.82) 2.3 Estimer varians og middelværdi Se fordelinger i main points Middelværdi Første formel på s. 64 Varians Formel fra side 64 for s 2 Frihedsværdier: f = n 1 2.4 Konfidensinterval s 2 = 1 S2 (USS n 1 n ) For 95% konfidensinterval skal α = 0.05 så (1 α) = (1 0.05) = 0.95. For fomler se main points. 2.5 SAS Her skal være et ScreenShot af fra en aflevering med ring om hvad vi kan læse ud fra det. Side 4 af 8

3 To observationsrækker 3.1 Main points Findes på side 94. 3.2 Homogenitet Test for homogenitet for σ 2 og µ findes i main points. 3.3 Estimater Alt efter model, kan man bruge disse estimater: σ 2 i s 2 (i) = 1 n i 1 (USS i S2 i n i ) σ 2 χ 2 (f (i) )/f (i) Hvor f 1 = f (1) + f (2) = n. 2 µ i x i. = S i n i N(µ i, σ2 i n i ) σ 2 s 2 1 = f (1)s 2 (1) + f (2)f 2 (2) f (1) + f (2) σ 2 χ 2 (f 1 )/f 1 3.4 Konfidensintervaller µ x.. = S 1 + S 2 n 1 + n 2 N(µ, σ2 n. ) Brug formlerne fra én observationsrække på side 79. Fælles varians [ C 95% (σ 2 f 1 s 2 1 ) = χ 2 0.975 (f 1), f 1 s 2 ] 1 χ 2 0.025 (f 1) Forskellig varians C 95% (σ 2 i ) = [ f (i) s 2 (i) χ 2 0.975 (f (i)), f (i) s 2 ] (i) χ 2 0.025 (f (i)) Fælles (og forskellig) middelværdi (varians ukendt) [ s 2 1 s 2 ] 1 C 95% (µ (i) ) = x i. t 0.975, x i. + t 0.975 n i n i Hvis der er fælles middelværdi, brug da x.. Side 5 af 8

3.5 SAS 4 Flere Observationsrækker 4.1 Main points Findes på side 114. Udregninger med USS, S & n findes på side 116. 5 Lineær regression 5.1 Main points Findes på side 155. comparison of regression lines: s. 187 5.2 Test Ens varians for 2 regressioner: Vi går fra modellen M 0 til M 1 ved at lave F-test fra Main Points s. 94. Skema til beregninger og i lineære regressioner og fordelinger for parametre findes på s. 125. Side 6 af 8

6 Multinomialfordelingen 6.1 Test først skal der regnes en -2lnQ(x) værdi, til det kan formlem på side 344 bruges. Pobs er herefter = 1 F X 2 (k 1 a)( 2lnQ(x)) (Hvilket svarer til CDF(ChiSquareDistribution(k- 1-a)),-2lnQ(x)) 6.2 Likelihood for at finde likelihood funktionen for en Multinomial distribution, se s.305m, husk at brøken kan forkortes som på s.301m 7 Likelihood teori Likelighood funktionen er sandsynlighedsfunktionen (PDF). Hvis dert er over flere, er det produktet af sandsynlighedsfunktionerne. 7.1 Likelighood ligning differentier logarritmen til likelihood funktionen 7.2 Handy formler ( 1 ) 3 ( 1 ) 3 ( y = = y 1 1/2) 3 ( = y 1) 1/2 3 ( 1 ) 3/2 = y 1/2 y Likelihood funktionen er tæthedsfunktionerne ganget samme. Tæthedsfunktionen for en normalfordeling: f X (x) = 1 (x µ)2 e 2σ 2 2πσ 2 7.3 Ln regneregler ln(e x ) = x e ln(x) = x ln(x y) = ln(x) + ln(y) ln(x / y) = ln(x) ln(y) ln(x y ) = y ln(x) ln(1) = 0 7.4 Maksumum likelihood Udled Log(L(x)) (Log likelihood), find derefter maksimum af funktionen: Dette kan gøres ved at sætte den differentierede funktion til 0, og ulede variablen derefter. Husk at tjekke at resultatets differentiering er 0 for at tjekke af det er maksimum funktionen. Side 7 af 8

7.5 Differentiering Bl.a. flip af param inde i ln 8 Lommeregner Generelt for TI-89: Catalog = F3 = Brug alpha til at finde funktionen Funktion TI-89 TI-Tobias Φ 1 (p) invnorm(p) placeholder Φ(p) normcdf(-,p) placeholder F χ 2 (k 1)(Ba) chi2cdf(0,ba,k-1) placeholder F F (k 1,n. k) (F ) FCdf(-,F,k-1,n.-k) placeholder t 1 α/2 (f) inv t(-,α/2,f) placeholder u 1 α/2 invnorm(α/2,0,1) placeholder χ 2 1 α/2 (f) invchi2(1-α/2,f) placeholder 9 Fordelinger Hvis det gælder at X. N(u, o) X. N(u, o/n) Side 8 af 8