Matematisk Modellering 1 Cheat Sheet

By a team of brave computer scientists: Mads P. Buch, Tobias Brixen, Troels Thorsen, Peder Detlefsen, Mark Gottenborg, Peter Krogshede - 1

Contents 1 Basalt 3 1.1 Varianser............................... 3 1.2 Middelværdier............................ 3 1.3 α.................................... 3 1.4 β.................................... 3 1.5 F-test................................. 3 2 En observationsrække 3 2.1 Main points.............................. 3 2.2 Fraktildiagram............................ 3 2.3 Estimer varians og middelværdi................... 4 2.4 Konfidensinterval........................... 4 2.5 SAS.................................. 4 3 To observationsrækker 5 3.1 Main points.............................. 5 3.2 Homogenitet............................. 5 3.3 Estimater............................... 5 3.4 Konfidensintervaller......................... 5 3.5 SAS.................................. 6 4 Flere Observationsrækker 6 4.1 Main points.............................. 6 5 Lineær regression 6 5.1 Main points.............................. 6 5.2 Test.................................. 6 6 Multinomialfordelingen 7 6.1 Test.................................. 7 6.2 Likelihood............................... 7 7 Likelihood teori 7 7.1 Likelighood ligning.......................... 7 7.2 Handy formler............................ 7 7.3 Ln regneregler............................. 7 7.4 Maksumum likelihood........................ 7 7.5 Differentiering............................. 8 8 Lommeregner 8 9 Fordelinger 8 Side 2 af 8

1 Basalt 1.1 Varianser estimerede varians = emperisk varians, man siger σ 2 s 2 σ 2 χ 2 (frihedsgrader)/frihedsgrader Variansen er også kendt som mean square. se s. 78 og/eller 125.n 1.2 Middelværdier estimerede middelværdi µ x. N(µ, σ 2 /n) se side 78 1.3 α fordeling s. 155, gider ikke skrive den ind :/ 1.4 β Fordeling s. 155, gider ikke skrive den ind :/ 1.5 F-test tester hvor langt to fordelinger er fra hinanden P obs = 1 F (f 02 f 01, f 01 ) hvor f 02 er fra framodellen og f 01 er fra tilmodellen 2 En observationsrække 2.1 Main points Findes på side 78. Her er lidt ekstra facts: S er sum af observationer s 2 er estimat af varians (empiriske varians) σ er spredning σ 2 er varians 2.2 Fraktildiagram Beregningsskema på s. 31. OBS! Det p 1 der bruges i Φ 1 er p 1 i den forgående søjle divederet med 100. Side 3 af 8

Virtuel test for normaldata Det kan antages at data er normalfordelte hvis de ikke afviger systematisk fra en ret linje på sandsynlighedspapir. Middelværdien kan ca aflæses som x værdien ved y = 0. Her ca 10 (beregnet til 10.82) 2.3 Estimer varians og middelværdi Se fordelinger i main points Middelværdi Første formel på s. 64 Varians Formel fra side 64 for s 2 Frihedsværdier: f = n 1 2.4 Konfidensinterval s 2 = 1 S2 (USS n 1 n ) For 95% konfidensinterval skal α = 0.05 så (1 α) = (1 0.05) = 0.95. For fomler se main points. 2.5 SAS Her skal være et ScreenShot af fra en aflevering med ring om hvad vi kan læse ud fra det. Side 4 af 8

3 To observationsrækker 3.1 Main points Findes på side 94. 3.2 Homogenitet Test for homogenitet for σ 2 og µ findes i main points. 3.3 Estimater Alt efter model, kan man bruge disse estimater: σ 2 i s 2 (i) = 1 n i 1 (USS i S2 i n i ) σ 2 χ 2 (f (i) )/f (i) Hvor f 1 = f (1) + f (2) = n. 2 µ i x i. = S i n i N(µ i, σ2 i n i ) σ 2 s 2 1 = f (1)s 2 (1) + f (2)f 2 (2) f (1) + f (2) σ 2 χ 2 (f 1 )/f 1 3.4 Konfidensintervaller µ x.. = S 1 + S 2 n 1 + n 2 N(µ, σ2 n. ) Brug formlerne fra én observationsrække på side 79. Fælles varians [ C 95% (σ 2 f 1 s 2 1 ) = χ 2 0.975 (f 1), f 1 s 2 ] 1 χ 2 0.025 (f 1) Forskellig varians C 95% (σ 2 i ) = [ f (i) s 2 (i) χ 2 0.975 (f (i)), f (i) s 2 ] (i) χ 2 0.025 (f (i)) Fælles (og forskellig) middelværdi (varians ukendt) [ s 2 1 s 2 ] 1 C 95% (µ (i) ) = x i. t 0.975, x i. + t 0.975 n i n i Hvis der er fælles middelværdi, brug da x.. Side 5 af 8

3.5 SAS 4 Flere Observationsrækker 4.1 Main points Findes på side 114. Udregninger med USS, S & n findes på side 116. 5 Lineær regression 5.1 Main points Findes på side 155. comparison of regression lines: s. 187 5.2 Test Ens varians for 2 regressioner: Vi går fra modellen M 0 til M 1 ved at lave F-test fra Main Points s. 94. Skema til beregninger og i lineære regressioner og fordelinger for parametre findes på s. 125. Side 6 af 8

6 Multinomialfordelingen 6.1 Test først skal der regnes en -2lnQ(x) værdi, til det kan formlem på side 344 bruges. Pobs er herefter = 1 F X 2 (k 1 a)( 2lnQ(x)) (Hvilket svarer til CDF(ChiSquareDistribution(k- 1-a)),-2lnQ(x)) 6.2 Likelihood for at finde likelihood funktionen for en Multinomial distribution, se s.305m, husk at brøken kan forkortes som på s.301m 7 Likelihood teori Likelighood funktionen er sandsynlighedsfunktionen (PDF). Hvis dert er over flere, er det produktet af sandsynlighedsfunktionerne. 7.1 Likelighood ligning differentier logarritmen til likelihood funktionen 7.2 Handy formler ( 1 ) 3 ( 1 ) 3 ( y = = y 1 1/2) 3 ( = y 1) 1/2 3 ( 1 ) 3/2 = y 1/2 y Likelihood funktionen er tæthedsfunktionerne ganget samme. Tæthedsfunktionen for en normalfordeling: f X (x) = 1 (x µ)2 e 2σ 2 2πσ 2 7.3 Ln regneregler ln(e x ) = x e ln(x) = x ln(x y) = ln(x) + ln(y) ln(x / y) = ln(x) ln(y) ln(x y ) = y ln(x) ln(1) = 0 7.4 Maksumum likelihood Udled Log(L(x)) (Log likelihood), find derefter maksimum af funktionen: Dette kan gøres ved at sætte den differentierede funktion til 0, og ulede variablen derefter. Husk at tjekke at resultatets differentiering er 0 for at tjekke af det er maksimum funktionen. Side 7 af 8

7.5 Differentiering Bl.a. flip af param inde i ln 8 Lommeregner Generelt for TI-89: Catalog = F3 = Brug alpha til at finde funktionen Funktion TI-89 TI-Tobias Φ 1 (p) invnorm(p) placeholder Φ(p) normcdf(-,p) placeholder F χ 2 (k 1)(Ba) chi2cdf(0,ba,k-1) placeholder F F (k 1,n. k) (F ) FCdf(-,F,k-1,n.-k) placeholder t 1 α/2 (f) inv t(-,α/2,f) placeholder u 1 α/2 invnorm(α/2,0,1) placeholder χ 2 1 α/2 (f) invchi2(1-α/2,f) placeholder 9 Fordelinger Hvis det gælder at X. N(u, o) X. N(u, o/n) Side 8 af 8