Matematisk Modellering 1 Cheat Sheet

Relaterede dokumenter
Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

Tema. Dagens tema: Indfør centrale statistiske begreber.

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kvantitative Metoder 1 - Forår 2007

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Forsøgsplanlægning Stikprøvestørrelse

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

k normalfordelte observationsrækker (ensidet variansanalyse)

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse

Landmålingens fejlteori - Repetition - Kontinuerte stokastiske variable - Lektion 3

Et firma tuner biler. Antallet af en bils cylindere er givet ved den stokastiske variabel X med massetæthedsfunktionen

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Eksamen i Statistik for biokemikere. Blok

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

Nanostatistik: Opgavebesvarelser

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Produkt og marked - matematiske og statistiske metoder

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

β = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm

Stastistik og Databehandling på en TI-83

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling.

n r x rs x r = 1 n r s=1 (x rs x r ) 2, s=1

Løsninger til kapitel 9

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Landmålingens fejlteori - Repetition - Fordeling af slutfejl - Lektion 8

Model. (m separate analyser). I vores eksempel er m = 2, n 1 = 13 (13 journalister) og

Note om Monte Carlo metoden

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Forelæsning 11: Kapitel 11: Regressionsanalyse

Module 12: Mere om variansanalyse

Uge 10 Teoretisk Statistik 1. marts 2004

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

En Introduktion til SAS. Kapitel 5.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Elementær sandsynlighedsregning

Statistik og Sandsynlighedsregning 2

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl i Kirkesalen, Studiestræde 38 Øvelser

Elementær sandsynlighedsregning

a) Har måleresultaterne for de 2 laboranter samme varians? b) Tyder resultaterne på, at nogen af laboranterne måler med en systematisk fejl?

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)

Overheads til forelæsninger, mandag 5. uge På E har vi en mængde af mulige sandsynlighedsfordelinger for X, (P θ ) θ Θ.

Løsning til eksaminen d. 29. maj 2009

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Kvantitative Metoder 1 - Forår Dagens program

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Sandsynlighedsregning

Lidt om fordelinger, afledt af normalfordelingen

13.1 Substrat Polynomiel regression Biomasse Kreatinin Læsefærdighed Protein og højde...

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14

13.1 Substrat Polynomiel regression Biomasse Kreatinin Læsefærdighed Protein og højde...

Module 4: Ensidig variansanalyse

Løsning eksamen d. 15. december 2008

Skriftlig eksamen Science statistik- ST501

Forsøgsplanlægning Stikprøvestørrelse

Kvantitative metoder 2

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Løsninger til kapitel 6

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

Løsning til eksamen d.27 Maj 2010

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Statistik og Sandsynlighedsregning 2

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Statistiske principper

k UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test)

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Opgaver til kapitel 3

Kvantitative Metoder 1 - Forår Dagens program

Nanostatistik: Konfidensinterval

Forelæsning 4: Konfidensinterval for middelværdi (og spredning)

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

Kvantitative Metoder 1 - Efterår Dagens program

Modul 12: Regression og korrelation

Løsning til eksaminen d. 14. december 2009

(studienummer) (underskrift) (bord nr)

Forelæsning 11: Envejs variansanalyse, ANOVA

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Transkript:

By a team of brave computer scientists: Mads P. Buch, Tobias Brixen, Troels Thorsen, Peder Detlefsen, Mark Gottenborg, Peter Krogshede - 1

Contents 1 Basalt 3 1.1 Varianser............................... 3 1.2 Middelværdier............................ 3 1.3 α.................................... 3 1.4 β.................................... 3 1.5 F-test................................. 3 2 En observationsrække 3 2.1 Main points.............................. 3 2.2 Fraktildiagram............................ 3 2.3 Estimer varians og middelværdi................... 4 2.4 Konfidensinterval........................... 4 2.5 SAS.................................. 4 3 To observationsrækker 5 3.1 Main points.............................. 5 3.2 Homogenitet............................. 5 3.3 Estimater............................... 5 3.4 Konfidensintervaller......................... 5 3.5 SAS.................................. 6 4 Flere Observationsrækker 6 4.1 Main points.............................. 6 5 Lineær regression 6 5.1 Main points.............................. 6 5.2 Test.................................. 6 6 Multinomialfordelingen 7 6.1 Test.................................. 7 6.2 Likelihood............................... 7 7 Likelihood teori 7 7.1 Likelighood ligning.......................... 7 7.2 Handy formler............................ 7 7.3 Ln regneregler............................. 7 7.4 Maksumum likelihood........................ 7 7.5 Differentiering............................. 8 8 Lommeregner 8 9 Fordelinger 8 Side 2 af 8

1 Basalt 1.1 Varianser estimerede varians = emperisk varians, man siger σ 2 s 2 σ 2 χ 2 (frihedsgrader)/frihedsgrader Variansen er også kendt som mean square. se s. 78 og/eller 125.n 1.2 Middelværdier estimerede middelværdi µ x. N(µ, σ 2 /n) se side 78 1.3 α fordeling s. 155, gider ikke skrive den ind :/ 1.4 β Fordeling s. 155, gider ikke skrive den ind :/ 1.5 F-test tester hvor langt to fordelinger er fra hinanden P obs = 1 F (f 02 f 01, f 01 ) hvor f 02 er fra framodellen og f 01 er fra tilmodellen 2 En observationsrække 2.1 Main points Findes på side 78. Her er lidt ekstra facts: S er sum af observationer s 2 er estimat af varians (empiriske varians) σ er spredning σ 2 er varians 2.2 Fraktildiagram Beregningsskema på s. 31. OBS! Det p 1 der bruges i Φ 1 er p 1 i den forgående søjle divederet med 100. Side 3 af 8

Virtuel test for normaldata Det kan antages at data er normalfordelte hvis de ikke afviger systematisk fra en ret linje på sandsynlighedspapir. Middelværdien kan ca aflæses som x værdien ved y = 0. Her ca 10 (beregnet til 10.82) 2.3 Estimer varians og middelværdi Se fordelinger i main points Middelværdi Første formel på s. 64 Varians Formel fra side 64 for s 2 Frihedsværdier: f = n 1 2.4 Konfidensinterval s 2 = 1 S2 (USS n 1 n ) For 95% konfidensinterval skal α = 0.05 så (1 α) = (1 0.05) = 0.95. For fomler se main points. 2.5 SAS Her skal være et ScreenShot af fra en aflevering med ring om hvad vi kan læse ud fra det. Side 4 af 8

3 To observationsrækker 3.1 Main points Findes på side 94. 3.2 Homogenitet Test for homogenitet for σ 2 og µ findes i main points. 3.3 Estimater Alt efter model, kan man bruge disse estimater: σ 2 i s 2 (i) = 1 n i 1 (USS i S2 i n i ) σ 2 χ 2 (f (i) )/f (i) Hvor f 1 = f (1) + f (2) = n. 2 µ i x i. = S i n i N(µ i, σ2 i n i ) σ 2 s 2 1 = f (1)s 2 (1) + f (2)f 2 (2) f (1) + f (2) σ 2 χ 2 (f 1 )/f 1 3.4 Konfidensintervaller µ x.. = S 1 + S 2 n 1 + n 2 N(µ, σ2 n. ) Brug formlerne fra én observationsrække på side 79. Fælles varians [ C 95% (σ 2 f 1 s 2 1 ) = χ 2 0.975 (f 1), f 1 s 2 ] 1 χ 2 0.025 (f 1) Forskellig varians C 95% (σ 2 i ) = [ f (i) s 2 (i) χ 2 0.975 (f (i)), f (i) s 2 ] (i) χ 2 0.025 (f (i)) Fælles (og forskellig) middelværdi (varians ukendt) [ s 2 1 s 2 ] 1 C 95% (µ (i) ) = x i. t 0.975, x i. + t 0.975 n i n i Hvis der er fælles middelværdi, brug da x.. Side 5 af 8

3.5 SAS 4 Flere Observationsrækker 4.1 Main points Findes på side 114. Udregninger med USS, S & n findes på side 116. 5 Lineær regression 5.1 Main points Findes på side 155. comparison of regression lines: s. 187 5.2 Test Ens varians for 2 regressioner: Vi går fra modellen M 0 til M 1 ved at lave F-test fra Main Points s. 94. Skema til beregninger og i lineære regressioner og fordelinger for parametre findes på s. 125. Side 6 af 8

6 Multinomialfordelingen 6.1 Test først skal der regnes en -2lnQ(x) værdi, til det kan formlem på side 344 bruges. Pobs er herefter = 1 F X 2 (k 1 a)( 2lnQ(x)) (Hvilket svarer til CDF(ChiSquareDistribution(k- 1-a)),-2lnQ(x)) 6.2 Likelihood for at finde likelihood funktionen for en Multinomial distribution, se s.305m, husk at brøken kan forkortes som på s.301m 7 Likelihood teori Likelighood funktionen er sandsynlighedsfunktionen (PDF). Hvis dert er over flere, er det produktet af sandsynlighedsfunktionerne. 7.1 Likelighood ligning differentier logarritmen til likelihood funktionen 7.2 Handy formler ( 1 ) 3 ( 1 ) 3 ( y = = y 1 1/2) 3 ( = y 1) 1/2 3 ( 1 ) 3/2 = y 1/2 y Likelihood funktionen er tæthedsfunktionerne ganget samme. Tæthedsfunktionen for en normalfordeling: f X (x) = 1 (x µ)2 e 2σ 2 2πσ 2 7.3 Ln regneregler ln(e x ) = x e ln(x) = x ln(x y) = ln(x) + ln(y) ln(x / y) = ln(x) ln(y) ln(x y ) = y ln(x) ln(1) = 0 7.4 Maksumum likelihood Udled Log(L(x)) (Log likelihood), find derefter maksimum af funktionen: Dette kan gøres ved at sætte den differentierede funktion til 0, og ulede variablen derefter. Husk at tjekke at resultatets differentiering er 0 for at tjekke af det er maksimum funktionen. Side 7 af 8

7.5 Differentiering Bl.a. flip af param inde i ln 8 Lommeregner Generelt for TI-89: Catalog = F3 = Brug alpha til at finde funktionen Funktion TI-89 TI-Tobias Φ 1 (p) invnorm(p) placeholder Φ(p) normcdf(-,p) placeholder F χ 2 (k 1)(Ba) chi2cdf(0,ba,k-1) placeholder F F (k 1,n. k) (F ) FCdf(-,F,k-1,n.-k) placeholder t 1 α/2 (f) inv t(-,α/2,f) placeholder u 1 α/2 invnorm(α/2,0,1) placeholder χ 2 1 α/2 (f) invchi2(1-α/2,f) placeholder 9 Fordelinger Hvis det gælder at X. N(u, o) X. N(u, o/n) Side 8 af 8