Indholdsfortegnelse Generelt Diskrete stokastiske variable: Kontinuerte stokastiske variable: Regneregler for stokastiske variable



Relaterede dokumenter
hvor i er observationsnummeret, som løber fra 1 til stikprøvestørrelsen n, X i

Konfidens intervaller

Statistik Lektion 8. Parrede test Test for forskel i andele Test for ens varians Gensyn med flyskræk!

Matematisk Modellering 1 Hjælpeark

Stikprøvefordelinger og konfidensintervaller

Test i to populationer. Hypotesetest for parrede observationer Test for ens varians Gensyn med flyskræk!

Simpel Lineær Regression. Opsplitning af variationen Determinations koefficient Variansanalyse F-test Model-kontrol

Motivation. En tegning

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

9. Binomialfordelingen

antal gange krone sker i første n kast = n

Statistik 8. gang 1 KONFIDENSINTERVALLER. Konfidensintervaller: kapitel 11. Valg og test af fordelingsfunktion

Anvendt Statistik Lektion 3. Punkt- og intervalestimater Konfidensintervaller Valg af stikprøvestørrelse

Mikroøkonomi, matematik og statistik Eksamenshjemmeopgave december 2007

Statistik Lektion 7. Hypotesetest og kritiske værdier Type I og Type II fejl Styrken af en test Sammenligning af to populationer

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

24. januar Epidemiologi og biostatistik. Forelæsning 1 Uge 1, tirsdag. Niels Trolle Andersen, Afdelingen for Biostatistik.

Sætning: Middelværdi og varians for linearkombinationer. Lad X 1,X 2,...,X n være stokastiske variable. Da gælder. Var ( a 0 + a 1 X a n X n

Dagens program. Estimation: Kapitel Eksempler på middelrette og/eller konsistente estimator (de sidste fra sidste forelæsning)

Løsninger til kapitel 7

Gamle eksamensopgaver. Diskret Matematik med Anvendelser (DM72) & Diskrete Strukturer(DM504)

Estimation ved momentmetoden. Estimation af middelværdiparameter

STATISTIKNOTER Simple normalfordelingsmodeller

13. februar Resumé: En statistisk analyse resulterer ofte i : Et estimat ˆ θ med en tilhørende se( ˆ θ )

Praktisk info. Statistisk analyse af en enkelt stikprøve: kendt eller ukendt varians Sandsynlighedsregning og Statistik (SaSt) I tirsdags.

Sammenligning af to grupper

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab

Kvantitative metoder 2

1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens... 2

Diskrete og kontinuerte stokastiske variable

Generelle lineære modeller

30. august Epidemiologi og biostatistik. Forelæsning 3 Uge 2, torsdag d. 8. september 2005 Michael Væth, Afdeling for Biostatistik.

Økonometri 1. Definition og motivation. Definition og motivation. Dagens program. Den multiple regressionsmodel 15. februar 2006

Maja Tarp AARHUS UNIVERSITET

Teoretisk Statistik, 9. februar Beskrivende statistik

Statistiske test. Efteråret 2010 Jens Friis, AAU. Hjemmeside :

29. januar Epidemiologi og biostatistik Forelæsning 2 Uge 1, torsdag 2. februar 2006 Michael Væth, Afdeling for Biostatistik.

DATV: Introduktion til optimering og operationsanalyse, Bin Packing Problemet

Meningsmålinger KLADDE. Thomas Heide-Jørgensen, Rosborg Gymnasium & HF, 2017

Scorer FCK "for mange" mål i det sidste kvarter?

Opsamling. Lidt om det hele..!

Spørgsmål 3 (5 %) Bestem sandsynligheden for at et tilfældigt valgt vindue har en fejl ved listerne, når man ved at der er fejl i glasset.

Økonometri 1. Inferens i den lineære regressionsmodel 29. september Økonometri 1: F7 1

Elementær Matematik. Polynomier

Program. Ensidet variansanalyse Normalfordelingen. Antibiotika og nedbrydning af organisk materiale. Tegninger

Uge 48 II Teoretisk Statistik 27. november Numerisk modelkontrol af diskrete fordelinger: intro

Vejledende opgavebesvarelser

Den flerdimensionale normalfordeling

Undersøgelse af numeriske modeller

Vejledende besvarelser til opgaver i kapitel 15

Projekt 9.1 Regneregler for stokastiske variable middelværdi, varians og spredning

Kapitel 10 KALIBRERING AF STRØMNINGSMODEL

STATISTISKE GRUNDBEGREBER

Lys og gitterligningen

STATISTISKE GRUNDBEGREBER

Note til styrkefunktionen

Oversigt. Kursus 02402/02323 Introducerende Statistik. Forelæsning 12: Inferens for andele. Klaus K. Andersen og Per Bruun Brockhoff

Noter om kombinatorik, Kirsten Rosenkilde, februar Kombinatorik

Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

Hypotese test. Repetition fra sidst Hypoteser Test af middelværdi Test af andel Test af varians Type 1 og type 2 fejl Signifikansniveau

vejer (med fortegn). Det vil vi illustrere visuelt og geometrisk for (2 2)-matricer og (3 3)-matricer i enote 6.

Program. Populationer og stikprøver. Praktiske oplysninger. Eksempel vaccine mod miltbrand hos får. Praktiske oplysninger

Løsningsforslag til skriftlig eksamen i Kombinatorik, sandsynlighed og randomiserede algoritmer (DM528)

Matematik A. Studentereksamen. Forberedelsesmateriale. Forsøg med digitale eksamensopgaver med adgang til internettet.

Begreber og definitioner

02402 Løsning til testquiz02402f (Test VI)

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

Program. Middelværdi af Y = t(x ) Transformationssætningen

Sandsynlighedsregning Stokastisk variabel

Velkommen. Program. Statistik og Sandsynlighedsregning 2 Sandsynlighedstætheder og kontinuerte fordelinger på R. Praktiske ting og sager

Projekt 1.3 Brydningsloven

Forelæsning 8: Inferens for varianser (kap 9)

Tests for forskel i central tendens for data på ordinal- og intervalskala. Typer af statistiske test:

(VIDENSKABSTEORI) STATISTIK (EKSPERIMENTELT ARBEJDE)

Matematikkens mysterier - på et obligatorisk niveau. 7. Ligninger, polynomier og asymptoter

Talfølger og -rækker

Asymptotisk optimalitet af MLE

Renteformlen. Erik Vestergaard

Program. Statistisk inferens En enkelt stikprøve og lineær regression Stat. modeller, estimation og konfidensintervaller. Fordeling af gennemsnit

Projekt 2.3 Det gyldne snit og Fibonaccitallene

Estimation og test i normalfordelingen

Atom og kernefysik Ingrid Jespersens Gymnasieskole 2007

x-klasserne Gammel Hellerup Gymnasium

STATISTIK x-klasserne Gammel Hellerup Gymnasium

Introduktion til uligheder

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup)

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration

ESBILAC. - modermælkserstatning til hvalpe VEJLEDNING.

Program. 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test.

Uge 40 I Teoretisk Statistik, 30. september 2003

Introduktion til uligheder

Bestemmelse af vandføring i Østerå

Konfidensinterval for µ (σ kendt)

Sandsynlighedsregning: endeligt udfaldsrum (repetition)

Module 12: Mere om variansanalyse

Psyken på overarbejde hva ka du gøre?

Modul 14: Goodness-of-fit test og krydstabelanalyse

Morten Frydenberg version dato:

Vi kalder nu antal prøverør blandt de 20, hvor der ikke ses vækst for X.

Transkript:

Idholdsfortegelse Geerelt:...3 Stokastisk variabel:...3 Tæthedsfuktio/sadsylighedsfuktio for stokastisk variabel:...3 Fordeligsfuktio/sumfuktio for stokastisk variabel:...3 Middelværdi:...4 Geemsit:...4 Fraktiler:...4 Skæve fordeliger:...5 Varias:...6 Spredig/stadardafvigelse:...6 Variatioskoefficiet:...6 Diskrete stokastiske variable:...7 Biomialfordelig:...7 Hypergeometrisk fordelig:...9 Poissofordelig:...11 Kotiuerte stokastiske variable:...1 Normalfordelige:...1 Ekspoetialfordelige:...14 Uiformfordelige:...15 Log-Normalfordelige:...16 Regeregler for stokastiske variable...17 Trasformatioer...18 Stikprøvefordeliger med kedt varias:...19 Uedelig populatio: (stikprøve lille i forhold til populatio)...19 Edelig populatio: (stikprøve stor i forhold til populatio)...19 Stikprøvefordeliger med estimeret varias:...0 t-fordelige:...0 χ -fordelige:...1 F -fordelige:... Iferes for geemsit...3 Maksimal fejl på et estimat...3 Kofidesiterval for geemsit...3 Sadsylighed og kofides...4 Hypotese test - geerelt...5 Fejltyper:...5 Iferes for Middelværdi...6 Hypotesetest af é middelværdi (t-test)...6 Sammehæg mellem hypotesetest og kofidesitervaller:...7 Hypotesetest for sammeligig af middelværdier (t-test):...8 Kofidesiterval for forskel i middelværdi...9 Parrede t-tests...9 Iferes for varias...30 Kofidesiterval for varias...30 Hypotesetest af é varias...30 Hypotesetest for sammeligig af to variaser...31 1

Iferes for adele...3 Puktestimat af adel:...3 Kofidesiterval (1-α)% for e adel:...3 Maksimal fejl på estimat:...3 Bestemmelse af stikprøvestørrelse, :...3 Hypotesetest for e adel...3 Hypotesetest for to adele s....33 Kofidesiterval (1-α)% for forskelle mellem to adele...33 Hypotesetest for flere adele...33 Goodess of fit...34 Regressiosaalyse...35 Korrelatioskoefficiet...35 Simpel lieær model...36 Regressiosaalyse/iferes i regressios model...37 Hypotesetest om skærig med Y-akse...37 Hypotesetest om hældige...37 Kofidesitervaller...38 Variasaalyse...39 Esidet variasaalyse...39 (1-α) kofidesiterval for forskelle i middelværdi, s. 410...40 Tosidet variasaalyse / radomiseret blokforsøg s.417...40

Geerelt: Stokastisk variabel: E stokastisk variabel X er e fuktio defieret på Ω, der atager værdier på de reelle akse. Tæthedsfuktio/sadsylighedsfuktio for stokastisk variabel: (frekvesfuktio / hyppighed) Et godt plot af f(x) er histogram for kotiuerte variable og barchart for diskrete variable Sadsylighedsfuktio (Diskret variabel): S er udfaldsrummet for X Tæthedsfuktio (Kotiuert variabel): Husk at: E kotiuert stokastisk variabel har puktsadsylighed = 0 for alle udfald, dvs. Fordeligsfuktio/sumfuktio for stokastisk variabel: Diskret variabel: Et godt plot er de kumulative fordelig. Kotiuert variabel: 3

Geerelt: Middelværdi: µ bliver estimeret af geemsittet x. Diskret variabel: μ = alle x x f (x) Kotiuert variabel: S er udfaldsrummet for X, ormalt (- ; ). Geemsit: x er et estimat af middelværdie. Diskret variabel: Grupperede data (i itervaller): Fraktiler: Defiitio: De p ede fraktil er e værdi, x p i datasættet, hvor midst p % af alle observatioer x p. For at udrege de p ede fraktil for observatioer, udreges k = p, hvor p er i %. 100 Dette tal fortæller oget om, hvilke observatio vi skal tælle op til. Vigtigt: Husk at orde datasættet, så observatioere står i umerisk rækkefølge. Hvis k ikke er et heltal, rudes op til æste observatio, som vil have værdie x p. Hvis k er et heltal, tages geemsittet af k og k + 1. Specielle fraktiler: Media: 50 % Nedre kvartil hhv. øvre kvartil : 5 % og 75 %. Decilere er 10%, 0%, 30%, 40%, 50%, 60%, 70%, 80% og 90%. 4

Eksempel 1: Fide 5 % -fraktile (de edre kvartil) for 13 observatioer: Givet: p = 5 = 13. Derfor: k = 0,5 13 = 3,15. Da k ikke er et heltal, ruder vi op til 4. Derfor er x p = de 4. observatio. Eksempel Fide 50 %-fraktile (mediae) for 50 observatioer: Givet: p = 50 = 50 Derfor: k = 0,50 50 = 5. Da k er et heltal, skal vi fide geemsittet mellem observatio 5 og 6. Derfor er x p = x + x 5 6. Media: Mediae er 50%-fraktile, dvs. de midterste observatio i det ordede datasæt. Hvis ma har ekstremt afvigede værdier, er mediae at foretrække frem for middelværdie. For e symmetrisk fordelig er mediae = geemsittet x Skæve fordeliger: Hvis fordelige har e hale, så de ikke lægere er symmetrisk, er de skæv. Fordelige er højreskæv, år hale ligger til højre (positively skewed). Mediae for højreskæve fordeliger > x. For delige er vestreskæv, år hale ligger til vestre (egatively skewed). Mediae for vestreskæve fordeliger < x. 5

Geerelt: Varias: Diskrete variable: σ = (x μ) f (x) alle x Grupperede data (i itervaller): Kotiuerte variable: S er udfaldsrummet for X, ormalt (- ; ). Spredig/stadardafvigelse: σ = σ Variatioskoefficiet: Bruges hvis ma skal sammelige variatioe mellem forskellige datasæt. 6

Diskrete stokastiske variable: Diskrete stokastiske variable er tællevariable, der tager heltalsværdier. Biomialfordelig: = atal forsøg p = sadsylighedsparameter Bruges år: Verde ka deles op i to, dvs. der ka tælles atal succes og atal fiaskoer. Et udfald er uafhægigt af tidligere udfald, dvs. p er kostat/ sadsylighede for succes er es for alle forsøg. Eksempler på brug: Stikprøver med tilbagelægig Vælgertilslutig til Vestre bladt 500 vælgere Atal korrekte svar i e multiple choice test med 5 spørgsmål Hvor mage seksere der slås på 6 slag Hvor mage gage ma får kroe ud af 10 kast med e møt Sadsylighedsfuktio: f (x) = P(X = x) = p x (1 p) x x NB: husk for at udrege, bruges kommadoe Cr(, x) / Cr(øverst, ederst) på TI89 x Fordeligsfuktio: Disse værdier ka fides i tabelle s. 565. Middelværdi: Varias: 7

Diskrete stokastiske variable: Diskrete stokastiske variable er tællevariable, der tager heltalsværdier. Biomialfordelig: Approksimatio af biomialfordelige vha. Poissofordelige Biomialfordelige ka approksimeres med poissofordelige, hvis er tilstrækkeligt stort og p tilstrækkeligt lille. Herved fås λ = p. E tommelfigerregel er, at dee approksimatio ka avedes år 0 og p 0,05. Hvis 100, er det dog tilstrækkeligt, at p 10. Hvis p er tæt på 0,50, avedes ormalfordelige til at approksimere (se edefor). Approksimatio af biomialfordelige vha. ormalfordelige Biomialfordelige ka approksimeres med ormalfordelige, hvis er stor og p er tæt på 0,50. Herved udreges Z: X p Z = p (1 p) hvor Z følger e stadardormalfordelig med µ = 0 og σ = 1. Dee trasformatio er idetisk med trasformatioe der ormalt avedes til at stadardisere ormalfordeliger, da µ = p og σ = p (1-p) for biomialfordelige. Det er vigtigt at ædre græsere for Z, da biomialfordelige er e diskret fordelig, hvor ormalfordelige er e kotiuert fordelig. (Forskelle ligger i at de diskrete fordelig udelukkede består af puktsadsyligheder, hvorimod puktsadsylighede i de kotiuerte = 0.) Hvis ma fx skal fide P(X 8), vil de X-værdi, ma skal idsætte i formle, være 8,5, da ormalfordeliges iterval (7,5 ; 8,5) dækker biomialfordeliges X = 8. Hvis ma fx skal fide P(X < 8), vil X-værdie være 7,5, da, hvad der svarer til biomialfordeliges X = 8, ikke skal være ikluderet. Hvis ma fx skal fide P(3 X < 8), vil de to X-værdier skulle være hhv.,5 og 7,5. 8

Diskrete stokastiske variable: Diskrete stokastiske variable er tællevariable, der tager heltalsværdier. Hypergeometrisk fordelig: = atal forsøg a = atal defekte i populatioe N = populatioes størrelse Bruges år: Verde ka deles op i to, dvs. der ka tælles atal succes og atal fiaskoer. Et udfald er afhægigt af tidligere udfald, dvs. p ikke er kostat/sadsylighede for succes ædrer sig for hvert forsøg. Eksempler på brug: Stikprøver ude tilbagelægig Sadsylighede for at få 5 hjerter hvis ma udtager 5 kort fra et almideligt spil kort. Sadsylighede for at få blå bolde, hvis ma udtager 5 bolde fra e pose med 15 blå bolde og 5 røde. Sadsylighede for at fide 10 defekte fjersy ud af e prøve på 0, år prøve er taget fra et parti på 80 ideholdede 34 defekte. Sadsylighedsfuktio: NB: husk Cr(øverst, ederst) på TI89 Fordeligsfuktio: Middelværdi: Varias: σ = a N (1 a N ) (N N 1 ) 9

Diskrete stokastiske variable: Diskrete stokastiske variable er tællevariable, der tager heltalsværdier. Hypergeometrisk fordelig: Approksimatio af de hypergeometriske fordelig vha. biomialfordelige: De hypergeometriske fordelig ka approksimeres med biomialfordelige, år stikprøve () er lille i forhold til populatioe (N). N skal være midst 10, før dee approksimatio ka avedes. De approksimerede biomialfordeligs parametre er så =, og p = a N. 10

Diskrete stokastiske variable: Diskrete stokastiske variable er tællevariable, der tager heltalsværdier. Poissofordelig: λ = itesitete/geemsittet pr. ehed Bruges år: Verde ikke ka deles op i ete succes eller fiasko. Fx hadler det ikke om e bombe slår ed eller ej, me hvor mage bomber der slår ed. Fordelige karakteriseres ved λ, som er itesitete af vores variabel. λ agives på forme atal pr. oget (fx pr. dag/pr. areal/pr. perso etc.). Poissofordelige bruges ofte, år der ikke er oge aturlig øvre græse for λ. Poissofordelige avedes, år det ikke er muligt at tælle, hvor mage fiaskoer, der ikke er. Dvs. det totale atal fiaskoer ikke kedes. Eksempler på brug: Hvor mage persoer der idlægges pr. dag grudet luftforureig. Hvor mage kuder der går id i et supermarked på e time. Hvor mage computere der går ed på e dag. Hvor mage gestade alkohol Jae drikker på e gaske almidelig uge. Hvor mage fejl der er pr. meter sejlgar Sadsylighedsfuktio: år λ > 0 Fordeligsfuktio: Se tabel s. 570 Middelværdi: Varias: 11

Kotiuerte stokastiske variable: Kotiuerte stokastiske variable er måledata, der derfor er reelle tal. Sadsylighedere reges i itervaller. Normalfordelige: μ = middelværdie σ = variase Stadardormalfordelige (også kaldet Z-fordelige) er; P(Z X) ka fides i Tabel 3. Bruges år: Ma har kotiuerte observatioer, som har e klokkeformet sadsylighedsfuktio, Eksempler på brug: Fordelige af værepligtiges højde Vægte af melposer fyldt af e robot Tide det tager for e ambulace at å frem til e givet distace Hvor lag tid det tager at poppe e pose mikrobølgeovspopcor Tæthedsfuktio:, - < x < Fordeligsfuktio: For stadardormalfordelige se forrest i boge eller Tabel 3 HUSK at for stadardormalfordelige gælder at Middelværdi: Varias: 1

Kotiuerte stokastiske variable: Kotiuerte stokastiske variable er måledata, der derfor er reelle tal. Sadsylighedere reges i itervaller. Normalfordelige: Stadardiserig: Ka stadardiseres ved at berege: Der gælder da, at Og at Husk i øvrigt at P(Z 1 X Z ) =Φ(Z ) Φ(Z 1 ) Itervallet [μ-σ,μ+σ] rummer mere ed halvdele af udfaldee. 13

Kotiuerte stokastiske variable: Kotiuerte stokastiske variable er måledata, der derfor er reelle tal. Sadsylighedere reges i itervaller. Ekspoetialfordelige: Bruges til: At beskrive levetider og vetetider. At beskrive (vete)tide mellem hædelser i poissofordelige. Eksempler på brug: Tide der går mellem kuders akomst til et supermarked. Hvor lag tid der går mellem idlæggelser pga. luftforureig. Hvor lag tid der går mellem computere går ed. Hvor lag tid der går mellem Jaes idtagelse af alkohol. Hvor mage cm der er mellem fejl på et stykke sejlgar Tæthedsfuktio: ß = 1 λ Fordeligsfuktio: Sadsylighede for at vetetide er midre ed x: x x x 1 F(X x) = e β β dx = 1 e 0 β Sadsylighede for at vetetide er over x: x x x 1 β β β F( X x) = e dx= 0 ( e ) = e β Middelværdi: x Varias: Sammehæg med Poissofordelige: Poisso: Diskrete hædelser pr. ehed Ekspoetial: De kotiuerte afstad mellem diskrete hædelser 14

Kotiuerte stokastiske variable: Kotiuerte stokastiske variable er måledata, der derfor er reelle tal. Sadsylighedere reges i itervaller. Uiformfordelige: Bruges år: Der er e kotiuert stokastisk variabel hvor alle udfald i et iterval er lige sadsylige Eksempel på brug: Trykket på fælge uder bremseklodse, år ma bremser på si cykel. Tæthedsfuktio: For α < x < β. For alle adre x er f (x) = 0. Middelværdi: Varias: 15

Kotiuerte stokastiske variable: Kotiuerte stokastiske variable er måledata, der derfor er reelle tal. Sadsylighedere reges i itervaller. Log-Normalfordelige: α = µ, β =σ. Bruges år: Når de stokastiske variabel er ormalfordelt, hvis ma tager l af P(X). Eksempler på brug: Itervallet mellem superova-eksplosioer. Forstærkelse af trasistorsigaler Tæthedsfuktio: Når x > 0 og β > 0 Ellers er f(x) = 0 Middelværdi: Varias: Trasformerig til stadardormalfordelig: Ka stadardiseres ved at berege: 16

Regeregler for stokastiske variable s. 183 Geerelt E(X) = de forvetede værdi af X (på egelsk: expected value) = middelværdie = µ. Var(X) = variase af X = σ. X er e stokastisk variabel, a og b er kostater. E(X) E(aX + b) = ae(x) + b E(a 1 X 1 + a X +... + a X ) = a 1 E(X 1 ) + a E(X ) +... + a E(X ) Var(X) Var(aX + b) = a Var(X) Var(a 1 X 1 + a X +... + a X ) = (a 1 ) Var(X 1 ) + (a ) Var(X ) +... + (a ) Var(X ) Vigtigt! Når ma skal bestemme variase, er det vigtigt at fide ud af, om ma får iformatio om variase for hvert ekelt X (uafhægige variable) eller blot om geemsitsvariase for alle X (afhægige variable). Hvis ma ku keder geemsitsvariase, bruges de første formel ( der sættes i.). Hvis ma keder variase for hvert ekelt X, svarer det til at bruge de ade formel ( der sættes ikke i.). Da a i = 1 for alle X i, vil alle (a i ) = (-1) /1 = 1. Derfor skal ma blot lægge variasere samme. Eksempel: Der er blevet taget tid på, hvor lag tid det tager for e computer at læse e chip. E(X) = sekuder og Var(X) = 0,05 sekuder. Desude tager computere præcis 60 sekuder om at starte op. Fid E(00X + 60) og Var(00X + 60) E(00X + 60) = 00 E(X) + 60= 00 + 60= 460 sekuder For at fide Var(X), skal det først bestemmes om X er e afhægig eller e uafhægig variabel: Hvis ma tester de samme chip 00 gage, er X e afhægig variabel. Derfor er Var(00X + 60) = 00 Var(X) = 00 0,05 = 000 sekuder Hvis ma tester 00 forskellige chips é gag hver, er X e uafhægig variabel. I dette tilfælde er Var(00X + 60) = Var(X) + Var(X) +... + Var(X) = 00 Var(X) = 10 sekuder. 17

Trasformatioer s. 193 Hvis ma har meget skæve fordeliger, ka ma formidske ekstreme værdiers idflydelse på datasættet ved at trasformere datasættet. I 99% af alle tilfælde avedes l(x). Derved vil e vestreskæv fordelig blive klokkeformet og derfor kue approksimeres med e ormalfordelig. For vestreskæve fordeliger: (hale er til vestre) Her skal store værdier gøres midre. Her avedes oftest: l(x) 1 x x 4 x For højreskæve fordeliger (hale er til højre): Her skal store værdier gøres større: Der avedes ofte: x x 3 18

Stikprøvefordeliger med kedt varias: s. 09 X er middelværdie for stikprøve. X = 1 x i i= 0 Uedelig populatio: (stikprøve lille i forhold til populatio) Bruges år: Stikprøve er lille i forhold til populatioe. Der kedes: µ og σ (populatioes middelværdi og varias) Fordelig: Uaset selve populatioes fordelig, vil stikprøves X altid følge e ormalfordelig, år stikprøvestørrelse gøres stor ok (se figurer s. 13). X følger e fordelig med middelværdi μ og varias X er ka tilærmes med ormalfordelige σ X N μ, Stadardiserig: Ifølge de cetrale græseværdisætig s. 1 vil X μ Z = σ / Z følger e stadardormalfordelig for Edelig populatio: (stikprøve stor i forhold til populatio) Bruges sjældet Bruges år: Stikprøve er stor i forhold til populatioe Der kedes: µ og σ (populatioes middelværdi og varias) Fordelig: X følger da e fordelig med middelværdi μ og varias 19

Stikprøvefordeliger med estimeret varias: s. 16 X er middelværdie for stikprøve. X = 1 x i i= 0 S er de estimerede varias af stikprøve. S = 1 1 (X i X ) i=1 t-fordelige: Mider meget om ormalfordelige, er også symmetrisk omkrig 0. Me t-fordelige er bredere. Bruges til: Det er e stikprøvefordelig for middelværdie Fordelige: X t = μ S t er da e stokastisk variabel og følger e t-fordelig med parameter υ = -1 υ kaldes frihedsgrade Opslag: Tabel 4, s. 587 Ved t α (υ) forstås de værdi således at HUSK at i t-fordelige læser ma større ed eller lig med i tabelle, modsat ormalfordelige. Ka approksimeres med: Stadardormalfordelige, hvis υ > 9 for da er det stort set det samme. Der gælder at: t( ) = stadardormalfordelig e t-fordelig er bredere ed e stadardormalfordelig 0

Stikprøvefordelig for variase: s. 18 X er middelværdie for stikprøve. X = 1 x i i= 0 S er de estimerede varias af stikprøve. S = 1 1 (X i X ) i=1 χ -fordelige: χ -fordelige er ikke symmetrisk, er vestreskæv. Bruges til: Det er e stikprøvefordelig for variase. Fordelige: χ er da e stokastisk variabel og følger e χ -fordelig med parameter υ = -1 υ kaldes frihedsgrade Opslag: Tabel 5, s. 588 Ved χ α(υ) forstås de værdi således at HUSK at i χ -fordelige læser ma større ed eller lig med i tabelle, modsat ormalfordelige. 1

Stikprøvefordelig for sammeligede variaser: s. 0 X er middelværdie for stikprøve. X = 1 x i i= 0 S er de estimerede varias af stikprøve. S = 1 1 (X i X ) i=1 F -fordelige: F-fordelige er ikke symmetrisk Bruges til: Det er e stikprøvefordelig for sammeligig af variaser. Når: Der haves stikprøver fra to ormalfordeliger med samme varias. S 1 er de estimerede varias af de ee stikprøve med størrelse 1. S er de estimerede varias af de ee stikprøve med størrelse. Fordelige: F er da e stokastisk variabel og følger e F-fordelig med parametre υ 1 = 1-1 og υ = -1 υ kaldes frihedsgrade. Opslag: Tabel 6, s. 589 og frem Ved F α (υ 1,υ ) forstås de værdi således at HUSK at i F-fordelige læser ma større ed eller lig med i tabelle, modsat ormalfordelige. OBS! Der er e tabel for hver sadsylighed se toppe. F 0,05 betyder at 5% er over værdie.

Iferes for geemsit s. 6 Stikprøve skal være repræsetativ for populatioe. Følgede er mål for, hvor god stikprøve er: Cetral estimator: Stikprøve skal være cetreret omkrig de sade middelværdi (ubiased). Efficiet estimator: Variase på stikprøve skal være så lille som muligt. Maksimal fejl på et estimat Forudsætig: Observatioere skal kue atages at være ormalfordelte. σ kedt: De maksimale fejl med sadsylighed 1-α er: σ E1 α = zα/ z α/ fides i stadardormalfordelige, tabel 3, eller i ederste lije i tabel 4. σ ukedt, > 30: E1 α = zα/ S σ ukedt, < 30: E1 α = tα/ S t α/ fides i tabel 4, med frihedsgrad v = -1 Stikprøvestørrelse Bereges ud fra de maksimale fejl ma vil have på sit geemsit, med (1-α)100% sasylighed. zα / σ = E Kofidesiterval for geemsit Itervalestimat vi ka med 1-α sikkerhed (kofides) atage at X ligger ide for dette iterval. σ kedt: σ σ x zα/ < μ < x+ zα/ σ ukedt, > 30: 3

S x zα/ < μ < x+ zα/ σ ukedt, < 30: S x tα/ < μ < x+ tα/ Sadsylighed og kofides Sadsyligheder udtaler sig om fremtide. Kofides udtaler sig om allerede målte data. S S 4

Hypotese test geerelt s. 38 Nul hypotese, H 0 : μ = μ 0 : Udgagspukt, som vi øsker at forkaste ud fra stikprøve. Alterativ hypotese, H 1 : μ μ 0 : Står i modsætig til H 0 og er de hypotese, vi øsker at sadsyliggøre. Esidet alterativ: H 1 : μ < μ 0 H 1 : μ > μ 0 Tosidet alterativ: H 1 : μ μ 0 Fejltyper: Vi accepterer H Vi forkaster H H er sad Korrekt beslutig Fejl af type 1 H er falsk Fejl af type Korrekt beslutig Type 1: Made er uskyldig, me dømmes skyldig Type : Made er skyldig, me frikedes P(fejl af type 1)=α, er som regel 0,05 eller 0,01 = sigifikasiveauet P(fejl af type )=β, ka ikke styres Ædrig af fejle ved hypotesetest Ma ka ædre på fejle ved hypotesetest. Dette sker ved at ædre på parametree α eller. Hvis ma øger, vil ma midske sadsylighede for fejl af både type 1 og type. Hvis ma øger α, midsker ma risikoe for type 1 fejl, me øger samtidig risikoe for type -fejl. E tests styrke er defieret ved 1 β. 5

Iferes for Middelværdi s. 46 Hypotesetest af é middelværdi (t-test) Bruges år: Det er e forudsætig, at observatioere er ormalfordelte. Det skal testes, om ma ud fra data ka bestemme, om de foreslåede μ 0 er sadsylig. Metode: Opstil hypotesere H 0 (ofte μ = μ 0 ) og H 1, og vælg sigifikasiveau α Husk at lighedsteget skal stå i H 0. Bereg teststørrelse: σ kedt: Stadardormalfordelige bruges: X μ Z = 0 σ Z N(0,1 ) σ ukedt, > 30: Stadardormalfordelige bruges: X μ Z = 0 S Z N(0,1 ) σ ukedt, < 30: t-fordelige bruges X μ t = 0 S t t(v), hvor υ = -1 Beregig af kritisk værdi: Slå op i t-fordelige med υ = 1 frihedsgrader, z-fordelige svarer til v = Beregig af P-værdi: P-værdie er sadsylighede for e midst lige så ekstrem værdi som de kritiske værdi. Fås ved at slå de fude Z-værdi op i tabelle og fide de tilsvarede sadsylighed p = P(Z k)=1- P(Z k)=. Hvis P-værdie er midre ed α, forkastes H 0. Ka ku udreges, hvis observatioere følger e ormalfordelig og σ er kedt. 6

Iferes for Middelværdi Hypotesetest af é middelværdi (t-test) Metode - fortsat: Sammelig teststørrelse og kritisk værdi Sammelig P-værdi og sigifikasiveau. Sammehæg mellem hypotesetest og kofidesitervaller: s. 51 Hvis ma har et (1-α) 100% - kofidesiterval, svarer det til acceptområdet af ulhypotese, hvis ma laver e tosidet test. Dvs. at ulhypotese accepteres, hvis de kritiske værdi ligger ide for kofidesitervallet med samme sigifikasiveau. 7

Iferes for middelværdi Hypotesetest for sammeligig af middelværdier (t-test): s. 60 Bruges år: Der sammeliges geemsit for stikprøver; Stikprøve 1: 1, X 1, s 1 Stikprøve :, X, s Forudsætig: x1 og x skal være uafhægige. Ma atager at observatioere er ormalfordelte. Der er variashomogeitet : s 1 = s. Dette kotrolleres med e F-test. Hvis der ikke er variashomogeitet, skal ma bruges kors -formle i tabelle på æstsidste side. Metode: Først opstilles H 0, som oftest er af forme H 0 : µ 1 - µ = δ Som alterativ hypotese har ma ete µ 1 - µ > δ, µ 1 - µ < δ eller µ 1 - µ δ Teststørrelse bereges: For stikprøver med kedte variaserσ 1 og σ Z = (X X ) δ 1 σ 1 + σ, hvor Z N(0,1 ) 1 For stikprøver 30, med ukedte variaser Z = (X X ) δ 1 s 1 + s, hvor Z N(0,1 ) 1 For stikprøver 30 og med ukedte variaser t = (X 1 X ) δ s p + s, hvor s p = ( 1)s 1 1 + ( 1)s og t t(ν), hvor ν = 1 + p 1 + 1 Beregig af kritisk værdi: Dette gøres vha. t-fordeligstabelle, hvor ma har bestemt frihedsgrade. For ormalfordelige er frihedsgrade = Teststørrelse og de kritiske værdi sammeliges: 8

Kofidesiterval for forskel i middelværdi Ma ka for store stikprøver berege et (1-α) kofidesiterval for δ=u 1 -u : s x 1 x ± z 1 α + s. 1 Hvis σ 1 og σ kedes, bruges de i stedet for s 1 og s. For små stikprøver med ukedt σ 1 og σ bereges et (1-α) kofidesiterval for δ=u 1 -u : x 1 x ± t α ( 1 1)s 1 + ( 1)s 1 + 1 1 + 1, hvor frihedsgrade i t-fordelige er 1 + -. Parret t-test s. 68 Parrede t-tests avedes, år ma har to datasæt, som er parret/uafhægige/beskriver e udviklig i populatioe/stikprøve. Fx hvor mage cigaretter mødre ryger før og efter fødsle, hvor mage kilo ma har tabt efter 4 uger, etc.. Det er e ødvedig forudsætig, at observatioere er ormalfordelte. Metode: Ma fider blot forskelle mellem alle sæt af værdier, D=Y-X, og behadler det som et helt almideligt datasæt med e middelværdi, d. Dee middelværdi beskriver e mulig ædrig (hvis de er sigifikat forskellig fra 0), og kofidesitervallet er: S d t d t D D α < μd < + α med frihedsgrad -1 S 9

Iferes for varias s. 81 Kofidesiterval for varias ( 1) S χ α < σ ( 1) S < χ 1 α Fraktilere for χ har υ = 1 frihedsgrader HUSK: kofidesitervallet er ikke ødvedigvis symmetrisk! Hypotesetest af é varias S = 1 1 (X i X ) i=1 Bruges år: Det er e forudsætig, at observatioere er ormalfordelte. Det skal testes, om ma ud fra data ka bestemme, om de foreslåede σ er sadsylig. Metode: Opstil hypoteser H 0 (ofte σ = σ 0 ) og H 1, og vælg sigifikasiveau (α) Husk at lighedsteg skal stå i H 0. ( 1) S Bereg teststørrelse: χ = σ 0 Beregig af kritisk værdi: slå op i χ -fordelige tabel 5 med υ = 1 frihedsgrader Sammelig teststørrelse og kritisk værdi 30

Iferes for varias Hypotesetest for sammeligig af to variaser, F-test s. 86 S = 1 1 (X i X ) i=1 Bruges år: Ma har to stikprøver og vil sammelige deres varias. Det er ataget at data fra begge stikprøver er ormalfordelt vigtigt! Metode: Opstil hypoteser H 0 (ofte σ 1 = σ ) og H 1, og vælg sigifikasiveau (α) Husk at lighedsteg skal stå i H 0. Bereg teststørrelse: se tabel edefor. HUSK at kvadrere S ere! Beregig af kritisk værdi: slå op i F-fordelige tabel med frihedsgrader se tabel edefor Sammelig teststørrelse og kritisk værdi Kofidesiterval for to stikprøver hvor variase ka atages at være es (= ˆ σ p ): ( + ) ˆ σ ( + ) ˆ σ 1 p 1 p < σ < χα χ1 α Hvor frihedsgrade for Ki^ er 1 + - 31

Iferes for adele (s. 9) Puktestimat af adel: x pˆ = hvor p ˆ [0;1 ] Det kræves at >100-00 for at få et præcist estimat. Kofidesiterval (1-α)% for e adel: Bruges ved e stor stikprøve. x x x x 1 1 x x z α/ < p< + z α/ Maksimal fejl på estimat: s. 96 p(1 p) E = zα / Hvis estimatet ˆp bruges i stedet for parametere p, fås et estimat af E. Bestemmelse af stikprøvestørrelse, : s. 96 p estimeret: zα / = (1 ) p p E p ukedt (p atages at være ½, da det kræver de største stikprøve): 1 zα / = 4 E Hypotesetest for e adel: s. 98 Gælder for store stikprøver 1. H 0 : p=p 0 H 1 : p p 0 eller p<p 0 eller p>p 0 X p0. Teststørrelse: Z = p0(1 p0) 3. H 0 forkastes hvis Z >z α (z α/ ) 3

Hypotesetest for to adele (s. 304) Sammeligig af adele for to forskellige biomialfordelte populatioer. Kræver store stikprøver! H 0 : p 1 =p Z = X X 1 1 1 1 pˆ(1 pˆ) + 1 hvor pˆ = X + X + 1 1 Kofidesiterval (1-α)% for forskelle mellem to adele p 1 -p X1 X1 X X 1 1 X X 1 1 1 ± z + α / 1 1 Hypotesetest for flere adele, atalstabeller (s. 309) Sammeligig af adele for flere ed to forskellige populatioer, eller udersøgelse af sammehæge med flere iddeliger. Tabelle ideholder diskrete data. Fx: Er stemmefordelige es 4 uger før og uger før valget? Er det de samme, som får gode karakterer i matematik og statistik? Er der e sammehæg mellem IQ og hårfarve? De observerede hyppigheder er opstillet/givet i e tabel. Start med at lægge alle værdier i de ekelte søjler og rækker samme! χ -fordelige er her e approksimatio, derfor: Alle de forvetede hyppigheder skal være større ed 5! H 0 : p 1 =p = =p k H 1 : o H 0 - dvs. altid esidet test! Eller: H 0 : uafhægighed mellem rækker og søjler. H 1 : afhægighed dvs. altid esidet test! Teststørrelse: r s χ = ( oij eij ) e i= 1 j= 1 ij o ij er de observerede værdi og e ij er de forvetede værdi. e ij udreges ved at tage rækkesumme søjlesumme de totale sum Forkast H 0, hvis χ > χ α (atal rækker-1)(atal søjler-1). Altid esidet, brug altid alpha. 33

Goodess of fit (s. 311) Udersøger hvor godt et datasæt følger e bestemt fordelig. Typisk er der givet to søjler, hvor de ee søjle ideholder de stokastiske variabel, og de ade søjle ideholder hyppigheder. Ma atager at datasættet har e bestemt fordelig, fx at de er ormalfordelte eller poissofordelte. Så udreges de hyppigheder, ma ville forvete, ud fra dee fordelig. (=sadsylighedere gage det totale atal observatioer) Disse sammeliges med de observerede værdier o i, ved at udrege teststørrelse χ. χ k ( oi ei) = e i= 1 i Hvis χ > χ (k-1-m), forkastes H 0, og datasættet ka ikke atages at have dee fordelig. k er atal kategorier / iddeliger, og m er atal estimerede parametre, som bruges i modelle. Ex: Hvis vi atager, at dataee følger e Poisso-fordelig med λ=λ 0, er m=1 Hvis vi atager, at dataee er ormalfordelte, med μ=μ 0 og σ = σ 0, er m= Hvis e forvetet hyppighed er uder 5, må e eller flere grupper slås samme, så både de forvetede hyppighed og de observerede hyppighed stiger. 34

Regressiosaalyse Bruges år: Det ee udfald afhæger af det adet. To kotiuerte variable. Korrelatioskoefficiet s. 374 Korrelatioskoefficiet: 1 xi x yi y r = ( )( ) = 1 s s i= 1 Der gælder at r [ 1,1 ] Hvis r = 1 haves e fuldstædig lieær forbidelse med positiv hældig Hvis r = -1 haves e fuldstædig lieær forbidelse med egativ hældig Hvis r = 0 er de slet ikke lieær r udtrykker grade af lieær sammehæg Forklarigsgrade, del af variatioe der bliver dækket af modelle = r Hvis r > 0,8 er det e god model Hvis r > 0,5 er det e brugbar model x y S S xx xy S yy (S ere er defieret på æste side) 35

Regressiosaalyse Simpel lieær model s. 338 Y = α + β x + ε Hvor Y = afhægig kotiuert variabel x = uafhægig kotiuert variabel α = skærig med Y-akse β = hældig ε = residual (tilfældig fejl) HUSK: at her avedes a + bx og ikke som ormalt ax + b Midste kvadraters metode: Bruges år residualere er tilfældigt spredt og ikke følger et møster. Går ud på at miimere de kvadratiske afstad mellem pukter og liie Der defieres: xx = ( i ) = x ( 1) i= 1 yy = i = y i= 1 S x x s S ( y y) s ( 1) S xy = i= 1 ( x x)( y i i y) S xy β ka estimeres med b = S xx α ka estimeres med a = y b x Excel: Idtast data Marker data Tryk på guide diagram (diagram iko) Vælg xy pukt plot Vælg det hvor de ikke hæger samme Tryk udfør Højreklik på e af prikkere i diagrammet og vælg tilføj tedesliie Uder faebladet type vælg lieær Uder faebladet idstilliger hakkes af i vis ligig og vis R-kvadreret værdi i diagram Tryk ok 36

Regressiosaalyse/iferes i regressios model Modelles usikkerhed: Det atages at ε er uafhægige og ormalfordelte stokastiske variable med middelværdi 0 og kostat varias σ. σ ka estimeres med s e = S yy ( S xy ) / S xx Hypotesetest om skærig med Y-akse Ka α fx atages at være 0? H 0 : H 1 : a = α a α Teststørrelse er: ( a α) S xx t = s S + ( x) e Kritisk værdi: t α / ( v) Hvor v = Forkast H 0 hvis t > t ) xx α / ( v Hypotesetest om hældige H 0 : b = β H 1 : b β Hvis b = 0 er der ige sammehæg og derfor ige model. Teststørrelse er: ( b β ) t = S xx s e Kritisk værdi: t α / ( v) Hvor v = Forkast H 0 hvis t > t ) α / ( v 37

Regressiosaalyse/iferes i regressios model Kofidesitervaller s. 346 Kofidesiterval for α: a ± t α / s e 1 ( x) + S xx Kofidesiterval for β: 1 b ± t α / se S xx Kofidesiterval for α + βx 0 : Kofidesiterval for modelle i puktet x 0. ( a β x ) ± t + 0 α / s e 1 ( x0 x) + S xx Bruges til at se på hvor geemsittet af Y-værdier ligger. F.eks. atal kroer i geemsit pr. uge Prædiktiositerval for α + βx 0 : Prædiktiositerval for modelle i puktet x 0. ( a β x ) ± t + 0 α / s e 1 ( x0 x) 1+ + S Bruges til at forudsige é målig. F.eks. atal kroer i æste uge. Prædiktiositervallet er bredere ed kofidesitervallet. xx 38

Variasaalyse (Aova) Tabellere mider om atalstabeller, me ideholder kotiuerte måliger (Y). X iddeles i grupper. Er der forskel i middel på gruppere? Ma skal atage at variasere i hver gruppe er es, og at observatioere er ormalfordelte. Esidet variasaalyse (s. 400) E faktor testes. (Excel: vælg Aova ekelt faktor) Fx om Mærkeligt ok testes forskelle i middelværdier ved at sammelige variaser og deres fordelig. Y ij = μ + α i + ε ij Det atages at fejleeεij N(0, σ ) Altså at der ikke er oge systematik i fejlee, og at alle fejl har samme variatio. μ er geemsittet for alle måliger. α i er : i te kategoris geemsit μ. (rækkeeffekte) Det vil sige, at hvis α i overalt er 0, er middelværdiere es. H 0 : α i = α j for alle i,j. H 1 : α i α j midst ét i,j Det ka udersøges hvor meget af de totale variatio (SST), der skyldes forskelle i kategorieres middelværdier(ss(tr)), og hvor meget der skyldes fejl(sse). SST=SS(Tr)+SSE Teststørrelse F: SS( Tr)/( k 1) F = SSE /( N k) hvor N er det totale atal observatioer, og k er atal kategorier eller grupper. Forkast H 0, hvis F > F α (k-1,n-k) (brug ALTID α, og ikke α/) Sum of squares/ kvadratafvigelsessummer ( hjælpestørrelser): Se også s. 404. T C = N Hvor T er summe af alle observatioer, og N er atal observatioer, k i SST = y C i= 1 j= i ij Udreges ved at kvadrere alle observatioer, lægge dem samme og trække C fra 39

k Ti SS( Tr) = C i= 1 i Udreges ved at lægge alle observatioer samme i i te kategori, kvadrere dee sum, dividere de med atal observatioer i kategorie, og trække C fra. Også lig med: De kvadrerede forskel mellem hver observatio i de i te kategori og geemsittet i de i te kategori, gaget med atal observatioer i de i te kategori. SSE = SST-SS(Tr) Variatiosaalysetabel Variatioskilde Sum of squares Frihedsgrader S Teststørrelse F Behadlig/Treatmet SS(Tr) k-1 S tr= SS(Tr)/(k-1) S tr/s err Residual/Error SSE N-k S err= SSE/(N-k) Total SST N-1 Totale atal frihedsgrader = Frihedsgrader for behadlig Frihedsgrader for residualere (1-α) kofidesiterval for forskelle i middelværdi (s. 410) 1 1 yi yl ± tα / s i l Brug at s = S err= SSE/(N-k) y i og yl er geemsit for de ekelte behadliger. Frihedsgrade for t er fejles frihedsgrad, altså N-k. Tosidet variasaalyse / radomiseret blokforsøg (s.417) To faktorer har (muligvis) idflydelse på data. (Excel: Vælg Aova, to faktorer ude getagelse). Der er delt op i blokke, idet der er to forskellige iddeligskriterier. Fx: hvad har idflydelse på måleresultatere af forskellige materialers styrke: måleistrumetere eller materialet? Y ij = μ + α i + β j + ε ij εij N(0, σ ) α i svarer til kategorieres idflydelse, β j svarer til blokkees idflydelse. Fejlee skal ige være ormalfordelte og usystematiske. μ er geemsittet for alle måliger. α i er : i te kategoris geemsit μ. β j er : j te bloks geemsit μ. Behadlig: H 0 (kategori): α 1 =α = =α a =0 H 1 : o H 0 SS(Tr)/(a-1) F tr = SSE/(a-1)(b-1) Forkast H 0, hvis F > F α (a-1,(a-1)(b-1)) 40

Blokke: H 0 (blok): β 1 = β = = β b=0 H 1 : o H 0 SS(Bl)/(b-1) F Bl = SSE/(a-1)(b-1) Forkast H 0, hvis F > F α (b-1,(a-1)(b-1)) Det ka udersøges hvor meget af de totale variatio (SST), der skyldes forskelle i kategorieres middelværdier(ss(tr)), forskelle i blokkees middelværdier og hvor meget der skyldes fejl(sse). SST=SS(Tr)+SS(Bl) + SSE Variatiosaalysetabel s. 40 Variatioskilde Sums of squares Frihedsgrader S Teststørrelse F Behadlig/Treatmet SS(Tr) a-1 S tr= SS(Tr)/(a-1) S tr/s err Blokke SS(Bl) b-1 S bl= SS(Bl)/(b-1) S bl/s err Residual/Error SSE (a-1)(b-1) S err= SSE/(a-1)(b-1) Total SST N-1 a er atal behadliger, b er atal blokke. Ma ka behadle lige så mage faktorer ma har lyst til, idet de ekelte faktors bidrag til variase udersøges hver for sig. De sættes altid i forhold til fejles bidrag. Atal faktorer = atal dimesioer Sums of squares (s. 419) Formler for SS(Tr), SS(Bl), SST og SSE for mauel udregig. T C = ab Hvor T er summe af alle observatioer, a SST = y C b i= 1 j= i ij Udreges ved at kvadrere alle observatioer, lægge dem samme og trække C fra a Ti SS( Tr) = C i= 1 b T i udreges ved at summere over de b observatioer i hver treatmet. T i lægges samme, divideres med atal blokke, og C trækkes fra. b T j SS( Bl) = C j= 1 a T j udreges ved at summere over de a observatioer i hver blok. T j lægges samme, divideres med atal treatmets, og C trækkes fra. SSE = SST-SS(Tr)-SS(Bl) 41