Lineær regression: lidt mere tekniske betragtninger om R 2 og et godt alternativ
|
|
- Julius Michelsen
- 6 år siden
- Visninger:
Transkript
1 Lineær regression: lidt mere tekniske betragtninger om R 2 og et godt alternativ Per Bruun Brockhoff, DTU Compute, Claus Thorn Ekstrøm, KU Biostatistik, Ernst Hansen, KU Matematik January 17, 2017 Abstract Dette ekstra lille notat om den såkaldte R 2 -værdi, som kan beregnes i forbindelse med lineær regression, skal ses i sammenhæng med vores ikke-tekniske notat om samme emne (Brockhoff et al., 2017). Ud over at få defineret tingene matematisk præcist, vil vi foreslå spredningen σ som et godt alternativ. De to hænger nært sammen, måler for så vidt det samme, R 2 på en relativ måde og σ på en absolut måde. Spredningen σ kan ses i ret direkte sammenhæng med usikkerhedsbetragtninger mere generelt, som vi i det store billede mener er ret vigtige. Definition af R 2 i den simple lineære regressionssituation Lad os lige minde om hvad vi overhovedet taler om. Den simpleste forekomst af R 2 optræder i den lineære regressionsmodel, y i = α + βx i + ε i, i = 1,..., n. Til hver måling y i er der knyttet en kovariat x i, og man kan ønske at undsøger om kovariaten har en lineær påvirkning af målingen og i givet fald at kvantificere og fortolke sammenhængen og måske at benytte den til at forudsige y-værdien for nye x-værdier. Parametrene α og β er ukendte, og analysen af regressionsmodellen fokuserer normalt på at estimere dem. De tilbageværende størrelser ε 1,..., ε n er såkaldte støjvariable, der skal redde modellen fra at kollapse i mødet med virkeligheden, hvor parrene (x i, y i ) jo aldrig ligger præcis på en matematisk ret linje. Den sædvanlige antagelse om støjvariablene er, at de er uafhængige, og at de er normalfordelte med middelværdi 0 og samme varians σ 2 (endnu en parameter i modellen). I denne ramme defineres R 2 ved formlen R 2 = SS 2 xy SS xx SS yy, (1) 1
2 hvor SS xy, SS xx og SS yy er nogle af de standard beregningsstørrelser, man alligevel ofte regner ud i forbindelse med estimation af de tre parametre α, β og σ 2 : ˆβ = SS xy SS xx (2) ˆα = ȳ ˆβ x (3) hvor SS xx = SS yy = SS xy = (x i x) 2 (4) (y i ȳ) 2 (5) (x i x)(y i ȳ) (6) Disse resultater er også velkendte fra mindste kvadraters metode, og giver modellens estimerede hældning og skæring (på baggrund af de tilgængelige data). Med de estimerede parametre kan vi bruge modellen til at udregne de forventede værdier, ŷ i, der beskriver, hvad vi i gennemsnit forventer at observere for en given x i -værdi: ŷ i = ˆα + ˆβx i. Med disse størrelser kan vi estimere variansen, der er baseret på forskellen mellem de reelle observationer, y i, og de forventede observationer (på baggrund af modellen og de tilhørende x i er) ˆσ 2 = 1 n 2 R 2 for mere komplicerede modeller (y i ŷ i ) 2 (7) Ovenfor er R 2 defineret i det simple lineære regressionssetup, men R 2 kan også benyttes for mere komplicerede modeller med flere forklarende variable, for eksempel P forklarende variable, dvs. x i = (x i1,..., x ip ), så længe man stadig er indenfor klassen af lineære modeller. En lineær model refererer til, at sammenhængen mellem y og x kan skrives i et lineært ligningssystem y i = α + P β p x ip + ε i, i = 1,..., n, p=1 2
3 og vil derfor også dække specialtilfælde som eksempelvis polynomial regression y i = α + β 1 x i + β 2 x 2 i + ε i, i = 1,..., n. Bemærk, at man således godt kan modellere en ikke-lineær relation mellem x og y med en lineær model. Der findes naturligvis også egentlig ikke-linære modeller, men selvom R 2 kan defineres for sådanne ikke-lineære regressionsmodeller, så har den ikke længere sin sædvanlige fortolkning som forklaringsgrad, formel () nedenfor gælder ikke længere, og summen af residualerne er ikke længere nul. Detaljerne i disse yderligere (ikke-linære) udfordringer ved forståelsen og brugen af R 2 er ikke berørt nærmere hverken her eller i vores ikke-tekniske notat. Lidt flere detaljer om R 2 for linære modeller R 2 er også den kvadrerede korrelation mellem y-værdier og de forventede y-værdier i modellen for de x-er man har med, ŷ i -værdierne. Denne definition gælder også for de mere generelle lineære modeller med flere x-variable. R 2 er givet ved y-variationer, og dem findes der to/tre af to af dem summerer til den tredje: hvor SST = SS yy = SST = SSM + SSE, (y i ȳ) 2, SSM = (ŷ i ȳ) 2, SSE = (y i ŷ i ) 2. Bemærk at SS(Total) = SST udtrykker y-variationen uden nogen x-indblanding, og bemærk, at hvis man dividerer SST med n 1 så har man den klassiske beregning af en stikprøvevarians anvendt på y-data. SSM er variationen givet ud fra x erne, og SSE er den såkaldte restvariation, der udtrykker forskellen mellem linje-værdierne ŷ i og data y i. Det er denne SSE-værdi man har minimeret, når man har fundet den bedste rette linje ved hjælp af mindste kvadraters metode den er så lille som det er muligt med de data man har. Nu kan man så skrive præcist hvad R 2 faktisk er på en lidt anden vis end ovenfor: R 2 = (SST SSE) SST = 1 SSE SST Så R 2 er givet ved forholdet mellem disse to y-variationer: y-variationen, som den nu engang kommer, og restvariationen i y, når man har fjernet det, som x kan forklare gennem linjen. (eller en mere generelle model, hvis en sådan er i spil det gør ingen forskel for udtrykkene her). Og heraf fortolkningen: Forklaringsgrad Heraf kan man også linke til teori omkring variation og varianser/spredninger: En matematiker vil vide, at en varians (som teoretisk begrebsmæssigt er et integrale) ikke er transformationsinvariant: Anvender man en ikke-lineær transformation af skala/data, vil disse tal naturligvis ændre sig på en ikke-simpel måde. 3
4 Selvom det ikke fremgår så direkte af ovenstående, så afhænger R 2 naturligvis også af x- værdierne - det er gennem ŷ i -værdierne denne afhængighed kan ses. Hvis enten alle y- værdierne er ens, så SST = 0, og punkterne ligger eksakt på en horisontal linje, eller alle x-værdierne er ens, så er R 2 ikke defineret. Lineær regression kan have forskellige formål stikord Der kan være forskellige årsager til at man laver lineær regression, og derfor kan fokus også ændre sig lidt. Formålet kan eksempelvis være at afdække om der er en sammenhæng mellem to variable (hermed underforstået at vi leder efter en lineær sammenhæng). Nogle ville kalde dette for korrelationsanalyse, og fokusere på korrelationen og ikke på selve linjen (og måske lave et hypotese-test for om korrelation=0). I denne situation der oftest bliver brugt i socio og samfundsfagssammenhænge er man udelukkende interesseret i at vurdere, om der er en sammenhæng, og derfor opfattes x erne og y erne i modellen i princippet symmetrisk: hvis man laver en tilsvarende lineær regressionsanalyse, hvor man modellerer x som lineær funktion af y, så opnår man samme resultat. kvantificere den underliggende lineære relation mellem middelværdierne af y og x for fortolkningens skyld eller evt at kunne interpolere, altså skønne/estimere eksempelvis middelvægten for personer af en højde man ikke lige fik med i stikprøven (men stadig inden for range af data man skal være varsom med at ekstrapolere). Her kan man beregne linjen, og kombinere med konfidensintervaller (Bemærk: hypotese-testet for hælding=0 er det samme som for korrelation=0). bruge modellen til at prædiktere nye cases, der kommer til altså beregne ŷ ny for en konkret x ny -værdi. (beregne linjen, og kombinere med prædiktionsintervaller, der også direkte involverer spredningen). Formålet kan/bør måske også ses i en lidt større sammenhæng som at besvare: Hvad er den rette model? Her vil målet være at finde den rette model, dernæst kvantificere elementerne i denne model, og så kan vi evt til sidst enten estimere eller prædiktere, hvis vi ønsker. Et alternativ til R 2 R 2 er som vist et relativ mål for hvor tæt modellen ligger på data. Dette anvendes ofte i situationer, hvor skalaen på variablerne ikke i sig selv betyder så meget, f.eks. i samfundsfag, sociologi, psykologi, etc, hvor det kan være forskellige spørgeskema-skalaer, der er i brug. Taler vi om anvendelser inden for teknik og naturvidenskab, vil der ofte være ret konkrete skalaer for såvel x som y. I sådanne tilfælde kan følgende alternativ være en god ide. 4
5 Vi giver herunder et forslag til at benytte et absolut mål for afvigelsen mellem model og data fremfor det relative mål som R 2 faktisk er. Men før dette bør man gøre sig klart, at det i langt de fleste tilfælde er selve linjen, der vil være det mest interessante i en konkret sammenhæng. Derfor er estimation/beregning af linjen helt centralt. Dernæst vil det mest relevante være at kvantificere usikkerheden i bestemmelsen af linjen, noget vi typisk ville gøre ved at beregne stikprøveusikkerhederne for afskæring og hældning, for derefter evt at udtrykke disse i konfidensintervaller for disse to størrelser (i praksis er det oftest hældningen, der udtrykker noget spændende). Den centrale størrelse der indgår i formlerne for disse usikkerheder er netop det absolutte mål, der præsenteres nu (se figur 1). y x Figur 1: De absolutte vertikale afstande (de blå stiplede linjer) måler, hvor langt den lineære regressionsmodel (den røde linje) ligger fra de observerede data, og de har samme skala som y. Spredningen ˆσ udtrykker den gennemsnitlige værdi af disse. Hvis man bruger SSE absolut set i stedet for relativt, SSE/SST, og beregner: SSE ˆσ = (n 2) så har man faktisk estimeret den underliggende spredning for y-værdierne (for en fastholdt x-værdi), som desuden er en parameter i den klassiske formelle statistiske model, der kan ligge 5
6 bagved: y i = α + βx i + ε i, ε i N(0, σ 2 ). Man har således på denne vis kvantificeret den gennemsnitlige afstand mellem y-værdier og linjen direkte, og det vil være er klart for de fleste med teknisk/naturvidenskabelig baggrund at det er et tal, der kommer med den samme fysiske enhed som y-værdien kommer med fra starten. På den vis bliver f.eks. skalaafhængigheden meget direkte tydelig for enhver, og tallet har en rigtig god fortolkning. Tallet σ er således hverken mere eller mindre rigtigt at beregne end R 2, og hvis man forsøger at bruge σ til den at besvare de spørgsmål vi har anført ovenfor, løber man ind i samme problemer som med R 2. Det er klart, at da tallet her for en given total y-variation er ækvivalent med R 2 -værdien, så er det hverken mere eller mindre rigtigt at beregne end R 2, og hvis man forsøger at bruge σ til den at besvare de spørgsmål vi har anført ovenfor, løber man ind i samme problemer som med R 2. Men måske det for mange vil være et tal man lettere kan forholde sig til, og måske man i lidt mindre grad vil være fristet til at drage forhastede konklusioner ud fra dette tal end man kan være med R 2. En lille krølle er følgende: Skulle man nu alligevel få tanken, at man gerne i tillæg vil fortolke (residual)spredningen relativt til den spredning, som y-værdierne har uden indlanding af x erne: SSyy ˆσ y = n 1 Altså tilbage til den relative fortolkning som R 2 egentlig har, og f.eks. beregne ˆσ2, så har ˆσ y 2 man faktisk beregnet den såkaldte Adjusted R 2, som mange software-pakker helt standard i tillæg vil beregne for sådanne modeller, ellere rettere 1 Radj 2 : ˆσ 2 ˆσ 2 y = SSE/(n P 1) SST/(n 1) = (n 1) SSE (n P 1) SST (n 1) ( = ) 1 R 2 = 1 Radj 2 (n P 1) hvor p er antallet af x-variabler i modellen. Og på flere måder er den adjustede R 2 faktisk at foretrække frem for den almindelige. For simple lineære regressioner (P = 1) med stort n, er der ikke nogen væsentlig forskel på de to, idet (n 1)/(n 2) således vil være tæt på 1. Usikkerhedsbetragtninger Et af de helt centrale budskaber i statistik som fagområde er, at alt vi beregner på og uddrager af data er behæftet med en eller anden form for usikkerhed/variation. Faktisk er dette mere centralt end det klassiske hypotesetest, som ofte som metode lidt uhensigtsmæssigt kan blive synonym med statistik, se også Ekstrøm et al. (2017). Dette gælder således ligeledes beregningsstørrelser i regressionssammenhænge. Den beregnede spredning ˆσ indgår centralt i de relevante usikkerhedsberegninger for såvel afskæring ˆα, hældning ˆβ og linjeberegninger: 6
7 1 ˆσˆα = ˆσ n + x2 (8) SS xx 1 ˆσ ˆβ = ˆσ (9) SS xx 1 ˆσˆα+x0 ˆβ = ˆσ n + (x 0 x) 2 (10) SS xx = ˆσ ˆσˆα+x0 ˆβ+ɛ0 n + (x 0 x) 2 (11) SS xx Det er naturligvis hverken hensigten her at forklare og bevise alle disse formler eller at man som gymnasieelev i Danmark skal lære detaljerne af dette. I mange såkaldte non-calculus baserede statistikkurser på indledende universitetsniveau for mange studieretninger verden over angives disse og lignende formler ligeledes uden bevis. Det kræver dog ikke andet end nogle lineære varians-regneregler eller, om man vil, lineære fejlophobningsbetragtninger. Alle disse spredninger kaldes også nogen gange for standard errors eller stikprøvespredninger - de udtrykker hvor meget en beregnet størrelse forventes at variere fra stikprøve-til-stikprøve, altså hvor usikkert bestemt den egentlig er. Vi viser formlerne her for at understrege den fundamentale betydning af spredningen, som indgår på samme måde i alle formlerne. Og alle usikkerhedsformlerne er udvidede versioner af den samme og helt fundamentale usikkerhedsformel for et simpelt stikprøvegennemsnit, f.eks. udtrykt ved y: (uden indblanding af x) ˆσȳ = ˆσ y 1 = ˆσ y n n De fleste indledende statistikkurser vil introducere de grundlæggende statistiske begreber som hypotesetests og konfidensintervaller i dette simpleste af alle setups. Konfidensintervaller er det konkrete statistiske redskab man kan tage i anvendelse for at formalisere usikkerhedsbetragtninger ved hjælp af sandsynlighedsteori. Igen er det ikke hensigten at give en udtømmende gennemgang her, men f.eks. bliver (1 α) konfidensintervallerne for α og β (12) ˆα ± t 1 α/2ˆσ α (13) ˆβ ± t 1 α/2ˆσ β (14) hvor t 1 α/2 er (1 α/2)-fraktilen for en t-fordeling med n 2 frihedsgrader. t-fordelingen kan løst siges at være en version af standard normalfordelingen, der tager højde for at variansen, der indgår er estimeret fra data, og altså i sig selv er behæftet med usikkerhed. Hvis den ikke var det, ville normalfordelingen kunne anvendes for alle usikkerhedsberegningerne, idet 7
8 lineære transformationer af normalfordelinger igen er normalfordelinger. I praksis vil disse konfidensintervalformler ofte tilnærmelsesvis have formen: ȳ ± 2ˆσȳ, altså hvor man har et estimat for en parameter (her gennemsnittet) plus/minus 2 gange usikkerheden på estimatet. Ved at bruge normalfordelingen kan man se, at disse grænser omtrentlig vil svare til 95% konfidens, og denne fundamentale relation kan være god at kommunikere ud. Og som en sidste lille perspektiverende gymnasiekrølle: Det er standard metodik i indledende statistikkurser, at man under visse normalfordelingsforudsætninger kan kvantificere usikkerheden i sprednings- og variansberegninger i sig selv ved brug af χ 2 -fordelingen. Alstå den samme fordeling som anvendes til det klassiske χ 2 -test. Det er en matematisk/sandsynlighedsteoretisk konsekvens af at kvadrere normalfordelinger. Og pudsigt nok, er der ingen global tradition for tilsvarende at kvantificere usikkerheden i en R 2 -beregning, selvom den, som sammenhængene ovenfor viser, på helt samme måde er behæftet med usikkerhed. Og dermed er der uden tvivl en større risiko for at denne usikkerhed bliver glemt i skyndingen, end tilsvarende for ˆσ. Referencer Brockhoff Per Bruun, Hansen Ernst, Ekstrøm Claus Thorn. Brugen af R 2 i gymnasiet // LMFK-bladet Ekstrøm Claus Thorn, Hansen Ernst, Brockhoff Per Bruun. Statistik i gymnasiet // LMFKbladet
Forelæsning 11: Kapitel 11: Regressionsanalyse
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs mereOversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse
Læs mereEpidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse
Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser
Læs mereProgram: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19
Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større
Læs mereAnvendt Statistik Lektion 8. Multipel Lineær Regression
Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke
Læs mereEpidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk
Eksempel: Systolisk blodtryk Udgangspunkt: Vi ønsker at prædiktere det systoliske blodtryk hos en gruppe af personer. Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Afdeling for Biostatistik.
Læs mere12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse
. september 5 Epidemiologi og biostatistik. Forelæsning Uge, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression
Læs mere1 Regressionsproblemet 2
Indhold 1 Regressionsproblemet 2 2 Simpel lineær regression 3 2.1 Mindste kvadraters tilpasning.............................. 3 2.2 Prædiktion og residualer................................. 5 2.3 Estimation
Læs mereMindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning
1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3
Læs mereMLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som
MLR antagelserne Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + u, hvor β 0, β 1, β 2,...,β k er ukendte parametere,
Læs mereOpgave 11.4 side 316 (7ed: 11.4, side 352 og 6ed: 11.2, side 345)
Kursus 4: Besvarelser til øvelses- og hjemmeopgaver i uge 11 Opgave 11.4 side 316 (7ed: 11.4, side 35 og 6ed: 11., side 345) Opgaven består i at foretage en regressionsanalse. Først afbildes data som i
Læs mereØkonometri Lektion 1 Simpel Lineær Regression 1/31
Økonometri Lektion 1 Simpel Lineær Regression 1/31 Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Statistisk model: Vi antager at sammenhængen
Læs mereLøsning til eksaminen d. 14. december 2009
DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,
Læs mereKursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff
Kursus 02402 Introduktion til Statistik Forelæsning 13: Summary Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:
Læs mereMultipel regression. Data fra opgave 3 side 453: Multipel regressionsmodel: Y = α + β 1 x 1 + β 2 x 2 + ǫ. hvor ǫ N(0, σ 2 ).
Program 1. multipel regression 2. polynomiel regression (og andre kurver) 3. kategoriske variable 4. Determinationkoefficient og justeret determinationskoefficient 5. ANOVA-tabel 1/13 Multipel regression
Læs merePerspektiver i Matematik-Økonomi: Linær regression
Perspektiver i Matematik-Økonomi: Linær regression Jens Ledet Jensen H2.21, email: jlj@imf.au.dk Perspektiver i Matematik-Økonomi: Linær regression p. 1/34 Program for i dag 1. Indledning: sammenhæng mellem
Læs mereLøsning eksamen d. 15. december 2008
Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Læs mereAnvendt Statistik Lektion 7. Simpel Lineær Regression
Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot
Læs mereHvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm
Kon densintervaller og vurdering af estimaters usikkerhed Claus Thorn Ekstrøm KU Biostatistik ekstrom@sund.ku.dk Marts 18, 2019 Slides @ biostatistics.dk/talks/ 1 Population og stikprøve 2 Stikprøvevariation
Læs mereØkonometri: Lektion 2 Multipel Lineær Regression 1/27
Økonometri: Lektion 2 Multipel Lineær Regression 1/27 Multipel Lineær Regression Sidst så vi på simpel lineær regression, hvor y er forklaret af én variabel. Der er intet, der forhindre os i at have mere
Læs mere3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve
Læs mereMotivation. Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser
Motivation Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser Rasmus Waagepetersen October 26, 2018 Eksempel: En landmåler får til opgave at måle længden λ fra A til B. Entreprenøren
Læs mereUge 43 I Teoretisk Statistik, 21. oktober Forudsigelser
Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier
Læs mereKapitel 11 Lineær regression
Kapitel 11 Lineær regression Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 1 Indledning Vi modellerer en afhængig variabel (responset) på baggrund af en uafhængig variabel (stimulus),
Læs mereAnalysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17
nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse
Læs mereSimpel Lineær Regression: Model
Simpel Lineær Regression: Model Sidst så vi på simpel lineære regression. Det er en statisisk model på formen y = β 0 + β 1 x + u, hvor fejlledet u, har egenskaben E[u x] = 0. Dette betyder bl.a. E[y x]
Læs mereEksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning
1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion
Læs mereTænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.
Repetition af vektor-regning Økonometri: Lektion 3 Matrix-formulering Fordelingsantagelse Hypotesetest Antag vi har to n-dimensionelle (søjle)vektorer a 1 b 1 a 2 a =. og b = b 2. a n b n Tænk på a og
Læs mereDen lineære normale model
Den lineære normale model Ingredienser: V : N-dimensionalt vektorrum. X : Ω V : stokastisk variabel. L : ægte underrum af V, dimension k., : fundamentalt indre produkt på V. Vi laver en hel familie af
Læs mereSimpel Lineær Regression
Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Vi antager at sammenhængen mellem y og x er beskrevet ved y = β 0 + β 1 x + u. y: Afhængige
Læs mereØkonometri: Lektion 2 Multipel Lineær Regression 1/33
Økonometri: Lektion 2 Multipel Lineær Regression 1/33 Simpel Lineær Regression: Model Sidst så vi på simpel lineære regression. Det er en statisisk model på formen y = β 0 +β 1 x +u, hvor fejlledet u,
Læs mereTema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.
Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller
Læs meremen nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller
Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =
Læs mereStatistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge
Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2
Læs mereKursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte
Læs mereForelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)
Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske
Læs mereNormalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ
Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet
Læs mereKursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte
Læs mereBrugen af R 2 i gymnasiet
Brugen af R 2 i gymnasiet Per Bruun Brockhoff, DTU Compute Ernst Hansen, KU Matematik Claus Thorn Ekstrøm, KU Biostatistik 17 januar 2017 Der lader til at være en vis forvirring blandt og uenighed mellem
Læs meregrupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
Læs mereI dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd
I dag Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik SaSt) Helle Sørensen Først lidt om de sidste uger af SaSt. Derefter statistisk analyse af en enkelt
Læs mereModul 12: Regression og korrelation
Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 12: Regression og korrelation 12.1 Sammenligning af to regressionslinier........................ 1 12.1.1 Test for ens hældning............................
Læs mereNATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.
NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. Eksamen i Statistik 1TS Teoretisk statistik Den skriftlige prøve Sommer 2002 3 timer - alle hjælpemidler tilladt Det er tilladt at skrive
Læs mereTema. Dagens tema: Indfør centrale statistiske begreber.
Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i
Læs mereLøsning til eksaminen d. 29. maj 2009
DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Læs mere1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ
Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen
Læs mereStatistisk modellering og regressionsanalyse
Statistisk modellering og regressionsanalyse Claus Thorn Ekstrøm KU Biostatistik ekstrom@sund.ku.dk Oktober 25, 2018 Slides @ biostatistics.dk/talks/ 1 2 Hvad er statistik? Statistics is a science, not
Læs mereLineær regression. Simpel regression. Model. ofte bruges følgende notation:
Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til
Læs mereKvantitative metoder 2
Kvantitative metoder 2 Den multiple regressionsmodel 5. marts 2007 regressionsmodel 1 Dagens program Emnet for denne forelæsning er stadig den multiple regressionsmodel (Wooldridge kap. 3.4-3.5, E.2) Variansen
Læs mereØkonometri 1. Dagens program. Den simple regressionsmodel 15. september 2006
Dagens program Økonometri Den simple regressionsmodel 5. september 006 Den simple lineære regressionsmodel (Wooldridge kap.4-.6) Eksemplet fortsat: Løn og uddannelse på danske data Funktionel form Statistiske
Læs mereProdukt og marked - matematiske og statistiske metoder
Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring
Læs mere02402 Vejledende løsninger til Splus-opgaverne fra hele kurset
02402 Vejledende løsninger til Splus-opgaverne fra hele kurset Vejledende løsning SPL3.3.1 Der er tale om en binomialfordeling med n =10ogp=0.6, og den angivne sandsynlighed er P (X =4) som i bogen også
Læs mereStatistik og Sandsynlighedsregning 2
Statistik og Sandsynlighedsregning 2 Normalfordelingens venner og bekendte Helle Sørensen Uge 9, onsdag SaSt2 (Uge 9, onsdag) Normalfordelingens venner 1 / 20 Program Resultaterne fra denne uge skal bruges
Læs mereUniversity of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version
university of copenhagen University of Copenhagen Notat om statistisk inferens Larsen, Martin Vinæs Publication date: 2014 Document Version Peer-review version Citation for published version (APA): Larsen,
Læs mere1 Hb SS Hb Sβ Hb SC = , (s = )
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.
Læs mereOversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff
Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs mere! Variansen på OLS estimatoren. ! Multikollinaritet. ! Variansen i misspecificerede modeller. ! Estimat af variansen på fejlleddet
Dagens program Økonometri Den multiple regressionsmodel 4. februar 003 regressionsmodel Emnet for denne forelæsning er stadig den multiple regressionsmodel (Wooldridge kap. 3.4-3.5)! Opsamling fra sidst
Læs mereEksamen i Statistik for biokemikere. Blok
Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)
Læs mereØkonometri lektion 5 Multipel Lineær Regression. Inferens Modelkontrol Prædiktion
Økonometri lektion 5 Multipel Lineær Regression Inferens Modelkontrol Prædiktion Multipel Lineær Regression Data: Sæt af oservationer (x i, x i,, x ki, y i, i,,n y i er den afhængige variael x i, x i,,
Læs mereResidualer i grundforløbet
Erik Vestergaard www.matematikfysik.dk 1 Residualer i grundforløbet I dette lille tillæg til grundforløbet, skal vi kigge på begreberne residualer, residualplot samt residualspredning. Vi vil se, hvad
Læs mereModule 3: Statistiske modeller
Department of Statistics ST502: Statistisk modellering Pia Veldt Larsen Module 3: Statistiske modeller 31 ANOVA 1 32 Variabelselektion 4 321 Multipel determinationskoefficient 5 322 Variabelselektion med
Læs mereMikro-kursus i statistik 1. del. 24-11-2002 Mikrokursus i biostatistik 1
Mikro-kursus i statistik 1. del 24-11-2002 Mikrokursus i biostatistik 1 Hvad er statistik? Det systematiske studium af tilfældighedernes spil!dyrkes af biostatistikere Anvendes som redskab til vurdering
Læs mereLineære normale modeller (4) udkast
E6 efterår 1999 Notat 21 Jørgen Larsen 2. december 1999 Lineære normale modeller (4) udkast 4.5 Regressionsanalyse 4.5.1 Præsentation 1 Regressionsanalyse handler om at undersøge hvordan én målt størrelse
Læs mereLøsning til eksamen d.27 Maj 2010
DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1
Læs mereLøsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)
Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up
Læs mereDagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at
Likelihood teori Lineær regression (intro) Dagens Emner Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 1 ) = ( 2πσ 2)n/2 e 1 2 P n (xi µ)2 er tætheden som funktion af
Læs mereModul 6: Regression og kalibrering
Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 6: Regression og kalibrering 6.1 Årsag og virkning................................... 1 6.2 Kovarians og korrelation...............................
Læs mereØkonometri: Lektion 7 Emne: Prædiktionsintervaller, RESET teset, proxy variable og manglende data.
Økonometri: Lektion 7 Emne: Prædiktionsintervaller, RESET teset, proxy variable og manglende data. 1 / 32 Motivation Eksempel: Savings = β 0 + β 1 Income + u Vi ved allerede, hvordan vi estimerer regresseionlinjen:
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs mereStatistik Lektion 4. Variansanalyse Modelkontrol
Statistik Lektion 4 Variansanalyse Modelkontrol Eksempel Spørgsmål: Er der sammenhæng mellem udetemperaturen og forbruget af gas? Y : Forbrug af gas (gas) X : Udetemperatur (temp) Scatterplot SPSS: Estimerede
Læs mereTo samhørende variable
To samhørende variable Statistik er tal brugt som argumenter. - Leonard Louis Levinsen Antagatviharn observationspar x 1, y 1,, x n,y n. Betragt de to tilsvarende variable x og y. Hvordan måles sammenhængen
Læs mereKonfidensintervaller og Hypotesetest
Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller
Læs mere(studienummer) (underskrift) (bord nr)
Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 14. december 2009 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs mere(tæt på N(0,1) hvis n ikke alt for lille). t i god til at checke for outliers som kan have stor indflydelse på estimaterne s 2 og ˆσ 2 e i
Da er r i = e i ˆσ ei t(n 3) (tæt på N(0,1) hvis n ikke alt for lille). Program 1. lineær regression: opgave 3 og 13 (sukker-temperatur). 2. studentiserede residualer, multipel regression. Tommelfinger-regel:
Læs mereProgram. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter
Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede
Læs mereEnsidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese
Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet
Læs mereSkriftlig eksamen Science statistik- ST501
SYDDANSK UNIVERSITET INSTITUT FOR MATEMATIK OG DATALOGI Skriftlig eksamen Science statistik- ST501 Torsdag den 21. januar Opgavesættet består af 5 opgaver, med i alt 13 delspørgsmål, som vægtes ligeligt.
Læs mereStatistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge
Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange
Læs mereDansk Erhvervs gymnasieeffekt - sådan gør vi
Dansk Erhvervs gymnasieeffekt - sådan gør vi FORMÅL Formålet har været at undersøge, hvor dygtige de enkelte gymnasier er til at løfte elevernes faglige niveau. Dette kan man ikke undersøge blot ved at
Læs mereDansk Erhvervs gymnasieanalyse Sådan gør vi
METODENOTAT Dansk Erhvervs gymnasieanalyse Sådan gør vi FORMÅL Formålet med analysen er at undersøge, hvor dygtige de enkelte gymnasier er til at løfte elevernes faglige niveau. Dette kan man ikke undersøge
Læs mereForelæsning 9: Inferens for andele (kapitel 10)
Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs mereInstitut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6
Institut for Matematiske Fag Matematisk Modellering 1 Aarhus Universitet Eva B. Vedel Jensen 25. februar 2008 UGESEDDEL 6 Forelæsningerne torsdag den 21. februar og tirsdag den 26. februar. Jeg har gennemgået
Læs mereMultipel Lineær Regression
Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer
Læs mereVejledende besvarelser til opgaver i kapitel 14
Vejledende besvarelser til opgaver i kapitel 14 Opgave 1 a) Det første trin i opstillingen af en hypotesetest er at formulere to hypoteser, hvoraf den ene støtter den teori vi vil teste, mens den anden
Læs mereNanostatistik: Lineær regression
Nanostatistik: Lineær regression JLJ Nanostatistik: Lineær regression p. 1/41 Sammenhænge Funktionssammenhæng: y er en funktion af x. Ex: Hvis jeg kender afstanden mellem to galakser så kender jeg også
Læs mereNote om Monte Carlo metoden
Note om Monte Carlo metoden Kasper K. Berthelsen Version 1.2 25. marts 2014 1 Introduktion Betegnelsen Monte Carlo dækker over en lang række metoder. Fælles for disse metoder er, at de anvendes til at
Læs mereDen lineære normale model
Den lineære normale model Ingredienser: V : N-dimensionalt vektorrum. X : Ω V : stokastisk variabel. L : ægte underrum af V, dimension k., : fundamentalt indre produkt på V. Vi laver en hel familie af
Læs mereMuligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling.
Eksempel: dæktyper og brændstofforbrug (opgave 25 side 319) Program: cars 1 2 3 4 5... radial 4.2 4.7 6.6 7.0 6.7... belt 4.1 4.9 6.2 6.9 6.8... Muligheder: 1. vi starter med at gennemgå opgave 7 side
Læs mereØkonometri: Lektion 6 Emne: Heteroskedasticitet
Økonometri: Lektion 6 Emne: Heteroskedasticitet 1 / 32 Konsekvenser af Heteroskedasticitet Antag her (og i resten) at MLR.1 til MLR.4 er opfyldt. Antag MLR.5 ikke er opfyldt, dvs. vi har heteroskedastiske
Læs mereModule 4: Ensidig variansanalyse
Module 4: Ensidig variansanalyse 4.1 Analyse af én stikprøve................. 1 4.1.1 Estimation.................... 3 4.1.2 Modelkontrol................... 4 4.1.3 Hypotesetest................... 6 4.2
Læs mereKvantitative metoder 2
Kvantitative metoder Heteroskedasticitet 11. april 007 KM: F18 1 Oversigt: Heteroskedasticitet OLS estimation under heteroskedasticitet (W.8.1-): Konsekvenser af heteroskedasticitet for OLS Gyldige test
Læs mereModul 11: Simpel lineær regression
Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 11: Simpel lineær regression 11.1 Regression uden gentagelser............................. 1 11.1.1 Oversigt....................................
Læs mere13.1 Substrat Polynomiel regression Biomasse Kreatinin Læsefærdighed Protein og højde...
Modul 13: Exercises 13.1 Substrat.......................... 1 13.2 Polynomiel regression.................. 3 13.3 Biomasse.......................... 4 13.4 Kreatinin.......................... 7 13.5 Læsefærdighed......................
Læs mere13.1 Substrat Polynomiel regression Biomasse Kreatinin Læsefærdighed Protein og højde...
Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 13: Exercises 13.1 Substrat........................................ 1 13.2 Polynomiel regression................................
Læs mereStatistik II 4. Lektion. Logistisk regression
Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:
Læs mereØkonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2
Økonometri 1 Den simple regressionsmodel 11. september 2006 Dagens program Den simple regressionsmodel SLR : Én forklarende variabel (Wooldridge kap. 2.1-2.4) Motivation for gennemgangen af SLR Definition
Læs mereEstimation og usikkerhed
Estimation og usikkerhed = estimat af en eller anden ukendt størrelse, τ. ypiske ukendte størrelser Sandsynligheder eoretisk middelværdi eoretisk varians Parametre i statistiske modeller 1 Krav til gode
Læs mereNATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.
NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. Eksamen i Statistik 1TS Teoretisk statistik Den skriftlige prøve Sommer 2003 3 timer - alle hjælpemidler tilladt Det er tilladt at skrive
Læs mere