Statistik 1TS 2005 Obligatorisk opgave 1
|
|
- Tina Sørensen
- 6 år siden
- Visninger:
Transkript
1 9. marts 2005 Stat 1TS / EH Statistik 1TS 2005 Obligatorisk opgave 1 Formelle forhold: Opgaven stilles onsdag d. 9. marts Rapporten skal afleveres til mig personligt. Afleveringsfristen er tirsdag d. 5. april kl (bemærk at det ikke er en forelæsningsdag). For sent indleverede besvarelser vil ikke blive rettet. Rapporten skal skrives ind i et tekstbehandlingsanlæg (eller på maskine). Håndskrevne besvarelser vil ikke blive accepteret. Opgaven kan besvares i grupper af 1-3 studerende. Grupperne må gerne samarbejde undervejs, men den endelige rapport skal være selvstændigt arbejde for hver gruppe. Software: I princippet er valget af software frit. Det anbefales dog at man bruger R. Rapportens indhold: Besvarelsen skal indeholde tekst, formler og grafer, men ikke program-kode. Ernst Hansen 1
2 Vurdering af grafiske størrelser Talmaterialet i denne opgave stammer fra et eksperiment, der blev gennemført i øvelsestimerne i kursets første uger. I eksperimentet fik hver forsøgsperson en række figurer at se, hvor en størrelse mellem 0 og 100 var repræsenteret grafisk, og de blev bedt om at vurdere den bagvedliggende størrelse. Hver figur blev vist på en computerskærm i præcis 5 sekunder, hvorefter forsøgspersonen blev bedt om at vurdere den. Der var intet tidspres i vurderingsfasen, det næste billede blev først vist når forsøgspersonen erklærede sig klar. Der var fire figurtyper, og hver forsøgsperson blev præsenteret for 15 figurer af hver type i tilfældig rækkefølge. Der deltog 32 forsøgspersoner i eksperimentet, og der er således = 1920 enkeltmålinger. Målet med eksperimentet er at afsløre hvilken af de fire figurtyper, der bedst lader sig aflæse. Figur 1: De fire figurtyper i eksperimentet. Øverst til venstre et cirkeldiagram (som regel omtalt som lagkagediagram). Øverst til højre en af de mange tegningstyper, der går under navnet dotplot. Nederst til venstre et barplot, og nederst til højre et logplot. 2
3 De fire figurtyper benævnes henholdsvis cirkeldiagram, dotplot, barplot og logplot (det sidste har ikke noget at gøre med logaritmefunktionen men med det engelske ord for en træstamme). Eksempler er angivet i figur 1. Cirkeldiagrammet og barplottet er tæt beslægtede: for dem begge gælder at det samlede areal af det farvede og det hvide område er 100, og udfordringen er at gætte hvor stor del af det samlede areal, der er farvet. Et logplot er en éndimensional variant, hvor man ikke ser på områder, men på liniestykker: det farvede liniestykke og det ufarvede liniestykker har en samlet længde på 100, og udfordringen er at gætte længden af det farvede liniestykke. Et dotplot to spejlvendte logplots tegnet oven over hinanden: det ene har en farvet prik, og udfordringen er at gætte hvor langt der er fra tegningens venstre side til den farvede prik, når afstanden fra venstre til højre side er 100. Denne afstand er lige så stor som afstanden fra tegningens højre side til den ufarvede prik. Der hersker næppe tvivl om at der er forskel på forsøgspersonernes evne til at gætte rigtigt, men denne forskel interesserer os ikke i denne opgave. Vi opfatter alle målingerne som resultatet af ét virtuelt individs gæt. De teoretiske/statistiske temaer for projektet drejer sig om modelopstilling og modelkontrol, om at finde maksimaliseringsestimatorer ved hjælp af numeriske metoder, og om at beskrive usikkerheden forbundet med parameterestimater. Numerisk maksimering af likelihoodfunktionen For langt de fleste af de modeller, der lever uden for tekstbøgernes beskyttede verden, kan man måske nok opstille likelihoodfunktionen, men man er ude af stand til finde eksplicitte udtryk for maksimaliseringsestimatoren. I så fald er man henvist til at benytte numeriske teknikker til maksimaliseringen. Eller til minimeringen af den loglikelihoodfunktion, som man af tekniske grunde som regel foretrækker. I lærebogen er der et længere afsnit om Newton-Raphson algoritmen, der i en vis forstand er den simpleste minimeringsteknik. Problemet med denne algoritme er først og fremmest den byrde der lægges på brugeren, der er nødt til selv at komme med de to første afledede af loglikelihoodfunktionen. Ofte 3
4 kan man bruge symbolsk eller automatisk differentation til at producere disse afledede, men det er alligevel besværligt. Derfor foretrækker man i mange tilfælde algoritmer, der i højere grad kan selv. I lærebogen er der en overfladisk beskrivelse af quasi-newton metoder og af simplex metoder. I lavdimensionale problemer virker disse metoder ofte forbløffende effektivt. I R er funktionen optim() et fælles dække for en lang række optimeringsalgoritmer. Den præcise algoritme vælges med argumentet methods. Default metoden er Nelder-Mead algoritmen, der er af simplex typen. Herudover kan det være relevant at forsøget sig med methods = BFGS, der giver en quasi-newton metode, og methods = CG, der giver en konjugeret gradient metode. Alle tre metoder kræver at man angiver en startværdi, og her må man forsøge sig lidt frem. Hvilken af metoderne der er bedst afhænger meget af det konkrete problem og af brugerens evne til at producere en god startværdi. Modelkontrol for polynomialfordelinger Lad (Y 1,..., Y N ) være en tabellering af n = N i=1 Y i objekter, der fordeles i N kasser. Det er naturligt at forestille sig at Y -vektoren er polynomialfordelt med længde n, og nogle gange har man også en ret god ide om den sandsynlighedsvektor π = (π 1,... π N ), der er involveret. For at checke om der er konkordans mellem den observerede Y -vektor og polynomialfordelingen med længde n og sandsynlighedsvektor π, vil man ofte se på Pearson-kombinanten K = N (Y i n π i ) 2 i=1 n π i (1) Denne størrelse måler afstanden mellem de observerede celletal Y i og de forventede celletal n π i, på en sådan måde at en forskel af en vis størrelse tæller mest i de celler, hvor det forventede celletal er lille - en forskel på 10 er mere dramatisk, hvis der kun forventes én observation i cellen, end hvis der forventes
5 En lille værdi af K betyder at Y -vektoren er i konkordans med polynomialmodellen med sandsynlighedsvektor π. En stor værdi af K betyder derimod at Y -vektoren er i diskordans med denne polynomialfordelingsmodel - den kan eventuelt være i fin konkordans med andre polynomialfordelinger, men ikke med den vi forsøger at holde den op imod. Disse fortolkninger er ret klare. Problemet er bare: hvordan skelner man en stor K-værdi fra en lille? Hvor går grænsen? Den bedste ide er at finde ud af hvilke K-værdier man typisk får hvis modellen vitterligt er rigtig. Altså at finde fordelingen af K under modellen. Så kan man afgrænse et konkordansområde, og undersøge om K-værdien for data ligger i dette område. Der findes næppe den model, hvor det er muligt at regne den eksakte fordeling af K ud. Men der er alligevel to strategier, der tillader os at udnytte konkordansideen. Den ene vej er at simulere fordelingen af K frem under modellen: man simulerer under modellen et større antal datasæt af samme størrelse som det virkelige datasæt, regner K-værdien ud for hver af dem, og bruger 95% fraktilen i den empiriske fordeling som skillelinie mllem stor og lille. Den anden vej er at forlade sig på det asymptotiske resultat at K approx χ 2 df=n 1 (2) hvis Y -vektoren virkelig stammer fra den påståede polynomialfordeling. Approksimationen bliver selvfølgelig bedre og bedre for n, men den er ofte ganske god også for relativt små værdier af n. På baggrund af dette approksimative resultat, bruger man 95%-fraktilen i χ 2 -fordelingen med N 1 frihedsgrader som grænse mellem stor eller lille. Om det asymptotiske resultat står til troende, afhænger i høj grad af om modellen forudsiger tyndt besatte celler. Det fremgår af (1) at en celle med en lille værdi af n π i kommer til at vægte meget i K, og derfor bliver det meget vigtigt hvad det observerede celletal er. Den asymptotiske situation opstår først når denne afhængighed af enkeltobservationer forsvinder. Som tommelfingerregel plejer man at sige at de forventede celletal alle bør være mindst 5 - men denne regel er nu overdrevet pessimistisk, den asymptotiske situation er indtrådt længe inden da. 5
6 Konfidensområder Hvis R : Θ X R er en reel kombinant, og hvis vi for hvert θ Θ vælger et z θ R så P θ (R(θ, X) < z θ ) = 0.95 for alle θ Θ, (3) så vil området C(x) = {θ Θ R(θ, x) < z θ } være et såkaldt 95% konfidensområde. Altså en x-afhængig mængde af parametre med den egenskab at P θ (θ C(X)) = 0.95 for alle θ Θ. (4) Formuleret i ord er det et område, man vælger på baggrund af den gjorte observation, med den egenskab at i et stort antal gentagelser af eksperimentet, vil man i 95% af tilfældende fange den sande parameter ind. I praksis ved man naturligvis aldrig om man står med et af de ubehagelige tilfælde hvor den sande parameter er smuttet ud af området, men eftersom det sker så sjældent, kan man med en vis ret gå ud fra at det konkrete C(x) faktisk indeholder den sande parameter. Det er uhyre regnekrævende at finde de z θ er der løser (3). Og det kan i øvrigt også være vældig regnetungt bagefter at vende konstruktionen om for at finde konfidensområdet. Bemærk at konstruktionen simplificeres betragteligt hvis R er en pivot, for i så fald varierer z θ slet ikke med θ, og man kan nøjes med at finde et enkelt z θ. Vi vil benytte denne konstruktion ud fra kombinanten 2 log Q(θ, x) = 2l x (θ) 2l x (ˆθ), hvor ˆθ er maksimaliseringsestimatoren (der jo minimerer l x ). Vi betragter l x (θ) som et udtryk for konkordansen mellem observation x og parameter θ, så hvis 2 log Q(x, θ) er lille, betyder det at θ er i næsten lige så god konkordans med x som den bedste parameter ˆθ. Konfidensområdet på baggrund af 2 log Q samler så at sige de gode parametre, og repræsenterer derfor et udsagn om usikkerheden forbundet med maksimaliseringsestimation. For at denne konstruktion skal være nogen nytte til i praksis, er det vigtigt at der ofte gælder at 2 log Q(θ, X) approx χ 2 df=dim Θ for alle θ Θ. (5) 6
7 Altså: 2 log Q er approksimativt pivot, og den (approksimative) fælles fordeling er oven i købet kendt. Dette er et af de centrale resultater fra den asymptotiske teori for statistiske modeller, og man kan i almindelighed slippe godt fra at lade som om resultatet er eksakt, hvis modellen beskriver et eksperiment med et stort antal uafhængige gentagelser. Helt konkret fører denne ide til de approksimative konfidensområder C(x) = {θ Θ 2 log Q(θ, x) < z} (6) hvor z er 95% fraktilen i χ 2 -fordelingen med dim Θ frihedsgrader. Denne konstruktion opfylder muligvis ikke helt (4), men det vil som regel være tæt på. Data Datamaterialet er gjort tilgængeligt på kursushjemmesiden erhansen/stat1ts 05/ hvor det kan findes under menupunktet Rapportopgaver. Der ligger en fil der indeholder en linie for hver af de 1920 enkeltvurderinger. Kolonnerne svarer til variable: Person Dag Type RotateAngle Horizontal Vertical Target Estimate Forsøgsperson Forsøgsdag Figurtype Drejningsvinkel (cirkeldiagrammer) Højre eller venstre side (barplots, logplots) Øverst eller nederst (dotplots) Den størrelse, der skal gættes Forsøgspersonens gæt Variablen Dag antager tre værdier, og er registreret fordi der var en del larm den ene dag (onsdag), med håndværkere, der arbejdede med maskiner på facaden umiddelbart under forsøgslokalet. Man kunne meget vel forestille sig at larmen førte til at denne dags resultater blev systematisk dårligere end de andre dages. Men det er ikke et tema, der indgår i denne opgave. 7
8 Variablene RotateAngle, Horizontal og Vertical har at gøre med grafiske elementer i figurerne, der ikke er fastlagt af det overordnede design. Disse elementer er randomiserede, og forventes derfor ikke at have nogen indflydelse. For et cirkeldiagram fortæller RotateAngle hvor meget det farvede cirkeludsnit er roteret i forhold til et vilkårligt valgt nulpunkt (hvor udsnittet er afsat fra kl. 3 og videre i negativ omløbsretning. Denne vinkel regnes i grader, afsættes i negativ omløbsretning og er trukket fra en ligefordeling på (0, 360). For et barplot eller et logplot fortæller Horizontal om det er højre eller venstre side af figuren der er farvet. Og for et dotplot fortæller Vertical om det er den øverste eller nederste af linierne, der indeholdt den farvede prik. I denne opgave vil vi udelukkende interessere os for de to sidste variable, Target og Estimate, der begge er heltal i området 0, 1,..., 100. Man må antage at der under disse variable ligger kontinuerte variable, der er blevet diskretiseret. Opgave 1. Indlæs data. Optegn Estimate mod Target (denne jargon betyder at Estimate afsættes på 2.-aksen). Hvad kan du observere på denne figur? Visse værdier af Estimate er meget langt fra den tilsvarende værdi af Target, så langt at de næppe repræsenterer ægte gæt. Vi vælger at forholde os til problemet ved en grov og håndfast totrinsalgoritme: 1.) Hvis Estimate Target > 15 sætter vi Estimate = 100 Estimate 2.) Hvis der stadig gælder at Estimate Target > 15 sletter vi observationen. Opgave 2. Prøv at give en begrundelse for disse to trin. Der ønskes ikke et matematisk ræsonement, men en diskussion af fysiske forhold ved eksperimentet, der kunne berettige dem. I det følgende vil vi fokusere på forskellen med det, der gættes, og det der gættes på, det vil sige Respons = Estimate Target I de første mange delopgaver vil diskussionen handle om observationerne af typen Dotplot. Vi starter derfor med en eksplorativ undersøgelse af disse observationer. 8
9 Opgave 3. Find for observationerne af type Dotplot den empiriske middelværdi og varians af Respons-variablen, og tegn et histogram. Opgave 4. Vurder om dotplot-observationerne er symmetriske om 0 ved at optegne et QQ-plot af den empiriske fordeling mod den spejlede fordeling (altså af x mod -x, hvis x er observationerne). For at kunne vurdere hvordan asymmetri tager sig ud i en sådan tegning, så lav et par stykker med simulerede observationer fra f.eks. en Gammafordeling. Opgave 5. Vurder haletykkelsen i fordelingen af dotplot-observationerne ved at optegne et QQ-plot mod henholdsvis en normalfordeling og t- fordeling med formparameter 5. Diskuter. Model Vores Respons-variabel er kraftigt diskretiseret - den kan kun antage heltalsværdier mellem -15 og 15. Denne diskrete natur havde en kraftig indvirkning på i hvert fald QQ-plottene i opgave 5, og er er ikke noget man uden videre kan se bort fra. Modellering vil derfor naturligt foregå i en polynomialfordelingsramme. Selv om observationerne er blevet diskretiserede, er det naturligt at forestille sig at der bag de afgivne gæt er et uformuleret gæt på en kontinuert skala. Vi opstiller følgende model: Den observerede Resultat-variabel er en afrunding til nærmeste heltal af en uobserveret variabel Z, der er t-fordelt et ukendt antal frihedsgrader og en ukendt skalaparameter. Denne model fører til cellesandsynligheder af formen π i = P ( i 1 2 < Z < i + 1 ) i+ 1 2 = 2 i 1 2 f λ c (x) dx for i = 15,..., 15. Her er f λ c (x) tætheden for en t-fordeling med formparameter λ > 0 og skalaparameter c > 0. Både λ og c antages ukendte. Bemærk at R i sin parametrisering af t-fordelinger insisterer på at man bruger frihedsgrader, ikke formparameter, og at den ikke kender noget til skalaparametre i denne sammenhæng. 9
10 Estimation Opgave 6. Opskriv likelihoodfunktionen L X (λ, c) for dotplot-observationerne og opskriv også l X (λ, c) = log L X (λ, c) Optegn i et relevant område af (λ, c)-planen nogle niveaukurver for den observerede loglikelihoodfunktion. Opgave 7. I denne model kan man ikke eksplicit finde maksimaliseringsestimatoren, og man er derfor tvunget ud i numerisk optimering. Vælg en passende algoritme og minimer ) loglikelihoodfunktionen. Angiv maksimaliseringsestimatoren (ˆλ, ĉ. Angiv også den minimale værdi af loglikelihoodfunktionen. Opgave 8. Optegn et QQ-plot mod den estimerede t-fordeling. Modelkontrol Opgave 9. Udregn Pearson-størrelsen K for dotplot-observationerne i forhold til polynomialfordelingen med cellesandsynligheder svarende til en diskretiseret t-fordeling med de parametre, der blev estimeret i opgave 7. Opgave 10. Simuler 1000 datasæt (eller mere) ud fra modellen, af samme størrelse som det observerede datasæt. I simulationerne bruges som sande parametre de parametre, der blev estimeret i opgave 7. Udregn for hvert af disse datasæt Pearsonstørrelsen i forhold til de sande simulationssandsynligheder. Tegn et histogram af de simulerede Pearsonstørrelser, og tilføj den observerede Pearsonstørrelse fra opgave 9. Tyder denne tegning på observationen er i konkordans eller diskordans med modellen? Som det fremgår af (2) kan man i de fleste sammenhænge lade som Pearsonstørrelser er χ 2 -fordelte. I det aktuelle tilfælde passer denne approksimation desværre ikke særlig godt. Det skyldes at den t-fordeling vi holde data op imod, essentielt samler alle observationerne i området mellem -10 og 10. Ydercellerne bliver derfor tyndt besatte, og det ødelægger den asymptotiske teori. Opgave 11. Optegn et QQ-plot af de simulerede Pearsonstørrelse mod en χ 2 -fordeling med 30 frihedsgrader. Gentag simulationseksperimentet på en 10
11 sådan måde at hvert simuleret datasæt i stedet for 480 observationer indeholder observationer. Tegn igen et QQ-plot af Pearsonstørrelserne for de simulerede datasæt mod en χ 2 -fordeling med 30 frihedsgrader. Det er temmelig usædvanligt med en situation hvor den almene viden der teoretisk kan begrundes i den asymptotiske teori, giver vildledende resultater, men det kan altså ske. Moralen er at man altid kan finde den rigtige fordeling ved simulation, som vi gjorde i opgave 10. Man kan måske godt blive nervøs for om metodikken med Pearsonstørrelser overhovedet er i stand til at fange at observationer ikke stemmer overens med en model. Opgave 12. Tag et par t-fordelinger efter eget valg, og undersøg om dotplot-observationerne kan tænkes at være diskretiserede observationer fra disse fordelinger, ved at bruge fremgangsmåden fra opgave 10. Konfidensområde Opgave 13. Find konfidensområdet (6) for de aktuelle data ved følgende numeriske procedure: for et stort antal punkter i (λ, c)-planen undersøges om betingelsen i (6) er opfyldt. Hvis ja farvelægges det pågældende punkt på en passende markant måde, hvis nej farvelægges det pågældende punkt ikke. Opgave 14. Undersøg ved et simulationseksperiment dækningsgraden af det konfidensområde, der konstrueres i opgave 13. Altså: simuler 1000 datasæt (eller mere) ud fra modellen, af samme størrelse som det observerede datasæt. I simulationerne bruges som sande parametre de parametre, der blev estimeret i opgave 7. Find i hvert af disse datasæt maksimaliseringsestimatoren, udregn kvotientteststørrelsen for den sande parameter, og undersøg om den sande parameter kommer med i konfidensområdet baseret på (6) eller om den ryger udenfor. Konklusion Hidtil har vi kun beskæftiget os med dotplot-observationerne. Som sidste tema vil vi prøve at sammenligne dotplot-observationerne med cirkeldiagram- 11
12 observationerne. I princippet burde vi gennemgå de fleste af de ovenstående opgaver igen med cirkeldiagram-observationerne, for at undersøge om disse observationer kan opfattes som stammende fra en diskretiseret t-fordeling. Du er velkommen til at gøre det, og skrive de interessante overvejelser ned som en sådan undersøgelse giver anledning til. Men her vil vi blot gå ud fra at en underliggende t-fordeling kan klare sagen. Opgave 15. Find maksimaliseringsestimatoren for (λ, c) for gruppen af cirkeldiagram-observationer. Find konfidensområdet som i opgave 13. Optegn konfidensområderne for de to grupper i samme (λ, c)-plan. Opgave 16. Konkluder: Er der forskel på hvor sikkert man kan aflæse de to typer grafiske repræsentationer? 12
Statistik 1TS 2003 Obligatorisk opgave 1
Afdeling for Statistik og Operationsanalyse Institut for Matematiske Fag, Københavns Universitet 4. marts 2003 Stat 1TS / EH Statistik 1TS 2003 Obligatorisk opgave 1 Formelle forhold: Opgaven stilles tirsdag
Læs mereStatistik Obligatorisk opgave
13. maj 2008 Stat 2 / EH Statistik 2 2008 Obligatorisk opgave Formelle forhold: Opgaven stilles tirsdag d. 13. maj 2008. Rapporten skal afleveres til mig personligt. Afleveringsfristen er mandag d. 2.
Læs mereOmrådeestimator. X x. P θ. ν θ. Θ C(x) En områdeestimator er en afbildning C : X P(Θ). . p.1/30
Områdeestimator X (Ω, F) (X, E) x 01 01 P θ ν θ θ Θ 0000 1111 000000 111111 0000 1111 0000 1111 C(x) En områdeestimator er en afbildning C : X P(Θ).. p.1/30 Konfidensområde En områdestimator C : X P(Θ)
Læs mereNATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.
NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. Eksamen i Statistik 1TS Teoretisk statistik Den skriftlige prøve Sommer 2002 3 timer - alle hjælpemidler tilladt Det er tilladt at skrive
Læs mereOverheads til forelæsninger, mandag 5. uge På E har vi en mængde af mulige sandsynlighedsfordelinger for X, (P θ ) θ Θ.
Statistiske modeller (Definitioner) Statistik og Sandsynlighedsregning 2 IH kapitel 0 og En observation er en vektor af tal x (x,..., x n ) E, der repræsenterer udfaldet af et (eller flere) eksperimenter.
Læs mereNATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.
NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. Eksamen i Statistik 1TS Teoretisk statistik Den skriftlige prøve Sommer 2003 3 timer - alle hjælpemidler tilladt Det er tilladt at skrive
Læs mereNATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.
NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. Eksamen i Statistik 1TS Teoretisk statistik Den skriftlige prøve Sommer 2005 3 timer - alle hjælpemidler tilladt Det er tilladt at skrive
Læs mere3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve
Læs mereModelkontrol i Faktor Modeller
Modelkontrol i Faktor Modeller Julie Lyng Forman Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for Biokemikere 2003 For at konklusionerne på en ensidet, flersidet eller hierarkisk
Læs mereKursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte
Læs mereProdukt og marked - matematiske og statistiske metoder
Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring
Læs mereKursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte
Læs mereTema. Dagens tema: Indfør centrale statistiske begreber.
Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i
Læs mereDen lineære normale model
Den lineære normale model Ingredienser: V : N-dimensionalt vektorrum. X : Ω V : stokastisk variabel. L : ægte underrum af V, dimension k., : fundamentalt indre produkt på V. Vi laver en hel familie af
Læs mereOmrådeestimation. Kapitel 7
Kapitel 7 Områdeestimation Lad (ν θ ) θ Θ være en parametriseret statistisk model på (X, E). I kapitel 4 definerede vi såkaldte punktestimatorer af parameteren θ. Disse estimatorer fungerer sådan at vi
Læs mereEstimation. Lad (ν θ ) θ Θ være en statistisk model på (X, E). En estimator af θ er en afbildning t : X Θ. En konkret værdi t(x) kaldes et estimat.
Estimation Lad (ν θ ) θ Θ være en statistisk model på (X, E). En estimator af θ er en afbildning t : X Θ. En konkret værdi t(x) kaldes et estimat. En estimator er en gætteregel.. p.1/22 Estimation X acements
Læs mereKombinant. En kombinant er en afbildning. hvor (Y, K) er endnu et målbart rum. Typisk taler vi om reelle kombinanter, hvor Y = R.
Kombinant Lad (ν θ ) θ Θ være en statistisk model på (X, E). En kombinant er en afbildning hvor (Y, K) er endnu et målbart rum. R : X Θ Y Typisk taler vi om reelle kombinanter, hvor Y = R. Som regel forsøger
Læs mereSusanne Ditlevsen Institut for Matematiske Fag susanne
Statistik og Sandsynlighedsregning 1 STAT kapitel 4.4 Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne 7. undervisningsuge, mandag 1 Estimation og konfidensintervaller
Læs mereI dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd
I dag Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik SaSt) Helle Sørensen Først lidt om de sidste uger af SaSt. Derefter statistisk analyse af en enkelt
Læs merePraktiske ting og sager: Forelæsninger tirsdag og torsdag kl i Kirkesalen, Studiestræde 38 Øvelser
Uge 36 Velkommen tilbage Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl. -2 i Kirkesalen, Studiestræde 38 Øvelser Hold -4 og 6: mandag og onsdag kl. 8-; start 3. september Hold 5: tirsdag
Læs mereCenter for Statistik. Multipel regression med laggede responser som forklarende variable
Center for Statistik Handelshøjskolen i København MPAS Tue Tjur November 2006 Multipel regression med laggede responser som forklarende variable Ved en tidsrække forstås i almindelighed et datasæt, der
Læs mereEstimation og konfidensintervaller
Statistik og Sandsynlighedsregning STAT kapitel 4.4 Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne Estimation og konfidensintervaller Antag X Bin(n,
Læs mereI dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)
I dag Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt) Helle Sørensen Repetition vha eksempel om dagligvarepriser Analyse med R: ttest
Læs mereBilledbehandling og mønstergenkendelse: Lidt elementær statistik (version 1)
; C ED 6 > Billedbehandling og mønstergenkendelse Lidt elementær statistik (version 1) Klaus Hansen 24 september 2003 1 Elementære empiriske mål Hvis vi har observationer kan vi udregne gennemsnit og varians
Læs mereTeoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.
Teoretisk Statistik, 9 marts 2005 Empiriske analoger (Kap. 3.7) Normalfordelingen (Kap. 3.12) Opsamling på Kap. 3 nb. Det forventes ikke, at alt materialet dækkes d. 9. marts. 1 Empiriske analoger Betragt
Læs mereDen lineære normale model
Den lineære normale model Ingredienser: V : N-dimensionalt vektorrum. X : Ω V : stokastisk variabel. L : ægte underrum af V, dimension k., : fundamentalt indre produkt på V. Vi laver en hel familie af
Læs mereInstitut for Matematiske Fag Sandsynlighedsregning og Statistik 2. R opgaver
Institut for Matematiske Fag Sandsynlighedsregning og Statistik 2 Københavns Universitet Susanne Ditlevsen og Helle Sørensen R opgaver Det er en god ide at vænne sig til at skrive kommandoerne i en editor
Læs mereProgram. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18
Program 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Fordeling af X Stikprøve X 1,X 2,...,X n stokastisk X stokastisk. Ex (normalfordelt stikprøve)
Læs mereStatistisk model. Definition: En statistisk model består af et repræsentationsrum (X, E) og en familie P af sandsynlighedsmål
Statistisk model Definition: En statistisk model består af et repræsentationsrum (X, E) og en familie P af sandsynlighedsmål på (X, E). Modellen er parametriseret hvis der findes en parametermængde Θ og
Læs mereNote om Monte Carlo metoden
Note om Monte Carlo metoden Kasper K. Berthelsen Version 1.2 25. marts 2014 1 Introduktion Betegnelsen Monte Carlo dækker over en lang række metoder. Fælles for disse metoder er, at de anvendes til at
Læs mereOpsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller
Opsamling Modeltyper: Tabelanalyse Logistisk regression Binær respons og kategorisk eller kontinuerte forklarende variable. Generaliserede lineære modeller Normalfordelt respons og kategoriske forklarende
Læs mereUniversity of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version
university of copenhagen University of Copenhagen Notat om statistisk inferens Larsen, Martin Vinæs Publication date: 2014 Document Version Peer-review version Citation for published version (APA): Larsen,
Læs mereLøsning til eksamen d.27 Maj 2010
DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1
Læs mereTrykfejlsliste - alle fejl Introduktion til Matematisk Statistik 2. udgave
3. februar 2012 Stat 1TS / EH Trykfejlsliste - alle fejl Introduktion til Matematisk Statistik 2. udgave Denne liste indeholder alle de regulære fejl, slåfejl og stavefejl der er fundet i 2. udgave af
Læs mereGennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP()
Gennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP() John Andersen, Læreruddannelsen i Aarhus, VIA Et kast med 10 terninger gav følgende udfald Fig. 1 Result of rolling 10 dices
Læs mereUge 43 I Teoretisk Statistik, 21. oktober Forudsigelser
Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier
Læs mereAfstande, skæringer og vinkler i rummet
Afstande, skæringer og vinkler i rummet Frank Nasser 9. april 20 c 2008-20. Dette dokument må kun anvendes til undervisning i klasser som abonnerer på MatBog.dk. Se yderligere betingelser for brug her.
Læs mereStatistik og Sandsynlighedsregning 1. IH kapitel 6
Statistik og Sandsynlighedsregning 1 IH kapitel 6 Overheads til forelæsninger. Uge 41/2005 1 Test i Polynomialfordelingen Forsøg: n uafhængige gentagelse af forsøg med m udfald. Vi observerer x = x 1,...,
Læs merePreben Blæsild og Jens Ledet Jensen
χ 2 Test Preben Blæsild og Jens Ledet Jensen Institut for Matematisk Fag Aarhus Universitet Egå Gymnasium, December 2010 Program 8.15-10.00 Forelæsning 10.15-12.00 Statlab: I arbejder, vi cirkler rundt
Læs mereAfstande, skæringer og vinkler i rummet
Afstande, skæringer og vinkler i rummet Frank Villa 2. maj 202 c 2008-20. Dette dokument må kun anvendes til undervisning i klasser som abonnerer på MatBog.dk. Se yderligere betingelser for brug her. Indhold
Læs mereMotivation. Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser
Motivation Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser Rasmus Waagepetersen October 26, 2018 Eksempel: En landmåler får til opgave at måle længden λ fra A til B. Entreprenøren
Læs mereStatistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Introduktion Kursusholder: Kasper K. Berthelsen Opbygning: Kurset består af 5 blokke En blok består af: To normale
Læs mereKonfidensintervaller og Hypotesetest
Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller
Læs mereStatistik for ankomstprocesser
Statistik for ankomstprocesser Anders Gorst-Rasmussen 20. september 2006 Resumé Denne note er en kortfattet gennemgang af grundlæggende statistiske værktøjer, man kunne tænke sig brugt til at vurdere rimeligheden
Læs mereUge 10 Teoretisk Statistik 1. marts 2004
1 Uge 10 Teoretisk Statistik 1. marts 004 1. u-fordelingen. Normalfordelingen 3. Middelværdi og varians 4. Mere normalfordelingsteori 5. Grafisk kontrol af normalfordelingsantagelse 6. Eksempler 7. Oversigt
Læs mereBinomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/
Program: 1. Repetition af vigtige sandsynlighedsfordelinger: binomial, (Poisson,) normal (og χ 2 ). 2. Populationer og stikprøver 3. Opsummering af data vha. deskriptive størrelser og grafer. 1/29 Binomial
Læs mereNATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.
NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. Eksamen i Statistik 1 Tag-hjem prøve 1. juli 2010 24 timer Alle hjælpemidler er tilladt. Det er tilladt at skrive med blyant og benytte viskelæder,
Læs mere1 Hb SS Hb Sβ Hb SC = , (s = )
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.
Læs mereNote om Monte Carlo eksperimenter
Note om Monte Carlo eksperimenter Mette Ejrnæs og Hans Christian Kongsted Økonomisk Institut, Københavns Universitet 9. september 003 Denne note er skrevet til kurset Økonometri på. årsprøve af polit-studiet.
Læs mereStatistik II 4. Lektion. Logistisk regression
Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:
Læs mereNote til styrkefunktionen
Teoretisk Statistik. årsprøve Note til styrkefunktionen Først er det vigtigt at gøre sig klart, at når man laver statistiske test, så kan man begå to forskellige typer af fejl: Type fejl: At forkaste H
Læs mereOpgaver til kapitel 3
Opgaver til kapitel 3 3.1 En løber er interesseret i at undersøge om hendes løbeur er kalibreret korrekt. Hun udmåler derfor en strækning på præcis 1000 m og løber den 16 gange. For hver løbetur noterer
Læs mereTema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.
Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller
Læs mereKvadratisk regression
Kvadratisk regression Helle Sørensen Institut for Matematiske Fag Københavns Universitet Juli 2011 I kapitlet om lineær regression blev det vist hvordan man kan modellere en lineær sammenhæng mellem to
Læs mereStatistiske modeller
Statistiske modeller Statistisk model Datamatrice Variabelmatrice Hændelse Sandsynligheder Data Statistiske modeller indeholder: Variable Hændelser defineret ved mulige variabel værdier Sandsynligheder
Læs mereBinomialfordelingen. X ~ bin(n,p): X = antal "succeser" i n uafhængige forsøg, der alle har samme sandsynlighed p for at ende med succes.
Uge 9 Teoretisk Statistik 23. februar 24 1. Binomialfordelingen 2. Den hypergeometriske fordeling 3. Poissonfordelingen 4. Den negative binomialfordeling 5. Gammafordelingen Binomialfordelingen X ~ bin(n,p):
Læs mereStatistik for Biokemikere Projekt
Statistik for Biokemikere Projekt Institut for Matematiske Fag Inge Henningsen og Helle Sørensen Københavns Universitet November 2008 Formalia Dette projekt udgør en del af evalueringen i kurset Statistik
Læs mereHypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0
Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt
Læs mereStatistik i GeoGebra
Statistik i GeoGebra Peter Harremoës 13. maj 2015 Jeg vil her beskrive hvordan man kan lave forskellige statistiske analyser ved hjælp af GeoGebra 4.2.60.0. De statistiske analyser svarer til pensum Matematik
Læs mereReeksamen 2014/2015 Mål- og integralteori
Reeksamen 4/5 Mål- og integralteori Københavns Universitet Institut for Matematiske Fag Formalia Eksamensopgaven består af 4 opgaver med ialt spørgsmål. Ved bedømmelsen indgår de spørgsmål med samme vægt.
Læs mereVejledende besvarelse af eksamen i Statistik for biokemikere, blok
Opgave 1 Vejledende besvarelse af eksamen i Statistik for biokemikere, blok 2 2006 Inge Henningsen og Niels Richard Hansen Analysevariablen i denne opgave er variablen forskel, der for hver af 10 kvinder
Læs mereTaldata 1. Chancer gennem eksperimenter
Taldata 1. Chancer gennem eksperimenter Indhold 1. Kast med to terninger 2. Et pindediagram 3. Sumtabel 4. Median og kvartiler 5. Et trappediagram 6. Gennemsnit 7. En statistik 8. Anvendelse af edb 9.
Læs mereStatistik. Peter Sørensen: Statistik og sandsynlighed Side 1
Statistik Formålet... 1 Mindsteværdi... 1 Størsteværdi... 1 Ikke grupperede observationer... 2 Median og kvartiler defineres ved ikke grupperede observationer således:... 2 Middeltal defineres ved ikke
Læs mereAgenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede
Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede fordelinger (kap. 4) Middelværdi og varians (kap. 3-4) Fordelingsresultater
Læs mereLøsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)
Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up
Læs merePointen med Funktioner
Pointen med Funktioner Frank Nasser 0. april 0 c 0080. Dette dokument må kun anvendes til undervisning i klasser som abonnerer på MatBog.dk. Se yderligere betingelser for brug her. Bemærk: Dette er en
Læs mereVejledende besvarelser til opgaver i kapitel 14
Vejledende besvarelser til opgaver i kapitel 14 Opgave 1 a) Det første trin i opstillingen af en hypotesetest er at formulere to hypoteser, hvoraf den ene støtter den teori vi vil teste, mens den anden
Læs mereBasal statistik for lægevidenskabelige forskere, forår 2012 Udleveret 6.marts, afleveres senest ved øvelserne i uge 15 (
Hjemmeopgave Basal statistik for lægevidenskabelige forskere, forår 2012 Udleveret 6.marts, afleveres senest ved øvelserne i uge 15 (10.-12. april) I et randomiseret forsøg sammenlignes vitamin D behandling
Læs mereNanostatistik: Konfidensinterval
Nanostatistik: Konfidensinterval JLJ Nanostatistik: Konfidensinterval p. 1/37 Fraktilpåmindelse u p : Φ(u p ) = p, Φ( z ) = 1 Φ( z ) t p [f] : F t[f] (t p [f]) = p, F t[f] ( t ) = 1 F t[f] ( t ) F-fordeling:
Læs mereFornyelsesteori med anvendelser: Punktprøve
Fornyelsesteori med anvendelser: Punktprøve May 9, 2003 For at få kredit for kurset Fornyelsesteori med anvendelser kræves at afleveringsopgave 1 og 2 samt nedenstående punktprøve besvares tilfredsstillende.
Læs mereLidt om fordelinger, afledt af normalfordelingen
IMM, 2002-10-10 Poul Thyregod Lidt om fordelinger, afledt af normalfordelingen 1 Introduktion I forbindelse med inferens i normalfordelinger optræder forskellige fordelinger, der er afledt af normalfordelingen,
Læs mereπ er irrationel Frank Nasser 10. december 2011
π er irrationel Frank Nasser 10. december 2011 2008-2011. Dette dokument må kun anvendes til undervisning i klasser som abonnerer på MatBog.dk. Se yderligere betingelser for brug her. Indhold 1 Introduktion
Læs mere2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900.
2 -fordeling og 2 -test Generelt om 2 -fordelingen 2 -fordelingen er en kontinuert fordeling, modsat binomialfordelingen som er en diskret fordeling. Fordelingen er særdeles kompleks at beskrive med matematiske
Læs mereProgram: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.
Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. 1/23 Opsummering af fordelinger X 1. Kendt σ: Z = X µ σ/ n N(0,1)
Læs mereStatistiske Modeller 1: Kontingenstabeller i SAS
Statistiske Modeller 1: Kontingenstabeller i SAS Jens Ledet Jensen October 31, 2005 1 Indledning Som vist i Notat 1 afsnit 13 er 2 log Q for et test i en multinomialmodel ækvivalent med et test i en poissonmodel.
Læs mereKvantitative Metoder 1 - Efterår Dagens program
Dagens program Estimation: Kapitel 9.7-9.10 Estimationsmetoder kap 9.10 Momentestimation Maximum likelihood estimation Test Hypoteser kap. 10.1 Testprocedure kap 10.2 Teststørrelsen Testsandsynlighed 1
Læs mereStatistik II 1. Lektion. Analyse af kontingenstabeller
Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression
Læs mereDel I. Statistiske grundbegreber
Del I Statistiske grundbegreber 1 2 Kapitel 1 Konkordans Vores behandling af teoretisk statistik vil tage udgangspunkt i følgende centrale problem: Et eksperiment beskrives ved et repræsentationsrum (X,
Læs mereOpgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved
Matematisk Modellering 1 (reeksamen) Side 1 Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved { 1 hvis x {1, 2, 3}, p X (x) = 3 0 ellers,
Læs mereProgram: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19
Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større
Læs mereEstimation og usikkerhed
Estimation og usikkerhed = estimat af en eller anden ukendt størrelse, τ. ypiske ukendte størrelser Sandsynligheder eoretisk middelværdi eoretisk varians Parametre i statistiske modeller 1 Krav til gode
Læs mereBesvarelser til Calculus Ordinær Eksamen - 5. Januar 2018
Besvarelser til Calculus Ordinær Eksamen - 5. Januar 18 Mikkel Findinge Bemærk, at der kan være sneget sig fejl ind. Kontakt mig endelig, hvis du skulle falde over en sådan. Dette dokument har udelukkende
Læs mereNormalfordelingen og Stikprøvefordelinger
Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger
Læs mereTrykfejlsliste - alle fejl Introduktion til matematisk statistik
29. juni 2004 Stat 1TS / EH Trykfejlsliste - alle fejl Introduktion til matematisk statistik Denne liste indeholder alle de regulære fejl, slåfejl og stavefejl der er fundet i noterne indtil nu. 4 5 Forkert:
Læs mereKvantitative Metoder 1 - Forår 2007
Dagens program Kapitel 8.7, 8.8 og 8.10 Momenter af gennemsnit og andele kap. 8.7 Eksempel med simulationer Den centrale grænseværdisætning (Central Limit Theorem) kap. 8.8 Simulationer Normalfordelte
Læs mereVærktøjshjælp for TI-Nspire CAS Struktur for appendiks:
Værktøjshjælp for TI-Nspire CAS Struktur for appendiks: Til hvert af de gennemgåede værktøjer findes der 5 afsnit. De enkelte afsnit kan læses uafhængigt af hinanden. Der forudsættes et elementært kendskab
Læs mereStatistiske principper
Statistiske principper 1) Likelihood princippet - Maximum likelihood estimater - Likelihood ratio tests - Deviance 2) Modelbegrebet - Modelkontrol 3) Sufficient datareduktion 4) Likelihood inferens i praksis
Læs mereSupplement til kapitel 7: Approksimationen til normalfordelingen, s. 136
Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 36 Det er besværligt at regne med binomialfordelingen, og man vælger derfor ofte at bruge en approksimation med normalfordeling. Man
Læs mereSammenhængsanalyser. Et eksempel: Sammenhæng mellem rygevaner som 45-årig og selvvurderet helbred som 51 blandt mænd fra Københavns amt.
Sammenhængsanalyser Et eksempel: Sammenhæng mellem rygevaner som 45-årig og selvvurderet helbred som 51 blandt mænd fra Københavns amt. rygevaner som 45 årig * helbred som 51 årig Crosstabulation rygevaner
Læs mereBilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen
Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Microsoft Excel har en del standard anvendelsesmuligheder i forhold til den beskrivende statistik og statistisk
Læs mereKapitel 4 Sandsynlighed og statistiske modeller
Kapitel 4 Sandsynlighed og statistiske modeller Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 Indledning 2 Sandsynlighed i binomialfordelingen 3 Normalfordelingen 4 Modelkontrol
Læs mereProjekt 1 Spørgeskemaanalyse af Bedst på Nettet
Projekt 1 Spørgeskemaanalyse af Bedst på Nettet D.29/2 2012 Udarbejdet af: Katrine Ahle Warming Nielsen Jannie Jeppesen Schmøde Sara Lorenzen A) Kritik af spørgeskema Set ud fra en kritisk vinkel af spørgeskemaet
Læs mereStokastiske processer og køteori
Stokastiske processer og køteori 3. kursusgang Anders Gorst-Rasmussen Institut for Matematiske Fag Aalborg Universitet 1 SIDSTE GANG Ankomstproces T 1, T 2,... (ankomsttid per kunde) til køsystem. Modellér
Læs mereEt eksempel på en todimensional normalfordeling Anders Milhøj September 2006
Et eksempel på en todimensional normalfordeling Anders Milhøj September 006 I dette notat gennemgås et eksempel, der illustrerer den todimensionale normalfordelings egenskaber. Notatet lægger sig op af
Læs mereTilfældige rektangler: Et matematikeksperiment Variable og sammenhænge
Tilfældige rektangler: Et matematikeksperiment Variable og sammenhænge Baggrund: I de senere år har en del gymnasieskoler eksperimenteret med HOT-programmet i matematik og fysik, hvor HOT står for Higher
Læs mereKvantitative Metoder 1 - Efterår Dagens program
Dagens program Afsnit 6.1. Ligefordelinger, fra sidst Den standardiserede normalfordeling Normalfordelingen Beskrivelse af normalfordelinger: - Tæthed og fordelingsfunktion - Middelværdi, varians og fraktiler
Læs mereKvantitative Metoder 1 - Forår Dagens program
Dagens program Kapitel 8.1-8.3 Tilfældig stikprøve (Random Sampling) Likelihood Eksempler på likelihood funktioner Sufficiente statistikker Eksempler på sufficiente statistikker 1 Tilfældig stikprøve Kvantitative
Læs mereNoter til Computerstøttet Beregning Taylors formel
Noter til Computerstøttet Beregning Taylors formel Arne Jensen c 23 1 Introduktion I disse noter formulerer og beviser vi Taylors formel. Den spiller en vigtig rolle ved teoretiske overvejelser, og også
Læs mereSandsynlighedsfordelinger for kontinuerte data på interval/ratioskala
3 5% 5% 5% 0 3 4 5 6 7 8 9 0 Statistik for biologer 005-6, modul 5: Normalfordelingen opstår når mange forskellige faktorer uafhængigt af hinanden bidrager med additiv variation til. F.eks. Højde af rekrutter
Læs mere