Kvantitative Metoder 1 - Forår Dagens program
|
|
|
- Victor Peter Jakobsen
- 9 år siden
- Visninger:
Transkript
1 Dagens program Kapitel Tilfældig stikprøve (Random Sampling) Likelihood Eksempler på likelihood funktioner Sufficiente statistikker Eksempler på sufficiente statistikker 1
2 Tilfældig stikprøve Kvantitative Metoder 1 - Forår 2007 Meget statistik handler om, at man er interesseret i at få infomation om et karakteristika ved en population. Dette karakteristika kaldes for en parameter. Man kunne f.eks. ønske at kende middelværdien af timelønnen. For at kunne komme med et gæt på en populationsparameter anvender man en stikprøve. Centrale statistiske begreber En population er en statistisk betegnelse for en samling individer, genstande eller andre objekter. En stikprøve er en samling af værdier fra en population. Stikprøven er resultatet af en udvælgelsesprocedure. En population, en stikprøve og en udvælgelsesprocedure kaldes et eksperiment. 2
3 En repræsentativ stikprøve En repræsentativ stikprøve har de samme karakteristika som populationen. Hvorfor er det vigtigt, at stikprøven er repræsentativ? Desværre er der ikke nogen udvælgelsesmetode, som kan garantere en repræsentativ stikprøve. Men der er nogle metoder, som er bedre end andre. En tilfældig udvælgelse En stikprøve, som er lavet på baggrund af tilfældig udvælgelse, er ofte tæt på at være repræsentativ. Jo større stikprøven er (jo flere individer den indeholder) jo lettere er det at få stikprøven til at være næsten repræsentativ. Definition: Tilfældig udvælgelse fra en endelig population: Individer er tilfældigt udvalgt, således at ét individ af gangen udvælges blandt de mulige, enten med eller uden tilbagelægning. 3
4 Eksempel: Lotteri Tilfældig udvælgelse kan laves som et lotteri. Alle individer i populationen er repræsenteret ved et lod (f.eks. ved at CPR-nr. står på loddet). Så trækkes et lod af gangen. Med tilbagelægning noteres nummer på loddet, og loddet lægges tilbage, før næste lod trækkes.alle lodder er således mulige ved hver trækning. Uden tilbagelægning noteres nummeret, men loddet lægges ikke tilbage. Der bliver således færre og færre lodder tilbage. Egenskaber ved tilfældig udvælgelse: Alle mulige stikprøver er lige sandsynlige Alle individer i populationen har samme chance for at komme med i stikprøven 4
5 Antag, at vi er interesseret i X (f.eks. timelønnen i befolkningen). Værdier af X for tilfældigt udvalgte individer fra befolkningen kan opfattes som en stokastisk variabel. Fordelingen for X kaldes populationens fordeling, beskrevet ved tætheden f X.En stikprøve på n individer kan skrives som (X 1,X 2,X 3,.., X n ). Eksempel (8.1b i bogen) Antag at populationen består af 20 genstande (18 gode og 2 defekte). Lad den stokastiske variabel X være givet ved ½ 1 hvis genstanden er defekt X = 0 hvis genstanden er ok Der gælder, at fordelingen af X er populationsfordelingen f(1) = 2/20 = 0,1, f(0) = 18/20 = 0,9. Antag at vi udtager en stikprøve på 3 individer (n =3). Mulige udfald: (000), (001), (010), (100), (011), (101), (110), (111). 5
6 Med tilbagelægning: P med (001) = =0, 081 Observationerne (X 1,X 2,X 3 ) er uafhængige og identisk fordelte (med fordeling som er populationsfordelingen). Uden tilbagelægning: P uden (001) = =0, 089 Observationerne (X 1,X 2,X 3 ) er ikke uafhængige, men er identisk fordelte (med fordeling som er populationsfordelingen). 6
7 Udvælgelse af stikprøver i praksis. I praksis er det ikke altid, at man laver en tilfældig udvælgelse. Eksempler på forskellige metoder til at indsamle data: Spørgeskemaer sendt til bopælsadressen Telefoninterview Spørgeskemaer som udfyldes via Internet (evt. med præmier for deltagelse) Registeroplysninger via CPR-nr. Ofte laver man strata (disjunkte grupper baseret på karakteristika ved individerne f.eks. alder, køn, bopæl), og så laver man tilfældig udvælgelse indenfor hver strata. Nogen gange laver man også cluster, hvor man udvælger husholdninger og så inkluderer alle individer i husholdningen i stikprøven. I praksis er det også sjældent, tilfældig udvælgelse er med tilbagelægning - det er oftest uden tilbagelægning. 7
8 Tilfældig stikprøve Definition: En tilfældig stikprøve af størrelse n er en sekvens af uafhængige observationer X = (X 1,X 2,..., X n ), hvor hver observation er trukket fra populationsfordelingen. Det følger specielt af definitionen, at observationerne er uafhængige og identisk fordelte. Den simultane fordeling af n observationer i stikprøven er givet ved ny f(x 1,x 2,x 3,..., x n )=f X (x 1 ) f X (x 2 )... f X (x n )= f X (x i ) En stikprøve baseret på en tilfældig udvælgelse uden tilbagelægning vil ikke være en tilfældig stikprøve. Hvorfor? Alligevel vil man ofte antage, at stikprøven er en stilfældig stikprøve. Dette kan opfattes som en approksimation, som er god, hvis stikprøven er lille i forhold til populationen. I det meste af dette kursus vil vi antage, at vi arbejder med en tilfældig stikprøve. i=1 8
9 Likelihood funktion Kvantitative Metoder 1 - Forår 2007 Vi definerer en model (en populationsfordeling) ved at angive fordelingen f(x θ) og herved angive parameteren θ. Hver værdi af θ angiver en ny model. "Likelihood"er et begreb, som anvendes i statistik. Likelihood analyse benyttes til at give et "gæt"på parameteren θ i en bestemt fordeling for en given stikprøve. Definition: For en given stikprøve x =(x 1,x 2,..., x n ) fra en population med en populationsfordeling f(x θ) er likelihood funktionen givet ved Egenskaber ved likelihood funktionen: L(θ) f(x 1,x 2,..., x n θ) Likelihood funktionen er en funktion af θ. Likelihood funktionen er proportional med den simultane tæthedsfunktion for stikprøven. Værdien af likelihood funktionen i θ 0 angiver, hvor "rimelig"det er, at parameteren i populationsfordelingen er θ 0 for den givne stikprøve. 9
10 Eksempel på likelihood funktion (8.2b i bogen) Antag at vi har en tilfældig stikprøve bestående af 10 individer (X 1,X 2,X 3,...X 10 ), dvs. at individerne er indbyrdes uafhængige og identisk fordelte. Vi antager, at populationsfordelingen er en Bernoulli fordeling med parameteren p f X (x p) =p x (1 p) 1 x, x =0, 1 Hvis den givne stikprøve indeholder 6 successer og 4 fiaskoer, f.eks. (x 1,x 2,x 3,...x 10 )= (1, 1, 1, 1, 1, 1, 0, 0, 0, 0), kan likelihood funktionen for netop denne stikprøve opskrives L(p) =f(x 1,x 2,..., x 10 p) = 10Y i=1 Likelihood funktionen er en funktion af p. f X (x i p) =p 6 (1 p) 4, 0 p 1 10
11 Likelihood funktionen opnår de største værdier for p =0, 6, dvs. det er mest sandsynligt at have fået 6 successer og 4 fiaskoer, hvis fordelingen, som stikprøven stammer fra, har en parameter på 0,6. Det gælder også at L(0, 5)/L(0, 4) = 0, /0, = 1, 84 Det betyder for denne stikprøve, at det er 1,84 gange så "sandsynligt"at p =0.5 i forhold til at p =0, 4 11
12 Likelihood funktionen 0,0014 0,0012 0,001 L(p) 0,0008 0,0006 0,0004 0, ,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 p 12 Figur 1:
13 Antag at vi kun havde information om, at stikprøven indeholdte 6 succeser og 4 fiaskoer (og altså ikke kendte rækkefølgen): Y =6 hvor Y = X 1 + X X 10 Bin(10,p) I dette tilfælde vides at f Y (6 p) = µ 10 6 p 6 (1 p) 4, 0 p 1 Likelihood µ funktionen baseret på f Y (6 p) er den samme som før (idet der kun er konstanten til forskel, og likelihood funktionen skal "kun"være proportional med 10 6 tætheden). Likelihood princippet: Hvis forskellige eksperimenter baseret på modeller, som afhænger af θ, giver den samme likelihood funktion, så skal man nå til den samme inferens og de samme konklusioner. 13
14 Sufficiens "Sufficiens"betyder tilstrækkelig. Begrebet sufficiens dækker over, hvad der er tilstrækkeligt at vide (om stikprøven), når man vil lave inferens (f.eks. estimation af parameter). Vi har tidligere set, at likelihood funktionen indeholder alt relevant information fra stikprøven, der er nødvendig fra stikprøven. Det betyder, vi ikke behøver information om de enkelte variabler. Definition: En stikprøvefunktion (eller statistik) T = t(x) for en familie af fordelinger f(x θ) er sufficient,hvis og kun hvis likelihood funktionen kun afhænger af X gennem t(x) = t(x 1,X 2,..., X n ) L(θ) =g(t(x),θ). Sufficiens kan også defineres således: T = t(x) er sufficient hvis og kun hvis f(x θ) =g(t(x),θ)h(x). 14
15 15
16 Eksempel (fortsat): For en tilfældig stikprøve (X 1,X 2,..., X 10 ) for en populationsfordeling Ber(p) kan likelihood funktionen skrives som: L(p) = f(x 1,X 2,..., X 10 p) = 10Y i=1 = p P 10 i=1 X i (1 p) 10 P 10 i=1 X i = g( = g(t(x 1,X 2,..., X 10 ),p) f X (X i p) = 10X i=1 X i,p) 10Y i=1 p X i (1 p) 1 X i Heraf sluttes, at P 10 i=1 X er en sufficient stikprøvefunktion. Det betyder, at alt relevant information om parameteren i modellen er indeholdt i P 10 X i=1 16
17 Antag at X stammer fra en tilfældig stikprøve fra en diskret populationsfordeling med parameteren θ. T = t(x) er sufficient for θ. For en given stikprøve X = x gælder der t(x) =t 0. Likelihood funktionen er L(θ) =g(t(x),θ)=g(t 0,θ). Hvis man observerer T = t 0 istedetforx, kanvinuslutteat P (T = t 0 )= X f(x θ) = X g(t(x),θ)h(x) T =t 0 T =t 0 = g(t 0,θ) X h(x) T =t 0 L (θ) 17
18 Opsummering Stikprøve: Population, stikprøve, udvælgelsesprocedure -> eksperiment Tilfældig udvælgelse Tilfældig stikprøve Likelihood funktionen Sufficient stikprøvefunktion 18
19 Næste gang Onsdag d. 11/4 : Fordelingen af statistikker kap. 8.4 Simulationer kap. 8.5 Ordens statistikker kap. 8.6 GOD PÅSKEFEIRE 19
Kvantitative Metoder 1 - Forår 2007
Dagens program Kapitel 8.7, 8.8 og 8.10 Momenter af gennemsnit og andele kap. 8.7 Eksempel med simulationer Den centrale grænseværdisætning (Central Limit Theorem) kap. 8.8 Simulationer Normalfordelte
Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader
Stikprøver og stikprøve fordelinger Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Statistik Statistisk Inferens: Prediktere og forekaste værdier af
Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable
Kursus 02402 Introduktion til Statistik Forelæsning 2: Kapitel 4, Diskrete fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)
Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske
Kvantitative Metoder 1 - Forår 2007
Dagens program Kapitel 4: Diskrete fordelinger Hypergeometrisk fordeling, Afsnit 4.3 Multinomial fordeling, Afsnit 4.8 Geometrisk fordeling og Negativ binomialfordeling (Inverse Sampling), Afsnit 4.4 Approksimation
Normalfordelingen og Stikprøvefordelinger
Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger
Kvantitative Metoder 1 - Efterår Dagens program
Dagens program Estimation: Kapitel 9.7-9.10 Estimationsmetoder kap 9.10 Momentestimation Maximum likelihood estimation Test Hypoteser kap. 10.1 Testprocedure kap 10.2 Teststørrelsen Testsandsynlighed 1
Kvantitative Metoder 1 - Efterår Dagens program
Dagens program Approksimation af binomialsandsynligheder, Afsnit 4.5 Multinomial fordeling, Afsnit 4.8 Negativ binomialfordeling, Afsnit 4.4 Poisson fordeling og Poisson process, Afsnit 4.6 Kontinuerte
Kvantitative Metoder 1 - Forår 2007. Dagens program
Dagens program Hypoteser: kap: 10.1-10.2 Eksempler på Maximum likelihood analyser kap 9.10 Test Hypoteser kap. 10.1 Testprocedure kap 10.2 Teststørrelsen Testsandsynlighed 1 Estimationsmetoder Kvantitative
Oversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger
Introduktion til Statistik Forelæsning 2: og diskrete fordelinger Oversigt 1 2 3 Fordelingsfunktion 4 Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 017 Danmarks Tekniske Universitet 2800
Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18
Program 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Fordeling af X Stikprøve X 1,X 2,...,X n stokastisk X stokastisk. Ex (normalfordelt stikprøve)
Grundlæggende statistik Lektion 2 Indhold Diskrete fordelinger Binomial fordelingen Poisson fordelingen Hypergeometrisk fordeling Data typer el. typer af tilfældige variable Diskrete variable > Kategoriseres
Sandsynligheder. Udfaldsrum Ω = {ω 1,..., ω N } hvor alle udfald er lige sandsynlige, dvs. P (ω i )=1/N for alle i =1,..., N.
Dagens program Afsnit 1.4-1.6 Kombinatorik - Permutationer - Kombinationer Udtagelse af stikprøver - Population - Med og uden tilbagelægning Eksempler 1 Sandsynligheder Udfaldsrum Ω = {ω 1,..., ω N } hvor
Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Introduktion Kursusholder: Kasper K. Berthelsen Opbygning: Kurset består af 5 blokke En blok består af: To normale
Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007
Rettevejledning til eksamen i Kvantitative metoder 1,. årsprøve. januar 007 I rettevejledningen henvises der til Berry and Lindgren "Statistics Theory and methods"(b&l) hvis ikke andet er nævnt. Opgave
Statistik Lektion 2. Betinget sandsynlighed Bayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV Binomialfordelingen
Statistik Lektion etinget sandsynlighed ayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV inomialfordelingen Repetition Udfaldsrum S Hændelse S Simpel hændelse O i 1, 3 4,
Modul 2: Sandsynlighedsmodeller og diskrete stokastiske variable
Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 2: Sandsynlighedsmodeller og diskrete stokastiske variable 2.1 Sandsynlighedsbegrebet............................... 1 2.1.1
Kvantitative Metoder 1 - Forår 2007. Dagens program
Dagens program Kapitel 7 Introduktion til statistik Organisering af data Diskrete variabler Kontinuerte variabler Beskrivende statistik Fraktiler Gennemsnit Empirisk varians og spredning Empirisk korrelationkoe
Tema. Dagens tema: Indfør centrale statistiske begreber.
Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i
Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger
Course 02402/02323 Introducerende Statistik Forelæsning 2: Stokastisk variabel og diskrete fordelinger Klaus K. Andersen og Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Danmarks Tekniske Universitet
Dagens program. Afsnit 1.1-1.3 Eksperimenter med usikkerhed Sandsynlighedsmodel - Udfaldsrum - Hændelser - Sandsynligheder Eksempler
Dagens program Afsnit 1.1-1.3 Eksperimenter med usikkerhed Sandsynlighedsmodel - Udfaldsrum - Hændelser - Sandsynligheder Eksempler 1 Sandsynlighedsmodel Kvantitative Metoder 1 - Efterår 2006 Eksperiment
Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen
Statistik Lektion 3 Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen Repetition En stokastisk variabel er en funktion defineret på S (udfaldsrummet, der antager
Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable
Normal fordelingen Normal fordelingen Egenskaber ved normalfordelingen Standard normal fordelingen Find sandsynligheder ud fra tabel Transformation af normal fordelte variable Invers transformation Repetition
3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve
University of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version
university of copenhagen University of Copenhagen Notat om statistisk inferens Larsen, Martin Vinæs Publication date: 2014 Document Version Peer-review version Citation for published version (APA): Larsen,
Statistiske modeller
Statistiske modeller Statistisk model Datamatrice Variabelmatrice Hændelse Sandsynligheder Data Statistiske modeller indeholder: Variable Hændelser defineret ved mulige variabel værdier Sandsynligheder
Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen
Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen Repetition Lov om total sandsynlighed Bayes sætning P( B A) = P(A) = P(AI B) + P(AI P( A B) P( B) P( A B) P( B) +
Vejledende løsninger til opgaver i kapitel 6
Vejledende løsninger til opgaver i kapitel Opgave 1: a) Den stokastiske variabel, X, der angiver, om en elev består, X = 1, eller dumper, X =, sin eksamen i statistik. b) En binomialfordelt variabel fremkommer
Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger. Peder Bacher
Introduktion til Statistik Forelæsning 2: Stokastisk variabel og diskrete fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark
Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede
Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede fordelinger (kap. 4) Middelværdi og varians (kap. 3-4) Fordelingsresultater
Statistik noter - Efterår 2009 Keller - Statistics for management and economics
Statistik noter - Efterår 2009 Keller - Statistics for management and economics Jonas Sveistrup Hansen - stud.merc.it 22. september 2009 1 Indhold 1 Begrebsliste 3 2 Forelæsning 1 - kap. 1-3 3 2.1 Kelvin
Statistik. Hjemmeside: kkb. Statistik - lektion 1 p.1/22
Statistik Kursets omfang: 2 ECTS Inklusiv mini-projekt! Bog: Complete Business Statistics, AD Aczel & J. Sounderpandian Software: SPSS eller Excel?? Forelæser: Kasper K. Berthelsen E-mail: [email protected]
Økonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2
Økonometri 1 Den simple regressionsmodel 11. september 2006 Dagens program Den simple regressionsmodel SLR : Én forklarende variabel (Wooldridge kap. 2.1-2.4) Motivation for gennemgangen af SLR Definition
1 Sandsynlighed Sandsynlighedsbegrebet Definitioner Diskret fordeling Betinget sandsynlighed og uafhængighed...
Indhold 1 Sandsynlighed 1 1.1 Sandsynlighedsbegrebet................................. 1 1.2 Definitioner........................................ 2 1.3 Diskret fordeling.....................................
Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff
Kursus 02402 Introduktion til Statistik Forelæsning 13: Summary Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:
En oversigt over udvalgte kontinuerte sandsynlighedsfordelinger
Institut for Økonomi Aarhus Universitet Statistik 1, Forår 2001 Allan Würtz 4. April, 2001 En oversigt over udvalgte kontinuerte sandsynlighedsfordelinger Uniform fordeling Benyttes som model for situationer,
Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Introduktion Kasper K. Berthelsen, Inst f. Matematiske Fag Omfang: 8 Kursusgang I fremtiden
Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet March 1, 2013 Sandsynlighedsregning og lagerstyring Normalfordelingen
Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1)
; C ED 6 > Billedbehandling og mønstergenkendelse Lidt elementær statistik (version 1) Klaus Hansen 24 september 2003 1 Elementære empiriske mål Hvis vi har observationer kan vi udregne gennemsnit og varians
Sandsynlighedsregning 3. forelæsning Bo Friis Nielsen
Sandsynlighedsregning 3. forelæsning Bo Friis Nielsen Anvendt Matematik og Computer Science Danmarks Tekniske Universitet 28 Kgs. Lyngby Danmark Email: [email protected] Dagens emner Stokastiske variable: udfald
Susanne Ditlevsen Institut for Matematiske Fag Email: [email protected] http://math.ku.dk/ susanne
Statistik og Sandsynlighedsregning 1 Indledning til statistik, kap 2 i STAT Susanne Ditlevsen Institut for Matematiske Fag Email: [email protected] http://math.ku.dk/ susanne 5. undervisningsuge, onsdag
Indblik i statistik - for samfundsvidenskab
Indblik i statistik - for samfundsvidenskab Læs mere om nye titler fra Academica på www.academica.dk Nikolaj Malchow-Møller og Allan H. Würtz Indblik i statistik for samfundsvidenskab Academica Indblik
! Proxy variable. ! Målefejl. ! Manglende observationer. ! Dataudvælgelse. ! Ekstreme observationer. ! Eksempel: Lønrelation (på US data)
Dagens program Økonometri 1 Specifikation, og dataproblemer 10. april 003 Emnet for denne forelæsning er specifikation (Wooldridge kap. 9.-9.4)! Proxy variable! Målefejl! Manglende observationer! Dataudvælgelse!
Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)
Formelsamlingen 1 Regneregler for middelværdier M(a + bx) a + bm X M(X+Y) M X +M Y Spredning varians og standardafvigelse VAR(X) 1 n n i1 ( X i - M x ) 2 Y a + bx VAR(Y) VAR(a+bX) b²var(x) 2 Kovariansen
Forelæsning 3: Kapitel 5: Kontinuerte fordelinger
Kursus 02402 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning
Side 1 af 6 Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning Litteratur: Kenneth Hansen & Charlotte Koldsø: Statistik I økonomisk perspektiv, Hans Reitzels Forlag 2012, 2. udgave,
02402 Vejledende løsninger til hjemmeopgaver og øvelser i kapitel 4
0202 Vejledende løsninger til hjemmeopgaver og øvelser i kapitel Hjemmeopgaver Vejledende løsning.2 Eksperimentet kan beskrives ved binomialfordelingen, X b(x; n, p), hvor n = og p = 1 2. Dermed kan man
Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele
Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning
Binomialfordelingen. X ~ bin(n,p): X = antal "succeser" i n uafhængige forsøg, der alle har samme sandsynlighed p for at ende med succes.
Uge 9 Teoretisk Statistik 23. februar 24 1. Binomialfordelingen 2. Den hypergeometriske fordeling 3. Poissonfordelingen 4. Den negative binomialfordeling 5. Gammafordelingen Binomialfordelingen X ~ bin(n,p):
Rettevejledning til Kvantitative metoder 1, 2. årsprøve 18. juni timers prøve med hjælpemidler
Rettevejledning til Kvantitative metoder 1, 2. årsprøve 18. juni 2007 4 timers prøve med hjælpemidler Opgaven består af re delopgaver, som alle skal besvares. De re opgaver indgår med samme vægt. Opgaverne
Statistisk model. Definition: En statistisk model består af et repræsentationsrum (X, E) og en familie P af sandsynlighedsmål
Statistisk model Definition: En statistisk model består af et repræsentationsrum (X, E) og en familie P af sandsynlighedsmål på (X, E). Modellen er parametriseret hvis der findes en parametermængde Θ og
Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.
Landmålingens fejlteori Lektion 2 Transformation af stokastiske variable - [email protected] http://people.math.aau.dk/ kkb/undervisning/lf12 Institut for Matematiske Fag Aalborg Universitet Repetition:
Statistik Lektion 2. Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var.
Statistik Lektion Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var. Repetition Stikprøve Stikprøvestørrelse n Stikprøvemiddelværdi Stikprøvevarians s Population
1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...
Indhold 1 Statistisk inferens: Hypotese og test 2 1.1 Nulhypotese - alternativ.................................. 2 1.2 Teststatistik........................................ 3 1.3 P-værdi..........................................
Løsninger til kapitel 5
1 Løsninger til kapitel 5 Opgave 51 Det nemmeste er her at omskrive alle sandsynlighederne til differenser mellem kumulerede sandsynligheder, dvs af sandsynligheder af formen, og derefter beregne disse
Produkt og marked - matematiske og statistiske metoder
Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 11, 2016 1/22 Kursusindhold: Sandsynlighedsregning og lagerstyring
Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05
Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ
Uge 10 Teoretisk Statistik 1. marts 2004
1 Uge 10 Teoretisk Statistik 1. marts 004 1. u-fordelingen. Normalfordelingen 3. Middelværdi og varians 4. Mere normalfordelingsteori 5. Grafisk kontrol af normalfordelingsantagelse 6. Eksempler 7. Oversigt
Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele
Anvendt Statistik Lektion 4 Hypotesetest generelt Test for middelværdi Test for andele Hypoteser og Test Hypotese I statistik er en hypotese en påstand om en populationsparameter. Typisk en påstand om
Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele
Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning
Løsning til eksaminen d. 14. december 2009
DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,
Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen
Landmålingens fejlteori Lektion Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ - [email protected] Institut for Matematiske Fag Aalborg Universitet En stokastisk variabel er en variabel,
Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau
Hvad skal vi lave? 1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ. Teststatistik P-værdi Signifikansniveau 2 t-test for middelværdi Tosidet t-test for middelværdi Ensidet t-test for middelværdi
Præcision og effektivitet (efficiency)?
Case-kontrol studier PhD kursus i Epidemiologi Københavns Universitet 18 Sep 2012 Søren Friis Center for Kræftforskning, Kræftens Bekæmpelse Valg af design Problemstilling? Validitet? Præcision og effektivitet
Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse
Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ
Kvantitative metoder 1
Forår 2007 Kvantitative metoder 1 5. februar 2007 Præsentation af forelæserne Forelæser: Dorte Grinderslev Specialkonsulent i det økonomiske råd Mette Ejrnæs Lektor ved Økonomisk Institut Kontor på Bispetorvet,
