University of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version

Størrelse: px
Starte visningen fra side:

Download "University of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version"

Transkript

1 university of copenhagen University of Copenhagen Notat om statistisk inferens Larsen, Martin Vinæs Publication date: 2014 Document Version Peer-review version Citation for published version (APA): Larsen, M. V., (2014). Notat om statistisk inferens Download date: 07. Feb. 2017

2 Note om statistisk inferens De store tals lov og den centrale grænseværdisætning Institut for Statskundskab, KU Metode 1 Martin Vinæs Larsen Efterår, 2013 Denne note introducerer to statistiske principper, der er afgørende for, at vi kan sige noget om vores population ud fra en stikprøve: de store tals lov og den centrale grænseværdisætning. Først diskuteres med udgangspunkt i stikprøvesituationen, nogle simple men tilstrækkelige antagelser, der gør de to principper gældende. Herefter beskrives de store tals lov for henholdsvis stikprøvegennemsnittet og stikprøvevariansen. Endeligt beskrives den centrale grænseværdisætning for stikprøvegennemsnittet, samt andre udvalgte gennemsnit. Noten er udviklet i forbindelse med undervisningen på Metode 1, og er tænkt som et supplement til Agresti og Finlay (2013) kapitel 4. 1 Nogle grundlæggende antagelser I mange situationer vil man stå over for situationer, hvor man kun kan indsamle informationer om en mindre del af den population af enheder, man egentlig er interesseret i. For at komme omkring dette problem udvælger man en stikprøve bestående af n enheder. Disse enheder kan i princippet være alt muligt: avisartikler, skoler, kandidater til kommunalvalg osv. Af præsentationsmæssige årsager vil denne note imidlertid tage udgangspunkt i et eksempel, hvor man tager en tilfældig stikprøve af individer. De konklusioner som noten kommer frem til, gælder imidlertid for alle tilfældige stikprøver. Når man først har fået fat i en stikprøve af enheder, så vil man måle disse på en række relevante variable. Lad os, for at holde det simpelt, tage udgangspunkt i én variabel, X. Al vores information om det enkelte individ, i, er nu identiceret ved sin værdi på denne variabel, X i. Det kunne eksempelvis være respondentens ideologiske orientering på en skala der går fra 1 (venstreorienteret) til 10 (højreorienteret). Med udgangspunkt i sin stikprøve kunne man nu udregne stikprøvegennemsnittet som 1

3 n i xi n = x, ligesom man kunne udregne stikprøvevariansen som n i (xi x)2 n = s 2. 1 Hvis vi vender tilbage til danskernes ideologiske orientering, så kunne vi altså med udgangspunkt i vores stikprøve af danskere, udregne hvor de gennemsnitligt lå på tipunktsskalaen samt hvor spredte deres svar var (variansen). Vi er imidlertid ikke synderligt interesserede i x eller s 2. De beskriver jo bare vores stikprøve. Vi er i virkeligheden interesseret i det gennemsnit, som ndes blandt alle enheder, µ, og den variation der ndes blandt alle vores enheder, σ 2. For at kunne sige noget om µ og σ 2 bliver vi imidlertid nødt til at gøre os en central antagelser om, hvordan vores stikprøve er udvalgt. Den vigtigste antagelse er, at stikprøven er udvalgt tilfældigt. Tilfældig udvælgelse er vigtig, da den sikrer at alle populationens enheder vil have lige stor sandsynlighed for at blive udvalgt til ens stikprøve. Når alle enheder har samme sandsynlighed for at blive udvalgt, vil sandsynligheden for at en udvalgt enhed har et givent udfald, være lig andelen af enheder, der har dette udfald i populationen. Hvis vi vender tilbage til den ideologiske orientering, så vil sandsynligheden for at udvælge en person i stikprøven, der har værdien 1 på skalaen, svare præcist til andelen af alle danskere der har værdien 1. 2 Tilsammen gør disse to antagelser, at vi kan forstå vores stikprøve som n uafhængige træk af den variabel vi er interesseret i, X, hvor de enkelte udfald, X i, er trukket fra en sandsynlighedsfordeling med populationens gennemsnit (µ) og varians (σ 2 ). 2 De store tals lov Hvis man udvælger enheder tilfældigt fra ens population, når man trækker sin stikprøve, kan det altså forståes som at lave uafhængige træk fra en sandsynlighedsfordeling. Det er en produktiv måde at forstå stikprøveudvælgelse på, fordi vi hermed kan bruge nogle teoremer fra sandsynlighedsregningen til at beskrive forholdet mellem vores stikprøve og vores population. Det første teorem vi skal se på er det store tals lov, der siger følgende om forholdet mellem vores stikprøvegennemsnit ( x) og gennemsnittet i vores population (µ): 1 Hvis formlerne for hhv. gennemsnit og varians ikke virker bekendte, så konsulter kapitel 3 i Agresti og Finaly (2013). Bemærk derudover at nævneren i formlen for stikprøvevariansen er n og ikke n-1. Det skyldes, at vi i denne note udelukkende beskæftiger os med asymptotiske resultater (se afsnit 3.2), hvor n går mod uendelig, og når n går mod uendelig vil n n 1. 2 Denne skal teknisk set suppleres med en antagelse om at vores stikprøve er udvalgt på baggrund af en populationsfordeling med et bestemt gennemsnit, µ, og en bestemt varians, σ 2. Denne antagelse vil sjældent være brudt i praksis, og har derfor en mere teoretisk karakter. Den etablerer blot, at der er et gennemsnit og en varians derude, som vi gerne vil sige noget om. 2

4 x µ (1) x vil altså nærme sig populationens gennemsnit, µ, efterhånden som vores stikprøve bliver større - altså når n går mod uendelig. Et interessant og intuitivt resultat. Intuitivt fordi mere information om gennemsnittet i vores population (større n), medfører at vores stikprøvegennemsnittet kommer tættere på populationens gennemsnit. Et interessant resultat, fordi vi nu ved, at jo ere vi udvælger til vores stikrprøve, desto tættere kommer vi på populationens gennemsnit. Hvis vi igen vender tilbage til danskernes højre-venstre placering, så kommer vi altså tættere og tættere på danskernes gennemsnitlige ideologiske orientering, når vi gør vores stikprøve større. Det store tals lov gælder for en lang række stikprøvemål. Det kræver blot, at vi kan omkskrive strikprøvemålet til et gennemsnit. Lad os tage et eksempel, der kommer til at have en naturlig interesse. n i Gennemsnittet af de kvadrerede afvigelser fra gennemsnittet, (xi x)2 n = s 2. Vi kalder dette gennemsnit for s 2, da formlen er den samme som formlen for variansen i stikprøven (jf. afsnit 1). Ligesom overfor kan vi anvende de store tals lov og komme frem til følgende: s 2 σ 2 (2) Ligesom at stikprøvegennemsnittet vil nærme sig populationens gennemsnit når n går mod uendelig, så vil stikprøvevariansen også nærme sig populationens varians. 3 Den centrale grænseværdisætning Selvom det kan være svært at få armene ned oven på de store tals lov, så står vi stadig tilbage med et problem. Vi vil aldrig kunne udtrække uendelig observationer, så vores stikprøvegennemsnit vil aldrig blive præcis lig populationens gennemsnit. Så selvom vi ved, at vores stikprøvegennemsnit vil komme tættere på, hvis vi indsamler mere data om danskers ideologi, så ved vi ikke noget om, hvor langt vi er fra populationens gennemsnit. For at kunne løse dette problem skal vi sige noget om hvilken sandsynlighedsfordeling, som stikprøvegennemsnittet, x, følger. Men hvad er nu det? Var det ikke kun 3

5 populationen, der havde en bestemt sandsynlighedsfordeling? Nej, faktisk har stikprøvegennemsnittet også en sandsynlighedsfordeling. Det kan umiddelbart virke lidt kontraintuitivt at tænke stikprøvegennemsnittet som noget der kan variere. Typisk vil man jo kun have én stikprøve, og således også kun ét stikprøvegennemsnit. Man kan imidlertid forstå stikprøvegennemsnittets sandsynlighedsfordeling, som den fordeling af gennemsnit, du ville se, hvis du blev ved med at udvælge et nyt tilfældigt udsnit af dine respondenter og registrere stikprøvegennemsnittet. Ligesom trækkene af X følger en sandsynlighedsfordeling, vil disse stikprøvegennemsnit ( x) også følge en sandsynlighedsfordeling. Hvor populationens sandsynlighedsfordeling beskriver hvor sandsynligt det er, at få et givet udfald på X, så beskriver stikprøvegennemsnittets sandsynlighedsfordeling, hvor sandsynligt det er at få et givent stikprøvegennemsnittet. Hvad ved vi om stikprøvegennemsnittets sandsynlighedsfordeling? Fra de store tals lov ved vi at den ændrer sig når n bliver større. Vi ved nemlig at dit stikprøvegennemsnit vil komme tættere på den rigtige værdi jo ere observationer du får - altså vil sandsyndlighedsfordelingen for stikprøvegennemsnittet variere mindre og mindre efterhånden som n stiger. Når du indsamler uendelig observationer vil fordelingen kollapse helt, og du vil få det sande gennemsnit. Men hvad så når n ikke er uendelig? Hvordan fordeler afvigelser fra det sande gennemsnit sig så? Det fortæller et andet teorem os: den centrale grænseværdisætning. Dette teorem beskriver hvordan afstanden mellem stikprøvegennemsnittet og dens sande værdi ( x µ) er fordelt: ( x µ) N(0; σ 2 /n) (3) Grundlæggende siger den centrale grænseværdisætning altså, at efterhånden som n går mod uendelig, så vil forskellen mellem stikprøvegennemsnittet og populationens gennemsnit ( x µ) følge en normalfordeling, der gennemsnitligt vil være nul og have en varians, der er lig populationens varians divideret med n. Hvad betyder det? For det første, og som vi vidste fra de store tals lov, så vil den gennemsnitlige forskel mellem stikprøvegennemsnittet og populationens gennemsnit være lig nul. Gennemsnitligt set vil x altså være lig µ. For det andet, og mere interessant, kan vi nu også sige noget om variansen af afvigelsen mellem stikprøvegennemsnittet og populationens gennemsnit - altså hvor langt x typisk vil ligge fra µ. Konkret vil variansen af afvigelserne være lig variansen i populationen divideret med n. 4

6 Endelig ved vi at afvigelserne fra populationsgennemsnittet vil være normalfordelte. Når en variabel er normalfordelt med et bestemt gennemsnit og en bestemt varians, så betyder det at vi kan knytte bestemte sandsynligheder til, at vi får bestemte udfald på denne variabel. I det her tilfælde er vores variabel de forskellige afvigelser fra populationsgennemsnittet vi kunne have fået, såfremt vi havde spurgt et andet tilfældigt udsnit, og vores udfald er den afvigelse, vi rent faktisk har fået. Vi kan altså knytte en bestemt sandsynlighed til, at vi får en bestemt afvigelse fra populationsgennemsnittet. Og her når vi så til sagens kerne - hvorfor den centrale grænseværdisætning er så central - den kan, for en given stikprøvestørrelse, fortælle os hvor sandsynligt det er, at vi lander et bestemt stykke fra populationsgennemsnittet. Vi kan altså, hvis vi spørger 500 danskere, udregne, hvor sandsynligt det er, at vores stikprøvegennemsnit er landet et (eller to) skalapunkter fra det sande gennemsnit. 3.1 Nogle vigtige omskrivninger af den centrale grænseværdisætning Det er sådan set alt man behøver vide om den centrale grænseværdisætning. Det er imidlertid relevant at gennemgå et par typiske omksrivninger af sætningen, der tillader os at bruge den mere eektivt, og eksplicitere intuitionen bag teoremet. Vi starter med at se på variansen af afvigelserne fra populationsgennemsnittet, σ 2 /n. Den fortæller grundlæggende noget om hvor præcise vores gæt (dvs. stikprøvegennemsnittet) på populationens gennemsnit er. Konkret bliver vi mindre præcise, når populationsvariansen stiger σ 2. Når det er mere sandsynligt at et givet X i ligger langt fra µ, er X i mindre informativ i forhold til µ. Derudover så falder variansen når n stiger, hvilket vi også ville forvente på baggrund af de store tals lov. Jo ere observationer vi får, jo tættere vil vi ligge på det rigtige gennemsnit. Et problem ved variansudtrykket, σ 2 /n, er at vi generelt ikke kender 3 σ 2. Vi ved imidlertid fra de store tals lov at s 2 σ 2. Derfor kan vi udskifte den ukendte varians σ 2 med den kendte stikprøvevarians s 2, når n går mod uendelig: ( x µ) N(0; ŝ2 /N) (4) En anden omksrivning går ud på at standardisere afvigelserne fra populationsgennemsnittet. Dette gøres ved at dividere med fordelingens standardafvigelse, der er lig kvadratroden af variansen ( σ). Så ser den centrale grænseværdisætning ud som følger: 3 Præcis ligesom vi ikke kender populationsgennemsnittet kender vi heller ikke populationsvariansen. 5

7 ( x µ) ˆσ/ N(0; 1) (5) N Hvor udtrykket til venstre ofte blot betegnes z, og kan forstås som antallet af standardafvigelser som stikprøven lander fra stikprøvegennemsnittet. z N(0; 1) (6) Styrken ved denne omskrivning er at z-værdierne nu vil være standardnormalfordelte. Det vil sige, at afvigelserne er normalfordelte med gennemsnit 0 og varians 1. Dette er en særlig simpel normalfordeling, som let kan bruges til at udregne sandsynligheden for forskellige z-værdierne. Man kan eksempelvis nde sandsynligheden for en given z-værdi i Agresti og Finlay tabel A (2013, 592) 3.2 Hvor stor skal n være? Alle resultater ovenfor har været det man kalder asymptotiske. Det vil sige, at de kun er rigtige når n, men hvad betyder det rent faktisk når teoremerne anvendes? Ikke så meget. Det viser sig nemlig, at n ikke skal være så langt mod uendeligt, før at den centrale grænseværdisætning er ret god til at beskrive stikprøvegennemsnittets afvigelser fra gennemsnittet. Agresti og Finlay (2013) anbefaler 30 observationer, men det faktiske antal varierer afhængigt af populationens fordeling. Et eksempel kan ndes i gur 1. Her er trukket 1000 stikprøver af hhv. 2, 4, 8, 16, 32 og 64 observationer fra en population af individer, der er helt ligeligt fordelt på tværs af en højre-venstre skala fra 1-10, hvorfor gennemsnitet er på 5,5. Figuren viser, hvordan stikprøvegennemsnittet fordeler sig på tværs af de 1000 stikprøver. Som det kan ses, begynder normalfordeling allerede at være en fornuftig approksimation ved omkring 4-8 observationer. Bemærk desuden, hvordan stikprøvegennemsnittene ligger tættere og tættere på det faktiske gennemsnit, efterhånden som stikprøven bliver større. 3.3 Den centrale grænseværdisætning og dummyvariable Hvis man ønsker at estimerer sandsynligheden π for et udfald (a) kan vi ligeledes bruge den centrale grænseværdisætning. Det kan eksempelvis være sandsynligheden for at en tilfældig dansker er Socialdemokrat. Vi denerer i dette tilfælde en variabel X med kun to udfald {0,1}, hvor det udfald vi er 6

8 Figur 1: Hvor stor skal n være? En illustration 7

9 interesserede i gives værdien 1, og alle andre udfald værdien 0. En sådan variabel kaldes en dikotom, binær eller dummy-variabel. Lad os nu forestille os, at vi har udvalgt en tilfældig stikprøve af danskere. Hvis du vil udregne sandsynligheden p for at du trak en socialdemokrat fra din stikprøve, ville du blot skulle tage antallet af det udfald du var interesseret i (Socialdemokrater) og dividerer med samtlige udfald (din stikprøvestørrelse), matematisk: p = n i X i/n. Dette er præcis udtrykket for vores stikprøvegennemsnittet. Derfor gælder det store tals lov: p π (7) Det samme gør den centrale grænseværdisætning: (p π) N(0; s 2 ) (8) Stikprøvevariansen kan i dette tilfælde også udtrykkes endnu meres simpelt, nemlig som p(1 p), hvorfor følgende udtryk kan bruges: (p π) N(0; p(1 p)) (9) 8

Kvantitative Metoder 1 - Forår 2007

Kvantitative Metoder 1 - Forår 2007 Dagens program Kapitel 8.7, 8.8 og 8.10 Momenter af gennemsnit og andele kap. 8.7 Eksempel med simulationer Den centrale grænseværdisætning (Central Limit Theorem) kap. 8.8 Simulationer Normalfordelte

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Kvantitative Metoder 1 - Forår 2007

Kvantitative Metoder 1 - Forår 2007 Dagens program Estimation: Kapitel 9.1-9.3 Estimation Estimationsfejlen Bias Eksempler Bestemmelse af stikprøvens størrelse Konsistens De nitioner påkonsistens Eksempler på konsistente og middelrette estimatorer

Læs mere

C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b2.

C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b2. C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b. 5.000 4.800 4.600 4.400 4.00 4.000 3.800 3.600 3.400 3.00 3.000 1.19% 14.9% 7.38% 40.48% 53.57% 66.67% 79.76% 9.86% 010 011

Læs mere

Normalfordelingen og Stikprøvefordelinger

Normalfordelingen og Stikprøvefordelinger Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger

Læs mere

Note om Monte Carlo metoden

Note om Monte Carlo metoden Note om Monte Carlo metoden Kasper K. Berthelsen Version 1.2 25. marts 2014 1 Introduktion Betegnelsen Monte Carlo dækker over en lang række metoder. Fælles for disse metoder er, at de anvendes til at

Læs mere

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Program 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Fordeling af X Stikprøve X 1,X 2,...,X n stokastisk X stokastisk. Ex (normalfordelt stikprøve)

Læs mere

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M. Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet March 1, 2013 Sandsynlighedsregning og lagerstyring Normalfordelingen

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen Landmålingens fejlteori Lektion Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet En stokastisk variabel er en variabel,

Læs mere

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Anvendt Statistik Lektion 2 Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Sandsynlighed: Opvarmning Udfald Resultatet af et eksperiment kaldes et udfald. Eksempler:

Læs mere

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0. Landmålingens fejlteori Lektion 2 Transformation af stokastiske variable - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf12 Institut for Matematiske Fag Aalborg Universitet Repetition:

Læs mere

Produkt og marked - matematiske og statistiske metoder

Produkt og marked - matematiske og statistiske metoder Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring

Læs mere

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Stikprøver og stikprøve fordelinger Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Statistik Statistisk Inferens: Prediktere og forekaste værdier af

Læs mere

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Anvendt Statistik Lektion 2 Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Sandsynlighed: Opvarmning Udfald Resultatet af et eksperiment kaldes et udfald. Eksempler:

Læs mere

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Introduktion Kursusholder: Kasper K. Berthelsen Opbygning: Kurset består af 5 blokke En blok består af: To normale

Læs mere

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala 3 5% 5% 5% 0 3 4 5 6 7 8 9 0 Statistik for biologer 005-6, modul 5: Normalfordelingen opstår når mange forskellige faktorer uafhængigt af hinanden bidrager med additiv variation til. F.eks. Højde af rekrutter

Læs mere

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable Landmålingens fejlteori Lektion 2 Transformation af stokastiske variable - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf12 Institut for Matematiske Fag Aalborg Universitet 1/31 Repetition:

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af

Læs mere

Estimation og usikkerhed

Estimation og usikkerhed Estimation og usikkerhed = estimat af en eller anden ukendt størrelse, τ. ypiske ukendte størrelser Sandsynligheder eoretisk middelværdi eoretisk varians Parametre i statistiske modeller 1 Krav til gode

Læs mere

Nanostatistik: Opgavebesvarelser

Nanostatistik: Opgavebesvarelser Nanostatistik: Opgavebesvarelser JLJ Nanostatistik: Opgavebesvarelser p. 1/16 Pakkemaskine En producent hævder at poserne indeholder i gennemsnit 16 ounces sukker. Data: 10 pakker sukker: 16.1, 15.8, 15.8,

Læs mere

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen Statistik Lektion 3 Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen Repetition En stokastisk variabel er en funktion defineret på S (udfaldsrummet, der antager

Læs mere

Landmålingens fejlteori - Lektion 3. Estimation af σ Dobbeltmålinger Geometrisk nivellement Linearisering

Landmålingens fejlteori - Lektion 3. Estimation af σ Dobbeltmålinger Geometrisk nivellement Linearisering Landmålingens fejlteori Lektion 3 Estimation af σ Dobbeltmålinger Geometrisk nivellement Linearisering - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet 1/31 Repetition: Middelværdi og

Læs mere

hvor y antages approksimeret ved normalfordeling med middelværdi y og varians va^r(y): y ± u 1-/2 # cv(y) # y = y(1 ± u 1-/2 # cv(y))

hvor y antages approksimeret ved normalfordeling med middelværdi y og varians va^r(y): y ± u 1-/2 # cv(y) # y = y(1 ± u 1-/2 # cv(y)) 1 Opgave II.1 a) Stikprøvevariansen er vidt forskellig for de fire varetyper, men denne absolutte størrelse er vanskelig at sammenligne på tværs af varetyper, da disse har vidt forskellige niveauer, målt

Læs mere

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable Normal fordelingen Normal fordelingen Egenskaber ved normalfordelingen Standard normal fordelingen Find sandsynligheder ud fra tabel Transformation af normal fordelte variable Invers transformation Repetition

Læs mere

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd I dag Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik SaSt) Helle Sørensen Først lidt om de sidste uger af SaSt. Derefter statistisk analyse af en enkelt

Læs mere

4 Oversigt over kapitel 4

4 Oversigt over kapitel 4 IMM, 2002-09-14 Poul Thyregod 4 Oversigt over kapitel 4 Introduktion Hidtil har vi beskæftiget os med data. Når data repræsenterer gentagne observationer (i bred forstand) af et fænomen, kan det være bekvemt

Læs mere

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Introduktion Kasper K. Berthelsen, Inst f. Matematiske Fag Omfang: 8 Kursusgang I fremtiden

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π

Læs mere

Kulturel kapital blandt topdirektører i Danmark - En domineret kapitalform? Ellersgaard, Christoph Houman; Larsen, Anton Grau

Kulturel kapital blandt topdirektører i Danmark - En domineret kapitalform? Ellersgaard, Christoph Houman; Larsen, Anton Grau university of copenhagen Kulturel kapital blandt topdirektører i Danmark - En domineret kapitalform? Ellersgaard, Christoph Houman; Larsen, Anton Grau Published in: Dansk Sociologi Publication date: 2011

Læs mere

Vejledende besvarelser til opgaver i kapitel 14

Vejledende besvarelser til opgaver i kapitel 14 Vejledende besvarelser til opgaver i kapitel 14 Opgave 1 a) Det første trin i opstillingen af en hypotesetest er at formulere to hypoteser, hvoraf den ene støtter den teori vi vil teste, mens den anden

Læs mere

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele Anvendt Statistik Lektion 4 Hypotesetest generelt Test for middelværdi Test for andele Hypoteser og Test Hypotese I statistik er en hypotese en påstand om en populationsparameter. Typisk en påstand om

Læs mere

Mikro-kursus i statistik 1. del. 24-11-2002 Mikrokursus i biostatistik 1

Mikro-kursus i statistik 1. del. 24-11-2002 Mikrokursus i biostatistik 1 Mikro-kursus i statistik 1. del 24-11-2002 Mikrokursus i biostatistik 1 Hvad er statistik? Det systematiske studium af tilfældighedernes spil!dyrkes af biostatistikere Anvendes som redskab til vurdering

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan

Læs mere

Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne

Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne Statistik og Sandsynlighedsregning 1 Indledning til statistik, kap 2 i STAT Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne 5. undervisningsuge, onsdag

Læs mere

Fagplan for statistik, efteråret 2015

Fagplan for statistik, efteråret 2015 Side 1 af 7 M Fagplan for statistik, efteråret 20 Litteratur Kenneth Hansen & Charlotte Koldsø (HK): Statistik I økonomisk perspektiv, Hans Reitzels Forlag 2012, 2. udgave, ISBN 9788741256047 HypoStat

Læs mere

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Introduktion Kasper K. Berthelsen, Inst f. Matematiske Fag Omfang: 8 Kursusgang I fremtiden

Læs mere

Om hypoteseprøvning (1)

Om hypoteseprøvning (1) E6 efterår 1999 Notat 16 Jørgen Larsen 11. november 1999 Om hypoteseprøvning 1) Det grundlæggende problem kan generelt formuleres sådan: Man har en statistisk model parametriseret med en parameter θ Ω;

Læs mere

Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Dagens tema: Indfør centrale statistiske begreber. Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i

Læs mere

Opgaver til kapitel 3

Opgaver til kapitel 3 Opgaver til kapitel 3 3.1 En løber er interesseret i at undersøge om hendes løbeur er kalibreret korrekt. Hun udmåler derfor en strækning på præcis 1000 m og løber den 16 gange. For hver løbetur noterer

Læs mere

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium Deskriptiv (beskrivende) statistik er den disciplin, der trækker de væsentligste oplysninger ud af et ofte uoverskueligt materiale. Det sker f.eks. ved at konstruere forskellige deskriptorer, d.v.s. regnestørrelser,

Læs mere

1 Sandsynlighed Sandsynlighedsbegrebet Definitioner Diskret fordeling Betinget sandsynlighed og uafhængighed...

1 Sandsynlighed Sandsynlighedsbegrebet Definitioner Diskret fordeling Betinget sandsynlighed og uafhængighed... Indhold 1 Sandsynlighed 1 1.1 Sandsynlighedsbegrebet................................. 1 1.2 Definitioner........................................ 2 1.3 Diskret fordeling.....................................

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Statistisk Model

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Statistisk Model Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Statistisk Model Indhold Binomialfordeling Sandsynlighedsfunktion Middelværdi og spredning 1 Aalen: Innføring i statistik med medisinske eksempler

Læs mere

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts. Teoretisk Statistik, 9 marts 2005 Empiriske analoger (Kap. 3.7) Normalfordelingen (Kap. 3.12) Opsamling på Kap. 3 nb. Det forventes ikke, at alt materialet dækkes d. 9. marts. 1 Empiriske analoger Betragt

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 14. december 2009 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Schweynoch, 2003. Se eventuelt http://www.mathematik.uni-kassel.de/~fathom/projekt.htm.

Schweynoch, 2003. Se eventuelt http://www.mathematik.uni-kassel.de/~fathom/projekt.htm. Projekt 8.5 Hypotesetest med anvendelse af t-test (Dette materiale har været anvendt som forberedelsesmateriale til den skriftlige prøve 01 for netforsøget) Indhold Indledning... 1 χ -test... Numeriske

Læs mere

Kvantitative Metoder 1 - Forår Dagens program

Kvantitative Metoder 1 - Forår Dagens program Dagens program Kapitel 8.1-8.3 Tilfældig stikprøve (Random Sampling) Likelihood Eksempler på likelihood funktioner Sufficiente statistikker Eksempler på sufficiente statistikker 1 Tilfældig stikprøve Kvantitative

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Kursus 242 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik Bygning 35/324 Danmarks Tekniske Universitet 28 Lyngby Danmark e-mail:

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet Matematik A Studentereksamen Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet stx11-matn/a-080501 Tirsdag den 8. maj 01 Forberedelsesmateriale til stx A Net MATEMATIK Der

Læs mere

Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning

Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning Side 1 af 6 Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning Litteratur: Kenneth Hansen & Charlotte Koldsø: Statistik I økonomisk perspektiv, Hans Reitzels Forlag 2012, 2. udgave,

Læs mere

Kvantitative Metoder 1 - Efterår Dagens program

Kvantitative Metoder 1 - Efterår Dagens program Dagens program Estimation: Kapitel 9.7-9.10 Estimationsmetoder kap 9.10 Momentestimation Maximum likelihood estimation Test Hypoteser kap. 10.1 Testprocedure kap 10.2 Teststørrelsen Testsandsynlighed 1

Læs mere

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Kursus 02402 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Statistik og Sandsynlighedsregning 2

Statistik og Sandsynlighedsregning 2 Statistik og Sandsynlighedsregning 2 Normalfordelingens venner og bekendte Helle Sørensen Uge 9, onsdag SaSt2 (Uge 9, onsdag) Normalfordelingens venner 1 / 20 Program Resultaterne fra denne uge skal bruges

Læs mere

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens Oversigt Oversigt over emner 1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens 2 Konfidensinterval Konfidensinterval for andel Konfidensinterval - normalfordelt stikprøve

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Hvorfor er normalfordelingen så normal?

Hvorfor er normalfordelingen så normal? Hvorfor er normalfordelingen så normal? Søren Højsgaard Institut for Matematiske Fag, Aalborg Universitet October 24, 2018 normalfordelingen så normal? October 24, 2018 1 / 13 Højde af kvinder Histogram

Læs mere

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05 Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Vejledende løsninger kapitel 8 opgaver

Vejledende løsninger kapitel 8 opgaver KAPITEL 8 OPGAVE 1 Nej den kan også være over 1 OPGAVE 2 Stikprøvestørrelse 10 Stikprøvegennemsnit 1,18 Stikprøvespredning 0,388158 Konfidensniveau 0,95 Nedre grænse 0,902328 Øvre grænse 1,457672 Stikprøvestørrelse

Læs mere

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt) I dag Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt) Helle Sørensen Repetition vha eksempel om dagligvarepriser Analyse med R: ttest

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 Indledning 2 Ensidet variansanalyse 3 Blokforsøg 4 Vekselvirkning 1 Indledning 2 Ensidet

Læs mere

ca. 5 min. STATISTISKE TEGN

ca. 5 min. STATISTISKE TEGN ca. 5 min. STATISTISKE TEGN I statistik støder du tit på forskellige tegn - det som også kaldes for statistisk notation. Det kan virke forvirrende og uoverskueligt i starten. Men bare rolig: For det første

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning

Læs mere

Statistiske modeller

Statistiske modeller Statistiske modeller Statistisk model Datamatrice Variabelmatrice Hændelse Sandsynligheder Data Statistiske modeller indeholder: Variable Hændelser defineret ved mulige variabel værdier Sandsynligheder

Læs mere

Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller

Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller Statistik II 1. Lektion Sandsynlighedsregning Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller

Læs mere

Statistik Lektion 2. Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var.

Statistik Lektion 2. Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var. Statistik Lektion Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var. Repetition Stikprøve Stikprøvestørrelse n Stikprøvemiddelværdi Stikprøvevarians s Population

Læs mere

Modelkontrol i Faktor Modeller

Modelkontrol i Faktor Modeller Modelkontrol i Faktor Modeller Julie Lyng Forman Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for Biokemikere 2003 For at konklusionerne på en ensidet, flersidet eller hierarkisk

Læs mere

Vægte motiverende eksempel. Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl. Vægtet model. Vægtrelationen

Vægte motiverende eksempel. Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl. Vægtet model. Vægtrelationen Vægte motiverende eksempel Landmålingens fejlteori Lektion 4 Vægtet gennemsnit Fordeling af slutfejl - kkb@mathaaudk Institut for Matematiske Fag Aalborg Universitet Højdeforskellen mellem punkterne P

Læs mere

Kapitel 7 Forskelle mellem centraltendenser

Kapitel 7 Forskelle mellem centraltendenser Kapitel 7 Forskelle mellem centraltendenser Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 29 Indledning 1. z-test for ukorrelerede data 2. t-test for ukorrelerede data med ens

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination

Læs mere

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller

Læs mere

Definition. Definitioner

Definition. Definitioner Definition Landmålingens fejlteori Lektion Diskrete stokastiske variable En reel funktion defineret på et udfaldsrum (med sandsynlighedsfordeling) kaldes en stokastisk variabel. - kkb@math.aau.dk http://people.math.aau.dk/

Læs mere

Kapitel 4 Sandsynlighed og statistiske modeller

Kapitel 4 Sandsynlighed og statistiske modeller Kapitel 4 Sandsynlighed og statistiske modeller Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 22 Generalisering fra stikprøve til population Idé: Opstil en model for populationen

Læs mere

Dagens program. Praktisk information:

Dagens program. Praktisk information: Dagens program Praktisk information: Husk hjemmeopgaven i statistik Hypoteseprøvning kap. 11.2,11.3 og 11.8 Eksempel på test Styrkefunktionen kap. 11.2 Stikprøvens størrelse kap. 11.3 Likelihood ratio

Læs mere

Dagens program. Praktisk information: Husk evalueringer af kurset

Dagens program. Praktisk information: Husk evalueringer af kurset Dagens program Praktisk information: Husk evalueringer af kurset Hypoteseprøvning kap. 11.1-11.3 Fokastelsesområdet kap. 11.1 Type I og Type II fejl kap. 11.1 Styrkefunktionen kap. 11.2 Stikprøvens størrelse

Læs mere

1 Sammenligning af 2 grupper Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver... 2

1 Sammenligning af 2 grupper Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver... 2 Indhold 1 Sammenligning af 2 grupper 2 1.1 Responsvariabel og forklarende variabel......................... 2 1.2 Afhængige/uafhængige stikprøver............................ 2 2 Sammenligning af 2 middelværdier

Læs mere

Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl

Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl Landmålingens fejlteori Lektion 4 Vægtet gennemsnit Fordeling af slutfejl - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet 1/36 Estimation af varians/spredning Antag X 1,...,X n stokastiske

Læs mere

Hvad skal vi lave? Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver

Hvad skal vi lave? Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver Hvad skal vi lave? 1 Sammenligning af 2 grupper Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver 2 Sammenligning af 2 middelværdier Uafhængige stikprøver Uafhængige stikprøver -

Læs mere

Sandsynlighedsregning

Sandsynlighedsregning Mogens Bladt www2.imm.dtu.dk/courses/02405 21. September, 2007 Lidt om binomialkoefficienter n størrelsen af en mængde/population. Vi ønsker at udtage en sub population af størrelse r. To sub populationer

Læs mere

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning

Læs mere

Kvantitative Metoder 1 - Forår 2007

Kvantitative Metoder 1 - Forår 2007 Dagens program Kapitel 4: Diskrete fordelinger Afsnit 4.1-4.2, 4.7: Bernoulli fordeling Binomial fordeling Store Tals Lov (Laws of Averages, Laws of Large Numbers) 1 Bernoulli fordeling Kvantitative Metoder

Læs mere

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl i Kirkesalen, Studiestræde 38 Øvelser

Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl i Kirkesalen, Studiestræde 38 Øvelser Uge 36 Velkommen tilbage Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl. -2 i Kirkesalen, Studiestræde 38 Øvelser Hold -4 og 6: mandag og onsdag kl. 8-; start 3. september Hold 5: tirsdag

Læs mere

Lineær regression: lidt mere tekniske betragtninger om R 2 og et godt alternativ

Lineær regression: lidt mere tekniske betragtninger om R 2 og et godt alternativ Lineær regression: lidt mere tekniske betragtninger om R 2 og et godt alternativ Per Bruun Brockhoff, DTU Compute, Claus Thorn Ekstrøm, KU Biostatistik, Ernst Hansen, KU Matematik January 17, 2017 Abstract

Læs mere

Landmålingens fejlteori - Repetition - Kontinuerte stokastiske variable - Lektion 3

Landmålingens fejlteori - Repetition - Kontinuerte stokastiske variable - Lektion 3 Landmålingens fejlteori Repetition - Kontinuerte stokastiske variable Lektion 4 - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf10 Institut for Matematiske Fag Aalborg Universitet 29. april

Læs mere

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede fordelinger (kap. 4) Middelværdi og varians (kap. 3-4) Fordelingsresultater

Læs mere

Bilag 7. SFA-modellen

Bilag 7. SFA-modellen Bilag 7 SFA-modellen November 2016 Bilag 7 Konkurrence- og Forbrugerstyrelsen Forsyningssekretariatet Carl Jacobsens Vej 35 2500 Valby Tlf.: +45 41 71 50 00 E-mail: kfst@kfst.dk Online ISBN 978-87-7029-650-2

Læs mere

Økonometri 1. Dagens program. Den simple regressionsmodel 15. september 2006

Økonometri 1. Dagens program. Den simple regressionsmodel 15. september 2006 Dagens program Økonometri Den simple regressionsmodel 5. september 006 Den simple lineære regressionsmodel (Wooldridge kap.4-.6) Eksemplet fortsat: Løn og uddannelse på danske data Funktionel form Statistiske

Læs mere

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable Landmålingens fejlteori - lidt om kurset Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet Kursusholder

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som MLR antagelserne Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + u, hvor β 0, β 1, β 2,...,β k er ukendte parametere,

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression: Definitioner For en binær (0/) variabel Y antager vi P(Y)p P(Y0)-p Eksempel: Bil til arbejde vs alder

Læs mere

Kvantitative Metoder 1 - Forår 2007. Dagens program

Kvantitative Metoder 1 - Forår 2007. Dagens program Dagens program Kapitel 7 Introduktion til statistik Organisering af data Diskrete variabler Kontinuerte variabler Beskrivende statistik Fraktiler Gennemsnit Empirisk varians og spredning Empirisk korrelationkoe

Læs mere

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Kursus 02402: Besvarelser til øvelsesopgaver i uge 9 Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Som model benyttes en binomialfordeling, som beskriver antallet, X, blandt

Læs mere