Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning
|
|
- Stine Skaarup
- 7 år siden
- Visninger:
Transkript
1 Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning
2 Introduktion Kasper K. Berthelsen, Inst f. Matematiske Fag Omfang: 8 Kursusgang I fremtiden Start 8:15?? Kursusgang: 2 x 45 min forelæsning + opgaveregning Indhold: Groft sagt kapitel 1 til 11 i Newbold Eksamen: Individuel mundtlig efter 7-trins skala Eksamen tager udgangspunkt i et antal opgaver. Software: R
3 Nogle definitioner Population: Mængden af alle individer vi er interesserede i. fx alle virksomheder i DK Parameter: Et deskriptivt mål for populationen (for eksempel middelværdi og varians). fx gennemsnits antal ansatte Stikprøve (sample): Mængde af data taget fra en delmængde af populationen fx 10 tilfældigt udvalgte virksomheder Statistik: Et deskriptivt mål for stikprøven. fx gennemsnits antal ansatte blandt de 10. Variabel: En karakteristik af populationen eller stikprøven fx antal ansatte, omsætning, region, type
4 Typisk statistisk problemstilling Vi ønsker at udtale os om en population (alle flyrejsende) ud fra en stikprøve (et udsnit af de flyrejsende). Vi vil udtale os om en parameter for populationen (andelen af trygge flyrejsende) ud fra en stikprøve statistik (andelen af trygge flyrejsende i stikprøven). Parameteren for population er aldrig kendt! (i praksis) Vigtigt: Vi er ligeglade med medlemmerne af stikprøven! Det er populationen vi vil udtale os om!
5 Lidt om stikprøver Simpel tilfældig stikprøve: Alle medlemmer i populationen har lige stor sandsynlighed for at blive udvalgt til stikprøven Notation: N : Størrelsen af populationen (alle vælgere) n : Størrelsen af stikprøven (antal adspurgte vælgere) Population Stikprøve:
6 Deskriptiv versus inferential statistik Deskriptiv statistik: Metoder til at organisere og præsentere data på en informativ måde. Inferential statistik Omhandler: Estimation, test af hypoteser, analyse af sammenhæng og forudsigelse. Eksempel: Hvad er middel-indkomsten i region nord? Er den større en ?
7 Deskriptiv Statistik Data består af en eller flere variable, fx højde, køn, alder, favoritfarve for hvert medlem i stikprøven. Hvordan data (de enkelte variable) opsummeres / beskrives afhænger bl.a. datas natur. Hovedopdeling: Kategorisk eller numerisk variabel Kvalitativ variabel: Variablens værdier er beskrivende, kategorisk variabel, forskelle giver ikke mening. Kvantitative variable: Variablens værdier er målinger, numerisk variabel, forskelle giver mening.
8 Kategoriske variable Variable hvis værdi er en kategori, fx. Ryger: Ja, Nej Godt vejr: Meget enig, devis enig,, meget uenig Favoritfarve: Rød, grøn, anden Ordinal kategorisk variabel (ordinal = ordnet) Kategorierne har en rækkefølge (Godt vejr) Nominal kategorisk variabel (nominal = navngiven) Kategorierne har ikke en rækkefølge (Favoritfarve)
9 Deskriptiv statistik: Kategoriske variable Kategorisk variable opsummeres typisk i et bar plot Højden af baren svarer til frekvensen (dvs. antallet) af medlemmer af hver kategori
10 Numerisk Variabel Variabel der tager en talværdi. Diskret numerisk variabel Variabel kan tage et tælleligt antal værdier Typisk udtryk for et antal Fx. antal forsikring-anmeldelser på en uge Kontinuert numerisk variabel Variabel kan tage alle værdier i et interval Typisk udtryk for noget man kan måle. Fx. Højde, vægt, tid, afstand. Indkomst?
11 Histogram Numeriske data præsenteres typisk med et histogram Histogrammet inddeler et interval i et passende antal delintervaller For hvert del interval er en kasse, hvis areal er proportional med frekvensen (dvs. antallet) af data i det interval. Frequency Histogram of mitdata$va mitdata$vaegt
12 Percentiler Det P te percentil er den værdi, hvor P% af data ligger under. Antag vi har en stikprøve med n observationer. Antag observationerne er sorterede. Den P te percentil er (ca) givet ved den (n+1)p/100 te observation. Eksempel: Antag n = 75 og P = 25. Find en værdi, så 25% af data ligger under denne værdi. Løsning: Vælg data punkt nr. 76*25/100 = 19
13 Kvartiler Kvartiler inddeler data i kvarte. 1., 2. og 3. kvartil svarer til 25., 50., og 75. percentiler. 25% af data ligger under 1. kvartil (Q 1 ) 50% af data ligger under 2. kvartil (Q 2 ) 75% af data ligger under 3. kvartil (Q 3 ) Frequency Histogram for vægt mitdata$vaegt
14 Boxplot Et boxplot er en grafisk repræsentation af bl.a. kvartiler. Kassen angiver, hvor de midterste 50% af data ligger. Højden på kassen er forskellen mellem 3. kvartil og 1. kvartil, den såkaldte Inter Quartile Range (IQR). Knurhårene strækker sig ud til observationer, der ligger maks 1.5*IQR væk fra kassen. 3. kvartil Observationer, der ligger mere end 1.5*IQR borte kaldes Medianen outliers kvartil Outlier max 1,5*IQR IQR
15 Centralitet og Variation χ χ χ χχ χ χ χ χ χ χχχ χ χ χ 0 0 Centralitet: Mål for hvor data ligger Fx: Median, middelværdi, toppunkt (mode) Variation: Mål for hvor meget data er spredt ud Fx spænd (range), varians, standard afvigelse
16 Centralitet: Median Medianen er værdien af den midterste observation. Medianen er 50% percentilen og 2. kvartil. n = antal observationer n ulige : Medianen = midterste observation n lige : Medianen = gennemsnit af to midterste obs. medianen medianen? 0 χ χ χχχ χ χ 0 χ χ χχχ χ χ Data: 7, 9, 11, 12, 13, 15, 17 n = 7
17 Gennemsnit / Middelværdi Populationsgennemsnit (ukendt) (mean) N x x + x + = = µ = N N i i + x i er værdien for i te medlem i populationen. μ = my Stikprøve-gennemsnit (sample mean) x x + x + x = = = n n = x streg. x n i i + Bemærk: Græske bogstaver betegner det ukendte. x x n N
18 Gennemsnit: Eksempel Stikprøve-gennemsnittet x n x x + x + = = = n n i i + x n Stikprøve-gennemsnittet x = = 12 x =? 0 χ χ χχχ χ χ 0 χ χ χχχ χ χ
19 Eksempel: Vægt Histogram for vægt Minimum 1. kvartil Median Gennemsnit 3. kvartil Maksimum Antal manglende svar Bemærk at vægt-fordelingen er lidt højre-skæv, dvs. fordelingen hælder til højre. Frequency mitdata$vaegt
20 Variansen Variansen er et mål for variationen. Populationsvariansen (ukendt) σ σ = sigma Stikprøve-variansen s ( x ) N 2 i = 1 i µ 2 = 2 De n-1 sikrer at s 2 i gennemsnit er lig σ 2. n N ( x x) i 1 = i= n 1 2
21 Varians: Eksempel Stikprøve-gennemsnit Stikprøve-gennemsnit s 2 n ( x x) 1 = i= n 1 i 2 s (7 12) + (9 12) + (11 12) + (12 12) = , (13 12) 2 + (15 12)? 2 + (17 12) 2 0 χ χ χχχ χ χ? 0 χ χ χχχ χ χ 0 χ χ χχχ χ χ
22 Standardafvigelsen Standardafvigelsen er kvadratroden af variansen Populationens standard afvigelsen (ukendt) σ Stikprøve-standard afvigelsen ( x ) N 2 i = i µ 2 1 = σ = N ( x x) 2 i 1 s = s = = n 1 n i 2
23 R Intro til R
24 R Ifølge wikipedia: R er et open source statstikprogram og programmeringssprog introduceret i Seneste version er R kan downloades på R er i udgangspunktet uden peg-og-klik Mere end 2000 pakker (udvidelser a la et plugin) Senere skal vi bruge en pakke specielt til økonometri I det følgende tager vi udgangspunkt i Windows versionen. Der eksisterer versioner til Mac og Linux.
25 Start R Inden man starter R er det en god ide at lave en arbejdsmappe, hvor man samler datafiler og.r-filer (kommer vi til senere). Når R så er startet, så brug File Change dir til at vælge arbejdsmappen. Nu er vi klar!
26 Ændre default arbejdsmappe Tilføj --sdi
27 Se data I min arbejdsmappe har jeg en data-fil der hedder Sundby95.dat liggende. Hvis jeg åbner data-filen i Notepad ser den sådan ud: Data består af 6 kolonner, der hver svarer til en variabel. Bemærk: Variabelnavnet står øverst i række! Luk Notepad igen ellers går det bare galt ;-)
28 Hent data ind i R Vi er nu klar til vores første kommando! På kommandolinjen skriv: mitdata = read.table( Sundby95.dat, header=true) Dette læser data-filen ind i en tabel med navnet mitdata. Med tilføjelsen header=true har vi angivet at variabel navnet er angivet i øverste række i data-filen. Man kan se indholdet af tabellen mitdata, med flg. kommando: fix(mitdata) Man kan få hjælp ved at skrive?read.table
29 Sådan ser data ud Tænk på tabellen som en matrix med navngivne søjler. Luk Data Editor vinduet for at komme videre
30 Et hurtigt overblik Man kan få en opsummering af tabellen vha. summary(mitdata) Resultat: For kategoriske variable: Frekvenser for hver kategori. For kvalitative variable: Mindste værdi, 1. kvartil, median, middelværdi, 3. kvartil, største værdi, og antal manglende værdier. NA = Not Available manglende observationer.
31 Den enkelte variabel. Man kan se hvilke variable tabellen indeholder vha: Vi vil se nærmere på vægt. Vi kan se indholdet af søjlen med navnet vaegt frem vha. mitdata$vaegt. Gør man det får man listet BMI for alle 2742 deltagere lidt uoverskueligt! Vi kan få et overblik over vægt vha.
32 Et par plot Histogram Frequency Histogram of mitdata$va mitdata$vaegt Boxplot
33 Numeriske opsummeringer Middelværdi R vil ikke udregne gennemsnittet, når der mangler observationer. Percentiler (0%, 25%, 50%, 75%, 100%) Andre percentiler, fx. 5% og 95% Standardafvigelsen
34 Sandsynligheder Hændelser Sandsynligheder Regler for sandsynligheder
35 Udgangspunktet Eksperiment: Handling, der leder frem til et af flere mulige udfald Fx. Kast med en terning Vælg 10 tilfældige virksomheder. Udfald: Observation eller måling Fx: Antal øjne på en terning 10 navngivne virksomheder.
36 Udfaldsrum Udfaldsrummet er mængden af mulige udfald af eksperimentet, S = {O 1,O 2,,O k } Udfaldene skal være udtømmende Eksempler: (exhaustive) Terningkast: S={1,2,3,4,5,6} S={1,2,3,4,5} dur ikke! Møntkast: S={plat, krone} S={plat} dur ikke O i er i te udfald af k mulige. Udfaldene må ikke overlappe Terningkast: S={1,2,3,4,5,6} S={1-2,2-3,3-4,4-5,5-6} dur ikke!
37 Hændelser En simpel hændelse er ett udfald i udfaldsrummet Eksempel: Terningkast en 6 er er en simpel hændelse En hændelse er en delmængde af udfaldsrummet. En hændelse består typisk af mange udfald. Eksempel: Terningkast : A={1,4,6} er en hændelse Hændelser kan indtegnes i et Venn diagram Venn Diagram A 1, 4, 6 2,3,5 S
38 Sandsynlighed En sandsynlighed er et kvantitativt mål for usikkerhed et mål der udtrykker styrken af vores tro på forekomsten af en usikker begivenhed. Sandsynligheden for en hændelse, A, betegnes P(A) En sandsynlighed er et reelt tal mellem 0 og 1. P(A) = 0 : Hændelsen A sker aldrig P(A) = 1 : Hændelsen A sker altid Ex: Sandsynligheden for regn i morgen er 0,5 Ex: Sandsynligheden for at få 7 rigtige i lotto er 0,
39 Klassisk Sandsynlighed Antag at alle udfald forekommer med lige stor sandsynlighed. Da er sandsynligheden for en hændelse A givet ved: hvor N A er antal udfald i hændelsen A. N er antal udfald i udfaldsrummet S. P ( A) = N N A Eksempel: Terningkast lige sandsynlighed for alle udfald. Lad A={1,2,4} N A = 3 N = 6 P(A) = 3/6 = 0.5
40 Regler for sandsynlighed Givet et udfaldsrum S={O 1, O 2,, O k } da skal sandsynlighederne opfylde: 1) For enhver hændelse A i udfaldsrummet S 0 P( A) 1 Dvs. sandsynligheden for en hændelse er et tal mellem 0 og 1. 2) For enhver hændelse A i udfaldsrummet S P ( A) = P( O ) O A Dvs. sandsynligheden for en hændelse er summen af sandsynlighederne for de simple hændelser indeholdt i A. 3) P(S) = 1 Dvs summen af sandsynlighederne for alle simple hændelser i ufaldsrummet er 1. i i
41 Komplimentærmængden Komplementet af en mængde A, er mængden Ā, der indeholder alle elementer i S, der ikke er i A. Eksempel: S={1,2,3,4,5,6} og A={1,4,6}. Så er Ā={2,3,5} A 1, 4, 6 Ā 2,3,5 S Spørgsmål: Antag vi kender P(A). Find P(Ā) =
42 Fællesmængden Fællesmængden af A og B, A B, er mængden, der indeholder de elementer, der er i både A og B A A B 1, 2 3 4, 5 B 6 S Eksempel: A = {1,2,3}, hændelsen at vi slår 1,2 eller 3 øjne. B = {3,4,5}, hændelsen at vi slår 3,4 eller 5 øjne. A B, hændelsen at både A og B indtræffer. A B = {3}
43 Foreningsmængden Foreningsmængden af A og B, A U B, er mængden, der indeholder de elementer, der er i A eller B eller begge S A 1, 2 3 4, 5 B 6 A U B Eksempel: A = {1,2,3}, hændelsen at vi slår 1,2 eller 3 øjne. B = {3,4,5}, hændelsen at vi slår 3,4 eller 5 øjne. A B, hændelsen at A og/eller B indtræffer. A B = {1,2,3,4,5}
44 Spørgsmål Antag vi kender følgende sandsynlighed P(A) P(B) P(A B) Hvad er sandynligheden for A B P(A B ) = A A B 1, 2 3 4, 5 B 6 S
45 Den tomme mængde Den tomme mængde betegnes Ø P(Ø) = To mængder er disjunkte, hvis fællesmængden A B=Ø A={1,2,3} B={4,5} A B={Ø} A 1, 2, 3 4, 5 6 B S Dvs to disjunkte hændelser ikke kan indtræffe på samme tid (mutually exclusive). Antag A B=Ø. Hvad er da P(A B) =?
Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Introduktion Kasper K. Berthelsen, Inst f. Matematiske Fag Omfang: 8 Kursusgang I fremtiden
Læs mereStatistik. Introduktion Deskriptiv statistik Sandsynslighedregning
Statistik Introduktion Deskriptiv statistik Sandsynslighedregning Introduktion Kasper K. Berthelsen, Institut f. Mat. Fag 8 Kursusgange Individuel mundtlig eksamen (7-skala) Udgangspunkt i opgaver Software:
Læs mereStatistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Introduktion Kursusholder: Kasper K. Berthelsen Opbygning: Kurset består af 5 blokke En blok består af: To normale
Læs mereR / RStudio. Intro til R / RStudio
R / RStudio Intro til R / RStudio R R er et open source statstikprogram og programmeringssprog introduceret i 1993. Seneste version er 2.15.3 R kan downloades på www.r-project.org R er i udgangspunktet
Læs mereSandsynligheder. Mængder Hændelser Sandsynligheder Regler for sandsynligheder
Sandsynligheder Mængder Hændelser Sandsynligheder Regler for sandsynligheder Sandsynligheder En sandsynlighed er et kvantitativt mål for usikkerhed et mål der udtrykker styrken af vores tro på forekomsten
Læs mereStatistik. Hjemmeside: kkb. Statistik - lektion 1 p.1/22
Statistik Kursets omfang: 2 ECTS Inklusiv mini-projekt! Bog: Complete Business Statistics, AD Aczel & J. Sounderpandian Software: SPSS eller Excel?? Forelæser: Kasper K. Berthelsen E-mail: kkb@math.aau.dk
Læs mereKvantitative Metoder 1 - Forår 2007. Dagens program
Dagens program Kapitel 7 Introduktion til statistik Organisering af data Diskrete variabler Kontinuerte variabler Beskrivende statistik Fraktiler Gennemsnit Empirisk varians og spredning Empirisk korrelationkoe
Læs mereBinomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/
Program: 1. Repetition af vigtige sandsynlighedsfordelinger: binomial, (Poisson,) normal (og χ 2 ). 2. Populationer og stikprøver 3. Opsummering af data vha. deskriptive størrelser og grafer. 1/29 Binomial
Læs mereDefinition. Definitioner
Definition Landmålingens fejlteori Lektion Diskrete stokastiske variable En reel funktion defineret på et udfaldsrum (med sandsynlighedsfordeling) kaldes en stokastisk variabel. - kkb@math.aau.dk http://people.math.aau.dk/
Læs mereVIGTIGT! Kurset består af: 1. Forelæsninger. 2. Øvelser. 3. Litteraturlæsning
Intro til statistik Rasmus F. Brøndum, Institut 17 (Matematik) Hjemmeside: people.math.aau.dk/~froberg 22 forelæsninger (hvor af jeg afholder de første 13) + det samme antal øvelsesgange. Hjælpelærer:
Læs mereAnvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger
Anvendt Statistik Lektion 2 Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Sandsynlighed: Opvarmning Udfald Resultatet af et eksperiment kaldes et udfald. Eksempler:
Læs mereUniversity of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version
university of copenhagen University of Copenhagen Notat om statistisk inferens Larsen, Martin Vinæs Publication date: 2014 Document Version Peer-review version Citation for published version (APA): Larsen,
Læs mereBilledbehandling og mønstergenkendelse: Lidt elementær statistik (version 1)
; C ED 6 > Billedbehandling og mønstergenkendelse Lidt elementær statistik (version 1) Klaus Hansen 24 september 2003 1 Elementære empiriske mål Hvis vi har observationer kan vi udregne gennemsnit og varians
Læs mere3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve
Læs mereAnvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger
Anvendt Statistik Lektion 2 Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Sandsynlighed: Opvarmning Udfald Resultatet af et eksperiment kaldes et udfald. Eksempler:
Læs mereStatistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller
Statistik II 1. Lektion Sandsynlighedsregning Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller
Læs mere1 Sandsynlighed Sandsynlighedsbegrebet Definitioner Diskret fordeling Betinget sandsynlighed og uafhængighed...
Indhold 1 Sandsynlighed 1 1.1 Sandsynlighedsbegrebet................................. 1 1.2 Definitioner........................................ 2 1.3 Diskret fordeling.....................................
Læs mereNormalfordelingen og Stikprøvefordelinger
Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger
Læs mereProdukt og marked - matematiske og statistiske metoder
Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring
Læs mereStatistik Lektion 2. Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var.
Statistik Lektion Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var. Repetition Stikprøve Stikprøvestørrelse n Stikprøvemiddelværdi Stikprøvevarians s Population
Læs mereKursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte
Læs mereStatistik Lektion 2. Betinget sandsynlighed Bayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV Binomialfordelingen
Statistik Lektion etinget sandsynlighed ayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV inomialfordelingen Repetition Udfaldsrum S Hændelse S Simpel hændelse O i 1, 3 4,
Læs mereKursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte
Læs mere2011.09.20 lth@campus.dk
2011.09.20 lth@campus.dk Intro Læseplan Beskrivende Statistik Sandsynligheder Ordet kommer fra Latin.: statisticum (statsrådgiver) Italiensk.: statistica (statsmand / politiker) Hvorfor statistik? Træk
Læs mereEx µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4. hvor. Vha. R: Vha. tabel:
Normal fordeling Tæthedsfunktion for normalfordeling med middelværdi µ og varians σ 2 : Program (8.15-10): f() = 1 µ)2 ep( ( 2πσ 2 2σ 2 ) E µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4 1. vigtige sandsynlighedsfordelinger:
Læs mereStatistik. Peter Sørensen: Statistik og sandsynlighed Side 1
Statistik Formålet... 1 Mindsteværdi... 1 Størsteværdi... 1 Ikke grupperede observationer... 2 Median og kvartiler defineres ved ikke grupperede observationer således:... 2 Middeltal defineres ved ikke
Læs mereDeskriptiv statistik for hf-matc
Deskriptiv statistik for hf-matc 75 50 25 2018 Karsten Juul Deskriptiv statistik for hf-matc Hvad er deskriptiv statistik? 1.1 Hvad er deskriptiv statistik?... 1 1.2 Hvad er grupperede og ugrupperede data?...
Læs mereProgram: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.
Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. 1/23 Opsummering af fordelinger X 1. Kendt σ: Z = X µ σ/ n N(0,1)
Læs mereKvantitative Metoder 1 - Forår 2007
Dagens program Kapitel 8.7, 8.8 og 8.10 Momenter af gennemsnit og andele kap. 8.7 Eksempel med simulationer Den centrale grænseværdisætning (Central Limit Theorem) kap. 8.8 Simulationer Normalfordelte
Læs mereStatistik noter - Efterår 2009 Keller - Statistics for management and economics
Statistik noter - Efterår 2009 Keller - Statistics for management and economics Jonas Sveistrup Hansen - stud.merc.it 22. september 2009 1 Indhold 1 Begrebsliste 3 2 Forelæsning 1 - kap. 1-3 3 2.1 Kelvin
Læs mere4 Oversigt over kapitel 4
IMM, 2002-09-14 Poul Thyregod 4 Oversigt over kapitel 4 Introduktion Hidtil har vi beskæftiget os med data. Når data repræsenterer gentagne observationer (i bred forstand) af et fænomen, kan det være bekvemt
Læs mereKursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet March 1, 2013 Sandsynlighedsregning og lagerstyring Normalfordelingen
Læs mereForelæsning 1: Intro og beskrivende statistik
Kursus 02402 Introduktion til Statistik Forelæsning 1: Intro og beskrivende statistik Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby
Læs mereForelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)
Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske
Læs mereDeskriptiv statistik for matc i stx og hf
Deskriptiv statistik for matc i stx og hf 75 50 25 2019 Karsten Juul Deskriptiv statistik for matc i stx og hf Hvad er deskriptiv statistik? 1.1 Hvad er deskriptiv statistik?... 1 1.2 Hvad er grupperede
Læs mereSandsynlighedsregning: endeligt udfaldsrum (repetition)
Program: 1. Repetition: sandsynlighedsregning 2. Sandsynlighedsregning fortsat: stokastisk variabel, sandsynlighedsfunktion/tæthed, fordelingsfunktion. 1/16 Sandsynlighedsregning: endeligt udfaldsrum (repetition)
Læs mereProgram. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18
Program 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Fordeling af X Stikprøve X 1,X 2,...,X n stokastisk X stokastisk. Ex (normalfordelt stikprøve)
Læs mereOversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable
Kursus 02402 Introduktion til Statistik Forelæsning 2: Kapitel 4, Diskrete fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs mereForelæsning 2: Kapitel 4, Diskrete fordelinger
Kursus 02402 Introduktion til Statistik Forelæsning 2: Kapitel 4, Diskrete fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs meret-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.
t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program (8.15-10): 1. repetition: fordeling af observatorer X, S 2 og t. 2. konfidens-intervaller, hypotese test, type I og type II fejl, styrke,
Læs mereOversigt. Kursus 02402 Introduktion til Statistik. Forelæsning 1: Intro og beskrivende statistik. Per Bruun Brockhoff. Praktisk Information
Kursus 02402 Forelæsning 1: Intro og beskrivende statistik Oversigt 1 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:
Læs mere1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable
Landmålingens fejlteori - lidt om kurset Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet Kursusholder
Læs mereStikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader
Stikprøver og stikprøve fordelinger Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Statistik Statistisk Inferens: Prediktere og forekaste værdier af
Læs mereStatistik II 1. Lektion. Analyse af kontingenstabeller
Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression
Læs mereDeskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium
Deskriptiv (beskrivende) statistik er den disciplin, der trækker de væsentligste oplysninger ud af et ofte uoverskueligt materiale. Det sker f.eks. ved at konstruere forskellige deskriptorer, d.v.s. regnestørrelser,
Læs mereKonfidensintervaller og Hypotesetest
Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller
Læs mereLandmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable
Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet 1/41 Landmålingens fejlteori - lidt om kurset
Læs mereModul 2: Sandsynlighedsmodeller og diskrete stokastiske variable
Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 2: Sandsynlighedsmodeller og diskrete stokastiske variable 2.1 Sandsynlighedsbegrebet............................... 1 2.1.1
Læs mereTema. Dagens tema: Indfør centrale statistiske begreber.
Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i
Læs mereSandsynlighedsregning og statistik
og statistik Jakob G. Rasmussen, Institut for Matematiske Fag jgr@math.aau.dk Litteratur: Walpole, Myers, Myers & Ye: Probability and Statistics for Engineers and Scientists, Prentice Hall, 8th ed. Slides
Læs mereLøsning til eksamen d.27 Maj 2010
DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1
Læs mereKursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff
Kursus 02402 Introduktion til Statistik Forelæsning 13: Summary Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:
Læs mereAnvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af
Læs mereNote om Monte Carlo metoden
Note om Monte Carlo metoden Kasper K. Berthelsen Version 1.2 25. marts 2014 1 Introduktion Betegnelsen Monte Carlo dækker over en lang række metoder. Fælles for disse metoder er, at de anvendes til at
Læs mereTema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.
Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller
Læs mereNanostatistik: sandsynligheder Kursushjemmeside: http://www.imf.au.dk/ kurser/nanostatistik/
Nanostatistik: sandsynligheder Kursushjemmeside: http://www.imf.au.dk/ kurser/nanostatistik/ JLJ Nanostatistik: sandsynlighederkursushjemmeside:http://www.imf.au.dk/kurser/nanostatistik/ p. 1/16 Højder
Læs mereTrin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse
Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ
Læs mereElementær sandsynlighedsregning
Elementær sandsynlighedsregning Sandsynlighedsbegrebet Et udfaldsrum S er mængden af alle de mulige udfald af et eksperiment. En hændelse A er en delmængde af udfaldsrummet S. Et sandsynlighedsmål er en
Læs mere5. Statistik. Hayati Balo,AAMS. 1. Carstensen, Frandsen og Studsgaard, stx mat B2, systime
5. Statistik Hayati Balo,AAMS Følgende fremstilling er baseret på 1. Carstensen, Frandsen og Studsgaard, stx mat B2, systime 1. Ugrupperede Observationer Hvis der foreligger et antal målinger eller observationer
Læs mereKapitel 3 Centraltendens og spredning
Kapitel 3 Centraltendens og spredning Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 25 Indledning I kapitel 2 omsatte vi de rå data til en tabel, der bedre viste materialets fordeling
Læs mereIndblik i statistik - for samfundsvidenskab
Indblik i statistik - for samfundsvidenskab Læs mere om nye titler fra Academica på www.academica.dk Nikolaj Malchow-Møller og Allan H. Würtz Indblik i statistik for samfundsvidenskab Academica Indblik
Læs mereMM501 forelæsningsslides
MM501 forelæsningsslides uge 40, 2010 Produceret af Hans J. Munkholm bearbejdet af JC 1 Separabel 1. ordens differentialligning En generel 1. ordens differentialligning har formen s.445-8 dx Eksempler
Læs mereNanostatistik: Opgaver
Nanostatistik: Opgaver Jens Ledet Jensen, 19/01/05 Opgaver 1 Opgaver fra Indblik i Statistik 5 Eksamensopgaver fra tidligere år 11 i ii NANOSTATISTIK: OPGAVER Opgaver Opgave 1 God opgaveskik: Når I regner
Læs mereGrupperede observationer et eksempel. (begreber fra MatC genopfriskes og varians og spredning indføres)
Grupperede observationer et eksempel. (begreber fra MatC genopfriskes og varians og spredning indføres) Til Gribskovløbet 006 gennemførte 118 kvinder 1,4 km distancen. Fordelingen af kvindernes løbstider
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Introduktion 1 Formelt Lærere: Esben Budtz-Jørgensen Jørgen Holm Petersen Øvelseslærere: Berivan+Kathrine, Amalie+Annabell Databehandling: SPSS
Læs mereStatistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen
Statistik Lektion 3 Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen Repetition En stokastisk variabel er en funktion defineret på S (udfaldsrummet, der antager
Læs mereDagens program. Afsnit 1.1-1.3 Eksperimenter med usikkerhed Sandsynlighedsmodel - Udfaldsrum - Hændelser - Sandsynligheder Eksempler
Dagens program Afsnit 1.1-1.3 Eksperimenter med usikkerhed Sandsynlighedsmodel - Udfaldsrum - Hændelser - Sandsynligheder Eksempler 1 Sandsynlighedsmodel Kvantitative Metoder 1 - Efterår 2006 Eksperiment
Læs mereOversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger
Introduktion til Statistik Forelæsning 2: og diskrete fordelinger Oversigt 1 2 3 Fordelingsfunktion 4 Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 017 Danmarks Tekniske Universitet 2800
Læs mereStatistik (deskriptiv)
Statistik (deskriptiv) Ikke-grupperede data For at behandle ikke-grupperede data i TI, skal data tastes ind i en liste. Dette kan gøres ved brug af List, hvis ikon er nr. 5 fra venstre på værktøjsbjælken
Læs mereElementær sandsynlighedsregning
Elementær sandsynlighedsregning Sandsynlighedsbegrebet Et udfaldsrum S er mængden af alle de mulige udfald af et eksperiment. En hændelse A er en delmængde af udfaldsrummet S. Den hændelse, der ikke indeholder
Læs mereBasal statistik. 30. januar 2007
Basal statistik 30. januar 2007 Deskriptiv statistik Typer af data Tabeller Grafik Summary statistics Lene Theil Skovgaard, Biostatistisk Afdeling Institut for Folkesundhedsvidenskab, Københavns Universitet
Læs mereHvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05
Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ
Læs mereModule 1: Data og Statistik
Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen og Hans Chr. Petersen Module 1: Data og Statistik 1.1 Hvad er statistik?................................... 1 1.2 Datatyper.......................................
Læs mereLøsning eksamen d. 15. december 2008
Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Læs mereProdukt og marked - matematiske og statistiske metoder
Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 11, 2016 1/22 Kursusindhold: Sandsynlighedsregning og lagerstyring
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Introduktion 1 Formelt Lærer: Jørgen Holm Petersen Øvelseslærere: Amalie og Marie Databehandling: SPSS Eksamen: Ugeopgave efterfulgt af mundtlig
Læs mereOversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.
Kursus 242 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik Bygning 35/324 Danmarks Tekniske Universitet 28 Lyngby Danmark e-mail:
Læs mereKapitel 7 Forskelle mellem centraltendenser
Kapitel 7 Forskelle mellem centraltendenser Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 29 Indledning 1. z-test for ukorrelerede data 2. t-test for ukorrelerede data med ens
Læs mereHvorfor er det lige at vi skal lære det her?
Lektion 8 Stokastiske variable En stokastisk variabel er en afbildning af udfaldsrummet ind i de reelle tal. Man benytter ofte store bogstaver som X, Y og Z til at betegne en stokastisk variabel. Ved at
Læs mereBilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen
Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Microsoft Excel har en del standard anvendelsesmuligheder i forhold til den beskrivende statistik og statistisk
Læs mereBeskrivende statistik
Beskrivende statistik Stikprøve af størrelse n for variablen x: x 1, x 2,, x n Beskriv fordelingen af data med nogle få talstørrelser. Centralt mål: en værdi som data er centreret om. Variationsmål: mål
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs mereForelæsning 3: Kapitel 5: Kontinuerte fordelinger
Kursus 02402 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs mereStatistiske modeller
Statistiske modeller Statistisk model Datamatrice Variabelmatrice Hændelse Sandsynligheder Data Statistiske modeller indeholder: Variable Hændelser defineret ved mulige variabel værdier Sandsynligheder
Læs mere2 Populationer. 2.1 Virkelige populationer
2 Populationer I en statistisk sammenhæng er en population en samling af elementer, fx personer, virksomheder, lande, kunder eller mere abstrakte objekter. Fra en population kan man udtage en stikprøve.
Læs mereNanostatistik: Stokastisk variabel
Nanostatistik: Stokastisk variabel JLJ Nanostatistik: Stokastisk variabel p. 1/34 Repetition Ω: udfaldsrummet: alle de mulige udfald af et experiment P(A): ss for hændelsen A = frekvens i uafhængige gentagelser
Læs mereBasal statistik. 2. september 2008
Basal statistik 2. september 2008 Deskriptiv statistik Grafik Summary statistics Normalfordelingen Typer af data Esben Budtz-Jørgensen, Biostatistisk Afdeling Institut for Folkesundhedsvidenskab, Københavns
Læs mereLad os som eksempel se på samtidigt kast med en terning og en mønt:
SANDSYNLIGHEDSREGNING Stokastisk eksperiment Et stokastisk eksperiment er et eksperiment, hvor vi fornuftigvis ikke på forhånd kan have en formodning om resultatet af eksperimentet Til gengæld kan vi prøve
Læs mereStatistik og Sandsynlighedsregning 2
Statistik og Sandsynlighedsregning 2 Sandsynlighedstætheder og kontinuerte fordelinger på R Helle Sørensen Uge 6, mandag SaSt2 (Uge 6, mandag) Tætheder og kont. fordelinger 1 / 19 Program Velkommen I dag:
Læs merePersonlig stemmeafgivning
Ib Michelsen X 2 -test 1 Personlig stemmeafgivning Efter valget i 2005 1 har man udspurgt en mindre del af de deltagende, om de har stemt personligt. Man har svar fra 1131 mænd (hvoraf 54 % har stemt personligt
Læs mereNanostatistik: Stokastisk variabel
Nanostatistik: Stokastisk variabel JLJ Nanostatistik: Stokastisk variabel p. 1/29 Repetition Ω: udfaldsrummet: alle de mulige udfald af et experiment P(A): ss for hændelsen A = frekvens i uafhængige gentagelser
Læs mereAnvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele
Anvendt Statistik Lektion 4 Hypotesetest generelt Test for middelværdi Test for andele Hypoteser og Test Hypotese I statistik er en hypotese en påstand om en populationsparameter. Typisk en påstand om
Læs mereKvantitative Metoder 1 - Forår Dagens program
Dagens program Kontinuerte fordelinger Ventetider i en Poissonproces Beskrivelse af kontinuerte fordelinger: - Median og kvartiler - Middelværdi - Varians Simultane fordelinger 1 Ventetider i en Poissonproces
Læs mereKursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 9, 2015 Sandsynlighedsregning og lagerstyring Normalfordelingen
Læs mereI dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)
I dag Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt) Helle Sørensen Repetition vha eksempel om dagligvarepriser Analyse med R: ttest
Læs mereWORKSHOP 2C, DLF-kursus, Krogerup, 26. november 2015
WORKSHOP 2C, DLF-kursus, Krogerup, 26. november 2015 At I får overblik over statistik og sandsynlighed som fagområde i folkeskolen indblik i didaktiske forskeres anbefalinger til undervisningen i statistik
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Introduktion 1 Formelt Lærer: Jørgen Holm Petersen Øvelseslærere: Signe, Helene, Marie, Amalie Databehandling: SPSS Eksamen: Ugeopgave efterfulgt
Læs mere2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900.
2 -fordeling og 2 -test Generelt om 2 -fordelingen 2 -fordelingen er en kontinuert fordeling, modsat binomialfordelingen som er en diskret fordeling. Fordelingen er særdeles kompleks at beskrive med matematiske
Læs mere