2 Stikprøvebegrebet 8. 3 Gruppering og frekvenstabeller Gruppering Frekvenstabeller Bargraf... 10
|
|
- Pernille Frederiksen
- 7 år siden
- Visninger:
Transkript
1 Indhold 1 Dataformater, indlæsning og editering Data Indlæsning af tekstfil i Rcmdr Data typer Omkodning af variable Hjælpesider Stikprøvebegrebet 8 3 Gruppering og frekvenstabeller Gruppering Frekvenstabeller Bargraf Histogram - kvantitativ variabel Tæthedsfunktion Summarisk beskrivelse af kvantitative variable Centermål: Middelværdi og median Spredningsmål: rækkevidde, standardafvigelse og varians Percentiler Median, kvartiler og interquartile range Boxplot - kvantitativ variabel faktorer: Krydstabulering kvantitative variable: Scatterplot 18 9 Populationsparametre Gem din analyse 19 1
2 1 Dataformater, indlæsning og editering 1.1 Data Dataeksempel Description Thirty magazines were ranked by educational level of their readers. According to rank three magazines were randomly selected from the first ten(group 1 - highest educational level), the second ten(group 2 - medium educational level), and third ten magazines(group 3 - lowest educational level). Six advertisements were randomly selected from each of the nine selected magazines. The magazines were 1. Scientific American (GROUP 1). 2. Fortune (GROUP 1). 3. The New Yorker (GROUP 1). 4. Sports Illustrated (GROUP 2). 5. Newsweek (GROUP 2). 6. People (GROUP 2). 7. National Enquirer (GROUP 3). 8. Grit (GROUP 3). 9. True Confessions (GROUP 3). Dataeksempel Data For each advertisement (54 cases), the data below were observed. Variable Names: 1. WDS = number of words in advertisement copy 2. SEN = number of sentences in advertisement copy 2
3 3. 3SYL = number of 3+ syllable words in advertisement copy 4. MAG = magazine (1 through 9 as above) 5. GRP = educational level (as above) Tekstfil: magazineads.dat Data Import Data from text file or clipboard... Regneark Data Import Data from Excel,Access or dbase dataset... 3
4 1.2 Indlæsning af tekstfil i Rcmdr Indlæs magazineads.dat Data Import Data from text file or clipboard... giver en dialogboks 4
5 Vi skal angive navnet på den dataramme, som oprettes i R-sessionen. Derudover skal vi specificere dataformatet, fex at kolonnerne er adskilt af White space. Når vi klikker OK åbnes et vindue, hvor vi kan specificere stien til magazineads.dat. DataEditor Et klik på Edit Data set åbner vinduet Variabelnavne står i første linie. Bemærk at disse ikke må starte med et ciffer. R smækker et X foran 3SYL. 5
6 1.3 Data typer Data typer Kvantitative variable Mange data fremkommer på en af følgende måder Kontinuerte variable: målinger af fex ventetider i en kø, omsætning, aktiekurser, osv Diskrete variable: antalstællinger af fex ord i tekst, hits på en hjemmeside, antal ankomster til en kø i løbet af en time, osv Målingerne er knyttet til en veldefineret skala og kodes i R som typen numeric. Det er vigtigt at kunne skelne mellem diskrete tællevariable og kontinuerte variable, idet dette ofte er afgørende for, hvordan vi vælger at beskrive usikkerheden på en måling. Data typer Kategoriske/kvalitative data Målingen består i en klassifikation i forhold til et sæt givne kategorier, fex køn, hårfarve, socialgruppe, tilfredsheds-score, etc. Målingerne kodes normalt - hvilket jeg anbefaler - i R som datatypen factor. De mulige kategorierfex mand/kvinde - kaldes for faktorens niveauer(levels). Faktorer har to såkaldte skalaer. Nominal skala: Der er ingen naturlig ordning af faktorens niveauer - eksempelvis køn, virksomhedstype Ordinal skala: Der er naturlig ordning af faktorens niveauer - eksempelvis socialgruppe og tilfredsheds-score. En factor i R kan tildeles en såkaldt attribut, som fortæller om den er ordinal. 1.4 Omkodning af variable Numeric til factor Data Manage variables in active data set Recode variables... 6
7 hvor vi opnår at GROUP som før var af typen numeric bliver nu af typen factor, som har 3 niveauer. De numeriske værdier erstattes af mere informative labels, som angiver uddannelsesniveauet. 1.5 Hjælpesider Hjælpesider Hvis vi klikker på Help-knappen i Recode Variables vinduet fås en detaljeret beskrivelse af mulighederne for omkodning af variable. 7
8 2 Stikprøvebegrebet Stikprøve I det foregående eksempel udvalgtes i hvert magasin 6 annoncer. En yderst vigtig detalje er, at udvælgelsen foregår helt tilfældigt, dvs alle annoncer har lige stor chance for at blive udvalgt. I det følgende er det en helt grundliggende præmis, at dataindsamlingen respekterer dette tilfældighedsprincip og vi vil i så fald tale om en stikprøve. Mere formelt: Vi har en population af objekter - fex annoncer. Vi vælger helt tilfældigt n af disse objekter, og på det j te objekt foretager vi målingen y j, j = 1, 2,..., n. Målingerne y 1, y 2,..., y n kaldes da en stikprøve. Mere generelt: Populationen kan være uendelig stor. Hvis vi fex skal lave 4 vandkvalitetsmålinger på et år, så kan det være en dårlig ide, hvis man kun vil indsamle data i godt vejr. Valg af tidspunkt må ikke være influeret af faktorer, som kan have indflydelse på målingen. 8
9 3 Gruppering og frekvenstabeller 3.1 Gruppering Data Manage variables in active data set Bin numeric variable... Vi vælger 4 intervaller(bins). Den nye variabel er en factor, hvor niveauerne navngives med intervalendepunkterne. Punkterne vælges så de danner 4 naturlige klynger. 3.2 Frekvenstabeller Statistics Summaries Frequency Distributions... Vi vælger variablen stavgte3 og ønsker at se frekvenser(antal observationer) og relative frekvenser(procentuel andel) på factorens 4 niveauer. 9
10 Resultatet kan ses i Rcmdr s outputvindue, hvor man kan se at godt 40% af observationerne ligger mellem 8 og Bargraf Graphs Bar graph... I stedet for tabellen kan vi illustrere denne ved for hvert niveau af faktoren at tegne en kasse hvis højde er proportional med frekvensen. Frequency [0,8] (8,18] (18,29] (29,43] stav3gte 10
11 4 Histogram - kvantitativ variabel Indbygget dataramme Vi skal kigge på et datasæt som er indbygget i R. Vi vælger pakken car og datasættet Ericksen, som vi også giver navnet Ericksen. The Ericksen data frame has 66 rows and 9 columns. The observations are 16 large cities, the remaining parts of the states in which these cities are located, and the other U. S. states. Data Data in packages Read dataset from an attached package... Datarammen Ericksen This data frame contains the following columns: minority Percentage black or Hispanic. crime Rate of serious crimes per 1000 population. poverty Percentage poor. language Percentage having difficulty speaking or writing English. highschool Percentage age 25 or older who had not finished highschool. housing Percentage of housing in small, multiunit buildings. city A factor with levels: city, major city; state, state or state-remainder. conventional Percentage of households counted by conventional personal enumeration. undercount Preliminary estimate of percentage undercount. 11
12 Vi kigger på crime rates i USA. Graphs Histogram... frequency Ericksen$crime 1. Inddel intervallet fra Minimum til Maximum i et passende antal lige store delintervaller. 2. Tegn kasser over hvert delinterval med højde svarende til antal observationer i delintervallet. 4.1 Tæthedsfunktion Når observationsantallet vokser Når vi tegner et histogram, hvor arealet af hver kasse svarer til den relative frekvens, så vil det samlede areal være en. Når observationsantallet vokser, så kan vi forfine inddelingen og får et mere glat forløb. Histogram af 50 observationer Histogram af 500 observationer Histogram af population I teorien kan vi forestille os uendeligt mange observationer, som giver en pæn glat kurve, hvor arealet under kurven er 1. En funktion hvis graf fremkommer på denne måde kaldes en tæthedsfunktion. taethed taethed taethed varvalue varvalue varvalue 12
13 Former på tætheder Symmetrisk tæthed U formet Symmetrisk tæthed Klokkeformet tæhed tæthed x x Højreskæv tæthed Venstreskæv tæthed tæthed tæthed x x 5 Summarisk beskrivelse af kvantitative variable Dataeksempel Vi vender tilbage til eksemplet med annoncer. Statistics Summaries Numerical summaries... 13
14 Vi vælger en variabel af numerisk type og holder os ellers til default. Man kan også specificere andre typer af fraktiler(quantiles). 5.1 Centermål: Middelværdi og median De observerede værdier af variablen WDS er y 1 = 203, y 2 = 229,..., y n = 208, hvor der ialt er n = 54 værdier. Dette er som tidligere defineret en stikprøve. Centermål Mean= er gennemsnittet af stikprøven: n ȳ = 1 n i=1 y i En anden betegnelse er (empirisk) middelværdi. Median=95.5 er 50-percentilen, dvs den værdi som deler stikprøven i 2 lige store grupper. 14
15 5.2 Spredningsmål: rækkevidde, standardafvigelse og varians Spredningsmål Variansen er - praktisk talt - gennemsnittet af de kvadrerede afvigelser fra middelværdien og kaldes (empirisk) varians. s 2 = 1 n 1 n (y i ȳ) 2 sd=standard afvigelsen(deviance)=s = s 2 = kaldes på dansk også (empirisk) spredning. Ud over dette angives ofte rækkeviden(range), som er forskellen på største og mindste værdi. i=1 5.3 Percentiler p te percentil: Højst p% af populationen under denne værdi og højst (100-p)% af populationen over denne værdi Vi ordner data i stigende rækkefølge y (1) = 31, y (2) = 32, y (3) = 34,..., y (n) = 230 p te percentilen, når p=5 og n=54: Vi beregner obsnr = p (n + 1) = 2.75, dvs 5-percentilen skal svare til observation nummer og skal være et sted mellem observationerne x (k) = 32 og x (k+1) = 34, hvor k = 2 < obsnr < 3. Lad d = obsnr k = En af flere metoder til estimat af 5-percentilen: x (k) + d(x (k+1) x (k) ) = =
16 5.4 Median, kvartiler og interquartile range Median: 50-percentilen kaldes som sagt medianen og er et centralitetsmål. 0-percentilen=31 er den mindste værdi, dvs minimum. 25-percentilen=69 kaldes nedre kvartil. 75-percentilen=201.5 kaldes øvre kvartil. 100-percentilen=230 er den største værdi, dvs maximum. Interquartile Range(IQR): er et spredningsmål givet ved forskellen på øvre og nedre kvartil: = Boxplot - kvantitativ variabel Box plots with fences/whiskers 1. Beregn median, nedre og øvre kvartil. 2. Plot en linie ved medianen og tegn en kasse mellem øvre og nedre kvartil. 3. Beregn interquartile range og kald det IQR. Beregn følgende værdier: L1 = nedre kvartil - 1.5*IQR L2 = nedre kvartil - 3.0*IQR U1 = øvre kvartil + 1.5*IQR U2 = øvre kvartil + 3.0*IQR 4. Tegn en linie fra nedre kvartil til det mindste datapunkt, som er større end L1. Tilsvarende, Tegn en linie fra øvre kvartil til det største datapunkt, som er mindre end U1. 5. Datapunkter mellem L1 og L2/mellem U1 og U2 tegnes som cirkler. Datapunkter mindre end L2/større end U2 markeres med. 16
17 Data: Ericksen Graphs Boxplot... poverty Der er tilsyneladende mere udbredt fattigdom i byerne. En enkelt stat skiller sig markant ud med høj fattigdom. city state city 7 2 faktorer: Krydstabulering Statistics Contingency tables Two-way table... Vi vælger variablene stavgte3 og Group. Vi ønsker at se tabeller over frekvenser og relative frekvenser af antal observationer svarende til kombinationer af de 2 variable. 17
18 Vi har valgt relative frekvenser(column percentages) for hvert af uddannelsesniveauerne. Der er især påfaldende mange annoncer i lavgruppen, som har stavelsesord. 8 2 kvantitative variable: Scatterplot Scatterplot - 2 kvantitative variable Graphs Scatterplot... city city state poverty highschool 18
19 9 Populationsparametre Histogram af 50 observationer Histogram af 500 observationer Histogram af population taethed taethed taethed varvalue varvalue varvalue Når stikprøvestørrelsen vokser, så vil eksempelvis middelværdien efterhånden stabilisere sig omkring en fast værdi, som normalt er ukendt. Værdien kaldes populationens middelværdi. Tilsvarende vil stikprøvens standardafvigelse stabilisere sig om en fast værdi. Værdien kaldes populationens standardafvigelse. Notation: µ(my) betegner populationens middelværdi. σ(lille sigma) betegner populationens standardafvigelse. 10 Gem din analyse Gem dit projekt File Save script... Man kan gemme alle de kommandoer, som har genereret dataanalysen. Kommandoerne gemmes i en asciifil, som nemt kan redigeres og stort set intet fylder på computeren. Hvis man senere har behov for at gentage/videreudvikle dataanalysen, så er dette nemt med File Open script file... 19
Oversigt over emner I 1 Dataformater, indlæsning og editering
Oversigt Oversigt over emner I 1 Dataformater, indlæsning og editering Data Indlæsning af tekstfil i Rcmdr Data typer Omkodning af variable Hjælpesider 2 Stikprøvebegrebet 3 Gruppering og frekvenstabeller
Læs mereStatistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Introduktion Kursusholder: Kasper K. Berthelsen Opbygning: Kurset består af 5 blokke En blok består af: To normale
Læs mereOversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens
Oversigt Oversigt over emner 1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens 2 Konfidensinterval Konfidensinterval for andel Konfidensinterval - normalfordelt stikprøve
Læs mereStatistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Introduktion Kasper K. Berthelsen, Inst f. Matematiske Fag Omfang: 8 Kursusgang I fremtiden
Læs mereKvantitative Metoder 1 - Forår 2007. Dagens program
Dagens program Kapitel 7 Introduktion til statistik Organisering af data Diskrete variabler Kontinuerte variabler Beskrivende statistik Fraktiler Gennemsnit Empirisk varians og spredning Empirisk korrelationkoe
Læs mereBetinget fordeling Uafhængighed. Beregning af forventet tabel Chi-kvadrat teststatistik Chi-kvadrat test. Chi-kvadratfordelingen Agresti - Summary
1 Kontingenstabeller Betinget fordeling Uafhængighed 2 Chi-kvadrat test for uafhængighed Beregning af forventet tabel Chi-kvadrat teststatistik Chi-kvadrat test. Chi-kvadratfordelingen Agresti - Summary
Læs mereStatistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Introduktion Kasper K. Berthelsen, Inst f. Matematiske Fag Omfang: 8 Kursusgang I fremtiden
Læs mere1 Sandsynlighed Sandsynlighedsbegrebet Definitioner Diskret fordeling Betinget sandsynlighed og uafhængighed...
Indhold 1 Sandsynlighed 1 1.1 Sandsynlighedsbegrebet................................. 1 1.2 Definitioner........................................ 2 1.3 Diskret fordeling.....................................
Læs mereSPSS introduktion Om at komme igang 1
SPSS introduktion Om at komme igang 1 af Henrik Lolle, oktober 2003 Indhold Indledning 1 Indgang til SPSS 2 Frekvenstabeller 3 Deskriptive statistikker gennemsnit, standardafvigelse, median osv. 4 Søjlediagrammer
Læs mere1 Regressionsproblemet 2
Indhold 1 Regressionsproblemet 2 2 Simpel lineær regression 3 2.1 Mindste kvadraters tilpasning.............................. 3 2.2 Prædiktion og residualer................................. 5 2.3 Estimation
Læs mereStata datafil Variables og Properties Data typer: Skalære, ordinale, nominelle og dikotome
1 Populationer og stikprøver 2 Data, indlæsning og editering i Stata Stata datafil Variables og Properties Data typer: Skalære, ordinale, nominelle og dikotome 3 Gruppering og frekvenstabeller Gruppering
Læs mereVIGTIGT! Kurset består af: 1. Forelæsninger. 2. Øvelser. 3. Litteraturlæsning
Intro til statistik Rasmus F. Brøndum, Institut 17 (Matematik) Hjemmeside: people.math.aau.dk/~froberg 22 forelæsninger (hvor af jeg afholder de første 13) + det samme antal øvelsesgange. Hjælpelærer:
Læs mereMindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning
1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3
Læs mereStatistik. Introduktion Deskriptiv statistik Sandsynslighedregning
Statistik Introduktion Deskriptiv statistik Sandsynslighedregning Introduktion Kasper K. Berthelsen, Institut f. Mat. Fag 8 Kursusgange Individuel mundtlig eksamen (7-skala) Udgangspunkt i opgaver Software:
Læs mereStatistik (deskriptiv)
Statistik (deskriptiv) Ikke-grupperede data For at behandle ikke-grupperede data i TI, skal data tastes ind i en liste. Dette kan gøres ved brug af List, hvis ikon er nr. 5 fra venstre på værktøjsbjælken
Læs mereKommentarer til øvelser i basalkursus, 2. uge
Kommentarer til øvelser i basalkursus, 2. uge Opgave 2. Vi betragter målinger af hjertevægt (i g) og total kropsvægt (målt i kg) for 10 normale mænd og 11 mænd med hjertesvigt. Målingerne er taget ved
Læs mereIndhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9
Indhold 1 Ensidet variansanalyse 2 1.1 Estimation af middelværdier............................... 3 1.2 Estimation af standardafvigelse............................. 3 1.3 F-test for ens middelværdier...............................
Læs mereBinomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/
Program: 1. Repetition af vigtige sandsynlighedsfordelinger: binomial, (Poisson,) normal (og χ 2 ). 2. Populationer og stikprøver 3. Opsummering af data vha. deskriptive størrelser og grafer. 1/29 Binomial
Læs mereNormalfordelingen og Stikprøvefordelinger
Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger
Læs mere1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ
Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen
Læs mereSPSS appendix SPSS APPENDIX. Box plots. Indlæsning. Faculty of Health Sciences. Basal Statistik: Sammenligning af grupper, Variansanalyse
Faculty of Health Sciences SPSS APPENDIX SPSS appendix Basal Statistik: Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 12. september 2017 med instruktioner til SPSS-analyse svarende til
Læs mereFaculty of Health Sciences. SPSS appendix. Basal Statistik: Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 22.
Faculty of Health Sciences SPSS appendix Basal Statistik: Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 22. januar 2018 1 / 20 SPSS APPENDIX med instruktioner til SPSS-analyse svarende
Læs mereSPSS appendix SPSS APPENDIX. Box plots. Indlæsning. Faculty of Health Sciences. Basal Statistik: Sammenligning af grupper, Variansanalyse
Faculty of Health Sciences SPSS APPENDIX SPSS appendix Basal Statistik: Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 11. februar 2019 med instruktioner til SPSS-analyse svarende til nogle
Læs meregrupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
Læs mereBilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen
Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Microsoft Excel har en del standard anvendelsesmuligheder i forhold til den beskrivende statistik og statistisk
Læs mere1 Populationer og stikprøver 4
Indhold 1 Populationer og stikprøver 4 2 Data, indlæsning og editering i Stata 4 2.1 Stata datafil........................................ 4 2.2 Variables og Properties..................................
Læs mere1 Sammenligning af 2 grupper Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver... 2
Indhold 1 Sammenligning af 2 grupper 2 1.1 Responsvariabel og forklarende variabel......................... 2 1.2 Afhængige/uafhængige stikprøver............................ 2 2 Sammenligning af 2 middelværdier
Læs mereØvelser til basalkursus, 2. uge
Øvelser til basalkursus, 2. uge Opgave 1 Vi betragter igen Sundby95-materialet, og skal nu forbedre nogle af de ting, vi gjorde sidste gang. 1. Gå ind i ANALYST vha. Solutions/Analysis/Analyst. 2. Filen
Læs mereHvad skal vi lave? Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver
Hvad skal vi lave? 1 Sammenligning af 2 grupper Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver 2 Sammenligning af 2 middelværdier Uafhængige stikprøver Uafhængige stikprøver -
Læs mereBasal Statistik - SPSS
Faculty of Health Sciences Basal Statistik - SPSS Begreber. Parrede sammenligninger. Lene Theil Skovgaard 5. september 2017 1 / 16 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides
Læs mereIntroduktion til SPSS
Introduktion til SPSS Øvelserne på dette statistikkursus skal gennemføres ved hjælp af det såkaldte SPSS program. Det er erfaringsmæssigt sådan, at man i forbindelse af øvelserne på statistikkurser bruger
Læs mereKursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff
Kursus 02402 Introduktion til Statistik Forelæsning 13: Summary Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:
Læs mereBasal statistik. 30. januar 2007
Basal statistik 30. januar 2007 Deskriptiv statistik Typer af data Tabeller Grafik Summary statistics Lene Theil Skovgaard, Biostatistisk Afdeling Institut for Folkesundhedsvidenskab, Københavns Universitet
Læs mereGrupperede observationssæt Deskriptiv statistik: Middelværdi, frekvensfordeling, sumkurve, kvartilsæt, boxplot
Grupperede datasæt: Middelværdi, intervalfrekvens og kumuleret frekvens. Bilbestandens alder i 2005 fremgår af følgende tabel. Alder i år ]0;4] ]4;8] ]8;12] ]12;16] ]16;20] ]20;24] Antal i tusinde 401
Læs mereKursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte
Læs mereDeskriptiv statistik for matc i stx og hf
Deskriptiv statistik for matc i stx og hf 75 50 25 2019 Karsten Juul Deskriptiv statistik for matc i stx og hf Hvad er deskriptiv statistik? 1.1 Hvad er deskriptiv statistik?... 1 1.2 Hvad er grupperede
Læs mereHvad skal vi lave? Model med hovedvirkninger Model med vekselvirkning F-test for ingen vekselvirkning. 1 Kovariansanalyse. 2 Sammenligning af modeller
Hvad skal vi lave? 1 Kovariansanalyse Model med hovedvirkninger Model med vekselvirkning F-test for ingen vekselvirkning 2 Sammenligning af modeller 3 Mere generelle modeller PSE (I17) ASTA - 14. lektion
Læs mereDeskriptiv statistik for hf-matc
Deskriptiv statistik for hf-matc 75 50 25 2018 Karsten Juul Deskriptiv statistik for hf-matc Hvad er deskriptiv statistik? 1.1 Hvad er deskriptiv statistik?... 1 1.2 Hvad er grupperede og ugrupperede data?...
Læs mereLøsninger til kapitel 1
Opgave. a) observation hyppighed frekvens kum. frekvens 2,25,25 3,875,325 2 3,875,5 3 3,875,6875 4,625,75 5,625,825 6,,825 7 2,25,9375 8,,9375 9,625, Frekvenser illustreres i et pindediagram,2,8,6,4,2,,8,6,4,2
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Introduktion 1 Formelt Lærere: Esben Budtz-Jørgensen Jørgen Holm Petersen Øvelseslærere: Berivan+Kathrine, Amalie+Annabell Databehandling: SPSS
Læs mere3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve
Læs mereDeskriptiv Statitik. Judith L. Jacobsen, PhD. http://staff.pubhealth.ku.dk/~lts/basal09_1/ jlj@statcon.dk
Deskriptiv Statitik Judith L. Jacobsen, PhD. http://staff.pubhealth.ku.dk/~lts/basal09_1/ jlj@statcon.dk Kursus formål Planlægning af studier selve indsamlingen af data, opstilling af statistiske hypoteser
Læs mereKapitel 3 Centraltendens og spredning
Kapitel 3 Centraltendens og spredning Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 25 Indledning I kapitel 2 omsatte vi de rå data til en tabel, der bedre viste materialets fordeling
Læs mereKursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte
Læs mereEn Introduktion til SAS. Kapitel 5.
En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel
Læs mereModul 1: Beskrivende dataanalyse
Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 1: Beskrivende dataanalyse 1.1 Statistik og dataanalyse............................... 1 1.2 Variable og data...................................
Læs mere1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...
Indhold 1 Statistisk inferens: Hypotese og test 2 1.1 Nulhypotese - alternativ.................................. 2 1.2 Teststatistik........................................ 3 1.3 P-værdi..........................................
Læs mereIkke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test
Ikkeparametriske metoder Repetition Wilcoxon SignedRank Test KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,
Læs mereRepetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable
Normal fordelingen Normal fordelingen Egenskaber ved normalfordelingen Standard normal fordelingen Find sandsynligheder ud fra tabel Transformation af normal fordelte variable Invers transformation Repetition
Læs mereStatistik FSV 4. semester 2014 Øvelser Uge 2: 11. februar
Århus 6. februar 2014 Morten Frydenberg Statistik FSV 4. semester 2014 Øvelser Uge 2: 11. februar Til disse øvelser har I brug for fishoil1.dta, der indeholder data fra det fiskeolie forsøg vi så på ved
Læs mereProdukt og marked - matematiske og statistiske metoder
Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring
Læs mereR / RStudio. Intro til R / RStudio
R / RStudio Intro til R / RStudio R R er et open source statstikprogram og programmeringssprog introduceret i 1993. Seneste version er 2.15.3 R kan downloades på www.r-project.org R er i udgangspunktet
Læs mereEx µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4. hvor. Vha. R: Vha. tabel:
Normal fordeling Tæthedsfunktion for normalfordeling med middelværdi µ og varians σ 2 : Program (8.15-10): f() = 1 µ)2 ep( ( 2πσ 2 2σ 2 ) E µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4 1. vigtige sandsynlighedsfordelinger:
Læs mereStatistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test
Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,
Læs mereGennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP()
Gennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP() John Andersen, Læreruddannelsen i Aarhus, VIA Et kast med 10 terninger gav følgende udfald Fig. 1 Result of rolling 10 dices
Læs mereLog-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres.
Log-lineære modeller Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres. Kontingenstabel Contingency: mulighed/tilfælde Kontingenstabel: antal observationer (frekvenser)
Læs mereKvantitative Metoder 1 - Forår Dagens program
Dagens program Kontinuerte fordelinger Ventetider i en Poissonproces Beskrivelse af kontinuerte fordelinger: - Median og kvartiler - Middelværdi - Varians Simultane fordelinger 1 Ventetider i en Poissonproces
Læs mereKvantitative Metoder 1 - Forår 2007
Dagens program Kapitel 4: Diskrete fordelinger Afsnit 4.1-4.2, 4.7: Bernoulli fordeling Binomial fordeling Store Tals Lov (Laws of Averages, Laws of Large Numbers) 1 Bernoulli fordeling Kvantitative Metoder
Læs mereHvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau
Hvad skal vi lave? 1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ. Teststatistik P-værdi Signifikansniveau 2 t-test for middelværdi Tosidet t-test for middelværdi Ensidet t-test for middelværdi
Læs mereI dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)
I dag Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt) Helle Sørensen Repetition vha eksempel om dagligvarepriser Analyse med R: ttest
Læs mereModule 1: Data og Statistik
Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen og Hans Chr. Petersen Module 1: Data og Statistik 1.1 Hvad er statistik?................................... 1 1.2 Datatyper.......................................
Læs mereIntroduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher
Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Introduktion 1 Formelt Lærer: Jørgen Holm Petersen Øvelseslærere: Signe, Helene, Marie, Amalie Databehandling: SPSS Eksamen: Ugeopgave efterfulgt
Læs mereBeskrivende statistik
Beskrivende statistik Stikprøve af størrelse n for variablen x: x 1, x 2,, x n Beskriv fordelingen af data med nogle få talstørrelser. Centralt mål: en værdi som data er centreret om. Variationsmål: mål
Læs mereOversigt. Kursus 02402 Introduktion til Statistik. Forelæsning 1: Intro og beskrivende statistik. Per Bruun Brockhoff. Praktisk Information
Kursus 02402 Forelæsning 1: Intro og beskrivende statistik Oversigt 1 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:
Læs mereEksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning
1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion
Læs mereDeskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium
Deskriptiv (beskrivende) statistik er den disciplin, der trækker de væsentligste oplysninger ud af et ofte uoverskueligt materiale. Det sker f.eks. ved at konstruere forskellige deskriptorer, d.v.s. regnestørrelser,
Læs mereInstitut for Matematiske Fag Sandsynlighedsregning og Statistik 2. R opgaver
Institut for Matematiske Fag Sandsynlighedsregning og Statistik 2 Københavns Universitet Susanne Ditlevsen og Helle Sørensen R opgaver Det er en god ide at vænne sig til at skrive kommandoerne i en editor
Læs mereBasal statistik. 2. september 2008
Basal statistik 2. september 2008 Deskriptiv statistik Grafik Summary statistics Normalfordelingen Typer af data Esben Budtz-Jørgensen, Biostatistisk Afdeling Institut for Folkesundhedsvidenskab, Københavns
Læs mereForelæsning 1: Intro og beskrivende statistik
Kursus 02402 Introduktion til Statistik Forelæsning 1: Intro og beskrivende statistik Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Introduktion 1 Formelt Lærer: Jørgen Holm Petersen Øvelseslærere: Amalie og Marie Databehandling: SPSS Eksamen: Ugeopgave efterfulgt af mundtlig
Læs mereModule 2: Beskrivende Statistik
Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen og Hans Chr. Petersen Module 2: Beskrivende Statistik 2.1 Histogrammer og søjlediagrammer......................... 1 2.2 Sammenfatning
Læs mereProgram dag 2 (11. april 2011)
Program dag 2 (11. april 2011) Dag 2: 1) Hvordan kan man bearbejde data; 2) Undersøgelse af datamaterialet; 3) Forskellige typer statistik; 4) Indledende dataundersøgelser; 5) Hvad kan man sige om sammenhænge;
Læs mereStikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader
Stikprøver og stikprøve fordelinger Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Statistik Statistisk Inferens: Prediktere og forekaste værdier af
Læs mereStatistiske modeller
Statistiske modeller Statistisk model Datamatrice Variabelmatrice Hændelse Sandsynligheder Data Statistiske modeller indeholder: Variable Hændelser defineret ved mulige variabel værdier Sandsynligheder
Læs mereLøsning eksamen d. 15. december 2008
Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Læs mereEksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet
Eksamen ved Københavns Universitet i Kvantitative forskningsmetoder Det Samfundsvidenskabelige Fakultet 14. december 2011 Eksamensnummer: 5 14. december 2011 Side 1 af 6 1) Af boxplottet kan man aflæse,
Læs mere6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag)
Institut for Epidemiologi og Socialmedicin Institut for Biostatistik. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag) Opgave 1 Læs afsnit.1 i An Introduction to Medical Statistics, specielt
Læs mereBasal statistik. 29. januar 2008
Basal statistik 29. januar 2008 Deskriptiv statistik Grafik Summary statistics Normalfordelingen Typer af data Lene Theil Skovgaard, Biostatistisk Afdeling Institut for Folkesundhedsvidenskab, Københavns
Læs mere5. Statistik. Hayati Balo,AAMS. 1. Carstensen, Frandsen og Studsgaard, stx mat B2, systime
5. Statistik Hayati Balo,AAMS Følgende fremstilling er baseret på 1. Carstensen, Frandsen og Studsgaard, stx mat B2, systime 1. Ugrupperede Observationer Hvis der foreligger et antal målinger eller observationer
Læs mereProjekt 8.3 Hvordan undersøges om et talmateriale normalfordelt?
Projekt 8.3 Hvordan undersøges om et talmateriale normalfordelt? Projektet drejer sig om at udvikle en metode, til at undersøge om et givet talmateriale med rimelighed kan siges at være normalfordelt.
Læs mereKonfidensintervaller og Hypotesetest
Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller
Læs mereLøsning til eksaminen d. 14. december 2009
DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,
Læs mereGrundlæggende statistik Lektion 2 Indhold Diskrete fordelinger Binomial fordelingen Poisson fordelingen Hypergeometrisk fordeling Data typer el. typer af tilfældige variable Diskrete variable > Kategoriseres
Læs mere2 Populationer. 2.1 Virkelige populationer
2 Populationer I en statistisk sammenhæng er en population en samling af elementer, fx personer, virksomheder, lande, kunder eller mere abstrakte objekter. Fra en population kan man udtage en stikprøve.
Læs mereProgram. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18
Program 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Fordeling af X Stikprøve X 1,X 2,...,X n stokastisk X stokastisk. Ex (normalfordelt stikprøve)
Læs mereForelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)
Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske
Læs mereHvorfor er det lige at vi skal lære det her?
Lektion 8 Stokastiske variable En stokastisk variabel er en afbildning af udfaldsrummet ind i de reelle tal. Man benytter ofte store bogstaver som X, Y og Z til at betegne en stokastisk variabel. Ved at
Læs mereØvelse 7: Aktuar-tabeller, Kaplan-Meier kurver og log-rank test
Øvelse 7: Aktuar-tabeller, Kaplan-Meier kurver og log-rank test Formålet med øvelsen er at analysere risikoen for død forbundet med forskelligt alkoholforbrug. I denne øvelse skal analyserne foretages
Læs mereBasal Statistik - SPSS
Faculty of Health Sciences Basal Statistik - SPSS Regressionsanalyse. Lene Theil Skovgaard 5. februar 2018 1 / 12 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Indlæsning og
Læs mereMikro-kursus i statistik 1. del. 24-11-2002 Mikrokursus i biostatistik 1
Mikro-kursus i statistik 1. del 24-11-2002 Mikrokursus i biostatistik 1 Hvad er statistik? Det systematiske studium af tilfældighedernes spil!dyrkes af biostatistikere Anvendes som redskab til vurdering
Læs mere1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens... 2
Idhold 1 Pukt- og itervalestimatio 2 1.1 Puktestimatorer: Cetralitet(bias) og efficies.................... 2 2 Kofidesiterval 3 2.1 Kofidesiterval for adel................................ 4 2.2 Kofidesiterval
Læs mereØVELSE 2B. Formål Det primære formål med denne øvelse er at prøve nogle vigtige procedurer til statistisk og grafisk analyse.
ØVELSE 2B I denne øvelse gennemgår vi: Udskrivning ved hjælp af PUT. Procedurerne FREQ, UNIVARIATE og CORR. Overførsel af procedure-uddata til et datasæt. Fremstilling af histogrammer og XY-plots. Formål
Læs mereModelkontrol i Faktor Modeller
Modelkontrol i Faktor Modeller Julie Lyng Forman Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for Biokemikere 2003 For at konklusionerne på en ensidet, flersidet eller hierarkisk
Læs mereISCC. IMM Statistical Consulting Center. Brugervejledning til beregningsmodul til robust estimation af nugget effect. Technical University of Denmark
IMM Statistical Consulting Center Technical University of Denmark ISCC Brugervejledning til beregningsmodul til robust estimation af nugget effect Endelig udgave til Eurofins af Christian Dehlendorff 15.
Læs mereLØNSPREDNINGSOPGØRELSER NU TILGÆNGELIG I LOPAKS
LØNSPREDNINGSOPGØRELSER NU TILGÆNGELIG I LOPAKS INDHOLD 2 Formål 2 LOPAKS 3 Begreber 6 Eksempler 6. december 2010 LOPAKS er nu udvidet med en ny tabel, der giver mulighed for at opgøre lønspredning på
Læs mereIkke-parametriske tests
Ikke-parametriske tests 2 Dagens menu t testen Hvordan var det nu lige det var? Wilcoxson Mann Whitney U Kruskall Wallis Friedman Kendalls og Spearmans correlation 3 t-testen Patient Drug Placebo difference
Læs mereForelæsning 3: Kapitel 5: Kontinuerte fordelinger
Kursus 02402 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs mereVelkommen til StatBK. Program. Introduktion, summary measures, SAS. Praktisk info. Praktisk info
Program Introduktion, summary measures, SAS Helle Sørensen E-mail: helle@math.ku.dk I dag: Praktiske informationer Faglig intro: et par dataeksempler Datatyper Beskrivende statistik, bla. gennemsnit og
Læs merePhd-kursus i Basal Statistik, Opgaver til 1. uge
Phd-kursus i Basal Statistik, Opgaver til 1. uge Opgave 1: Wright For 17 patienter er der målt peak expiratory flow rate (maksimal udåndingshastighed, i l/min) på to forskellige måder, dels ved at anvende
Læs mere