R for Statistik 1. KØBENHAVNS UNIVERSITET Statistik 1 AFDELING FOR ANVENDT MATEMATIK SFN/EH

Størrelse: px
Starte visningen fra side:

Download "R for Statistik 1. KØBENHAVNS UNIVERSITET Statistik 1 AFDELING FOR ANVENDT MATEMATIK SFN/EH"

Transkript

1 KØBENHAVNS UNIVERSITET Statistik 1 AFDELING FOR ANVENDT MATEMATIK SFN/EH OG STATISTIK 13. februar 2005 R for Statistik 1 Formålet med R for Statistik 1 er at give en introduktion til den interaktive statistiske programpakke R. Introduktionen er udformet som et minikursus i 10 dele. Hver del indeholder en beskrivelse af dele af R, eksempler og nogle mere eller mindre simple opgaver. Du bør gentage eksemplerne, så du kan se hvad der sker. Nogle af de objekter, der dannes i eksemplerne skal du bruge senere i opgaverne eller andre eksempler. En del af opgaverne er utvivlsomt en fornærmelse mod din intelligens men når de nu er så nemme, hvorfor så ikke løse dem? Enkelte af opgaverne er markeret med en stjerne; det skal forstås som et tegn på at dele af opgaven kan være lidt sværere end de øvrige og/eller mere tidskrævende. Det er ikke meningen at stjernen skal skræmme dig væk men kun være et tegn på at du skal afsætte et bestemt tidsrum til denne opgave og hvis du ikke får den løst inden for dette tidsrum skal du overveje at gå videre med noget andet. Der vil ikke være nogen kontrol af om du har læst noterne eller løst opgaverne; det er op til dig selv. Du får behov for R når du skal lave obligatoriske opgaver, og dette minikursus skulle gerne gøre de obligatoriske opgaver nemmere. Til sidst skal det nævnes at denne introduktion er skrevet af en stort set selvlært amatør uden videre forstand på hverken datalogi i almindelighed eller R i særdeleshed. Det betyder f.eks. at jeg formentlig bruger forkerte ord/begreber fra tid til anden. Den væsentligste ulempe ved dette er sikkert at de utallige ting, jeg har misforstået i årenes løb, er nedskrevet heri som om de er alt andet end netop misforståelser. Med andre ord, mine misforståelser er ved kursets afslutning også jeres! Derfor anbefales det at supplere dette kursus med en kritisk indstilling og den officielle An introduction to R. Søren Feodor Nielsen Manuskriptet er blevet bragt i overensstemmelse med en række ændringer i R siden Søren Feodor Nielsen skrev den oprindelige version. Ernst Hansen

2 Lektion 1 Introduktion R er et open source projekt, ledet af en meget dedikeret gruppe af mennesker, heriblandt ikke så få af verdens førende eksperter i statistical computing. At det er open source projekt betyder at kildekoden er underlagt en meget speciel copyrightbestemmelse, der først og fremmest har til formål at forhindre nogen i at skjule dele af koden. Hele kildekoden er offentlig tilgængelig og kan downloades gratis. R projektet har i løbet af få år stort set fjernet alle kommercielle aktører fra markedet for avanceret statistisk software - det er umuligt at konkurrence når R er både bedre og billigere - ja, ligefrem gratis. Ud over kildekoden kan man downloade prækompilerede versioner til de almindeligste operativsystemer - forskellige Linux-versioner, forskellige Windows-versioner (Windows 95, 98, ME, NT4.0, 2000 og XP) og Macintosh ( At installere en af disse versioner på sin hjemmecomputer er nok en af de simpleste opgaver man kan komme ud for - installationsprocessen er meget gennemtænkt på alle platforme, og det anbefales stærkt at man kaster sig ud i det, for det er program man vil have stor glæde af. Her på instituttet er R installeret på alle maskiner, både Linux- og Windowsmaskiner; skulle man finde en undtagelse fra denne regel, bør man orientere helpdesk. R startes på Linux systemet ved at give kommandoen R i en xterminal. Det starter en såkaldt konsol op, shannon:~/> R R : Copyright 2004, The R Foundation for Statistical Computing Version ( ), ISBN R is free software and comes with ABSOLUTELY NO WARRANTY. You are welcome to redistribute it under certain conditions. Type license() or licence() for distribution details. R is a collaborative project with many contributors. Type contributors() for more information and citation() on how to cite R or R packages in publications. Type demo() for some demos, help() for on-line help, or help.start() for a HTML browser interface to help. Type q() to quit R. > Det sidste > er prompten. Under Windows 2000 startes R fra Start-menuen. Det får den såkaldte Rgui til at åbne - en brugergrænsflade, der næppe vil forvirre Windowsbrugere. Et af vinduerne i denne grænsfalde er en konsol, der svarer ganske nøje til Linux-konsollen (bortset fra at den reagerer på sædvanlige Windows short-cuts, hvor Linux-konsollere reagerer på emacs short-cuts). Som dette skrives får man en lidt anden R-version under Lektion 1-ii

3 Windows, nemlig 2.0.0, men de to versioner bringes forhåbentlig i fase inden længe. Man afslutter sin R-version ved at give kommandoen q(). Bemærk parenteserne; de er vigtige! Når man afslutter sin R-version bliver man spurgt: > q() Save workspace image? [y/n/c]: Det såkaldte workspace image indeholder alle de variable, vektorer, funktioner, data etc, man har oprettet i løbet af sin session. Svarer man y gemmes de og indlæses næste gang man starter R. Svarer man n er de tabt. Hvad man skal svare, afhænger af ens personlige arbejdsvaner (SFN: jeg svarer y, EH: jeg svarer n, fordi jeg alligevel gemmer alt i eksterne tekstfiler). Opgave a) Tænd og sluk for R på din foretrukne platform. Kommandoen ls() giver en liste over de variable etc, der er konstrueret ( indholdet af workspace image ). Hvis dette er tomt, får man > ls() character(0) Opgave b) Tænd igen for R og giv kommandoerne > a <- 1 > a Pilen <- skrives med et mindre-end-tegn og et minus (der må for guds skyld ikke være mellemrum mellem de to tegn, men det betragtes som god stil at have mellemrum omkring pilen, det øger læseligheden dramatisk). Tjek med ls() at a findes. Prøv dernæst > 2 -> b > b Den almindelige konvention er kun at bruge pil til venstre - pil til højre virker forvirrende for de fleste læsere af programmet. Og åh jo - andre mennesker skal kunne læse dine programmer. Ellers har du forhindret dig selv i at få hjælp. Hvad er resultatet af a <- b? Symbolet <- dækker altså over en assignmentoperator. En anden operator med den samme effekt, som jeg dog ikke vil anbefale, er =. Opgave c) Hvad gør a = b? Hvad gør a == b? Hvorfor synes jeg at man bør undgå at bruge =? Hvis man altid gemmer sit workspace image bliver det hurtigt meget stort. Derfor er det en god ide at slette ting man ikke længere skal bruge. Variablen a slettes vha rm(a), både a og b med rm(a,b) og alting med rm(list=ls()). Bemærk at = her ikke er en assignment men en angivelse af værdien af argumentet list. Lektion 1-iii

4 Opgave d) Slet a og b. q, ls og rm er alle funktioner. Det ser ud til at q og ls er funktioner af 0 variable mens rm kan have adskillige. Det er ikke helt korrekt; man kan angive nogle variable til q og ls men som regel er default-værdierne gode nok. rm kan kaldes helt uden variable (rm()); i så fald slettes ingenting (som forventet?). Som beskrevet ovenfor sletter rm(list=ls()) alt. Se, det er jo ikke lige til at gætte (mit første forsøg var rm(ls()), men det virker ikke). Derfor er hjælpesider nyttige; man får hjælp til f.eks. ls med kommandoen?ls eller help(ls). I Windows får man så hjælpesiden op i et nyt vindue. I Linux kommer hjælpesiden op i den xterminal man arbejder i; man bladrer i hjælpesiden med space og b og kommer ud ved at trykke q. Hvis man starter med at skrive help.start() vil hjælpesiderne komme frem i en browser (typsk Mozilla) i stedet. Det er lidt tungere ar arbejde med hjælpesiderne på denne måde, men på den anden side er de nemmere at læse. Endelig kan man få demonstreret eksemplerne sidst på hjælpesiden ved kommandoen example(kommando) 1. Det vil være direkte dumt at gøre dette med en kommando som rm. Opgave e) Se på hjælpesiderne for barplot. Forvent ikke at forstå alverden; det kræver øvelse! Prøv at køre eksemplerne nederst på hjælpesiden ved example(barplot). En anden ofte nyttig information om en funktion får man ved at skrive funktionens navn (uden ()); det er ikke så oplysende hvad der kommer ud af at skrive barplot, men prøv i stedet at skrive barplot.default. Lektion 2 Vektorer Vektorer er en grundlæggende struktur i R. En vektor a bestående af tallene 1, 2, 6, 88 laves således > a <- c(1,2,6,88) Vi kan derefter gange a (elementvis) med 3: > 3*a [1] En vektor b bestående af 1, 2, 3 og 4 kan laves tilsvarende eller således > b <- 1:4 Opgave a) Lav de to vektorer a og b og se at de indeholder det forventede. Gang dem derefter sammen: > a*b Hvad er resultatet? To vektorer ganges (og adderes og... ) altså sammen elementvist. Men man kan også gange vektorer sammen selv om de ikke har samme længde: 1 Når man ser på eksempler, hvori indgår grafer, er det en god ide først at give kommandoen par(ask=t). I så fald vil man blive spurgt for hver ny graf om den skal tegnes. Lektion 2-iv

5 > b <- 1:2 > a*b [1] Det, der sker, er at den kortere vektor genbruges så mange gange som er nødvendigt ( recycling ). Opgave b) Hvad er resultatet af > d<-1:3 > a+d mon? Man kan lave vektorer på mange andre måder. For eksempel ved kommandoerne seq og rep: > seq(7,14,by=2) #vektor fra 7 til 14 med spring på 2 [1] > seq(7,14,length=5) #vektor fra 7 til 14 af længde 5 [1] > rep(0,5) #0-vektor af længde 5 [1] De vektorer vi har lavet indtil nu har været meget små, men man kan uden problemer lave vektorer med flere millioner komponenter. Opgave c) Prøv at skrive > 1:100 Forklar de tal i firkantede parenteser, de står længst til venstre. Vektorer kan indeholde boolske værdier (logical), tal (numeric), eller bogstaver (character) men ikke blandinger; hvis man prøver at lave en blandet vektor bliver alle elementerne af den sidste type i den orden som er angivet ovenfor (boolske værdier bliver til 0 og 1, tal bliver til bogstaver ). Typen kan aflæses med funktionen mode. Opgave d) Prøv funktionerne mode og length på a, b og d. Hvad gør length? Mere interessant er nok enten at tage matematiske funktioner så som exp og sin på en vektor de virker så elementvis og returnerer en vektor af samme længe som den oprindelige eller statistiske funktioner så som mean og var, som returnerer et tal (middelværdien og variansen). Opgave e) Prøv disse funktioner (og evt. andre du kan gætte hvad hedder). Man har også ofte behov for at se på en del af en vektor. F.eks. 2 R. 2 Vi tilføjer kommentarer; de skal naturligvis ikke skrives med i din R-session. # er kommentartegn i Lektion 2-v

6 > a <- c(3,5,6,9) > a[1] #a s første element [1] 3 > b <- 2:1 > b [1] 2 1 #bemærk 2 før 1 > a[b] [1] 5 3 #a s andet og derefter det første element > a[-b] [1] 6 9 #a pånær det andet og det første element > a[2*b] [1] 9 5 #a s fjerde og andet element Logisk indicering er meget nyttigt. Her er en række simple eksempler: > (a > 5) [1] FALSE FALSE TRUE TRUE > a[a>5] [1] 6 9 #de elementer af a der er større end 5 > a[a!=5]-a[a==5] [1] #de elementer af a der er forskellige fra 5 minus dem #der er 5 > (a%%3==0) [1] TRUE FALSE TRUE TRUE > a[a%%3==0] [1] #de elementer af a der er delelige med 3 > (a %in% (2*(1:5))) [1] FALSE FALSE TRUE FALSE > a[a %in% (2*(1:5))] [1] 6 #de elementer af a der ligger i (2, 4, 6, 8, 10) sort er naturligvis den funktion, der ordner: > sort(a[2*b]) [1] 5 9 Hvis man har to vektorer a fra før og b som f.eks. er > b <- c(b,4,-2) #danner b udfra den gamle b ved at tilføje 4 og -2 > b [1] så kunne man være interesseret i at ordne b med den mindste først og derefter ordne a så ordningen af a er den samme som bs, dvs da > sort(b) [1] vil vi gerne have a ordnet Det gøres ved > a[order(b)] [1] Lektion 3-vi

7 Lektion 3 Matricer Matricer kan i lighed med vektorer kun have elementer af en type. De konstrueres normal ved at omforme en vektor: > a [1] > b [1] > A <- matrix(a, nrow=2) #en matrix med to rækker > A [,1] [,2] [1,] 3 6 [2,] 5 9 > B <- matrix(b, ncol=2) #en matrix med to søjler > B [,1] [,2] [1,] 2 4 [2,] 1-2 I dette eksempel er det naturligvis ligegyldigt om vi angiver antal rækker (nrow) eller søjler (ncol). Man kan også benytte cbind til at binde vektorer sammen søjlevis: > cbind(a,b) a b [1,] 3 2 [2,] 5 1 [3,] 6 4 [4,] 9-2 rbind binder sammen rækkevis. Alternativt kan man gøre b til en matrix ved at give den dimensioner: > dim(b) <- c(2,2) #b gives dimensioner > b #hvad er b? [,1] [,2] [1,] 2 4 [2,] 1-2 > is.matrix(b) #er b en matrix? [1] TRUE > b==b #b er det samme som B [,1] [,2] [1,] TRUE TRUE [2,] TRUE TRUE > dim(b) <- c(1,4) #nye dimensioner for b > b [,1] [,2] [,3] [,4] [1,] > is.matrix(b) #er b nu en vektor? [1] TRUE #nej! stadig en matrix > dim(b) <- NULL #fjern b s dimensioner Lektion 3-vii

8 > is.matrix(b) #nu er b ikke længere en matrix [1] FALSE Den anden mulighed er at lave en tom matrix: > E <- matrix(nrow=3, ncol=2) > E [,1] [,2] [1,] NA NA [2,] NA NA [3,] NA NA og så fylde ind elementvis. Inden da bemærker vi at NA står for not available; NA indikerer altså at elementerne i matricen mangler. Opgave a) Prøv følgende kommandoer og se efter hver kommando hvad E nu er: > E[,1] <- a[1:3] > E[-3,] <- B > E[3,2] <- mean(b) Endelig kan diagonalmatricer konstrueres med funktionen diag: > diag(3) #en 3x3 identitetsmatrix [,1] [,2] [,3] [1,] [2,] [3,] > diag(c(7,45)) #en diagonalmatrix [,1] [,2] [1,] 7 0 [2,] 0 45 > diag(b) #B s diagonal [1] 2-2 Hvis vi ganger matricerne A og B sammen, så får vi > A*B [,1] [,2] [1,] 6 24 [2,] 5-18 Der er altså tale om elementvis multiplikation, ikke matrix-multiplikation. Matrixmultiplikation fås ved > A%*%B [,1] [,2] [1,] 12 0 [2,] 19 2 Naturligvis kan vi mere end bare gange sammen; A transponeres med funktionen t, den inverse til A findes som solve(a), determinant fås vha det, egenværdier og -vektorer vha eigen. Derimod synes der ikke at være en funktion til beregning af sporet. Lektion 3-viii

9 Opgave b) Sporet af en kvadratisk matrix er summen af diagonalelementerne eller summen af egenværdierne. Beregn sporet af A ved at pille diagonal elementerne ud. Løs opgaven så du kan gøre det for en kvadratisk matrix af vilkårlig størrelse. Opgave c) Betragt ligningssystemet hvor E er matricen > E [,1] [,2] [1,] 2 4 [2,] 1-2 [3,] 6 1 Ex = Der er tale om 3 ligninger med 2 ubekendte, så det er ikke givet at der findes en løsning. Vi vil prøve at løse systemet alligevel. En måde er at gange med E t på begge sider og så invertere E t E. Derved får vi x = (E t E) 1 E t som vi så kan sætte ind i den oprindelige ligning ( gøre prøve ) og se om det er en løsning. Find x ud fra denne procedure, og undersøg om det løser ligningssystemet Lektion 4 Dataframes Data repræsenteres ofte som en matrix hvor hver række svarer til et individ/en observation mens hver søjle repræsenterer en variabel. Da variable ofte er af forskellig type nogle er kontinuerte (numeric) og andre er diskrete (ofte character) kan et sådant datamateriale ikke repræsenteres som en R-matrix. Man bruger i stedet objekter af typen data.frame. R indeholder en del datamaterialer; en liste over dem alle fås med kommandoen data(). Opgave a) Se på datamaterialet iris. For at forstå hvad det indeholder benyt kommandoen?iris. Få et hurtigt indblik vha summary(iris). Også plot(iris) kan være nyttig. iris indeholder altså 150 observationer af 5 variable. En af disse variable hedder Species. Opgave b) Hvad sker der her: > summary(species) Lektion 4-ix

10 > summary(iris$species) > attach(iris) > summary(species) Vi kan altså få nemmere adgang til variablene i et datamateriale ved at attach e det. Vi kan se hvad vi har attach et med kommandoen > search() [1] ".GlobalEnv" "iris" "package:methods" [4] "package:stats" "package:graphics" "package:grdevices" [7] "package:utils" "package:datasets" "Autoloads" [10] "package:base" og detach e iris igen med kommandoen detach(iris). Opgave c) Detach iris. Typisk vil man være mere interesseret i at indlæse et datamateriale fra f.eks. en tekstfil. Dette gøres med kommandoen read.table, hvor man som argument skal angive fil-navn (i gåse-øjne) og hvis den første linie i filen er variabel-navnene så også header=t: > my.data <- read.table( filnavn,header=t) Konventionerne for hvordan filnavnet skal skrives er en anelse systemafhængige. Lad os sige at jeg under roden på mit M-drev på det lokale system har et katalog stat1 og at jeg i dette kataolog har filen datafil.txt liggende. Hvis jeg arbejder i Linux, og startede R processen direkte under roden, får jeg indlæst denne fil som > my.data <- read.table( stat1/datafil.txt, header=t) Hvis jeg derimod havde startet R processen nede i stat1, skulle jeg have skrevet > my.data <- read.table( datafil.txt, header=t) Hvis jeg arbejde under Windows, vil det i praksis tage sig ud som om jeg arbejder direkte under roden. Men jeg er i så fald nødt til at angive et drev: > my.data <- read.table( M:stat1/datafil.txt, header=t) Som seperationstegn i en sti-angivelse bør man bruge et fremadrettet slash (/). Man kan i princippet godt bruge backslash, men af forskellige grunde skal det i de fleste sammenhænge fordobles (\\), hvilket et svært at huske og forstå. Hvis man arbejder på en computer der er på nettet, kan man udnytte at read.table() ikke kun kan løse lokale filer, men faktisk kan gå direkte på internettet. I så fald er syntaksen > my.data <- read.table( header=t) eller hvad den relevante URl nu er. Lektion 4-x

11 Opgave d) Download datamaterialet fra 01/doku/rapport/puzzle.dat og indlæs det i R som data.frame n puzzle. Kig på det med summary. Hvis du vil vide mere om materialet, findes en nærmere beskrivelse i 01/doku/rapport/opgave1.ps. Det kan også være nyttigt at skrive ting ud til en fil. Opgave e) Undersøg hvad følgende kommandoer gør 3 : > a [1] > cat(a) > cat(a, \n ) > cat(a, \n,file= Rkursus.txt ) > b [1] > cat(b, \n,file= Rkursus.txt ) > cat(a, \n,file= Rkursus.txt,append=T) Hele datamaterialer kan udskrives som > write.table(puzzle,file= Rkursus.txt ) En data.frame er en list af klasse data.frame: > mode(puzzle) [1] "list" > class(puzzle) [1] "data.frame" Et objekt af typen list er bare en vektor hvor hvert element kan være hvad som helst (egentlige vektorer, matricer, andre lister, etc). Man kan hive elementer i lister ud på mange måder. Opgave f) Prøv følgende kommandoer: > puzzle$point > puzzle[2] > puzzle[[2]] Hvad får man ud af dem? Lektion 5 Test i tovejstabeller Betragt igen det datamateriale, puzzle, vi indlæste sidst. Et spørgsmål man kunne være interesseret i er om en god studentereksamen giver bedre chancer for at bestå 3 Pas på hvis du har en fil ved navn Rkursus.txt liggende; den vil blive overskrevet! Lektion 5-xi

12 den skriftlige del af eksamen 4. Vi definerer ganske arbitrært at en god studentereksamen er en med et snit på mindst 9 (du er velkommen til at benytte et andet afskæringspunkt). Vi kan nu lave en faktor: > attach(puzzle) > god <- factor(studeksamen>9) > summary(god) FALSE TRUE NA s NA erne er her intet problem 5 ; R vil ignorere dem når det virkelig går løs. Man kan diskutere om TRUE/FALSE er ideelle betegnelser. Hvis du ikke kan lide dem, kan du jo prøve at lave dem om 6 til noget du synes bedre om: > levels(god) <- c( øv, jubii ) > summary(god) øv jubii NA s Vi kan tilføje NA erne til den dårlige gruppe hvis vi synes: > god[is.na(god)] <- øv > summary(god) øv jubii Opgave a) Lav på tilsvarende vis en faktor best som angiver om man har bestået den skriftlige del af eksamen på kurset stat1ms, dvs om variablen Point har værdien 50 eller mere. Bemærk at her bør NAerne kodes som dumpet. Vi kan så tabulere materialet: > table(god,best) best god FALSE TRUE FALSE 16 3 TRUE En sådan tabel kan jo være ganske god men måske vil vi hellere have estimeret nogle sandsynligheder. Vi kan f.eks. gøre således: > table(god,best)/sum(table(god,best)) best god FALSE TRUE FALSE TRUE > format(table(god,best)/sum(table(god,best)),digit=1) #pænere udskrift best god FALSE TRUE FALSE "0.28" "0.05" TRUE "0.33" "0.33" 4 Fra tid til anden diskuteres det om der bør indføres adgangsbegrænsning til bl.a. de matematiske fag med netop den begrundelse. 5 Eller også er de, men det er et ganske andet kursus. 6 Jeg beholder TRUE/FALSE i det følgende. Lektion 5-xii

13 Opgave b) Måske er en tabel med betingede fordelinger mere informativ, altså en hvor vi kan se sandsynligheden for at bestå givet at ens studentereksamen er god eller mindre god: best god FALSE TRUE FALSE "0.84" "0.16" TRUE "0.50" "0.50" Lav denne tabel eller en der ligner. Du får behov for rækkesummerne af tabellen; de kan fås (f.eks.) ved at matrix-multiplicere tabellen med en vektor. Endelig kan man være interesseret i at teste om der er uafhængighed mellem inddelingskriterierne. R er udstyret med et utal af statistiske procedurer. En del af dem, f.eks. Pearson s χ 2 -test, er umiddelbart tilgængelige, mens andre ligger i pakker, som skal loades før man kan bruge dem. Pearsons χ 2 -test kan gennemføres med kommandoen chisq.test(table(god,best)). Opgave c) Udfør dette test. Er der en sammenhæng? Opgave d) Undersøg også om der er en sammenhæng mellem beståelse og om Tid er skarpt mindre end 5. Lektion 6 Plots En af R s stærke sider er de grafiske muligheder. Den grundlæggende funktioner er her funktionen plot, som laver forskellige plots alt efter hvad man bruger som argument. Opgave a) Prøv følgende kommandoer: > plot(puzzle) > attach(puzzle) > plot(studeksamen,point) > plot(as.factor(round(studeksamen))) > plot(tid) Man kan opnå finere kontrol med grafen ved at specificere et yderligere antal argumenter. De umiddelbart vigtigste er nok type: plot(point,type= n ) hvor typen n kan være p (punkter), l (linier), b (begge; punkter og linier), n (intet; mere nyttigt end du tror!) mm. pch og lty: plot(point,pch=2) erstatter cirklerne i grafen med trekanter; andre tal giver andre plot-symboler. lty giver tilsvarende andre linietyper. xlim og ylim: plot(point,ylim=c(50,85)) sikrer at anden aksen går fra 50 til 85 (plus en lille smule i hver ende). Lektion 6-xiii

14 xlab, ylab, main: plot(point,xlab= navn ) skriver navn under første aksen; main giver overskrift. Opgave b) Prøv følgende kommandoer > plot(1:20, pch=1:20) > plot(1:20, col=1:20) Andre nyttige plotte-kommandoer er points, som sætter punkter ind på et allerede eksisterende plot, og lines, som tilsvarende sætter linier ind. abline sætter en ret linie ind i et eksisterende plot; man skal angive skæring og hældning eller for en vandret (horisontal) linie gennem 2 h=2 og for en lodret (vertikal) v=2, f.eks.: > plot(studeksamen, Point) > abline(v=9, lty=2) Opgave c) Lav en graf med StudEksamen ud af første aksen og Point op af anden aksen med forskellige plotsymboler alt efter om Tid er skarpt mindre end 5 eller ej. Denne effekt kan opnås på mange måder, men den nemmeste er nok at skrive pch = ifelse(tid < 5, 2, 16) i kaldet af plot() - det sikrer at symbol 2 bruges når Tid < 5, og at symbol 16 bruges i de andre tilfælde. Ofte vil man være interesseret i at se på fordelingen af en variabel, dvs for en kontinuert variabel på et histogram: > hist(studeksamen) #antal > hist(studeksamen,prob=t) #andel: som regel det bedste! Også pindediagrammer kan konstrueres: > barplot(table(as.factor(round(studeksamen)))) Man bemærker at resultatet er det samme som det plot(as.factor(round(studeksamen))) giver. Det er ofte nyttigt med flere grafer på en gang: > par(mfrow=c(2,3)) opdeler grafikvinduet i 2 3 del-vinduer, som så udfyldes rækkevis (hvis de skal udfyldes søjlevis bruges mfcol). par(mfrow=c(1,1)) fjerner opdelingen igen. Man får hurtigt behov for at udskrive eller gemme sine grafer: > dev.print() #printer grafen i det aktive vindue ud > dev.copy2eps(file= myplot.eps ) #gemmer i filen myplot.eps under Linux #(som kan inkluderes i LaTeX-dokumenter) > dev.copy2eps(file= M:myplot.eps ) #gemmer i filen myplot.eps under Windows #(som kan inkluderes i LaTeX-dokumenter) Opgave d) Lav igen grafen fra Opgave c) og gem den i en fil. Lektion 7-xiv

15 Lektion 7 Lineær regression Når man ser på grafen > attach(puzzle) > plot(tid[tid<5], Point[Tid<5]) af Point som funktion af Tid (for Tid<5), kunne man måske få den tanke at der er en lineær sammenhæng mellem Tid og Point. Lad os fitte en lineær regression (Point som funktion af Tid): > lm(point[tid<5]~tid[tid<5]) Call: lm(formula = Point[Tid < 5] ~ Tid[Tid < 5]) Coefficients: (Intercept) Tid[Tid < 5] Outputtet er lidet informativt, men man ser dog at der er en negativ sammenhæng; jo længere Tid jo mindre Point. R kan give meget mere! Resultatet af lm er et lm-objekt, en liste hvoraf vi umiddelbart ser en meget lille del. Listen indeholder en masse: > names(lm(point[tid<5]~tid[tid<5])) [1] "coefficients" "residuals" "effects" "rank" [5] "fitted.values" "assign" "qr" "df.residual" [9] "na.action" "xlevels" "call" "terms" [13] "model" Lad os derfor gemme vores regressionsanalyse så vi kan undersøge den nærmere: > my.reg<-lm(point[tid<5]~tid[tid<5]) Opgave a) Prøv følgende kommandoer: > summary(my.reg) > coefficients(my.reg) > summary(residuals(my.reg)) > plot(fitted.values(my.reg),residuals(my.reg)) > plot(tid[tid<5], Point[Tid<5]) > abline(my.reg) Opgave b)* Plot igen Point mod Tid (for Tid<5) men brug forskellige symboler alt efter om StudEksamen er mindre end 9 eller ej. Fit to lineære regressionsmodel med Point som funktion af Tid, en for den del af materialet hvor StudEksamen er mindre end 9 og en hvor det er større. Du får nok brug for at huske/gætte at Point[Tid<5 & StudEksamen<9] giver de værdier af Point med Tid<5 og StudEksamen<9. Tegn regressionslinierne ind på din graf. Lektion 8-xv

16 Lektion 8 Egne funktioner En størrelse der dukker op i mange statistike regnerier er x log x. Konventionen er at for x = 0 skal denne størrelse forstås som 0. Det ved computeren uheldigvis ikke, den går i hårdknude når man forsøger at tage logaritmen til 0. For at komme uden om dette problem kan man konstruere en lille funktion: > xlogx<-function(x){ifelse(x>0,x*log(x),0)} Funktionen xlogx er nu dannet og kan anvendes når som helst vi måtte ønske det. Faktisk er mange af Rs indbyggede funktioner af denne form, dvs funktioner som er skrevet i R og som kalder andre R-funktioner. Se f.eks. på funktionen sd som beregner standardafvigelser: > sd function (x, na.rm = FALSE) { if (is.matrix(x)) apply(x, 2, sd) else if (is.vector(x)) sqrt(var(x, na.rm = na.rm)) else if (is.data.frame(x)) sapply(x, sd) else sqrt(var(as.vector(x), na.rm = na.rm)) } Dette er jo næsten til at forstå: is.matrix(x) er sand hvis x er en matrix; as.vector(x) tvinger x til at være en vektor. Funktionen sd finder altså ud af hvad type objekt x er og beregner så en passende standardafvigelse (kvadratroden af variansen); for matricer søjlevis (vha apply), for data.framer variabelvis (sapply er en variant af apply). Vi bemærker at sd tager to argumenter: x som er det objekt vi skal finde standardafvigelser på og na.rm som man ikke behøver at angive fordi der er en default-værdi (nemlig FALSE). Egentlige programmer i R skrives ofte med fordel som R-funktioner. Disse bliver ofte længere end den ene linie vi benyttede os af ovenfor (xlogx) og det gør det svært at undgå fejl undervejs. Hvis der er fejl, bliver man så nødt til at starte forfra (og så laver man en ny fejl... ). Det vil derfor være en fordel at skrive sine programmer i en flad tekstfil (vha Xemacs eller Notepad). Når filen så er gemt som (f.eks.) myfct.r kan man source den ind: > source( myfct.r ) #husk drev-angivelse under Windows Hvis programmet indeholder fejl, vil man få en fejlmeddelelse og så må man jo i gang med at finde fejlen - et godt bud er at der er rod i parenteserne. Filen behøver ikke hedder R til efternavn; det er bare praktisk så man ved at det er et R-program. En fil man sourcer ind, kan indeholde hvad som helst; evt kommandoer vil blive udført, så man kan også bare skrive sine kommandoer i en source-fil og så source dem ind. Typisk får man ikke noget synligt resultat af sine anstrengelser; for at få resultater ud, skal man bruge kommandoen print: Lektion 8-xvi

17 #Source-fil: summary(puzzle) print(summary(puzzle)) #Intet resultat #Det ønskede resultat Alternativt kan man source med ekko : > source( myfct.r,echo=t) Så får man kommandoer og output frem. Mere information. Der er meget mere at sige om funktioner og programmering i R men det vil føre os for vidt omkring i forhold til denne introduktion til R. Jeg henviser til An introduktion to R ( Tilføjelse. Skal man køre store progammer er det nyttigt at kunne køre dem som batch, så man kan gå hjem og holde weekend imens. Dette gøres under Linux ved at give kommandoen shannon:~/> R CMD BATCH myfct.r output.log & hvor filen myfct.r indeholder ens kommandoer og filen output.log tager imod output; disse filer kan naturligvis hedde hvad som helst. Derefter kan man logge af og vende tilbage senere. Lektion 9 Fordelinger mv I R er indbygget en lang række af de mest almindelige fordelinger i den forstand at R kan simulere fra disse fordelinger, beregne fordelingsfunktioner og tætheder samt finde fraktiler. Lad os se på normalfordelingen: Simulering: rnorm(n,my,sigma) giver en vektor med længde n af tilfældige tal fra normalfordelingen med middelværdi µ og spredning σ (bemærk det er spredning og ikke varians der skal angives). Hvis man ikke angiver middelværdi og spredning er defaulten standardnormalfordelingen. Fordelingsfunktion: pnorm(q,my,sigma) giver fordelingsfunktionen i punktet q; hvis dette er en vektor fås tilsvarende en vektor af værdier. Tæthed: dnorm(x,my,sigma) giver tætheden i x (evt en vektor). Fraktiler: qnorm(p,my,sigma) giver fraktil(er) svarende til (vektoren) p Andre fordelinger fås på tilsvarende vis; man skal bare erstatte norm med den ønskede fordelings navn (f.eks. t for t-fordelingen) og (µ, σ) med de parametre der er relevante 7. Husker du da du i gymnasiet skulle sætte prikker på normalfordelingspapir? Det står i bekendtgørelsen 8 at det skal man lære i gymnasiet, så det har du sikkert prøvet. I dag er der absolut ingen som bruger normalfordelingspapir fordi fornuftige computerprogrammer kan lave disse grafer for os. Sådanne grafer hedder QQ-plots, noget vi skal vende tilbage til senere. I R tegner man på normalfordelingspapir med kommandoen qqnorm: 7 Advarsel: Se efter på hjælpesiderne hvordan parametrene skal specificeres! Γ-fordelingen især er tricky og det griner vi ofte af... Lektion 9-xvii

18 > x <- rnorm(500) > qqnorm(x) > qqline(x) Punkterne i grafen skulle gerne ligge omkring linien (som qqline tegner). Normalfordelingen er naturligvis vigtigere end så mange andre fordelinger, men i dag er det let nok at lave QQ-plot for andre fordelinger end normalfordelingen. Desværre skal man programmere en lille smule i R: > qqt <- function(x,df){ plot(qt(ppoints(x),df),sort(x), + main=paste( t(,df, ) QQ Plot,sep=""), + xlab= Theoretical quantiles, ylab= Sample quantiles ) } qqline bør nok også rettes. Opgave a) Lav en QQ-plot funktion for en (eller flere) fordeling(er) efter eget valg (men ikke normal- og t-fordelingerne). Inkluder en qqline-funktionalitet i din funktion. Funktionen skal altså se cirka sådan ud: qqt <- funktion(x,df,line=t){ tegn qqplottet if (line) tegn linien } Lektion 9-xviii

R for Statistik 1. KØBENHAVNS UNIVERSITET Statistik 1 AFDELING FOR ANVENDT MATEMATIK. Søren Feodor Nielsen

R for Statistik 1. KØBENHAVNS UNIVERSITET Statistik 1 AFDELING FOR ANVENDT MATEMATIK. Søren Feodor Nielsen KØBENHAVNS UNIVERSITET Statistik 1 AFDELING FOR ANVENDT MATEMATIK Søren Feodor Nielsen OG STATISTIK 5. februar 2004 R for Statistik 1 Formålet med R for Statistik 1 er at give en introduktion til den interaktive

Læs mere

R syntaks. Installation af R

R syntaks. Installation af R R syntaks Denne note er en introduktion 1 til syntaksen i R. Den kode, vi skal bruge til modellerne, står i bogen eller kommer til at være på hjemmesiden i den takt, vi gennemgår teorien. Så det, vi skal

Læs mere

1 Start og afslutning. Help.

1 Start og afslutning. Help. Afdeling for Teoretisk Statistik STATISTIK 2 Institut for Matematiske Fag Jørgen Granfeldt Aarhus Universitet 24. september 2003 Hermed en udvidet udgave af Jens Ledet Jensens introduktion til R. 1 Start

Læs mere

Institut for Matematiske Fag Sandsynlighedsregning og Statistik 2. R opgaver

Institut for Matematiske Fag Sandsynlighedsregning og Statistik 2. R opgaver Institut for Matematiske Fag Sandsynlighedsregning og Statistik 2 Københavns Universitet Susanne Ditlevsen og Helle Sørensen R opgaver Det er en god ide at vænne sig til at skrive kommandoerne i en editor

Læs mere

Introduktion til R. March 8, Regne- og tegneprogrammet R kan frit downloades fra adressen. http : //mirrors.sunsite.dk.cran

Introduktion til R. March 8, Regne- og tegneprogrammet R kan frit downloades fra adressen. http : //mirrors.sunsite.dk.cran Introduktion til R March 8, 2004 1 Adgang til R Regne- og tegneprogrammet R kan frit downloades fra adressen http : //mirrors.sunsite.dk.cran 2 Start og afslutning. Help. I et vindue starter i R, typisk

Læs mere

Løsning til eksamen d.27 Maj 2010

Løsning til eksamen d.27 Maj 2010 DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1

Læs mere

Produkt og marked - matematiske og statistiske metoder

Produkt og marked - matematiske og statistiske metoder Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring

Læs mere

Matricer og lineære ligningssystemer

Matricer og lineære ligningssystemer Matricer og lineære ligningssystemer Grete Ridder Ebbesen Virum Gymnasium Indhold 1 Matricer 11 Grundlæggende begreber 1 Regning med matricer 3 13 Kvadratiske matricer og determinant 9 14 Invers matrix

Læs mere

Kom godt i gang med I-bogen

Kom godt i gang med I-bogen Kom godt i gang med I-bogen At åbne bogen Det allerførste, du skal gøre, for at kunne arbejde med i-bogen, er at aktivere den. Det gøres ved at oprette en konto på systime.dk og derefter aktivere bogen

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3

Læs mere

1 Regressionsproblemet 2

1 Regressionsproblemet 2 Indhold 1 Regressionsproblemet 2 2 Simpel lineær regression 3 2.1 Mindste kvadraters tilpasning.............................. 3 2.2 Prædiktion og residualer................................. 5 2.3 Estimation

Læs mere

Modelkontrol i Faktor Modeller

Modelkontrol i Faktor Modeller Modelkontrol i Faktor Modeller Julie Lyng Forman Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for Biokemikere 2003 For at konklusionerne på en ensidet, flersidet eller hierarkisk

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt) I dag Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt) Helle Sørensen Repetition vha eksempel om dagligvarepriser Analyse med R: ttest

Læs mere

Opgaver til kapitel 3

Opgaver til kapitel 3 Opgaver til kapitel 3 3.1 En løber er interesseret i at undersøge om hendes løbeur er kalibreret korrekt. Hun udmåler derfor en strækning på præcis 1000 m og løber den 16 gange. For hver løbetur noterer

Læs mere

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Microsoft Excel har en del standard anvendelsesmuligheder i forhold til den beskrivende statistik og statistisk

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Kursus 02402 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Kursus 242 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik Bygning 35/324 Danmarks Tekniske Universitet 28 Lyngby Danmark e-mail:

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences Basal Statistik - SPSS Kovariansanalyse. Lene Theil Skovgaard 1. oktober 2018 1 / 12 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Bland-Altman plot,

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 21 sider. Skriftlig prøve: 27. maj 2010 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences Basal Statistik - SPSS Kovariansanalyse. Lene Theil Skovgaard 3. oktober 2017 1 / 12 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Bland-Altman plot,

Læs mere

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

Statistik i GeoGebra

Statistik i GeoGebra Statistik i GeoGebra Peter Harremoës 13. maj 2015 Jeg vil her beskrive hvordan man kan lave forskellige statistiske analyser ved hjælp af GeoGebra 4.2.60.0. De statistiske analyser svarer til pensum Matematik

Læs mere

R / RStudio. Intro til R / RStudio

R / RStudio. Intro til R / RStudio R / RStudio Intro til R / RStudio R R er et open source statstikprogram og programmeringssprog introduceret i 1993. Seneste version er 2.15.3 R kan downloades på www.r-project.org R er i udgangspunktet

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Statistiske Modeller 1: Kontingenstabeller i SAS

Statistiske Modeller 1: Kontingenstabeller i SAS Statistiske Modeller 1: Kontingenstabeller i SAS Jens Ledet Jensen October 31, 2005 1 Indledning Som vist i Notat 1 afsnit 13 er 2 log Q for et test i en multinomialmodel ækvivalent med et test i en poissonmodel.

Læs mere

4 Oversigt over kapitel 4

4 Oversigt over kapitel 4 IMM, 2002-09-14 Poul Thyregod 4 Oversigt over kapitel 4 Introduktion Hidtil har vi beskæftiget os med data. Når data repræsenterer gentagne observationer (i bred forstand) af et fænomen, kan det være bekvemt

Læs mere

Introduktion til MatLab Matematisk Modellering af Dynamiske Modeller ved Kasper Bjering Jensen, RUC, februar 2010

Introduktion til MatLab Matematisk Modellering af Dynamiske Modeller ved Kasper Bjering Jensen, RUC, februar 2010 Introduktion til MatLab Matematisk Modellering af Dynamiske Modeller ved Kasper Bjering Jensen, RUC, februar 2010 Computere er uvurderlige redskaber for personer der ønsker at arbejde med matematiske modeller

Læs mere

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/ Program: 1. Repetition af vigtige sandsynlighedsfordelinger: binomial, (Poisson,) normal (og χ 2 ). 2. Populationer og stikprøver 3. Opsummering af data vha. deskriptive størrelser og grafer. 1/29 Binomial

Læs mere

Skriftlig eksamen Science statistik- ST501

Skriftlig eksamen Science statistik- ST501 SYDDANSK UNIVERSITET INSTITUT FOR MATEMATIK OG DATALOGI Skriftlig eksamen Science statistik- ST501 Torsdag den 21. januar Opgavesættet består af 5 opgaver, med i alt 13 delspørgsmål, som vægtes ligeligt.

Læs mere

Maple. Skærmbilledet. Vi starter med at se lidt nærmere på opstartsbilledet i Maple. Værktøjslinje til indtastningsområdet. Menulinje.

Maple. Skærmbilledet. Vi starter med at se lidt nærmere på opstartsbilledet i Maple. Værktøjslinje til indtastningsområdet. Menulinje. Maple Dette kapitel giver en kort introduktion til hvordan Maple 12 kan benyttes til at løse mange af de opgaver, som man bliver mødt med i matematiktimerne på HHX. Skærmbilledet Vi starter med at se lidt

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences Basal Statistik - SPSS Regressionsanalyse. Lene Theil Skovgaard 5. februar 2018 1 / 12 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Indlæsning og

Læs mere

Forelæsning 11: Kapitel 11: Regressionsanalyse

Forelæsning 11: Kapitel 11: Regressionsanalyse Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Vejledning i brug af Gym-pakken til Maple

Vejledning i brug af Gym-pakken til Maple Vejledning i brug af Gym-pakken til Maple Gym-pakken vil automatisk være installeret på din pc eller mac, hvis du benytter cd'en Maple 16 - Til danske Gymnasier eller en af de tilsvarende installere. Det

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger Kursus 02402 Introduktion til Statistik Forelæsning 4: Kapitel 5: Kontinuerte fordelinger Rune Haubo B Christensen (based on slides by Per Bruun Brockhoff) DTU Compute, Statistik og Dataanalyse Bygning

Læs mere

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable Landmålingens fejlteori - lidt om kurset Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet Kursusholder

Læs mere

Et eksempel på en todimensional normalfordeling Anders Milhøj September 2006

Et eksempel på en todimensional normalfordeling Anders Milhøj September 2006 Et eksempel på en todimensional normalfordeling Anders Milhøj September 006 I dette notat gennemgås et eksempel, der illustrerer den todimensionale normalfordelings egenskaber. Notatet lægger sig op af

Læs mere

2010 Matematik 2A hold 4 : Prøveeksamen juni 2010

2010 Matematik 2A hold 4 : Prøveeksamen juni 2010 1 of 7 31-05-2010 13:18 2010 Matematik 2A hold 4 : Prøveeksamen juni 2010 Welcome Jens Mohr Mortensen [ My Profile ] View Details View Grade Help Quit & Save Feedback: Details Report [PRINT] 2010 Matematik

Læs mere

Fable Kom godt i gang

Fable Kom godt i gang Fable Kom godt i gang Opdateret: 26-03-2018 Indholdsfortegnelse 1. Først skal du installere programmet på din computer 3 2. Når programmet er installeret er du klar til at pakke robotten ud 4 3. Nu er

Læs mere

Kom godt i gang med Fable-robotten

Kom godt i gang med Fable-robotten Kom godt i gang med Fable-robotten 1. Først skal du installere programmet på din computer. Gå ind på shaperobotics.com og under support vælger du download: Her vælger du, under PC App om du kører Windows

Læs mere

Aflevering 4: Mindste kvadraters metode

Aflevering 4: Mindste kvadraters metode Aflevering 4: Mindste kvadraters metode Daniel Østergaard Andreasen December 2, 2011 Abstract Da meget få havde løst afleveringsopgave 4, giver jeg har en mulig (men meget udførlig) løsning af opgaven.

Læs mere

Kursusgang 3 Matrixalgebra Repetition

Kursusgang 3 Matrixalgebra Repetition Kursusgang 3 Repetition - froberg@mathaaudk http://peoplemathaaudk/ froberg/oecon3 Institut for Matematiske Fag Aalborg Universitet 12 september 2008 1/12 Lineære ligningssystemer Et lineært ligningssystem

Læs mere

Normalfordelingen og Stikprøvefordelinger

Normalfordelingen og Stikprøvefordelinger Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger

Læs mere

Nanostatistik: Opgaver

Nanostatistik: Opgaver Nanostatistik: Opgaver Jens Ledet Jensen, 19/01/05 Opgaver 1 Opgaver fra Indblik i Statistik 5 Eksamensopgaver fra tidligere år 11 i ii NANOSTATISTIK: OPGAVER Opgaver Opgave 1 God opgaveskik: Når I regner

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 14. december 2009 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Gennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP()

Gennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP() Gennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP() John Andersen, Læreruddannelsen i Aarhus, VIA Et kast med 10 terninger gav følgende udfald Fig. 1 Result of rolling 10 dices

Læs mere

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen Statistik Lektion 3 Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen Repetition En stokastisk variabel er en funktion defineret på S (udfaldsrummet, der antager

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium Deskriptiv (beskrivende) statistik er den disciplin, der trækker de væsentligste oplysninger ud af et ofte uoverskueligt materiale. Det sker f.eks. ved at konstruere forskellige deskriptorer, d.v.s. regnestørrelser,

Læs mere

En meget kort introduktion til R på polit

En meget kort introduktion til R på polit En meget kort introduktion til R på polit Sebastian Barfort sebastian.barfort@econ.ku.dk Indhold 1 Introduktion 1 2 R som lommeregner 2 3 Tabeller, grafer og estimation 6 4 Økonomiske figurer 11 1 Introduktion

Læs mere

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som MLR antagelserne Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + u, hvor β 0, β 1, β 2,...,β k er ukendte parametere,

Læs mere

Multipel Lineær Regression

Multipel Lineær Regression Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer

Læs mere

Matematik for økonomer 3. semester

Matematik for økonomer 3. semester Matematik for økonomer 3. semester cand.oecon. studiet, 3. semester Planchesæt 2 - Forelæsning 3 Esben Høg Aalborg Universitet 10. september 2009 Institut for Matematiske Fag Aalborg Universitet Esben

Læs mere

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 33B, Rum 9 Danmarks Tekniske Universitet 28 Lyngby Danmark e-mail: pbac@dtu.dk Efterår

Læs mere

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange

Læs mere

Økonometri Lektion 1 Simpel Lineær Regression 1/31

Økonometri Lektion 1 Simpel Lineær Regression 1/31 Økonometri Lektion 1 Simpel Lineær Regression 1/31 Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Statistisk model: Vi antager at sammenhængen

Læs mere

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6 Institut for Matematiske Fag Matematisk Modellering 1 Aarhus Universitet Eva B. Vedel Jensen 25. februar 2008 UGESEDDEL 6 Forelæsningerne torsdag den 21. februar og tirsdag den 26. februar. Jeg har gennemgået

Læs mere

Note om Monte Carlo metoden

Note om Monte Carlo metoden Note om Monte Carlo metoden Kasper K. Berthelsen Version 1.2 25. marts 2014 1 Introduktion Betegnelsen Monte Carlo dækker over en lang række metoder. Fælles for disse metoder er, at de anvendes til at

Læs mere

Fable Kom godt i gang

Fable Kom godt i gang Fable Kom godt i gang Vers. 1.3.1 Opdateret: 29-08-2018 Indholdsfortegnelse 1. Installer programmet 3 2. Pak robotten ud 5 3. I gang med at programmere 6 4. Programmér Fable til at køre fra 90 til -90

Læs mere

Statistik II 4. Lektion. Logistisk regression

Statistik II 4. Lektion. Logistisk regression Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:

Læs mere

Vejledning til GYM17 Copyright Adept Nordic 2013

Vejledning til GYM17 Copyright Adept Nordic 2013 Vejledning til GYM17 Copyright Adept Nordic 2013 Vejledning i brug af Gym17-pakken... iv 1 Deskriptiv statistik... 1 1.1 Ikke-grupperede observationssæt... 1 1.2 Grupperede observationssæt... 4 2 Regressioner...

Læs mere

Maple 11 - Chi-i-anden test

Maple 11 - Chi-i-anden test Maple 11 - Chi-i-anden test Erik Vestergaard 2014 Indledning I dette dokument skal vi se hvordan Maple kan bruges til at løse opgaver indenfor χ 2 tests: χ 2 - Goodness of fit test samt χ 2 -uafhængighedstest.

Læs mere

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts. Teoretisk Statistik, 9 marts 2005 Empiriske analoger (Kap. 3.7) Normalfordelingen (Kap. 3.12) Opsamling på Kap. 3 nb. Det forventes ikke, at alt materialet dækkes d. 9. marts. 1 Empiriske analoger Betragt

Læs mere

n r x rs x r = 1 n r s=1 (x rs x r ) 2, s=1

n r x rs x r = 1 n r s=1 (x rs x r ) 2, s=1 (a) Denne opgave bygger på resultaterne fra 2 forsøg med epo-behandling af for tidligt fødte børn, idet gruppe 1 og 3 stammer fra første forsøg, mens gruppe 2 og 4 stammer fra det andet. Det må antages,

Læs mere

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =

Læs mere

Skriftlig Eksamen Kombinatorik, sandsynlighed og randomiserede algoritmer (DM528)

Skriftlig Eksamen Kombinatorik, sandsynlighed og randomiserede algoritmer (DM528) Skriftlig Eksamen Kombinatorik, sandsynlighed og randomiserede algoritmer (DM58) Institut for Matematik & Datalogi Syddansk Universitet Torsdag den 7 Januar 010, kl. 9 13 Alle sædvanlige hjælpemidler (lærebøger,

Læs mere

Programmering for begyndere Lektion 2. Opsamling mm

Programmering for begyndere Lektion 2. Opsamling mm Lektion 2 Opsamling mm God tone Der er indlagt spørge sessioner Lektion 2 - Agenda Programmering for Lidt ændringer til teknikken, herunder hvordan du genser en lektion Lidt generelle tilbagemeldinger

Læs mere

Kapitel 11 Lineær regression

Kapitel 11 Lineær regression Kapitel 11 Lineær regression Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 1 Indledning Vi modellerer en afhængig variabel (responset) på baggrund af en uafhængig variabel (stimulus),

Læs mere

En Introduktion til SAS. Kapitel 5.

En Introduktion til SAS. Kapitel 5. En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel

Læs mere

Fagets IT Introduktion til MATLAB

Fagets IT Introduktion til MATLAB Fagets IT Introduktion til MATLAB Mads G. Christensen mgc@kom.auc.dk Afdeling for Kommunikationsteknologi, Aalborg Universitet. MATLAB 2002 p.1/28 Kursusoversigt 1. Introduktion, matrix-indeksering, -operationer

Læs mere

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0. Landmålingens fejlteori Lektion 2 Transformation af stokastiske variable - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf12 Institut for Matematiske Fag Aalborg Universitet Repetition:

Læs mere

Stastistik og Databehandling på en TI-83

Stastistik og Databehandling på en TI-83 Stastistik og Databehandling på en TI-83 Af Jonas L. Jensen (jonas@imf.au.dk). 1 Fordelingsfunktioner Husk på, at en fordelingsfunktion for en stokastisk variabel X er funktionen F X (t) = P (X t) og at

Læs mere

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M. Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet March 1, 2013 Sandsynlighedsregning og lagerstyring Normalfordelingen

Læs mere

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 13: Summary Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Introduktion til CD ere og Arkivdeling Gammel Dok - September-oktober 2003. Jonas Christiansen Voss

Introduktion til CD ere og Arkivdeling Gammel Dok - September-oktober 2003. Jonas Christiansen Voss Introduktion til CD ere og Arkivdeling Gammel Dok - September-oktober 2003 Jonas Christiansen Voss 2. marts 2004 Indhold 1 CD ere 2 1.1 Brænde dokumenter til CD....................... 2 1.2 Disk Copy.................................

Læs mere

Indledning. På de følgende sider vises, primært i tegneserieform, lidt om mulighederne i PC-AXIS for Windows.

Indledning. På de følgende sider vises, primært i tegneserieform, lidt om mulighederne i PC-AXIS for Windows. Indledning PC-AXIS for Windows er et talbehandlingsprogram, der kan håndtere store mængder statistisk materiale. PC-AXIS giver mulighed for at arbejde videre med det statistiske materiale i egne programmer

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Statistik og Sandsynlighedsregning 2 Repetition og eksamen T-test Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige

Læs mere

I denne artikel, vil der blive gennemgået de grundlæggende PHP-funktioner, såsom udskrift til skærmen, tid og dato og if-sætningen.

I denne artikel, vil der blive gennemgået de grundlæggende PHP-funktioner, såsom udskrift til skærmen, tid og dato og if-sætningen. Denne guide er oprindeligt udgivet på Eksperten.dk Grundlæggende PHP I denne artikel, vil der blive gennemgået de grundlæggende PHP-funktioner, såsom udskrift til skærmen, tid og dato og if-sætningen.

Læs mere

Projekt 8.3 Hvordan undersøges om et talmateriale normalfordelt?

Projekt 8.3 Hvordan undersøges om et talmateriale normalfordelt? Projekt 8.3 Hvordan undersøges om et talmateriale normalfordelt? Projektet drejer sig om at udvikle en metode, til at undersøge om et givet talmateriale med rimelighed kan siges at være normalfordelt.

Læs mere

Appendiks Økonometrisk teori... II

Appendiks Økonometrisk teori... II Appendiks Økonometrisk teori... II De klassiske SLR-antagelser... II Hypotesetest... VII Regressioner... VIII Inflation:... VIII Test for SLR antagelser... IX Reset-test... IX Plots... X Breusch-Pagan

Læs mere

Introduktion til SPSS

Introduktion til SPSS Introduktion til SPSS Øvelserne på dette statistikkursus skal gennemføres ved hjælp af det såkaldte SPSS program. Det er erfaringsmæssigt sådan, at man i forbindelse af øvelserne på statistikkurser bruger

Læs mere

Matlab-kommandoer. Robert Jacobsen. 9. august 2010

Matlab-kommandoer. Robert Jacobsen. 9. august 2010 Matlab-kommandoer Robert Jacobsen 9. august 2010 1 Kommandoer til Matlabs funktionaliteter Ønsker man at køre Matlab fra terminalen, ses de mulige options med matlab -help. For at starte Matlab uden det

Læs mere

Vektorer og lineær regression

Vektorer og lineær regression Vektorer og lineær regression Peter Harremoës Niels Brock April 03 Planproduktet Vi har set, at man kan gange en vektor med et tal Et oplagt spørgsmål er, om man også kan gange to vektorer med hinanden

Læs mere

Løsning til eksaminen d. 29. maj 2009

Løsning til eksaminen d. 29. maj 2009 DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

praktiskegrunde Regression og geometrisk data analyse (2. del) Ulf Brinkkjær

praktiskegrunde Regression og geometrisk data analyse (2. del) Ulf Brinkkjær praktiskegrunde Praktiske Grunde. Nordisk tidsskrift for kultur- og samfundsvidenskab Nr. 3 / 2010. ISSN 1902-2271. www.hexis.dk Regression og geometrisk data analyse (2. del) Ulf Brinkkjær Introduktion

Læs mere

Landmålingens fejlteori - Repetition - Kontinuerte stokastiske variable - Lektion 3

Landmålingens fejlteori - Repetition - Kontinuerte stokastiske variable - Lektion 3 Landmålingens fejlteori Repetition - Kontinuerte stokastiske variable Lektion 4 - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf10 Institut for Matematiske Fag Aalborg Universitet 29. april

Læs mere

Vektorer og lineær regression. Peter Harremoës Niels Brock

Vektorer og lineær regression. Peter Harremoës Niels Brock Vektorer og lineær regression Peter Harremoës Niels Brock April 2013 1 Planproduktet Vi har set, at man kan gange en vektor med et tal. Et oplagt spørgsmål er, om man også kan gange to vektorer med hinanden.

Læs mere

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling.

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling. Eksempel: dæktyper og brændstofforbrug (opgave 25 side 319) Program: cars 1 2 3 4 5... radial 4.2 4.7 6.6 7.0 6.7... belt 4.1 4.9 6.2 6.9 6.8... Muligheder: 1. vi starter med at gennemgå opgave 7 side

Læs mere

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala 3 5% 5% 5% 0 3 4 5 6 7 8 9 0 Statistik for biologer 005-6, modul 5: Normalfordelingen opstår når mange forskellige faktorer uafhængigt af hinanden bidrager med additiv variation til. F.eks. Højde af rekrutter

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

Module 1: Introduktion til R, simpel regression

Module 1: Introduktion til R, simpel regression Department of Statistics ST502: Statistisk modellering Pia Veldt Larsen Module 1: Introduktion til R, simpel regression 1.1 Lineære modeller................................... 1 1.2 Simpel lineær regression..............................

Læs mere

Kursusgang 3 Matrixalgebra fortsat

Kursusgang 3 Matrixalgebra fortsat Kursusgang 3 fortsat - froberg@math.aau.dk http://people.math.aau.dk/ froberg/oecon3 Institut for Matematiske Fag Aalborg Universitet 12. september 2008 1/31 Nødvendige betingelser En nødvendig betingelse

Læs mere

IT opgave. Informationsteknologi B. Vejleder: Karl. Navn: Devran Kücükyildiz. Klasse: 2,4

IT opgave. Informationsteknologi B. Vejleder: Karl. Navn: Devran Kücükyildiz. Klasse: 2,4 IT opgave Informationsteknologi B Vejleder: Karl Navn: Devran Kücükyildiz Klasse: 2,4 Dato:03-03-2009 1 Indholdsfortegnelse 1. Indledning... 3 2. Planlægning... 3 Kommunikationsplanlægning... 3 Problemstillingen...

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Ex µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4. hvor. Vha. R: Vha. tabel:

Ex µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4. hvor. Vha. R: Vha. tabel: Normal fordeling Tæthedsfunktion for normalfordeling med middelværdi µ og varians σ 2 : Program (8.15-10): f() = 1 µ)2 ep( ( 2πσ 2 2σ 2 ) E µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4 1. vigtige sandsynlighedsfordelinger:

Læs mere