ØVELSE 2B. Formål Det primære formål med denne øvelse er at prøve nogle vigtige procedurer til statistisk og grafisk analyse.

Størrelse: px
Starte visningen fra side:

Download "ØVELSE 2B. Formål Det primære formål med denne øvelse er at prøve nogle vigtige procedurer til statistisk og grafisk analyse."

Transkript

1 ØVELSE 2B I denne øvelse gennemgår vi: Udskrivning ved hjælp af PUT. Procedurerne FREQ, UNIVARIATE og CORR. Overførsel af procedure-uddata til et datasæt. Fremstilling af histogrammer og XY-plots. Formål Det primære formål med denne øvelse er at prøve nogle vigtige procedurer til statistisk og grafisk analyse. PUT og FILE sætningerne Til normal udskrift er det mest simpelt at bruge PROC PRINT, men med PUT kan man styre udskriften fuldstændigt. PUT-sætningen kan bruges til output af data fra et datatrin til log-filen, eller til en vilkårlig uddata-fil. PUT kan opfattes som det modsatte af INPUT, og der gælder for begge den samme formatterings-syntaks. FILE-sætningen kan anvendes til definition af uddatafilen. Fx fører følgende til en udskrift af variablerne VAR1 og VAR2 i log-filen: PUT VAR1 VAR2; medens vi med nedenstående dirigerer udskriften til outputvinduet: FILE PRINT; PUT VAR1 VAR2; I det følgende eksempel vil udskriften af VAR1 blive placeret i kolonne og VAR2 i kolonne 30-40; VAR1 udskrives med 3 decimaler: FILE PRINT; PUT VAR VAR ; Der kan tilføjes en tekststreng (forklarende tekst) som et argument til PUT-sætningen: FILE PRINT; PUT 'Variabel 1 2 VAR2; fører til en forskydning af print-positionen til det pågældende kolonne-nummer inden udskrift af den efterfølgende variabel. Vi kan få en udskrift af de to variable på hver sin linie ved opsætningen: FILE PRINT; PUT 'Var 1 VAR1 #2 'Var 2 VAR2; Tegnet # bruges til at flytte skrivepositionen til det angivne linienummer (her linie 2). Samme resultat kan opnås ved: 1

2 FILE PRINT; PUT 'Var 1 VAR1 / 'Var 2 VAR2; idet tegnet / flytter skrivepositionen til næste linie i uddatafilen. Flere procedurer til dataanalyse I sidste øvelse arbejdede du med PROC MEANS, en procedure til univariat resumerende statistik. Nedenfor gennemgås nogle andre vigtige SAS-procedurer til simpel dataanalyse: PROC FREQ - fordeling af diskrete variable BASE SAS-proceduren PROC FREQ bruges til at at lave tabeller over den hyppighed (frekvens), hvormed de enkelte værdier forekommer inden for en eller flere variable (Frequency tables). Vi bruger datasættet MYSAS.DATA85 som eksempel: DATA TEMP; SET MYSAS.DATA85; PROC FREQ; TABLES ALDER KOEN; Programmet laver en tabel over hyppigheden (frekvensen) af de enkelte værdier for hver af de to variable ALDER og KOEN. Printfilen vises nedenfor i uddrag. Det fremgår af udskriften, at LABEL-sætningen har været anvendt ved oprettelse af dette datasæt (se overskrifterne Alder (år)' og Køn'). Alder (år) Cumulative Cumulative ALDER Frequency Percent Frequency Percent (udskriftlinier udeladt) Køn Cumulative Cumulative KOEN Frequency Percent Frequency Percent K M Tabellen viser, at der findes 5 personer med alderen 31 år (i 1985), 4 personer på 32 år etc. De to aldersklasser udgør hh. 13.9% og 11.1% af samtlige observationer. De to kolonner til højre viser de kumulative hyppigheder (antal personer med alder lig med eller mindre...). 2

3 Som det vises nedenfor et det også muligt at lade PROC FREQ lave en kryds-tabulering' (Crosstabulation.), hvilket opnås ved at placere tegnet * mellem variabelnavnene i TABLES-sætningen. Eksemplet viser også, at beregningerne kan foretages uden først at oprette det temporære datasæt TEMP: PROC FREQ DATA=MYSAS.DATA85; TABLES ALDER*KOEN; Et udsnit af printfilen produceret af dette program vises nedenfor: TABLE OF ALDER BY KOEN ALDER(Alder (år)) KOEN(Køn) Frequency Percent Row Pct Col Pct K M Total (udskriften fortsætter) Det er muligt at bryde krydstabuleringen op i yderligere niveauer, fx PROC FREQ; TABLES ALDER*KOEN*HAIRCOLR; hvor variablen HAIRCOLR antages at rumme værdier for personens hårfarve. Det har kun mening af anvende PROC FREQ i forbindelse med diskrete variable, dvs. variable, der kun kan antage et begrænset antal værdier, da PROC FREQ laver output for hver eneste værdi. Diskrete variable kan være enten af typen numeric eller character. For kontinuerte numeriske variable, fx VAEGT og HOEJDE, må vi bruge andre metoder til resumering, fx PROC MEANS eller PROC UNIVARIATE, der omtales nedenfor. 3

4 PROC UNIVARIATE - analyse af kontinuerte variable PROC UNIVARIATE, der også hører til BASE SAS bruges til deskriptiv statistik i forbindelse med variable af typen numeric. Den minder meget om PROC MEANS, men giver på flere punkter lidt mere detaljeret information. Det er også muligt at få PROC UNIVARIATE til udføre en test til belysning af, om en given variabel er normalfordelt. I eksemplet nedenfor anvendes proceduren til undersøgelse af den beregnede variable HOVERV i datasættet MYSAS.DATA85: DATA TEMP; SET MYSAS.DATA85; PROC SORT; BY KOEN; PROC UNIVARIATE NORMAL; VAR HOVERV; BY KOEN; Der foretages en separat analyse for hvert af de to køn (sætningen BY KOEN). Option NORMAL til procedurekaldet fører til beregning af en test-størrelse til vurdering af, hvorvidt den pågældende variable (HOVERV) er normalfordelt. En af disse test-størrelser (Shapiro-Wilk test for normalitet), W norm, er et tal i intervallet 0 < W norm 1. Små værdier af W norm fører til forkastelse af hypotesen om normalfordeling. Nedenstående vises den ene halvdel af udskriften fra PROC UNIVARIATE, svarende til KOEN = K'. Her er kun vist Shapiro-Wilk test. I nyere SAS-udgaver kommer der også resultatet af andre test for normalfordeling KOEN=K UNIVARIATE PROCEDURE Variable=HOVERV Moments N 15 Sum Wgts 15 Mean Sum Std Dev Variance Skewness Kurtosis USS CSS CV Std Mean T:Mean= Prob> T Sgn Rank 60 Prob> S Num ^= 0 15 W:Normal Prob<W

5 Quantiles(Def=5) 100% Max % % Q % % Med % % Q % % Min % % Range Q3-Q Mode 2.5 Extremes Lowest Obs Highest Obs ( 5) ( 7) ( 9) ( 8) 2.5 ( 15) ( 3) 2.5 ( 4) ( 2) ( 14) ( 13) Det konkluderes, at variablen HOVERV må antages at være normalfordelt. Pladsen tillader ikke en detaljeret beskrivelse af PROC UNIVARIATE's mange muligheder. Oplysning om den statistiske baggrund må søges i lærebøger i statistik. De eksempler på statistiske procedurer, der vises i denne vejledning skal alene give et indtryk af de opgaver, der kan løses ved hjælp af SAS, men det er ikke hensigten at komme nærmere ind på statistisk teori. Omvendt kan du godt gennemføre øvelsesprogrammet uden at forstå de statistiske aspekter i detaljer. PROC CORR - korrelationsanalyse Korrelationsanalyse anvendes til at afgøre, hvor god sammenhængen er mellem to stokastiske variable. Hvis store værdier af den ene variable fortrinsvis optræder sammen med store værdier af den anden, taler man om en positiv korrelation. Hvis omvendt store værdier af den ene variable optræder sammen med små værdier af den anden, tales om negativ korrelation. Korrelationskoefficenten r er et tal i intervallet -1 r 1. Værdien r = 1 svarer til en perfekt positiv korrelation, r = -1 til en perfekt negativ korrelation. Værdier af r i nærheden af 0 betyder, at der er ingen eller ringe korrelation mellem de to variable. Korrelationsanalyse kan udføres ved hjælp af BASE SAS-proceduren PROC CORR. I nedenstående eksempel bruges PROC CORR til at undersøge korrelationen mellem højde og vægt i datasættet MYSAS.DATA85: PROC CORR DATA=MYSAS.DATA85; VAR HOEJDE VAEGT; PROC CORR udskriver den beregnede r (Pearson correlation coefficient), samt sandsynligheden for at finde en r af denne størrelse, såfremt der ingen korrelation findes mellem de variable. OUTPUT-sætningen Det er muligt ved hjælp af OUTPUT-sætningen at få SAS til at sende procedure-uddata til et datasæt i stedet for til en fil: 5

6 PROC MEANS; VAR X; OUTPUT OUT=DATASET MEAN=MEANX; I OUTPUT-sætningen skal der således stå navnet på det datasæt, man vil lave, og de variable, man vil have lagt ned i datasættet. Navnet på datasættet angives ved OUT = datasæt'. Hvis man fx vil have middelværdien - som i dette tilfælde - skrives 'MEAN=' efterfulgt af et variabelnavn, man selv finder på. I dette tilfælde kommer middelværdien i det nye datasæt til at hedde MEANX, men valget af variabelnavn er dit; du kunne lige så godt have kaldt den HUGO', hvis du synes, det er pænere: OUTPUT OUT=DATASET MEAN=HUGO; Datasættet i eksemplet kommer kun til at indholde en observation, nemlig middelværdien for alle X. Man kan dele analysen op i grupper vha. BY-sætningen, fx BY KOEN'. I så fald kommer det nye datasæt til at indeholde en observation for hvert køn. Et andet eksempel på anvendelse af OUTPUT-sætningen, denne gang med PROC UNIVARIATE: PROC UNIVARIATE DATA=MYSAS.DATA85; VAR HOVERV; OUTPUT OUT=B N=NX MEAN=MEANX STD=STDX MEDIAN=MEDX; OUTPUT-sætningen gør det muligt at bruge uddata fra en SAS-procedure som inddata for en efterfølgende analyse med et andet SAS-program. GRAFIK Data kan afbildes grafisk på mange forskellige måder ved hjælp af SAS. BASE SAS-modulet indeholder procedurer (fx CHART, PLOT), der muliggør grafiske afbildninger i en almindelig printfil (linieskrivergrafik). SAS GRAPH-modulet indeholder mere avancerede grafiske procedurer (fx GCHART, GPLOT), der kan fremstille grafiske afbildninger på mange forskellige uddataenheder (grafisk skærm, plotter, laserprinter mm.). Nedenfor vises nogle simple eksempler, der tager udgangspunkt i datasættet MYSAS.DATA85. Histogrammer Antal personer i MYSAS.DATA85 kan angives i histogram-form ( frequency chart') ved hjælp af PROC CHART. Der benyttes lodrette søjler (VBAR = vertical bars'), og der skelnes mellem de to køn (KOEN): OPTIONS PS=23; PROC CHART DATA=MYSAS.DATA85; VBAR KOEN; Histogramsøjler, akser mm. tegnes' af PROC CHART på skærm eller printer ved hjælp af de almindelige ASCII-tegn. Der er altså ikke tale om egentlig grafik. Options-sætningen medfører, at histogrammet kan være på et almindeligt skærmbillede (23 linier). 6

7 Ved at bruge PROC GCHART i stedet for PROC CHART fås et histogram, der udnytter den pågældende uddataenheds grafiske egenskaber. I gamle dage var det alt for tidskrævende at bruge PROC GCHART under bearbejdelsen af SAS-programmet. I dag foretrækker de fleste bare at bruge procedurerne GCHART og GPLOT i stedet for CHART og PLOT. I de følgende eksempler produceres således sand grafik på PC'ens skærm. PROC GCHART DATA=MYSAS.DATA85; VBAR KOEN; Afbildningen kan modificeres på utallige måder. I forrige eksempel blev histogrammet omgivet af en rektangulær ramme (FRAME). I nedenstående eksempel fjerner vi denne ramme og forsyner figuren med en overskrift (TITLE1): TITLE1 'Helbredsdata 1985'; PROC GCHART DATA=MYSAS.DATA85; VBAR KOEN / NOFRAME; Hvis man i stedet foretrækker et histogram med vandrette søjler (HBAR = horisontal bars'), skrives: PROC GCHART DATA=MYSAS.DATA85; HBAR KOEN; Ved at bruge HBAR får man lidt flere oplysninger på grafen ude til højre for de vandrette søjler end med VBAR. Såfremt man foretrækker en afbildning af den procentiske fordeling mellem mænd og kvinder, snarere end det absolutte antal personer af hvert køn, bruges et percentage bar chart': PROC GCHART DATA=MYSAS.DATA85; VBAR KOEN / TYPE=PERCENT; Hvis man ønsker en grafisk præsentation af den gennemsnitlige alder i undersøgelsesmaterialet for medlemmerne af de to køn, igen i histogram-form, skrives: PROC GCHART DATA=MYSAS.DATA85; VBAR KOEN / TYPE=MEAN SUMVAR=ALDER; Et grafisk overblik over aldersfordelingen i undersøgelses-materialet kan også fås med PROC GCHART, her ved anvendelse af vandrette søjler: DATA TEMP; SET MYSAS.DATA85; PROC SORT; BY KOEN; PROC GCHART; HBAR ALDER; BY KOEN; 7

8 XY-plots Et XY-plot kan anvendes til grafisk at undersøge en evt. korrelation mellem to variable. XY-plot fremstilles ved hjælp af PROC PLOT eller PROC GPLOT. Nedenstående eksempel afbilder personernes højde som funktion af deres vægt: PROC GPLOT; PLOT HOEJDE*VAEGT; PROC GPLOT vil anvende forskellige symboler for de to køn, såfremt man skriver: PROC GPLOT; PLOT HOEJDE*VAEGT=KOEN; Farve og punktudseende kan bestemmes således: PROC GPLOT; SYMBOL1 V=STAR C=RED; PLOT HOEJDE*VAEGT=1; Hvis man vil forbinde punkterne med en ret linje mellem hvert punkt (og ikke vil have at selve punktet skal vises) skrives: SYMBOL1 V=NONE I=JOIN C=RED; V står for Value, C for Color og I for Interpollation, altså hvordan man vil forbinde punkterne. Denne option egner sig dog ikke til ovenstående program, men f.eks. hvis man havde fulgt en persons vægt gennem en tidsperiode, kunne man havde brugt den. Senere i kurset ser du også, hvordan du kan forbinde punkterne med en blød linje. På tilsvarende måde kan man i PROC CHART bruge PATTERN (se hjælpesystemet). 3-D grafik Vi slutter med et lidt mere komplekst eksempel. Nedenstående program opretter et datasæt bestående af sammenhørende værdier af X, Y og Z, hvorefter materialet afbildes tredimensionalt ved hjælp af PROC G3D. DATA HAT; DO X=-5 TO 5 BY.25; DO Y=-5 TO 5 BY.25; Z=SIN(SQRT(X*X + Y*Y)); OUTPUT; END; END; TITLE1 f=swiss 'The Cowboy Hat'; PROC G3D DATA=HAT; PLOT Y*X=Z; 8

9 En cowboy-hat, fremstillet ved hjælp af SAS. Øvelse 2b 1. Grafik: Gennemprøv de forskellige former for grafisk afbildning, der er omtalt på side 6-8 idet MYSAS.DAT85TOT på K:\EDB-KURS\WEEK2 anvendes som materiale. Datasættet MYSAS.DAT85TOT svarer til dit datasæt MYSAS.DATA85(DATA85.SAS7BDAT), som du lavede sidst der er bare kommet nogle flere observationer og en enkelt variabel mere. Du vil senere i kurset lære, hvordan man tilføjer nye observationer og variable til et eksisterende datasæt. 2. PROC FREQ: Lav et program, der i tabelform giver en oversigt over antal personer af hh. hankøn og hunkøn for hver alder i MYSAS.DAT85TOT. I datasættet ALL.SSD findes to diskrete værdier for hver af de to variable ACCLSAL og TESTSAL (tilpasnings-salinitet resp. forsøgs-salinitet). Lav en tabel, der viser antal observationer for alle de mulige kombinationer af ACCLSAL og TESTSAL. 3. PROC UNIVARIATE: Lav et program, der analyserer de to variabler HOVERV og SYSDIA i MYSAS.DAT85TOT. Analysen skal omfatte en vurdering af, om de to variable er normalfordelte. I datasættet ALL.SAS7BDAT findes den numeriske variabel EALA. Undersøg, om denne variabel kan antages at være normalfordelt inden for hver af de fire grupper, der defineres af de mulige værdier for ACCLSAL og TESTSAL. 4. PROC CORR: Undersøg for både mænd og kvinder korrelationen mellem variablerne HOEJDE og VAEGT i det permanente datasæt MYSAS.DAT85TOT. Er der holdepunkt for en positiv korrelation mellem de to variable? 9

10 Vis også korrelationen mellem de to variable i grafisk form. 5. PUT og FILE: Udskriv initialer og personnummer (i formatet ddmmåå-nnnn) for samtlige personer i MYSAS.DAT85TOT. Udskriv initialer, personnummer og vægt for alle personer i undersøgelsesmaterialet med en vægt over 80 kg i OUTPUT-sætningen, anvendt på MYSAS.DAT85TOT: Find ved hjælp af PROC UNIVARIATE den gennemsnitlige 1985-vægt (middelværdi og median) for hh. mænd og kvinder, og send resultatet til et permanent datasæt på H:-drevet. Prøv derefter PROC CONTENTS og PROC PRINT på det nyoprettede datasæt. Hvilke variable indeholder det, og hvad er deres værdi? 7. Programmet på side 8 frembringer et 3-dimensionalt plot. Prøv at køre programmet. Prøv at lave lidt om på programmet. Ved fx at skrive COS i stedet for SIN ændres figuren. Du kan få figuren til at dreje rundt ved f.eks. at tilføje ROTATE=0 T0 80 by 5 som option efter en / under PLOT, altså PLOT X*Y=Z / ROTATE=0 T0 90 by 5. Ligeledes kan du få figuren til at dreje op og ned ved samme sted at skrive TILT=0 TO 90 by 5. De to options kan kombineres. 10

En Introduktion til SAS. Kapitel 5.

En Introduktion til SAS. Kapitel 5. En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel

Læs mere

Kommentarer til øvelser i basalkursus, 2. uge

Kommentarer til øvelser i basalkursus, 2. uge Kommentarer til øvelser i basalkursus, 2. uge Opgave 2. Vi betragter målinger af hjertevægt (i g) og total kropsvægt (målt i kg) for 10 normale mænd og 11 mænd med hjertesvigt. Målingerne er taget ved

Læs mere

Regressionsanalyse i SAS

Regressionsanalyse i SAS Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Inge Henningsen Afdeling for Anvendt Matematik og Statistik December 2006 Regressionsanalyse uden gentagelser Regressionsanalyse

Læs mere

Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1

Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1 Statistik Formålet... 1 Mindsteværdi... 1 Størsteværdi... 1 Ikke grupperede observationer... 2 Median og kvartiler defineres ved ikke grupperede observationer således:... 2 Middeltal defineres ved ikke

Læs mere

En Introduktion til SAS

En Introduktion til SAS En Introduktion til SAS Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Februar 2005 6. udgave i FORORD til 1. udgave Denne introduktion til SAS til brug ved kurset Statistik

Læs mere

Kort intro til SAS. Efterår 2015. Janne Petersen Judith L Jacobsen Lene Theil Skovgaard

Kort intro til SAS. Efterår 2015. Janne Petersen Judith L Jacobsen Lene Theil Skovgaard Kort intro til SAS Efterår 2015 Janne Petersen Judith L Jacobsen Lene Theil Skovgaard 1 Hvorfor SAS Kan alt Alle ph.d. studerende har gratis adgang Fra universitetet eller hospitalerne Kode --- hjælp fra

Læs mere

SAS systemet SAS. SAS vinduer. 2012 Janne Petersen

SAS systemet SAS. SAS vinduer. 2012 Janne Petersen SAS systemet SAS 2012 Janne Petersen February 7, 2012 Styrken i SAS er dets evne til at håndtere store datasæt. Det er hurtigt og har mange statistiske og ikke-statistiske muligheder. Kan "alt", så det

Læs mere

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

Normalfordelingen og Stikprøvefordelinger

Normalfordelingen og Stikprøvefordelinger Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger

Læs mere

Kvantitative Metoder 1 - Forår 2007. Dagens program

Kvantitative Metoder 1 - Forår 2007. Dagens program Dagens program Kapitel 7 Introduktion til statistik Organisering af data Diskrete variabler Kontinuerte variabler Beskrivende statistik Fraktiler Gennemsnit Empirisk varians og spredning Empirisk korrelationkoe

Læs mere

Øvelser til basalkursus, 2. uge

Øvelser til basalkursus, 2. uge Øvelser til basalkursus, 2. uge Opgave 1 Vi betragter igen Sundby95-materialet, og skal nu forbedre nogle af de ting, vi gjorde sidste gang. 1. Gå ind i ANALYST vha. Solutions/Analysis/Analyst. 2. Filen

Læs mere

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/ Program: 1. Repetition af vigtige sandsynlighedsfordelinger: binomial, (Poisson,) normal (og χ 2 ). 2. Populationer og stikprøver 3. Opsummering af data vha. deskriptive størrelser og grafer. 1/29 Binomial

Læs mere

Hvorfor SAS Kort intro til SAS

Hvorfor SAS Kort intro til SAS Hvorfor SAS Kort intro til SAS Efterår 2015 Janne Petersen Judith L Jacobsen Lene Theil Skovgaard Kan alt Alle ph.d. studerende har gratis adgang Fra universitetet eller hospitalerne Kode --- hjælp fra

Læs mere

Modelkontrol i Faktor Modeller

Modelkontrol i Faktor Modeller Modelkontrol i Faktor Modeller Julie Lyng Forman Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for Biokemikere 2003 For at konklusionerne på en ensidet, flersidet eller hierarkisk

Læs mere

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium Deskriptiv (beskrivende) statistik er den disciplin, der trækker de væsentligste oplysninger ud af et ofte uoverskueligt materiale. Det sker f.eks. ved at konstruere forskellige deskriptorer, d.v.s. regnestørrelser,

Læs mere

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Microsoft Excel har en del standard anvendelsesmuligheder i forhold til den beskrivende statistik og statistisk

Læs mere

Forelæsning 11: Kapitel 11: Regressionsanalyse

Forelæsning 11: Kapitel 11: Regressionsanalyse Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1)

Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1) ; C ED 6 > Billedbehandling og mønstergenkendelse Lidt elementær statistik (version 1) Klaus Hansen 24 september 2003 1 Elementære empiriske mål Hvis vi har observationer kan vi udregne gennemsnit og varians

Læs mere

INTRODUKTION TIL dele af SAS

INTRODUKTION TIL dele af SAS INTRODUKTION TIL dele af SAS Der er flere forskellige angrebsvinkler ved statistiske analyser i SAS. Vi skal her kun beskæftige os med to af disse, nemlig Direkte programmering. Brug af SAS ANALYST Hvilken

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1

Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1 Statistik Formålet... 1 Mindsteværdi... 1 Størsteværdi... 1 Ikke grupperede observationer... 2 Median og kvartiler defineres ved ikke grupperede observationer således:... 2 Middeltal defineres ved ikke

Læs mere

Øvelser i epidemiologi og biostatistik, 6. april 2010 Baseline-informationer fra Ebeltoft datasættet Eksempel på besvarelse

Øvelser i epidemiologi og biostatistik, 6. april 2010 Baseline-informationer fra Ebeltoft datasættet Eksempel på besvarelse Øvelser i epidemiologi og biostatistik, 6. april 2010 Baseline-informationer fra Ebeltoft datasættet Eksempel på besvarelse 1. Hvor stor en andel af deltagerne var mænd? Var der samme andel i de tre randomiseringsgrupper?.

Læs mere

Program dag 2 (11. april 2011)

Program dag 2 (11. april 2011) Program dag 2 (11. april 2011) Dag 2: 1) Hvordan kan man bearbejde data; 2) Undersøgelse af datamaterialet; 3) Forskellige typer statistik; 4) Indledende dataundersøgelser; 5) Hvad kan man sige om sammenhænge;

Læs mere

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1 Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen

Læs mere

Statistik (deskriptiv)

Statistik (deskriptiv) Statistik (deskriptiv) Ikke-grupperede data For at behandle ikke-grupperede data i TI, skal data tastes ind i en liste. Dette kan gøres ved brug af List, hvis ikon er nr. 5 fra venstre på værktøjsbjælken

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af

Læs mere

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved Matematisk Modellering 1 (reeksamen) Side 1 Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved { 1 hvis x {1, 2, 3}, p X (x) = 3 0 ellers,

Læs mere

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede

Læs mere

Afdeling for Anvendt Matematik og Statistik Januar Regressionsanalyse i SAS 2. Regressionsanalyse med GLM Sammenligning af regressionslinier

Afdeling for Anvendt Matematik og Statistik Januar Regressionsanalyse i SAS 2. Regressionsanalyse med GLM Sammenligning af regressionslinier Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Inge Henningsen Afdeling for Anvendt Matematik og Statistik Januar 2007 2 Regressionsanalyse med GLM Sammenligning af regressionslinier

Læs mere

Tips og tricks til Proc Means. Per Andersen

Tips og tricks til Proc Means. Per Andersen Tips og tricks til Proc Means Capgemini gruppen Grundlagt 1967 i Paris, startet i Danmark 1984 Omsætning på verdensplan i 2008 8,7 milliader euro 91.600 medarbejdere på verdensplan, heraf 300 i Danmark

Læs mere

Løsning til opgave 7, 9, 10 og 11C Matematik B Sommer 2014

Løsning til opgave 7, 9, 10 og 11C Matematik B Sommer 2014 Vejledning til udvalgte opgave fra Matematik B, sommer 2014 Opgave 7 Størrelsen og udbudsprisen på 100 fritidshuse på Rømø er indsamlet via boligsiden.dk. a) Grafisk præsentation, der beskriver fordelingen

Læs mere

ØVELSE 2A. Ex_2a. Data-trin faciliteter: DATA sætningen INPUT sætningen CARDS sætningen INFILE sætningen LIST sætningen

ØVELSE 2A. Ex_2a. Data-trin faciliteter: DATA sætningen INPUT sætningen CARDS sætningen INFILE sætningen LIST sætningen ØVELSE 2A I denne øvelse gennemgår vi: Anvendelse af PROC CONTENTS til klarlægning af et SAS-datasæts struktur. Hvad forstås ved SAS informat og format? SAS-variablers længde. LABEL-sætningen. Manipulation

Læs mere

Projekt 1 Spørgeskemaanalyse af Bedst på Nettet

Projekt 1 Spørgeskemaanalyse af Bedst på Nettet Projekt 1 Spørgeskemaanalyse af Bedst på Nettet D.29/2 2012 Udarbejdet af: Katrine Ahle Warming Nielsen Jannie Jeppesen Schmøde Sara Lorenzen A) Kritik af spørgeskema Set ud fra en kritisk vinkel af spørgeskemaet

Læs mere

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Introduktion Kursusholder: Kasper K. Berthelsen Opbygning: Kurset består af 5 blokke En blok består af: To normale

Læs mere

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Lineær regression. Simpel regression. Model. ofte bruges følgende notation: Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til

Læs mere

2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900.

2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900. 2 -fordeling og 2 -test Generelt om 2 -fordelingen 2 -fordelingen er en kontinuert fordeling, modsat binomialfordelingen som er en diskret fordeling. Fordelingen er særdeles kompleks at beskrive med matematiske

Læs mere

Statistik. Introduktion Deskriptiv statistik Sandsynslighedregning

Statistik. Introduktion Deskriptiv statistik Sandsynslighedregning Statistik Introduktion Deskriptiv statistik Sandsynslighedregning Introduktion Kasper K. Berthelsen, Institut f. Mat. Fag 8 Kursusgange Individuel mundtlig eksamen (7-skala) Udgangspunkt i opgaver Software:

Læs mere

Indhold Grupperede observationer... 1 Ugrupperede observationer... 3 Analyse af normalfordelt observationssæt... 4

Indhold Grupperede observationer... 1 Ugrupperede observationer... 3 Analyse af normalfordelt observationssæt... 4 BH Test for normalfordeling i WordMat Indhold Grupperede observationer... 1 Ugrupperede observationer... 3 Analyse af normalfordelt observationssæt... 4 Grupperede observationer Vi tager udgangspunkt i

Læs mere

Variansanalyse i SAS. Institut for Matematiske Fag December 2007

Variansanalyse i SAS. Institut for Matematiske Fag December 2007 Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Institut for Matematiske Fag December 2007 Variansanalyse i SAS 2 Tosidet variansanalyse Residualplot Tosidet variansanalyse

Læs mere

Ex µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4. hvor. Vha. R: Vha. tabel:

Ex µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4. hvor. Vha. R: Vha. tabel: Normal fordeling Tæthedsfunktion for normalfordeling med middelværdi µ og varians σ 2 : Program (8.15-10): f() = 1 µ)2 ep( ( 2πσ 2 2σ 2 ) E µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4 1. vigtige sandsynlighedsfordelinger:

Læs mere

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper. 1. Indlæs data. * HUSK at angive din egen placering af filen; data framing; infile '/home/sro00/mph2016/framing.txt' firstobs=2; input id sex age frw sbp sbp10 dbp chol cig chd yrschd death yrsdth cause;

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på

Læs mere

Basal statistik. 30. januar 2007

Basal statistik. 30. januar 2007 Basal statistik 30. januar 2007 Deskriptiv statistik Typer af data Tabeller Grafik Summary statistics Lene Theil Skovgaard, Biostatistisk Afdeling Institut for Folkesundhedsvidenskab, Københavns Universitet

Læs mere

Postoperative komplikationer

Postoperative komplikationer Løsninger til øvelser i kategoriske data, oktober 2008 1 Postoperative komplikationer Udgangspunktet for vurdering af den ny metode må være en nulhypotese om at der er samme komplikationshyppighed, 20%.

Læs mere

Skriftlig eksamen Science statistik- ST501

Skriftlig eksamen Science statistik- ST501 SYDDANSK UNIVERSITET INSTITUT FOR MATEMATIK OG DATALOGI Skriftlig eksamen Science statistik- ST501 Torsdag den 21. januar Opgavesættet består af 5 opgaver, med i alt 13 delspørgsmål, som vægtes ligeligt.

Læs mere

Oversigt. Kursus 02402 Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Eksponential fordelingen

Oversigt. Kursus 02402 Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Eksponential fordelingen Kursus 02402 Introduktion til Statistik Forelæsning 4: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Introduktion til SPSS

Introduktion til SPSS Introduktion til SPSS Øvelserne på dette statistikkursus skal gennemføres ved hjælp af det såkaldte SPSS program. Det er erfaringsmæssigt sådan, at man i forbindelse af øvelserne på statistikkurser bruger

Læs mere

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Introduktion Kasper K. Berthelsen, Inst f. Matematiske Fag Omfang: 8 Kursusgang I fremtiden

Læs mere

For nemheds skyld: m = 2, dvs. interesseret i fordeling af X 1 og X 2. Nemt at generalisere til vilkårligt m.

For nemheds skyld: m = 2, dvs. interesseret i fordeling af X 1 og X 2. Nemt at generalisere til vilkårligt m. 1 Uge 11 Teoretisk Statistik 8. marts 2004 Kapitel 3: Fordeling af en stokastisk variabel, X Kapitel 4: Fordeling af flere stokastiske variable, X 1,,X m (på en gang). NB: X 1,,X m kan være gentagne observationer

Læs mere

Statistiske modeller

Statistiske modeller Statistiske modeller Statistisk model Datamatrice Variabelmatrice Hændelse Sandsynligheder Data Statistiske modeller indeholder: Variable Hændelser defineret ved mulige variabel værdier Sandsynligheder

Læs mere

n r x rs x r = 1 n r s=1 (x rs x r ) 2, s=1

n r x rs x r = 1 n r s=1 (x rs x r ) 2, s=1 (a) Denne opgave bygger på resultaterne fra 2 forsøg med epo-behandling af for tidligt fødte børn, idet gruppe 1 og 3 stammer fra første forsøg, mens gruppe 2 og 4 stammer fra det andet. Det må antages,

Læs mere

Tips og tricks til Proc Means. Per Andersen Senior IM Consultant Dong Energy, Group IT, Trading IT, Analytics

Tips og tricks til Proc Means. Per Andersen Senior IM Consultant Dong Energy, Group IT, Trading IT, Analytics Tips og tricks til Proc Means Per Andersen Senior IM Consultant Dong Energy, Group IT, Trading IT, Analytics ENERGI I FORANDRING Marts 2012 DONG Energy er en af Nordeuropas førende energikoncerner med

Læs mere

for gymnasiet og hf 2017 Karsten Juul

for gymnasiet og hf 2017 Karsten Juul for gymnasiet og hf 75 50 5 017 Karsten Juul Statistik for gymnasiet og hf 017 Karsten Juul 5/11-017 Nyeste version af dette hæfte kan downloades fra http://mat1.dk/noter.htm Hæftet må benyttes i undervisningen

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable Normal fordelingen Normal fordelingen Egenskaber ved normalfordelingen Standard normal fordelingen Find sandsynligheder ud fra tabel Transformation af normal fordelte variable Invers transformation Repetition

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Statistik FSV 4. semester 2014 Øvelser Uge 2: 11. februar

Statistik FSV 4. semester 2014 Øvelser Uge 2: 11. februar Århus 6. februar 2014 Morten Frydenberg Statistik FSV 4. semester 2014 Øvelser Uge 2: 11. februar Til disse øvelser har I brug for fishoil1.dta, der indeholder data fra det fiskeolie forsøg vi så på ved

Læs mere

SPSS introduktion Om at komme igang 1

SPSS introduktion Om at komme igang 1 SPSS introduktion Om at komme igang 1 af Henrik Lolle, oktober 2003 Indhold Indledning 1 Indgang til SPSS 2 Frekvenstabeller 3 Deskriptive statistikker gennemsnit, standardafvigelse, median osv. 4 Søjlediagrammer

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Adgangsgivende eksamen (udeladt kategori: Matematisk student med matematik på niveau A)

Adgangsgivende eksamen (udeladt kategori: Matematisk student med matematik på niveau A) Økonometri 1 Forår 2003 Ugeseddel 13 Program for øvelserne: Gruppearbejde Opsamling af gruppearbejdet og introduktion af SAS SAS-øvelser i computerkælderen Øvelsesopgave 6: Hvem består første årsprøve

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Institut for Matematiske Fag Sandsynlighedsregning og Statistik 2. R opgaver

Institut for Matematiske Fag Sandsynlighedsregning og Statistik 2. R opgaver Institut for Matematiske Fag Sandsynlighedsregning og Statistik 2 Københavns Universitet Susanne Ditlevsen og Helle Sørensen R opgaver Det er en god ide at vænne sig til at skrive kommandoerne i en editor

Læs mere

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som MLR antagelserne Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + u, hvor β 0, β 1, β 2,...,β k er ukendte parametere,

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger Kursus 02402 Introduktion til Statistik Forelæsning 4: Kapitel 5: Kontinuerte fordelinger Rune Haubo B Christensen (based on slides by Per Bruun Brockhoff) DTU Compute, Statistik og Dataanalyse Bygning

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences Basal Statistik - SPSS Multipel regression. Lene Theil Skovgaard 10. oktober 2017 1 / 12 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Figurer: s.

Læs mere

Schweynoch, 2003. Se eventuelt http://www.mathematik.uni-kassel.de/~fathom/projekt.htm.

Schweynoch, 2003. Se eventuelt http://www.mathematik.uni-kassel.de/~fathom/projekt.htm. Projekt 8.5 Hypotesetest med anvendelse af t-test (Dette materiale har været anvendt som forberedelsesmateriale til den skriftlige prøve 01 for netforsøget) Indhold Indledning... 1 χ -test... Numeriske

Læs mere

Statistik kommandoer i Stata opdateret 22/ Erik Parner

Statistik kommandoer i Stata opdateret 22/ Erik Parner Statistik kommandoer i Stata opdateret 22/4 2008 Erik Parner Indledning... 1 Simple beskrivelser... 1 Data manipulation... 1 Estimation af proportioner... 2 Estimation af rater... 2 Estimation af Relativ

Læs mere

Produkt og marked - matematiske og statistiske metoder

Produkt og marked - matematiske og statistiske metoder Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring

Læs mere

Reeksamen i Statistik for Biokemikere 6. april 2009

Reeksamen i Statistik for Biokemikere 6. april 2009 Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for Biokemikere 6. april 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet er på

Læs mere

Matematik B. Højere handelseksamen. Vejledende opgave 1

Matematik B. Højere handelseksamen. Vejledende opgave 1 Matematik B Højere handelseksamen Vejledende opgave 1 Efterår 011 Prøven består af to delprøver. Delprøven uden hjælpemidler består af opgave 1 til 5 med i alt 5 spørgsmål. Besvarelsen af denne delprøve

Læs mere

ØVELSESGANG 1A EDB PROGRAMMER SAS SOM PROGRAMMERINGSSPROG

ØVELSESGANG 1A EDB PROGRAMMER SAS SOM PROGRAMMERINGSSPROG ØVELSESGANG 1A EDB PROGRAMMER Et EDB program er en serie instruktioner, skrevet i et sprog som maskinen forstår. Helt generelt består et program af et hoved, en header, og en body der indeholder input/output

Læs mere

R / RStudio. Intro til R / RStudio

R / RStudio. Intro til R / RStudio R / RStudio Intro til R / RStudio R R er et open source statstikprogram og programmeringssprog introduceret i 1993. Seneste version er 2.15.3 R kan downloades på www.r-project.org R er i udgangspunktet

Læs mere

LØNSPREDNINGSOPGØRELSER NU TILGÆNGELIG I LOPAKS

LØNSPREDNINGSOPGØRELSER NU TILGÆNGELIG I LOPAKS LØNSPREDNINGSOPGØRELSER NU TILGÆNGELIG I LOPAKS INDHOLD 2 Formål 2 LOPAKS 3 Begreber 6 Eksempler 6. december 2010 LOPAKS er nu udvidet med en ny tabel, der giver mulighed for at opgøre lønspredning på

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Personlig stemmeafgivning

Personlig stemmeafgivning Ib Michelsen X 2 -test 1 Personlig stemmeafgivning Efter valget i 2005 1 har man udspurgt en mindre del af de deltagende, om de har stemt personligt. Man har svar fra 1131 mænd (hvoraf 54 % har stemt personligt

Læs mere

KURSUS I ANALYSEPORTALEN (AP) DANSK PALLIATIV DATABASE 3 1. ÅBNING AF ANALYSEPORTALEN 3 2. OPRETTELSE AF EN RAPPORT DVS. START AF DATAANALYSE 4

KURSUS I ANALYSEPORTALEN (AP) DANSK PALLIATIV DATABASE 3 1. ÅBNING AF ANALYSEPORTALEN 3 2. OPRETTELSE AF EN RAPPORT DVS. START AF DATAANALYSE 4 KURSUS I ANALYSEPORTALEN (AP) DANSK PALLIATIV DATABASE 3 1. ÅBNING AF ANALYSEPORTALEN 3 2. OPRETTELSE AF EN RAPPORT DVS. START AF DATAANALYSE 4 3. VALG AF DATA 5 4. BEHANDLING OG VISNING AF DATA 7 1 Liste

Læs mere

Analyse af en lineær regression med lav R 2 -værdi

Analyse af en lineær regression med lav R 2 -værdi Analyse af en lineær regression med lav R 2 -værdi Denne gennemgang omhandler figur 13 i Regn med biologi. Man kan sagtens lave beregninger på egne data. Forsøgsmæssigt kræver det bare en tommestok tapet

Læs mere

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt) I dag Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt) Helle Sørensen Repetition vha eksempel om dagligvarepriser Analyse med R: ttest

Læs mere

Undervisningsbeskrivelse

Undervisningsbeskrivelse Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin aug-juni 10/11 Institution Campus Vejle Handelsgymnasie Uddannelse Fag og niveau Lærer(e) Hold HHX Statistik

Læs mere

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet Matematik A Studentereksamen Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet stx11-matn/a-080501 Tirsdag den 8. maj 01 Forberedelsesmateriale til stx A Net MATEMATIK Der

Læs mere

Statistik II 1. Lektion. Analyse af kontingenstabeller

Statistik II 1. Lektion. Analyse af kontingenstabeller Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression

Læs mere

Opgavebesvarelse, Basalkursus, uge 3

Opgavebesvarelse, Basalkursus, uge 3 Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt

Læs mere

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten.

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten. Opgavebesvarelse, Resting metabolic rate I filen T:\rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991 og Owen et.al.,

Læs mere

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 3: Kontinuerte fordelinger. Per Bruun Brockhoff

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 3: Kontinuerte fordelinger. Per Bruun Brockhoff Course 242/2323 Introducerende Statistik Forelæsning 3: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 22 Danmarks Tekniske Universitet 28 Lyngby Danmark

Læs mere

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 13: Summary Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test.

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test. Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ -test og Goodness of Fit test. Anvendelser af statistik Statistik er et levende og fascinerende emne, men at læse om det er alt

Læs mere

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =

Læs mere

Statistik Lektion 2. Betinget sandsynlighed Bayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV Binomialfordelingen

Statistik Lektion 2. Betinget sandsynlighed Bayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV Binomialfordelingen Statistik Lektion etinget sandsynlighed ayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV inomialfordelingen Repetition Udfaldsrum S Hændelse S Simpel hændelse O i 1, 3 4,

Læs mere

Gennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP()

Gennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP() Gennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP() John Andersen, Læreruddannelsen i Aarhus, VIA Et kast med 10 terninger gav følgende udfald Fig. 1 Result of rolling 10 dices

Læs mere

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Anvendt Statistik Lektion 7. Simpel Lineær Regression Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot

Læs mere

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Århus 8. april 2011 Morten Frydenberg Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Opgave 1 ( gruppe 1: sp 1-4, gruppe 5: sp 5-9 og gruppe 6: 10-14) I denne opgaveser vi på et

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller

Læs mere

Modul 7: Eksempler. 7.1 Beskrivende dataanalyse. 7.1.1 Diagrammer. Bent Jørgensen. Forskningsenheden for Statistik ST501: Science Statistik

Modul 7: Eksempler. 7.1 Beskrivende dataanalyse. 7.1.1 Diagrammer. Bent Jørgensen. Forskningsenheden for Statistik ST501: Science Statistik Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 7: Eksempler 7.1 Beskrivende dataanalyse............................... 1 7.1.1 Diagrammer.................................

Læs mere

Øvelser i epidemiologi og biostatistik, 12. april 2010 Ebeltoft-projektet: Analyse af alkoholrelaterede data mm. Eksempel på besvarelse

Øvelser i epidemiologi og biostatistik, 12. april 2010 Ebeltoft-projektet: Analyse af alkoholrelaterede data mm. Eksempel på besvarelse Øvelser i epidemiologi og biostatistik, 12. april 21 Ebeltoft-projektet: Analyse af alkoholrelaterede data mm. Eksempel på besvarelse 1. Belys ud fra data ved 5 års follow-up den fordom, at der er flere

Læs mere

Betinget fordeling Uafhængighed. Beregning af forventet tabel Chi-kvadrat teststatistik Chi-kvadrat test. Chi-kvadratfordelingen Agresti - Summary

Betinget fordeling Uafhængighed. Beregning af forventet tabel Chi-kvadrat teststatistik Chi-kvadrat test. Chi-kvadratfordelingen Agresti - Summary 1 Kontingenstabeller Betinget fordeling Uafhængighed 2 Chi-kvadrat test for uafhængighed Beregning af forventet tabel Chi-kvadrat teststatistik Chi-kvadrat test. Chi-kvadratfordelingen Agresti - Summary

Læs mere

Deskriptiv statistik for hf-matc

Deskriptiv statistik for hf-matc Deskriptiv statistik for hf-matc 75 50 25 2018 Karsten Juul Deskriptiv statistik for hf-matc Hvad er deskriptiv statistik? 1.1 Hvad er deskriptiv statistik?... 1 1.2 Hvad er grupperede og ugrupperede data?...

Læs mere

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere