Phd-kursus i Basal Statistik, Opgaver til 1. uge
|
|
- Simone Brandt
- 5 år siden
- Visninger:
Transkript
1 Phd-kursus i Basal Statistik, Opgaver til 1. uge Opgave 1: Wright For 17 patienter er der målt peak expiratory flow rate (maksimal udåndingshastighed, i l/min) på to forskellige måder, dels ved at anvende det traditionelle Wright peak flow meter, og dels med det nye såkaldte mini Wright flow meter (Bland and Altman, 1986). Med begge apparater er der foretaget dobbeltbestemmelser, således at der i alt foreligger 4 observationer for hver person. 1. Indlæs data i SPSS (menuen File/Open/Data...). Til en start kan vi se på et plot af dobbeltbestemmelser mod hinanden, for hver af de to målemetoder med et scatterplot (Graphs/Chart builder...) hvor de to målinger trækkes ind på hhv. x- og y-aksen: 1
2 Referencelinjer kan tilføjes i graf-editoren som åbnes ved at dobbeltklikke på grafen. Det ses, at observationerne fordeler sig rimeligt omkring en linie (den blå regressionslinie, fuldt optrukket), og hvis man kigger nærmere efter, er denne linie næsten identitetslinien (den røde skraverede), og dermed vil vi umiddelbart sige, at dobbeltbestemmelserne stemmer rimeligt godt overens. De efterfølgende spørgsmål skal lede igennem forskellige betragtninger vedrørende vurdering af hver af målemetoderne samt sammenligning af de to målemetoder. Det endelige formål er at kvantificere overensstemmelsen mellem de to målemetoder (hhv. Wright og Mini Wright). 2. Vurder (for hver af de to målemetoder for sig) om differensen mellem dobbeltmålinger afhænger af niveauet af lungefunktionen. En god metode til dette er det såkaldte Bland-Altman plot (scatter plot af differenser mod gennemsnit). Vi har nu brug for at ændre i datasættet wright, fordi vi skal danne nogle nye variable. Nedenfor udregner vi differenser mellem dobbeltbestemmelser for hver af metoderne, gennemsnit af selvsamme dobbeltbestemmelser, samt (til brug for spm. 6) differenser mellem gennemsnit af de to metoder (dif) samt gennemsnittet af disse gennemsnit (gnsnit, som altså blot er gennemsnittet af alle fire målinger). De nye variable laves med Transform/Compute variable (en gang for hver ny variabel) eller ved at skrive følgende kode i en SYNTAX-fil og køre den: 2
3 COMPUTE wright_dif=wright1-wright2. COMPUTE wright_gs=(wright1+wright2)/2. COMPUTE mini_dif=mini1-mini2. COMPUTE mini_gs=(mini1+mini2)/2. COMPUTE dif=wright_gs-mini_gs. COMPUTE gnsnit=(wright_gs+mini_gs)/2. EXECUTE. Vi laver herefter (for hver af målemetoderne for sig) et scatter-plot af differenserne mod gennemsnittet, hvorved vi får figurerne Disse figurer går under betegnelsen Bland-Altman plots, efter artiklen Bland&Altman(1986). Vi ser af disse plots, at differenserne generelt ligger i et bånd omkring 0 af nogenlunde lige stor bredde hele vejen, omend det lille antal observationer ikke tillader alt for kategoriske konklusioner. Der synes at være en enkelt person, hvor der er meget stor forskel mellem de to observationer af mini. Vi vil komme tilbage til dette senere. 3. Reproducerbarhed: Udregn og fortolk limits of agreement (normalområde for differenser), igen separat for hver af metoderne, uden at transformere. Vurder rimeligheden af de nødvendige antagelser. Limits of agreement er normalområder for differenserne, så vi skal finde gennemsnit og spredning for disse, ved hjælp af Descriptives i menuen 3
4 Analyze/Descriptive Statistics. Vi gør dette for alle tre differenser på en gang ved at tilføje dem på en gang: hvorved vi får Descriptive Statistics wright_dif mini_dif dif Valid N (listwise) N Minimum Maximum Mean Std. Deviation 17-54,00 51,00 4, , ,00 33,00-2, , ,00 51,50-6, , Vi går ud fra, at de 17 personer ikke er familiemæssigt relateret, og at de 17 differenser derfor er uafhængige. For at anvende ovenstående spredninger til at udregne normalområder, skal vi yderligere sikre os, at differenserne er rimeligt normalfordelte og nogenlunde af samme størrelsesorden uanset niveau. Det sidste var netop hvad vi vurderede i spørgsmålet ovenfor, så tilbage står antagelsen om normalitet. Nedenfor ses histogrammer for hhv. wright_dif og mini_dif og vi ser, at der er nogen afvigelse fra en normalfordeling. Usikkerheden i vurderingen er imidlertid stor med så få observationer. Endvidere er vist et fraktildiagram, selv om vi må erkende, at vi ikke 4
5 med nogen rimelighed kan vurdere normalfordelingstilpasningen med så få observationer. Derfor bliver limits-of-agreement også usikre, hvilket vi vil komme tilbage til nedenfor i en teknisk note. Figurerne kan dannes på flere måder, som alle findes i menuen Analyze/Descriptive Statistics. Undermenuen Frequencies giver histogrammer med en overlagt normalfordelingskurve, Q-Q Plots... laver udelukkende Q-Q plots mens Explore... kan begge dele, blot uden en standardkurve for normalfordeling på histogrammet. Menuvalgene og syntaxen til de tre forskellige måder at lave plots på ser således ud: 5
6 FREQUENCIES VARIABLES=wright_dif mini_dif /FORMAT=NOTABLE /HISTOGRAM NORMAL /ORDER=ANALYSIS. PPLOT /VARIABLES=wright_dif mini_dif 6
7 /NOLOG /NOSTANDARDIZE /TYPE=Q-Q /FRACTION=BLOM /TIES=MEAN /DIST=NORMAL. EXAMINE VARIABLES=wright_dif mini_dif /PLOT HISTOGRAM NPPLOT /STATISTICS DESCRIPTIVES /CINTERVAL 95 /MISSING LISTWISE /NOTOTAL. Med outputtet fra Explore får man også tests for normalitet (som man normalt ikke får meget relevant information fra, fordi de plejer at blive godkendt, når man har få observationer og forkastet, når man har mange...) giver faktisk her en afvisning for Mini Wright, på trods af det sparsomme materiale: 7
8 Tests of Normality Kolmogorov-Smirnov a Shapiro-Wilk Statistic df Sig. Statistic df Sig. wright_dif 0, ,142 0, ,065 mini_dif 0, ,167 0, ,002 a. Lilliefors Significance Correction Denne afvisning - ligesom i øvrigt det lave antal observationer - gør, at vi skal tage de nedenfor udregnede grænser med et stort forbehold. Vi finder limits of agreement til Wright: 4.94 ± = ( 38.50, 48.38) Mini Wright: 2.88 ± = ( 60.62, 54.86) Betydningen af limits of agreement er, at differenserne mellem dobbeltbestemmelser med 95% sandsynlighed vil ligge indenfor disse grænser, dvs. de udtrykker troværdigheden af en enkelt måling med hver af apparaterne. Da datamaterialet er så lille, kunne vi også have valgt at bruge en passende t-fraktil til at udregne disse normalområder, det ville i så fald være med 16 frihedsgrader, altså Teknisk note 1: Man kunne ligeledes overveje, om man skulle kræve, at differenserne havde middelværdi 0 og dermed estimere spredningen ved 1 17 p=1 dif2 p i stedet for p=1 (dif p dif) 2 Herved ville vi få symmetriske normalområder (limits of agreement): Wright: 0 ± = ±43.30 Mini Wright: 0 ± = ± Teknisk note 2: Usikkerhed på grænserne: Paa grund af det lille materiale, vil selve grænserne være ret usikkert 3 bestemt, nemlig med en standard error på ca. s, hvilket her giver n Wright: 8
9 3 nedre grænse: ± 2 17 øvre grænse: ± = ( 66.6, 30.1) = (20.3, 56.7) Mini Wright: 3 nedre grænse: ± = ( 79.1, 30.6) 17 øvre graense: ± = (36.4, 84.9) Det ses af ovenstående, at grænserne er frygteligt dårligt bestemt ud fra så få observationer, så når man vil udtale sig om limits-of-agreement (eller normalområder generelt) bør man have langt flere observationer Hvilken af metoderne har den bedste reproducerbarhed? Baseret på de udregnede limits of agreement ovenfor, ser det ud som om Wright metoden har en noget bedre reproducerbarhed end Mini Wright, idet dens limits of agreement er smallest. Man kunne godt lave et egentligt test for dette, men det fører alt for vidt her...specielt naar vi lige har indset, hvor usikre, disse graenser er. 5. Tegn et scatter plot af de numeriske differenser mellem dobbeltbestemmelser, med de to metoder paa hver sin akse, og vurder på baggrund af dette, om der er nogle personer, der ser ud til at være mere ustabile at måle på end andre. Den venstre af figurerne nedenfor viser de to sæt differenser (med fortegn) plottet mod hinanden, medens den højre figur plotter de tilsvarende numeriske (absolutte) differenser, dannet ved f.eks. COMPUTE abs_wright_dif=abs(wright_dif). COMPUTE abs_mini_dif=abs(mini_dif). EXECUTE. Hvis fortegnet på differensen skønnes at være vigtigt (hvis der f.eks. ses en generel stigning fra første til anden måling) bør venstre figur benyttes, ellers er højre lettere at se på. 9
10 Vi skal vurdere om der er enkelte personer, der har store differenser mellem dobbeltbestemmelserne for begge målemetoder, og dette ses ikke umiddelbart at være tilfældet. Vi har (som tidligere bemærket) en enkelt person med en stor diskrepans mellem de to målinger for Mini Wright, men denne person har pænt overensstemmende målinger for Wright apparaturet, så man kan ikke sige, at vedkommende er svær at måle på. Sådanne personer, der er svære at måle på ses i andre sammenhænge, såsom vurdering af leverstørrelse, hvor overvægtige personer er sværere at vurdere. 6. Overensstemmelse: Sammenlign nu gennemsnittene af dobbeltbestemmelserne for de to metoder, dvs. tegn igen Bland-Altman plot og udregn limits of agreement, denne gang for sammenligning af de to målemetoder. Kommenter den kliniske anvendelighed af disse grænser. Vi arbejder nu videre med de to gennemsnit, ovenfor kaldet wright_gs hhv. mini_gs. Igen skal vi se på et plot af differenser (dif) mod gennemsnit (gnsnit) samt vurdere rimeligheden af normalfordelingsantagelsen, inden vi går over til at udregne normalområder for differenserne. De relevante tegninger er 10
11 og ved hjælp af Descriptives finder vi de størrelser, vi skal bruge til at udregne normalområder Descriptive Statistics N Minimum Maximum Mean Std. Deviation dif Valid N (listwise) 17-92,00 51,50-6, , Selv om det (igen) er lidt vovet på så få observationer, udregner vi nu limits of agreement til Wright vs. Mini Wright: 6.03 ± = ( 72.43, 60.37) Når vi anvender disse grænser i praksis, skal vi huske på, at de er udregnet på baggrund af gennemsnit af to dobbeltbestemmelser. Hvis dette ikke er sædvanlig klinisk praksis, dvs. hvis man i praksis kun foretager en enkelt måling, så vil disse grænser være for snævre! 7. Er der systematisk forskel på de to målemetoder? Kvantificer! 11
12 Vi interesserer os her for middelværdierne af de to målemetoder, nærmere betegnet om disse afviger signifikant fra hinanden. Igen er der tale om parrede observationer (gennemsnittene wright_gs hhv mini_gs), så vi ser enten på differenserne dif og tester om disse har middelværdi 0 eller foretager et parret t-test, som findes i menuen Analyze/Compare Means/Paired Samples T Test. Forudsætningen for dette er rimelig normalitet for differenserne, hvilket vi allerede checkede ovenfor. Vi ser altså, at T-testet giver teststørrelsen t=-0.75, svarende til P=0.47, og altså ingen signifikant forskel på de to målemetoder. En tilsvarende konklusion opnås fra et nonparametrisk test. Hermed kan vi imidlertid ikke være sikre på, at der ingen forskel er, så vi kvantificerer den sandsynlige forskel ved et konfidensinterval for forskellen mellem middelværdier, som her aflæses fra outputtet til at være ( 23.10, 11.04) 12
13 Vi kan altså ikke udelukke at forskellen på middelværdierne kan være op til ca. 10 den ene vej eller lidt over 20 den anden vej. 8. Hvis en forskel på 75 l/min skønnes at have klinisk betydning, kan vi så erstatte Wright med det nye mini Wright? Her skal vi vurdere om der hyppigt forekommer forskelle på 75 l/min, når man måler to gange på samme person med hvert af de to forskellige apparater. Ud fra limits of agreement ser vi, at 75 l/min ligger udenfor det, der normalt forekommer, dvs. det, der forekommer i 95% af tilfældene. Det vil således være relativt sjældent, at vi blot ved et tilfælde ser klinisk betydelige afvigelser mellem de to målemetoder, igen forudsat at vi til daglig virkelig benytter gennemsnit af dobbeltbestemmelser! Sluttelig skal vi se to figurer (High-Low plots), der forsøger at medtage alle observationer på en gang: For hver person råder vi over 4 observationer, 2 med hver målemetode. Disse 4 er opsat som linjer, idet dobbeltbestemmelser foretaget med samme målemetode er forbundet med et liniestykke. Figurerne er illustrative, fordi de både viser overensstemmelsen mellem de to typer af måleappartur (ligger krydsene cirka på identitetslinien?) samt reproducerbarheden for hver af metoderne (hhv. længden af stregerne). Det, vi så i spørgsmål 3, var, at det traditionelle apparatur (wright) var en anelse bedre 13
14 end det nye (mini), hvilket her svarer til, stregerne til højre er en anelse kortere end dem til venstre. Vi kan af tegningen se, at dette hovedsagelig skyldes en enkelt person, hvor der var stor uoverensstemmelse mellem de to mini-målinger. Reference: Bland, J.M. and Altman, D.G. (1986). Statistical methods for assessing agreement between two methods of clinical measurement. Lancet, i,
15 Opgave 2: Sundby Vi betragter nu et lille uddrag af det såkaldte Sundby95-materiale, der er en stor undersøgelse af københavnernes sundhed. Det totale datasæt ligger på hjemmesiden som præfabrikeret datasæt med et lille udpluk af informationerne i tekstfilen Sundby_lille, indeholdende variablene (i den nævnte rækkefølge) kon: Personens køn (1: mand, 2:kvinde) v75: Personens vægt, i kg v76: Personens højde, i cm v17: Fysisk aftivitet i fritid (kategorier 1-4, lave tal betyder mest aktiv) v24af: Antal drukkede genstande sidste weekend 1. Indlæs data og omdøb variablene, så de har forståelige navne. Vi skal i det følgende kun bruge kon, v75 og v76, så vi nøjes med at omdøbe de to sidstnævnte til hhv vaegt og hoejde. Samtidig definerer vi den ekstra variabel bmi, som kommenteres senere. Vi benytter Transform/Compute variable, hvor vi f.eks. sætter hoejde som Target Variable og skriver v75/100 i definitionsfeltet. Herefter vil den nye variabel hoejde (som angiver højden i meter) være tilføjet datasættet. Tilsvarende med de to andre variabeldefinitioner: hoejde=v76/100 vaegt=v75 bmi=vaegt/hoejde**2 Herefter kan man angive value labels til variablen kon ved at vælge Variable View i bunden af dataset-skærmbilledet og klikke på Values: 15
16 Nogle observationer indeholder ikke en angivelse for køn, og disse må vi slette. I menuen vælges Data/Select Cases: Nu har vi foretaget et par ændringer i vores datasæt sundby, nemlig: Sletning af observationer med ukendt køn Definition af en mere forståelig angivelse af kønnet Mere intuitive betegnelser for højde- og vægt-variable, samt omkodning af højde fra cm til m 16
17 Definition af en ny variabel, bmi, se nedenfor under spm Lav en illustration af vægtfordelingen (v75) for mænd hhv. kvinder (brug f.eks. Box plots eller histogrammer), og beskriv også fordelingen i tal, dvs. gennemsnit, median, spredning mv. Box plottene kan laves med Graphs/Chart Builder, hvor man vælger BoxPlot (det simple yderst til venstre), sætter vaegt på Y-aksen og kon på X-aksen: Boxplottene kommer da til at se således ud: 17
18 Bemærk: Hvis Boxplottene ikke får fornuftige akser, kan man selv gå ind og definere dem ved at klikke Element properties, markere Y-Axis1 under Edit Properties of og sætte f.eks. Minimum under Custom til et bestemt tal. De synes at vise en vis skævhed i fordelingerne, så lad os se nærmere på histogrammer for at vurdere tilpasningen til normalfordelingen (som skal bruges i næste spørgsmål). I forbindelse med histogrammerne udregner vi også 2.5% og 97.5% fraktilerne, idet vi benytter Frequencies under Analyze/Descriptive Statistics, men fordi vi vil have resultaterne opdel på køn, skal vi først bruge Data/Split file, hvor vi vælger Compare Groups og sætter kon over i Groups Based on: 18
19 Bemærk: Split File er slået til indtil man slår det fra igen! Vær desuden opmærksom på at selv om man vælger Compare Groups har dette kun effekt på opstillingen af data - Der foretages ingen statistiske sammenligninger! Nu kan vi køre Frequencies, og for nemhes skyld (for at kunne bruge det senere) gør vi det for alle de kvantitative variable på en gang. Vi sætter derfor vaegt, hoejde og bmi over i Variables, klikker Statistics og afkrydser det ønskede, herunder Percentiles, hvor man skriver 2,5/Add og 97,5/Add/Continue. Fjern også fluebenet ved Display frequency tables. Under Charts Histograms, med flueben i Show normal curve on histogram. 19
20 Herved får vi følgende output: 20
21 Statistics Køn vægt (kg) højde (m) bmi Male N Valid Missing Mean 78,4883 1, ,2284 Median 77,0000 1, ,8088 Std. Deviation 11, , ,20476 Minimum 34,00 1,55 11,63 Maximum 140,00 2,00 39,64 Percentiles 2,5 58,0000 1, , ,5 106,0000 1, ,7947 Female N Valid Missing Mean 64,8959 1, ,1517 Median 63,0000 1, ,4191 Std. Deviation 11, , ,91164 Minimum 32,00 1,48 13,67 Maximum 117,00 1,98 37,37 Percentiles 2,5 47,0000 1, , ,5 92,0000 1, ,3502 Page 1 21
22 Ikke overraskende kan vi konstatere, at mændene vejer mere end kvinderne. En del af årsagen hertil kunne jo være, at de også er højere (og det er de jo, hvilket også klart ses af såvel boxplot som summary statistics). 3. Kommenter fundene fra forrige spørgsmålet med henblik på at konstruere normalområder for vægten, for hvert køn for sig. Bestem et sådant normalområde, både med og uden brug af normalfordelingsantagelsen. Hvordan passer de sammen? Udfra gennemsnit og spredning udregner vi normalområder under antagelse af, at vi har at gøre med normalfordelinger for hvert køn. Her er udregningerne foretaget i R, som (bl.a.) fungerer som regnemaskine: 22
23 > c(-2,2)*11.44 [1] > c(-2,2)* [1] Normalområderne for vægten er således: Kvinder: (42.0, 87.8) kg Mænd: (54.7, 102.3) kg Sammenligner vi med 2 1% og 97 1 % fraktilerne, som blev udregnet med 2 2 Frequencies: Statistics Køn vægt (kg) højde (m) bmi Male N Valid Missing Mean 78,4883 1, ,2284 Median 77,0000 1, ,8088 Std. Deviation 11, , ,20476 Minimum 34,00 1,55 11,63 Maximum 140,00 2,00 39,64 Percentiles 2,5 58,0000 1, , ,5 106,0000 1, ,7947 Female N Valid Missing Mean 64,8959 1, ,1517 Median 63,0000 1, ,4191 Std. Deviation 11, , ,91164 Minimum 32,00 1,48 13,67 Maximum 117,00 1,98 37,37 Percentiles 2,5 47,0000 1, , ,5 92,0000 1, ,3502 ser vi, at de normalfordelingsbaserede intervaller skyder lidt for lavt, fordi de ikke tager hensyn til den lille skævhed, der er i fordelingerne. 4. Det ser klart ud til, at mændene vejer mere end kvinderne. Hvordan kunne man forklare det? 23
24 Det har vi allerede berørt ovenfor: Det kan skyldes, at mændene er højere - men det kan selvfølgelig også skyldes kraftigere knoglebygning, større muskler osv. 5. Lav et scatterplot af vægt overfor højde (v76), med forskellige symboler for mænd og kvinder. Ser det ud som om vægtforskellen kan forklares ved at mænd generelt er højere end kvinder? Først må vi ind og aflyse Data/Split File ved i stedet at sætte fluebenet tilbage i Analyze all cases, do not create groups. Scatterplottet kræver farver for at man skal kunne se forskel på kønnene. Derfor laves et Grouped Scatter plot (Scatter/Dot, nr. 2 fra venstre i Graphs/Chart Builder, hvor kon trækkes over i group boksen øverst til højre, hoejde sættes på X-aksen og vaegt på Y-aksen. Resultatet bliver: Umiddelbart ser det på plottet ud som om højden kan forklare en god del af forskellen på vægten på mænd og kvinder. 24
25 Et velkendt højde-korrigeret mål for vægt er body mass index (BMI), der defineres som BMI = vægt i kg højde i meter, kvadreret 6. Bestem nu et normalområde for bmi ved hjælp af en normalfordelingsantagelse. Vi tager lige et kig på figurerne svarende til vægten ovenfor, nu blot for body mass index, bmi: 25
26 Her supplerer vi med fraktildiagrammer, som kan dannes på flere måder. Vi skal have Data/Split File tilbage på banen og kan derefter enten bruge Analyze/Descriptive Statistics/Q-Q Plots med bmi i Variables eller via Analyze/Descriptive Statistics/Explore/Plots, hvor man sætter flueben i Normality Plots with tests og fjerner fluebenet ved Stem-and-leaf. Vi får figurerne: Igen ser vi, at normalfordelingen næppe er helt rimelig, da der ses en skævhed i fordelingen. Vi fortsætter alligevel, men sørger for at 26
27 huske, at vi ikke kan stole helt på udregninger, der baserer sig på normalfordelingsantagelsen. Det ville nok være en bedre ide at foretage udregningerne på de logaritmetransformerede værdier og så tilbagetransformere endepunkterne... Statistics bmi Male N Valid Missing Mean Median Std. Deviation Minimum Maximum Percentiles 2,5 97,5 Female N Valid Missing Mean Median Std. Deviation Minimum Maximum Percentiles 2,5 97, , ,8088 3, ,63 39,64 19, , , ,4191 3, ,67 37,37 17, ,3502 Vi benytter de ovenfor udregnede størrelser fra Frequencies (husk Split File... og udregner (her gjort ved hjælp af R): c(-2,2)* = c(-2,2)* = Normalområderne for body mass index er således: Kvinder: (15.3,31.0) Mænd: (17.8,30.6) Hvordan passer det med den faktiske fordeling (fraktiler=percentiler)? De direkte udregnede fraktiler for body mass index ses i outputtet fra Frequencies og vi ser, at de normalfordelingsbaserede grænser 27
28 her ligger lidt lavere end de, der er baseret på fraktilerne. Hvor mange procent falder udenfor det normalfordelingsbaserede område? Her skal man lige lave lidt ekstra omkodning, så det er et lidt svært spørgsmål. V i laver en ny variabel, bmigroup ved hjælp af Transform/Recode Into Different Variables (gøres for hvert køn ved at benytte If-knappen nederst i boxen, hvor man afkrydser Include if case satisfies condition og skriver enten kon=1 eller kon=2): Sæt nu bmi over i Numeric Variable -- Group Variable og skriv bmigroup i Output Variable/Name (og evt. BMI Gruppe i Label). Herefter defineres værdierne for bmigroup således: Sæt flueben i Output Variables are strings Klik Range/LOWEST through Value, sæt value til nedre grænse for normalvægt for det pågældende køn og klik Add Klik Range/LOWEST through Value, sæt value til nedre grænse for normalvægt for det pågældende køn og klik Add Klik Range/Value through HIGHEST, sæt value til øvre grænse for normalvægt for det pågældende køn og klik Add Hernæst kan vi opgøre fordelingen som procent med Crosstabs i Analyze/Descriptive Statistics (som vi kommer til at se nærmere på senere på kurset): Sæt kon i Rows, bmigroup i Column(s) 28
29 og klik Cells, hvor man afkrydser Counts: Observed og i Percentages: Row: Vi får så outputtet 29
30 Case Processing Summary Cases Valid Missing Total N Percent N Percent N Percent Køn * BMI Gruppe ,0% 0 0,0% ,0% Køn * BMI Gruppe Crosstabulation BMI Gruppe Køn Male Count % within Køn Female Count % within Køn Total Count % within Køn Normalvægtig Overvægtig Ukendt BMI Undervægtig ,8% 4,5% 2,9% 0,8% ,0% 5,1% 4,7% 0,2% ,8% 4,8% 3,9% 0,5% Køn * BMI Gruppe Crosstabulation Køn Male Count % within Køn Female Count % within Køn Total Count % within Køn Total ,0% ,0% ,0% Page 1 30
31 Vi finder altså ret få (under 1%), der ligger under normalområdet (og altså ville blive vurderet til at være for tynde), men lidt for mange, der ligger over (4-5%). Hvordan ser normalområderne ud, hvis de er baseret på en normalfordelingsantagelse for logaritmen til bmi? Vi bemærkede ovenfor en vis skævhed i (bl.a) fordelingen af bmi, og en deraf følgende diskrepans mellem normalområder udregnet dels fra gennemsnit og spredning og dels fra de empiriske fraktiler. Denne skævhed forsøger vi nu at transformere os ud af, idet vi definerer log10bmi=lg10(bmi) under Transform/Compute. Vi kan nu gentage figurerne fra tidligere, blot med denne transformerede variabel, og finder: 31
32 32
33 Disse figurer synes at vise en noget bedre normalfordelingstilpasning end den utransformerede variabel, og vi fortsætter derfor med at udregne summary statistics for denne: Igen regner vi videre i R, idet vi i et hug udregner normalområder for den logaritmerede variabel, samt tilbagetransformerer til den oprindelige skala. Dette kan selvfølgelig også gøres i flere trin og med en lommeregner: > 10^( c(-2,0,2)*0.0698) 33
34 [1] > 10^( c(-2,0,2)*0.0557) [1] Normalområderne for body mass index er således: Kvinder: (16.6,31.5) Mænd: (18.6,31.1) hvilket er en smule bedre i overensstemmelse med områderne, som udregnes fra de empiriske fraktiler. Man kan evt. gå videre med denne opgave og se på forskellige forklarende variable for BMI. Måske er BMI højt for fysisk inaktive personer (v17) personer, der drikker meget (v24af) 34
Phd-kursus i Basal Statistik, Opgaver til 1. uge
Phd-kursus i Basal Statistik, Opgaver til 1. uge Opgave 1: Wright For 17 patienter er der målt peak expiratory flow rate (maksimal udåndingshastighed, i l/min) på to forskellige måder, dels ved at anvende
Læs merePhd-kursus i Basal Statistik, Opgaver til 1. uge Opgave 1: Sundby
Phd-kursus i Basal Statistik, Opgaver til 1. uge Opgave 1: Sundby Vi betragter et lille uddrag af det såkaldte Sundby95-materiale, der er en stor undersøgelse af københavnernes sundhed. Det totale datasæt
Læs merePhd-kursus i Basal Statistik, Opgaver til 1. uge
Phd-kursus i Basal Statistik, Opgaver til 1. uge Opgave 1: Wright For 17 patienter er der målt peak expiratory flow rate (maksimal udåndingshastighed, i l/min) på to forskellige måder, dels ved at anvende
Læs mereBasal Statistik - SPSS
Faculty of Health Sciences Basal Statistik - SPSS Begreber. Parrede sammenligninger. Lene Theil Skovgaard 5. september 2017 1 / 16 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides
Læs mereKommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge
Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge Opgave 1. Data indlæses i 3 kolonner, som f.eks. kaldessalt,pre ogpost. Der er således i alt tale om 26 observationer, idet de to grupper lægges
Læs mereVejledende besvarelse af hjemmeopgave, efterår 2018
Vejledende besvarelse af hjemmeopgave, efterår 2018 Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (30. oktober.-1. november). Der er foretaget en del undersøgelser af krigsveteraner og
Læs mereSPSS appendix SPSS APPENDIX. Box plots. Indlæsning. Faculty of Health Sciences. Basal Statistik: Sammenligning af grupper, Variansanalyse
Faculty of Health Sciences SPSS APPENDIX SPSS appendix Basal Statistik: Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 12. september 2017 med instruktioner til SPSS-analyse svarende til
Læs mereFaculty of Health Sciences. SPSS appendix. Basal Statistik: Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 22.
Faculty of Health Sciences SPSS appendix Basal Statistik: Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 22. januar 2018 1 / 20 SPSS APPENDIX med instruktioner til SPSS-analyse svarende
Læs mereSPSS appendix SPSS APPENDIX. Box plots. Indlæsning. Faculty of Health Sciences. Basal Statistik: Sammenligning af grupper, Variansanalyse
Faculty of Health Sciences SPSS APPENDIX SPSS appendix Basal Statistik: Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 11. februar 2019 med instruktioner til SPSS-analyse svarende til nogle
Læs mereBasal Statistik - SPSS
Faculty of Health Sciences Basal Statistik - SPSS Kovariansanalyse. Lene Theil Skovgaard 1. oktober 2018 1 / 12 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Bland-Altman plot,
Læs mereBasal Statistik - SPSS
Faculty of Health Sciences Basal Statistik - SPSS Kovariansanalyse. Lene Theil Skovgaard 3. oktober 2017 1 / 12 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Bland-Altman plot,
Læs mereKommentarer til øvelser i basalkursus, 2. uge
Kommentarer til øvelser i basalkursus, 2. uge Opgave 2. Vi betragter målinger af hjertevægt (i g) og total kropsvægt (målt i kg) for 10 normale mænd og 11 mænd med hjertesvigt. Målingerne er taget ved
Læs mereVejledende besvarelse af hjemmeopgave, efterår 2017
Vejledende besvarelse af hjemmeopgave, efterår 2017 Udleveret 3. oktober 2017, afleveres senest ved øvelserne i uge 44 (31. okt.-2. nov. 2017) På hjemmesiden http://publicifsv.sund.ku.dk/~lts/basal17_2/hjemmeopgave/hjemmeopgave.txt
Læs mereBasal Statistik - SPSS
Faculty of Health Sciences Basal Statistik - SPSS Regressionsanalyse. Lene Theil Skovgaard 5. februar 2018 1 / 12 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Indlæsning og
Læs mereBasal Statistik - SPSS
Faculty of Health Sciences Basal Statistik - SPSS Multipel regression. Lene Theil Skovgaard 10. oktober 2017 1 / 12 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Figurer: s.
Læs mereEpidemiologi og Biostatistik
Kapitel 1, Kliniske målinger Epidemiologi og Biostatistik Introduktion til skilder (varianskomponenter) måleusikkerhed sammenligning af målemetoder Mogens Erlandsen, Institut for Biostatistik Uge, torsdag
Læs mereIntroduktion til SPSS
Introduktion til SPSS Øvelserne på dette statistikkursus skal gennemføres ved hjælp af det såkaldte SPSS program. Det er erfaringsmæssigt sådan, at man i forbindelse af øvelserne på statistikkurser bruger
Læs mereEpidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april
Århus 8. april 2011 Morten Frydenberg Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Opgave 1 ( gruppe 1: sp 1-4, gruppe 5: sp 5-9 og gruppe 6: 10-14) I denne opgaveser vi på et
Læs mereVejledende besvarelse af hjemmeopgave, forår 2018
Vejledende besvarelse af hjemmeopgave, forår 2018 Udleveret 12. februar, afleveres senest ved øvelserne i uge 10 (6.-9.marts) I forbindelse med reagensglasbehandling blev 100 par randomiseret til to forskellige
Læs mereBasal Statistik - SPSS
Faculty of Health Sciences Basal Statistik - SPSS Korrelerede målinger. Lene Theil Skovgaard 8. april 2019 1 / 21 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Plots: s. 3, 4,
Læs mereVi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten.
Opgavebesvarelse, Resting metabolic rate I filen T:\rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991 og Owen et.al.,
Læs mereBasal Statistik - SPSS
Faculty of Health Sciences APPENDIX Basal Statistik - SPSS Korrelerede målinger. Lene Theil Skovgaard 8. april 2019 med instruktioner til SPSS-analyse svarende til nogle af slides Plots: s. 3, 4, 7, 11-12
Læs mereLøsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)
Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up
Læs mereIkke-parametriske tests
Ikke-parametriske tests 2 Dagens menu t testen Hvordan var det nu lige det var? Wilcoxson Mann Whitney U Kruskall Wallis Friedman Kendalls og Spearmans correlation 3 t-testen Patient Drug Placebo difference
Læs mereØvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger
Øvelser til basalkursus, 5. uge Opgavebesvarelse: Knogledensitet hos unge piger I alt 112 piger har fået målt knogledensitet (bone mineral density, bmd) i 11-års alderen (baseline værdi). Pigerne er herefter
Læs mereAnvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af
Læs mere1 Hb SS Hb Sβ Hb SC = , (s = )
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.
Læs mereStatistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Introduktion Kursusholder: Kasper K. Berthelsen Opbygning: Kurset består af 5 blokke En blok består af: To normale
Læs mereBasal Statistik - SPSS
Faculty of Health Sciences APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Basal Statistik - SPSS Den generelle lineære model. Lene Theil Skovgaard 24. oktober 2017 Biokemisk iltforbrug,
Læs mereBasal Statistik - SPSS
Faculty of Health Sciences Basal Statistik - SPSS Den generelle lineære model. Lene Theil Skovgaard 26. februar 2018 1 / 28 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Biokemisk
Læs mereMultipel Lineær Regression
Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer
Læs mereOpgavebesvarelse, Basalkursus, uge 3
Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt
Læs mereSPSS introduktion Om at komme igang 1
SPSS introduktion Om at komme igang 1 af Henrik Lolle, oktober 2003 Indhold Indledning 1 Indgang til SPSS 2 Frekvenstabeller 3 Deskriptive statistikker gennemsnit, standardafvigelse, median osv. 4 Søjlediagrammer
Læs mereVejledende besvarelse af hjemmeopgave, forår 2017
Vejledende besvarelse af hjemmeopgave, forår 2017 På hjemmesiden http://publicifsv.sund.ku.dk/~lts/basal17_1/hjemmeopgave/hjemmeopgave.txt ligger data fra 400 fødende kvinder. Der er tale om et uddrag
Læs mereØvelser til basalkursus, 2. uge
Øvelser til basalkursus, 2. uge Opgave 1 Vi betragter igen Sundby95-materialet, og skal nu forbedre nogle af de ting, vi gjorde sidste gang. 1. Gå ind i ANALYST vha. Solutions/Analysis/Analyst. 2. Filen
Læs merePhd-kursus i Basal Statistik, Opgaver til 2. uge
Phd-kursus i Basal Statistik, Opgaver til 2. uge Opgave 1: Sædkvalitet Filen oeko.sav på hjemmesiden indeholder datamateriale til belysning af forskellen i sædkvalitet mellem SAS-ansatte og mænd, der lever
Læs mereEn Introduktion til SAS. Kapitel 5.
En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel
Læs mere6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag)
Institut for Folkesundhed Afdeling for Biostatistik Afdeling for Epidemiologi. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag) Opgave 1 Udgangspunktet for de følgende spørgsmål er artiklen:
Læs mereVejledende besvarelse af hjemmeopgave, forår 2019
Vejledende besvarelse af hjemmeopgave, forår 2019 Udleveret 4. marts, afleveres senest ved øvelserne i uge 13 (26. marts.-28. marts). På hjemmesiden http://staff.pubhealth.ku.dk/~lts/basal19_1/hjemmeopgave.html
Læs mere3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve
Læs mereOpgavebesvarelse, Basalkursus, uge 3
Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt
Læs mereLøsning til eksamen d.27 Maj 2010
DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1
Læs mereDet kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.
1. Indlæs data. * HUSK at angive din egen placering af filen; data framing; infile '/home/sro00/mph2016/framing.txt' firstobs=2; input id sex age frw sbp sbp10 dbp chol cig chd yrschd death yrsdth cause;
Læs mereMPH specialmodul Epidemiologi og Biostatistik
MPH specialmodul Epidemiologi og Biostatistik Kvantitative udfaldsvariable 23. maj 2011 www.biostat.ku.dk/~sr/mphspec11 Susanne Rosthøj (Per Kragh Andersen) 1 Kapitelhenvisninger Andersen & Skovgaard:
Læs mereStatistik FSV 4. semester 2014 Øvelser Uge 2: 11. februar
Århus 6. februar 2014 Morten Frydenberg Statistik FSV 4. semester 2014 Øvelser Uge 2: 11. februar Til disse øvelser har I brug for fishoil1.dta, der indeholder data fra det fiskeolie forsøg vi så på ved
Læs mereAnvendt Statistik Lektion 7. Simpel Lineær Regression
Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot
Læs mereKonfidensintervaller og Hypotesetest
Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller
Læs mereProgram. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter
Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs mereBinomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/
Program: 1. Repetition af vigtige sandsynlighedsfordelinger: binomial, (Poisson,) normal (og χ 2 ). 2. Populationer og stikprøver 3. Opsummering af data vha. deskriptive størrelser og grafer. 1/29 Binomial
Læs mereProgram dag 2 (11. april 2011)
Program dag 2 (11. april 2011) Dag 2: 1) Hvordan kan man bearbejde data; 2) Undersøgelse af datamaterialet; 3) Forskellige typer statistik; 4) Indledende dataundersøgelser; 5) Hvad kan man sige om sammenhænge;
Læs mereØvelser i epidemiologi og biostatistik, 6. april 2010 Baseline-informationer fra Ebeltoft datasættet Eksempel på besvarelse
Øvelser i epidemiologi og biostatistik, 6. april 2010 Baseline-informationer fra Ebeltoft datasættet Eksempel på besvarelse 1. Hvor stor en andel af deltagerne var mænd? Var der samme andel i de tre randomiseringsgrupper?.
Læs mereFilen indeholder 45 linier, først en linie med variabelnavnene (bw og rmr) og derefter 44 datalinier, hver med disse to oplysninger.
Opgavebesvarelse, Resting metabolic rate I filen rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991 og Owen et.al., Am.
Læs mereEpidemiologi og Biostatistik
Epidemiologi og Biostatistik Kliniske målinger (Kapitel. +.1 + 11.-11 + 1.1-) Introduktion til skilder (varianskomponenter) måleusikkerhed sammenligning af målemetoder Mogens Erlandsen, Institut for Biostatistik
Læs mereStatistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test
Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,
Læs mereAnvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination
Læs mereHvorfor er det lige at vi skal lære det her?
Lektion 8 Stokastiske variable En stokastisk variabel er en afbildning af udfaldsrummet ind i de reelle tal. Man benytter ofte store bogstaver som X, Y og Z til at betegne en stokastisk variabel. Ved at
Læs mereBasal statistik for sundhedsvidenskabelige forskere, efterår 2014 Udleveret 30. september, afleveres senest ved øvelserne i uge 44 (
Hjemmeopgave Basal statistik for sundhedsvidenskabelige forskere, efterår 2014 Udleveret 30. september, afleveres senest ved øvelserne i uge 44 (28.-30. oktober) En stor undersøgelse søger at afdække forhold
Læs mereNormalfordelingen. Statistik og Sandsynlighedsregning 2
Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på
Læs mereAnvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele
Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning
Læs mereAnvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele
Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning
Læs mereGenerelle lineære modeller
Generelle lineære modeller Regressionsmodeller med én uafhængig intervalskala variabel: Y en eller flere uafhængige variable: X 1,..,X k Den betingede fordeling af Y givet X 1,..,X k antages at være normal
Læs mere1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ
Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs meregrupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
Læs mereBilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen
Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Microsoft Excel har en del standard anvendelsesmuligheder i forhold til den beskrivende statistik og statistisk
Læs mereEksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl
Eksamen 2018 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 20-02-2018 Tid: kl. 09.00-11.00 Bedømmelsesform
Læs mereOpgavebesvarelse, brain weight
Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) For 20 musekuld er der i tabellen nedenfor anført oplysning om kuldstørrelsen (fra 3 til 12 mus
Læs mereBesvarelse af vitcap -opgaven
Besvarelse af -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Beskriv fordelingen af vital capacity og i de 3 grupper ved hjælp af summary statistics.
Læs mereVejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013
Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 I forbindelse med reagensglasbehandling blev 100 par randomiseret til to forskellige former for hormonstimulation.
Læs mereStatistik i GeoGebra
Statistik i GeoGebra Peter Harremoës 13. maj 2015 Jeg vil her beskrive hvordan man kan lave forskellige statistiske analyser ved hjælp af GeoGebra 4.2.60.0. De statistiske analyser svarer til pensum Matematik
Læs mereProgram: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.
Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. 1/23 Opsummering af fordelinger X 1. Kendt σ: Z = X µ σ/ n N(0,1)
Læs mereUdleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (29. oktober-1. november)
Hjemmeopgave Basal statistik, efterår 2013 Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (29. oktober-1. november) I forbindelse med en undersøgelse af vitamin D status i Europa, har man
Læs mereEksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet
Eksamen ved Københavns Universitet i Kvantitative forskningsmetoder Det Samfundsvidenskabelige Fakultet 14. december 2011 Eksamensnummer: 5 14. december 2011 Side 1 af 6 1) Af boxplottet kan man aflæse,
Læs mereStatistik II 1. Lektion. Analyse af kontingenstabeller
Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression
Læs mereI dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)
I dag Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt) Helle Sørensen Repetition vha eksempel om dagligvarepriser Analyse med R: ttest
Læs mereKlasseøvelser dag 2 Opgave 1
Klasseøvelser dag 2 Opgave 1 1.1. Vi sætter først working directory og data indlæses: library( foreign ) d
Læs mereStatistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge
Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange
Læs mereBesvarelse af opgave om Vital Capacity
Besvarelse af opgave om Vital Capacity I filen cadmium.txt ligger observationer fra et eksempel omhandlende lungefunktionen hos arbejdere i cadmium industrien (hentet fra P. Armitage & G. Berry: Statistical
Læs mereIkke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test
Ikkeparametriske metoder Repetition Wilcoxon SignedRank Test KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,
Læs mere5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14
Module 5: Exercises 5.1 ph i blod.......................... 1 5.2 Medikamenters effektivitet............... 2 5.3 Reaktionstid........................ 3 5.4 Alkohol i blodet...................... 3 5.5
Læs mereAnalysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17
nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse
Læs mereLøsning til eksaminen d. 14. december 2009
DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,
Læs mereHjemmeopgave, efterår 2009
Hjemmeopgave, efterår 2009 Basal statistik for sundhedsvidenskabelige forskere Udleveret 29. september, afleveres senest ved øvelserne i uge 44 (27.-29. oktober) I alt 112 piger har fået målt bone mineral
Læs mereReeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl
Reeksamen 2018 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 13-08-2018 Tid: kl. 09.00-11.00 Bedømmelsesform
Læs mereBasal statistik. 30. januar 2007
Basal statistik 30. januar 2007 Deskriptiv statistik Typer af data Tabeller Grafik Summary statistics Lene Theil Skovgaard, Biostatistisk Afdeling Institut for Folkesundhedsvidenskab, Københavns Universitet
Læs mereModelkontrol i Faktor Modeller
Modelkontrol i Faktor Modeller Julie Lyng Forman Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for Biokemikere 2003 For at konklusionerne på en ensidet, flersidet eller hierarkisk
Læs mereStatistik viden eller tilfældighed
MATEMATIK i perspektiv Side 1 af 9 DNA-analyser 1 Sandsynligheden for at en uskyldig anklages Følgende histogram viser, hvordan fragmentlængden for et DNA-område varierer inden for befolkningen. Der indgår
Læs mereLøsning eksamen d. 15. december 2008
Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Læs mereBasal statistik for sundhedsvidenskabelige forskere, efterår 2015 Udleveret 29. september, afleveres senest ved øvelserne i uge 44 (27.-30.
Hjemmeopgave Basal statistik for sundhedsvidenskabelige forskere, efterår 2015 Udleveret 29. september, afleveres senest ved øvelserne i uge 44 (27.-30. oktober) En undersøgelse blandt fødende kvinder
Læs mereDeskriptiv statistik for hf-matc
Deskriptiv statistik for hf-matc 75 50 25 2018 Karsten Juul Deskriptiv statistik for hf-matc Hvad er deskriptiv statistik? 1.1 Hvad er deskriptiv statistik?... 1 1.2 Hvad er grupperede og ugrupperede data?...
Læs mereMikro-kursus i statistik 1. del. 24-11-2002 Mikrokursus i biostatistik 1
Mikro-kursus i statistik 1. del 24-11-2002 Mikrokursus i biostatistik 1 Hvad er statistik? Det systematiske studium af tilfældighedernes spil!dyrkes af biostatistikere Anvendes som redskab til vurdering
Læs mereBasal Statistik. En- og to-stikprøve problemer. Eksempel på parrede data. Eksempel på parrede data. Faculty of Health Sciences
Faculty of Health Sciences En- og to-stikprøve problemer One- and two-sample problems: Basal Statistik T-tests. Lene Theil Skovgaard 17. september 2013 1 / 67 Sammenligning af to situationer: Parret t-test
Læs mereSkriftlig Eksamen ST501: Science Statistik Tirsdag den 8. juni 2010 kl
Skriftlig Eksamen ST501: Science Statistik Tirsdag den 8. juni 2010 kl. 9.00 12.00 IMADA Syddansk Universitet Alle skriftlige hjælpemidler samt brug af lommeregner er tilladt. Opgavesættet består af 5
Læs mereFaculty of Health Sciences. Basal Statistik. T-tests. Lene Theil Skovgaard. 17. september 2013
Faculty of Health Sciences Basal Statistik T-tests. Lene Theil Skovgaard 17. september 2013 1 / 67 En- og to-stikprøve problemer One- and two-sample problems: Sammenligning af to situationer: Parret t-test
Læs mereEstimation og usikkerhed
Estimation og usikkerhed = estimat af en eller anden ukendt størrelse, τ. ypiske ukendte størrelser Sandsynligheder eoretisk middelværdi eoretisk varians Parametre i statistiske modeller 1 Krav til gode
Læs mereBasal statistik for lægevidenskabelige forskere, forår Udleveret 12. marts, afleveres senest ved øvelserne i uge 14 (2.-4.
Hjemmeopgave Basal statistik for lægevidenskabelige forskere, forår 2013 Udleveret 12. marts, afleveres senest ved øvelserne i uge 14 (2.-4.april) I forbindelse med reagensglasbehandling blev 100 par randomiseret
Læs mereStatistik II 4. Lektion. Logistisk regression
Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:
Læs mere02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5
02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5 Opgave 5.117, side 171 (7ed: 5.116 side 201 og 6ed: 5.116 side 197) I denne opgave skal vi benytte relationen mellem den log-normale fordeling
Læs mereBasal statistik for lægevidenskabelige forskere, forår 2012 Udleveret 6.marts, afleveres senest ved øvelserne i uge 15 (
Hjemmeopgave Basal statistik for lægevidenskabelige forskere, forår 2012 Udleveret 6.marts, afleveres senest ved øvelserne i uge 15 (10.-12. april) I et randomiseret forsøg sammenlignes vitamin D behandling
Læs mere