Øvelser til Kemometri McDonalds data Datasættet er tidligere hentet fra www.mcdonaldsmenu.info og findes i filen McDonaldsScaled. Download filen ved at klikke på McDonals på hjemmesiden www.models.life.ku.dk/gymnasieoevelse23 A) Åben filen gennem File - Open eller dobbeltklik på den (BEMÆRK: Programmet er lang tid om at starte, så hav tålmodighed). Se rådata ved at vælge Data - Edit dataset. Luk editoren igen vha. File - Exit. B) Plot Energi mod Fedt: Klik på ikonet for at plotte variable. Klik på Object number under figuren og vælg Energi. Klik OK. Vælg dernæst Fedt i boxen Variables. For at fjerne linierne der forbinder de enkelte punkter: Vælg View Marker plot. Plot Energi mod Protein: Vælg Protein i boxen Variables. C) Lav en PCA på data: Klik på Produkter i boxen Sets (til venstre i WorkBench en) og på Næringsindhold i boxen Sets (for Variables). Klik på Plot objects ikonet og vælg View - Line plot. Vælg Transform - Autoscale. For at beregne en PCA vælges Calculate. Klik på OK, når programmet melder, at PCA modellen er beregnet. D) Vi vil nu se på score-plottet (landkortet over prøverne): Vælg Plots - Scores. Kommentér plottet: Hvilke produkter ligner hinanden og hvilke er meget forskellige? Sammenlign evt. med eget forslag til placering af prøverne. E) Lav et bi-plot med information om både Produkter og Næringsindhold. Vælg Plots - Bi-plot. Marker både Produkter og Næringsindhold i boxen Color according to: Sets. Afklik Markers nederst i højre hjørne (mest for syns skyld). Kommentér plottet: Hvilke næringsindholdsvariable er høje for burgerprodukterne? Og for Apple-pie / Pomme Frites? 1
F) Vi vil nu lave en PCA uden cola-, milkshake- og salatprodukterne. Fravælg de fem produkter i boxen Objects i WorkBench en (hold CTRL nede og klik med musen for at fravælge). Vælg Calculate og OK på den menu der fremkommer. Kommentér scores plot og bi-plot. 2
People data Man har målt Højde (cm), Vægt (kg), Skostørrelse (europæisk standard), Alder (år), Øl-indtag (liter om året), Vin-indtag (liter om året) og IQ (Europæisk standardiseret IQ-test, gennemsnittet for dette datasæt er 118). Data findes i filen People_Gym. Download filen ved at klikke på People på hjemmesiden www.models.life.ku.dk/gymnasieoevelse23 A) Plot Height mod Weight: Klik på ikonet for at plotte variable. Klik på Object number under figuren og vælg Height. Klik OK. Vælg dernæst Weight i boxen Variables. For at fjerne linierne der forbinder de enkelte punkter: Vælg View Marker plot. Plot Height mod IQ. B) Lav en PCA på data. Vælg X i Variables / Sets boxen og vælg All objects i Objects / Sets. Vælg Transform - Autoscale. Klik Calculate. Programmet beregner nu en PCA på de valgte data. Klik OK. Lav scores plottet (Plots - Scores). Undersøg kønsforskelle. Vælg sættene Mænd og Kvinder i Color according to: Sets. Undersøg Nord/Syd-forskelle. Vælg sættene Nord og Syd i Color according to: Sets. C) Vi vil nu lave det tilsvarende Loading Plot. Vælg Plots - Loadings. D) Lav et bi-plot. Vælg Plots - Bi-plot. Kommenter plottet. 3
E) Vi vil nu indtaste en ny person, og undersøge om det er en mand eller kvinde fra Nord- eller Sydeuropa. Åben Excel og indtast følgende værdier (eller dine egne værdier ): højde: 185, vægt: 73, skostørrelse: 43, alder: 41, øl: 36 (liter/år), vin: 50 (liter/år), IQ: 118. I Excel ser det således ud: Tast CTRL-C for kopiere til ClipBoard et. I WorkBench en vælges Objects - Add objects from clipboard. Vælg Køn og Region og klik OK: 4
Beregn en PCA inklusive den nye prøve og undersøg scores plottet. Bestem tilhørsforholdet for prøve 33 (med navnet Obj#1). Er vedkommende en mand eller en kvinde? Kommer vedkommende fra Nord- eller Sydeuropa? Prøv også at taste dine egne værdier ind (en gennemsnitlig IQ i Danmark er 104). Kommentér din egen placering. NB. Programmet Latentix kan downloades gratis på www.latentix.dk i en begrænset udgave. Det er den samme udgave, som er anvendt i disse øvelser. Det er oplagt at bruge programmet, hvis klassen senere skal analysere multivariate data som fx højde, vægt, BMI osv for hver elev. 5