Test og sammenligning af udvalgte regressionsmodeller Berit Christina Olsen forår 2008

Indholdsfortegnelse 1 INDLEDNING OG PROBLEMSTILLING... 2 1.1 OVERVÆGT SOM CASE... 2 2 ANALYSEFORBEREDELSER... 4 2.1 HEPRO-UNDERSØGELSEN... 4 2.2 DEN AFHÆNGIGE VARIABEL VIGTIGHED AF ÆNDRINGEN AF VÆGT... 5 2.2.1 Interval eller ordinalskalleret?... 5 2.2.2 De forskellige mål... 7 2.3 DEN UAFHÆNGIGE VARIABEL BMI... 8 2.4 ANDRE FAKTORER... 8 2.4.1 Fysisk tilstand... 8 2.4.2 Psykisk tilstand... 10 2.4.3 Baggrundsvariable... 11 3 ANALYSE... 12 3.1 ANVENDELSE AF LINEÆR REGRESSION... 12 3.1.1 Simpel lineær regression... 12 3.1.2 Multipel lineær regression kontrol for andre faktorer... 15 3.2 ANVENDELSE AF ALMINDELIG LOGISTISK REGRESSION... 19 3.2.1 Simpel logistisk regression... 19 3.2.2 Multipel logistisk regression kontrol for andre faktorer... 20 3.3 ANVENDELSE AF MULTINOMINAL LOGISTISK REGRESSION... 22 3.3.1 Simpel multinominal regression... 22 3.3.2 Multipel multinominal regression... 23 3.4 ANVENDELSE AF ORDINAL LOGISTISK REGRESSION... 26 4 SAMMENLIGNING AF MODELLER... 28 5 OPSAMLING... 32 6 LITTERATURLISTE... 33 7 BILAG - SPSS PROGRAMMERING... 34 Side 1 af 39

1 Indledning og problemstilling En given problemstilling kan oftest undersøges ved hjælp af flere metoder, hvor nogle undersøgelsesmetoder selvfølgelig er mere oplagte end andre. Inden for den kvantitative metode og brugen af statistik kan sammenhænge mellem bestemte variable ligeledes oftest analyseres ved hjælp af flere forskellige statistiske mål og regressionsmodeller. Valget af regressionsmodeller er blandt andet afhængig af variablernes type, dvs. om de er intervalskallerede, ordinalskallerede eller nominalskalerede. Målet med denne metodeopgave er at anvende og teste forskellige regressionsmodeller til at analysere en bestemt problemstilling. Resultaterne fra de forskellige analyser vil således blive sammenlignet, hvor der vil være en diskussion om fordele og ulemper ved anvendelse af de forskellige regressionsmodeller i forbindelse med analysen af problemstillingen. Til at afprøve regressionsmodellerne tages der udgangspunkt i en case omhandlende, hvorvidt det er vigtigt for personer i region Nordjylland at ændre deres vægt. I nærværende opgave undersøges dette, og hvilken sammenhæng der er med personernes BMI. Udover BMI undersøges det, om der er andre faktorer, som kan formodes at have betydning for, hvorvidt det er vigtigt at ændre sin vægt. Der vil således blive kontrolleret for en række relevante variable så som køn, alder, uddannelse, psykisk tilstand og fysisk tilstand. Datagrundlaget for analysen er HEPRO-undersøgelsen, som vil blive beskrevet i et kapitel 2. Regressionsmodellerne, der vil blive anvendt til at undersøge sammenhængen mellem vigtigheden af at ændre vægt og BMI, vil være en lineærregressionsmodel og logistiske regressionsmodeller. Ved anvendelse af den logistiske regression vil der blive benyttet forskellige metoder til at analysere den afhængige variabel på herunder almindelig logistisk regression, multinominal regression og ordinal regression. 1.1 Overvægt som case Ifølge sundheds og sygelighedsundersøgelsen foretaget af Statens Institut for folkesundhed er næsten 45 % af danskerne over 15 år i dag overvægtige, hvilket svarer til 2,2 millioner danskere. Heraf er 11,4 % eller næsten en halv million danskere svært overvægtige. Overvægt har betydelige konsekvenser for både den enkelte som for eksempel forringet livskvalitet i form af helbredsproblemer, følgesygdomme og social udstødelse og en økonomisk byrde for samfundet (Indenrigs- og Sundhedsministeriet 2005:5). Side 2 af 39

Ud fra disse betragtninger er det således relevant at undersøge befolkningen i Nordjyllands ændringsparathed i forhold til at ændre deres vægt i forhold til hvor høj eller lav deres BMI er. BMI står for Body Mass Index, som er kropsvægten divideret med højden i centimeter i anden. Det kan formodes, at der er andre faktorer i form af forskellige ressourcer eller barrierer, der har betydning for, hvor vigtigt det er for en person at ændre sin vægt. Disse ressourcer og barrierer kunne for eksempel være uddannelse, alder og den fysiske og psykiske tilstand. Sammenhængen mellem hvor vigtigt det er for folk at ændre deres vægt og deres BMI, vil således ved hjælp af forskellige regressionsmodeller blive analyseret og resultaterne af disse analyser sammenlignet. Figur 1 Sammenhæng mellem BMI og vigtigheden af ændring af vægt samt andre faktorer BMI Alder Psykisk tilstand Fysisk tilstand Køn Videregående udd. Vigtigheden af ændring af vægt Side 3 af 39

2 Analyseforberedelser I følgende afsnit vil HEPRO- undersøgelsen, som er datagrundlaget for opgaven blive beskrevet. I de efterfølgende afsnit vil de variable, der anvendes i analysen blive beskrevet herunder den afhængige, den uafhængige og kontrolvariablene. 2.1 HEPRO-undersøgelsen Til at belyse problemstillingen omkring sammenhængen mellem BMI og hvor vigtigt det er at ændre vægt, anvendes som tidligere nævnt data fra HEPRO-undersøgelsen 1. HEPRO-undersøgelsen blev udarbejdet i Region Nordjylland 2006-2007 i forbindelse med Kommunalreformen. Målet med undersøgelsen er at udarbejde kommunale sundhedsprofiler, som kan bibringe kommunerne og regionen viden om den aktuelle sundhedstilstand i landsdelen. Meningen med HEPRO er at fremme sundheden for borgerne samt bidrage til at sætte folkesundhed øverst på den politiske dagsorden. Gallup har stået for spørgeskemaundersøgelsen, og Statens institut for folkesundhed står for bearbejdning af data og afrapportering til Region Nordjylland og kommunerne. Der er blevet sendt ca. 22.000 spørgeskemaer ud heraf ca. 2200 pr kommune. I alt har 11.498 personer svaret på spørgeskemaet, hvilket svarer til ca. 1000 fra hver kommune. Det er således kun lidt over halvdelen af de der har modtaget spørgeskemaet som har svaret, og der er dermed et forholdsvist stort frafald. Det store frafald har dog mindre betydning for denne opgave, da fokus her er på metoden og anvendelse af forskellige regressionsmodeller og ikke på selve den valgte problemstilling. De 11.498 svar danner stadig et godt grundlag for de statistiske analyser, som vil blive foretaget i opgaven. Spørgeskemaet indeholder spørgsmål omkring selvvurderet, helbred, livsstil, motivation til forandring af livsstil, sygelighed, medicinforbrug, sociale forhold, arbejdsmiljø, netværk, ensomhed/isolation, tryghed, deltagelse i lokalsamfundet, tillid til andre mennesker og til systemer, ressourcer (Sundhedsprofil 2007:1-4). 1 HEPRO står for Health profiles eller på dansk sundhedsprofiler Side 4 af 39

2.2 Den afhængige variabel vigtighed af ændringen af vægt Til at belyse sammenhængen mellem vigtigheden af ændring af vægt og BMI, anvendes der til at måle den afhængige variabel spørgsmålet: - Hvor vigtig er det for dig at ændre din vægt på en skala fra 0 til 10 hvor 0 er slet ikke vigtigt og 10 er meget vigtigt? Variablen er således en skala med kategorierne 0 til 10. Denne type af spørgsmål hvor der skal svares på en skala med talværdier, anvendes ofte ved spørgeskemaundersøgelser. Ved anvendelsen af en sådan type skala kan der dog opstå en diskussion om, hvordan variablen anvendes i analysen, og det kan diskuteres, hvorvidt den er intervalskalleret, eller om den er ordinalskalleret, hvilket er relevant, da valget af regressionsmodel er afhængig af, om variablen er intervalskalleret eller ordinalskalleret. I følgende afsnit vil dette blive diskuteret i forhold til den afhængige variabel omhandlende vigtigheden af at ændre vægt. 2.2.1 Interval eller ordinalskalleret? Ved en ordinalskalleret variabel kan svarkategorierne rangordnes i enten stigende eller aftagende rækkefølge. Ved en intervalskalleret variabel kan svarkategorierne ligeledes rangordnes, men ved den intervalskallerede variabel er den indbyrdes afstand mellem svarkategorierne den samme. For at den afhængige variabel skal kunne betegnes som intervalskalleret, skal der således være lige stor afstand mellem de 11 kategorier. For at dette er tilfældet er det nødvendigt, at alle informanterne opfatter den oprindelige skala fra 0 til 10 på samme måde, hvor der er lige stor afstand mellem eksempelvis kategori 2 og 3 og kategori 8 og 9. Derudover er der risiko for en tendens til at vælge nogle bestemte svarkategorier frem for andre. Er dette tilfældet skaber dette ligeledes en bias i forhold til svarfordelingen. For at undersøge dette ses der således nærmere på en frekvens over variablen. Tabel 1 viser svarfordelingen, og de kategorier med højst svarprocent viser sig at være 0 og 10 på henholdsvis 25 og 15,5 %, hvilket vil sige yderkategorierne. Derudover viser der sig et mønster, ved at midterkategorien 5 har en forholdsvis høj svarprocent på 10 % og kategorierne 4 og 6 ved siden af, har en forholdsvis lav svarprocent på 3,8 og 4,9 %. Mellem yderkategorien 0 og midterkategorien 5 har svarkategori 2, der er en den 3. svarkategori fra yderkategorien med den højeste svar procent på 6,4 %. Dette gør sig også gældende mellem midterkategorien 5 og Side 5 af 39

yderkategorien, hvor svarkategori 8 har den højeste svarprocent. Det tyder således på at nogle svarkategorier vælges oftere end andre, hvilket skaber en form for bias. Tabel 1 Svarfordelingen på den afhængige variabel Skala 0 1 2 3 4 5 6 7 8 9 10 Procent 25 5 6,4 5,5 3,8 10 4,9 8,8 10,3 4,7 15,5 For at få mest ud af data er det nødvendigt at anvende den regressionsmodel, hvor der går mindst data tabt og på den måde maksimere variablens målingsniveau. Jo højere målingsniveau, jo mere information indeholder variablen. I datahierarkiet ligger den intervalskallerede variabel således højere end den ordinalskallerede. Betegnes den afhængige variabel som intervalskalleret, vil man få det største udbytte af dataene ved anvendelse af en lineærregressionsmodel. Der kan her stilles spørgsmålstegn til, om man blot kan tillade sig at antage, at alle informanterne i en undersøgelse opfatter en skala med talværdier som en differential skala og analysere den som dette, ved f.eks. at anvende en lineær regressionsmodel. Opfatter alle informanterne det ikke som en differential skala, og der anvendes en lineær regressionsmodel til at analysere sammenhængen mellem den og andre variable, begås der er en fejl. I tilfældet med vigtigheden af ændringen af vægt, vil det på baggrund af fordelingen af svar meget sandsynligt være en fejlslutning at tro, at alle informanterne opfatter skalaen som en differential skala, og variablen dermed ikke opfylder kravene til en intervalskalleret variabel. Betegnes variablen i stedet for som ordinalskalleret, vil det ikke være muligt at anvende den lineærregressionsmodel, men i stedet en logistisk regressionsmodel. Ved anvendelse af en almindelig logisk regressionsmodel, er det nødvendigt, at den afhængige variabel er dikotom. Dette medfører, at analysen og resultatet bliver forsimplet i forhold til datamaterialet, hvor der i tilfældet med vigtigheden af ændringen af vægt, oprindeligt er 11 svarkategorier. Anvendes der en multinominal eller ordinal regressionsmodel, er det dog muligt at have flere kategorier på den afhængige variabel. Når der foretages en analyse, er det ved valg af analysemetode og regressionsmodel nødvendigt at vurdere, hvilken model der bedst analyserer, og kommer med det resultat, der bedst kan løse den givne problemstilling. I nærværende opgave kunne problemstillingen være at motivere overvægtige til at tabe sig, og det er således relevant at undersøge sammenhængen mellem BMI og vigtigheden Side 6 af 39

af at ændre vægt samt inddrage for udvalgte variable, for at finde ud af hvem der synes det er vigtig og ikke vigtigt at ændre vægt. For at se på forskelle mellem anvendelse af de forskellige regressionsmodeller og disses resultater, antages det først, at den afhængige variabel kan betegnes som en intervalskalleret variabel, og sammenhængen mellem denne og den uafhængige variabel kan således analyseres ved hjælp af en lineærregressionsmodel. Hernæst betegnes variablen som ordinalskalleret, og sammenhængen analyseres ved hjælp af en logistisk regressionsmodel. 2.2.2 De forskellige mål Til de forskellige regressionsanalyser anvendes der således de samme variable, de måles dog på forskellig måde. Ved den lineære regressionsanalyse anvendes den oprindelige afhængige variabel med de 11 kategorier som en intervalskalleret variabel. Ved den almindelige logistiske regression omkodes denne til en binær variabel. Afhængig af den givne problemstilling er der forskellige måder, hvorpå dette kan gøres mest hensigtsmæssigt. En mulighed kunne være at slå kategorierne sammen således, at der er cirka lige mange i hver af de to nye kategorier, det vil sige kategorierne 0-4 og 5-10. På denne måde kommer den ene kategori til at bestå af informanter, der synes det er vigtigt at ændres deres vægt og den anden af informanter, der synes det er mindre vigtigt at ændre deres vægt. En anden mulighed er at omkode variablen således, at den ene kategori kun til kommer at bestå af informanter, der slet ikke synes det er vigtigt at ændre deres vægt, og den anden kategori vil bestå af de resterende informanter. Fordelen ved at slå kategorierne sammen på denne måde er, at man kan se forskel på dem der slet ikke synes det er vigtigt at ændre deres vægt, og de resterende som synes det er lidt til meget vigtigt at ændre deres vægt. Der er dermed muligt at undersøge, hvorvidt det er informanter, der har et højt BMI, som slet ikke synes det er vigtigt at ændre deres vægt og således de informanter hvis holdning man set i et sundhedsfremmende perspektiv gerne vil ændre. På baggrund af dette omkodes variablen på sidstnævnte måde. Ved den multinominale og ordinale regressionsanalyse omkodes den oprindelige variabel til en variabel med 4 kategorier. Kategorierne slås sammen således at 0 bliver en kategori for sig selv. Disse er de informanter, der slet ikke synes det er vigtigt at ændre vægt. Kategorierne 1-4, 5-7 og 8-10 slås sammen og er de informanter, der henholdsvis synes det er lidt vigtigt, noget vigtigt og meget vigtigt at ændre vægt. Formålet med opgaven er således også, at undersøge om der er forskel Side 7 af 39

på resultaterne når variablene omkodes på forskellig måde ved de forskellige regressionsanalyser, og hvorvidt det dermed er muligt at manipulere med eller dreje resultaterne i en bestemt retning. 2.3 Den uafhængige variabel BMI Til at afdække den uafhængige variabel dannes der en BMI variabel ved hjælp af spørgsmål om højde og vægt 2. BMI variablen er således en intervalskaleret variabel, der går fra en minimumværdi på 14,88 til en maksimumværdi på 71,49. Til den lineære regressionsanalyse vil den oprindelige intervalskalerede variabel blive anvendt. WHO definerer personer med en BMI på under 18,5 som undervægtige, mellem 18,5 og 25 som normalvægtige, mellem 25 og 30 som overvægtige og over 30 som svært overvægtige. Den samme inddeling af BMI anvendes ligeledes i nærværende rapport i de logistiske regressionsanalyser. 2.4 Andre faktorer Da der må formodes at være andre faktorer end BMI, der er bestemmende for, hvor vigtigt folk mener det er at ændre deres vægt, inddrages der en række andre faktorer. Da casen omhandlende ændringen af vægt skal virke som et eksempel til at vise anvendelsen af forskellige regressionsmodeller og fordele og ulemper ved brugen af disse, er der udvalgt en begrænset mængde kontrolvariable. I nedenstående beskrives de anvendte kontrolvariable og indeks. 2.4.1 Fysisk tilstand Som kontrolvariable er der dannet to indeks af henholdsvis fire og fem spørgsmål. Disse er dannet for at anvende så mange informationer fra spørgsmålene som muligt, uden at skulle anvende variablene hver for sig. Det ene indeks omhandler den fysiske tilstand og er dannet af fire følgende spørgsmål om, hvor ofte man har følt følgende i de sidste 4 uger, hvor svarkategorierne består af hele tiden, det meste af tiden, en hel den af tiden, lidt af tiden, og på intet tidspunkt : - Har du følt dig veloplagt og fuld af liv? - Har du været fuld af energi? - Har du følt dig nedslidt? - Har du følt dig træt? 2 Der anvendes her selvrapporterede data. Ulempen ved at disse, er at der er risiko for at respondenterne angiver, at de er højere end de er eller vejer mindre, end de gør i virkeligheden. Side 8 af 39

Efter at have vendt de nødvendige variable, det vil sige har du følt dig nedslidt og har du følt dig træt således, at alle fire variable vender samme vej, foretages en faktoranalyse og reliabilitetstest. Variablene viser sig at korrelere med en KMO på 0,688 og en Cronbachs Alpha på 0,842. Det er dermed hensigtsmæssigt at danne et indeks af de fire variable. På det dannede indeks er det muligt at få en score fra 4 til 20, hvor 4 svarer til det bedste fysiske helbred, og 20 svarer til det dårligste fysiske helbred. Til den lineære regressionsanalyse anvendes dette indeks som en intervalskalleret variabel. Ofte er der en tendens til at informanterne på sådanne indeks, klumper sig sammen på midten, således at der er flest i midterkategorierne og få i yderkategorierne. Dette er tilfældet med indekset for den fysiske tilstand og kan både skyldes, at informanterne har svaret i midterkategorierne i de oprindelige spørgsmål, og at de i et spørgsmål har fået en høj score, og i et andet har de fået en lav score, hvilket også vil medføre, at de til sammen får en score, som placerer dem i midterkategorierne på indekset. Til de logistiske regressionsanalyser er det mest hensigtsmæssigt at omkode indekset til en variabel med færre kategorier. Fordelingen af informanterne på indekset har betydning for, hvordan omkodningen foretages mest hensigtsmæssigt, så der bliver nogenlunde lige mange besvarelser i hver kategori, men også hvad der er bedst i forhold til problemstillingen. Da der som tidligere nævnt er flere, der har fået en score i midterkategorierne og færre i yderkategorierne, bliver indekset omkodet til en variabel med fire kategorier som dannes ved at slå scorerne 4-7, 8-9, 10-11 og 12-20 sammen. På den måde kommer der til at være cirka lige mange besvarelser i hver af de fire kategorier. Kategorien 4-7 kommer således til at indeholde de informanter, der har den bedste psykiske tilstand, kategorien 8-9 vil indeholde de informanter, der har en lidt dårligere fysisk tilstand, kategorien 10-11 vil indeholde de informanter, der har en noget dårligere fysisk tilstand, og kategorien 12-20 vil komme til at indeholde de informanter, der har den dårligste fysiske tilstand. Tabel 2 Svarfordelingen på indekset over fysisk tilstand Score 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Procent 3,3 2,4 7,6 14,7 16,3 11,7 11,7 7,2 8,1 4,8 4,3 2,7 2,1 1,2 1,1 0,5 0,4 Side 9 af 39

2.4.2 Psykisk tilstand Det andet indeks omhandler den psykiske tilstand, og er dannet af fem spørgsmål. Disse går ud på at beskrive, hvor meget følgende problemer eller lidelser har generet i de sidste 7 dage, hvor svarkategorierne består af over-hovedet ikke, en lille smule, en hel del og rigtig meget. - Ængstelse, nervøsitet eller uro - Angst - Følelse af håbløshed for fremtiden - Nedtrykt, deprimeret, ulykkelig - For mange bekymringer Variablene korrelerer ifølge en faktor analyse og reliabilitetstest med en KMO på 0,843 og Cronbachs Alpha på 0,860, og det er dermed hensigtsmæssigt at danne et indeks af de 5 variable, hvorpå der er muligt at få en score fra 5 til 20, hvor 5 svarer til bedste psykiske helbred, og 20 svarer til det dårligste psykiske helbred. Dette indeks anvendes ligeledes som en intervalskalleret variabel til den lineære regressions analyse. Fordelingen på indekset for den psykiske tilstand koncentrer sig i modsætning til på indekset for den fysiske tilstand i yderkategorien. Her er den største procentdel på 37,9 % ved scoren 5, hvilket svarer til den bedste psykiske tilstand. Tabel 3 Svarfordelingen på indekset over psykisk tilstand Score 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Procent 37,9 17,0 13,5 9,7 5,6 5,0 3,3 2,1 1,6 1,3 1,0 0,5 0,4 0,3 0,2 0,4 Ved anvendelsen af de logistiske regressionsanalyser omkodes også indekset for den psykiske tilstand til en variabel med fire kategorier. Da størstedelen af informanterne har fået en forholdsvis lav score på indekset, omkodes det ved at scoren 5 bliver en kategori for sig selv, scorerne 6-7, 8-10 og 11-20 slås sammen, så der på den måde kommer cirka lige mange besvarelser i hver kategori. Kategorien 5 kommer således til at indeholde de informanter der har den bedste psykiske tilstand, og overhovedet ikke har følt sig generet af ovenstående problemer i løbet af de sidste 7 dage. Kategorien 6-7 vil indeholde de informanter der har været lidt generet af problemerne, kategorien 8-10 vil indeholde de informanter, der har følt sig noget generet af problemerne og kategorien 11-20 vil komme til at indeholde de informanter, der har været meget generet af ovenstående psykiske problemer i løbet af de sidste 7 dage. Side 10 af 39

2.4.3 Baggrundsvariable Udover psykisk og fysisk tilstand består de andre faktorer af baggrundsspørgsmål som alder, køn og uddannelse. Til den lineære regressionsanalyse anvendes den intervalskallerede aldersvariabel, hvor der til den logistiske regressionsanalyse anvendes en omkodet variabel med kategorierne 16-24 år, 25-44 år, 45-64 år og 65+ år. Derudover dannes der fire dummyvariable, som svarer til de fire alderskategorier. Til den lineære regressionsanalyse anvendes en variabel med antal år på en videregående uddannelse, erhvervsuddannelse eller anden type uddannelse. Til den logistiske regressionsanalyse anvendes en omkodet variabel som inddeles i kategorierne ingen videregående uddannelse, kort videregående uddannelse, mellemlang videregående uddannelse og lang videregående uddannelse. Det er desuden værd at bemærke, at når køn-variablen anvendes i analyserne, er det mænd, der er referencegruppen. Side 11 af 39

3 Analyse I de følgende afsnit beskrives de anvendte regressionsmodeller og resultaterne fra regressionsanalyserne vil blive præsenteret. 3.1 Anvendelse af lineær regression Den lineære regressionsanalyse anvendes til at måle effekten fra en uafhængig variabel på en afhængig variabel. Lineær regression går i hovedtræk ud på at lave en ret linie ud fra observationernes placering i et koordinatsystem og ud fra denne, se om der er en lineær sammenhæng mellem X og Y. Den sande regressionslinie for populationen er Y = + X. Ud fra en stikprøve kan estimeres en regressionslinie Ŷ = a + bx, hvor konstanten a er liniens skæring med y-aksen, og b er hældningskoefficienten (Agresti & Finlay 1997:309). For at kunne anvende lineær regression, er der visse forudsætninger der skal være opfyldt i forhold til typen af variable og observationernes fordeling. Det er således et krav, at de anvendte variable er intervalskallerede. Det antages at variablen vigtighed for ændring af vægt, opfylder denne betingelse. Dikotome uafhængige variable accepteres ligeledes. Den uafhængige BMI variabel opfylder også kravene til lineær regression, da denne er intervalskalleret. Det er ved anvendelse af lineær regression også en forudsætning, at en lineær sammenhæng mellem variablene. (Agresti & Finlay 1997:308). Styrken i den lineære sammenhæng mellem variablene undersøges ved hjælp af regressionskoefficienten Pearson s r, som kan antage værdier mellem -1 og 1. Pearsons r er i den bivariate analyse lig med den standardiserede regressionskoefficient (Agresti & Finlay 1997:417). I analysen ses der på den justerede r 2, der er justeret for antal forklarende variable. Dette er forklaringskraften, der giver udtryk for, hvor meget den uafhængige variabel forklarer af variansen på den afhængige variabel. 3.1.1 Simpel lineær regression Efter at have foretaget en simpel lineær regressionsanalyse i SPSS, hvor der ikke kontrolleres for andre variable, er den justerede r 2 -værdi for den simple lineære regression på 0,215, hvilket vil sige at BMI forklarer 21,5 % af variansen på den afhængige variabel. P-værdien er signifikant, og det er derfor muligt at forkaste Ho-hypotesen om, at der ikke er en sammenhæng mellem BMI og Side 12 af 39

vigtighed af ændringen af vægt. Ud fra de rå koefficienter hvor a er -4,449 og b er 0,398 kan den estimerede regressionsligning skrives som: Ŷ = - 4,449+ 0,398X. I ligningen indsættes grænseværdierne for BMI samt nogle af midterværdierne. Det beregnes således ud fra den estimerede lineære regressionsligning, hvor informanterne med en bestemt BMI vil placere sig på den afhængige intervalskallerede variabel omhandlende, hvor vigtigt det er at ændre vægt på en skala fra 0 til 10. 14,88: Ŷ = - 4,449 + 0,398 x 14,88 = 1,47 36,31: Ŷ = - 4,449 + 0,398 x 36,43 = 10,00 18,5: Ŷ = - 4,449 + 0,398 x 18,5 = 2,91 40: Ŷ = - 4,449 + 0,398 x 40 = 11,47 25: Ŷ = - 4,449 + 0,398 x 25 = 5,50 50: Ŷ = - 4,449 + 0,398 x 50 = 21,45 30: Ŷ = - 4,449 + 0,398 x 30 = 7,49 71,49: Ŷ = - 4,449 + 0,398 x 71,49 = 24,00 På baggrund af den estimerede regressionsligning vil informanter med minimum BMI-værdien på 14,88, have en værdi på 1,47 på den afhængige variabel omhandlende hvor vigtigt det er at ændre vægt. Undervægtige informanter vil have en værdi på mellem 1,47 og 2,91 på den afhængige variabel. Normalvægtige informanter vil have en værdi på mellem 2,91 og 5,50 på den afhængige variabel. Overvægtige informanter vil have en værdi på mellem 5,50 og 7,49 på den afhængige variabel. Svært overvægtige vil have en værdi på mellem 7,49 og 24. I og med at den oprindelige skala på den afhængige variabel går fra 0-10, er det i øjenfaldende at Ŷ værdierne for de informanter med en BMI på over 36,31, vil være over 10, som er den maksimale værdi på den oprindelige skala. Dette kunne tyde på, at den lineære regression ikke er den model der bedst beskriver sammenhængen mellem BMI, og hvor vigtigt det er at ændre vægt. På baggrund af ovenstående fremgår det således af den lineære regressionsanalyse, at der er en sammenhæng mellem befolkningen i Region Nordjyllands mening om, hvor vigtigt det er for dem at ændre deres vægt og deres BMI. Den positive hældning på regressionsligningen betyder, at jo højere BMI en person har, jo vigtigere er det for dem at ændre deres vægt. På figur 2 ses et diagram over sammenhængen mellem de to variable. Ud fra denne er det bemærkelsesværdigt at de overvægtige ikke i så høj grad, som man måske kunne forvente, synes det er vigtigt vægt. Derimod synes de svært overvægtige i noget højere grad, at det er vigtigt at ændre deres vægt. Side 13 af 39

Figur 2 Diagram over sammenhængen mellem vigtigheden af at ændre vægt og BMI På figur 3 ses scatterplottet for sammenhængen mellem hvor vigtig det er for informanterne at ændre deres vægt og deres BMI. På scatterplottet ses ligeledes den estimerede linje for den lineære regression. Ved en nærmere undersøgelse af den estimerede regressionsligning, kan det som tidligere nævnt betvivles, at sammenhængen mellem BMI og vigtigheden af at ændre vægt er lineær. Det er ud fra scatterplottet svært at drage nogle konklusioner på grund af det høje antal observationer, der placerer sig oveni hinanden på figuren. En mulighed er at sammenhængen mellem de to variable i stedet for en lineær regressionsmodel, kan udtrykkes ved hjælp af en anden regressionsmodel. Dette kunne f.eks. være en logaritmisk regressionsmodel eller en andengradsligning, som også ses på figur 3. Hvor forklaringskræften r 2 for den lineære regressionsmodel er 0,215 er den for den logaritmiske regressionsmodel 0,225 og 0,233 for andengradsligningen. Det kunne dermed tyde på at disse regressionsmodeller bedre beskriver sammenhængen mellem BMI, og hvor vigtigt det er at ændre sin vægt. Da der kun er en forholdsvis lille forskel på forklaringskraften mellem de tre regressionsmodeller, vil der i det følgende fortsat blive anvendt den lineære regressionsmodel, hvor andre faktorer vil blive inddraget. Side 14 af 39

Figur 3 Scatterplot over sammenhængen mellem vigtigheden af at ændre vægt og BMI 3.1.2 Multipel lineær regression kontrol for andre faktorer Efter at have undersøgt hvor stor en sammenhæng der er mellem den uafhængige og afhængige variabel ved hjælp af simpel lineær regression, er det relevant at undersøge, hvorvidt dele af variansen på den afhængige variabel bliver forklaret af andre faktorer. De andre faktorer alder psykisk tilstand, fysisk tilstand, køn, og videregående uddannelse indsættes dermed i en multipel regressionsmodel. Der undersøges her således, hvor meget variablene forklarer af variansen på den afhængige variabel, og om forholdet mellem den uafhængige og afhængige variabel ændrer sig. På baggrund af en formodning om at køn har en betydning for, om man synes det er vigtigt at ændre vægt, og om der eksisterer stor forskel mellem mænd og kvinder, indsættes først køn i en regressionsmodel. På figur 4 og 5 ses scatterplottene samt de estimerede lineære ligninger for sammenhængen mellem vigtigheden for ændringen af vægt og BMI for kvinder og for mænd hver for sig. Side 15 af 39

Figur 4 Scatterplot over sammenhængen mellem vigtigheden af at ændre vægt og BMI Kun kvinder Figur 5 Scatterplot sammenhængen mellem vigtigheden af at ændre vægt og BMI Kun Mænd Side 16 af 39

Den estimerede ligning for kvinder bliver på baggrund af en lineær regressionsanalyse: Ŷ = - 4,488+ 0,432X For mænd bliver den estimerede ligning: Ŷ = - 5,559+ 0,412X Kvinderne mener således, at det er vigtigere at ændre vægt, end mænd synes. Derudover tyder det på, at mændene skal have et større BMI i forhold til kvinder, før end de synes, det er vigtigt at ændre deres vægt. De resterende faktorer sættes herefter ind i regressionsmodellen. På baggrund af forskellen mellem mænd og kvinder, kunne det tænkes, at der var en interaktion mellem køn og BMI. Der er i regressionsanalysen således medtaget et interaktionsled med de to variable i den multiple analyse. Dette viser sig dog ikke at være signifikant. Når alle variablene indsættes, er den justerede r 2 -værdi 0,301, hvilket vil sige, at variablene tilsammen forklarer 30,1 % af variansen på den afhængige variabel. Dette er 8,8 % point mere end hvad BMI forklarer alene i den bivariate analyse. Dette tyder således på, at der også er en sammenhæng mellem disse og den afhængige variabel om vigtigheden af at ændre sin vægt. Efter at have inddraget kontrolvariablene i regressionsmodellen, falder de rå koefficienter a til -68,762 og b stiger til 0,452. Alle variablene på nær interaktionsledet og den fysiske tilstand er signifikante. På trods af at B værdien for alder er 0,031 og dermed forholdsvis lav, kunne det tænkes, at der er forskel på, hvor vigtigt der er at ændre vægt for forskellige generationer. Dette undersøges ved at indsætte fire dummyvariable i modellen i stedet for aldersvariablen. Dummyvariablene dækker over aldersgrupperne 16-24 år, 25-44 år, 45-64 år og 65 år og derover. Den lineære multiple regressionsanalyse er foretaget med en backward selection, hvilket vil sige at de variable, der ikke er signifikante udtages af modellen en efter en, og afsluttende er der kun de variable, der er signifikante med i modellen. I tabel 4 ses resultaterne for den simple lineære regressionsanalyse, den multiple regressionsanalyse med aldersvariablen som intervalskalleret, den multiple regressionsanalyse med alder som dummyvariable og den endelige model hvor kun de signifikante variable er med. De variable der i analysen ikke er signifikante og derfor udtages, er dummyvariablen for aldersgruppen 25-44 år, variablen for fysisk tilstand og interaktionsledet med BMI og køn. I det følgende fokuseres der primært på værdierne fra den endelige model. Side 17 af 39

I forhold til andre faktorer der kunne have betydning for, hvor vigtigt informanterne synes det er at ændre vægt, kunne det på baggrund af den multiple regressionsanalyse med aldersvariablen tyde på, at der er en positiv sammenhæng mellem vigtighed af at ændre vægt og alder da B er positiv med en værdi på 0,031. Dette vil sige at jo ældre man er, jo mere synes man at det er vigtigt at ændre sin vægt. I den endelige model hvor dummyvariablene anvendes i stedet for, ser det dog anderledes ud Kategorien 16-25 år har en B-værdi på 0,585. Da værdien er positiv synes de således at det er vigtigere at ændre vægt end resten af informanterne. Kategorien 45-64 år har en negativ B-værdi på - 0,445, og disse synes således at det er mindre vigtigt at ændre deres vægt i forhold til resten af informanterne. Kategorien 65+ har en negativ B-værdi på - 1,278 og synes dermed, at det er mindre vigtigt at ændre deres vægt i forhold til resten af informanterne. I modsætning til regressionsanalysen hvor der blev anvendt den intervalskallerede aldersvariabel viser det sig ved anvendelsen af dummyvariable, at jo ældre man er, jo mindre vigtigt synes man det er at ændre vægt. Ved anvendelse af forskellige mål, er det således muligt at få forskellige resultater. Da referencegruppen for køn er mænd, betyder det, at kvinder synes, at det er vigtigere end mænd at ændre deres vægt med en positiv B-værdi på 1,624. For de to indeks omhandlende psykisk og fysisk tilstand, er det kun den psykiske tilstand, der viser sig at være signifikant. Her gælder det ifølge den multiple regressionsanalyse, at jo værre man har det psykisk, jo vigtigere synes man det er at ændre vægt med en positiv B-værdi på 0,088. Med hensyn til uddannelse gør det sig gældende, at jo flere års videregående uddannelse man har, jo vigtigere synes man det er at ændre vægt med en positiv B-værdi på 0,048. Den lineære formel for multipel lineær regression her med k uafhængige variable ser således ud: E(Y) = + 1 X 1 + 2 X 2 +...+ k X k. Ligningen for den endelige multiple lineære model bliver således: Ŷ= -7,050 + 0,451 X 1 + 0,585 X 2-0,445 X 3-1,278 X 4 + 0,088 X 5 + 1,624 X 6 + 0,048 X 7 Det er i analysen desuden testet for multikollinaritet, hvilket vil sige, at de uafhængige variable korrelerer meget med hinanden hvorved det kan påvirke r², og det er derved vanskeligt at adskille effekten fra de enkelte uafhængige variable (de Vaus 2002:327). Da ingen af VIF-værdierne i dette tilfælde overstiger fire, er der i regressionsanalysen således ikke multikollinaritet. Side 18 af 39

Tabel 4 Resultater fra den lineære regressionsanalyse Simpel Multipel med alder år Multipel med alder som dummy Endelig model Model Std. Std. B Std. Sig. B Std. Sig. B Error Sig. B Error Sig. Error Error (Constant) - 4,449,191,000-68,762 4,360,000-7,070,332,000-7,050,236,000 BMI,398,007,000,452,012,000,449,012,000,451,008,000 Alder,031,002,000 - - - - - - Alderdum 16-24 år - - -,589,115,000,585,115,000 Alderdum 45-64 år - - - -,445,075,000 -,445,075,000 Alderdum 65 år + - - - -1,281,117,000-1,278,117,000 Psykisk tilstand,078,015,000,078,015,000,088,012,000 Fysisk tilstand,012,013,373,014,013,302 - - - Køn (ref. Mænd) 1,641,407,000 1,572,407,000 1,624,068,000 Uddannelse antal år,048,012,000,048,012,000,048,012,000 Interaktion køn&bmi,000,016,954,002,016,908 - - - 3.2 Anvendelse af almindelig logistisk regression I følgende analyse antages det, at den afhængige variabel ikke er intervalskalleret, og der vil således blive anvendt logistisk regression til at analysere sammenhængen mellem de to variable samt kontrol for de øvrige variable. Den logistiske regressionsmodel beskriver en asymmetrisk relation mellem én binær variabel og en eller flere uafhængige variable. Overordnet går den ud på at sammenligne chancerne for den samme hændelse under forskellige betingelser, hvilket er forholdet mellem to odds-værdier. I forhold til lineær regression stilles der færre krav til anvendelsen af logistisk regression. I den simple logistiske regressionsmodel er det er dog et krav, at den afhængige variabel Y er dikotom, hvor der ingen krav er til skalaen på de uafhængige variable. Ligningen for den logistiske regression er: Log it (π) = log = α + β x 3.2.1 Simpel logistisk regression For at kunne analysere sammenhængen mellem vigtighed af ændring af vægt og BMI ved hjælp af almindelig logistisk regression, er det således nødvendig at omdanne den afhængige intervalskallerede vigtighed af ændringen af vægt variabel til en dikotom variabel, hvilket blev beskrevet i afsnit 2.2.2. I den logistiske regressionsanalyse vil kategorien slet ikke vigtigt at ændre vægten fungere som referencekategori, således at oddsene for succes bliver oddsene for, at det er vigtigt at ændre vægt. For den uafhængige BMI-variabel er kategorien BMI på 18,5-25 valgt som referencekategori, da dette svarer til at være normalvægtig. Efter at have foretaget den logistiske regressionsanalyse uden inddragelse af andre faktorer i SPSS, viser det sig at alle kategorierne i den uafhængige variabel er signifikante. Det ses yderligere at oddsene for at synes at det er vigtigt at ændre vægt i forhold til slet ikke at synes det er vigtigt at ændre vægt, for overvægtige er 4,821 gange større end når man normalvægtig. Ligeledes er oddsene for at synes, at det er vigtigt at ændre Side 19 af 39

vægt, når man er svært overvægtig 14,615 gange større, end når man er normalvægtig. Er man overvægtig, er der således tendens til, at man synes det er vigtigt at ændre vægt, i forhold til hvis man er normalvægtig. Med hensyn til de undervægtige gælder det, at oddsene for at synes det er vigtigt at ændre vægt, er 0,717 gange større hvis man er undervægtig, end hvis man er normalvægtig. 3.2.2 Multipel logistisk regression kontrol for andre faktorer Efter at have foretaget en simpel logistisk regressionsanalyse, vil der i nedenstående blive kontrolleret for de øvrige variable alder, psykisk tilstand, fysisk tilstand, køn og uddannelse. Ved inddragelse af de andre faktorer stiger oddsene for, at man synes det er vigtigt at ændre vægt, hvis man er overvægtig til at være 8,344 gange større, end hvis man er normalvægtig. Ligeledes stiger oddsene for, at man synes det er vigtigt at ændre vægt, hvis man er svært overvægtig til at være 22,874 gange større end hvis man er normalvægtig. Når der kontrolleres for andre faktorer, falder oddsene for at synes det er vigtigt at ændre vægt, for personerne der er undervægtige til at være 0,502, og der er således mindre odds for, at man synes det er vigtigt at ændre vægt, hvis man er undervægtig, i forhold til hvis man er normalvægtig. I forhold til kontrolvariablene viser det sig, at jo ældre man er, jo mindre er oddsene for, at man synes det er vigtigt at ændre sin vægt. Med hensyn til den psykiske og fysiske tilstand viser der sig ikke noget entydigt mønster, og nogle af kategorierne er ikke signifikante. I forhold til køn er oddsene for, at man synes det er vigtigt at ændre vægt 2,377 gange større, hvis man er en kvinde, i forhold til hvis man er en mand. Ved uddannelse gør det sig gældende, at jo længere videregående uddannelse man har, jo større er oddsene for at man synes det er vigtigt at ændre vægt, i forhold til hvis man ingen videregående uddannelse har. Ligningen for den multiple logistiske regression er: Log it (π) = log = α + β 1 x 1 + β 2 x 2 + β k x k Dem der på baggrund af den multiple logistiske regressionsanalyse vil have de største odds for at synes det er lidt til meget vigtig at ændre vægt, i forhold til slet ikke at synes det er vigtigt at ændre sin vægt, vil være en svært overvægtig kvinde i alderen 16-24 år med en noget dårlig psykisk og fysisk tilstand med en lang videregående uddannelse. Oddsene for denne beregnes til at være: 0,664 x 22,874 x 2,377 x 1,377 x 1,646 x 1,330 x 1,669 = 181,64 gange større end en normalvægtig mand i alderen 25-44 år med en god psykisk og fysisk tilstand uden en videregående uddannelse. Side 20 af 39

Tabel 5 Resultater fra den almindelige logistiske regressionsanalyse Simpel Multipel B S.E. Wald df Sig Exp(B) B S.E. Wald df Sig Exp(B) BMI 18,5-25 (ref.) 1023,889 3,000 1020,175 3,000 BMI 0-18,49 -,333,148 5,057 1,025,717 -,689,182 14,368 1,000,502 BMI 25,01-30 1,573,058 731,212 1,000 4,821 2,121,075 796,598 1,000 8,344 BMI 30,01+ 2,682,143 353,084 1,000 14,615 3,130,177 312,967 1,000 22,874 Constant,446,028 252,118 1,000 1,563 - - - - - - Alder 25-44 (ref.) 220,105 3,000 Alder 16-24,320,102 9,756 1,002 1,377 Alder 45-64 -,552,067 68,593 1,000,576 Alder 65+ -1,178,098 145,770 1,000,308 Psykisktilstand God (ref.) 57,528 3,000 Psykisktilstand (1),479,071 45,847 1,000 1,614 Psykisktilstand (2),498,088 32,396 1,000 1,646 Psykisktilstand (3) dårlig,248,112 4,917 1,027 1,281 Fysisktilstand God (ref.) 10,160 3,017 Fysisktilstand (1),101,075 1,849 1,174 1,107 Fysisktilstand (2),285,089 10,158 1,001 1,330 Fysisktilstand (3) dårlig,129,093 1,948 1,163 1,138 Køn (ref. =mænd),866,061 202,363 1,000 2,377 Udd. ingen videreg (ref.) 38,623 3,000 Udd. kort videreg,356,095 14,139 1,000 1,428 Udd. ml. videreg.,459,080 32,674 1,000 1,582 Udd. lang videreg,512,095 28,954 1,000 1,669 Constant -,410,101 16,517 1,000,664 Side 21 af 39

3.3 Anvendelse af multinominal logistisk regression Ved anvendelsen af en multinominal logistisk regressionsmodel, er der muligt at anvende en afhængig variabel med flere kategorier end to. Den afhængige variabel vil med anvendelse af denne regressionsmodel blive behandlet som en nominalskalleret variabel, og der vil således ikke blive taget hensyn til en eventuel rangorden for kategorierne i variablen. Den afhængige variabel omhandlende hvor vigtigt det er at ændre vægt, omkodes som tidligere beskrevet til en variabel med 4 kategorier. Det er med den multinominale regressionsanalyse muligt at se på oddsene for hver af grupperne der synes det lidt vigtigt, noget vigtigt og meget vigtigt at ændre vægt i forhold til slet ikke at synes at det er vigtigt at ændre vægt, som vil fungere som baseline. Det er derudover muligt at se på forskellene mellem kategorierne. Ved den simple multinominale regressionsanalyse sammenlignes oddsene for, hvor vigtigt det er at ændre vægt i forhold til BMI for hver af de fire kategorier. De normalvægtige med en BMI på 18,5-25 fungerer også her som referencegruppe. 3.3.1 Simpel multinominal regression Resultaterne fra den simple multinominale regressionsanalyse ses i tabel 6. Det viser sig at alle kategorierne er signifikante med undtagelse af undervægtige i kategori 3 og 4. Når der ikke kontrolleres for andre faktorer, er oddsene for at synes det er lidt vigtigt at ændre sin vægt, i forhold til ikke at synes det er vigtigt at ændre sin vægt, for overvægtige informanter 2,238 gange større end for normalvægtige informanter. For svært overvægtige er oddsene 2,479 gange større end normalvægtige informanter. Oddsene for undervægtige informanter er 0,474 og således mindre end normalvægtige. Overordnet er der således større odds for, at man synes det er lidt vigtigt, noget vigtigt og meget vigtigt at ændre sin vægt jo højere BMI man har, i forhold til ikke at synes, det er vigtigt at ændre sin vægt. F.eks. er Oddsene for, at synes det er meget vigtigt at ændre sin vægt, i forhold til ikke at synes det er vigtigt at ændre sin vægt for svært overvægtige informanter 38,888 gange større end normalvægtige informanter. Der er altså stor forskel på oddsene, og BMI har således forskellig betydning i for tre grupper. Side 22 af 39

Tabel 6 Resultater fra den simple multinominale regressionsanalyse Vigtigheden af ændring af BMI Std. B Error Wald df Sig. Exp(B) 2 = lidt vigtigt Intercept -,376,034 119,185 1,000 BMI 0-18,49 -,747,216 11,972 1,001,474 BMI 25,01-30,806,070 130,787 1,000 2,238 BMI 30,01+,908,176 26,624 1,000 2,479 BMI 18,5-25 (ref.) 0b.. 0.. 3 = noget vigtigt Intercept -,710,038 344,552 1,000 BMI 0-18,49,006,188,001 1,974 1,006 BMI 25,01-30 1,623,068 563,820 1,000 5,067 BMI 30,01+ 2,535,152 276,475 1,000 12,619 BMI 18,5-25 (ref.) 0b.. 0.. 4 = meget vigtigt Intercept -,957,042 527,614 1,000 BMI 0-18,49 -,247,224 1,214 1,271,781 BMI 25,01-30 2,211,068 1044,855 1,000 9,128 BMI 30,01+ 3,661,147 615,966 1,000 38,888 BMI 18,5-25 (ref.) 0b.. 0.. 3.3.2 Multipel multinominal regression Ved den multiple multinominale regression inddrages der ligesom ved de andre analyser andre faktorer alder, psykisk tilstand, fysisk tilstand, køn og videregående uddannelse. Efter inddragelse af andre faktorer i modellen stiger oddsene i forhold til den simple multinominale analyse for hver af de tre kategorier. F.eks. er oddsene for at synes det er meget vigtigt at ændre sin vægt, i forhold til ikke at synes det er vigtigt at ændre sin vægt for svært overvægtige informanter steget til at være 93,749 gange større end normalvægtige informanter. For både kategori 2, 3 og 4 gælder det, at jo højere BMI jo større odds for at mans synes det er vigtigt at ændre sin vægt. Med hensyn til de andre faktorer er alder signifikant i alle kategorierne med undtagelse af de 16-24- årige, der synes det er lidt vigtigt at ændre vægt. Oddsene for at synes det er lidt vigtigt, noget vigtigt og meget vigtigt at ændre vægt, i forhold til ikke at synes det er vigtigt at ændre vægt, er for de 16-24-årige henholdsvis 1,244, 1,474 og 1,488 gange større end for de 25-44-årige. Oddsene for at synes det er lidt vigtigt, noget vigtigt og meget vigtigt at ændre vægt, i forhold til ikke at synes det er vigtigt at ændre vægt, er for aldersgrupperne 45-64 år og 65 og derover mindre end for de 25-44-årige. I forhold til den psykiske tilstand er alle kategorierne signifikante, på nær dem med en dårlig psykisk tilstand der synes, det er lidt vigtigt og noget vigtigt at ændre vægt. Oddsene for at synes det er lidt vigtigt, noget vigtigt og meget at ændre sin vægt, i forhold til ikke at synes det er vigtigt at ændre sin vægt, er for alle kategorierne højere end dem med en god psykisk tilstand. Alle Side 23 af 39

kategorierne for den fysiske tilstand med undtagelse af dem i fysisk tilstand gruppe 2 der synes, det er lidt eller noget vigtigt at ændre sin vægt, viser sig at være ikke-signifikante. Det er således ikke muligt at konkludere noget ud fra den multiple multinominale regressionsanalyse i forhold til den fysiske tilstand. Oddsene for at synes det er lidt vigtigt at ændre sin vægt, i forhold til ikke at synes det er vigtigt at ændre sin vægt, er for kvinder 1,589 gange større, end det er for mænd. Oddsene for at synes det er noget vigtigt at ændre sin vægt, er for kvinder 2,249 gange større end for mænd. Oddsene for at synes det er meget vigtigt at ændre sin vægt, er for kvinder 5,183 gange større end for mænd. Køn har således en forskellig betydning for de tre grupper. Alle kategorierne for uddannelse er signifikante, og oddsene for at synes det er lidt vigtigt, noget vigtigt og meget vigtigt at ændre sin vægt, i forhold til ikke at synes det er vigtigt at ændre sin vægt, er for alle kategorierne højere end dem uden videregående uddannelse. Ligningen for den multiple multinominale regression er: Log = (α j + β j1 x 1 + β j2 x 2 + β kj x k ) Som eksempel er oddsene, for at synes det er meget vigtigt at ændre vægt, i forhold til slet ikke at synes det er vigtigt at ændre vægt for svært overvægtige kvinder i alderen 16-24 med en lidt til noget dårlig psykisk tilstand med en lang videregående uddannelse lig med Exp(-2,724) x 93,749 x 5,183 x 1,488 x 1,975 x 2,244 = 210,24 gange større end normalvægtige mænd i alderen 25-44 år med en god psykisk tilstand uden en videregående uddannelse. Side 24 af 39

Tabel 7 Resultater fra den multiple multinominale regressionsanalyse 2 = lidt vigtigt 3 = noget vigtigt 4 = meget vigtigt Vigtigheden af ændring af BMI B Std. Error Wald df Sig. Exp(B) B Std. Error Wald df Sig. Exp(B) B Std. Error Wald df Sig. Exp(B) Intercept -,823,118 48,970 1,000-1,535,124 152,305 1,000-2,724,138 389,794 1,000 BMI 0-18, 49 -,845,239 12,468 1,000,429 -,366,224 2,670 1,102,694 -,889,285 9,719 1,002,411 BMI 25,01-30 1,267,087 211,940 1,000 3,551 2,199,087 638,670 1,000 9,013 3,167,092 1181,122 1,000 23,740 BMI 30,01+ 1,276,214 35,709 1,000 3,583 3,131,188 277,279 1,000 22,904 4,541,188 584,209 1,000 93,749 BMI 18,5-25 (ref.) 0b.. 0.. 0b.. 0.. 0b.. 0.. Alder 16-24,218,117 3,490 1,062 1,244,388,121 10,263 1,001 1,474,398,129 9,455 1,002 1,488 Alder 45-64 -,601,077 60,363 1,000,548 -,458,079 33,729 1,000,633 -,581,081 50,851 1,000,560 Alder 65+ -1,049,116 81,639 1,000,350-1,131,120 88,244 1,000,323-1,415,127 123,585 1,000,243 Alder 25-44(ref.) 0b.. 0.. 0b.. 0.. 0b.. 0.. Psykisktilstand (1),384,082 21,993 1,000 1,469,445,085 27,648 1,000 1,561,681,089 58,583 1,000 1,975 Psykisktilstand (2),401,101 15,793 1,000 1,493,481,103 21,745 1,000 1,618,680,108 39,951 1,000 1,975 Psykisktilstand (3) dårlig,030,134,051 1,822 1,030,258,133 3,729 1,053 1,294,555,137 16,336 1,000 1,742 Psykisktilstand God (ref.) 0b.. 0.. 0b.. 0.. 0b.. 0.. Fysisktilstand (1),093,087 1,141 1,285 1,097,118,090 1,727 1,189 1,125,105,094 1,245 1,265 1,111 Fysisktilstand (2),339,103 10,929 1,001 1,403,290,106 7,561 1,006 1,337,196,111 3,109 1,078 1,216 Fysisktilstand (3) dårlig,106,108,963 1,326 1,112,133,110 1,445 1,229 1,142,143,115 1,555 1,212 1,154 Fysisktilstand God (ref.) 0b.. 0.. 0b.. 0.. 0b.. 0.. Køn = Kvinder,463,071 42,430 1,000 1,589,810,073 121,563 1,000 2,249 1,645,078 446,405 1,000 5,183 Køn = Mænd (ref.) 0b.. 0.. 0b.. 0.. 0b.. 0.. Udd. kort videreg,278,111 6,218 1,013 1,320,300,113 7,030 1,008 1,350,566,118 23,004 1,000 1,760 Udd. ml. videreg.,405,094 18,440 1,000 1,499,440,096 21,213 1,000 1,552,574,101 32,263 1,000 1,775 Udd. lang videreg,393,112 12,348 1,000 1,481,440,114 14,909 1,000 1,553,808,119 46,432 1,000 2,244 Udd. ingen videreg (ref.) 0b.. 0.. 0b.. 0.. 0b.. 0.. Side 25 af 39

3.4 Anvendelse af ordinal logistisk regression Den ordinale regressionsmodel kan anvendes i tilfælde, hvor den afhængige variabel er en ordinalskalleret variabel. Dette vil sige at kategorierne i variablen kan rangordnes. Ved den ordinale regressionsanalyse beregnes oddsene for kategorierne kumulativt. I forhold til den afhængige variabel om hvor vigtigt er det at ændre vægt, sammenlignes først at det ikke er vigtigt med at det er lidt vigtigt, noget vigtigt og meget vigtigt. Dernæst sammenlignes ikke vigtigt og lidt vigtigt med noget vigtigt og meget vigtigt. Sidst sammenlignes ikke vigtigt, lidt vigtigt o g noget vigtigt med meget vigtigt. Det er et krav i forhold til anvendelse af den ordinale regressionsmodel, at den uafhængige variabel har lige stor betydning for de forskellige kategorier på den afhængige variabel. Det vil sige, at BMI og de andre inddragede faktorer har lige stor betydning for de fire kategorier på variablen, om hvor vigtigt det er at ændre vægt. Ligning for den ordinale regression er: Log it (P(Y j)) = (α j + β 1 x 1 + β 2 x 2 + β k x k ) Resultatet for den simple og multiple ordinale regression ses i tabel 8. Inden der kontrolleres for andre faktorer, er oddsene for den simple ordinale regressionsanalyse for konstanterne for de tre ovenstående sammenligninger på henholdsvis 0,631, 1,895 og 6,246. Oddsene for BMI kategorierne er de samme for de tre sammenligninger. Oddsene er for de undervægtige 0,865, for de overvægtige 4,433 og for de svært overvægtige 11,101 i forhold til de normalvægtige. Ved den multiple ordinale regressionsanalyse falder oddsene for de undervægtige til 0,587, og stiger for de overvægtige og svært overvægtige til henholdsvis 6,903 og 16,265. De undervægtige er dog ikke signifikante ved hverken den simple eller den multiple ordinale regressionsanalyse. Ved den multiple regressionsanalyse er alle de inddragede variable signifikante med undtagelse af fysisk tilstand. Den multinominale regressionsanalyse viste, at der var stor forskel på både BMI og de andre faktorer i forhold til kategorierne på den afhængige variabel, om hvorvidt informanterne synes det er vigtigt at ændre vægt. Da kravet for den ordinale regressionsanalyse netop er at de uafhængige variable skal have samme betydning for alle kategorierne på den afhæ ngige variabel, vil det således være misvisende at anvende en ordinal regressionsmodel. Resultaterne fra den ordinale regressionsanalyse vil derfor ikke blive beskrevet yderligere. Side 26 af 39