Det Danske Samfund i sociologisk perspektiv Kvantitative metoder. Indledning (1024,824)(1015,815)(1035,835)... 3

Størrelse: px
Starte visningen fra side:

Download "Det Danske Samfund i sociologisk perspektiv Kvantitative metoder. Indledning (1024,824)(1015,815)(1035,835)... 3"

Transkript

1 Indholdsfortegnelse Indledning (1024,824)(1015,815)(1035,835)... 3 Problemformulering (1024,824)(1015,815)(1035,835)... 4 Teoretisk redegørelse... 5 Finn Diderichsen: Individet og dets eksponering for sundhedstilstande (1015,815)... 5 Pierre Bourdieu: Et differentieret samfund symbolsk magt og symbolsk vold (1024,824)... 6 Jørgen Elm Larsen: Forskellighed i kommunikation og refleksionsniveau (1035,835)... 7 Sara Nettleton: Det informationssøgende individ (1035,835)... 9 Rune Lykkeberg: Den kulturelle overklasses dominans (1015,815)... 9 Teoretiske hypoteser (1024,824) Operationalisering (1035,835) Empiriske hypoteser (1015,815) Statistisk teori Stokastiske variable (1024,824) Estimator og estimat (1015,815) Momenter for stokastiske variable (1015,815) Bernoullifordeling (1035,835) Standardnormalfordelingen (1024,824) Den centrale grænseværdisætning (1024,824) Hypotesetest (1035,835) Hypotesetest af en χ2-fordeling (1035,835) Hypotesetest for middelværdi ved Bernoullifordelte observationer (1015,815) Enkeltcelletest (1015,815) Repræsentativitetstest χ 2 -test for repræsentativitet (1015,815) Z-test for repræsentativitet (1024,824) Delkonklusion (1024,824)(1015,815)(1035,835) Uafhængighedstests Hypotese 1: uddannelse og helbred (1035,835) Hypotese 2: uddannelse og kommunikation med det offentlige (1015,815)

2 Delkonklusion (1024,824)(1015,815)(1035,835) Diskussion Første hypotese: ulighed i sundhed (1024,824) Anden hypotese: lave sociale positioner er udsatte for symbolsk vold (1035,835) Sammenspil mellem de to hypoteser (1015,815) Kortuddannedes frafald til rygestopkurser (1024,824) Symbolsk vold på sundhedsområdet (1024,824) Nye krav til individets rolle på sundhedsområdet (1035,835) Ulighed i brug og forståelse af sundhedssektoren (1015,815) Reaktioner på den symbolske vold (1024,824) Konklusion (1024,824)(1015,815)(1035,835) Metodeovervejelser (1024,824)(1015,815)(1035,835) Perspektivering (1024,824)(1015,815)(1035,835) Litteraturliste Litteratur Internetsider Bilag Bilag 2 - dofile

3 Indledning Denne opgave vil omhandle emnet ulighed i sundhed og diskuterer, hvorvidt en skæv fordeling af forudsætningerne for at forstå den offentlige kommunikation på sundhedsområdet kan være med til at skabe en ulighed i sundhed hos den danske befolkning. I dagens Danmark er der stor fokus på sundhed. Både den offentlige og den private sektor bruger store mængder ressourcer på sunde kantiner, motionstilbud til medarbejdere, rådgivning om forebyggelse af alverdens sygdomme og gennemførelse af et utal af sundhedskampagner. Alligevel påviser flere undersøgelser stadig en ulighed på sundhedsområdet, når man inddeler befolkningen efter forskellige sociale positioner 1. Det ser altså ud til, at de mange budskaber ikke når frem til bestemte grupper i samfundet. Hvad årsagen hertil er, findes der mange forklaringer på. Er det dovenskab, mangel på intelligens eller ligegyldighed hos individet, eller er det udelukkende sundhedssektoren, der fejler? Hvilke faktorer skal tages i betragtning, og hvordan kan disse i så fald influere på ulighed i sundhed? Uanset hvad, vil sundhed og helbred altid være under debat, idet samfundet har en ikke mindst økonomisk interesse i at bestå af en sund og rask befolkning. Fænomenet omkring sundhedsforskelle i de sociale lag er i høj grad sociologisk relevant. Både i forhold til at kortlægge årsagerne til uligheden, men også i forhold til at overskue, på hvilke måder det socialpolitisk er muligt at udligne disse forskelle. Derudover er problemstillingen yderst aktuel i øjeblikket. For det første fordi regeringen netop har besluttet at fjerne de ellers nyligt indførte afgifter på fedt og sukker. For det andet fordi der i medierne er stor fokus på forskellen i sundhed mellem godt stillede og dårligt stillede samfundsborgere 2. Vi vil i denne opgave undersøge sammenhængen mellem individers sociale position i samfundet og deres sundhedstilstand. Samtidig vil vi også undersøge, hvordan den sociale position har 1 Juel, Knud & Mette Bjerrum Koch, 2013: Social ulighed i dødelighed i Danmark gennem 25 år. Betydningen af 2 Eksempelvis: Schmidt, Anders Legarth, 2012: Uddannelse baner vejen for et langt og sundt liv. Politiken. 16. maj 2012: (besøgt ) og Ritzau 2013: Udspil: Færre smøger og mindre alkohol skal sikre lighed. Information. 13. maj 2013: (besøgt d ) 3

4 betydning for, hvorvidt man er i stand til at forstå og kommunikere med offentlige myndigheder. Dette vil lede os til en teoretisk diskussion, der vil sætte fokus på, om det at være udsat for symbolsk vold kan være årsag til en ulighed i sundhed hos den danske befolkning. Problemformulering Ud fra ovenstående indledning har vi valgt at opstille følgende problemformulering: Hvorvidt findes der en sammenhæng mellem social position og sundhedstilstand? Og hvis denne sammenhæng findes, hvorledes kan den så forklares med befolkningens ulige forudsætninger for at forstå kommunikation med offentlige systemer? For at give et overblik over opgavens indhold og afsnit vil vi nu fremlægge en kort vejledning for, hvordan vi ønsker at undersøge vores problemformulering. Læsevejledning Først i opgaven vil der i et teoretisk afsnit blive redegjort for flere sociologiske teorier, som vi bruger til at tematisere emnet ulighed i sundhed. Herunder også forskning om ændringer i medicinvidenskaben og teori om betydningen af en kulturel overklasse i samfundet. Hermed gives et bredt indblik i perspektiver, der er relevante for vores opgave. Næstefter vil opgavens teoretiske og empiriske hypoteser opstilles, med en gennemgang af operationaliseringen fra teori til empiri. Efterfølgende vil der blive redegjort for den statistiske teori, som er nødvendig for at udføre de ønskede tests til vores undersøgelse. Dette leder til en præsentation af det anvendte datasat, og udvælgelsen af analyseudvalg og variable. Herefter vil vi først udføre repræsentativitetstest for at belyse, hvorvidt vores analyseudvalg er repræsentativt for befolkningen. Efterfølgende udfører vi hypotesetests af vores hypoteser. Med resultaterne fra de statistiske tests vil vi inddrage teorien og opstille en diskussion af de teoretiske hypoteser. Her vil vi samtidig udforme en ny teoretisk model, som også vil blive diskuteret. Afslutningsvis vil resultaterne af vores undersøgelse blive opsamlet, vores valg af metode vil overvejes, og der vil ydermere blive lagt op til andre interessante perspektiver. 4

5 Teoretisk redegørelse I det følgende vil vi redegøre for de teorier og begreber, vi vil anvende i besvarelsen af vores problemformulering. Først vil vi redegøre for Finn Diderichsens teorier om ulighed i sundhed. Efterfølgende vil der blive introduceret til Pierre Bourdieu ved en redegørelse af hans begreber om habitus, kapitalformer og symbolsk vold. Med Bourdieus begreber på plads følger Jørgen Elm Larsen teori om differentiering mellem forskellige klasser i samfundet. Her tematiseres, hvorledes en dominerende klasse kan være styrende for den almene virkelighedsopfattelse. Denne teori vil give en anden forklaring på ulighed i sundhed end Diderichsens, hvilket vil blive berørt senere i opgaven i et samlet diskuterende afsnit. Herefter vil en redegørelse af en sociologisk forståelse af medicinfagets udvikling, skrevet af Sara Nettleton, give indblik i, hvordan det moderne menneske i dag må forholde sig til sundhedsvæsenet. Afslutningsvis vil vi med afsæt i et udsnit af Rune Lykkebergs bog Kampen om sandhederne redegøre for hans forståelse af en kulturel overklasse, som fungerer som smagsdommere for vores samfund. Finn Diderichsen: Individet og dets eksponering for sundhedstilstande Finn Diderichsen er professor for Institut for Folkesundhedsvidenskab på Københavns Universitet og speciallæge i socialmedicin. Han ser ulighed i sundhed som et resultat af et ulige samfund. Diderichsens hovedpointe er, at forskellige personer er eksponeret forskelligt i forhold til risikoen for dårligt helbred (Diderichsen 2011:363f). Dette betyder, at folk, der i forvejen er udsat for én påvirkende faktor, har større risiko for også at blive udsat for andre faktorer. Der findes mange forskellige faktorer, som kan påvirke helbredet. Diderichsen tager afsæt i sammenhængen mellem indkomst og helbred og mener, at en stigende indkomst medfører en faldende risiko for sygdom. Heri ligger også en risiko for påvirkning af helbredet ved arbejdsløshed (Diderichsen 2011:359). Et andet risikomoment findes i personers opvækst. Diderichsen argumenterer for, at fattigdom i barndommen medfører større risiko for fattigdom i voksenlivet, som igen medfører større eksponering for dårligt helbred (Diderichsen 2011:363). Ydermere nævnes faktorer som boligforhold, jobtype, social inklusion eller eksklusion og sundhedsadfærd, som alle varierer, alt efter hvilken social position i samfundet, der besiddes. Denne sociale position fastlægger Diderichsen på baggrund af indkomst, uddannelse, køn, etnicitet, alder og ikke mindst forældrenes position. Dermed vil en persons sociale position i samfundet have betydning for, hvor stærkt man er eksponeret for de forskellige risikofaktorer, 5

6 som kan påvirke helbredet. Uligheden i befolkningens sundhed opstår således ifølge Diderichsen af en ulighed, der gør sig gældende på et større samfundsmæssigt plan (Diderichsen 2011:366). Pierre Bourdieu: Et differentieret samfund symbolsk magt og symbolsk vold Teoretikeren Pierre Bourdieus bidrag til den moderne samfundsforskning består af en metode, der kombinerer et teoretisk begrebsapparat med vidtgående empiriske undersøgelser. I følgende afsnit vil der blive redegjort for begreberne habitus, kapitalformer, symbolsk magt og symbolsk vold, som Bourdieu anvender i sin handlingsteori til at beskrive samfundsindretningen (Järvinen 2007:345). Bourdieu forstår samfundet som en samlet mængde af mange forskellige positioneringer. Ethvert menneske har en position, som vedkommende vil forsøge at opretholde eller måske stige fra. Bourdieu bruger begrebet habitus til at forklare individets valg, handlinger, ressourcer, præferencer og måden, hvorpå omverdenen anskues. Netop habitus har stor betydning for en persons sociale position i samfundet (Bourdieu 2005:84). Habitus er et produkt af socialisering, hvilket både omhandler den primære socialisering i opdragelsen, samt de erfaringer individet opnår gennem livet. Habitus er både mentalt og kropsligt forankret og viser sig dermed både ved de holdninger og følelser, et individ har, men også i vedkommendes kropsholdning og måden, handlinger udføres på (Wilken 2011:44-48). Individets habitus består blandt andet af den kapitalsammensætning, vedkommende er i besiddelse af. Bourdieu arbejder her med tre kapitalformer: social, kulturel og økonomisk kapital. Social kapital omfatter individets omgangskreds og sociale netværk. Økonomisk kapital omfatter penge eller værdier, der direkte kan omsættes til penge (Wilken 2011:58f). Kulturel kapital består af tre dele. Den tingsliggjorte kulturelle kapital, som er direkte materielle ting, der har en kulturel værdi, eksempelvis bøger eller kunstværker. Den kropsliggjorte kulturelle kapital, som har direkte forbindelse med habitus, i og med at den omfatter, hvad man gennem socialisering har lært at tillægge en kulturel betydning, eksempelvis at værdsætte et maleri. Den institutionaliserede kulturelle kapital omfatter uddannelse, fx i form af diplomer og afgangsbeviser fra uddannelsesinstitutioner. Kulturel kapital er desuden i høj grad konvertibel med den økonomiske kapital (Bourdieu 1986:243). Har man høj grad af økonomisk kapital, har man mulighed for at købe dyre kunstværker og dermed opnå kulturel kapital via den symbolske betydning, kunstværket har. 6

7 Den anden vej kan kulturel kapital i forhold til uddannelse anvendes til at få gode jobs og dermed opnå stor økonomisk kapital. Éns habitus er medbestemmende for, hvor god man er til at konvertere og opnå kapitalformerne. Man er dermed disponeret for denne evne (Bourdieu 1986:244). Opsamlende kan det siges, at det er en persons habitus og kapitalsammensætning, der bestemmer, hvor ressourcestærk man er, og dermed hvilken social placering man besidder. Bourdieu beskriver også nogle af de magtkampe, der udspiller sig i det ulige samfund. Her skelner Bourdieu mellem symbolsk magt og symbolsk vold. Begrebet symbolsk magt beskriver, hvordan en klasse eller position i samfundet kan besidde magten til at konstruere virkeligheden på et givet felt (Bourdieu 1996:40). Dermed vil de sociale positioner, som ligger under magthaverne, være udsat for symbolsk vold: Det er i egenskap av å være strukturerte og strukturerende redskaper for kommunikasjon og kunnskap at de symbolske systeme fyller sin politiske funkjson som instrumenter til å påtvinge eller legimitere et herredømme over en annen (symbolsk vold)( ) (Bourdieu 1996:42). Symbolsk vold udøves altså, når nogle pålægger andre deres interesser, men på en sådan måde, at de bliver anerkendt og legitime og dermed accepteret som naturlige. Dette kan også tolkes som en usynlig, undertrykkende magt. En måde at opnå en legitimeret magt er i høj grad gennem den kulturelle kapital i sin institutionaliserede form: As an instrument of reproduction capable of disguising its own function, the scope of the educational system tends to increase, and together with this increase is the function of the market in social qualifications which gives rights to occupy rare positions. (Bourdieu 1986:254f). Her kan de mange diplomer og beviser i uddannelsesverdenen give symbolsk magt, da indehavere ofte vil blive set på som eksperter på det pågældende område (Wilken 2011:60). Jørgen Elm Larsen: Forskellighed i kommunikation og refleksionsniveau. Sociologen Jørgen Elm Larsen tager Bourdieus begreber i brug i bogen Kontinuitet og Forandring. I afsnittet Klassebiografi og individuel biografi bliver blandt andet magtkampene mellem forskellige positioner i samfundet beskrevet. Elm Larsen forklarer, hvorledes den dominerende samfundsgruppes udøvelse af symbolsk vold kan ses som værende en væsentlig faktor for reproduktion af sociale skel i samfundet (Larsen 2011:73). I ethvert magtfelt vil de højest placerede have magt til at sætte dagsordenen for, hvordan det pågældende sociale system fungerer. Elm Larsen påpeger, at de sociale systemers 7

8 kommunikation er betinget af de magthavende personers habitus. Kommunikationen i de sociale systemer skabes af kommunikerende individer, og deres habitus bliver dermed grundlæggende for, hvilken kommunikation der bliver benyttet (Larsen 2011:58f). Således bliver den symbolske magt udøvet over de resterende individer, der må handle herefter. Den virkelighed, som den dominerende klasse forstår, bliver også den virkelighed, som alle berørte parter i et gældende sociale system handler ud fra og denne virkelighed vil opfattes som naturlig for alle. Det er netop, når der ikke stilles spørgsmålstegn ved den måde, tingene fungerer på i et socialt system, at positionerne vil blive reproduceret og den symbolske vold fortsat udøves (Larsen 2011:64). Elm Larsen beskriver også, hvordan personer i de sociale lag har forskellige muligheder til at forstå viden og handle herefter: Ressourcerne til at indsamle og sortere viden og håndtere de ofte komplekse planlægnings- og valgsituationer er ikke ens i alle sociale lag (Larsen, 2011:37). Der er hermed forbundet en risiko for at skabe en differentiering mellem såkaldte refleksive tabere og refleksive vindere (Larsen 2011:37). Han understreger dog, at individer i lave sociale lag ikke nødvendigvis har en dårligere udviklet refleksivitet end individerne i højere sociale lag. Forskellen ligger ikke i, hvor meget man reflekterer, men i stedet i hvad der reflekteres over, hvilket er betinget af ens habitus (Larsen 2011:66). Dette antyder en risiko for, at de personer, som kommunikerer i de sociale systemer, automatisk henvender sig til personer med samme habitus og kapitalsammensætning som dem selv. Altså henvender de sig til folk med samme refleksionsevne. Fordi disse ressourcer er indlejret i individernes habitus, bliver de kommunikerendes virkelighedsopfattelse forstået som den almengyldige og den, der bliver handlet ud fra. Dette kan forstås som symbolsk vold mod de lavere sociale lag, da de ikke har det samme udgangspunkt eller ressourcer for refleksion og dermed svært ved at forstå denne kommunikation, der bliver opfattet som den almindelige (Larsen 2011:58f). Med Elm Larsens udgangspunkt opnås en forståelse af et samfund, hvor den sociale position har betydning for, hvorvidt et individ udøver symbolsk vold eller er underlagt den. Dette har endvidere betydning for, hvorledes et individ kan fungere i de forskellige sociale systemer. 8

9 Sara Nettleton: Det informationssøgende individ I teksten The Social Construction of Medical Knowledge beskriver Sara Nettleton, hvorledes menneskets forhold til kroppen og til medicinfaget har ændret sig over tid. Ved at se på gamle lægejournaler får hun adgang til beskrivelsen af en verden, hvor man så ganske anderledes på kroppen og derfor også havde helt andre behandlingsformer. På baggrund af dette argumenterer Nettleton for, at vores forståelse af kroppen er socialt konstrueret. Den viden vi har, om hvordan kroppen bør behandles, mener hun ligeledes er noget, der er opstået ud af diskurser på det gældende tidspunkt (Nettleton 2006:21). Nettleton præsenterer herefter fem medicinske kosmologier, der opdeler tiden fra 1770 erne og frem til nu i forskellige måder, hvorpå samtiden har indrettet sig i forholdet mellem patient og læge samt patient og den medicinske viden. Nutidens kosmologi med navnet e-scaped medicine, beskriver en aktiv patient, der selv søger viden og information om sygdomme og helbredsforhold. Ansvaret for sundhed ligger i høj grad hos befolkningen selv, og en ny del af lægernes rolle bliver derfor at oplyse om forskellige risikofaktorer, som man derefter selv må forstå og handle ud fra på egen hånd (Nettleton 2006:23f). Et godt eksempel på vores samtids informationssøgende individ er den store brug af hjemmesiden hvor der er samlet viden om sygdomme, der er skrevet af læger og speciallæger. Samlet set kan man med Nettletons forskning se, at der i dag stilles et større krav til personers egne evner og muligheder for at opsøge og forstå viden og risikofaktorer inden for sundhedsområdet. Rune Lykkeberg: Den kulturelle overklasses dominans I bogen Kampen om sandhederne skriver Rune Lykkeberg om den kulturelle klassekamp. Den kulturelle klassekamp handler grundlæggende om, at der i det danske samfund findes en kulturel overklasse, som undertrykker de dominerede. Lykkeberg tager udgangspunkt i den store tilslutning til de borgerlige partier under Foghs storhedstid. Ifølge Lykkeberg skyldtes succesen, at partierne fik overbevist de laveste sociale klasser om, at de dominerende i samfundet var den venstreorienterede, anti-autoritære kulturelle elite (Lykkeberg 2008:53). Formålet med Lykkebergs tekst er netop at fokusere på denne nye form for klassekamp, hvor der i stedet for økonomisk dominans herskes ud fra kulturel kapital. 9

10 Ifølge Lykkeberg består den kulturelle overklasse af professorer, samfundsforskere, kulturproducenter osv., som dominerer de offentlige forestillinger om, hvad der er sandt og falsk, rigtigt og forkert (Lykkeberg 2008:69). På denne måde bliver den kulturelle elites diskurs påtvunget de dominerede. Lykkeberg kalder den kulturelle overklasse for smagsdommere, fordi det bliver dette forholdsvis lille segment af samfundet, som definerer den gode smag i alt fra kunst til børnepasning. Hermed bliver der lagt afstand til den dårlige smag, som, ifølge Lykkeberg oftest er til stede blandt personer med lav uddannelse og mindst nedarvet kulturel kapital. Derfor bliver de lave sociale klassers smag genstand for latter. Som Lykkeberg selv formulerer det: De venstreorienterede har som gode marxister aldrig foragtet andre klassers økonomiske fattigdom, hvorimod det har været legitimt at foragte deres smag (Lykkeberg 2008:71). Den kulturelle overklasses dominans handler altså ikke om økonomisk formåen, men om magten til at bestemme god smag. Lykkebergs tese er, at de borgelige partier med Anders Fogh Rasmussen i spidsen formåede at få den danske befolknings øjne op for, at de var udsat for symbolsk vold. Med deres retorik fik de bevidst eller ubevidst overbevist folket om, at der herskede en kulturel overklasse. Idet symbolsk vold jf. tidligere afsnit virker som en usynlig magt, opnåede de borgerlige partier succes ved netop at gøre den venstreorienterede elites symbolske vold synlig. Vi har nu redegjort for de begreber og teorier, vi fremover i opgaven vil gøre brug af. De næste afsnit vil indeholde vores teoretiske og empiriske hypoteser, som uddyber problemstillingerne i opgaven. Teoretiske hypoteser Vores første teoretiske hypotese er, at individer med høj social position i samfundet har en bedre sundhedstilstand end individer, som har en lavere social position. Altså tror vi, at individets sociale position i samfundet påvirker vedkommendes sundhedstilstand. Hypotesen opstilles således: 10

11 Social position Sundhedstilstand Vores anden teoretiske hypotese udtrykker, at individer med lav social position bliver udsat for symbolsk vold. Vi antager dermed, at individets sociale position i samfundet har betydning for, hvorvidt vedkommende bliver udsat for symbolsk vold. Social position Udsat for symbolsk vold For at gøre det muligt at undersøge vores hypoteser rent empirisk, er det nødvendigt at operationalisere vores teoretiske begreber til empirisk målbare størrelser. I det følgende afsnit vil vi gøre rede for, hvordan vi har operationaliseret vores begreber. 11

12 Operationalisering Vi vil i dette afsnit redegøre for de overvejelser der må gøres i overgangen fra teoretiske hypoteser til empiriske hypoteser. Vi har valgt at operationalisere det teoretiske begreb social position til den målbare variabel Uddannelse. Variablen er inddelt alt efter, hvilken højest gennemførte uddannelse respondenten besidder. Man kan diskutere, om variable som indkomst, månedligt rådighedsbeløb eller lignende ville være mere oplagte til at afspejle personers sociale position. Argumentationen for vores valg hænger imidlertid sammen med Bourdieus kapitalbegreb, som vi har redegjort for i teoriafsnittet. Som tidligere beskrevet er kulturel og økonomisk kapital i høj grad konvertible med hinanden. Da uddannelse hører ind under den kulturelle kapital i form af institutionaliseret kulturel kapital, mener vi, at netop uddannelsesvariablen vil give os et godt, overordnet indblik i, hvilken social position i samfundet de pågældende personer befinder sig i. Desuden taler Lykkeberg om den dominerende kulturelle overklasse. Lykkeberg indikerer altså, at opdeling i sociale lag i dag i høj grad er præget af kulturelle forskelle, og ikke som tidligere af økonomiske uligheder. Derfor mener vi at kunne argumentere for, at Uddannelse er den variabel, der afspejler forskellene i de sociale positioner bedst. Begrebet sundhedstilstand har vi valgt at operationalisere til variablen Helbredsproblemer. Helt konkret bliver respondenterne spurgt om, hvorvidt de oplever varige problemer med førlighed eller helbred. Hermed vil vores testresultater omhandle alle typer af helbredsproblemer, både arvelige, miljøforårsagede og livsstilssygdomme. Der kan være en ulempe i, at det er personernes egen vurdering af helbredet, vi måler på. Principielt vil der være en usikkerhed i, hvordan den enkelte respondent definerer varige problemer. Nogen kan være tilbøjelig til at svare Ja ved den mindste følelse af utilpashed, mens andre ikke er klar over, at de rent faktisk har problemer med helbredet. Vi mener dog, at netop denne variabel er den mest ideelle til at skabe et billede af den generelle sundhedstilstand. For det første fordi spørgsmålet er et enkelt ja/nej-spørgsmål, som bliver stillet neutralt, hvilket giver en større sandsynlighed for, at langt de fleste tilkendegiver det sande svar. Alternativt kunne der være blevet brugt et mere negativt ladet spørgsmål som eksempelvis er du syg?, hvor flere vil være tilbøjelige til at svare nej. For det andet er det efter vores mening nu engang 12

13 personen selv, som i denne slags undersøgelser er den bedste til at vurdere sit eget helbred. Hvis man i stedet måler på, hvorvidt respondenterne indtager medicin regelmæssigt, vil der fx opstå en usikkerhed i forbindelse med, hvorvidt medicinen afhjælper et helbredsmæssigt problem, psykisk problem eller noget helt tredje. Vores sidste teoretiske begreb, symbolsk vold, operationaliserer vi til, hvorvidt man er i stand til at kommunikere med det offentlige (fremover kaldes variablen Kommunikation med det offentlige ). Denne operationalisering er udtænkt i forhold til den redegørelse for symbolsk vold, vi tidligere introducerede. Vores argumentation er, at hvis man som person befinder sig i en lav social position, er man i høj grad underlagt den diskurs i den offentliges kommunikation, som personer med højere social position har lagt. Vi måler derfor konkret udsathed for symbolsk vold ved at spørge ind til, hvorvidt man er i stand til selv at lave en skrivelse til en offentlig myndighed. På denne måde får vi et billede af, om respondenterne føler sig tilstrækkeligt kompetente, når det gælder kommunikation i det offentlige system. Her vil der ligge en usikkerhed i, at personer, der aldrig har haft brug for at lave en skrivelse til det offentlige, reelt ikke ved, om de er i stand til det eller ej. De vil derfor svare ud fra deres fornemmelse af, om de selv tror, de kan. I forhold til vores hypotese er dette dog ikke noget problem, da det i lige så høj grad er følelsen af at evne denne handling, der er interessant, fremfor om de rent praktisk formår det. Vi har nu gjort rede for, hvordan vi rent empirisk vil måle vores teoretiske begreber. Dermed er vi kommet frem til to empiriske hypoteser, som vi nu vil opstille. 13

14 Empiriske hypoteser Den første empiriske hypotese går på, at personer med høj uddannelse i lavere grad har helbredsproblemer set i forhold til personer med lav uddannelse. Altså tror vi, at uddannelse har en betydning for helbredsproblemer. Opstillet ser hypotesen således ud: Uddannelse Helbredsproblemer Den anden empiriske hypotese er, at personer med høj uddannelse lettere kan kommunikere med det offentlige end personer med lav uddannelse. Antagelsen er altså, at uddannelse påvirker muligheden for kommunikation med det offentlige, hvilket illustreres nedenfor: Uddannelse Kommunikation med det offentlige Hermed er de teoretiske hypoteser, vi startede med at fremlægge, nu blevet til empirisk målbare hypoteser, som er mulige at teste rent statistisk ud fra vores datamateriale. 14

15 Statistisk teori Følgende afsnit vil redegøre for den statistik, der senere vil blive brugt til at udføre repræsentativitetstest og tests af vores hypoteser. Overordnet set bruges statistik til at undersøge sammenhænge og komme med forudsigelser om sammenhænge. I statistik anvender man induktion, hvilket betyder, at man udtaler sig om en population ud fra en stikprøve (Malchow-Møller & Würtz 2010:17-20). En population forstås ved et antal elementer med en eller flere bestemte karakteristika. Eksempelvis en nationalitet, hvor et karakteristikum kunne være indkomst. En stikprøve består af en andel elementer af ens population. Når en stikprøve trækkes, opstår der usikkerheder i repræsentativiteten af populationen. Det er derfor vigtigt hvilken strategi, der vælges til udtrækket. Jo mere tilfældigt man kan udtrække sin stikprøve, jo mere sikkert kan der gives forudsigelser om sammenhænge i populationen. Vi bruger statistikken til at beregne den usikkerhed, der opstår med stikprøven (Malchow-Møller & Würtz 2010:25, 53, 55). Stokastiske variable Når der regnes med statistik, arbejdes der ofte med mange hændelser på samme tid. For overskuelighedens skyld anvendes derfor en stokastisk variabel til at forudsige sandsynlighederne for de mange hændelser. En stokastisk variabel er en funktion, der til ethvert udfald forbinder en talværdi. I vores opgave vil vi skelne mellem den stokastiske variabel og dens udfald ved at betegne den stokastiske variabel med store bogstaver (X og Y) og selve udfaldene med små bogstaver (x og y) (Malchow-Møller & Würtz 2010:75). Der skelnes mellem to former for stokastiske variable: diskrete stokastiske variable og kontinuerte stokastiske variable. Diskrete stokastiske variable kan antage et tælleligt antal værdier såsom 0, 1, 2 osv. Kontinuerte stokastiske variable er værdier, der også kan have decimaler. Da der kan være uendeligt mange decimaler, er der i princippet også uendeligt mange udfald (Malchow-Møller & Würtz 2010:77). Estimator og estimat Det er ikke altid, at fordelingen af ens observationer er kendte, men det kan stadig være ønskværdigt at have kendskab til forskellige egenskaber ved fordelingen. Derfor konstrueres et 15

16 skøn på forskellige beskrivende mål ud fra en stikprøve med en simpel tilfældig udtrækning. Et sådan skøn kaldes en estimator. Når stikprøven er udtrukket og estimatoren brugt til beregning for det pågældende mål, fås et estimat på målet - altså den realiserede værdi (Malchow-Møller & Würtz 2010:223). En god estimator må være unbiased, altså faktisk lig det mål, der ønskes at estimere. Dette sker, når uendeligt mange stikprøver, altså realiserede estimater, i gennemsnit vil ramme den sande værdi, som estimatoren er et skøn på (Malchow-Møller & Würtz 2010:228). Momenter for stokastiske variable Når der arbejdes med en population, kan der anvendes en række beskrivende mål til at skabe overblik over denne. Disse mål kaldes momenter. Et kendt moment er middelværdien, som er betegnelsen for gennemsnittet af en given kategoris værdier. Når man arbejder med stokastiske variable, bruger man en estimator for middelværdien. Trækkes en simpel tilfældig stikkeprøve med n observationer, X 1,..X n, som alle har en fordelingen f x (x), vil de hver have en middelværdi, som betegnes E(X). Denne er et skøn på den sande middelværdi, som betegnes µ. Ved at kombinere disse observationer i en samlet formel opnås et mere præcist skøn, og hermed en estimator for middelværdien. Formlen ses herunder (Malchow-Møller & Würtz 2010:226): X = 1 n! X!!!! Et andet brugt moment er variansen. Selvom to populationer har helt samme middelværdi, kan de godt have forskellig spredning af værdier i forhold til middelværdien. For at give en beskrivelse af denne spredning i observationerne anvendes variansen, σ 2. Da variansen er en kvadreret størrelse, er det svært at sammenligne to varianser. Derfor bruger man i stedet standardafvigelsen, som er kvadratroden af variansværdien og beskriver observationernes gennemsnitlige afstand fra middelværdien. Hermed får man en måleenhed, der er den samme som for observationerne og mulig at sammenholde med andre standardafvigelser (Malchow- Møller & Würtz 2010:112f). I det følgende vil vi beskrive Bernoullifordeling, normalfordeling samt standardnormalfordeling, som er nogle af de forskellige måder, stokastiske variable kan fordele sig på. 16

17 Bernoullifordeling En diskret stokastisk variabel følger en Bernoullifordeling, hvis den kun har to mulige udfald. Disse udfald kan betegnes som 1 (succes) og 0 (fiasko). Sandsynlighederne for de to værdier er henholdsvis p og 1-p. Bernoullifordelingen skrives: X ~ Ber(p), hvor p er sandsynligheden for 1. Bernoullifordelinger er anvendelige, når der er tale om populationer med to typer af elementer. Det kan være ja/nej, kvinde/mand osv. (Malchow-Møller & Würtz 2010:137). Normalfordeling En normalfordeling er en fordeling for en kontinuert stokastisk variabel: Y ~ N(µ,σ 2 ), hvor µ er gennemsnittet og σ 2 er variansen. Grundet de uendeligt mange udfald for den kontinuerte stokastiske variabel er det vanskeligere at beskrive dens sandsynlighed. Derfor anvendes der ikke sandsynligheder men tæthedsfunktioner. For en kontinuert stokastisk variabel, Y, vil tæthedsfunktionen da være (Malchow-Møller & Würtz 2010:148): f y = 1 2 π σ! e!!!!!!!! At tilskrive tæthed vil sige, at man arbejder med arealet under normalfordelingskurven som mål for sandsynlighed. Dette areal er altid lig med 1. Grafisk ser normalfordelingen således ud: Model 1: Normalfordeling Middelværdi Varians 17

18 Er observationerne uafhængige og uden systematiske fejlkilder, vil vores observationer fordele sig symmetrisk omkring den sande middelværdi, som er toppunktet for grafen. Når middelværdien bliver større, forskydes grafens midte længere til højre på x-aksen og ligeledes mod venstre, hvis middelværdien mindskes. Øges variansen, vil grafen blive bredere, dvs. jo større afvigelse fra gennemsnittet, jo bredere er tæthedsfunktionen. Arealet under grafen vil dog stadig altid være 1 (Malchow-Møller & Würtz 2010:148f). Følgende illustration viser, hvordan grafens form ændres ved en stigende varians i stigende rækkefølge: grøn, lilla, blå: Model 2: Normalfordeling med skiftende varians Standardnormalfordelingen For at udregne arealet under tæthedsfunktionen skal man integrere den. Dette er dog ikke altid lige nemt, hvorfor man benytter sig af en standardisering af normalfordelinger. Ved at standardisere en normalfordeling fås standardnormalfordelingen, som er en normalfordeling med µ=0 og σ 2 =1, hvilket er illustreret i grafen herunder: 18

19 Model 3: Standardnormalfordelingen Middelværdi: 0 Varians: 1 0 Kritisk grænseværdi Med standardnormalfordelingen er det lettere at udregne sandsynlighed, da den kumulative sandsynlighed, dvs. arealet, kan slås op i et register. Er en stokastisk variabel, Y, normalfordelt, kan den standardiseres ved at udregne Z =!!!. For en normalfordeling, Y, gælder, at hvis! Y N(µ,σ 2 ) så er den standardiserede stokastiske variabel, Z, normalfordelt med middelværdien 0 og variansen 1, dvs. Z N(0,1) (Malchow-Møller & Würtz 2010:150f). Den centrale grænseværdisætning Når der udtrækkes en stikprøve, er det ikke altid, at dens fordeling kendes. Det er dog muligt at finde en approksimation til stikprøvegennemsnittets fordeling, hvis stikprøvestørrelsen er stor. Det sker ved hjælp fra den centrale grænseværdisætning, som siger, at stikprøvegennemsnittet vil være approksimativt normalfordelt med middelværdi µ og varians σ 2 /n, når n er stor: X~! N(μ,!! ) (Malchow-Møller & Würtz 2010:232).! Med den centrale grænseværdisætning kan vi altså lave statistik på variable med ukendte fordelinger. På baggrund af den centrale grænseværdisætning får normalfordelingen en stor 19

20 betydning i vores statistiske analyse og er medvirkende til, at vi kan udtale os med større sikkerhed om populationen med vores stikprøve. Hypotesetest Arbejdes der med to forskellige variable, kan det være relevant at sammenligne disse med forskellige beskrivende mål. Herudover er det, som før beskrevet, ønskværdigt at kunne udtale sig om en population ud fra en stikprøve. En hypotesetest er et redskab, der bruges til at vurdere usikkerheden ved at udtale sig om populationen, eller til at udtale sig om uafhængighed mellem to variable. I hypotesetesten opstilles en nulhypotese, som kan bekræfte ens teori. Samtidig formuleres en alternativhypotese, som må accepteres, hvis resultatet af testen bliver at forkaste nulhypotesen. Herefter bestemmes et signifikansniveau, der fastsætter grænsen for, hvornår man må be- eller afkræfte de opstillede hypoteser. Endelig benyttes der en teststatistik, som indeholder netop den egenskab, som ønskes testet i hypotesen (Malchow-Møller & Würtz 2010:297). Hypotesetest af en χ2-fordeling Til at teste repræsentativitet og uafhængighed i vores data vil vi i disse hypotesetests gøre brug af en χ 2 -test, som tester egenskaber ved diskrete stokastiske variable, der er χ 2 -fordelte. χ 2 -testen bygger på den centrale grænseværdisætning og normalfordelingen og anvendes til at undersøge kategoriserede variable. Testen kan grundlæggende anvendes til to ting: 1) at teste, hvorvidt en stokastisk variabel fra en stikprøve følger en bestemt forventet fordeling og 2) at teste uafhængighed mellem to stokastiske variable. χ 2 -fordelingen er en kontinuert fordeling, som ligger i intervallet: [0; ], og er dermed altid positiv. χ 2 -testen kan bruges til at sammenligne flere værdier på samme tid. Testen er nemlig bygget sådan op, at den summer antallet af standardiserede normalfordelte variable, som hver er kvadredede. Dette vil beskrives nærmere, når χ 2 -testen uddybes senere i afsnittet. Den diskrete stokastiske variabel, X, kan antage K forskellige værdier eller kategorier x 1, x 2 x k. Sandsynligheden for hver af disse kategorier betegnes p 1, p 2 p k. Disse er de sande sandsynligheder, som er ukendte indtil en stikprøve er udtrukket (Malchow-Møller & Würtz 20

21 2010:361). De sande sandsynligheder testes op imod de teoretiske sandsynligheder, som betegnes π 1, π 2 π k. Når χ 2 -testen skal udføres, må man først og fremmest opstille en nulhypotese og en alternativhypotese. Hypotesen varierer alt efter, om der ønskes at teste repræsentativitet eller uafhængighed. Ved repræsentativitetstest vil værdierne for π k være hentet fra populationen og ved at sammenligne disse med en given stikprøve, kan det ses hvorvidt stikprøven kan repræsentere populationen. Nulhypotesen vil derfor være, at de ukendte, sande sandsynligheder, p k, er de samme som de forventede sandsynligheder π k. Det opstiller vi således: H 0 : p 1 = π 1 p k = π k Overfor denne nulhypotese formuleres en alternativhypotese, hvor det forventes, at mindst én af de ukendte sandsynligheder ikke er lig de forventede teoretiske sandsynligheder. Dette udtrykkes i følgende sætning: H 1 : mindst én p k π k for alle værdier af k Det vil altså sige, at hvis en enkelt af kategoriernes sandsynlighed ikke stemmer overens med de forventede sandsynligheder fra populationen, må nulhypotesen forkastes og alternativhypotesen accepteres (Malchow-Møller & Würtz 2010:362). Ved uafhængighedstest kan det testes, hvorvidt der er uafhængighed mellem to diskrete stokastiske variable. Med statistik kan vi altså ikke påvise, om der er tale om afhængighed sådanne sammenhænge skal forklares med teoretiske begrundelser, hvilket vi i opgavens sidste del vil gøre. Hypoteserne i uafhængighedstest er dannet ud fra definitionen om uafhængighed, som siger, at to variable A og B er uafhængige, når f(a,b) = f a (a) f b (b). Altså når den simultane sandsynlighed er 21

22 lig produktet af de to variables marginale sandsynligheder (Malchow-Møller & Würtz 2010:91). Hypoteserne opstilles således: H 0 : uafhængighed: f(a i,b j ) = f a (a i ) f b (b j ) hvor i =1 x og j = 1 y H 1 : afhængighed: f(a i,b j ) f a (a i ) f b (b j ) for mindst et udfald af (a i,b j ) Igen må der være uafhængighed i alle tilfælde, for at H 0 hypotesen kan accepteres (Malchow- Møller & Würtz 2010:373). Når hypoteserne er fastlagt er næste skridt bestemmelsesreglen, som afgør, hvor der skal fastsættes et signifikansniveau. Herfra kan man finde den kritiske grænseværdi, som fastsætter, hvor skellet mellem H 0 og H 1 går. Signifikansniveauet afgør sandsynligheden for at begå type-iog type-ii-fejl. Type-I-fejl indebærer at forkaste en sand nulhypotese, mens type-ii-fejl indebærer at acceptere en falsk nulhypotese (Malchow-Møller & Würtz 2010:299). Der eksisterer et trade-off mellem de to sandsynligheder; en lille sandsynlighed for type-i-fejl giver høj sandsynlighed for type-ii-fejl og omvendt (Malchow-Møller & Würtz 2010:308). Det næste skridt i χ 2 -testen er at udregne antal frihedsgrader, df (degrees of freedom). Antallet af frihedsgrader i en χ 2 -fordeling afhænger af, hvor mange π k der kan vælges frit. Idet summen af alle π K ere skal være 1, kan der i en stokastisk variabel med K kategorier altså maksimalt være K-1 frihedsgrader (Malchow-Møller & Würtz 2010:363). Arbejder man med to variable A og B, findes antallet af frihedsgrader ved, at antallet af kategorier i A fratrukket 1 ganges med antallet af kategorier i B fratrukket 1: df = (a k -1) (b k -1) (Hansen & Andersen 2009:205). Når signifikansniveauet er fastsat og frihedsgraderne udregnet, kan den kritiske værdi findes. For at finde den kritiske grænseværdi kan der slås op i en tabel over χ 2 -fordelingen. Denne er inddelt efter fraktiler og frihedsgrader. Ved et signifikansniveau på eksempelvis 5 % slås op under 0,95-fraktilen ud for antallet af frihedsgrader, og her aflæses den kritiske grænseværdi (Malchow-Møller & Würtz 2010:438). Hvis den udregnede χ 2 -værdi ligger indenfor den kritiske grænse, accepteres nulhypotesen, idet 22

23 man befinder sig i H 0 -rummet, mens H 1 må accepteres, hvis χ 2 -værdien ligger udenfor den kritiske grænse. Næstefter kan testen udføres. Hypotesemålet, vi bruger til at udføre testen, er givet ved (Malchow-Møller & Würtz 2010:362):!!!! p! π!! Når en stikprøve er udtrukket, kan p k skiftes ud med et estimat herpå. Dette gøres ved indsætte Z K, der udtrykker et estimat på de observerede frekvenser i en given stikprøve med værdien x k. Divideres Z K med antallet af observationer n i stikprøven, fås et estimat på sandsynligheden p k :!!. Dette kan således gøres med hver værdi af x k, og vores teststatistik er nu givet ved:!! χ! = n!!! Z! n π! π!! For at gøre formlen nemmere at anvende ganges n ind i brøken, og den endelige teststatistik fås ved: χ! =!!!!! Z! n π! n π! Formlen tester differencen mellem de faktiske, observerede frekvenser og de forventede frekvenser, hvorfor resultatet skal være lig 0, for at nulhypotesen kan bekræftes (Malchow- Møller & Würtz 2010:362). Grafen for χ 2 -fordelingen ser ud således: 23

24 Model 4: χ 2 -graf 0 Kritisk grænseværdi Grafens forløb kan forklares ved, at variablen, der testes på, er dannet ved sammensætningen af et antal af stokastiske variable, der alle følger den standardiserede normalfordeling. Da de stokastiske variable er kvadreret, vil alle de negative værdier, der i normalfordelingen fordeler sig til venstre for den sande middelværdi, blive flyttet over til den positive side af x-aksen. Dette er grunden til, at grafen for χ 2 -fordelingen minder om en halv graf for en normalfordeling. Det ses dog, at i forhold til normalfordelingen, der er symmetrisk fordelt omkring toppunktet, er χ 2 - grafens toppunkt forskudt mod højre. Grafen er derfor ikke ens med den positive side af grafen for normalfordelingen. Dette skyldes, at der nu er flere positive værdier som resultat af kvadreringen. Dermed følger det også, at jo flere stokastiske variable, man summer, og dermed jo flere frihedsgrader man arbejder med, jo mere vil toppunktet rykke sig mod højre. Dette illustreres herunder: Model 5: χ 2 -fordeling med skiftende frihedsgrader Kritisk grænseværdi 24

25 I model 5 ses det, hvordan grafen for χ 2 -fordelingen forskydes mod højre ved en stigning af frihedsgrader, i stigende rækkefølge: grøn, lilla, blå. Senere i opgaven vil vi bruge χ 2 -testen for at afgøre, hvorvidt vores stikprøve er repræsentativ for populationen på variablen uddannelse. Der vil også blive gjort brug af χ 2 -testen, når vi arbejder med vores hypoteser. Denne gang med testens anden funktion, uafhængighedstest. Hypotesetest for middelværdi ved Bernoullifordelte observationer I følgende afsnit vil vi forklare, hvorledes en test af middelværdi på Bernoullifordelte variable udføres som hypotesetest. Ved Bernoullifordelte observationer udføres en hypotesetest, der tester to middelværdier op mod hinanden. Som tidligere beskrevet har en Bernoullifordeling to mulige udfald: succes eller fiasko. Derfor er en test af middelværdi i en Bernullifordeling det samme som en test af andelen af succeser i fordelingen (Malchow-Møller & Würtz 2010:318). Som ved alle hypotesetests opstilles først en nulhypotese og en alternativhypotese: H 0 : p = p! H 1 : p p! eller p > p! eller p < p! Hvor p udtrykker sandsynligheden i analyseudvalget, mens p! er sandsynligheden i populationen. H 0 udtrykker, at sandsynligheden i analyseudvalget er lig sandsynligheden i populationen. Derimod kan opstilles tre forskellige alternativhypoteser, hvorfra en må vælges. De udtrykker at sandsynligheden i analyseudvalget enten er større end, mindre end eller forskellig fra sandsynligheden i populationen. Herefter skal signifikansniveauet sættes og den kritiske værdi findes. Dette gøres, som beskrevet i afsnittet om χ 2 -fordelingen, ved at slå op i et register, hvor de kritiske grænseværdier for en standardiseret normalfordeling står skrevet. Dette skyldes, at når stikprøvestørrelsen n er stor nok (n>20) vil Z-værdien, jf. den centrale grænseværdisætning, være approksimativt standardnormalfordelt. Z-værdien udregnes med følgende formel: 25

26 Z =!!!!!! (!!!! )/!! N 0,1 Efter udregning af Z-værdien vurderes denne i forhold til den/de kritiske grænseværdier, og det afgøres således, hvorvidt man må acceptere eller forkaste nulhypotesen. (Malchow-Møller & Würtz 2010:318). Enkeltcelletest Vores χ 2 -test kan fortælle os, hvorvidt der er uafhængighed mellem vores to variable eller ej, men testen fortæller ikke, hvilke celler, der er de afvigende og dermed er grund til, at vi må forkaste nulhypotesen. Derfor kan der udføres enkeltcelletest på hver celle for at se præcist, hvordan hver enkelt celle influerer på testens resultat (Malchow-Møller & Würtz 2010:373). Vi udregner størrelsen r xy, som er givet ved: (Z!" n π!" ) r!" = n π!" (1 f! x ) (1 f! y ) hvor n π!" er den forventede frekvens og Z!" er det observerede antal i cellen. Som tidligere forklaret er χ 2 -fordelingen et produkt af normalfordelte stokastiske variable, og derfor følger enkeltcelletesten, grundet den centrale grænseværdisætning, en standardiseret normalfordeling under H 0 (Malchow-Møller & Würtz 2010:373). Det betyder, at de kritiske grænseværdier findes for en normalfordeling, før man udregner r xy -værdien. Er r xy signifikant afvigende i forhold til de kritiske grænser, vil det sige, at den observerede frekvens afviger fra den forventede frekvens under H 0. Hvis r xy -værdien er positivt afvigende, betyder det en overrepræsentation i cellen i forhold til den forventede frekvens, mens en negativt afvigende r xy - værdi betyder underrepræsentation (Malchow-Møller & Würtz 2010:372f). Enkeltcelletesten kan dermed give os et billede af, hvilke celler der er medvirkende til χ 2 -testens udfald. Med den statistiske teori på plads vil vi i det følgende afsnit præsentere de data og variable, som vores opgave bygger på. Efter datapræsentationen vil følge selve de statistiske tests, hvor vi vil tage den teori i brug, som vi netop har gjort rede for. 26

27 Præsentation af datasæt Følgende afsnit vil indeholde en beskrivelse af det anvendte datasæt. Herefter vil opgavens analyseudvalg blive beskrevet, og afslutningsvis vil der være en præsentation af de variable, som vi senere i opgaven vil anvende. Præsentation af Levekårsundersøgelsen I vores undersøgelse anvender vi data fra den danske Levekårsundersøgelse. Levekårsundersøgelsen er en undersøgelse af den danske befolknings leveforhold. Med datasættet er det muligt at undersøge områder som uddannelse, boligforhold, helbred og holdninger til forskellige emner. Undersøgelsen er foretaget af Det Nationale Forskningscenter for Velfærd (SFI) og Sociologisk Institut og bygger på interviews med et repræsentativt udsnit af befolkningen. Data er indsamlet i 1976, 1986 og 2000, og datasættet består af to typer data: paneldata og tværsnitsdata for de tre indsamlingsår. Med Levekårsundersøgelsen er det blevet muligt at studere udviklingen i den danske befolknings levekår, hvilket gør den speciel. SFI og Sociologisk Institut har på baggrund af Levekårsundersøgelsen udgivet flere bøger omhandlende emner som fattigdom og fordeling af levekår (Sociologisk Databank 2007:2). Bortfald Stikprøven i år 1976 bestod af personer i alderen år. Der opnåedes interview med personer (87 %). I 1986 blev stikprøven, primært pga. dødsfald, reduceret til personer. Her opnåedes der interview med personer (83 %). I år 2000 var der personer tilbage fra den oprindelige stikprøve, som var i alderen år. Grundet denne aldersforskydning i forhold til de tidligere år tilføjedes der personer, hvor de var i alderen Dermed bestod den samlede stikprøve i år 2000 af personer i alderen år. Interview blev opnået med af disse personer (66 %) (Andersen, 2003:47). Vi vil i vores undersøgelse kun se på sammenhænge mellem variable i tværsnitdatasættet fra år 2000, hvorfor vi ikke mener, at bortfaldet har særlig betydning for vores undersøgelse. Analyseudvalg Vi vælger at indsnævre vores analyseudvalg til personer mellem 25 og 44 år. Den nedre grænse på 25 år sætter vi for ikke at risikere, at personer bliver sat i en for lav uddannelseskategori, hvis 27

28 de er i gang med at gennemføre en længere uddannelse, men for unge til at kunne have gennemført den. Vi vælger at sætte den øvre grænse til 44 år, da vi vurderer, at der er stor sandsynlighed for, at personer over 44 år lider af flere helbredsproblemer, der bunder i aldersmæssige årsager. Desuden er det de senere år blevet mere almindeligt at tage en akademisk uddannelse. Hvis vi medtager de ældre, vil der være en stor risiko for en sammenhæng mellem uddannelse og helbred pga. ældres generelt lavere uddannelse og dårligere helbred. For at undgå disse fejlkilder vælger vi altså aldersintervallet år. Beskrivelse af de anvendte variable For at kunne besvare vores undersøgelses sigte, ser vi på tre variable: Uddannelse, Helbredstilstand og I stand til at sende skrivelse til offentlig myndighed. Udover at vores analyseudvalg er reduceret til respondenter mellem år, medtager vi også kun dem, der har svaret på alle de tre valgte variable. Dermed består vores analyseudvalg af 1928 personer. I det følgende vil vi give en beskrivelse af disse variable. Variablen Uddannelse beskriver respondenters højest gennemførte uddannelse i år 2000 for personer mellem 25 og 44 år. Variablen er omkodet til at indeholde følgende fire kategorier: Ingen erhvervsuddannelse, Faglig uddannelse, Kort videregående uddannelse og Mellemlang eller lang videregående uddannelse 3. Kategorien Ingen erhvervsuddannelse indeholder de respondenter, som kun har gennemført skoleuddannelse. Kategorien Faglig uddannelse er omkodet og indeholder de oprindelige kategorier Specialarbejderuddannelse, Lærlinge- eller EFG-uddannelse og Anden faglig uddannelse. Kategorien Kort videregående uddannelse indeholder personer der har gennemført en kort videre gående uddannelse, mens kategorien Mellemlang videregående uddannelse og Lang videregående uddannelse er slået sammen i en kategori. Vores argument for at slå de to sidste kategorier sammen bunder i vores anden hypotese om kommunikation med det offentlige. Det er typisk personer med enten mellemlang eller lang videregående uddannelse, som er ansat i offentlige myndigheder og er ansvarlige for formidlingen i disse. Derfor er det interessant at se på disse to uddannelseskategorier samlet i 3 For fordeling for uddannelser inden omkodning, se bilag 1. 28

29 forhold til de resterene kategorier. Vi mener ikke, at dette vil påvirke nuancen i forhold til hypoteserne. Senere i opgaven vil der blive foretaget repræsentativitetstest på uddannelse i forhold til populationen. Nedestående tabel viser fordelingen af uddannelsesniveau i vores analyseudvalg: Tabel 1: Uddannelsesniveau Uddannelsesniveau Antal Procent Kumuleret procent Ingen erhvervsuddannelse ,52 21,52 Faglig uddannelse ,09 65,61 Kort videregående uddannelse ,14 77,75 Mellemlang eller lang videregående , uddannelse I alt I variablen Helbredsproblemer er respondenterne blevet spurgt, om de oplever nogle problemer af varig karakter med førlighed eller helbred. Nedenstående tabel viser fordelingen i besvarelserne i vores analyseudvalg: Tabel 2: Helbredsproblemer Helbredsproblemer Antal Procent Kumuleret procent Ja ,70 27,70 Nej , Total Tabel 2 viser altså, hvorvidt personer mellem 25 og 44 år selv vurderer, at de har helbredsproblemer. 27,70 % svarer ja, mens 72,30 % ikke oplever varige helbredsproblemer. Variablen I stand til at sende skrivelse til offentlig myndighed vil vi i opgaven betegne som Kommunikation med det offentlige. Variablen dækker over følgende spørgsmål til respondenterne: Hvis De får brug for at sende en skrivelse til en offentlig myndighed, kan De så selv lave den? Nedenstående tabel viser fordelingen i besvarelserne i vores analyseudvalg: 29

30 Er i stand til at sende skrivelse til offentlig myndighed Tabel 3: At skrive til en offentlig myndighed Antal Proce Ja ,40 87,40 Nej , Total nt Kumuleret procent Tabel 3 viser dermed, om personer mellem år føler, at de er i stand til at sende en skrivelse til en offentlig myndighed. 87,40 % svarer ja, mens 12,60 % svarer nej til dette spørgsmål. Efter denne introduktion til vores variable vil vi nu bevæge os videre til statistiktestene. De følgende afsnit vil behandle analyseudvalgets repræsentativitet og statistiske tests af vores hypoteser. 30

31 Repræsentativitetstest For at undersøge om vores analyseudvalg fra Levekårsundersøgelsen er repræsentativ for den del af den danske befolkning, som vi beskæftiger os med, udfører vi en χ 2 -test. Vi undersøger altså, om vores analyseudvalg er repræsentativt for populationen. Vi udfører en repræsentativitetstest på variablen Uddannelse. Dette fordi det netop er den variabel, som begge vores hypoteser bygger på. Ved statistisk at undersøge repræsentativiteten på uddannelsesfordelingen mellem vores analyseudvalg og populationen får vi mulighed for at vurdere, i hvilken grad vi kan beskrive populationen med vores analyseudvalg. For at udføre repræsentativitetstesten har vi fundet statistik over befolkningens højeste uddannelse i Statistikbanken. Som følge af vores begrænsning af analyseudvalget, som vi beskrev tidligere, er nedenstående data gældende for befolkningsandelen i aldersintervallet år. Tabel 4: Uddannelsesniveau i population og analyseudvalg Uddannelsesniveau Frekvens i population Andel i population Frekvens i stikprøve Andel i stikprøve Ingen , ,22 erhvervsuddannelse Faglig uddannelse , ,44 Kort videregående , ,12 uddannelse Mellemlang eller , ,22 lang videregående uddannelse I alt (Besøgt ) 31

32 Model 6: Stikprøve overfor population Ud fra tabel 4 og model 6 ses det, at der i nogle kategorier er stor forskel på analyseudvalg og population. Her falder især kategorien Ingen erhvervsuddannelse ud. Dette tyder på problemer ved repræsentativiteten. χ 2 -test for repræsentativitet Vi vil nu udføre χ 2 -testen for at se, om vi statistisk set kan påvise repræsentativitet eller ej. Først er det nødvendigt at formulere en nulhypotese og en alternativhypotese. Da vi forventer, at vores analyseudvalg er repræsentativt for befolkningen, ser vores nulhypotese således ud: H 0 : p 1 = π 1 p k = π k p er udtryk for fordelingen i analyseudvalget, π udtrykker fordelingen i populationen, og k betegner alle mulige udfald af variablen. Vores hypotese er altså, at fordelingen i hver enkelt kategori af uddannelsesvariablen i analyseudvalget er den samme som i populationen. Den alternative hypotese er derfor, at mindst ét af udfaldene i analyseudvalget afviger fra populationen. Altså: H 1 : mindst én p k π k for alle værdier af k 32

33 Det vil sige, at hvis analyseudvalgsfordelingen i ét af udfaldene afviger fra fordelingen i samme udfald i populationen, må vi forkaste vores nulhypotese og acceptere den alternative hypotese. Vi fastsætter nu vores signifikansniveau til 10 %. I denne test vil det bedste resultat i forhold til vores undersøgelse være at kunne acceptere nulhypotesen, da vi ønsker repræsentativitet. Vi sætter signifikansniveauet højt og gør dermed H 0 -rummet mindre. Således skærper vi altså kriteriet for at kunne påvise repræsentativitet og mindsker risikoen for at lave type-ii-fejl, som jo betyder, at man accepterer en falsk nulhypotese. Med et signifikansniveau på 10 % er der 30 % risiko for denne type fejl, hvilket vi vurderer til værende tilstrækkeligt lavt til at kunne udtale os om repræsentativiteten (Malchow-Møller & Würtz 2010:307). Den kritiske grænse findes nu ved at udregne antallet af frihedsgrader. Dette gøres, som beskrevet i teoriafsnittet, med formlen: df = K-1. I vores tilfælde er der tale om 4 kategorier: 4-1= 3 df. Med vores signifikansniveau på 10 % og 3 frihedsgrader er den kritiske grænseværdi 6,25 (Malchow-Møller & Würtz 2010:438). Således får vi et H 0 -rum og et H 1 -rum, der er adskilt ved grænseværdien 6,25, hvilket er illustreret i nedenstående graf: Model 7: Kritisk værdi på 6,25 H0 6,25 H Kritisk grænseværdi 33

34 Nu er vi klar til at udføre χ 2 -testen. Som beskrevet i teoriafsnittet bruger vi følgende teststatistik: χ! =!!!! Z! n π!! n π! Vi udregner første cellebidrag, som er for personer uden erhvervsuddannelse. Dette gøres med tal fra tabel 4. Følgende komponenter er i brug: Z 1 : Frekvens i analyseudvalg = 415 n: Antal observationer i analyseudvalg = 1928 π 1 : Andel under H 0 = 0,35 Vi indsætter tallene i formlen: χ! = ( ,35)! ,35 = 96,09 Således udregnes cellebidraget for samtlige kategorier. Cellebidragene kan ses i følgende tabel: Tabel 5: χ 2 -test for repræsentativitet Uddannelsesniveau Cellebidrag Ingen erhvervsuddannelse 96,09 Faglig uddannelse 17,51 Kort videregående uddannelse 117,5 Mellemlang og lang videregående 1,27 uddannelse Samlet χ 2 -værdi 232,37 Ifølge formlen for teststatistikken summes alle cellebidragene, og vi får derved resultatet af vores χ 2 -test: 232,37, som vist i tabel 5. Med en kritisk grænseværdi på 6,25 og et testresultat på 232,37 må H 0 forkastes og alternativhypotesen accepteres. Nedenstående graf illustrerer testens resultat: 34

35 Model 8: Repræsentativitetstest H0 6,25 H1 232, Kritisk grænseværdi Grafen viser hvordan χ 2 -værdien for repræsentativitet i vores analyseudvalg ligger langt fra H 0 - rummet og befinder sig meget langt til højre i H 1 -rummet. Derved bliver resultatet af χ 2 -testen, at der ikke er repræsentativitet i vores analyseudvalg i forhold til populationen. Z-test for repræsentativitet For at give en uddybning af repræsentativitetstesten vil vi teste hver uddannelseskategori i analyseudvalget op imod populationen, så vi kan se hvilke uddannelser, der afviger. Vi betragter hver uddannelse som Bernoullifordelt med to udfald: succes eller fiasko. Det vil sige, at enten har man den givne uddannelse (succes), eller også har man den ikke (fiasko), hvor fiasko altså indeholder de resterende uddannelseskategorier. Hertil kan vi opstille en hypotesetest til hver uddannelseskategori og anvende en Z-test for Bernoullifordelte variable. Således bliver det muligt at se, hvilke uddannelsesgrupper der afviger mest, og hvorvidt det er alle uddannelsesgrupper, der ikke er repræsentative i forhold til vores kritiske værdi på 10 %. Vores nulhypotese er, at andelen af personer med en given uddannelse er ens ved analyseudvalg og population. Vores alternativhypotese er derimod, at andelen af en given uddannelse for vores 35

36 Det Danske Samfund i sociologisk perspektiv analyseudvalg er forskelligt fra populationen. Således opstiller vi vores hypoteser for hver af de fire kategorier: 1. kategori: Ingen erhvervsuddannelse H0: 𝑝!"#$"!"!!"#!$%&&'((")$" = 𝑝!!"#$"!"!!"#!$%&&'((")$" H1: 𝑝!"#$"!"!!"#!$%&&'((")$" 𝑝!!"#$"!"!!!"#$%&&'((!)$! 2. kategori: Faglig uddannelse H0: 𝑝!"#$%#!""#$$%&'% = 𝑝!!"#$%#!""#$$%&'% H1: 𝑝!"#$%#!""#$$%&'% 𝑝!!"#$%#!""#$$%&'% 3. kategori: Kort videregående uddannelse H0: 𝑝!"#$!"#$%$&å!"#! = 𝑝!!"#$!"#$%$&å!"#! H1: 𝑝!"#$!"#$%$&å!"#! 𝑝!!"#$!"#$%$&å!"#! 4. kategori: Mellemlang og lang videregående uddannelse H0: 𝑝!"##"$,!"#$!"#$%$&å!"#! = 𝑝!!"##"$,!"#$!"#$%$&å!"#! H1: 𝑝!"##"$,!"#$!"#$%$&å!"#! 𝑝!!"##"$,!"#$!"#$%$&å!"#! De kritiske grænseværdier ved et signifikansniveau på 10 % er ±1,6449, både positivt og negativt, da vores hypotese er dobbeltsidet. Vi udregner nu Z-værdierne i hver af de fire hypotesetests med Z-testen for Bernoullifordelte variable, som er beskrevet i teoriafsnittet. Z-testen er som følger: 𝑍 = 𝑝 𝑝! 𝑝! (1 𝑝! )/𝑛 Nedenfor vises et eksempel på beregning af Z-værdi for kategorien Ingen erhvervsuddannelse : 𝑍 =!,!!!!,!"!,!" (!!!,!")/!"#$ = 11,97 Ligeledes regnes de resterende kategorier og følgende resultater opnås: 36

37 Tabel 6: Z-test for repræsentativitet Uddannelsesniveau p p 0 Z-værdi Ingen 0,22 0,35-11,97 erhvervsuddannels e Faglig uddannelse 0,44 0,38 5,43 Kort videregående 0,12 0,06 11,09 uddannelse Mellemlang eller lang videregående uddannelse 0,22 0,21 1,08 Med de kritiske værdier -1,6449 og 1,6449 ligger kun én af vores kategorier indenfor H 0 -rummet og er dermed repræsentativ. Resultaterne er vist grafisk i følgende model: Model 9: Z-test på uddannelse Kritiske grænser Repræsentativ Ikke repræsentativ -1,6449 1,6449 H0 1,08 11,09-11,97 H1 H1 5, Z-værdi Ud fra tabel 6 og model 9 ses det, at Mellemlang eller lang videregående uddannelse er den eneste af uddannelseskategorierne, der med en Z-værdi på 1,08 er indenfor H 0 -rummet. 37

38 Kategorierne Faglig uddannelse og Kort videregående uddannelse er begge overrepræsenteret i vores stikprøve i forhold til populationen, da deres Z-værdier har en positiv værdi og befinder sig i H 1 -rummet til højre for H 0 -rummet. Kategorien Ingen erhvervsuddannelse er den eneste underrepræsenterede kategori i vores stikprøve, da dens tilhørende Z-værdi er negativt afvigende og dermed befinder sig i H 1 -rummet til venstre for H 0. På baggrund af denne test må vi altså forkaste nulhypotesen for kategorierne Ingen erhvervsuddannelse, Faglig uddannelse og Kort videregående uddannelse og dermed acceptere alternativhypotesen om, at andelen i de tilsvarende kategorier i analyseudvalget er forskellige fra populationen og dermed ikke repræsentative. Vi kan dog for kategorien Mellemlang eller lang videregående uddannelse acceptere nulhypotesen og konkludere, at denne kategori er repræsentativ for populationen. Disse konklusioner bygger jf. teoriafsnittet på, at de udførte Z-test er baseret på den generelle grænseværdisætning, og Z er approksimativt normalfordelt da n>20. Med vores kritiske grænse på 10 % inkluderer denne accept af nulhypotesen for kategorien Mellemlang eller lang videregående uddannelse dog en risiko på 30 % for, at der forekommer en type-ii-fejl, altså at vi accepterer en nulhypotese, der er falsk. Delkonklusion Efter udførelsen af test for repræsentativitet vil vi i det følgende opsummere resultaterne samt kommentere på, hvilke konsekvenser de har, i forhold til hvordan vi kan udtale os om opgavens resultater. Vi valgte at undersøge repræsentativitet på uddannelse, da det er den variabel, vi anvender til begge vores empiriske hypoteser. Efter udførelsen af χ 2 -testen måtte vi forkaste vores nulhypotese, da vores testresultat havde en signifikant afvigelse. Dermed måtte vi acceptere hypotesen om, at der ikke er repræsentativitet for uddannelse i vores analyseudvalg i forhold til populationen. Da vi med χ 2 -testen må forkaste nulhypotesen, når bare ét af udfaldene afviger fra fordelingen i samme udfald i populationen, valgte vi med en Z-test at undersøge, om det var for alle uddannelseskategorier, at der var tale om signifikante afvigelser. Her så vi, at der for én af 38

39 kategorierne, nemlig Mellemlang eller lang videregående uddannelse, var tale om repræsentativitet. Alligevel må vi på baggrund af vores statistiske test konkludere, at vores analyseudvalg ikke er repræsentativt i forhold til populationen. Dette betyder, at det er med en vis usikkerhed, vi udtaler os om populationen på baggrund af resultaterne for vores analyseudvalg. Vi konkluderer dog ikke kun på baggrund af vores statistiske test, men inddrager også teori i den senere diskussion, hvorfor vi vil argumentere for, at vi stadig kan udtale os om de sammenhænge, vi i opgaven påviser, når blot vi har repræsentativitetsforskellene for øje. 39

40 Uafhængighedstests I det følgende afsnit vil vi gennem statistiske tests afprøve vores empiriske hypoteser for enten at kunne forkaste eller acceptere dem. Vi vil gøre brug af en uafhængighedstest for χ 2 -fordelinger, da vi arbejder med diskrete stokastiske variable med kvalitative data, hvor kategorierne befinder sig på en nominalskala. Det vil altså sige, at kategorierne indbyrdes ikke har nogen numerisk rangorden (Hansen & Andersen 2009:121). Hypotese 1: uddannelse og helbred Vi starter med at teste vores første hypotese om, at uddannelse har en betydning for helbredsproblemer. Rent statistisk tester vi, om der er uafhængighed mellem variablen Uddannelse og variablen Helbredsproblemer. Krydstabellen for de to variabler ser således ud: Tabel 7: Krydstabel Uddannelse/Helbredsproblemer HYPOTESE 1 Helbredsproblemer Uddannelsesniveau Ja Nej I alt Ingen erhvervsuddannelse ,01 % ,99 % % Faglig uddannelse ,24 % ,76 % % Kort videregående uddannelse 65 27,78 % ,22 % % Mellemlang eller lang videregående uddannelse ,41 % ,59 % % I alt ,70 % ,30 % % I tabel 7 ses det, at der er procentmæssigt flere uden erhvervsuddannelse, som oplever helbredsproblemer, i forhold til personer med mellemlang eller lang videregående uddannelse. Ud fra tabellen ligner det umiddelbart, at der ikke er uafhængighed mellem uddannelse og helbredsproblemer. Vi vil nu teste hypotesen statistisk, så vi kan udtale os om forholdet mellem de to variable med større sikkerhed. 40

41 Ud fra ovenstående tal i tabel 7 kan vi konstruere en tabel, som illustrerer, hvordan fordelingen i kategorierne ville se ud under uafhængighed. Dette gøres ved at gange den observerede frekvens for den første variabels ene kategori med den observerede frekvens for den anden variabels ene kategori og dividere dette med det totale antal observationer. Eksempelvis vil udregningen af den forventede fordeling under uafhængighed i cellen Ingen erhvervsuddannelse./ja se ud på følgende måde: = 115 Dermed er den forventede fordeling under uafhængighed 115 observationer for den pågældende celle. I nedenstående tabel viser vi denne fordeling for alle celler, hvilket vi senere skal bruge til at udregne vores χ 2 -værdi. Tabel 8: Forventet fordeling under H 0 HYPOTESE 1 Helbredsproblemer Uddannelsesniveau Ja Nej Marginal sandsynligh ed Ingen erhvervsuddannelse ,22 Faglig uddannelse ,44 Kort videregående ,12 uddannelse Mellemlang eller lang ,22 videregående uddannelse Marginal sandsynlighed 0,28 0,72 1 I tabel 8 er der udregnet de marginale sandsynligheder, som vi skal bruge i udregningen af χ 2 - værdien. Vi har dermed alle de tal, der er nødvendige for at kunne beregne en χ 2 -værdi, som skal fortælle os hvorvidt, der statistisk set kan påvises uafhængighed mellem uddannelse og helbred. Først opstiller vi vores nulhypotese og vores alternativhypotese. Nulhypotesen lyder: H 0 : f Uddannelse (x i ) f Helbredsproblemer (y j ) = f(x i,y j ) 41

42 i er betegnelsen for de mulige udfald af variablen Uddannelse, mens j er betegnelsen for de mulige udfald af variablen Helbredsproblemer. Hypotesen siger, at den simultane sandsynlighedsfunktion vil være lig produktet af de to marginale sandsynlighedsfunktioner, som beskrevet i det tidligere teoriafsnit. Alternativhypotesen formuleres således: H 1 : f Uddannelse (x i ) * f Helbredsproblemer (y j ) f(x i,y j ) for mindst ét udfald af f(x i,y j ). Alternativhypotesen udtrykker, at for mindst ét udfald vil den simultane sandsynlighedsfunktion ikke være lig med produktet af de to marginale sandsynlighedsfunktioner. Vi sætter nu et signifikansniveau, der fastlægger H 0 -rummet og H 1 -rummet. Vi vælger et signifikansniveau på 5 %, hvormed der er 5 % sandsynlighed for at begå en type-i-fejl. Vi vurderer, at denne risiko er tilpas lille, til at vi senere kan bringe resultatet af testen ind i en diskussion. Derudover skal vi udregne antal frihedsgrader, så vi kan fastsætte vores kritiske værdi. Som skrevet i teorien gøres dette ved at trække 1 fra antallet af kategorier i variablen Uddannelse og gange med antallet af kategorier i variablen Helbredsproblemer fratrukket 1. Altså: (4-1) (2-1) = 3. Med tre frihedsgrader og et signifikansniveau på 5 % bliver vores kritiske værdi 7,81 (Malchow-Møller & Würtz 2010:438). Det vil sige, at hvis vores χ 2 -værdi overskrider den kritiske værdi, befinder vi os i H 1 -rummet og må forkaste nulhypotesen. Herunder illustreres grænsen mellem H 0 -rummet og H 1 -rummet: 42

43 Model 10: Kritisk grænseværdi 7,81 H0 7,81 H Kritisk grænseværdi For hver celle skal der nu udregnes et χ 2 -bidrag. Vi bruger den formel, der tidligere blev redegjort for i det teoretiske afsnit: χ! =!!!! Z! n π!! n π! Beregningen af den samlede χ 2 -værdi kommer til at se ud på følgende måde: χ! =!"#!!!"!!!" 7,88. +!"#!!""!!"" +!!"!!"#!!"# +!"#!!"#!!"# +!"!!"!!" +!"#!!"!!!"# +!"#!!!"!!!" +!"#!!"#!!"# = Resultatet af hver celles enkelte χ 2 -bidrag er illustreret i nedenstående tabel: 43

44 Tabel 9: χ 2 -værdi HYPOTESE 1 Ja Nej Ingen 4,23 1,62 erhvervsuddannelse Faglig uddannelse 0,66 0,25 Kort videregående 0,00 0,00 uddannelse Mellemlang eller lang 0,81 0,31 videregående uddannelse Samlet χ 2 -værdi 7,88 Vores samlede χ 2 -værdi er altså 7,88, mens vores kritiske værdi var på 7,81. Det vil sige, at χ 2 - værdien selvom det ikke er meget overskrider den kritiske grænse. Vi må derfor forkaste nulhypotesen og kan konkludere, at der ikke er uafhængighed mellem uddannelse og helbred. Nedenfor er det illustreret grafisk, hvordan vores χ 2 -værdi ligger i forhold til den kritiske grænseværdi. Model 11: Hypotese 1 H0 7,81 7,88 H Kritisk grænseværdi 44

45 I model 11 ses vores χ 2 -fordeling, hvor den blå markering viser den kritiske grænseværdi på 7,81, mens den røde viser vores χ 2 -værdi på 7,88. Hermed ses det, at vores χ 2 -værdi ligger i H 1 - rummet. Det er nu interessant at foretage en enkeltcelletest for at kunne vurdere, hvilke celler der slår signifikant ud i forhold til nulhypotesen. Dette gøres ved at udregne størrelsen kaldet r xy. Formlen for r xy er følgende: (Z!" n π!" ) r!" = n π!" 1 f! x (1 f! y ) Som beskrevet i teorien er størrelsen r xy, på baggrund af den centrale grænseværdisætning approksimativt standardnormalfordelt under H 0. Jf. de kritiske værdier for en standardiseret normalfordeling med et signifikansniveau på 5 % vil det sige, at den kritiske værdi for, hvornår en celle afviger signifikant fra H 0 er ±1,96 (± fordi vores hypotese er dobbeltsidet). For at illustrere hvordan enkeltcelletesten konkret regnes, kommer her et eksempel for cellen Ingen erhvervsuddannelse/ja : r!" = ( ) ,22 (1 0,28) = 2,73 Denne udregning foretages for alle celler, og vi får følgende resultat: 45

46 Tabel 10: Enkeltcelletest Enkeltcelletest Ja (1) Nej (2) Ingen 2,73-2,73 erhvervsuddannelse (a) Faglig uddannelse -1,27 1,27 (b) Kort videregående 0,03-0,03 uddannelse (c) Mellemlang eller lang videregående uddannelse (d) -1,20 1,20 Resultaterne vises i følgende grafiske illustration: Model 12: Hypotese 1, enkeltcelletest Kritisk grænse H0 1,c 2,c 1,b 2,b 1,d 2,d 2,a 1,a H1 H Kritisk grænseværdi 46

47 De vertikale markeringer er navngivet efter den givne celles tal og bogstav i tabel 10. Her ses det, at vores kritiske grænse på ±1,96 kun overskrides for kategorien Ingen erhvervsuddannelse. Her er respondenterne overrepræsenteret i kategorien Ja, mens de tilsvarende er underrepræsenterede i kategorien Nej. Der kan her knyttes en overvejelse, da det netop var denne kategori, der i repræsentativitetstesten var mest underrepræsenteret. Det er derfor med forbehold, at vi kan udtale os om resultatet af denne hypotesetest. Resten af kategorierne fordeler sig i H 0 -rummet, og influerer altså ikke på, at vi alligevel må forkaste H 0 - hypotesen i uafhængighedstesten. Resultatet fra enkeltcelletesten understøtter vores empiriske hypotese, da vi forventede, at respondenter med kort eller ingen uddannelse i højere grad oplever helbredsproblemer end respondenter med videregående uddannelser. Hypotese 2: uddannelse og kommunikation med det offentlige Vi vil nu teste vores anden hypotese, som går på, at uddannelse har en betydning for, hvorvidt man er i stand til at kommunikere med det offentlige system. Altså om uddannelse og kommunikation er uafhængige. Nedenfor ses krydstabellen for de to variable Uddannelse og Kommunikation med det offentlige : Tabel 11: Krydstabel Uddannelse/Kommunikation HYPOTESE 2 Kan kommunikere med det offentlige Uddannelsesniveau Ja Nej I alt Ingen erhvervsuddannelse ,59 % 22,41 % Faglig uddannelse ,59 % 15,41 % Kort videregående uddannelse 94,02 % 5,98 % Mellemlang eller lang videre gående uddannelse 98,83 % 1,17 % I alt ,40 % ,60 %

48 Vi kan se i tabel 11, at der antydes en systematisk fordeling mellem Uddannelse og Kommunikation med det offentlige. Af personer uden erhvervsuddannelse kan 22,41 % ikke selv sende en skrivelse. Denne procentandel falder i takt med, at uddannelsen bliver længere, og af personer med mellemlang eller lang videregående uddannelse er det kun 1,17 %, som ikke kan sende en skrivelse. Vi vil nu lave en uafhængighedstest for at kunne udtale os om, hvorvidt de to variable er statistisk uafhængige eller ej. Som i testen af hypotese 1 får vi igen til vores beregninger brug for de forventede frekvenser under uafhængighed. Nedenfor ses resultaterne for den forventede uafhængighed: Tabel 12: Forventet fordeling under H 0 HYPOTESE 2 Kan kommunikere med det offentlige Uddannelsesniveau Ja Nej Marginal sandsynlighed Ingen erhvervsuddannelse ,22 Faglig uddannelse ,44 Kort videregående ,12 uddannelse Mellelang eller lang ,22 videregående uddannelse Marginal sandsynlighed 0,87 0,13 1 Tabellen indeholder også de marginale sandsynligheder, som skal bruges til udregning af χ 2 - værdien. Vi vil nu gå i gang med χ 2 -testen for uafhængighed. Vi opstiller igen en nulhypotese og en alternativhypotese: H 0 : f Uddannelse (x i ) f Skrivelse (y j ) = f(x i,y j ). H 1 : f Uddannelse (x i ) f Helbredsproblemer (y j ) f(x i,y j ) for mindst ét udfald af f(x i,y j ). I nulhypotesen forventes det, at den simultane sandsynlighedsfunktion er lig produktet af de to marginale sandsynlighedsfunktioner, mens det i alternativhypotesen forventes, at dette ikke er tilfældet for mindst ét af udfaldene. 48

49 Vi sætter igen signifikansniveauet til 5 %. Frihedsgraderne er også i dette tilfælde 3, idet vores variable i hypotese 2 har samme antal kategorier som i hypotese 1. Det betyder, at vores kritiske grænseværdi også er den samme som før: 7,81. Igen bruges følgende formel for beregning af χ 2 - værdien: Udregningen ser således ud: χ! =!!!! Z! n π!! n π! χ! =!""!!"!!!"! +!"!!"!!" +!"#!!"#!!"# +!"!!!"#!!"# +!!"!!"#!!!" +!"!!"!!" +!"!!!"#!!"# +!!!"!!" = 102,58. Hver enkelt celles χ 2 -bidrag er vist i nedenstående tabel: Tabel 13: χ 2 -værdi HYPOTESE 2 Ja Nej Ingen 4,57 31,66 erhvervsuddannelse Faglig uddannelse 0,77 5,32 Kort videregående 1,17 8,14 uddannelse Mellemlang eller 6,42 44,53 lang uddannelse Samlet χ2-værdi 102,58 Med en samlet χ 2 -værdi på 102,58 er vores χ 2 -værdi signifikant overskridende i forhold til den kritiske grænseværdi på 7,81. Det betyder, at vi forkaster H 0 -hypotesen og accepterer alternativhypotesen. Altså kan vi bekræfte, at der ikke er uafhængighed gældende mellem Uddannelse og Kommunikation med det offentlige. For at få en visuel fornemmelse af, hvor langt ude i H 1 -rummet vi befinder os, har vi lavet følgende model: 49

50 Model 13: Hypotese 1 H0 7,81 H1 102, Kritisk grænseværdi I model 13 er det med stiplet linje vist, at vi springer fra 8 til 100 på x-aksen, og vores χ 2 -værdi på 102,58 ligger således meget langt til højre. Igen vil vi lave en enkeltcelletest, da det er interessant at se, hvilke grupper, der slår signifikant ud i forhold til nulhypotesen. Vi bruger formlen for r xy : r!" = (Z!" n π!" ) n π!" 1 f! x (1 f! y ) Som i enkeltcelletesten for den første hypotese er den kritiske grænseværdi på ±1,96 grundet den standardiserede normalfordeling. Resultaterne for enkeltcelletesten er vist nedenfor i en tabel: 50

51 Tabel 14: Enkeltcelletest r xy -test Ja (1) Nej (2) Ingen (a) -6,79 6,79 Faglig (b) -3,30 3,30 Kort (c) 3,26-3,26 Mellemlang/lang (d) 8,10-8,10 Den røde farve illustrerer de celler, hvor respondenterne er signifikant underrepræsenterede, mens den grønne farve bruges i celler, hvor der er signifikant overrepræsentation. Der er brugt forskellige nuancer af farverne for at illustrere forskellige niveauer af signifikans de mørke farver angiver således de celler, som slår mest ud i forhold til nulhypotesen. Samme farver er brugt i nedenstående illustration, hvor resultatet for enkeltcelletesten er opstillet: Model 14: Hypotese 1, enkeltcelletest Kritisk grænse H0 2,c 1,c 1,b 2,b 1,a 2,a 2,d H1 H1 1,d Kritisk grænseværdi Enkeltcelletesten understøtter i høj grad hypotese 2, da det tydeligt ses, at respondenter med ingen erhvervsuddannelse er signifikant underrepræsenteret, når det gælder evnen til at 51

52 kommunikere med det offentlige. Samtidig er respondenterne med mellemlang eller lang videregående uddannelse signifikant overrepræsenteret. Dette betyder, at vi må forkaste nulhypotesen om uafhængighed mellem de to variable. Delkonklusion Vi har nu udført vores hypotesetests og vil kommentere på, hvad resultaterne betyder for de empiriske hypoteser. Senere vil vi løfte empirien op på et teoretisk niveau for at kunne diskutere vores teoretiske hypoteser. Den første hypotesetest på uafhængighed omhandlede vores empiriske hypotese om, at uddannelsesniveau har en betydning for, hvorvidt man oplever varige helbredsproblemer eller ej. Her fandt vi, at vores testresultat afveg signifikant fra nulhypotesen, som antager uafhængighed. Det vil altså sige, at der rent statistisk ikke kunne påvises uafhængighed mellem de to variable. I enkeltcelletesten var personer uden erhvervsuddannelse, som oplevede helbredsproblemer, overrepræsenterede, og omvendt var personer uden erhvervsuddannelse, som ikke oplevede helbredsproblemer, underrepræsenterede. Resten af kategorierne slog ikke signifikant ud i forhold til nulhypotesen om uafhængighed. Når vi i næste afsnit således bringer teorien i spil, kan vi begynde at diskutere, hvorvidt man kan tale om en årsagssammenhæng mellem uddannelse og helbredsproblemer eller som vi udtrykker det i teorien: mellem social position og sundhedstilstand. Vores anden empiriske hypotese om hvorvidt uddannelse har betydning for kommunikation med det offentlige blev testet på samme måde som hypotese 1. Her fandt vi igen, at testresultatet afveg signifikant fra nulhypotesen, og vi kunne altså påvise, at der ikke findes uafhængighed mellem de to variable. Enkeltcelletesten viste et mønster, der stemmer fint overens med hypotesens retning: de kortere uddannede er underrepræsenterede, når det gælder evnen til at skrive til en offentlig myndighed, mens personer med længere uddannelser omvendt er overrepræsenterede. I diskussionen løfter vi dette resultat op på et teoretisk niveau, hvor vi således vil diskutere, om der findes en sammenhæng mellem individers sociale position og hvorvidt de bliver udsat for symbolsk vold. 52

53 Testresultaterne har dog en vis usikkerhed i forhold til populationen, da vores repræsentativitetstest viste, at analyseudvalget ikke er repræsentativt for tre af de fire uddannelseskategorier. Dette aspekt må vi medtage, når vi senere i opgaven konkluderer på vores teoretiske hypoteser. Hermed har vi med de statiske hypotesetests muliggjort at bevæge os fra empiri til teori. 53

54 Diskussion I følgende afsnit vil vi diskutere vores teoretiske hypoteser på baggrund af resultaterne fra vores hypotesetests. Med udgangspunkt i, at vi i testene måtte forkaste hypoteserne om uafhængighed mellem vores variable, vil vi nu argumentere teoretisk for, at der rent faktisk findes en årsagssammenhæng mellem disse variable. Afslutningsvist vil vi diskutere et samspil mellem vores to hypoteser, hvor vi vil argumentere for, at symbolsk vold påvirker sammenhængen mellem social position og sundhedstilstand. Første hypotese: ulighed i sundhed I vores første hypotesetest fandt vi, at der ikke findes uafhængighed mellem uddannelse og helbred. Dette understøtter dermed vores hypotese om, at der er en sammenhæng mellem de to. Der ses en fordeling på helbredsområdet, hvor de højtuddannede står stærkere helbredsmæssigt end de kortuddannede. Jf. vores operationalisering kan vil løfte den empiriske hypotese tilbage til vores udgangspunkt; sat i et teoretisk perspektiv vil det sige, at et individs sociale position har betydning for vedkommendes sundhedstilstand. Således når vi frem til samme resultat, som Finn Diderichsen tematiserer i sin teori om ulighed i på sundhedsområdet. Med hans teori vil resultatet af den første hypotese kunne forklares ved, at de kortuddannede, grundet deres sociale position i samfundet, er udsat for flere risikofaktorer, som påvirker deres helbred i en negativ retning. Med Diderichsens teori får vi en meget bred forklaring på uligheden. Han inddrager en stor mængde forskellige faktorer, som alle i en vis grad spiller ind på individers helbred. Fælles for disse faktorer er dog, at de alle repræsenterer noget materielt. Diderichsen fokuserer altså på de økonomiske og materielle årsager til, hvorfor der findes ulighed i sundhedstilstanden hos den danske befolkning. Ligesom Diderichsen operer Elm Larsen med et ulige samfund, hvor der er tale om højere og lavere sociale positioner. Men modsat Diderichsen fokuserer Elm Larsen på uligheden i den kulturelle kapital. Denne betragtning lægger op til en diskussion af vores anden hypotese om social ulighed og det at være udsat for symbolsk vold. Anden hypotese: lave sociale positioner er udsatte for symbolsk vold Hos Elm Larsen giver en høj social position, jf. teoriafsnittet, mulighed for at sætte dagsordenen på de forskellige sociale scener, og dermed mulighed for at have indflydelse på, hvad der 54

55 betegnes som værende det rigtige og det forkerte på et givet felt. Med dette perspektiv kan der gives en forklaring på, hvorfor vi ikke kunne påvise uafhængighed i testen af vores anden hypotese. Elm Larsen påpeger netop, at de sociale systemers kommunikation er betinget af magthavernes habitus. Med inddragelse af Bourdieu kan det siges, at magthaverne besidder den symbolske magt til at konstruere virkeligheden. Når magthavernes virkelighed bliver til den almengyldige virkelighedsopfattelse i samfundet, bliver de, der ligger under magthaverne, således udsat for symbolsk vold. En forklaring på, at vi ikke kunne påvise uafhængighed i den anden hypotese, kan derfor være, at det ikke er tilfældigt, hvem der formår at lave en skrivelse, og hvem der ikke gør. Dette fordi måden, hvorpå skrivelsen skal laves, er blevet fastsat ud fra en dominerende klasses perspektiv, og den lavere sociale klasse er derfor underlagt symbolsk vold, idet de må indrette sig herefter, hvis de ønsker at kommunikere med det offentlige. Her kan vi ligeledes inddrage Lykkeberg, som netop ser den kulturelle overklasse som den dominerende klasse, der undertrykker især kortuddannede ved at definere deres ideer og opfattelser som værende dårlig smag. Det bliver dermed den kulturelle elite, som med den symbolske magt bliver bestemmende for virkelighedsopfattelsen, mens lavere sociale positioner er underlagt symbolsk vold, fordi elitens virkelighedsopfattelse bliver accepteret som den almengyldige. På denne måde skabes sammenhængen mellem social position og det at være udsat for symbolsk vold. Sammenspil mellem de to hypoteser Tages denne sidste forståelse i betragtning, vil der i vores specifikke tilfælde, altså på sundhedsområdet, også kunne peges på en dominerende klasse, der er styrende for kommunikationen og diskursen på området. Antages denne præmis, vil de højeste sociale lag både italesætte, hvordan godt og dårligt helbred forstås, og ydermere hvordan helbredsproblemer behandles. Således ses et samspil mellem vores to hypoteser, som illustreres i følgende teoretiske model: 55

56 Model 15: Teoretisk model Social position Sundhedstilstand Symbolsk vold Med en teoretisk forklaring på resultaterne af vores to hypotesetests ønsker vi nu at diskutere, hvorvidt de to hypoteser kan spille sammen som vist i modellen. Vi vil argumentere for, at en årsag til ulighed i sundhedstilstand i forhold til sociale positioner kan være den symbolske vold, som personer med lav social position bliver udsat for. Det er dog vigtigt at pointere, at den ovenstående model kun kan diskuteres teoretisk, da den ikke er blevet påvist statistisk. På bagrund af resultaterne af vores hypotesetests mener vi alligevel, at det er muligt at opstille sammenhængen med teoretiske argumenter. Kortuddannedes frafald til rygestopkurser Et eksempel på, hvordan symbolsk vold kan påvirke sundhed, findes i artiklen Rygestopkurser er kun for de kloge, bragt i MX den 8. april Her beskriver Marie Tromborg, hvordan personer med kort uddannelse i langt højere grad dropper ud af rygestopkurser i forhold til personer med længere uddannelser. Baggrunden for artiklen er, at TrygFonden har givet Region Hovedstaden to millioner kroner til udvikling af et rygestopkoncept for kortuddannede. Ph.d. og forskningsoverlæge ved Region Hovedstadens Forskningscenter for Forebyggelse og Sundhed, Charlotta H. Pisinger, udtaler følgende i artiklen: Rigtig mange af de kortuddannede føler sig malplaceret, hvis de sidder sammen med skolelærere og læger, hvor snakken går på en anderledes måde. Derfor falder mange kortuddannede fra kurserne (Tromborg 2013:5). Problemet er ifølge artiklen, at rygestopkurser er formet af akademikere og samtidig er målrettet 56

Vejledende besvarelser til opgaver i kapitel 14

Vejledende besvarelser til opgaver i kapitel 14 Vejledende besvarelser til opgaver i kapitel 14 Opgave 1 a) Det første trin i opstillingen af en hypotesetest er at formulere to hypoteser, hvoraf den ene støtter den teori vi vil teste, mens den anden

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Indholdsfortegnelse 1. INDLEDNING (1057:857)(1031:831)(1072:872)(1056:856) 2 2. LÆSEVEJLEDNING (1057:857)(1031:831)(1072:872)(1056:856) 3

Indholdsfortegnelse 1. INDLEDNING (1057:857)(1031:831)(1072:872)(1056:856) 2 2. LÆSEVEJLEDNING (1057:857)(1031:831)(1072:872)(1056:856) 3 Indholdsfortegnelse 1. INDLEDNING (1057:857)(1031:831)(1072:872)(1056:856) 2 2. LÆSEVEJLEDNING (1057:857)(1031:831)(1072:872)(1056:856) 3 3. TEORETISK UDGANGSPUNKT (1072:872) 3 3.1 FORFORSTÅELSE AF SUNDHED

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

3 OPERATIONALISERING (817/1004, 846/1047, 890/1080, 809/1039) 15

3 OPERATIONALISERING (817/1004, 846/1047, 890/1080, 809/1039) 15 Indholdsfortegnelse 1 INDLEDENDE (817/1004, 846/1047, 890/1080, 809/1039) 3 1.1 INDLEDNING (817/1004, 846/1047, 890/1080, 809/1039) 3 1. MOTIVERING (817/1004, 846/1047, 890/1080, 809/1039) 3 1.3 LÆSEVEJLEDNING

Læs mere

Personlig stemmeafgivning

Personlig stemmeafgivning Ib Michelsen X 2 -test 1 Personlig stemmeafgivning Efter valget i 2005 1 har man udspurgt en mindre del af de deltagende, om de har stemt personligt. Man har svar fra 1131 mænd (hvoraf 54 % har stemt personligt

Læs mere

University of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version

University of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version university of copenhagen University of Copenhagen Notat om statistisk inferens Larsen, Martin Vinæs Publication date: 2014 Document Version Peer-review version Citation for published version (APA): Larsen,

Læs mere

Sociologi, 2. semester Københavns Universitet Forår 2013

Sociologi, 2. semester Københavns Universitet Forår 2013 Indholdsfortegnelse 1. Problem og motivation: Bolig og ulighed i byen (1052, 852), (1040, 840), (1027, 827), (1105, 905)... 3 1.1 Teoretiske hypoteser... 4 2. Teoretisk udgangspunkt: Et steds betydning

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007 Rettevejledning til eksamen i Kvantitative metoder 1,. årsprøve. januar 007 I rettevejledningen henvises der til Berry and Lindgren "Statistics Theory and methods"(b&l) hvis ikke andet er nævnt. Opgave

Læs mere

Produkt og marked - matematiske og statistiske metoder

Produkt og marked - matematiske og statistiske metoder Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Normalfordelingen og Stikprøvefordelinger

Normalfordelingen og Stikprøvefordelinger Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger

Læs mere

Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Dagens tema: Indfør centrale statistiske begreber. Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i

Læs mere

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske

Læs mere

Kapitel 7 Forskelle mellem centraltendenser

Kapitel 7 Forskelle mellem centraltendenser Kapitel 7 Forskelle mellem centraltendenser Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 29 Indledning 1. z-test for ukorrelerede data 2. t-test for ukorrelerede data med ens

Læs mere

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05 Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Note om Monte Carlo metoden

Note om Monte Carlo metoden Note om Monte Carlo metoden Kasper K. Berthelsen Version 1.2 25. marts 2014 1 Introduktion Betegnelsen Monte Carlo dækker over en lang række metoder. Fælles for disse metoder er, at de anvendes til at

Læs mere

Statistik II 1. Lektion. Analyse af kontingenstabeller

Statistik II 1. Lektion. Analyse af kontingenstabeller Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression

Læs mere

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0 Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt

Læs mere

Statistiske modeller

Statistiske modeller Statistiske modeller Statistisk model Datamatrice Variabelmatrice Hændelse Sandsynligheder Data Statistiske modeller indeholder: Variable Hændelser defineret ved mulige variabel værdier Sandsynligheder

Læs mere

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Stikprøver og stikprøve fordelinger Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Statistik Statistisk Inferens: Prediktere og forekaste værdier af

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af

Læs mere

Indblik i statistik - for samfundsvidenskab

Indblik i statistik - for samfundsvidenskab Indblik i statistik - for samfundsvidenskab Læs mere om nye titler fra Academica på www.academica.dk Nikolaj Malchow-Møller og Allan H. Würtz Indblik i statistik for samfundsvidenskab Academica Indblik

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau... Indhold 1 Statistisk inferens: Hypotese og test 2 1.1 Nulhypotese - alternativ.................................. 2 1.2 Teststatistik........................................ 3 1.3 P-værdi..........................................

Læs mere

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens Oversigt Oversigt over emner 1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens 2 Konfidensinterval Konfidensinterval for andel Konfidensinterval - normalfordelt stikprøve

Læs mere

Kvantitative Metoder 1 - Forår 2007

Kvantitative Metoder 1 - Forår 2007 Dagens program Kapitel 8.7, 8.8 og 8.10 Momenter af gennemsnit og andele kap. 8.7 Eksempel med simulationer Den centrale grænseværdisætning (Central Limit Theorem) kap. 8.8 Simulationer Normalfordelte

Læs mere

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Program 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Fordeling af X Stikprøve X 1,X 2,...,X n stokastisk X stokastisk. Ex (normalfordelt stikprøve)

Læs mere

C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b2.

C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b2. C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b. 5.000 4.800 4.600 4.400 4.00 4.000 3.800 3.600 3.400 3.00 3.000 1.19% 14.9% 7.38% 40.48% 53.57% 66.67% 79.76% 9.86% 010 011

Læs mere

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele Anvendt Statistik Lektion 4 Hypotesetest generelt Test for middelværdi Test for andele Hypoteser og Test Hypotese I statistik er en hypotese en påstand om en populationsparameter. Typisk en påstand om

Læs mere

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau Hvad skal vi lave? 1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ. Teststatistik P-værdi Signifikansniveau 2 t-test for middelværdi Tosidet t-test for middelværdi Ensidet t-test for middelværdi

Læs mere

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x) Formelsamlingen 1 Regneregler for middelværdier M(a + bx) a + bm X M(X+Y) M X +M Y Spredning varians og standardafvigelse VAR(X) 1 n n i1 ( X i - M x ) 2 Y a + bx VAR(Y) VAR(a+bX) b²var(x) 2 Kovariansen

Læs mere

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala 3 5% 5% 5% 0 3 4 5 6 7 8 9 0 Statistik for biologer 005-6, modul 5: Normalfordelingen opstår når mange forskellige faktorer uafhængigt af hinanden bidrager med additiv variation til. F.eks. Højde af rekrutter

Læs mere

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller

Læs mere

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen Landmålingens fejlteori Lektion Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet En stokastisk variabel er en variabel,

Læs mere

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Anvendt Statistik Lektion 2 Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Sandsynlighed: Opvarmning Udfald Resultatet af et eksperiment kaldes et udfald. Eksempler:

Læs mere

Dag 1: 1) Fra problemformulering til spørgeskema-tematikker; 2) Hvordan hører data sammen; 3) Overvejelser om datas egenskaber; 4) Hvad kan man

Dag 1: 1) Fra problemformulering til spørgeskema-tematikker; 2) Hvordan hører data sammen; 3) Overvejelser om datas egenskaber; 4) Hvad kan man Dag 1: 1) Fra problemformulering til spørgeskema-tematikker; 2) Hvordan hører data sammen; 3) Overvejelser om datas egenskaber; 4) Hvad kan man spørge om; 5) Tips n tricks i forhold til at formulere spørgsmål;

Læs mere

1. Introduktion. 1.1 Indledning. Risiko for social eksklusion i et uddannelsesperspektiv

1. Introduktion. 1.1 Indledning. Risiko for social eksklusion i et uddannelsesperspektiv 1. Introduktion 1.1 Indledning I det danske samfund bryster vi os af at have afskaffet materiel knaphed gennem en universel velfærdsmodel, (Larsen 2000: 48), og ifølge en EU rapport fra 2003 er Danmark

Læs mere

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test.

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test. Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ -test og Goodness of Fit test. Anvendelser af statistik Statistik er et levende og fascinerende emne, men at læse om det er alt

Læs mere

Værktøjshjælp for TI-Nspire CAS Struktur for appendiks:

Værktøjshjælp for TI-Nspire CAS Struktur for appendiks: Værktøjshjælp for TI-Nspire CAS Struktur for appendiks: Til hvert af de gennemgåede værktøjer findes der 5 afsnit. De enkelte afsnit kan læses uafhængigt af hinanden. Der forudsættes et elementært kendskab

Læs mere

Schweynoch, 2003. Se eventuelt http://www.mathematik.uni-kassel.de/~fathom/projekt.htm.

Schweynoch, 2003. Se eventuelt http://www.mathematik.uni-kassel.de/~fathom/projekt.htm. Projekt 8.5 Hypotesetest med anvendelse af t-test (Dette materiale har været anvendt som forberedelsesmateriale til den skriftlige prøve 01 for netforsøget) Indhold Indledning... 1 χ -test... Numeriske

Læs mere

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0. Landmålingens fejlteori Lektion 2 Transformation af stokastiske variable - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf12 Institut for Matematiske Fag Aalborg Universitet Repetition:

Læs mere

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M. Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet March 1, 2013 Sandsynlighedsregning og lagerstyring Normalfordelingen

Læs mere

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium Deskriptiv (beskrivende) statistik er den disciplin, der trækker de væsentligste oplysninger ud af et ofte uoverskueligt materiale. Det sker f.eks. ved at konstruere forskellige deskriptorer, d.v.s. regnestørrelser,

Læs mere

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable Landmålingens fejlteori - lidt om kurset Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet Kursusholder

Læs mere

Løsning til eksaminen d. 29. maj 2009

Løsning til eksaminen d. 29. maj 2009 DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen Statistik Lektion 3 Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen Repetition En stokastisk variabel er en funktion defineret på S (udfaldsrummet, der antager

Læs mere

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet Matematik A Studentereksamen Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet stx11-matn/a-080501 Tirsdag den 8. maj 01 Forberedelsesmateriale til stx A Net MATEMATIK Der

Læs mere

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable Landmålingens fejlteori Lektion 2 Transformation af stokastiske variable - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf12 Institut for Matematiske Fag Aalborg Universitet 1/31 Repetition:

Læs mere

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Introduktion Kursusholder: Kasper K. Berthelsen Opbygning: Kurset består af 5 blokke En blok består af: To normale

Læs mere

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Anvendt Statistik Lektion 2 Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Sandsynlighed: Opvarmning Udfald Resultatet af et eksperiment kaldes et udfald. Eksempler:

Læs mere

Kapitel 4 Sandsynlighed og statistiske modeller

Kapitel 4 Sandsynlighed og statistiske modeller Kapitel 4 Sandsynlighed og statistiske modeller Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 22 Generalisering fra stikprøve til population Idé: Opstil en model for populationen

Læs mere

Evner eller opvækst? - Succes og fiasko i det danske uddannelsessystem

Evner eller opvækst? - Succes og fiasko i det danske uddannelsessystem Evner eller opvækst? - Succes og fiasko i det danske uddannelsessystem "We are taught that life is like a racetrack: that merit will find its own reward. This is the central way our system legitimates

Læs mere

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable Normal fordelingen Normal fordelingen Egenskaber ved normalfordelingen Standard normal fordelingen Find sandsynligheder ud fra tabel Transformation af normal fordelte variable Invers transformation Repetition

Læs mere

Nanostatistik: Opgavebesvarelser

Nanostatistik: Opgavebesvarelser Nanostatistik: Opgavebesvarelser JLJ Nanostatistik: Opgavebesvarelser p. 1/16 Pakkemaskine En producent hævder at poserne indeholder i gennemsnit 16 ounces sukker. Data: 10 pakker sukker: 16.1, 15.8, 15.8,

Læs mere

Om hypoteseprøvning (1)

Om hypoteseprøvning (1) E6 efterår 1999 Notat 16 Jørgen Larsen 11. november 1999 Om hypoteseprøvning 1) Det grundlæggende problem kan generelt formuleres sådan: Man har en statistisk model parametriseret med en parameter θ Ω;

Læs mere

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136 Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 36 Det er besværligt at regne med binomialfordelingen, og man vælger derfor ofte at bruge en approksimation med normalfordeling. Man

Læs mere

Mikro-kursus i statistik 1. del. 24-11-2002 Mikrokursus i biostatistik 1

Mikro-kursus i statistik 1. del. 24-11-2002 Mikrokursus i biostatistik 1 Mikro-kursus i statistik 1. del 24-11-2002 Mikrokursus i biostatistik 1 Hvad er statistik? Det systematiske studium af tilfældighedernes spil!dyrkes af biostatistikere Anvendes som redskab til vurdering

Læs mere

2012$ En#skæv#magtfordeling?# 18.)Maj) Et!sociologisk!studie!af!sammenhængen!! mellem!kulturel!kapital!og!politisk!! engagement!!

2012$ En#skæv#magtfordeling?# 18.)Maj) Et!sociologisk!studie!af!sammenhængen!! mellem!kulturel!kapital!og!politisk!! engagement!! 18.)Maj) 2012$ En#skæv#magtfordeling?# Etsociologiskstudieafsammenhængen mellemkulturelkapitalogpolitisk engagement Eksamensnumre: (DDS; 892, Kvant; 1012) (DDS; 829, Kvant; 1109) (DDS; 852, Kvant; 1085)

Læs mere

Ressourcer, generel tillid og sammenhængskraft

Ressourcer, generel tillid og sammenhængskraft Forår 01,. semester Ressourcer, generel tillid og sammenhængskraft En kvantitativ undersøgelse af sammenhængskraften i Danmark 18. maj 01 Integreret eksamensopgave i Kvantitative metoder og Det Danske

Læs mere

Kapitel 4 Sandsynlighed og statistiske modeller

Kapitel 4 Sandsynlighed og statistiske modeller Kapitel 4 Sandsynlighed og statistiske modeller Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 Indledning 2 Sandsynlighed i binomialfordelingen 3 Normalfordelingen 4 Modelkontrol

Læs mere

Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1

Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1 Statistik Formålet... 1 Mindsteværdi... 1 Størsteværdi... 1 Ikke grupperede observationer... 2 Median og kvartiler defineres ved ikke grupperede observationer således:... 2 Middeltal defineres ved ikke

Læs mere

2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900.

2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900. 2 -fordeling og 2 -test Generelt om 2 -fordelingen 2 -fordelingen er en kontinuert fordeling, modsat binomialfordelingen som er en diskret fordeling. Fordelingen er særdeles kompleks at beskrive med matematiske

Læs mere

Note til styrkefunktionen

Note til styrkefunktionen Teoretisk Statistik. årsprøve Note til styrkefunktionen Først er det vigtigt at gøre sig klart, at når man laver statistiske test, så kan man begå to forskellige typer af fejl: Type fejl: At forkaste H

Læs mere

Kvantitative Metoder 1 - Forår 2007

Kvantitative Metoder 1 - Forår 2007 Dagens program Estimation: Kapitel 9.1-9.3 Estimation Estimationsfejlen Bias Eksempler Bestemmelse af stikprøvens størrelse Konsistens De nitioner påkonsistens Eksempler på konsistente og middelrette estimatorer

Læs mere

Projekt 8.3 Hvordan undersøges om et talmateriale normalfordelt?

Projekt 8.3 Hvordan undersøges om et talmateriale normalfordelt? Projekt 8.3 Hvordan undersøges om et talmateriale normalfordelt? Projektet drejer sig om at udvikle en metode, til at undersøge om et givet talmateriale med rimelighed kan siges at være normalfordelt.

Læs mere

for gymnasiet og hf 2017 Karsten Juul

for gymnasiet og hf 2017 Karsten Juul for gymnasiet og hf 75 50 5 017 Karsten Juul Statistik for gymnasiet og hf 017 Karsten Juul 5/11-017 Nyeste version af dette hæfte kan downloades fra http://mat1.dk/noter.htm Hæftet må benyttes i undervisningen

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination

Læs mere

Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller

Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller Statistik II 1. Lektion Sandsynlighedsregning Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller

Læs mere

1 Sandsynlighed Sandsynlighedsbegrebet Definitioner Diskret fordeling Betinget sandsynlighed og uafhængighed...

1 Sandsynlighed Sandsynlighedsbegrebet Definitioner Diskret fordeling Betinget sandsynlighed og uafhængighed... Indhold 1 Sandsynlighed 1 1.1 Sandsynlighedsbegrebet................................. 1 1.2 Definitioner........................................ 2 1.3 Diskret fordeling.....................................

Læs mere

Projekt 1 Spørgeskemaanalyse af Bedst på Nettet

Projekt 1 Spørgeskemaanalyse af Bedst på Nettet Projekt 1 Spørgeskemaanalyse af Bedst på Nettet D.29/2 2012 Udarbejdet af: Katrine Ahle Warming Nielsen Jannie Jeppesen Schmøde Sara Lorenzen A) Kritik af spørgeskema Set ud fra en kritisk vinkel af spørgeskemaet

Læs mere

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet

Læs mere

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/ Program: 1. Repetition af vigtige sandsynlighedsfordelinger: binomial, (Poisson,) normal (og χ 2 ). 2. Populationer og stikprøver 3. Opsummering af data vha. deskriptive størrelser og grafer. 1/29 Binomial

Læs mere

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede fordelinger (kap. 4) Middelværdi og varians (kap. 3-4) Fordelingsresultater

Læs mere

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Kursus 02402: Besvarelser til øvelsesopgaver i uge 9 Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Som model benyttes en binomialfordeling, som beskriver antallet, X, blandt

Læs mere

Løsning til eksamen d.27 Maj 2010

Løsning til eksamen d.27 Maj 2010 DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1

Læs mere

Statistik Lektion 2. Betinget sandsynlighed Bayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV Binomialfordelingen

Statistik Lektion 2. Betinget sandsynlighed Bayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV Binomialfordelingen Statistik Lektion etinget sandsynlighed ayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV inomialfordelingen Repetition Udfaldsrum S Hændelse S Simpel hændelse O i 1, 3 4,

Læs mere

Definition. Definitioner

Definition. Definitioner Definition Landmålingens fejlteori Lektion Diskrete stokastiske variable En reel funktion defineret på et udfaldsrum (med sandsynlighedsfordeling) kaldes en stokastisk variabel. - kkb@math.aau.dk http://people.math.aau.dk/

Læs mere

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14 Module 5: Exercises 5.1 ph i blod.......................... 1 5.2 Medikamenters effektivitet............... 2 5.3 Reaktionstid........................ 3 5.4 Alkohol i blodet...................... 3 5.5

Læs mere

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet 1/41 Landmålingens fejlteori - lidt om kurset

Læs mere

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se Epidemiologi og biostatistik. Uge, torsdag 5. februar 00 Morten Frydenberg, Institut for Biostatistik. Type og type fejl Statistisk styrke Nogle speciale metoder: Normalfordelte data : t-test eksakte sikkerhedsintervaller

Læs mere

Kvantitative Metoder 1 - Efterår Dagens program

Kvantitative Metoder 1 - Efterår Dagens program Dagens program Estimation: Kapitel 9.7-9.10 Estimationsmetoder kap 9.10 Momentestimation Maximum likelihood estimation Test Hypoteser kap. 10.1 Testprocedure kap 10.2 Teststørrelsen Testsandsynlighed 1

Læs mere

Gennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP()

Gennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP() Gennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP() John Andersen, Læreruddannelsen i Aarhus, VIA Et kast med 10 terninger gav følgende udfald Fig. 1 Result of rolling 10 dices

Læs mere

Kanelgiffel i Kansas-tøj eller jordbær i jakkesæt? - social ulighed i sundhed

Kanelgiffel i Kansas-tøj eller jordbær i jakkesæt? - social ulighed i sundhed S O C I O L O G I S K I N S T I T U T K Ø B E N H A V N S U N I V E R S I T ET Kanelgiffel i Kansas-tøj eller jordbær i jakkesæt? - social ulighed i sundhed Velfærd, Ulighed og Mobilitet Grundlæggende

Læs mere

De sunde ejere 18-05-12. Det Danske Samfund II & Kvantitative metoder. Sociologi, Københavns Universitet. Frederikke 1078 / 845 1036 / 807 1019 / 853

De sunde ejere 18-05-12. Det Danske Samfund II & Kvantitative metoder. Sociologi, Københavns Universitet. Frederikke 1078 / 845 1036 / 807 1019 / 853 Det Danske Samfund II & Kvantitative metoder Sociologi, Københavns Universitet 18-05-12 De sunde ejere Frederikke 1078 / 845 1036 / 807 1019 / 853 Antal sider i alt: 71 Anslag i brødtekst: 95.837 Anslag

Læs mere

Lidt om fordelinger, afledt af normalfordelingen

Lidt om fordelinger, afledt af normalfordelingen IMM, 2002-10-10 Poul Thyregod Lidt om fordelinger, afledt af normalfordelingen 1 Introduktion I forbindelse med inferens i normalfordelinger optræder forskellige fordelinger, der er afledt af normalfordelingen,

Læs mere

Opgaver til kapitel 3

Opgaver til kapitel 3 Opgaver til kapitel 3 3.1 En løber er interesseret i at undersøge om hendes løbeur er kalibreret korrekt. Hun udmåler derfor en strækning på præcis 1000 m og løber den 16 gange. For hver løbetur noterer

Læs mere

Statistik Lektion 2. Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var.

Statistik Lektion 2. Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var. Statistik Lektion Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var. Repetition Stikprøve Stikprøvestørrelse n Stikprøvemiddelværdi Stikprøvevarians s Population

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan

Læs mere

Modelkontrol i Faktor Modeller

Modelkontrol i Faktor Modeller Modelkontrol i Faktor Modeller Julie Lyng Forman Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for Biokemikere 2003 For at konklusionerne på en ensidet, flersidet eller hierarkisk

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Uafhængighedstestet Eksempel: Bissau data Data kommer fra Guinea-Bissau i Vestafrika: 5273 børn blev undersøgt da de var yngre end 7 mdr og blev

Læs mere

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd I dag Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik SaSt) Helle Sørensen Først lidt om de sidste uger af SaSt. Derefter statistisk analyse af en enkelt

Læs mere

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet Eksamen ved Københavns Universitet i Kvantitative forskningsmetoder Det Samfundsvidenskabelige Fakultet 14. december 2011 Eksamensnummer: 5 14. december 2011 Side 1 af 6 1) Af boxplottet kan man aflæse,

Læs mere

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Maple 11 - Chi-i-anden test

Maple 11 - Chi-i-anden test Maple 11 - Chi-i-anden test Erik Vestergaard 2014 Indledning I dette dokument skal vi se hvordan Maple kan bruges til at løse opgaver indenfor χ 2 tests: χ 2 - Goodness of fit test samt χ 2 -uafhængighedstest.

Læs mere

Kvantitative Metoder 1 - Forår 2007

Kvantitative Metoder 1 - Forår 2007 Dagens program Kapitel 4: Diskrete fordelinger Afsnit 4.1-4.2, 4.7: Bernoulli fordeling Binomial fordeling Store Tals Lov (Laws of Averages, Laws of Large Numbers) 1 Bernoulli fordeling Kvantitative Metoder

Læs mere