RANDOMISEREDE FORSØG: HVAD, HVORFOR & HVORDAN? HELLE HANSEN METTE DEDING
PROGRAM 13.00-13.45 Velkomst Hvad er randomiserede kontrollerede forsøg? Randomiserede forsøg historisk set Hvorfor gennemføre RCT-studier? Design 13.45-14.00 Pause 14.00-15.00 Gruppearbejde og eksempler 15.00-15.15 Pause 15.15-16.00 Mere om design: rekruttering og randomiering Etiske problemstillinger Utilsigtede effekter af RCT og afrunding 2
PRÆSENTATION AF JER SELV HVAD ER DIT NAVN? HVORFOR HAR DU MELDT DIG TIL DENNE WORKSHOP? ARBEJDER DU MED RANDOMISEREDE FORSØG? 3
HVAD ER RANDOMISEREDE FORSØG? 4
DET RANDOMISEREDE KONTROLLEREDE FORSØG - RCT Kaldes også lodtrækningsforsøg eller et eksperiment Definition af eksperiment: Man manipulerer/varierer en given indsats (fx en behandling) på en systematisk måde, for derefter at undersøge hvilken effekt denne variation har på et givent udfald (fx niveau af stress, adfærd) 5
HVAD ER RANDOMISEREDE FORSØG? Chaplin 1931: Experimental method in sociology does not mean interference with individual movement or freedom. It does not endager life or limb or moral character. Oakley 1998: On the conctrary, what randomised controlled trials offer in the social domain is exactly what they promise to medicine: protection of the public from potentially damaging uncontrolled experimentation and a more rational knowledge about the benefits to be derived from a professional intervention 6
RCT HISTORISK SET 1061: Ben Cao Tu Jing Ginseng eller ej i forhold til at løbe 1753: Sir James Lind, læge i den engelske flåde Skørbug -Citron og appelsin overfor æblevin, fortyndet svovlsyre, havvand, eddike og urteblanding 1896-97: Johannes Fibiger Difteri - Første forsøg med randomisering 1900erne uddannelsesområdet i USA 1920erne R. A. Fischer inden for landbruget 1930erne socialområdet i USA Cambridge Sommerville 7
RCT HISTORISK SET 1944 England - Patulin mod hoste 1948 England - Streptomycin mod tuberkulose 1960erne-1985 Mange forsøg i USA på uddannelses- og socialområdet 1990erne især sundhedsområdet Cochrane Collaboration 2005- Campbell Collaboration: uddannelse, kriminologi, socialområdet 8
HVORFOR SNAKKER VI SÅ MEGET OM RANDOMISEREDE FORSØG? TITEL 15-09-2014 9
HVORFOR RCT? Vi kan ikke blot se en sammenhæng eller korrelation mellem indsats og effektmål. Fordi vi ved at den eneste forskel på indsats- og kontrolgruppe er indsatsen kan vi fastslå et kausalitetsforhold Hvis indsatsgruppe klarer sig bedre/dårligere end kontrolgruppen så kan vi konkludere at det er på grund af indsatsen 10
At finde den kausale effekt af indsats på udfaldsmål 11
12
Randomisering A B Indsats Måle udfald 13
HVORFOR RCT? Det bedste design til effektmåling Pga. den tilfældige tildeling af indsats Sikrer at grupperne er ens på både målbare og ikke-målbare faktorer Kan håndtere kompleksitet Kræver færrest deltagere 14
DESIGN AF RANDOMISEREDE KONTROLLEREDE FORSØG Fire elementer: 1. Målgruppe 2. Randomisering 3. Indsats/kontrol 4. Måling/analyse 15
DESIGN AF RCT: MÅLGRUPPE Individ: Enkelt personer randomiseres til intervention eller kontrol Gruppe/Cluster randomisering: Når den naturlige enhed at randomisere på er gruppen (fx skole, klasse, praktiserende læge, hjemmeplejeenhed, kommune) 16
DESIGN AF RCT: RANDOMISERING Almindelig lodtrækning: Der er en gruppe, der passer til indsatsen og som kan randomiseres. Venteliste: Der er en venteliste til et tilbud/kursus, hvor man kan randomisere hvem der modtager tilbuddet/kurset nu og hvem der skal vente til næste runde. Løbende rekruttering/randomisering: Rekrutteringen sker løbende og derfor sker randomiseringen ligeledes løbende efter en på forhånd fastlagt procedure. 17
INDSATS/INTERVENTION Indsatsen skal være: Afgrænset Velbeskrevet Gerne teoretisk funderet Så vi ved, hvad vi måler på! 18
KONTROLGRUPPE Hvad får kontrolgruppen? Anden form for specifik behandling Anden almindelig behandling Usual Care Venteliste til samme behandling 19
EFFEKTMÅL Vælg effektmål, der er vigtige for den indsats vi udfører. Og mål på det samme før og efter indsatsen. Sensitivt for vigtige ændringer Reliabelt måler det samme hvis vi måler den samme person flere gange Validt måler præcist det vi gerne vil måle Har ikke loft- eller gulv effekter (fx for svær eller for nem test) Målbart (fx kan måle niveau af depression) 20
PAUSE! 21
Gruppe arbejde 22
PAUSE! 23
INTERN/EKSTERN VALIDITET Deltagergruppen har betydning i forhold til generaliserbarheden af studiet. -Om resultaterne kan overføres til andre grupper. Oftest kan man kun sige noget sikkert om effekten på den gruppe man har undersøgt. Men man kan så måske formode at dette også vil gælde for andre grupper. 24
Randomisering A B Indsats Måle udfald 25
REKRUTTERING Så mange med som muligt! -overvej tiltag der kan tilskynde deltagelse Hvis målgruppen er lille kan det blive svært at rekruttere nok deltagere Få realistisk billede af, hvor mange der kan rekrutteres inden for det tidsrum man har valgt 26
ANTAL DELTAGERE Hvor mange personer vi skal have med i forsøget hænger sammen med den effektstørrelse vi forventer at finde: Jo større effektstørrelse jo større styrke/power. Jo større effektstørrelse jo færre personer behøver vi for at kunne vise en forskel Jo mindre effektstørrelse jo flere personer skal vi bruge 27
ANTAL DELTAGERE Tommelfingerregler (ikke absolut!): Stor effekt: 25 personer i hver gruppe (Cohen s d=0.80) Moderat effekt: 64 personer i hver gruppe (Cohen s d=0.50) Lille effekt: 400 personer i hver gruppe (Cohen s d=0.20) Generelt siger vi gerne 100-150 i alt 28
FRAFALD For det meste er der nogen der falder fra undervejs - Rekrutter lidt flere end der er brug for Ofte er der flere i kontrolgruppen der falder fra end i interventionsgruppen. Det er vigtigt at undersøge om dem, der falder fra er anderledes end dem, der fortsætter. Ellers kan man ende med forskellige grupper, der ikke kan sammenlignes. 29
DESIGN EKSEMPLER Individ: DUÅ Baby: Familier randomiseres til DUÅ Baby eller TAU Cluster: Kræver en del clustre gerne 40 - minimum 12 Skoleklasser (fx klasseledelse) Daginstitutioner (fx sprogstimulering) Sagsbehandler QRCT quasi-randomiseret: ikke tilfældig/randomiseret fordeling men næsten. Naturligt forekommende opdeling fx fødselsår, dag i uge man henvender sig 30
DESIGN AF RCT Venteliste: Kontrolgruppen står på venteliste Alle får indsats Ikke muligt med langtidsopfølgning Stepped wedge: Bruges ved udrulning af indsats. Individer eller grupper randomiseres til at begynde indsats på forskellige tidspunkter. Alle får indsatsen men på forskelligt tidspunkt. Ikke muligt med langtidsopfølgning 31
STEPPED WEDGE 32
RANDOMISERING Randomisering skal være uforudsigelig og uafhængig af dem, der er indblandet i forsøget. Det har vist sig at der snydes med det, når det er muligt Åbne konvolutterne Røntgenfotografere konvolutter Bytte om på rækkefølgen Mange metoder til randomisering Individniveau eller gruppeniveau (cluster) Brug simpel randomisering hvis muligt Behøver ikke altid være 1:1 33
RANDOMISERING Simpel randomisering lodtrækning, liste med tilfældige tal Blok randomisering fx blokke af 4 eller 6 Parvis randomisering når man har to Matching man matcher et par, fx alder eller køn Minimisering man udvælger nogle karakteristika som har betydning (fx alder, køn, problemniveau). 34
BLINDING DELTAGERE: Man holder deltagere uvidende om hvilken behandling de får, for at det ikke skal få indflydelse på deres effektmål. Kan ikke så tit lade sig gøre med sociale interventioner. UNDERSØGERE: Dem der skal foretage vurdering af effektmål holdes uvidende om hvilken gruppe personen tilhører. Skal så vidt muligt gøres. 35
EKSEMPEL DUÅ BABY RANDOMISERING 2:1 randomisering (DUÅ Baby:Usual Care) Hver kommune har separat liste Blokke så der kommer familier til begge grupper løbende 1. Genereret liste med angivelse af indsats eller kontrol 2. Sekretær i min afdeling står for randomisering 3. Kommune sender navne 4. Besked tilbage om hvad de skal tilbydes 36
INDSATS/KONTROL: STANDARDISERING Det er en fordel at standardisere så mange procedurer som muligt for at undgå utilsigtet variation. Hvis procedurerne bliver udført så ens som muligt igennem studiet så vi får den bedste mulighed for at kunne sige noget om effekten. Fx behandlingen, hvornår vi måler, hvilke familier der indgår, rekrutteringsprocedure. 37
MÅLING Afklar undersøgelsens problemstillinger og begreber Hvad er det vi vil undersøge helt præcist og hvordan måler vi det? Objektive/subjektive mål Er der nogen der har målt det før på en GOD måde? Se hvad andre har brugt stjæl/genbrug Spørg om det samme hver gang Supplere med kvalitativt data/register/andet (bio) 38
ETISKE PROBLEMSTILLINGER Er det uetisk at en lodtrækning afgør om man skal have behandling eller ej? Argumenter FOR randomisering på sociale område: Store regionale forskelle i behandling/tilbud Ikke enighed om, hvad der bør tilbydes Meget sjældent at kontrolgruppen ikke bliver tilbudt nogen behandling/tilbud overhovedet (oftest standard behandling) Ofte kan det man tilbyder indsatsgruppen kan betragtes som noget ekstra oven i standard behandlingen. 39
ETISKE OVERVEJELSER RCT-studier skal gerne kunne bidrage med væsentlig ny viden til at forbedre forholdene for borgerne i vores samfund. Målet er at maksimere sandsynligheden for at få et brugbart resultat af undersøgelsen samtidigt med at vi minimerer besværet for undersøgelsesdeltagerne. 40
ETISKE OVERVEJELSER Informeret samtykke: Deltagere skal informeres om undersøgelsen - både skriftligt og mundtligt. Skriftligt samtykke når borgeren/patienten skal give oplysninger (Persondataloven) Deltagere skal informeres om, at de kan trække sig fra undersøgelsen på ethvert tidspunkt, uden at det får konsekvenser for deres nuværende og fremtidige behandling. 41
42
ETISKE FORHOLD Mundtlig og skriftlig information om studiet til forældre Skriftligt samtykke Kan trække sig ud til hver tid Fortrolighed Datatilsyn Videnskabsetiske komitesystem Forsøgsprotokol registreres Bedre Familiebehandling 15-09-2014 43
UTILSIGTEDE EFFEKTER AF DEN EKSPERIMENTELLE SITUATION HAWTHORNE EFFEKT: Effekten af at få opmærksomhed, at føle sig særligt udvalgt PLACEBO EFFEKT: At troen på en behandling i sig selv kan have en effekt Dokumentationen for placeboeffekter er tvivlsom og formentlig overdrevet. Der er nok oftest tale om spontan remission/modning eller regression mod gennemsnittet. 44
UTILSIGTEDE EFFEKTER AF DEN EKSPERIMENTELLE SITUATION EKSPERIMENTEL KONTAMINATION/SPILLOVER: Fx hvis undersøgelsesdeltagerne påvirker og kommunikerer med hinanden. Eller hvis behandlere i kontrolgruppen begynder at bruge interventionen pga. at det for eksempel er oppe i tiden at bruge denne metode 45
UTILSIGTEDE EFFEKTER AF DEN EKSPERIMENTELLE SITUATION Der bliver for lille forskel mellem behandlingen i indsatsgruppen og kontrolgruppen til at man kan finde en forskel. Det betyder ikke nødvendigvis at der ikke er en effekt, vi kan bare ikke se den. Det er vigtigt, at der er forskel på indsats og kontrolgruppe. 46
RCT OPSAMLING RCT er det design, der egner sig bedst til at måle effekt Man kan udtale sig om kausalitet at A medfører B Randomiser hvis I overhovedet har mulighed for det Det behøver ikke at være så svært Men alt skal planlægges FØR i går i gang Start i det små 47
SPØRGSMÅL OG KOMMENTARER?! EFFEKTMÅLING: HVAD OG HVORDAN 15-09-2014 48