QTI ET VÆRKTØJ TIL MÅLING AF ELEV-LÆRER RELATIONEN -Rolf Lyneborg Lund Cand.pæd.soc.
VI ELSKER AT TESTE TING! Overskrifter fra aviser: Børn lider under tests Standardiserede tests måler ikke uddannelse PISA-undersøgelsen skader den danske folkeskole Undervisere drukner i standardiserede tests Eller de mere dramatiske fra USA: StandardizedTesting: The Monster That Ate American Education
SKAL VI ELSKE AT TESTE TING? Buzzwordsfra samtiden: overdiagnosticering, evidensbaseret, videnskabelig, målbarhed Hvad er forskellen på at teste og på at overteste? Teste for at lære eller teste for at teste?
HVAD TESTER QTI OG HVORFOR ER DEN ANDERLEDES? QTI Questionnaire on Teacher Interaction En cirkumfleks model til flerdimensionelle undervisningsformer eller den danske version: den måler flere nuancer af undervisningen QTI er ikke en test af elevernes færdigheder QTI er ikke en test af underviserens færdigheder QTI er en test der måler elevernes opfattelse af den pågældende undervisers lærerstil Eleverne vil sige: Endelig er det den anden vej rundt
HVORDAN MÅLER QTI? Spørgeskemaet består af 24 spørgsmål omhandlende underviserens fremtoning i den specifikke klasse Hver undersøgelse er klassespecifik Hver undersøgelse er underviserspecifik Hvad vil vi gerne vide? Er underviseren: Retningsgivende? Venlig? Forstående? En der tilpasser sig? Usikker? Utilfreds? En der skælder ud? Indgribende?
HVAD SPØRGER QTI OM? Alle spørgsmål besvaret på en likert-skala 1-5 hvor 1 er aldrig og 5 er altid Udvalgte spørgsmål i QTI Er god til at give retningslinjer Er tålmodig Lader os gøre hvad vi vil Virker usikker Virker lidt trist Bliver hurtigt vred
ER DET EN EN PERSONLIGHEDSTEST? Testen er udformet ud fra en ide om forståelse af andre Testen falder ikke ind under en traditionel test om personlighed nærmere en test af en signifikant andens væremåde Hvordan ved vi, at vi tester det vi tror vi tester? Generelt er testen blevet valideret i mange lande (Den Brok, Brekelmans& Wubbels, 2006; Khine& Fisher, 2004; Telliet.al., 2007) og flere kommer til herunder Danmark
HVAD FÅR VI UD AF DET? 24 items reduceres til 8 skalaer: Retningsgivende? Venlig? Forstående? En der tilpasser sig? Usikker? Utilfreds? En der skælder ud? Indgribende? 8 forskellige måder at være underviser på, der ikke er gensidigt udelukkende man kan godt være vred og venlig på samme tid 2 overordnede retningslinjer for styringog kommunikation baseret på de 8 subscores
DEN UDVIDEDE MODEL
HVAD MED DET NØRDEDE? Hvert item måles således:,, Hvad betyder det? Hvert spørgsmål scores 1-5, gennemsnittet af hver variabel er mellem 1 og 5 1 trækkes fra hver værdi i hver variabel sådan scoren bliver 0-4 Hver variabel divideres med 4 sådan at scoren nu ligger mellem 0 og 1 Gennemsnittet af de tre variable findes og vi har en subkategoriscore mellem 0 og 1
HVORFOR GØR DEN SÅDAN? Hvorfor er 0-1 bedre end 1-5? Er det ikke det samme? Fuldstændig! Sådan nogle som mig elsker 0-1 Hvorfor? Fordi 0-1 giver: Bedre mulighed for videre analyser Mulighed for at oversætte til procent du er 75% venlig men 89% usikker
HVAD MED KOMMUNIKATION OG STYRING? Kommunikation og styring udregnes ved at vægte hver subskala forskelligt til kommunikation vægtes f.eks. "retningsgivende" med en stærk vægt i positiv retning, mens "skælder ud" vægtes stærkt men i negativ retning Hvad er resultatet? En skala der strækker sig fra -1 til +1 Hvorfor -1 til +1? Skala på et koordinatsystem bliver så pænt af det
ER VI SÅ SIKRE PÅ, AT VI MÅLER DET VI SIGER VI MÅLER? En præmis for skalaens brugbarhed er, at der skal være stærk korrelation internt i skalaen, men ikke med de omkringliggende skalaer. Hvad betyder det? En simpel måde at forstå det å er ved at forestille sig at vi har 24 forskellige farver og vi vil blande dem til 8 specifikke farver; hver farve opstår kun, hvis man blander 3 farver korrekt sammen Hvad så hvis vi får brun når vi ville have haft gul? Enten har vi lavet en fejl eller også er der et problem med testen i den kontekst vi benytter den indtil videre har vi kun fået de farver vi gerne vil have
HVAD KAN VI SÅ BRUGE RESULTATERNE TIL? På mikro-plan giver det mulighed for: At hjælpe underviseren til at bedre forstå opfattelsen af sin undervisningsform At identificere problematikker underviseren ikke selv var klar over At kunne ekserimentere med undervisningsformen og afprøve nye idéer og samtidig følge med i, om det har den ønskede effekt På makro-plan giver det mulighed for: At få et overblik over hvad der virker hvor Et indblik i hele gymnasiers undervisningsform og perception af denne At teste pædagogiske programmer meget mere udførligt end tidligere
HVAD KAN VI MERE BRUGE RESULTATERNE TIL? Fokus på "what works" hvilke elever reagerer på forskellige undervisertyper? Hvor stor spredning er der i målingerne i den enkelte klasse? Er underviserstilen ens i flere af underviserens klasser? En bedre lærer/elev-relation = bedre fungerende klasse = større glæde ved studier/arbejde og dermed = bedre karakterer Hvorfor siger han karakterer og ikke læring?
HVAD KAN MAN BRUGE DEN TIL I VIDENSKABEN? Man kunne: Teste helt specifikke interventioner med en kontrolgruppe Teste helt specifikke fag men forskellige undervisere
HVAD HAR VI TÆNKT OS AT GØRE? Lave to målinger mere i Skive og Randers og tilføre kontrolgrupper Opstart var færdiggørelse af testen, mens de sidste to målinger bevæger sig i et kvasi-ekserimentielt design Er det kvasi-ekserimentielt? Nej Er det så ikke-kvasi-ekserimentielt? Nej Hvad er det så? Lige dele validering og undersøgelse af, hvad en bevidsthed om underviserstil gør ved elevernes forståelse af denne