Nyttan av vissa adhd-test kan ifrågasättas, visar psykologen Gunilla Granholm i en studie. Det finns en risk att tester och skattningar rent av kan grumla diagnostiken.
Continuous performance test (CPT) har i ett stort antal studier visats vara känsliga för dysfunktion oavsett typ och etiologi [1]. I forskning har de använts för att studera om och på vilket sätt uppmärksamhet är påverkad vid en rad olika neurologiska och psykiatriska tillstånd, däribland adhd [2,3].
Integrated visual and auditory continuous performance test (IVA) är ett av flera CPT som används i samband med adhd-diagnostik i Sverige och internationellt. IVA har enligt testtillverkaren hög samstämmighet med andra CPT och beteendeskattningsskalor för adhd-diagnostik [4]. Testresultaten mynnar ut i en diagnostisk arbetshypotes som är förenlig med definitionerna för adhd i DSM.
CPT har i flera studier och systematiska översikter visat sig kunna skilja ut barn med adhd från normala kontroller [2,5]. I en metastudie [6] sågs att effektstorlekar för olika kognitiva och neuropsykologiska test varierar stort vid jämförelser mellan adhd-grupper och kontroller och att störst effektstorlek sågs för CPT. Testens validitet har dock ifrågasatts, särskilt när det gäller att diskriminera adhd från andra kliniska grupper [7,8,9]. I jämförelse med andra CPT finns relativt få studier avseende den diskriminativa validiteten för IVA. En studie fann att testet inte kunde differentiera mellan adhd och lättare traumatisk hjärnskada [10]. I en annan sågs att IVA kunde skilja ut barn med autismspektrumstörning och de med adhd från kontroller, men inte differentiera mellan tillstånden [11].
Det har även varit svårt att påvisa starka samband mellan resultat på CPT och beteendeskattningar som utförts av föräldrar och lärare [12,13,14]. En metastudie av kommersiellt tillgängliga CPT, inklusive IVA, Conners CPT-II, TOVA med flera, visade att stödet för CPT:s diagnostiska nytta var både otillräckligt och motsägelsefullt [15]. De brister som sågs gällde förmågan att skilja adhd från subkliniska symtom och från andra kliniska grupper, liksom bristande ekologisk validitet och låg samstämmighet med beteendeskattningar.
Beteendeskattningar baserade på diagnostiska kriterier för adhd erbjuder ett effektivt och systematiskt sätt att inhämta information om barnets beteende i olika miljöer [16], vanligen hemma och i skolan. Skattningsskalan Swanson, Nolan and Pelham, version IV (SNAP IV) har använts i många studier, däribland Multimodal treatment study for adhd (MTA-studien) [17]. Den används brett inom barnpsykiatrin i Sverige.
Baserat på resultat av tidigare studier framfördes hypotesen att barn och ungdomar med adhd får högre totalpoäng i SNAP IV föräldra- och lärarskattning än de barn som inte erhållit diagnos. Barn och ungdomar med adhd borde också oftare än slumpen få poäng över cut off-värde i SNAP IV föräldra- och lärarskattning än de barn som inte erhållit diagnos. IVA borde oftare ange någon form av adhd-hypotes i gruppen barn med adhd än i gruppen barn som inte bedömts möta kriterier för diagnos. Den diagnostiska träffsäkerheten för SNAP IV borde vara bättre än slumpen. Baserat på studier avseende CPT gjordes antagandet att den diagnostiska träffsäkerheten för IVA var mer osäker, varför den undersöktes explorativt.
Instrumenten utvärderades retrospektivt i en realistisk klinisk miljö. Urvalet bestod av 161 barn och ungdomar (113 pojkar och 48 flickor) i åldrarna 6–18 år som utretts med frågeställning adhd vid Bup i Malmö. Som delmoment i den tvärprofessionella utredningen hade barnen testats med IVA och föräldrar och lärare hade skattat symtom i SNAP IV. Diagnostiken gjordes utgående från DSM-IV. Data inhämtades via patientjournaler. Av de 161 barnen erhöll 111 diagnosen adhd (gruppen adhd). Resterande 50 användes som jämförelsegrupp (gruppen icke-adhd). Barnen i bägge grupperna hade förhållandevis hög förekomst av samsjuklighet såsom autism, Tourettes syndrom, ångest, depression, utagerande och trots, familjerelationsproblem samt språk- och inlärningsstörning. Medelåldern var 13 år i båda grupperna. Fullständiga data fanns för 115 barn, vilket gav ett bortfall på 29 procent.
Totalpoäng för subdomän ouppmärksamhet respektive ouppmärksamhet och hyperaktivitet/impulsivitet kombinerad i SNAP lärarskattning var signifikant högre för gruppen adhd jämfört med gruppen icke-adhd, medan det i föräldrarnas skattning inte förelåg någon skillnad i någon av subdomänerna. Barn och ungdomar i såväl gruppen adhd som gruppen icke-adhd fick lika höga totalpoäng av föräldrarna. Vid bruk av de cut off-värden som rekommenderas sågs inga signifikanta skillnader mellan grupperna, med undantag för subdomän ouppmärksamhet i SNAP lärarskattning. Beträffande adhd-indikation i IVA sågs inga skillnader mellan grupperna. När den diagnostiska träffsäkerheten undersöktes sågs signifikanta resultat endast för subdomän ouppmärksamhet respektive ouppmärksamhet och hyperaktivitet/impulsivitet kombinerad i SNAP lärarskattning. I övrigt var träffsäkerheten för SNAP IV och IVA inte bättre än slumpen.
Den aktuella studien visade oväntat litet stöd för den kliniska nyttan av instrumenten. Varken SNAP IV eller IVA är tänkta att användas som fristående diagnostiska verktyg, men frågan är i vilken utsträckning de bidrar alls? Kan det vara så att testning och skattning rentav grumlar diagnostiken? Samtliga barn i studien hade aktualiserats med misstänkt adhd och hade också symtom på adhd i varierande grad. I studien jämfördes de barn och ungdomar som erhållit adhd-diagnos med de barn och ungdomar som utretts under samma tidsperiod och med samma metodik men där diagnos inte fastställts. Som jämförelsegrupp kan den tyckas bristfällig då barnen i gruppen haft symtom i den omfattningen att en utredning bedömts motiverad. Flera av barnen i gruppen kan ha bedömts uppvisa symtom precis under kriteriegränsen för diagnos.
Barnen i båda grupperna var belastade med annan psykiatrisk samsjuklighet och medelåldern var hög. Kontrasten mellan grupperna blir därmed mindre än om gruppen barn med diagnos adhd jämförts med en icke-klinisk grupp barn. Instrumentens diagnostiska träffsäkerhet prövades således inte i jämförelse med normala kontroller utan i den kliniska vardag där instrumenten faktiskt sätts på prov, vilket sammantaget ställer ännu högre krav på instrumenten. Den typen av klinisk utvärdering av instrumenten har med några få undantag inte gjorts förut.
Lärarnas skattning verkade vid en första anblick vara något mer användbar än föräldrarnas. Totalt sett var det dock få barn som skattats över cut off av lärare och i de fall det skett har barnet tenderat att få diagnosen adhd. Bland dem som inte fått diagnosen var det endast enstaka barn som skattats över cut off av lärare. Det talar för att lärarnas skattning blivit utslagsgivande vid ställningstagande till diagnos. I föräldraskattningen gick SNAP IV inte att använda, varken för att bekräfta eller avfärda diagnos adhd. Att så få barn nådde över cut off aktualiserar frågan om cut off-gränsen är lämpligt satt eller om den är för sträng, något som även framförts i tidigare studier [18,19]. Närmare 70 procent av barnen i studien var pojkar, vilket återspeglar dominansen av pojkar med adhd i barndomsåren, och medelåldern i gruppen var 13 år. SNAP IV är inte könsnormerat och det finns endast normer upp till 12 år, vilket gör instrumentet osäkrare för flickor och för barn äldre än 12 år. Då pojkar får högre poäng i SNAP IV kan antas att de höga cut off-värdena drabbar flickor än hårdare.
När cut off-värdena frångicks och en mer dimensionell bedömning genom poängsumma i stället användes som mått på sannolik adhd blev träffsäkerheten bättre. Det betyder att en lägre cut off skulle ge en bättre balans mellan sensitivitet och specificitet. Tidigare studier har endast visat måttliga samband mellan föräldra- och lärarskattningar [20,21]. Också i den här studien skiljer sig föräldra- och lärarskattningar åt. I aktuell studie är det dock troligt att urvalet har betydelse för att föräldraskattningarna inte på något signifikant sätt diskriminerar mellan grupperna. Barn vars föräldrar inte upplever funktionsnedsättande symtom blir sannolikt sällan föremål för utredning. Det faktum att föräldrarnas skattningar inte skiljer sig åt mellan gruppen adhd och gruppen icke-adhd skulle kunna förklaras av att föräldrar som väljer att låta utreda sitt barn för adhd i samtliga fall upplever problem och därmed skattar lika högt i SNAP IV.
Studien visar att barnen och ungdomarna i gruppen adhd inte skiljde sig på något signifikant sätt från barnen och ungdomarna i gruppen icke-adhd avseende resultatet i IVA. Testet gav inte heller någon tillfredsställande diagnostisk träffsäkerhet. Resultatet är, om än nedslående, i linje med de studier som pekat på bristande validitet hos CPT när det gäller förmågan att diskriminera adhd från andra kliniska grupper och från subkliniska symtom [7,8,9,10,11,15]. Det är en sak att skilja ut adhd från normala kontroller och betydligt svårare när psykiatri ställs mot psykiatri. De barn och ungdomar i studien som föll ut positivt i IVA, men inte erhöll diagnos adhd, kan tänkas ha »nästan adhd« eller en signifikant samsjuklighet som IVA också är känsligt för.
Det skulle också kunna vara så att IVA faktiskt fångat kliniskt signifikanta adhd-symtom men att funktionsnivån inte bedömts vara tillräckligt påverkad för diagnos, alternativt att symtomen bedömts vara sekundära till annan problematik. Det omvända, att diagnosen ställts trots att IVA inte indikerat adhd, ses också i aktuell studie. Adhd betraktas som en heterogen diagnos varför man skulle kunna tänka sig att det finns en eller flera subgrupper som IVA är känsligt för och andra subgrupper som inte faller ut i testet. Detta skulle kunna förklara det svaga sambandet mellan testresultat och diagnos.
I en retrospektiv klinisk studie av det här slaget finns ett stort mått av ovisshet. Det är i efterhand svårt att kontrollera de faktorer som eventuellt har påverkat informationsinhämtandet liksom hur stor vikt som lagts vid de olika delarna i det samlade bedömningsunderlaget. Diagnostiken har skett utgående från DSM-IV, vilket ger en viss struktur. Men klinikerns egen erfarenhet fungerar som norm i bedömningen av varje kriterium, om det föreligger och har den kvalitet och svårighetsgrad att det kan anses uppfyllt.
Även om vi antar att diagnosen är korrekt uppkommer ett speciellt problem då man använder diagnosen som utfallsmått för att bedöma metoder som används vid utredningen. Den diagnos som ställts är därmed inte helt oberoende av de instrument som studerats. Om resultaten av instrumenten vägt tungt vid ställningstagande till diagnosen hade man dock kunnat förvänta sig ett starkare samband mellan positivt testutfall och ställd diagnos. Detta gäller särskilt IVA, men i viss mån även SNAP IV. Det cirkulära problemet hade kunnat undvikas genom att använda instrumenten på redan diagnostiserade patienter, utredda med andra metoder än SNAP IV och IVA, för att på ett oberoende vis jämföra ställd diagnos med resultaten. Å andra sidan jämfördes adhd-gruppen med en välmatchad icke-adhd grupp.
SNAP IV förefaller användbart för screening avseende adhd-symtom. Barn utan adhd får sällan höga poäng i SNAP IV. I aktuell studie antyds möjligheten att de gängse cut off-värdena är alltför stränga och att det blir missvisande att enbart förlita sig på poäng över respektive under cut off. Totalpoäng kan vara ett bättre mått på sannolik adhd.
Resultaten bekräftar den stora mängd forskning som visar att den diagnosspecifika träffsäkerheten hos CPT är mycket osäker. IVA bör således inte betraktas som ett adhd-specifikt test och heller inte användas för att bekräfta eller avfärda diagnosen adhd i en klinisk grupp. Kliniker bör ha i åtanke att resultaten kan spegla svårigheter relaterade till andra tillstånd. Den diagnostiska nyttan i klinisk vardag är därmed begränsad eftersom svårigheten ofta ligger i att differentiera mellan olika psykiatriska tillstånd.
Det behövs fortsatt forskning som undersöker om, när och hur våra instrument kan bidra till säkrare och mer effektiv diagnostik – och i förlängningen rätt stöd och behandling för patienter med adhd.
Gunilla Granholm
Psykolog, specialist i neuropsykologi
Artikeln bygger på ett examensarbete under specialistutbildningen.
1. Riccio C A, Reynolds C R, Lowe P, et al. (2002). The continuous performance test: a window on the neural substrates for attention? Archives of Clinical Neuropsychology, 17 (3), 235–272.
2. Losier B J, McGrath P J, Klein R M (1996). Error patterns on the continuous performance test in non-medicated and medicated samples of children with and without ADHD: a meta-analytic review. Journal of Child Psychology and Psychiatry and Allied Disciplines, 37(8), 971–987.
3. Sonuga-Barke E J S, Sergeant J A, Nigg J, et al. (2008). Executive dysfunction and delay aversion in attention deficit hyperactivity disorder: Nosologic and diagnostic implications. Child and Adolescent Psychiatric Clinics of North America, 17, 367–384.
4. Sandford J A, Turner A (2004). Manual for the integrated visual and auditory continuous performance test. Richmond VA: Brain Train.
5. Epstein J N, Erkanli A, Conners C K, et al. (2003). Relations between continuous performance test performance measures and ADHD behaviors. Journal of the American Academy of Child & Adolescent Psychiatry, 31(5), 543–554.
6. Frazier T W, Demaree H A, Youngstrom E A (2004). Metaanalysis of intellectual and neuropsychological test performance in attention-deficit/hyperactivity disorder. Neuropsychology, 18(3), 543–555.
7. McGee R A, Clark S E, Symons D K (2000). Does the Conner´s Continuous performance test aid in ADHD diagnosis? Journal of Abnormal Child Psychology, 28(5):415–24.
8. Nichols S L, Waschbusch D A (2004). A review of the validity of laboratory cognitive tasks used to assess symptoms of ADHD. Child Psychiatry & Human Development, 34(4), 297–315.
9. Solanto M V, Etefia K, Marks D J (2004). The utility of self-report measures and the continuous performance test in the diagnosis of ADHD in adults. CNS Spectrums, 9(9), 649–659.
10. Tinius T P (2003). The integrated visual and auditory continuous performance test as a neuropsychological measure. Archives of Clinical Neuropsychology,18, 439–54.
11. Corbett B A, Constantine L J (2006). Autism and attention deficit hyperactivity disorder: Assessing attention and response control with the integrated visual and auditory continuous performance test. Child Neuropsychology, 12, 335–348.
12. Naglieri J A, Goldstein S, Delauder, et al. (2005). Relationships between the WISC-III and the cognitive assessment system with conners’ rating scales and continuous performance tests. Archives of clinical Neuropsychology, 20, 385–401.
13. Alloway T P, Gathercole S E, Holmes J, et al. (2009). The diagnostic utility of behavioural checklists in identifying children with adhd and children with working memory deficits. Child Psychiatry & Human Development, 40, 353–366.
14. Arble E, Kuentzel J, Barnett D (2014). Convergent validity of the integrated visual and auditory performance test (IVA+Plus): associations with working memory, processing speed, and behavioral ratings. Archives of Clinical Neuropsychology, 29(3):300–12.
15. Hall C H, Valentine A Z, Groom M J, et al. (2015). The clinical utility of the continuous performance test and objective measures of activity for diagnosing and monitoring ADHD in children: A systematic review. European Child & Adolescent Psychiatry.
16. Gioia G A, Isquith P K, Kenworthy L, et al. (2002). Profiles of everyday executive function in acquired and developmental disorders. Child Neuropsychology, 8(2), 121–137.
17. Swanson J M, Kraemer H C, Hinshaw S P, et al. (2001). Clinical relevance of the primary findings of the MTA: Success rates based on severity of ADHD and ODD symptoms at the end of treatment. Journal of the American Academy of Child and Adolescent Psychiatry, 40(2), 168–179.
18. Bussing R, Fernandez M, Harwood M, et al. (2008). Parent and teacher SNAP IV ratings of attention deficit hyperactivity disorder symptoms: psychometric properties and normative ratings from a school district sample. Assessment, 15(3), 317–328.
19. Gaub M, Carlsson C L (1997). Behavioral characteristics of DSM-IV ADHD subtypes in a school-based population. Journal of Abnormal Child Psychology, 25(2), 103–111.
20. Hartman C A, Rhee S H, Willcutt E G, et al. (2007). Modeling rater disagreement for ADHD: are parents or teachers biased? Journal of the American Academy of Child & Adolescent Psychiatry, 35(4), 356–342.
21. Thapar A, Harrington R, Ross K, et al. (2000). Does the definition of ADHD affect heritability? Journal of the American Academy of Child & Adolescent Psychiatry, 39(12), 1528–1536.