Inter-rater reliability of the Quebec Task Force classification system for recent-onset Whiplash Associated Disorders

Yaadwinder Shergill, DC
Pierre Côté, DC, PhD
Heather Shearer, DC, MSc
Jessica J. Wong, DC, MPH
Maja Stupar, DC, PhD
Anthony Tibbles, DC
J. David Cassidy, DC, PhD

Purpose: The inter-rater reliability of the Quebec Task Force (QTF) classification system for WhiplashAssociated Disorders (WAD) remains unknown. Our objective was to determine the inter-rater reliability of the WAD classification between an experienced chiropractic clinician and two chiropractic residents.
Methods: We conducted an inter-rater reliability study using baseline clinical data from 80 participants assessed for inclusion in a randomized clinical trial of the conservative management of WAD grades I and II. We reported reliability using Cohen’s kappa (k) and 95% confidence intervals (CI).
Results: The mean duration of WAD symptoms was 7.6 days (s.d.=5.2). In our study, the interrater reliability of the WAD grade classification varied from k=0.04 (95% CI -0.04 to 0.12) to k=0.80 (95% CI 0.67 to 0.94).
Conclusion: Inter-rater reliability of the WAD classification varied greatly across raters and may be associated with the experience of the raters and with their understanding of the criteria. Our results suggest that clinicians may benefit from training to standardize how they classify WAD. Furthermore, our results need to be tested in a different sample of patients and with a range of clinicians from different clinical disciplines.

Fiabilité inter-évaluateur de la classification établie par le Groupe de travail du Québec sur les troubles associés au coup de fouet cervical d’apparition récente
Objectif : La fiabilité inter-utilisateur du système de classification des troubles associés au coup de fouet cervical (TACF) établi par le Groupe de travail du Québec (GTQ) demeure inconnue. Notre étude visait à établir la fiabilité inter-évaluateur du système de classification des troubles associés au TACF utilisé par un chiropraticien clinicien d’expérience et deux
résidents en chiropratique.
Méthodologie : On a effectué notre étude à l’aide de données cliniques de départ sur 80 participants à un essai clinique, à répartition aléatoire, sur le traitement conservateur du TACF de stades I et II. On a utilisé le coefficient kappa (k) de Cohen et des intervalles de confiance (IC) à 95 % pour évaluer la fiabilité.
Résultats : La durée moyenne des symptômes du TACF était de 7,6 jours (écart-type :5,2). La fiabilité inter-utilisateur de la classification des TACF a varié de k = 0,04 (IC à 95 % – de 0,04 à 0,12) à k = 0,80 (IC à 95 % de 0,67 à 0,94).
Conclusion : La fiabilité inter-utilisateur de la classification des TACF a beaucoup varié d’un évaluateur à l’autre; l’écart pourrait être lié à l’expérience de l’évaluateur et à sa compréhension des critères de classification. Selon les résultats de notre étude, les cliniciens pourraient bénéficier d’une formation servant à normaliser leur méthode de classification des TACF. Nos résultats devraient être confirmés par une autre étude utilisant un autre échantillon de patients et un éventail de cliniciens appartenant à diverses disciplines.