Un guide de validation transculturelle des instruments
de mesure en santé mentale

Jean Caron Ph.D.
Professeur au Département des sciences du comportement
Université du Québec en Abitibi-Témiscamingue
Professeur invité au Centre de recherche de l'Hôpital Douglas
Université McGill

La validation transculturelle d’un instrument d’évaluation est un processus complexe qui nécessite un investissement important en ressources temporelles et financières. Il apparaît difficile de réaliser cet exercice en moins d'une année. Avant de s'aventurer dans ce processus, il est important de s'assurer qu'il n'existe pas d'instrument équivalent en langue française ou un instrument équivalent traduit et validé. Dans le cas contraire, il est primordial que le chercheur fasse une recension exhaustive des instruments pertinents pour son étude afin de sélectionner celui qui a traversé les étapes de validation les plus rigoureuses, dans sa langue d'origine. En effet, la validation transculturelle effectuée selon les règles de l'art ne peut généralement produire une version plus valide et fidèle que la version originelle. Certes, ce processus permet souvent d'améliorer certains aspects de la version d'origine ou de lui faire franchir certaines étapes de validation non encore complétées, mais il ne peut compenser des manques flagrants de validité de contenu, de construit et de fidélité. De plus, dans la plupart des cas, l'utilité d'un instrument d'évaluation est sa capacité de détecter des différences entre des individus, des groupes particuliers ou suite à des changements induits par un traitement, un programme ou par des modifications environnementales. On réfère ici à la spécificité et à la sensibilité de l'instrument. Ces qualités d'un instrument doivent également être prises en compte dans la sélection d'un instrument.

La validation transculturelle d'un instrument implique trois grandes étapes : 1) la traduction et la vérification de son équivalence; 2) la vérification empirique de la validité de la version traduite; 3) l'adaptation des scores au contexte culturel et le développement de normes. Chacune d’entre elles comporte également des étapes nécessaires à la réalisation d’une version valide, et plusieurs options s’offrent au chercheur avec leurs avantages et inconvénients. Le texte qui suit décrit ces étapes, et le lecteur intéressé à valider des instruments en langue française trouvera également en référence des articles spécialisés sur ce thème.

La traduction et la vérification de son équivalence

La processus de traduction doit assurer qu'un instrument conserve une équivalence inférentielle (Haccoun, 1987); c'est-à-dire qu'il soit possible de produire les mêmes inférences à partir de la version traduite qu'avec l'instrument originel. La correspondance entre les mots (équivalence sémantique) est difficilement réalisable d'une culture à l'autre compte tenu du vocabulaire et de la grammaire propre à chaque langue. Certaines expressions traduites littéralement n'ont pas de sens dans une autre culture et des expressions propres à la culture ciblée et conservant le sens des items doivent être trouvées (équivalence des expressions). Certaines situations qui sont évoquées dans la culture de l'instrument d'origine peuvent ne pas correspondre à la réalité dans une autre culture, ces items devront être remplacés par d'autres situations appropriées à cette culture tout en préservant l'objectif et le sens visé par ces items (équivalence expérientielle). Enfin, le même exercice doit être appliqué pour certains concepts, qui traduits littéralement, ne permettent pas la même représentation d'une culture à l'autre (équivalence conceptuelle). Le lecteur est invité à consulter Guillemin, Bombardier et Beaton (1993) pour un approfondissement de ces concepts d'équivalence.

Préparation d’une version préliminaire

L’évaluation de la version préliminaire

La vérification empirique de la validité de la version traduite

Pour qu'un instrument soit valide, il doit rencontrer des critères de validité de contenu, de validité concomitante, de validité de construit, et il doit également présenter des aspects qui assurent sa fidélité. Nous allons, dans les lignes qui suivent, présenter ces concepts et indiquer les procédures appropriées afin de vérifier la validité des instruments traduits.

La validité de contenu. Cet aspect de la validité s’apprécie par un jugement subjectif d’experts qui considèrent que les items de l’instrument semblent mesurer les aspects qu’il prétend mesurer.

La validité concomitante. Ce type de validité est obtenu lorsqu’un nouvel instrument est fortement corrélé avec un autre instrument qui mesure le ou les mêmes concepts.

Lorsque la version traduite corrèle fortement avec la version originale, elle est réputée avoir gardé sa validité de contenu et sa validité concomitante. Cet exercice suppose que la version originale et la version traduite soient administrées à des sujets bilingues et que l’on mesure leur degré de corrélation. Il faut toutefois s’assurer que les sujets sont effectivement bilingues (voir : Vallerand, 1989) Plusieurs procédures et techniques existent pour vérifier la validité de contenu et la validité concomitante.

La fidélité de la mesure est essentielle afin d’assurer la validité d’un instrument. Ce concept réfère à la consistance interne de l’instrument et à sa stabilité temporelle.

La stabilité temporelle de l’instrument. On s’attend d’un instrument fiable qu’il mesure le même phénomène avec la même précision d’une fois à l’autre. Si les conditions n’ont pas changé, l’instrument devrait produire les mêmes résultats suite à une période de temps. La stabilité temporelle d’un instrument s’établit donc par le degré de corrélation qui existe entre les réponses qu’ont données les mêmes sujets suite à la passation du même instrument à des temps différents. Une corrélation supérieure à 0,60 est habituellement souhaitable. L’intervalle de temps dépend de ce que l’on mesure. En effet, plus les éléments mesurés sont sensibles à des conditions qui risquent d’affecter les réponses, plus court doit être l’intervalle. Habituellement, un intervalle d'un mois apparaît approprié.

La consistance interne de l’instrument. En principe, lorsque le chercheur veut mesurer un phénomène il présentera plusieurs items pour l’appréhender. Même si ces items tentent de mesurer différents aspects du concept, ils devraient en principe être reliés. Afin de mesurer le degré de consistance interne d’un instrument, l’outil statistique recommandé est l’alpha de Cronbach. La valeur de cet alpha peut varier de 0 à 1. Cette valeur est affectée par le nombre d’items de l’instrument et le nombre de répondants. Plus ces deux paramètres sont élevés, plus l’exigence pour la valeur de l’alpha est élevée. Des valeurs entre 0,70 et 0,95 sont habituellement raisonnables lorsque l’échelle ou la sous-échelle a plus de 5 items. Un alpha trop élevé (0,90) peut indiquer une redondance de certains items. Pour apprécier la valeur de l'alpha pour des échelles de moins de 5 items, le lecteur est invité à consulter Gulliksen (1950).

Les lecteurs intéressés à approfondir les concepts de cette section sont invités à consulter Vallerand (1989).

L'adaptation des scores au contexte culturel et le développement de normes

Lorsqu'un instrument est élaboré dans une culture donnée, des normes sont habituellement développées pour permettre de situer un pointage individuel ou la moyenne d'un groupe par rapport à un ensemble de références plus larges. Il est possible que dans la culture pour laquelle l'instrument est traduit, le même phénomène apparaisse avec une intensité, une amplitude ou une fréquence différente. Il est donc important de comparer la distribution des pointages générés par la version traduite avec celle de l'instrument originel. Parmi les indicateurs de base, la moyenne et l'écart-type permettent d'apprécier la variabilité de la mesure. Il est important de vérifier ces indicateurs pour les hommes et les femmes. Des différences importantes dans les moyennes et dans les écarts-types avec la version originelle pourraient signifier : 1- que l'échantillon retenu pose problème, 2- que le phénomène étudié dans la culture cible présente des particularités. Une distribution très différente pourrait suggérer que l'instrument n'est peut-être pas approprié à la culture. Lorsque les différences sont acceptables, il devient important de développer des normes pour la culture cible. Ces normes devraient inclure la moyenne, l'écart-type, les rangs percentilles et les scores Z ou les scores T. Ces derniers permettent de situer les individus sur une échelle d'intervalle. Le choix de la population pour développer des normes dépend de l'objectif de l'instrument. Si l'instrument s'adresse principalement à des personnes présentant des problèmes de santé mentale, l'échantillon choisi devrait refléter cette préoccupation.

Références

Bullinger, M., Anderson,D., Cella, D., Aaronson, N. (1993). Developping and evaluating cross-cultural instruments for minimal requirements to optimal models. Quality of Life Research, 2, 451-459.

Flaherty, J.A., Gavira, M.F., Pathak,D., Mitchell,T., Wintrob, R., Richman, J., Birz, S.(1988). Developping instruments for cross-cultural psychiatric research. Journal of Nervous and Mental Disease, 176 (5) 257-263.

Guillemin,F., Bonbardier,C., Beaton, D. (1993). Cross-cultural adaptation of health-related quality of life measures : litterature review and proposed guidelines. Journal of Clinical Epidemiology, 46 (120), 1417-1432.

Gulliksen, H. (1950). Theory of mental test. NewYork : John Wiley.

Haccoun, R.R. (1987). Une nouvelle technique de vérification de l'équivalence de mesures Psychologiques traduites. Revue québécoise de psychologie, 8 (3), 30-39.

Hunt, S.M., Alonso,J., Bucqet, D., Niero, M., Wiklund, I., McKenna, S. (1991). Cross-cultural adaptation of health mesures. Health Policy, 19, 33-44.

Stevens, J. (1992) Applied multivariate statistics for the social sciences. Hillsdale : Lawrence Erlbraum Associates, Publishers

Vallerand, R.J. (1989). Vers une méthodologie de validation transculturelle de questionnaires psychologiques : implications pour la recherche en langue française. Psychologie Canadienne, 30 (4), 662-689.