AMT Adaptive Matrices Test
L. F. Hornke, S. Etzel und K. Rettig © SCHUHFRIED GmbH
L'AMT et un procédé adaptatif permettant d’effectuer l’évaluation non verbale de l’intelligence générale. Le rapport entre la longueur du test et la précision de mesure est optimal. On obtient des résultats plus précis avec moins d’items.
Utilisation
L’AMT est un procédé non verbal destiné à évaluer l'intelligence globale au sens du raisonnement causal. L’AMT est conçu pour les personnes de plus de 14 ans.
Contexte théorique
Les items ressemblent aux tâches de matrices classiques. Mais contrairement à celles-ci, ils ont été construits sur la base d’un processus rationnel, explicite et psychologiquement fondé, qui repose sur l’analyse détaillée des processus cognitifs utilisés pour résoudre ce genre de tâches. En tout, 289 items ont été réunis, mis au point et évalués au cours de trois explorations importantes à Kattowitz, Moscou et Vienne sur des échantillons volumineux. Les items ont été analysés d'après le modèle de test de Rasch dichotome et probabilistique et les valeurs nominales des items correspondantes ont été estimées (voir Hornke, Küppers et Etzel, 2000). La banque des items qui en résulte rend possible une présentation adaptative du test comportant tous les avantages d'un diagnostic par test moderne et informatisé : durée de passation plus brève et précision améliorée des mesures, motivation élevée du sujet de test en raison d'une sélection de tâches adaptées aux performances.
Réalisation
La présentation des items s'effectue de manière adaptative. Ceci signifie qu’à l’issue d'une phase initiale, au fur et à mesure que le test avancera, le sujet n’aura plus à résoudre que les items dont la difficulté correspond à ses capacités de performances. Sauter une tâche ou retourner à une tâche précédente n'est pas possible. En raison des huit réponses possibles par item, la probabilité de deviner reste minime.
Formes de test
Il existe quatre versions de test, S1, S2, S3 et S11, qui se distinguent par la précision présélectionnée (erreur de mesure standard) de l'évaluation des paramètres personnels et par la difficulté de l’item de départ. L'erreur de mesure standard est réglée pour la version du test S1 sur 0.63, pour S2 sur 0.44, pour S3 sur 0.39 et pour S11 sur 0.63 de manière fixe (cela correspond aux fiabilités .70, .83, .86, .70).
Évaluation
Le résultat du test est une estimation de l'Intelligence générale du sujet de test. L’estimation se fonde sur le modèle de Rasch, selon la méthode du maximum de vraisemblance.
Fiabilité
La fiabilité au sens de la cohérence interne existe en raison de la validité du modèle de Rasch. L'erreur de mesure standard critique est réglée pour les quatre versions du test sur 0.63, 0.44, 0.39 et 0.63 de manière fixe (cela correspond aux fiabilités 0.70, 0.83, 0.86, 0.70). La précision de mesure vaut pour tous les sujets de test à tous les niveaux de l'échelle ; ceci est l'avantage majeur et décisif par rapport aux tests psychométriques habituels qui se basent sur la théorie classique des tests : tous les sujets de test sont évalués avec la même fiabilité !
Validité
D’après Hornke, Etzel & Küppers (2000 ; Hornke, 2002), le rationnel de construction est en corrélation à 0.72 avec les paramètres de difficulté. Par ailleurs, Sommer et Arendasy (2005 ; Sommer, Arendasy & Häusler, 2005) ont prouvé à l’aide d’une analyse confirmatoire de facteurs que cette procédure, combinée à des tests de raisonnement inductif et déductif, charge le facteur d’intelligence fluide (Gf). D’autre part, l’intelligence fluide est déterminée par le facteur d’intelligence chargeant le plus fortement le facteur G. Enfin, des études situées dans le domaine de la psychologie de la circulation et de l’aviation confirment la validité des critères de la procédure.
Normes
Il existe les étalonnages de l'échantillon d'évaluation correspondant à 1356 personnes au total, ainsi qu’un échantillon-témoin de N=461 sujets.