Pour des informations sur le phénomène de la parapsychologie de la connaissance à distance, suintsychométrie.
La psychométrie est le domaine d’étude concerné par la théorie et la technique de la mesure psychologique, qui comprend la mesure des connaissances, des capacités, des attitudes et des traits de personnalité. Le domaine s’intéresse principalement à l’étude des différences entre les individus. Il implique deux tâches de recherche majeures, à savoir: (i) la construction d’instruments et de procédures de mesure; et (ii) le développement et le perfectionnement des approches théoriques de la mesure.
Table des matières
- 1origines et contexte
- 2Définition de la mesure en sciences sociales
- 3Instruments et procédures
- 4 Approches théoriques
- 4.1Concepts clés
- 5voir également
- 6 Articles connexes
- 7Références
- 7.1 Liens externes
Origines et contexte
Une grande partie des premiers travaux théoriques et appliqués en psychométrie ont été entrepris dans le but de mesurer l’intelligence. L’origine de la psychométrie a des liens avec le domaine connexe depsychophysique.Charles Spearman, un pionnier de la psychométrie qui a développé des approches de mesure de l’intelligence, a étudié underWilhelm Wundt et a été formé en psychophysique. Le psychométricien. L. Thurstone a ensuite développé et appliqué une approche théorique à la mesure appelée la loi du jugement comparé, une approche qui a des liens étroits avec la théorie psychophysique développée par Heinrich Weber et Gustav Fechner. En outre, Spearman et Thurstone ont tous deux apporté des contributions importantes à la théorie et à l’application de l’analyse des facteurs, une méthode statistique largement utilisée en psychométrie.
Plus récemment, la théorie psychométrique a été appliquée à la mesure de la personnalité, des attitudes et des croyances, des résultats scolaires et dans les domaines liés à la santé. La mesure de ces phénomènes inobservables est difficile, et une grande partie de la recherche et de l’art accumulé dans cette discipline a été développée dans le but de définir et de quantifier correctement ces phénomènes. Les critiques, y compris les praticiens des sciences physiques et les militants sociaux, ont fait valoir qu’une telle définition et quantification est incroyablement difficile et que de telles mesures sont souvent mal utilisées. Les partisans des techniques psychométriques peuvent cependant répondre que leurs critiques abusent souvent des données en n’appliquant pas de critères psychométriques, et que divers phénomènes quantitatifs en sciences physiques, tels que la chaleur et les forces, ne peuvent pas être observés directement mais doivent être déduits de leurs manifestations.
Parmi les personnalités qui ont apporté une contribution significative à la psychométrie, citons Karl Pearson, L. L. Thurstone, Georg Rasch et Arthur Jensen.
Définition de la mesure en sciences sociales
La définition de la mesure en sciences sociales a fait l’objet de controverses. Une définition actuellement répandue, proposée Parstanley Smith Stevens (1946), est que la mesure est « l’attribution de chiffres à des objets ou à des événements selon une règle ». Cette définition a été introduite dans l’article dans lequel Stevens a proposé quatre niveaux de mesure. Bien que largement adoptée, cette définition diffère à des égards importants de la définition plus classique de la mesure adoptée dans toutes les sciences physiques, qui est que la mesure est l’estimation numérique et l’expression de la grandeur d’une grandeur par rapport à une autre (Michell, 1997). En effet, la définition de Stevens de la mesure a été avancée en réponse au Comité Ferguson britannique, dont le président A. Ferguson était un physicien. Le comité a été nommé en 1932 par la British Association for the Advancement of Science pour étudier la possibilité d’estimer quantitativement les événements sensoriels. Bien que son président et d’autres membres soient des physiciens, le comité comprenait également plusieurs psychologues. Le rapport du comité souligne l’importance de la définition de la mesure. Alors que la réponse de Stevens était de proposer une nouvelle définition, qui a eu une influence considérable sur le terrain, ce n’était en aucun cas la seule réponse au rapport. Une autre réponse, particulièrement différente, a été d’accepter la définition classique, comme en témoigne l’énoncé suivant:
La mesure en psychologie et en physique ne sont en aucun cas différentes. Les physiciens peuvent mesurer quand ils peuvent trouver les opérations par lesquelles ils peuvent répondre aux critères nécessaires; les psychologues n’ont qu’à faire de même. Ils n’ont pas besoin de s’inquiéter des différences mystérieuses entre le sens de la mesure dans les deux sciences (Reese, 1943, p. 49).
Ces réponses divergentes se reflètent dans une large mesure dans d’autres approches de mesure. Par exemple, les méthodes basées sur des matrices de covariance sont généralement utilisées en partant du principe que les nombres, tels que les scores bruts dérivés des évaluations, sont des mesures. De telles approches impliquent implicitement la définition de Stevens de la mesure, qui exige seulement que les nombres soient attribués selon une règle quelconque. La principale tâche de recherche est donc généralement considérée comme la découverte d’associations entre les scores et de facteurs supposés sous-tendre de telles associations. D’autre part, lorsque des modèles de mesure tels que le modèle theRasch sont utilisés, les nombres ne sont pas attribués sur la base d’une règle. Au lieu de cela, conformément à la déclaration de Reese ci-dessus, des critères spécifiques de mesure sont énoncés, et l’objectif est de construire des procédures ou des opérations qui fournissent des données qui répondent aux critères pertinents. Les mesures sont estimées sur la base des modèles et des tests sont effectués pour vérifier s’il a été possible de répondre aux critères pertinents.
Instruments et procédures
Les premiers instruments psychométriques ont été conçus pour mesurer le concept d’intelligence. L’approche historique la plus connue concerne le test de QI Stanford-Binet, développé à l’origine par le psychologue français Alfred Binet. Contrairement à une idée fausse assez répandue, il n’existe aucune preuve convaincante qu’il soit possible de mesurer l’intelligence innée à travers de tels instruments, au sens d’une capacité d’apprentissage innée non affectée par l’expérience, et ce n’était pas non plus l’intention initiale lors de leur développement. Néanmoins, les tests de QI sont des outils utiles à diverses fins. Une autre conception de l’intelligence est que les installations cognitives au sein des individus sont la manifestation d’une composante générale, d’un facteur d’intelligence général, ainsi que d’une capacité cognitive spécifique à un domaine donné.
La psychométrie est largement appliquée dans l’évaluation éducative pour mesurer les capacités dans des domaines tels que la lecture, l’écriture et les mathématiques. Les principales approches d’application des tests dans ces domaines ont été la Théorie des tests classique et la Théorie plus moderne de la Réponse aux éléments et les modèles de mesure de Rasch. Ces approches modernes permettent une mise à l’échelle conjointe des personnes et des éléments d’évaluation, ce qui fournit une base pour la cartographie du continua de développement en permettant de décrire les compétences affichées à divers points d’un continuum. De telles approches fournissent des informations puissantes sur la nature de la croissance du développement dans divers domaines.
Un autre axe majeur de la psychométrie a été le test de personnalité. Il existe une gamme d’approches théoriques pour conceptualiser et mesurer la personnalité. Certains des instruments les plus connus incluent l’Inventaire de personnalité Multiphasique d’Innesota et l’Indicateur de type de theMyers-Briggs. Les attitudes ont également été largement étudiées en psychométrie. Une approche commune de la mesure des attitudes est l’utilisation de l’échelle de Nikert. Une approche alternative implique l’application de modèles de mesure de déploiement, le plus général étant le modèle du Cosinus hyperbolique (Andrich &Luo, 1993).
Approches théoriques
La théorie psychométrique implique plusieurs domaines d’étude distincts. Premièrement, les psychométriciens ont développé un vaste corpus de théories utilisées dans le développement de tests mentaux et l’analyse des données collectées à partir de ces tests. Ce travail peut être grossièrement divisé enla théorie classique des tests (CTT) et la théorie de la réponse plus récente (IRT). Une approche similaire à l’IRT, mais également assez distinctive, en termes d’origines et de caractéristiques, est représentée par le modèle de mesure de theRasch. Le développement du modèle de Rasch, et de la classe plus large de modèles à laquelle il appartient, a été explicitement fondé sur les exigences de mesure dans les sciences physiques (Rasch, 1960).
Deuxièmement, les psychométriciens ont développé des méthodes pour travailler avec de grandes matrices de corrélations et de covariances. Les techniques de cette tradition générale comprennent l’analyse factorielle (recherche de dimensions sous-jacentes importantes dans les données), la mise à l’échelle multidimensionnelle (recherche d’une représentation simple pour les données de grande dimension) et le clustering de données (recherche d’objets qui se ressemblent). Dans ces méthodes descriptives multivariées, les utilisateurs essaient de simplifier de grandes quantités de données. Plus récemment, la modélisation d’équations structurelles etl’analyse de trajectoire représentent des approches plus sophistiquées pour résoudre ce problème de grandes matrices de covariance. Ces méthodes permettent d’adapter des modèles statistiquement sophistiqués aux données et de les tester pour déterminer s’ils correspondent à des ajustements adéquats.
Concepts clés
Les concepts clés traditionnels de la théorie des tests classiques sont la fiabilité et la validité. Une mesure fiable mesure quelque chose de manière cohérente, tandis qu’une mesure valide mesure ce qu’elle est censée mesurer. Une mesure fiable peut être cohérente sans nécessairement être valide,.par ex., un instrument de mesure comme une règle cassée peut toujours sous-mesurer une quantité de la même quantité à chaque fois (de manière cohérente), mais la quantité résultante est toujours fausse, c’est-à-dire invalide. Pour un autre exemple, un fusil fiable aura un groupe serré de balles dans la cible, tandis qu’un fusil valide centrera ce groupe autour du centre de la cible.
La fiabilité et la validité peuvent être évaluées mathématiquement. La cohérence interne peut être évaluée en corrélant les performances sur deux moitiés d’un test (fiabilité divisée en deux moitiés); la valeur du coefficient de corrélation produit-moment de Pearson est ajustée avec la formule de prédiction de Pearman-Brown pour correspondre à la corrélation entre deux tests complets. D’autres approches incluent la corrélation intra-classe (le rapport entre la variance des mesures d’une cible donnée et la variance de toutes les cibles). Une mesure couramment utilisée est α de Cronbach, qui est équivalent à la moyenne de tous les coefficients de demi-division possibles. La stabilité sur des mesures répétées est évaluée avec le coefficient de Pearson, de même que l’équivalence de différentes versions d’une même mesure (différentes formes d’un test d’intelligence, par exemple). D’autres mesures sont également utilisées.
La validité peut être évaluée en corrélant des mesures avec une mesure critère connue pour être valide. Lorsque la mesure critère est recueillie en même temps que la mesure en cours de validation, l’objectif est d’établir une validité concurrente; lorsque le critère est recueillie ultérieurement, l’objectif est d’établir une validité prédictive. Une mesure aconstruire la validité si elle est liée à d’autres variables comme l’exige la théorie.La validité du contenu, ou validité du visage, est simplement une démonstration que les éléments d’un test sont tirés du domaine mesuré; cela ne garantit pas que le test mesure réellement des phénomènes dans ce domaine.
La validité prédictive ou concurrente ne peut dépasser le carré de la corrélation entre deux versions d’une même mesure.
La théorie de la réponse aux éléments modélise la relation entre les traits latents et les réponses aux éléments de test. Entre autres avantages, l’IRT fournit une base pour obtenir une estimation de l’emplacement d’un candidat sur un trait latent donné ainsi que l’erreur type de mesure de cet emplacement. Par exemple, les connaissances d’un étudiant universitaire en histoire peuvent être déduites de son score à un test universitaire et ensuite être comparées de manière fiable avec les connaissances d’un étudiant du secondaire déduites d’un test moins difficile. Les scores dérivés de la théorie des tests classiques n’ont pas cette caractéristique, et l’évaluation de la capacité réelle (plutôt que de la capacité par rapport aux autres candidats) doit être évaluée en comparant les scores à ceux d’un groupe de personnes choisies au hasard dans la population. En fait, toutes les mesures dérivées de la théorie des tests classiques dépendent de l’échantillon testé, alors que, en principe, celles dérivées de la théorie de la réponse à l’élément ne le sont pas.
Pour certains, le domaine de la psychométrie présente des aspects controversés relatifs aux implications humaines de la mesure appliquée. La controverse porte en partie sur la notion même de tests standardisés. Pour d’autres, les aspects problématiques de la psychométrie impliquent l’histoire du domaine, qui impliquent des aspects de l’eugénie.
Voir aussi
- Évaluation
- Théorie de la réponse à l’élément
- Modèle de Rasch
- Test standardisé
- Conseil scolaire
- Psychologue scolaire
- Informations Sur les Tests Psychométriques
- Institut de Psychométrie Appliquée
- Société psychométrique et page d’accueil de Psychometrika
Catégories:Psychometrics | Applied psychology
|