Para obtener información sobre el fenómeno de la psicología del conocimiento a distancia, consulte psicometría.
La psicometría es el campo de estudio relacionado con la teoría y la técnica de la medición psicológica, que incluye la medición de conocimientos, habilidades, actitudes y rasgos de personalidad. El campo se ocupa principalmente del estudio de las diferencias entre individuos. Se trata de dos grandes tareas de investigación, a saber: i) la construcción de instrumentos y procedimientos de medición; y ii) el desarrollo y perfeccionamiento de enfoques teóricos de la medición.
Contenido
- 1Origins y de fondo
- 2Definition de la medición en las ciencias sociales
- 3Instruments y procedimientos
- 4Theoretical enfoques
- 4.1 conceptos Clave
- 5See también
- 6Related artículos
- 7References
- 7.1enlaces externos
Orígenes y antecedentes
Gran parte del trabajo teórico y aplicado temprano en psicometría se realizó en un intento de medir la inteligencia. El origen de la psicometría tiene conexiones con el campo relacionado de la psicofísica.Charles Spearman, un pionero en psicometría que desarrolló enfoques para la medición de la inteligencia, estudió underWilhelm Wundt y se entrenó en psicofísica. El psicometrista. L. Thurstone más tarde desarrolló y aplicó un enfoque teórico a la medición conocida como la ley de juicio comparativo, un enfoque que tiene estrechas conexiones con la teoría psicofísica desarrollada por Ernst Heinrich Weber y Austav Fechner. Además, Spearman y Thurstone hicieron importantes contribuciones a la teoría y aplicación del análisis de factores, un método estadístico que se ha utilizado ampliamente en psicometría.
Más recientemente, la teoría psicométrica se ha aplicado en la medición de la personalidad, actitudes y creencias, logros académicos y en campos relacionados con la salud. La medición de estos fenómenos no observables es difícil, y gran parte de la investigación y el arte acumulado en esta disciplina se ha desarrollado en un intento de definir y cuantificar adecuadamente tales fenómenos. Los críticos, incluidos los profesionales de las ciencias físicas y los activistas sociales, han argumentado que tal definición y cuantificación es imposiblemente difícil, y que tales mediciones a menudo se usan incorrectamente. Los defensores de las técnicas psicométricas pueden responder, sin embargo, que sus críticos a menudo abusan de los datos al no aplicar criterios psicométricos, y también que varios fenómenos cuantitativos en las ciencias físicas, como el calor y las fuerzas, no pueden observarse directamente, sino que deben inferirse de sus manifestaciones.
Las figuras que hicieron contribuciones significativas a la psicometría incluyen a Karl Pearson, L. L. Thurstone, Georg Rasch y Arthur Jensen.
Definición de medición en las ciencias sociales
La definición de medición en las ciencias sociales ha sido un tema controvertido. Una definición actualmente extendida, propuesta Porstanley Smith Stevens (1946), es que la medición es «la asignación de números a objetos o eventos de acuerdo con alguna regla». Esta definición se introdujo en el artículo en el que Stevens propuso cuatro niveles de medición. Aunque ampliamente adoptada, esta definición difiere en aspectos importantes de la definición más clásica de medición adoptada en todas las ciencias físicas, que es que la medición es la estimación numérica y la expresión de la magnitud de una cantidad en relación con otra (Michell, 1997). De hecho, la definición de medición de Stevens se presentó en respuesta al Comité Ferguson británico, cuyo presidente A. Ferguson era físico. El comité fue nombrado en 1932 por la Asociación Británica para el Avance de la Ciencia para investigar la posibilidad de estimar cuantitativamente eventos sensoriales. Aunque su presidente y otros miembros eran físicos, el comité también estaba integrado por varios psicólogos. En el informe del Comité se destaca la importancia de la definición de medición. Mientras que Stevens respuesta fue proponer una nueva definición, que ha tenido una influencia considerable en el campo, esto no era la única respuesta al informe. Otra respuesta, notablemente diferente, fue aceptar la definición clásica, como se refleja en la siguiente declaración:
La medición en psicología y física no son en ningún sentido diferentes. Los físicos pueden medir cuándo pueden encontrar las operaciones por las que pueden cumplir con los criterios necesarios; los psicólogos no tienen más que hacer lo mismo. No necesitan preocuparse por las misteriosas diferencias entre el significado de la medición en las dos ciencias (Reese, 1943, p. 49).
Estas respuestas divergentes se reflejan en gran medida en enfoques alternativos de medición. Por ejemplo, los métodos basados en matrices de covarianza se emplean típicamente en la premisa de que los números, como las puntuaciones brutas derivadas de las evaluaciones, son mediciones. Estos enfoques implican implícitamente la definición de medición de Stevens, que solo requiere que los números se asignen de acuerdo con alguna regla. La principal tarea de investigación, por lo tanto, se considera generalmente que es el descubrimiento de asociaciones entre puntajes y de factores postulados para sustentar tales asociaciones. Por otro lado, cuando se emplean modelos de medición como el modelo theRasch, los números no se asignan en función de una regla. En cambio, de acuerdo con la declaración anterior de Reese, se establecen criterios específicos para la medición, y el objetivo es construir procedimientos u operaciones que proporcionen datos que cumplan con los criterios relevantes. Las mediciones se calculan sobre la base de los modelos y se realizan pruebas para determinar si ha sido posible cumplir los criterios pertinentes.
Instrumentos y procedimientos
Los primeros instrumentos psicométricos fueron diseñados para medir el concepto de inteligencia. El enfoque histórico más conocido incluye la prueba de coeficiente intelectual de Banford-Binet, desarrollada originalmente por el psicólogo francés Fred Binet. Contrariamente a una idea errónea bastante extendida, no hay evidencia convincente de que sea posible medir la inteligencia innata a través de tales instrumentos, en el sentido de una capacidad de aprendizaje innata no afectada por la experiencia, ni era esta la intención original cuando se desarrollaron. Sin embargo, las pruebas de coeficiente intelectual son herramientas útiles para varios propósitos. Una concepción alternativa de la inteligencia es que las instalaciones cognitivas dentro de los individuos son una manifestación de un componente general, un factor de inteligencia general, así como de la capacidad cognitiva específica de un dominio dado.
La psicometría se aplica ampliamente en la evaluación educativa para medir las habilidades en dominios como la lectura, la escritura y las matemáticas. Los principales enfoques en la aplicación de pruebas en estos dominios han sido la Teoría de Pruebas Clásica y la Teoría de Respuesta de Ítems más moderna y los modelos de medición Rasch. Estos enfoques modernos permiten el escalado conjunto de personas y elementos de evaluación, lo que proporciona una base para el mapeo de la continuidad del desarrollo al permitir descripciones de las habilidades mostradas en varios puntos a lo largo de un continuo. Estos enfoques proporcionan información poderosa sobre la naturaleza del crecimiento del desarrollo dentro de varios dominios.
Otro enfoque importante en psicometría han sido las pruebas de personalización. Ha habido una serie de enfoques teóricos para conceptualizar y medir la personalidad. Algunos de los instrumentos más conocidos incluyen el Inventario de Personalidad Multifásica de Innesota y el Indicador de tipo deyers-Briggs. Las actitudes también se han estudiado ampliamente en psicometría. Un enfoque común para la medición de las actitudes es el uso de la escala de alerta rápida. Un enfoque alternativo implica la aplicación de modelos de medición desplegables, el más general es el Modelo de Coseno Hiperbólico (Andrich & Luo, 1993).
Aproximaciones teóricas
La teoría psicométrica involucra varias áreas de estudio distintas. En primer lugar, los psicometristas han desarrollado un gran cuerpo de teoría que se utiliza en el desarrollo de pruebas mentales y el análisis de los datos recopilados a partir de estas pruebas. Este trabajo se puede dividir aproximadamente en teoría de pruebas clásicas (CTT, por sus siglas en inglés) y en la teoría de respuesta de respuesta más reciente (IRT, por sus siglas en inglés). Un enfoque que es similar a la IRT, pero también bastante distintivo, en términos de sus orígenes y características, está representado por el modelo de medición de theRasch. El desarrollo del modelo de Rasch, y la clase más amplia de modelos a los que pertenece, se basó explícitamente en los requisitos de medición en las ciencias físicas (Rasch, 1960).
En segundo lugar, los psicometristas han desarrollado métodos para trabajar con matrices grandes de correlaciones y covarianzas. Las técnicas en esta tradición general incluyen el análisis de factores (encontrar dimensiones subyacentes importantes en los datos),el escalado multidimensional (encontrar una representación simple para datos de alta dimensión) y la agrupación de datos (encontrar objetos que son similares entre sí). En estos métodos descriptivos multivariantes, los usuarios intentan simplificar grandes cantidades de datos. Más recientemente, el modelado de ecuaciones estructurales y el análisis de trayectorias representan enfoques más sofisticados para resolver este problema de matrices de covarianza grandes. Estos métodos permiten ajustar a los datos modelos estadísticamente sofisticados y probarlos para determinar si son adecuados.
Conceptos clave
Los conceptos tradicionales clave en la teoría de pruebas clásica son fiabilidad y validez. Una medida confiable es medir algo de manera consistente, mientras que una medida válida es medir lo que se supone que debe medir. Una medida fiable puede ser coherente sin ser necesariamente válida, .e. g., un instrumento de medición como una regla rota siempre puede medir una cantidad por la misma cantidad cada vez (consistentemente), pero la cantidad resultante sigue siendo incorrecta, es decir, no válida. Por otro ejemplo, un rifle confiable tendrá un grupo apretado de balas en el objetivo, mientras que uno válido centrará ese grupo alrededor del centro del objetivo.
Tanto la fiabilidad como la validez pueden evaluarse matemáticamente. La consistencia interna puede evaluarse correlacionando el rendimiento en dos mitades de un ensayo (fiabilidad dividida por la mitad); el valor del coeficiente de correlación entre el producto y el momento de las pruebas se ajusta con la fórmula de predicción de Espearman-Brown para corresponder a la correlación entre dos pruebas de duración completa. Otros enfoques incluyen la correlación intraclase (la relación de varianza de las mediciones de un objetivo dado con la varianza de todos los objetivos). Una medida comúnmente utilizada es α de Cronbach, que es equivalente a la media de todos los coeficientes de división de la mitad posibles. La estabilidad sobre medidas repetidas se evalúa con el coeficiente de Pearson, al igual que la equivalencia de diferentes versiones de la misma medida (diferentes formas de una prueba de inteligencia, por ejemplo). También se utilizan otras medidas.
La validez puede evaluarse correlacionando las medidas con una medida de criterio conocida como válida. Cuando la medida de criterio se recoge al mismo tiempo que la medida que se está validando, el objetivo es establecer la validez concurrente; cuando el criterio se recoge más tarde, el objetivo es establecer la validez predictiva. Una medida construye validez si está relacionada con otras variables como lo requiere la teoría.La validez de contenido, o validez de cara, es simplemente una demostración de que los elementos de una prueba se extraen del dominio que se está midiendo; no garantiza que la prueba realmente mida fenómenos en ese dominio.
La validez predictiva o concurrente no puede exceder el cuadrado de la correlación entre dos versiones de la misma medida.
La teoría de respuesta de ítems modela la relación entre los rasgos latentes y las respuestas a los ítems de prueba. Entre otras ventajas, la IRT proporciona una base para obtener una estimación de la ubicación de un examinador en un rasgo latente dado, así como el error estándar de medición de esa ubicación. Por ejemplo, el conocimiento de historia de un estudiante universitario puede deducirse de su puntaje en un examen universitario y luego compararse de manera confiable con el conocimiento de un estudiante de secundaria deducido de un examen menos difícil. Los puntajes derivados de la teoría clásica de los exámenes no tienen esta característica, y la evaluación de la capacidad real (en lugar de la capacidad relativa a otros candidatos a los exámenes) debe evaluarse comparando los puntajes con los del grupo anorm seleccionado aleatoriamente de la población. De hecho, todas las medidas derivadas de la teoría de pruebas clásica dependen de la muestra analizada, mientras que, en principio, las derivadas de la teoría de respuesta de ítems no lo son.
Para algunos, el campo de la psicometría tiene aspectos controvertidos relacionados con las implicaciones humanas de la medición aplicada. En parte, la controversia involucra la noción misma de pruebas estandarizadas. Para otros, los aspectos problemáticos de la psicometría involucran la historia del campo, que involucra aspectos de la eugenesia.
Ver también
- Evaluación
- Teoría de respuesta de ítems
- Modelo Rasch
- Prueba estandarizada
- Asesoramiento escolar
- Psicólogo escolar
- Información sobre Pruebas Psicométricas
- Instituto de Psicometría Aplicada
Categorías:Psychometrics | Applied psychology
|