Informationen zum parapsychologischen Phänomen des Fernwissens finden Sie unterpsychometrie.
Psychometrie ist das Studiengebiet, das sich mit der Theorie und Technik derpsychologischen Messung befasst, die die Messung von Wissen, Fähigkeiten, Einstellungen und Persönlichkeitsmerkmalen umfasst. Das Feld befasst sich hauptsächlich mit der Untersuchung von Unterschieden zwischen Individuen. Es umfasst zwei große Forschungsaufgaben, nämlich: (i) den Bau von Instrumenten und Verfahren zur Messung; und (ii) die Entwicklung und Verfeinerung theoretischer Messansätze.
Inhalt
- 1HERKUNFT und Hintergrund
- 2Definition der Messung in den Sozialwissenschaften
- 3Instrumente und Verfahren
- 4theoretische Ansätze
- 4.1Schlüsselkonzepte
- 5siehe auch
- 6verwandte Artikel
- 7Referenzen
- 7.1externe Links
Ursprünge und Hintergrund
Ein Großteil der frühen theoretischen und angewandten Arbeiten in der Psychometrie wurde in einem Versuch unternommen, Intelligenz zu messen. Der Ursprung der Psychometrie hat Verbindungen zum verwandten Gebiet Derpsychophysik.Charles Spearman, ein Pionier der Psychometrie, der Ansätze zur Messung von Intelligenz entwickelte, studierte unterWilhelm Wundt und wurde in Psychophysik ausgebildet. Der psychometricianL. L. Thurstone entwickelte und wandte später einen theoretischen Ansatz für die Messung an, der als das Gesetz des vergleichenden Urteils bezeichnet wird, Ein Ansatz, der enge Verbindungen zur psychophysischen Theorie hat, die vonernst Heinrich Weber undGustav Fechner. Darüber hinaus leisteten Spearman und Thurstone wichtige Beiträge zur Theorie und Anwendung der Faktorenanalyse, einer statistischen Methode, die in der Psychometrie umfassend eingesetzt wurde.In jüngerer Zeit wurde die psychometrische Theorie bei der Messung von Persönlichkeit, Einstellungen und Überzeugungen, akademischen Leistungen und in gesundheitsbezogenen Bereichen angewendet. Die Messung dieser nicht beobachtbaren Phänomene ist schwierig, und ein Großteil der Forschung und der gesammelten Kunst in dieser Disziplin wurde entwickelt, um solche Phänomene richtig zu definieren und zu quantifizieren. Kritiker, einschließlich Praktiker in den Naturwissenschaften und Sozialaktivisten, haben argumentiert, dass eine solche Definition und Quantifizierung unmöglich schwierig ist und dass solche Messungen häufig missbraucht werden. Befürworter psychometrischer Techniken können jedoch antworten, dass ihre Kritiker Daten häufig missbrauchen, indem sie psychometrische Kriterien nicht anwenden, und dass verschiedene quantitative Phänomene in den Naturwissenschaften, wie Hitze und Kräfte, nicht direkt beobachtet werden können, sondern aus ihren Manifestationen abgeleitet werden müssen.
Zu den Persönlichkeiten, die bedeutende Beiträge zur Psychometrie geleistet haben, gehören Karl Pearson, L. L. Thurstone, Georg Rasch undArthur Jensen.
Definition der Messung in den Sozialwissenschaften
Die Definition der Messung in den Sozialwissenschaften war ein kontroverses Thema. Eine derzeit weit verbreitete Definition, vorgeschlagen vonstanley Smith Stevens (1946), ist, dass Messung „die Zuordnung von Zahlen zu Objekten oder Ereignissen nach einer Regel“ ist. Diese Definition wurde in dem Papier eingeführt, in dem Stevens vier vorschlugebenen der Messung. Obwohl diese Definition weit verbreitet ist, unterscheidet sie sich in wichtiger Hinsicht von der klassischeren Definition der Messung, die in den Naturwissenschaften angewendet wird, nämlich dass die Messung die numerische Schätzung und der Ausdruck der Größe einer Größe relativ zu einer anderen ist (Michell, 1997). In der Tat wurde Stevens ‚Definition der Messung als Antwort auf das britische Ferguson-Komitee vorgelegt, dessen Vorsitzender A. Ferguson Physiker war. Das Komitee wurde 1932 von der British Association for the Advancement of Science ernannt, um die Möglichkeit einer quantitativen Schätzung sensorischer Ereignisse zu untersuchen. Obwohl der Vorsitzende und andere Mitglieder Physiker waren, bestand das Komitee auch aus mehreren Psychologen. Der Bericht des Ausschusses hob die Bedeutung der Definition der Messung hervor. Während Stevens ‚Antwort darin bestand, eine neue Definition vorzuschlagen, die auf diesem Gebiet erheblichen Einfluss hatte, war dies keineswegs die einzige Antwort auf den Bericht. Eine andere, bemerkenswert andere Antwort war die Annahme der klassischen Definition, wie sich in der folgenden Aussage widerspiegelt:
Messung in Psychologie und Physik unterscheiden sich in keiner Weise. Physiker können messen, wann sie die Operationen finden können, durch die sie die notwendigen Kriterien erfüllen können; Psychologen müssen nur das Gleiche tun. Sie brauchen sich keine Sorgen über die mysteriösen Unterschiede zwischen der Bedeutung der Messung in den beiden Wissenschaften zu machen (Reese, 1943, S. 49).
Diese divergierenden Reaktionen spiegeln sich in hohem Maße in alternativen Messansätzen wider. Beispielsweise werden Methoden, die auf Kovarianzmatrizen basieren, typischerweise unter der Prämisse eingesetzt, dass Zahlen, wie z. B. aus Bewertungen abgeleitete Rohwerte, Messungen sind. Solche Ansätze beinhalten implizit Stevens ‚Definition der Messung, die nur erfordert, dass Zahlen nach einer bestimmten Regel zugewiesen werden. Die Hauptforschungsaufgabe, dann, wird allgemein als die Entdeckung von Assoziationen zwischen Partituren angesehen, und von Faktoren, die solchen Assoziationen zugrunde liegen. Wenn andererseits Messmodelle wie das Rasch-Modell verwendet werden, werden Nummern nicht auf der Grundlage einer Regel zugewiesen. Stattdessen werden in Übereinstimmung mit Reeses obiger Aussage spezifische Kriterien für die Messung angegeben, und das Ziel besteht darin, Verfahren oder Operationen zu konstruieren, die Daten liefern, die die relevanten Kriterien erfüllen. Die Messungen werden anhand der Modelle geschätzt, und es werden Tests durchgeführt, um festzustellen, ob die relevanten Kriterien erfüllt werden konnten.
Instrumente und Verfahren
Die ersten psychometrischen Instrumente wurden entwickelt, um das Konzept der Intelligenz zu messen. Der bekannteste historische Ansatz beinhaltet dieStanford-Binet IQ-Test, ursprünglich vom französischen Psychologen Entwickeltalfred Binet. Entgegen einem weit verbreiteten Missverständnis gibt es keine zwingenden Beweise dafür, dass es möglich ist, angeborene Intelligenz durch solche Instrumente im Sinne einer angeborenen Lernfähigkeit zu messen, die von der Erfahrung unberührt bleibt, und dies war auch nicht die ursprüngliche Absicht, als sie entwickelt wurden. Dennoch sind IQ-Tests nützliche Werkzeuge für verschiedene Zwecke. Eine alternative Vorstellung von Intelligenz ist, dass kognitive Einrichtungen innerhalb von Individuen eine Manifestation einer allgemeinen Komponente, eines allgemeinen Intelligenzfaktors, sowie kognitiver Fähigkeiten sind, die für einen bestimmten Bereich spezifisch sind.
Psychometrie wird in der pädagogischen Beurteilung weit verbreitet angewendet, um Fähigkeiten in Bereichen wie Lesen, Schreiben und Mathematik zu messen. Die Hauptansätze bei der Anwendung von Tests in diesen Bereichen waren die klassische Testtheorie und die modernere Item-Response-Theorie und Rasch-Messmodelle. Diese modernen Ansätze ermöglichen eine gemeinsame Skalierung von Personen und Bewertungselementen, Dies bietet eine Grundlage für die Abbildung von Entwicklungskontinuien, indem Beschreibungen der an verschiedenen Punkten entlang eines Kontinuums angezeigten Fähigkeiten ermöglicht werden. Solche Ansätze liefern aussagekräftige Informationen über die Art des Entwicklungswachstums in verschiedenen Bereichen.
Ein weiterer Schwerpunkt in der Psychometrie lag auf Persönlichkeitstests. Es gab eine Reihe theoretischer Ansätze zur Konzeptualisierung und Messung der Persönlichkeit. Zu den bekannteren Instrumenten gehören theMinnesota Multiphasic Personality Inventory und theMyers-Briggs Type Indicator. Einstellungen wurden auch in der Psychometrie ausführlich untersucht. Ein gängiger Ansatz zur Messung von Einstellungen ist die Verwendung derikert-Skala. Ein alternativer Ansatz beinhaltet die Anwendung von Entfaltungsmessmodellen, wobei das hyperbolische Kosinusmodell am allgemeinsten ist (Andrich & Luo, 1993).
Theoretische Ansätze
Die psychometrische Theorie umfasst mehrere verschiedene Studienbereiche. Erstens haben Psychometriker eine große Menge an Theorie entwickelt, die bei der Entwicklung von mentalen Tests und der Analyse der aus diesen Tests gesammelten Daten verwendet wird. Diese Arbeit kann grob in die klassische Testtheorie (CTT) und die neuere Testantworttheorie (IRT) unterteilt werden. Ein Ansatz, der dem IRT ähnelt, aber auch in Bezug auf seine Ursprünge und Merkmale sehr unterschiedlich ist, wird durch das RASCH-Modell für die Messung dargestellt. Die Entwicklung des Rasch-Modells und der breiteren Klasse von Modellen, zu denen es gehört, beruhte ausdrücklich auf Anforderungen der Messung in den Naturwissenschaften (Rasch, 1960).Zweitens haben Psychometriker Methoden entwickelt, um mit großen Korrelations- und Kovarianzmatrizen zu arbeiten. Techniken in dieser allgemeinen Tradition umfassen Faktorenanalyse (Finden wichtiger zugrunde liegender Dimensionen in den Daten), mehrdimensionale Skalierung (Finden einer einfachen Darstellung für hochdimensionale Daten) und Datenclustering (Finden von Objekten, die einander ähnlich sind). Bei diesen multivariaten deskriptiven Methoden versuchen Benutzer, große Datenmengen zu vereinfachen. In jüngerer Zeit Strukturgleichungsmodellierung undpfad-Analyse stellen anspruchsvollere Ansätze zur Lösung dieses Problems großer Kovarianzmatrizen dar. Mit diesen Methoden können statistisch anspruchsvolle Modelle an Daten angepasst und getestet werden, um festzustellen, ob sie angemessen sind.
Schlüsselkonzepte
Die wichtigsten traditionellen Konzepte in der klassischen Testtheorie Sindzuverlässigkeit Undvalidität. Ein zuverlässiges Maß misst etwas konsistent, während ein gültiges Maß misst, was es messen soll. Eine zuverlässige Maßnahme kann konsistent sein, ohne notwendigerweise gültig zu sein, .beispielsweise., ein Maßinstrument wie ein gebrochenes Lineal kann eine Menge jedes Mal (konsequent) immer um den gleichen Betrag untermessen, aber die resultierende Menge ist immer noch falsch, dh ungültig. Für ein anderes Beispiel hat ein zuverlässiges Gewehr eine enge Gruppe von Kugeln im Ziel, während ein gültiges Gewehr diese Gruppe um die Mitte des Ziels zentriert.
Sowohl die Zuverlässigkeit als auch die Validität können mathematisch beurteilt werden. Die interne Konsistenz kann durch Korrelation der Leistung in zwei Hälften eines Tests beurteilt werden (Split-Half-Zuverlässigkeit); der Wert des Korrelationskoeffizienten Produkt-Moment von Pearson wird mit der Vorhersageformel von Pearman-Brown so angepasst, dass er der Korrelation zwischen zwei Tests in voller Länge entspricht. Andere Ansätze umfassen die klasseninterne Korrelation (das Verhältnis der Varianz der Messungen eines bestimmten Ziels zur Varianz aller Ziele). Ein häufig verwendetes Maß Istcronbachs α, das dem Mittelwert aller möglichen Split-Half-Koeffizienten entspricht. Die Stabilität gegenüber wiederholten Messungen wird mit dem Pearson-Koeffizienten bewertet, ebenso wie die Äquivalenz verschiedener Versionen desselben Maßes (z. B. verschiedene Formen eines Intelligenztests). Andere Maßnahmen werden ebenfalls angewendet.
Die Validität kann beurteilt werden, indem Maßnahmen mit einem als gültig bekannten Kriteriumsmaß korreliert werden. Wenn die Kriterienkennzahl gleichzeitig mit der zu validierenden Kennzahl erfasst wird, besteht das Ziel darin, die gleichzeitige Gültigkeit festzustellen. Ein Maß hasconstruct Gültigkeit, wenn es auf andere Variablen bezogen ist, wie von der Theorie erforderlich.Inhaltsvalidität oder Gesichtsvalidität ist einfach eine Demonstration, dass die Elemente eines Tests aus dem zu messenden Bereich stammen; Es garantiert nicht, dass der Test tatsächlich Phänomene in diesem Bereich misst.
Die prädiktive oder gleichzeitige Gültigkeit darf das Quadrat der Korrelation zwischen zwei Versionen derselben Kennzahl nicht überschreiten.
Item response theory modelliert die Beziehung zwischenlatente Merkmale und Antworten auf Testobjekte. Neben anderen Vorteilen bietet IRT eine Grundlage, um eine Schätzung des Standorts eines Testteilnehmers für ein bestimmtes latentes Merkmal sowie den Standardmessfehler dieses Standorts zu erhalten. Beispielsweise kann das Geschichtswissen eines Universitätsstudenten aus seiner Punktzahl bei einem Universitätstest abgeleitet und dann zuverlässig mit dem Wissen eines Gymnasiasten verglichen werden, das aus einem weniger schwierigen Test abgeleitet wurde. Die von der klassischen Testtheorie abgeleiteten Punktzahlen weisen diese Eigenschaft nicht auf, und die Beurteilung der tatsächlichen Fähigkeiten (und nicht der Fähigkeiten im Vergleich zu anderen Testteilnehmern) muss durch Vergleich der Punktzahlen mit denen einer aus der Grundgesamtheit zufällig ausgewählten Altersgruppe beurteilt werden. Tatsächlich sind alle aus der klassischen Testtheorie abgeleiteten Maßnahmen von der getesteten Probe abhängig, während diejenigen, die aus der Item-Response-Theorie abgeleitet sind, dies im Prinzip nicht tun.Für einige hat das Gebiet der Psychometrie kontroverse Aspekte in Bezug auf die menschlichen Implikationen der angewandten Messung. Zum Teil geht es bei der Kontroverse um den Begriff standardisierter Tests. Für andere beinhalten die problematischen Aspekte der Psychometrie die Geschichte des Feldes, die Aspekte der Eugenik beinhalten.
Siehe auch
- Assessment
- Item response theory
- Rasch-Modell
- Standardisierter Test
- Schulberatung
- Schulpsychologe
- Informationen zu psychometrischen Tests
- Institut für Angewandte Psychometrie
- Psychometrische Gesellschaft und Psychometrika Homepage
Kategorien:Psychometrics | Applied psychology
|