voor informatie over hetparapsychologisch fenomeen van kennis op afstand, ziepsychometrie.
Psychometrie is het studiegebied dat zich bezighoudt met de theorie en techniek van psychologische metingen, waaronder het meten van kennis, vaardigheden, attitudes en persoonlijkheidskenmerken. Het domein houdt zich voornamelijk bezig met de studie van verschillen tussen individuen. Het omvat twee belangrijke onderzoekstaken, namelijk: – de bouw van meetinstrumenten en-procedures; en (ii) de ontwikkeling en verfijning van theoretische meetmethoden.
Inhoud
- 1Origins en achtergrond
- 2Definition van de meting in de sociale wetenschappen
- 3Instruments en procedures
- 4Theoretical benaderingen
- 4.1 basisbegrippen
- 5See ook
- 6Related artikelen
- 7References
- 7.(1) externe links
oorsprong en achtergrond
veel van het vroege theoretische en toegepaste werk in de psychometrie werd uitgevoerd in een poging intelligentie te meten. De oorsprong van psychometrie heeft connecties met het verwante gebied vanpsychofysica.Charles Spearman, een pionier in psychometrie die benaderingen ontwikkelde voor het meten van intelligentie, studeerde underWilhelm Wundt en werd opgeleid in Psychofysica. De psychometricianL. L. Thurstone ontwikkelde en paste later een theoretische benadering toe voor de meting die wordt aangeduid als de wet van vergelijkend oordeel, een benadering die nauwe verbanden heeft met de psychofysische theorie die door Heinrich Weber en Gustav Fechner werd ontwikkeld. Daarnaast leverden Spearman en Thurstone allebei belangrijke bijdragen aan de theorie en toepassing van de actoranalyse, een statistische methode die uitgebreid is gebruikt in de psychometrie.
meer recentelijk is psychometrische theorie toegepast bij het meten vanpersoonlijkheid, attitudes en overtuigingen, academische prestaties en op gezondheidsgerelateerde gebieden. Het meten van deze niet waarneembare fenomenen is moeilijk, en veel van het onderzoek en de geaccumuleerde kunst in deze discipline is ontwikkeld in een poging om dergelijke fenomenen goed te definiëren en te kwantificeren. Critici, waaronder beoefenaars van de fysica en sociale activisten, hebben betoogd dat een dergelijke definitie en kwantificering onmogelijk moeilijk is, en dat dergelijke metingen vaak worden misbruikt. Voorstanders van psychometrische technieken kunnen echter antwoorden dat hun critici vaak gegevens misbruiken door geen psychometrische criteria toe te passen, en ook dat verschillende kwantitatieve fenomenen in de natuurwetenschappen, zoals hitte en krachten, niet direct kunnen worden waargenomen, maar moeten worden afgeleid uit hun manifestaties.
cijfers die belangrijke bijdragen leverden aan psychometrie zijn onder meerekarl Pearson,L. L. Thurstone,Georg Rasch enarthur Jensen.
definitie van meting in de sociale wetenschappen
de definitie van meting in de sociale wetenschappen is een controversieel onderwerp geweest. Een op dit moment wijdverbreide definitie, voorgesteld doorstanley Smith Stevens (1946), is dat meting is “de toewijzing van cijfers aan objecten of gebeurtenissen volgens een bepaalde regel”. Deze definitie werd geïntroduceerd in het document waarin Stevens vier meetniveaus voorstelde. Hoewel deze definitie op grote schaal wordt aangenomen, verschilt deze in belangrijke opzichten van de meer klassieke definitie van meting die in de natuurwetenschappen wordt aangenomen, namelijk dat meting de numerieke schatting en uitdrukking is van de grootte van de ene grootheid ten opzichte van de andere (Michell, 1997). De definitie van de meting van Stevens werd inderdaad naar voren gebracht in antwoord op de Britse Ferguson-Commissie, waarvan de voorzitter A. Ferguson fysicus was. Het Comité werd in 1932 benoemd door de British Association for the Advancement of Science om de mogelijkheid te onderzoeken om sensorische gebeurtenissen kwantitatief te schatten. Hoewel de voorzitter en andere leden natuurkundigen waren, bestond het Comité ook uit verschillende psychologen. In het verslag van de Commissie wordt gewezen op het belang van de definitie van meting. Het antwoord van Stevens was weliswaar een nieuwe definitie voor te stellen, die op dit gebied van grote invloed is geweest, maar dit was geenszins het enige antwoord op het verslag. Een andere, met name andere, reactie was om de klassieke definitie te accepteren, zoals weergegeven in de volgende verklaring:
meting in de psychologie en de fysica zijn in geen enkele zin verschillend. Natuurkundigen kunnen meten wanneer ze de operaties kunnen vinden waarmee ze aan de noodzakelijke criteria kunnen voldoen; psychologen moeten maar hetzelfde doen. Ze hoeven zich geen zorgen te maken over de mysterieuze verschillen tussen de Betekenis van de meting in de twee wetenschappen (Reese, 1943, p. 49).
deze uiteenlopende reacties komen grotendeels tot uiting in alternatieve meetmethoden. Bijvoorbeeld, methoden gebaseerd op covariantie matrices worden meestal gebruikt op de aanname dat getallen, zoals ruwe scores afgeleid van beoordelingen, metingen zijn. Dergelijke benaderingen impliceren impliciet Stevens ‘ definitie van meting, die alleen vereist dat getallen worden toegekend volgens een bepaalde regel. De voornaamste onderzoekstaak wordt dan ook algemeen beschouwd als het ontdekken van associaties tussen scores en van factoren die aan deze associaties ten grondslag liggen. Aan de andere kant, wanneer meetmodellen zoals het theRasch-model worden gebruikt, worden getallen niet toegewezen op basis van een regel. In plaats daarvan, in overeenstemming met Reese ‘ s verklaring hierboven, worden specifieke criteria voor meting vermeld, en het doel is om procedures of operaties te construeren die gegevens leveren die voldoen aan de relevante criteria. Metingen worden op basis van de modellen geschat en tests worden uitgevoerd om na te gaan of het mogelijk is geweest om aan de relevante criteria te voldoen.
instrumenten en procedures
de eerste psychometrische instrumenten werden ontworpen om het begrip intelligentie te meten. De bekendste historische benadering is de anford-Binet IQ-test, die oorspronkelijk werd ontwikkeld door de Franse PsychologistAlfred Binet. In tegenstelling tot een vrij wijdverbreide misvatting, is er geen overtuigend bewijs dat het mogelijk is om aangeboren intelligentie te meten door middel van dergelijke instrumenten, in de zin van een aangeboren leervermogen onaangetast door ervaring, noch was dit de oorspronkelijke bedoeling toen ze werden ontwikkeld. Niettemin, IQ tests zijn nuttige hulpmiddelen voor verschillende doeleinden. Een alternatieve opvatting van intelligentie is dat cognitieve faciliteiten binnen individuen een manifestatie zijn van een algemene component, of algemene intelligentiefactor, evenals cognitieve capaciteit specifiek voor een bepaald domein.
Psychometrie wordt op grote schaal toegepast in educatieve assessment om vaardigheden te meten in domeinen zoals lezen, schrijven en wiskunde. De belangrijkste benaderingen bij het toepassen van tests in deze domeinen zijn de klassieke Testtheorie en de meer moderne Itemresponstheorie en Rasch-meetmodellen. Deze moderne benaderingen staan gezamenlijke schaling van personen en evaluatiepunten toe, die een basis voor het in kaart brengen van ontwikkelingscontinua verstrekt door beschrijvingen van de vaardigheden toe te staan die op verschillende punten langs een continuüm worden getoond. Dergelijke benaderingen verstrekken krachtige informatie betreffende de aard van ontwikkelingsgroei binnen diverse domeinen.
een andere belangrijke focus in psychometrie is geweest op personaliteitstesten. Er zijn verschillende theoretische benaderingen geweest voor het conceptualiseren en meten van persoonlijkheid. Enkele van de beter bekende instrumenten zijn deinnesota Multiphasic persoonlijkheid inventaris en theMyers-Briggs Type Indicator. Attitudes zijn ook uitgebreid bestudeerd in de psychometrie. Een gemeenschappelijke aanpak voor het meten van attitudes is het gebruik van deikert-schaal. Een alternatieve benadering omvat de toepassing van ontvouwende meetmodellen, de meest algemene is het hyperbolische cosinus Model (Andrich & Luo, 1993).
theoretische benaderingen
psychometrische theorie omvat verschillende verschillende onderzoeksgebieden. In de eerste plaats hebben psychometriërs een grote hoeveelheid theorie ontwikkeld die wordt gebruikt bij de ontwikkeling van mentale tests en de analyse van gegevens die uit deze tests worden verzameld. Dit werk kan grofweg worden onderverdeeld in de klassieke Testtheorie (CTT) en de recentere responstheorie (IRT). Een benadering die vergelijkbaar is met IRT, maar ook heel onderscheidend, in termen van oorsprong en kenmerken, wordt vertegenwoordigd door het Asch model voor meting. De ontwikkeling van het Rasch-model, en de bredere klasse van modellen waartoe het behoort, was expliciet gebaseerd op meetvereisten in de natuurwetenschappen (rasch, 1960).ten tweede hebben psychometriërs methoden ontwikkeld voor het werken met grote matrices van correlaties en covarianties. Technieken in deze algemene traditie omvatten defactor analyse (het vinden van belangrijke onderliggende dimensies in de data),multidimensionale schaling (het vinden van een eenvoudige representatie voor hoogdimensionale data) en data clustering (het vinden van objecten die op elkaar lijken). In deze multivariate beschrijvende methoden proberen gebruikers grote hoeveelheden gegevens te vereenvoudigen. Meer recent,structurele vergelijking modelleren enpath analyse vertegenwoordigen meer geavanceerde benaderingen voor het oplossen van dit probleem van grote covariantie matrices. Deze methoden maken het mogelijk statistisch geavanceerde modellen op de gegevens te monteren en te testen om te bepalen of ze geschikt zijn.
sleutelbegrippen
de belangrijkste traditionele concepten in de klassieke Testtheorie zijn betrouwbaarheid en validiteit. Een betrouwbare maat meet iets consequent, terwijl een geldige maat meet wat het geacht wordt te meten. Een betrouwbare maatregel kan consistent zijn zonder noodzakelijkerwijs geldig te zijn .bijv., een meetinstrument zoals een gebroken liniaal kan altijd onder-meten een hoeveelheid met dezelfde hoeveelheid elke keer (consequent), maar de resulterende hoeveelheid is nog steeds verkeerd, dat wil zeggen ongeldig. Een ander voorbeeld: een betrouwbaar geweer heeft een strakke cluster van kogels in het doel, terwijl een geldig geweer dat cluster rond het midden van het doel zal centreren.
zowel de betrouwbaarheid als de validiteit kunnen wiskundig worden beoordeeld. De interne consistentie kan worden beoordeeld door de prestaties op twee helften van een test te correleren (gesplitste halfbetrouwbaarheid); de waarde van de Pearson product-moment correlatiecoëfficiënt wordt aangepast met de Spearman-Brown voorspellingsformule om overeen te komen met de correlatie tussen twee full-length tests. Andere benaderingen omvatten de intra-klasse correlatie (de verhouding tussen de variantie van metingen van een bepaald doel en de variantie van alle doelen). Een veelgebruikte maat iscronbach ‘ s α, die gelijk is aan het gemiddelde van alle mogelijke splitsings-half coëfficiënten. De stabiliteit over herhaalde metingen wordt beoordeeld met de Pearson-coëfficiënt, evenals de gelijkwaardigheid van verschillende versies van dezelfde meting (verschillende vormen van een intelligentietest, bijvoorbeeld). Er wordt ook gebruik gemaakt van andere maatregelen.
Validiteit kan worden beoordeeld door metingen te correleren met een criterium waarvan bekend is dat ze geldig zijn. Wanneer de criteriummaat wordt verzameld op hetzelfde moment als de te valideren maatregel, is het doel om gelijktijdige validiteit vast te stellen; wanneer het criterium later wordt verzameld, is het doel om predictieve validiteit vast te stellen. Een maat heeft geconstrueerde validiteit als deze gerelateerd is aan andere variabelen zoals vereist door de theorie.Content validity, of face validity, is gewoon een demonstratie dat de items van een test worden getrokken uit het domein dat wordt gemeten; het garandeert niet dat de test daadwerkelijk meet fenomenen in dat domein.
voorspellende of gelijktijdige validiteit mag niet groter zijn dan het kwadraat van de correlatie tussen twee versies van dezelfde maat.
Itemresponstheorie modelleert de relatie tussenlatente kenmerken en responsen op testitems. Het IRT biedt onder andere een basis voor het verkrijgen van een schatting van de locatie van een testnemer op een bepaalde latente eigenschap en de standaardfout bij het meten van die locatie. Zo kan de kennis van de geschiedenis van een universiteitsstudent worden afgeleid uit zijn of haar score op een universitaire toets en vervolgens betrouwbaar worden vergeleken met de kennis van een middelbare scholier afgeleid uit een minder moeilijke toets. Scores afgeleid door de klassieke Testtheorie hebben deze eigenschap niet, en de beoordeling van het werkelijke vermogen (in plaats van het vermogen ten opzichte van andere testnemers) moet worden beoordeeld door de scores te vergelijken met die van anorm groep willekeurig gekozen uit de populatie. In feite zijn alle metingen afgeleid van de klassieke Testtheorie afhankelijk van het geteste monster, terwijl in principe de metingen afgeleid van de itemresponstheorie dat niet zijn.
voor sommigen heeft het gebied van psychometrie controversiële aspecten met betrekking tot de menselijke implicaties van Toegepaste metingen. Voor een deel gaat de controverse over de notie van gestandaardiseerde tests. Voor anderen, de problematische aspecten van psychometrie betrekken de geschiedenis van het veld, die aspecten van eugenics betrekken.
Zie ook:
- Beoordeling
- Item response theorie
- Rasch-model
- Gestandaardiseerde test
- School counseling
- schoolpsycholoog
- Informatie Over Psychometrische Tests
- Instituut voor Toegepast Psychometrics
- Psychometrische Samenleving en Psychometrika homepage
Categorieën:Psychometrics | Applied psychology
|