Psychometrie

1 Psychometrické hodnocení

Psychometrické testy dominují testování inteligence již celé století. Charakteristickým rysem tohoto přístupu je jeho empirický základ; „psychometrický“ jednoduše označuje kvantitativní hodnocení psychologických stavů/schopností. Zatímco kvantitativní hodnocení se opírá o masivní technologii měření, jeho teoretické základy jsou mělké, což se odráží v jeho původu. První testy, které přímo ovlivnily současná intelektuální měření, vznikly na základě studií Alfreda Bineta a jeho kolegů ve Francii (Cronbach 1984). V roce 1904 byl Binet pověřen úkolem vymyslet způsob, jak v relativně novém všeobecném vzdělávacím systému rozlišit vzdělávatelné žáky od nevzdělavatelných. Poté, co zkoumal lebeční, obličejové, dlaňové a rukopisné indexy, objevil Binet přímou míru komplexních intelektuálních úkolů zahrnujících úsudek, porozumění a uvažování, která byla při rozlišování mezi žáky nejúspěšnější. Na základě těchto pragmatických východisek definoval Binet inteligenci jako schopnost přijmout a udržet směr, přizpůsobit se za účelem dosažení požadovaného cíle a sebekorektivně sledovat výkon. S malým upřesněním tato definice dodnes určuje směr psychometrického paradigmatu.

Typicky se moderní psychometrické testy skládají z rozmanitých subtestů, které postihují různé aspekty volně definovaného konstruktu inteligence. Například škály mohou obsahovat subtesty, které zkoumají širokou škálu znalostí (např. názvy předmětů, data, historická a zeměpisná fakta) a vyžadují, aby zkoušený sestavil barevné bloky tak, aby jejich vzor připomínal předem specifikovaný design (Sattler 1992). Výběr subtestů se opět neřídí teoretickým předpisem. Subtesty jsou vybírány proto, že fungují – v kombinaci slouží k hodnocení jednotlivců podle toho, kolik toho vědí a jak jsou dobří v řešení určitých problémů. Pragmatický výběr subtestů vychází z Binetova pojetí inteligence jako obecné nebo nediferencované schopnosti (g), takže úlohy, které využívají g, jsou v zásadě vzájemně zaměnitelné.

Jádro psychometrického testování spočívá v odkazování na normy (Sattler 1992). Testy vztažené k normě vznikají standardizovanou administrací položek reprezentativnímu vzorku dané populace. Normativní vzorek je považován za „reprezentativní“ do té míry, že je v rámci věkových skupin stratifikován na proměnné, které mohou rozdílně ovlivňovat výkon, jako je pohlaví, geografická oblast, etnický status, velikost komunity atd. Skóre jsou škálována tak, aby odvozené skóre každého jednotlivce představovalo relativní postavení v rámci normy nebo standardizační skupiny. V tomto smyslu je psychometrické testování empirickým počinem v nejčistším slova smyslu: jako srovnávací konstrukt není třeba příliš teoretizovat o přesné povaze inteligence.

Jak již bylo zmíněno, většina moderních psychometrických testů obsahuje různorodé úlohy. Původním záměrem bylo zajistit, aby g bylo komplexně zkoumáno. Postupem času však kliničtí lékaři začali využívat víceúlohové konstrukce testů inteligence k intraindividuálnímu rozlišování (Kaufman 1990). Na základě zkoumání variability mezi subtesty nebo skupinami subtestů posuzovatelé vyslovovali hypotézy o relativních intelektuálních silných a slabých stránkách. Například určitý respondent se může ukázat lepší v testech paměti než v úlohách zahrnujících konceptualizaci. Je však důležité poznamenat, že analýza intraindividuálních rozdílů se vyvinula dodatečně; taková srovnání se řídí spíše praktickými možnostmi toho, jaké subtesty jsou k dispozici, než podrobnou teorií o struktuře inteligence.

Empirická základna psychometrického úsilí znamená jak slabinu, tak sílu. Pokud jde o jeho omezení, pokusy o interpretaci intraindividuálních rozdílů na základě výběru pragmaticky zvolených subtestů nebyly empiricky ověřeny (Reschly 1997). Ateoretický přístup k výběru úloh navíc vedl k omezenému a neúplnému výběru vzorku oblasti inteligence (Chen a Gardner 1997). Například hudební a interpersonální schopnosti jsou zanedbávány. Místo toho se klade důraz na dovednosti získané akademickým učením, které je v západních společnostech hlavního proudu ceněno. Kritici proto namítají, že psychometrické testy měří jen o málo více než výsledky; hodnotí to, co se zkoumaný naučil, nikoliv potenciál zkoumaného učit se.

V souvislosti s tímto problémem a umocněným praxí definování individuální inteligence s ohledem na normativní skupinu se objevily otázky týkající se zkreslení v důsledku (sub)kulturních, etnických, životních zkušeností a motivačních rozdílů. To se stává sociálním problémem, když jsou zkoumané osoby z menšinových skupin srovnávány s normovým vzorkem, jehož kontext, hodnoty a zkušenosti s učením jsou odlišné od jejich vlastních (Suzuki a Valencia 1997). Testování se tak zpronevěřuje svému původnímu účelu poskytovat objektivní údaje o intelektuálním fungování jedince a místo toho dochází k diskriminaci atypických zkoumaných osob.

Další potíž s psychometrickými testy spočívá v tom, že ačkoli mezi sebou obvykle vysoce korelují, není tomu tak vždy (Daniel 1997). Korelace mohou být ovlivněny tím, jaké úlohy jsou do testu zařazeny a jak jsou váženy. Možná větší problém spočívá v tom, že i tam, kde výsledky testů vysoce korelují, může tentýž jedinec získat rozdílné výsledky v různých nástrojích v důsledku toho, že testy jsou normovány na různé standardizační skupiny.

Zásadní kritika psychometrických testů spočívá v tom, že se neprokázalo, že by doporučení odvozená z těchto nástrojů zlepšila nápravu zkoušených (Reschly 1997). To lze opět přičíst skutečnosti, že obsah těchto škál nebyl vybrán podle žádné teorie inteligence, fungování mozku nebo pedagogiky.

V jiných ohledech se psychometrické testy setkaly s úspěchem. Ačkoli jsou testové úlohy vybírány pragmaticky, shlukují se v testech a studiích pozoruhodně podobně, což umožňuje nahlédnout do struktury inteligence. Na základě statistických metod, které seskupují subtesty do shluků podle základních společných rysů (faktorová analýza), byly identifikovány tři vrstvy inteligence (Carrol 1997). Nejvyšší vrstvou je obecný faktor g. Tento faktor zahrnuje druhou vrstvu širokých faktorů, včetně „fluidní“ a „krystalizované“ inteligence. (Fluidní inteligence zahrnuje schopnost vyrovnávat se s novinkami a pružně myslet. Krystalizovaná inteligence zahrnuje ukládání a používání deklarativních znalostí, jako je slovní zásoba nebo informace). Pod každým širším faktorem se skrývá soubor užších schopností, jako je „indukce“ a „porozumění textu“. Znalost těchto odlišných, ale vzájemně závislých vrstev může být vodítkem při konstrukci nových psychometrických nástrojů.

Další silná stránka psychometrického přístupu vyplývá z jeho důrazu na kvantitativní metody; psychometrici se snaží zajistit, aby jejich testy byly spolehlivými a platnými prediktory výkonu (Sattler 1992). „Spolehlivost“ se týká konzistence měření; čím spolehlivější je měřítko, tím menší je chyba v odhadech z něj odvozených. Mnoho psychometrických testů se může pochlubit mimořádně vysokou vnitřní spolehlivostí (míra, do jaké koreluje výsledek každé složky testu s výsledkem celého testu) a krátkodobou spolehlivostí „test-retest“ (index stability získaný opakovaným zadáním testu stejné skupině osob). Kromě toho se ukázalo, že dlouhodobá stabilita IQ je impozantní, s dobrými předpověďmi po dobu 20 let. Také validita těchto testů se ukázala jako silná. „Validita“ označuje míru, do jaké test měří to, k čemu byl navržen. Výsledky inteligenčních testů korelují s výší školního vzdělání, kvalitou školní práce, profesním postavením a výkonem v pracovní situaci (i když síla posledně jmenované predikce je sporná), a to jak souběžně, tak prediktivně. Souhrnně lze říci, že ačkoli psychometrické měření má vážná omezení, tento přístup přináší spolehlivé a platné odhady intelektových funkcí. Psychometrické testy jsou přesnými klasifikátory a prediktory, pokud jsou používány s opatrností v omezeném kontextu.

Alai

1 Psychometrické hodnocení

Napsat komentář Zrušit odpověď na komentář