1 Psychometric Assessment

Psychometric testsは一世紀にわたって知能テストを支配してきた。 このアプローチの特徴は、その経験的基盤にあります。「サイコメトリー」とは、単に心理的状態/能力の定量的評価のことを指します。 定量的評価は膨大な測定技術の上に成り立っていますが、その起源に反映されるように、その理論的基盤は浅いものです。 現代の知的測定に直接影響を与えた最も古いテストは、フランスのアルフレッド・ビネらの研究から生まれた(Cronbach 1984)。 1904年、ビネは、比較的新しい国民皆保険制度において、教育を受けられる生徒と受けられない生徒を区別する手段を考案するよう指示された。 ビネは、頭蓋、顔面、手掌、手書き文字などの指標を調査し、判断力、理解力、推理力などの複雑な知的作業を直接測定する方法が、生徒の区別に最も適していることを発見した。 このような実用的な始まりに基づき、ビネは知能を「方向を定め、それを維持し、望ましい目的を達成するために適応を行い、自己修正的に業績を監視する能力」と定義した。 929】一般的に、現代の心理テストは、緩やかに定義された知能の構成要素の多様な側面を測定する多様な下位テストから構成されている。 例えば、尺度には、幅広い知識(例えば、物の名前、日付、歴史的・地理的事実)をサンプリングする下位テストや、あらかじめ指定されたデザインに類似したパターンとなるように色のついたブロックを組み立てることを受験者に要求する下位テストが含まれることがある(Sattler 1992)。 ここでも、小試験の選択は、理論的な処方箋に左右されることはありません。 小テストが選択されるのは、小テストを組み合わせることで、個人の知識量や問題解決能力をランク付けすることができるからです。 この実用的な下位検査の選択は、知能を一般的な、あるいは未分化の能力(g)とするBinetの概念に基づいており、原理的には、gを測定するタスクは交換可能である。 規範参照テストは、問題の母集団の代表的なサンプルに対して、標準化された方法で項目を実施することによって開発される。 ノルムサンプルは、性別、地理的地域、民族的地位、コミュニティの規模など、パフォーマンスに異なる影響を与える可能性のある変数について、年齢グループ内で層別化されている限りにおいて、「代表的」であると見なされる。 スコアは、各個人の導き出されたスコアが規範または標準化グループ内での相対的な地位を表すように、尺度化される。 この意味で、心理測定テストは最も純粋な意味での経験的努力である。比較構成要素として、知能の正確な性質について理論化する必要はほとんどないのだ。 当初の意図は、gが包括的に調査されるようにすることであった。 しかし時代とともに、臨床家は知能検査の多課題構成を利用して、個人内の区別を行うようになった(Kaufman 1990)。 評価者は、下位テストまたは下位テスト群間のばらつきを見ることによって、相対的な知的強さと弱さについて仮説を立てた。 たとえば、ある回答者は、記憶力のテストのほうが、概念化を伴うタスクよりも優れていると証明できるかもしれません。 このような比較は、知能構造に関する詳細な理論によってというよりも、どのような下位試験が利用できるかという現実的な問題によって推進されている。 その限界に関しては、実用的に選択された下位テストに基づいて個人内差異を解釈する試みは、経験的に検証されていない(Reschly 1997)。 さらに、課題選択に対する無神論的アプローチにより、知能領域のサンプリングが制限され、不完全なものとなっている(Chen and Gardner 1997)。 例えば、音楽的能力や対人関係能力は軽視されている。 その代わりに、西洋の主流社会で珍重されている学問的学習によって獲得されたスキルが強調されているのである。 したがって、批評家たちは、心理測定テストが達成度以上のものをほとんど測定しないという事実に異議を唱える。 これは、マイノリティグループの受験者が、自分たちとは文脈、価値観、学習経験が異なる規範サンプルと比較されたときに、社会問題となる(Suzuki and Valencia 1997)。 その結果、テストは個人の知的機能に関する客観的なデータを提供するという本来の目的を裏切り、かえって非典型的な受験者を差別するようになる。 相関は、どのような課題が含まれ、どのように重み付けされているかに影響されることがあります。 おそらくもっと大きな問題は、テストスコアが高い相関を示したとしても、テストが異なる標準化グループに基づいて規範化されているという事実のために、同じ個人が異なる測定器で不一致のスコアを獲得することがあるという事実にある。 これもまた、これらの尺度の内容が、知能、脳機能、教育学に関するいかなる理論にも従って選択されていないという事実に起因している。

他の点では、心理測定テストは成功を収めている。 テスト課題は実用的に選択されるが、テストや研究によって驚くほど類似した形で集積され、知能の構造についての洞察を与えている。 下位テストを根本的な共通点に従ってクラスタ化する統計的手法(因子分析)に基づき、知能の3つの層が特定されている(Carrol 1997)。 この因子は、「流動的」な知能と「結晶化された」知能を含む広範な因子の第2層を包含している。 (流動的な知能は、新奇性に対処し、柔軟に思考する能力を含む。 結晶化した知能は、語彙や情報などの宣言的知識の保存と活用に関わる)。 各要素の下には、「帰納」「読解」といった一連の狭い能力が含まれる。 これらの異なるが相互に依存する層の知識は、新しい心理測定機器の構築を導くことができる。

心理測定アプローチのもう一つの強みは、定量的な方法を重視していることに由来する。心理測定者は、テストがパフォーマンスの信頼できる有効な予測因子であることを確認するために努力している(Sattler 1992)。 信頼性」とは測定の一貫性を意味し、測定の信頼性が高ければ高いほど、そこから得られる推定値に含まれる誤差が少なくなります。 多くの心理テストは、非常に高い内部信頼性(テストの各要素スコアがテスト全体のスコアとどの程度相関しているか)と短期の「テスト・リテスト」信頼性(同じグループの個人にテストを2回以上実施することによって得られる安定性の指標)を誇っています。 さらに、IQの長期的な安定性は、20年以上にわたって良好な予測が可能であることが証明されている。 また、IQの長期的な安定性についても、20年以上にわたって良好な予測結果が得られており、テストの有効性が証明されています。 妥当性」とは、テストが測定するために設計されたものをどの程度測定しているかということです。 知能テストの得点は、学校教育の量、学校で作られた作品の質、職業上の地位、および仕事の状況でのパフォーマンス(後者の予測の強さは議論の余地があるが)と、同時および予測的に相関がある。 要約すると、心理測定には重大な限界があるが、この方法は信頼性が高く有効な知的機能の推定値をもたらす。 心理測定テストは,限定された文脈の中で注意深く使用されれば,正確な分類者であり予測者である

コメントを残す

メールアドレスが公開されることはありません。