サンプリングエラーとは何か、なぜ問題になるのか
サンプリングエラーとは何かを理解するには、まずサンプリングとそれが調査研究で何を意味するかを少し理解する必要があります。 (サンプリングについてすでによく知っている方は、次のセクションまで読み飛ばしてください。)
調査を実施する場合、通常、到達できる範囲よりもはるかに大きなグループの人々に関心があります。
サンプルが公正な代表であることを確認するために、いくつかの調査サンプリングのベストプラクティスに従う必要があります。 おそらく最もよく知られているのは、サンプルサイズを正しく設定することでしょう。 (小さすぎると、サンプルが代表的であることを確認できません)
しかし、サンプリングをうまく行うには、正しいサンプルサイズを得ることよりも重要なことがあります。 このため、サンプリングエラーと非サンプリングエラーの両方を理解し、研究で問題が発生するのを防ぐことが重要です。
正確な結果を得るには、サンプルをどの程度の大きさにすべきかご存知ですか?
非サンプリング エラーとサンプリング エラー:定義
少し紛らわしいのですが、「サンプリング エラー」という言葉は、研究者がサンプルを選択または使用する際に犯したミスを意味するのではありません。 間違った人を選んだり、バイアスをかけたり、参加者が自己選択したり、回答しなかったりすることを予測しなかったりといった問題は、非サンプリングエラーであり、この記事の後半で最悪の犯罪者をいくつか取り上げます。
一方、サンプリング誤差は、サンプルと母集団の平均値の差を意味するので、代表サンプルを使っている場合にのみ発生します。
興味深いことに、定義上、母集団全体の関連データが測定されていないため、調査におけるサンプリング誤差の程度を定量化することは通常できません。
OECD が説明しているように、母集団の方が大きく完全なので、サンプルでは母集団を完全に表すことは決してありません。 この意味で、サンプリングエラーはヒューマンエラーというよりもサンプリングの特徴であり、完全に避けることはできません。
しかし、サンプリングエラーは良い慣行に従うことで絶対に減らすことができます – これについては以下で詳しく説明します。 5つの例
母集団特定エラー(非サンプリング エラー)
このエラーは、調査者が誰を調査すべきか理解していないときに発生します。 例えば、家庭での朝食用シリアルの消費に関する調査を想像してみてください。 誰を調査すればよいのでしょうか。 家族全員かもしれませんし、最も頻繁に食料品の買い物をする人かもしれませんし、子供たちかもしれません。 このような非サンプリングエラーは、アンケートの作成または回答者の選択を始める前に、リサーチクエスチョンを十分に理解することで避けることができます。 典型的なフレームエラーは、1936年のルーズベルトとランドンとの大統領選挙で起こりました。 サンプルフレームは自動車登録と電話帳からでした。 1936年当時、多くのアメリカ人は車も電話も持っておらず、持っている人はほとんど共和党員でした。 その結果、共和党の勝利が誤って予測された。 ある種の人たちだけが回答者リストに現れることを研究者が予期しなかったために、無意識のうちに偏りが生じ、関心のある集団の一部が除外されてしまったのです。 現代の例では、携帯電話の番号を使用するため、高齢者や重度の学習障害を持つ人など、携帯電話を持たない大人をうっかり見逃してしまうことがあります。
フレームエラーは、対象集団以外の回答者が誤って含まれている場合にも起こります。 例えば、ある研究者が全国規模の調査をしているとします。 そのリストは、地理的な地図領域から作成され、誤って外国の領土の小さな一角を含んでいる可能性があります。 また、非ランダムサンプリングエラーとして、研究者側から導入されることもあります。
選択エラーは、参加者を得るために特別な努力をすることで、コントロールすることができます。 典型的な調査のプロセスとしては、調査前の協力要請の連絡から始まり、実際の調査、調査後のフォローアップがある。 回答が得られない場合は、2回目の調査依頼を行い、おそらく電話や個人対個人のような別の方法を使ったインタビューを行います。
非回答(非サンプリングエラー)
非回答エラーは、回答者が回答しなかった人と異なる場合に発生します。 たとえば、新製品を発売する前に市場調査を行っている企業だとします。 既存の顧客は、あなたのことを知っているので、不釣り合いなレベルの参加を得るかもしれませんし、まだあなたから買っていない、より広いプールの人々からの聞き取りを逃すかもしれません。
サンプリングエラー
前述のように、サンプリングエラーは、回答するサンプルの数または代表性のばらつきにより発生します。 サンプリングエラーは、(1)慎重なサンプルデザイン、(2)十分に大きなサンプル(オンラインのサンプルサイズ計算機をチェック)、(3)代表的な回答を保証するための複数回の接触、によって制御・削減することができます。
これらのサンプリングエラーと非サンプリングエラーに注意し、研究においてそれらを回避できるようにしてください。