仮説とは、予測に関する具体的な記述です。 研究で何が起こると予想されるかを(理論的ではなく)具体的な言葉で記述しています。 すべての研究に仮説があるわけではありません。 探索的な研究を目的とする場合もあります(帰納的研究を参照)。 正式な仮説はなく、おそらく研究の目的は、将来の研究で検証できる具体的な仮説や予測を立てるために、ある領域をより徹底的に調査することでしょう。 1 つの研究に 1 つまたは複数の仮説がある場合もあります。実は、私が仮説について話すときはいつでも、実際には 2 つの仮説について同時に考えているのです。 例えば、研究で2つの変数に関係があると予測したとします。 仮説検定を正式に設定する方法は、2つの仮説ステートメントを立てることです。1つはあなたの予測を記述するもの、もう1つは仮説の関係に関して他のすべての可能な結果を記述するものです。 あなたの予測は、変数A
と変数B
が関連しているだろうということです(あなたはそれが正または負の関係であるかどうかを気にしません)。 そうすると、他の可能な結果は、変数A
と変数B
が関連していないことだけになります。 通常、あなたが支持する仮説(あなたの予測)を対立仮説と呼び、残りの可能な結果を記述する仮説を帰無仮説と呼びます。 対立仮説や自分の予測を表すのにHA
やH1
、帰無仮説を表すのにHO
やH0
のような表記をすることもあります。 しかし、ここで注意しなければならないことがあります。 研究によっては、差がない、変化がないという予測もあり得ます。 この場合、あなたは本質的に帰無仮説の支持を見つけようとしており、対立仮説に反対しています。
あなたの予測が方向を指定し、したがって帰無が差のない予測と反対の方向の予測である場合、これを片側仮説と呼びます。 例えば、新入社員研修の効果を調査していて、その成果の1つが「社員の欠勤が減る」と考えている場合を想像してみましょう。 この研究の帰無仮説は、
HO: XYZ社の社員研修プログラムの結果、社員の欠勤率に有意な差はないか、あるいは有意に増加するであろう。
これを対立仮説に対して検定する:
HA: As a result of the XYZ company employee training program, there will be a significant decrease in employee absenteeism.
左図では、この状況をグラフ化して示しています。 対立仮説(プログラムが欠勤率を減少させるというあなたの予測)がそこに示されています。 帰無仮説は、他の2つの可能な条件、つまり、差がない、または欠勤率が増加する、を説明する必要があります。 図は、欠席率の差の仮想的な分布を示しています。 片側」という用語が、結果変数の分布の尾を指していることがわかります。
予測が方向を特定しない場合、「両側仮説がある」という言い方をします。 例えば、うつ病の新薬治療法を研究しているとします。 その薬は初期の動物実験には合格していますが、まだ人間には実験されていません。 あなたは、理論やこれまでの研究に基づいて、この薬には効果があると信じていますが、方向性を仮定して、この薬はうつ病を減らすだろうと言えるほどの自信はありません(結局のところ、有望な薬物治療が登場しても、結局は深刻な副作用があることがわかり、実際に症状が悪化した例を十分すぎるほど見てきているのです)。 この場合、次のように2つの仮説を述べるかもしれません:
この研究の帰無仮説は:
HO:
HA: 300mg./日のABC薬の結果、うつ病に有意な差はない。
これを対立仮説に対して検定する:
右の図はこの場合の両側予想を示しています。 仮説の記述で覚えておくべき重要なことは、予測(方向性があるかないか)を立て、次に最初の仮説の相互排他的で、そのケースに関するすべての可能な代替結果を組み込んだ2番目の仮説を立てるということです。 研究分析が完了したら、2つの仮説のどちらかを選択する必要があるということです。 予測が正しければ、(通常)帰無仮説を棄却し、対立仮説を受け入れることになります。 もしあなたの最初の予測がデータでサポートされなかったら、あなたは帰無仮説を受け入れ、対立仮説を棄却することになります。 仮説検定の論理は、次の 2 つの基本原則に基づいています。
- 一緒になって、すべての可能な結果を網羅する 2 つの相互に排他的な仮説ステートメントの定式化
- 一方が必然的に受け入れられ、他方が拒否されるようにこれらのテスト
OK、これは複雑で厄介、研究質問を行う形式的方法だとわかっています。 しかし、これは仮説演繹モデルと呼ばれる統計学の長い伝統を包含しており、伝統であるがゆえにやらなければならないことがあるのです。 いずれにせよ、この仮説検定のすべてが誰でも理解できるほど簡単だったとしたら、統計学者はどのように雇用を維持すると思いますか?