二項選択モデルは、潜在変数Un、すなわち、人nがある行動をとること(行動をとらないことに比べて)から得られる効用(または純便益)を仮定する。 行動をとることによって得られる効用は、その人の特徴に依存し、そのうちのいくつかは研究者によって観察され、いくつかは観察されない。
U n = β・s n + ε n {{displaystyle U{n}= {{\boldsymbol { }} \mathbf {s_{n}} +varepsilon _{n}}.
ここでβ{displaystyle {boldsymbol {thetbeta }}}は{{cdot {cdot {thetbeta {s_{n}}} }}のことです。
is set of regression coefficients and s n {displaystyle \mathbf {s_{n}}} {n} {boldsymbol {beta }} {3559}}は回帰係数のセットである。 }
は人物nを記述する独立変数(「特徴量」ともいう)の集合であり、離散「ダミー変数」または通常の連続変数である。 ε n {displaystyle \varepsilon _{n}}
は予測における「ノイズ」または「誤差」を指定する確率変数で、何らかの分布に従って分布すると仮定する。 通常、分布に平均や分散のパラメータがあっても特定できないので、パラメータは都合の良い値、慣習的に通常は平均0、分散1に設定される。
人はUn > 0ならyn = 1という行動をとる。非観測項εnはロジスティック分布と仮定する。
仕様を簡潔に書くと次のようになる。
-
- Un = βsn + εn
- Y n = { 1 , if U n > 0 , 0 , if U n ≤ 0 {displaystyle Y_{n}={{begin{cases}1,&{{text{if }}U_{n}>0,\0,&{text{if }}U_{n} 0leq }}end{cases}}} {displaystyle Y_{n} = {{begin{cases}1,&{{text{if }}U_{n}0leq }}displaystation
- ε∼ logistic, standard normal などの規格があります。
少し違う書き方をしましょう。
-
- Un = βsn – ja
- Y n = { 1 , if U n > 0 , 0 , if U n ≤ 0 {displaystyle Y_{n}={{begin{cases}1,&{{text{if }}U_{n}>0,\0,&{text{if }}U_{n} leq 0} }end{cases}}}
- e ∼ logistic, standard normal, etc.。
ここで、en = -εnの代入を行いました。 これは確率変数を、否定された領域で定義される、少し異なるものに変えます。 たまたま、私たちが通常考える誤差分布(ロジスティック分布、標準正規分布、標準スチューデントの t-分布など)は 0 について対称であり、したがって en 上の分布は εn 上の分布と同じです。
e {displaystyle e} の累積分布関数 (CDF) を記します。
as F e , {displaystyle F_{e},}
and quantile function of e {displaystyle e} (inverse CDF)。
として、F e – 1 . {displaystyle F_{e}^{-1}.} となります。
なお、
Pr ( Y n = 1 ) = Pr ( U n > 0 ) = Pr ( β・s n – e n > 0 ) = Pr ( – e n > – β・s n ) = Pr ( e n ) ≤ β ⋅ s n ) = F e ( β ⋅ s n ) {displaystyle {begin{aligned}Pr(Y_{n}=1)&=Pr(U_{n}>0)\&=Pr({}boldsymbol {Beta }}cdot \mathbf {s_{n}} – }}} は、”U__{n}”と “s_
Since Y n { Θdisplaystyle Y_{n}}
is Bernoulli trial, where E = Pr ( Y n = 1 ) , {displaystyle \mathbb {E} =entaPr(Y_{n}=1),}
we have E = F e ( β⋅ s n ) {\displaystyle \mathbb {E} =F_{e}({}boldsymbol {}cdot \mathbf {s_{n}} )} } } }。
あるいは同等に
F e – 1 ( E ) = β・s n . (F_{e}^{-1}(\mathbb {E} )={}boldsymbol {beta }}\cdot \mathbf {s_{n}} }。 .}
これは一般化線形モデルの形式式で表した二項回帰モデルと全く同等であることに注意してください。
If e n ∼ N ( 0 , 1 ) , {displaystyle e_{n}sim {Mathcal {N}}(0,1),}
つまり、このモデルは が標準正規分布として分布する場合、Φ – 1 ( E ) = β・s n { {displaystyle \Phi ^{-1}(\mathbb {E} )={boldsymbol {beta }}cdot \mathbf {s_{n}} } } }となる。 }
which is exactly probit model.
If e n ∼ Logistic ( 0 , 1 ) , {}displaystyle e_{n} {sim ###operatname {Logistic}}, {}mathbf {S}}, , if e n ∼ logistic ( 0 , 1 ), {}boldsymbol ЪЪЪЪЪЪ (0,1),}
すなわち平均0、スケールパラメータ1の標準ロジスティック分布として分布し、それに対応する分位関数はロジット関数で logit ( E ) = β⋅ s n {displaystyle \operatorname {logit} . (\mathbb {E} )={}boldsymbol {}beta }}cdot \mathbf {s_{n}}。 }
これはまさにロジットモデルと言えますね。
一般化線形モデル(GLM)と離散選択モデルという2つの異なる形式は、単純な2値選択モデルの場合には同等ですが、異なる方法で拡張できることに注意してください:
- GLM は、離散選択モデルの性質上制限されるカテゴリ変数や順序変数だけではなく、任意分布の応答変数(従属変数)も容易に扱えます。 GLMはまた、確率分布を仮定しなければならない誤差変数の使用とは異なり、ある分布の分位関数であるリンク関数に限定されない。
- 一方、離散選択モデルは生成モデルの一種として記述されるので、各人の選択肢が複数あり、相関があるかもしれないなど、複雑な状況への拡張が概念的に容易である。