A bináris választási modell feltételez egy látens változót Un, a hasznosságot (vagy nettó hasznot), amelyet n személy kap egy cselekvés megtételéből (szemben a cselekvés meg nem tételével). Az a hasznosság, amelyet a személy a cselekvés megtételéből nyer, a személy jellemzőitől függ, amelyek közül néhányat a kutató megfigyel, néhányat pedig nem:
U n = β ⋅ s n + ε n {\displaystyle U_{n}={\boldsymbol {\beta }}\cdot \mathbf {s_{n}} +\varepsilon _{n}}
hol β {\displaystyle {\boldsymbol {\beta }}}
a regressziós együtthatók halmaza, és s n {\displaystyle \mathbf {s_{n}} }
az n személyt leíró független változók (más néven “jellemzők”) halmaza, amelyek lehetnek diszkrét “dummy-változók” vagy szabályos folytonos változók. ε n {\displaystyle \varepsilon _{n}}
az előrejelzés “zaját” vagy “hibáját” meghatározó véletlen változó, amelyről feltételezzük, hogy valamilyen eloszlás szerint oszlik el. Általában, ha az eloszlásban van egy átlag- vagy szórásparaméter, az nem azonosítható, ezért a paramétereket kényelmes értékekre állítjuk be – a konvenció szerint általában átlag 0, szórás 1.
A személy végrehajtja a cselekvést, yn = 1, ha Un > 0. A megfigyeletlen kifejezésről, εn-ről feltételezzük, hogy logisztikus eloszlású.
A specifikációt röviden így írjuk le:
-
- Un = βsn + εn
- Y n = { 1 , ha U n > 0 , 0 , ha U n ≤ 0 {\displaystyle Y_{n}={\begin{cases}1,&{\text{if }}U_{n}>0,\\\0,&{\text{if }}U_{n}\leq 0\end{cases}}}}
- ε ∼ logisztikus, standard normál stb.
Írjuk ezt egy kicsit másképp:
-
- Un = βsn – en
- Y n = { 1 , ha U n > 0 , 0 , ha U n ≤ 0 {\displaystyle Y_{n}={\begin{cases}1,&{\text{if }}U_{n}>0,\\\0,&{\text{if }}U_{n}\leq 0\end{cases}}}}
- e ∼ logisztikus, standard normál stb.
Itt az en = -εn helyettesítést végeztük el. Ez egy véletlen változót egy kicsit más, negált tartományon definiált véletlen változóvá változtat. Történetesen az általunk általában figyelembe vett hibaeloszlások (pl. logisztikus eloszlás, standard normális eloszlás, standard Student-féle t-eloszlás stb.) 0 körül szimmetrikusak, és így az en feletti eloszlás megegyezik az εn feletti eloszlással.
Megjelöljük e kumulatív eloszlásfüggvényét (CDF) {\displaystyle e}
mint F e , {\displaystyle F_{e},}
és az e {\displaystyle e} kvantilisfüggvényét (inverz CDF) {\displaystyle e}
mint F e – 1 . {\displaystyle F_{e}^{-1}.}
Megjegyezzük, hogy
Pr ( Y n = 1 ) = Pr ( U n > 0 ) = Pr ( β ⋅ s n – e n > 0 ) = Pr ( – e n > – β ⋅ s n ) = Pr ( e n ≤ β β ⋅ s n ) = F e ( β ⋅ s n ) {\displaystyle {\begin{aligned}\Pr(Y_{n}=1)&=\Pr(U_{n}>0)\\\&=\Pr({\boldsymbol {\beta}}\cdot \mathbf {s_{n}} -e_{n}>0)\\&=\Pr(-e_{n}>-{\boldsymbol {\beta }}\cdot \mathbf {s_{n}} )\\\&=\Pr(e_{n}\leq {\boldsymbol {\beta }}\cdot \mathbf {s_{n}} )\\\&=F_{e}({\boldsymbol {\beta }}\cdot \mathbf {s_{n}} )\end{aligned}}}}
Mivel Y n {\displaystyle Y_{n}}}
egy Bernoulli próba, ahol E = Pr ( Y n = 1 ) , {\displaystyle \mathbb {E} =\Pr(Y_{n}=1),}
akkor E = F e ( β ⋅ s n ) {\displaystyle \mathbb {E} =F_{e}({\boldsymbol {\beta }}\cdot \mathbf {s_{n}} )}
vagy egyenértékűen
F e – 1 ( E ) = β ⋅ s n . {\displaystyle F_{e}^{-1}(\mathbb {E} )={\boldsymbol {\beta }}\cdot \mathbf {s_{n}} .}
Megjegyezzük, hogy ez pontosan megegyezik az általánosított lineáris modell formalizmusában kifejezett binomiális regressziós modellel.
Ha e n ∼ N ( 0 , 1 ) , {\displaystyle e_{n}\sim {\mathcal {N}}(0,1),}
azaz. eloszlása standard normális eloszlás, akkor Φ – 1 ( E ) = β ⋅ s n {\displaystyle \Phi ^{-1}(\mathbb {E} )={\boldsymbol {\beta }}\cdot \mathbf {s_{n}}} }
ami pontosan egy probit modell.
Ha e n ∼ Logistic ( 0 , 1 ) , {\displaystyle e_{n}\sim \operatorname {Logistic}} (0,1),}
azaz 0 átlagú és 1 skálaparaméterű standard logisztikus eloszlásként oszlik el, akkor a megfelelő kvantilisfüggvény a logit függvény, és logit ( E ) = β ⋅ s n {\displaystyle \operatorname {logit} (\mathbb {E} )={\boldsymbol {\beta }}\cdot \mathbf {s_{n}} }
ami pontosan egy logit modell.
Megjegyezzük, hogy a két különböző formalizmus – az általánosított lineáris modellek (GLM-ek) és a diszkrét választási modellek – az egyszerű bináris választási modellek esetében egyenértékűek, de eltérő módon bővíthetők:
- A GLM-ek könnyen kezelhetnek tetszőlegesen elosztott válaszváltozókat (függő változókat), nem csak kategorikus változókat vagy ordinális változókat, amelyekre a diszkrét választási modellek természetüknél fogva korlátozódnak. A GLM-ek nem korlátozódnak olyan kapcsolati függvényekre sem, amelyek valamilyen eloszlás kvantilis függvényei, ellentétben a hibaváltozó használatával, amelynek feltételezés szerint valószínűségi eloszlással kell rendelkeznie.
- Másrészt, mivel a diszkrét választási modelleket a generatív modellek típusaként írják le, koncepcionálisan könnyebb kiterjeszteni őket olyan bonyolult helyzetekre, amelyekben az egyes személyek több, esetleg korrelált választást vagy más variációkat tartalmaznak.