Model binární volby předpokládá latentní proměnnou Un, tedy užitek (nebo čistý prospěch), který osoba n získá, když provede určitou akci (oproti tomu, když akci neprovede). Užitek, který osoba získá z přijetí akce, závisí na charakteristikách osoby, z nichž některé jsou výzkumníkem pozorovány a některé nikoli:
U n = β ⋅ s n + ε n {\displaystyle U_{n}={\boldsymbol {\beta }}\cdot \mathbf {s_{n}} +\varepsilon _{n}}
kde β {\displaystyle {\boldsymbol {\beta }}}
je soubor regresních koeficientů a s n {\displaystyle \mathbf {s_{n}} }
je soubor nezávislých proměnných (známých také jako „rysy“) popisujících osobu n, které mohou být buď diskrétní „fiktivní proměnné“, nebo regulární spojité proměnné. ε n {\displaystyle \varepsilon _{n}} je soubor nezávislých proměnných (známých také jako „rysy“) popisujících osobu n, které mohou být buď diskrétní „fiktivní proměnné“, nebo regulární spojité proměnné.
je náhodná veličina určující „šum“ nebo „chybu“ v předpovědi, o níž se předpokládá, že je rozdělena podle nějakého rozdělení. Obvykle, pokud v rozdělení existuje střední hodnota nebo parametr rozptylu, nelze je identifikovat, takže parametry jsou nastaveny na vhodné hodnoty – podle konvence obvykle střední hodnota 0, rozptyl 1.
Člověk provede akci, yn = 1, jestliže Un > 0. Předpokládá se, že nepozorovaný člen, εn, má logistické rozdělení.
Specifikace se stručně zapisuje takto:
-
- Un = βsn + εn
- Y n = { 1 , jestliže U n > 0 , 0 , jestliže U n ≤ 0 {\displaystyle Y_{n}={\begin{cases}1,&{\text{if }}U_{n}>0,\\0,&{\text{if }}U_{n}\leq 0\end{cases}}}
- ε ∼ logistický, standardní normální atd.
Zapíšeme to trochu jinak:
-
- Un = βsn – en
- Y n = { 1 , jestliže U n > 0 , 0 , jestliže U n ≤ 0 {\displaystyle Y_{n}={\begin{cases}1,&{\text{if }}U_{n}>0,\\0,&{\text{if }}U_{n}\leq 0\end{cases}}}
- e ∼ logistický, standardní normální atd.
Zde jsme provedli substituci en = -εn. Tím se náhodná veličina změní na trochu jinou, definovanou nad negovaným oborem. Jak už to tak bývá, chybová rozdělení, která obvykle uvažujeme (např. logistické rozdělení, standardní normální rozdělení, standardní Studentovo t-rozdělení atd.), jsou symetrická kolem 0, a proto je rozdělení nad en totožné s rozdělením nad εn.
Poznamenejte kumulativní distribuční funkci (CDF) e {\displayystyle e}.
jako F e , {\displaystyle F_{e},}
a kvantilovou funkci (inverzní CDF) e {\displaystyle e}
jako F e – 1 . {\displaystyle F_{e}^{-1}.}
Poznamenejme, že
Pr ( Y n = 1 ) = Pr ( U n > 0 ) = Pr ( β ⋅ s n – e n > 0 ) = Pr ( – e n > – β ⋅ s n ) = Pr ( e n ≤ β ⋅ s n ) = F e ( β ⋅ s n ) {\displaystyle {\begin{aligned}\Pr(Y_{n}=1)&=\Pr(U_{n}>0)\\&=\Pr({\boldsymbol {\beta }}\cdot \mathbf {s_{n}} -.e_{n}>0)\\&=\Pr(-e_{n}>-{\boldsymbol {\beta }}\cdot \mathbf {s_{n}} )\\&=\Pr(e_{n}\leq {\boldsymbol {\beta }}\cdot \mathbf {s_{n}} )\\&=F_{e}({\boldsymbol {\beta }}\cdot \mathbf {s_{n}} )\end{aligned}}}.
Protože Y n {\displaystyle Y_{n}}
je Bernoulliho pokus, kde E = Pr ( Y n = 1 ) , {\displaystyle \mathbb {E} =\Pr(Y_{n}=1),}
máme E = F e ( β ⋅ s n ) {\displaystyle \mathbb {E} =F_{e}({\boldsymbol {\beta }}\cdot \mathbf {s_{n}} )} }.
nebo ekvivalentně
F e – 1 ( E ) = β ⋅ s n . {\displaystyle F_{e}^{-1}(\mathbb {E} )={\boldsymbol {\beta }}\cdot \mathbf {s_{n}} .}
Všimněte si, že toto je přesně ekvivalentní binomickému regresnímu modelu vyjádřenému ve formalismu zobecněného lineárního modelu.
Pokud e n ∼ N ( 0 , 1 ) , {\displaystyle e_{n}\sim {\mathcal {N}}(0,1),}
tj. rozděleno jako standardní normální rozdělení, pak Φ – 1 ( E ) = β ⋅ s n {\displaystyle \Phi ^{-1}(\mathbb {E} )={\boldsymbol {\beta }}\cdot \mathbf {s_{n}}. }
což je přesně probitový model.
Pokud e n ∼ Logistic ( 0 , 1 ) , {\displaystyle e_{n}\sim \operatorname {Logistic} (0,1),}
tj. rozděleno jako standardní logistické rozdělení se střední hodnotou 0 a parametrem měřítka 1, pak odpovídající kvantilová funkce je funkce logit a logit ( E ) = β ⋅ s n {\displaystyle \operatorname {logit}. (\mathbb {E} )={\boldsymbol {\beta }}\cdot \mathbf {s_{n}} }
což je přesně logitový model.
Všimněte si, že oba různé formalismy – zobecněné lineární modely (GLM) a modely diskrétní volby – jsou v případě jednoduchých binárních modelů volby ekvivalentní, ale lze je rozšířit, pokud se liší:
- GLM mohou snadno pracovat s libovolně rozloženými proměnnými odpovědí (závislými proměnnými), nejen s kategoriálními nebo ordinálními proměnnými, na které jsou modely diskrétní volby ze své podstaty omezeny. GLM také nejsou omezeny na spojovací funkce, které jsou kvantilovými funkcemi nějakého rozdělení, na rozdíl od použití chybové proměnné, která musí mít podle předpokladu pravděpodobnostní rozdělení.
- Na druhé straně, protože modely diskrétní volby jsou popsány jako typy generativních modelů, je koncepčně snazší rozšířit je na komplikované situace s více, případně korelovanými, volbami pro každou osobu nebo jinými variantami.
.