Ein binäres Wahlmodell geht von einer latenten Variable Un aus, dem Nutzen (oder Nettonutzen), den die Person n aus der Durchführung einer Handlung (im Gegensatz zur Nichtdurchführung der Handlung) zieht. Der Nutzen, den die Person aus der Durchführung der Handlung zieht, hängt von den Eigenschaften der Person ab, von denen einige vom Forscher beobachtet werden und andere nicht:
U n = β ⋅ s n + ε n {\displaystyle U_{n}={\boldsymbol {\beta }}\cdot \mathbf {s_{n}} +\varepsilon _{n}}
wobei β {\displaystyle {\boldsymbol {\beta }}
eine Menge von Regressionskoeffizienten ist und s n {\displaystyle \mathbf {s_{n}} }
ist eine Menge unabhängiger Variablen (auch als „Merkmale“ bezeichnet), die die Person n beschreiben und entweder diskrete „Dummy-Variablen“ oder reguläre kontinuierliche Variablen sein können. ε n {\displaystyle \varepsilon _{n}}
ist eine Zufallsvariable, die das „Rauschen“ oder den „Fehler“ in der Vorhersage angibt und von der angenommen wird, dass sie nach einer bestimmten Verteilung verteilt ist. Wenn es einen Mittelwert- oder Varianzparameter in der Verteilung gibt, kann dieser normalerweise nicht identifiziert werden, so dass die Parameter auf günstige Werte gesetzt werden – nach Konvention normalerweise Mittelwert 0, Varianz 1.
Die Person ergreift die Handlung, yn = 1, wenn Un > 0. Für den unbeobachteten Term, εn, wird eine logistische Verteilung angenommen.
Die Spezifikation wird kurz und bündig wie folgt geschrieben:
-
- Un = βsn + εn
- Y n = { 1 , wenn U n > 0 , 0 , wenn U n ≤ 0 {\displaystyle Y_{n}={\begin{cases}1,&{\text{if }}U_{n}>0,\\0,&{\text{if }}U_{n}\leq 0\end{cases}}}
- ε ∼ logistisch, standardnormal, usw.
Lassen Sie es uns etwas anders schreiben:
-
- Un = βsn – en
- Y n = { 1 , wenn U n > 0 , 0 , wenn U n ≤ 0 {\displaystyle Y_{n}={\begin{cases}1,&{\text{if }}U_{n}>0,\\0,&{\text{if }}U_{n}\leq 0\end{cases}}}
- e ∼ logistisch, standardnormal, usw.
Hier haben wir die Substitution en = -εn vorgenommen. Dadurch wird aus einer Zufallsvariablen eine etwas andere, die über einen negierten Bereich definiert ist. Zufälligerweise sind die Fehlerverteilungen, die wir üblicherweise betrachten (z.B. logistische Verteilung, Standardnormalverteilung, Standard-Student’s t-Verteilung, usw.) symmetrisch um 0, und daher ist die Verteilung über en identisch mit der Verteilung über εn.
Benennen Sie die kumulative Verteilungsfunktion (CDF) von e {\displaystyle e}
als F e , {\displaystyle F_{e},}
und die Quantilsfunktion (inverse CDF) von e {\displaystyle e}
als F e – 1 . {\displaystyle F_{e}^{-1}.}
Beachte, dass
Pr ( Y n = 1 ) = Pr ( U n > 0 ) = Pr ( β ⋅ s n – e n > 0 ) = Pr ( – e n > – β ⋅ s n ) = Pr ( e n ≤ β ⋅ s n ) = F e ( β ⋅ s n ) {\displaystyle {\begin{aligned}\Pr(Y_{n}=1)&=\Pr(U_{n}>0)\\&=\Pr({\boldsymbol {\beta }}\cdot \mathbf {s_{n}} -e_{n}>0)\\&=\Pr(-e_{n}>-{\boldsymbol {\beta }}\cdot \mathbf {s_{n}} )\\&=\Pr(e_{n}\leq {\boldsymbol {\beta }}\cdot \mathbf {s_{n}} )\\&=F_{e}({\boldsymbol {\beta }}\cdot \mathbf {s_{n}} )\end{aligned}}}
Da Y n {\displaystyle Y_{n}}
ein Bernoulli-Versuch ist, wobei E = Pr ( Y n = 1 ) , {\displaystyle \mathbb {E} =\Pr(Y_{n}=1),}
wir haben E = F e ( β ⋅ s n ) {\displaystyle \mathbb {E} =F_{e}({\boldsymbol {\beta }}\cdot \mathbf {s_{n}} )}
oder gleichwertig
F e – 1 ( E ) = β ⋅ s n . {\displaystyle F_{e}^{-1}(\mathbb {E} )={\boldsymbol {\beta }}\cdot \mathbf {s_{n}} .}
Beachten Sie, dass dies genau dem binomialen Regressionsmodell im Formalismus des verallgemeinerten linearen Modells entspricht.
Wenn e n ∼ N ( 0 , 1 ) , {\displaystyle e_{n}\sim {\mathcal {N}}(0,1),}
d.h. verteilt wie eine Standardnormalverteilung, dann ist Φ – 1 ( E ) = β ⋅ s n {\displaystyle \Phi ^{-1}(\mathbb {E} )={\boldsymbol {\beta }}\cdot \mathbf {s_{n}} }
was genau ein Probit-Modell ist.
Wenn e n ∼ Logistic ( 0 , 1 ) , {\displaystyle e_{n}\sim \operatorname {Logistic} (0,1),}
d.h. als logistische Standardverteilung mit Mittelwert 0 und Skalenparameter 1 verteilt, dann ist die entsprechende Quantilsfunktion die Logitfunktion, und logit ( E ) = β ⋅ s n {\displaystyle \operatorname {logit} (\mathbb {E} )={\boldsymbol {\beta }}\cdot \mathbf {s_{n}} }
was genau ein Logit-Modell ist.
Beachten Sie, dass die beiden unterschiedlichen Formalismen – verallgemeinerte lineare Modelle (GLMs) und diskrete Wahlmodelle – im Fall von einfachen binären Wahlmodellen äquivalent sind, aber auf unterschiedliche Weise erweitert werden können:
- GLMs können problemlos mit beliebig verteilten Antwortvariablen (abhängigen Variablen) umgehen, nicht nur mit kategorialen oder ordinalen Variablen, auf die diskrete Wahlmodelle von Natur aus beschränkt sind. GLMs sind auch nicht auf Verknüpfungsfunktionen beschränkt, die Quantilfunktionen einer bestimmten Verteilung sind, im Gegensatz zur Verwendung einer Fehlervariablen, die annahmegemäß eine Wahrscheinlichkeitsverteilung haben muss.
- Andererseits ist es, da diskrete Wahlmodelle als Typen von generativen Modellen beschrieben werden, konzeptionell einfacher, sie auf komplizierte Situationen mit mehreren, möglicherweise korrelierten Wahlmöglichkeiten für jede Person oder andere Variationen zu erweitern.