Um modelo de escolha binomial assume uma variável latente Un, a utilidade (ou benefício líquido) que a pessoa n obtém ao tomar uma ação (ao contrário de não tomar a ação). A utilidade que a pessoa obtém ao tomar a ação depende das características da pessoa, algumas das quais são observadas pelo pesquisador e outras não:
U n = β ⋅ s n + ε n {\i1}=={\i1}boldsymbol {\i}cdot {\i}mathbf {s_{\i} +\i1}varepsilon _{n}
where β {\i1}displaystyle {\i}boldsymbol {\i}{\i}boldsymbol {\i}beta
é um conjunto de coeficientes de regressão e s n {\i1}mathbf {\i}{s_{n}} }
é um conjunto de variáveis independentes (também conhecidas como “características”) descrevendo a pessoa n, que pode ser “variáveis dummy” discretas ou variáveis contínuas regulares. ε n {\displaystyle \varepsilon _{n}}
é uma variável aleatória especificando “ruído” ou “erro” na previsão, assumindo-se que seja distribuída de acordo com alguma distribuição. Normalmente, se houver uma média ou parâmetro de variância na distribuição, ela não pode ser identificada, então os parâmetros são definidos para valores convenientes – por convenção geralmente média 0, variância 1.
A pessoa toma a ação, yn = 1, se Un > 0. O termo não observado, εn, é assumido como tendo uma distribuição logística.
A especificação é escrita sucintamente como:
-
- Un = βsn + εn
- Y n = { 1 , se U n > 0 , 0 , if U n ≤ 0 {\i1}{\i1}{\i1}displaystyle Y_{\i}={\i1}begin{\i}1,&{\i}text{\i}U_{\i}>0,{\i}0,&{\i}text 0
- ε ∼ logístico, normal, etc.
Deixe-nos escrevê-lo de forma ligeiramente diferente:
-
- Un = βsn – en
- Y n = { 1 , se U n > 0 , 0 , if U n ≤ 0 {\i1}{\i1}{\i1}displaystyle Y_{\i}={\i1}begin{\i}1,&{\i}text{\i}U_{\i}>0,{\i}0,&{\i}text 0
- e ∼ logístico, normal, etc.
Aqui fizemos a substituição pt = -εn. Isto muda uma variável aleatória para uma variável ligeiramente diferente, definida sobre um domínio negado. Acontece que as distribuições de erro que normalmente consideramos (por exemplo, distribuição logística, distribuição normal padrão, distribuição t padrão de Student, etc.) são simétricas em torno de 0, e portanto a distribuição sobre en é idêntica à distribuição sobre εn.
Denotar a função de distribuição cumulativa (CDF) do e {\displaystyle e}
como F e , {\f_{e},}
e a função de quantil (CDF invertido) de e {\f_{\f}
como F e – 1 . F_{\a}^{-1}.}
Nota que
Pr ( Y n = 1 ) = Pr ( U n > 0 ) = Pr ( β ⋅ s n – e n > 0 ) = Pr ( – e n > – β ⋅ s n ) = Pr ( e n ≤ β β ⋅ s n ) = F e ( β ⋅ s n ) {\i1}{\i1}{\i1}(Y_{n}=1)&===Pr(U_{n}>0){\i}&==Pr({\i}boldsymbol {\i}}cdot {\i}mathbf {s_{n}} -e_{n}>0)\\&=\Pr(-e_{n}>-Símbolo de fivela Símbolo de fivela Símbolo de fivela Símbolo de fivela Símbolo de fivela Símbolo de fivela Símbolo de fivela Símbolo de fivela Símbolo de fivela Símbolo de fivela Símbolo de fivela Símbolo de fivela Símbolo de fivela Símbolo de fivela Símbolo de fivela Símbolo de fivela Símbolo de fivela Símbolo de fivela Símbolo de fivela Símbolo de fivela Símbolo de fivela Símbolo de fivela Símbolo de fivela Símbolo de fivela Símbolo de fivela Símbolo de fivela Símbolo de fivela Símbolo de fivela Símbolo de fivela Símbolo de fivela Símbolo de fivela Símbolo de fivela Símbolo de fivela Símbolo de fivela
Since Y n {\i1}displaystyle Y_{n}}
é um julgamento Bernoulli, onde E = Pr ( Y n = 1 ) , {\i1}displaystyle {\i}mathbb {E} =\i(Y_{n}=1),
temos E = F e ( β ⋅ s n ) {\i} {\i1}displaystyle {\i}mathbb {E} =F_{e}({\i}{\i1}(Símbolo de furo {\i}}cdot {\i}mathbf {s_{n}}} F_{e}^{-1}(mathbb {E} )={\i1}bolos de fendas {\i}cdot {\i}mathbf {s_{n}} .}
Notem que isto é exactamente equivalente ao modelo de regressão binomial expresso no formalismo do modelo linear generalizado.
If e n ∼ N ( 0 , 1 ) , {\i1}displaystyle e_{n}}sim {\i}(0,1),}
i.e. distribuído como uma distribuição normal, depois Φ – 1 ( E ) = β ⋅ s n {\i1}displaystyle \i^{-1}(mathbb {E} )={\i1}boldsymbol {\i}beta {\i}cdot {\i}mathbf {s_{n}} }
que é exactamente um modelo probit.
If e n ∼ Logistic ( 0 , 1 ) , {\i1}displaystyle e_{\i}sim {\i}sim {\i}operatorname {\i} (0,1),}
ou seja, distribuído como uma distribuição logística padrão com média 0 e parâmetro de escala 1, então a função de quantil correspondente é a função logit, e logit ( E ) = β ⋅ s n {\i}displaystyle \i}operatorname {logit} (mathbb {E} )={\i1}boldsymbol {\i}beta {\i}cdot {\i}mathbf {s_{n}} }
que é exactamente um modelo logit.
Nota que os dois diferentes formalismos – modelos lineares generalizados (GLM’s) e modelos de escolha discreta – são equivalentes no caso de modelos de escolha binária simples, mas podem ser estendidos se diferentes formas:
- GLM’s podem facilmente lidar com variáveis de resposta distribuídas arbitrariamente (variáveis dependentes), não apenas variáveis categóricas ou variáveis ordinais, às quais os modelos de escolha discreta estão limitados pela sua natureza. Os GLM’s também não estão limitados a ligar funções que são funções de quantis de alguma distribuição, ao contrário do uso de uma variável de erro, que por suposição deve ter uma distribuição de probabilidade.
- Por outro lado, porque os modelos de escolha discreta são descritos como tipos de modelos generativos, é conceitualmente mais fácil estendê-los a situações complicadas com múltiplas escolhas, possivelmente correlacionadas, para cada pessoa, ou outras variações.