Pular para o conteúdo principal

Endogeneidade

O treinamento dos economistas em métodos quantitativos aplicados é ainda pouco desenvolvido na maioria dos cursos de economia que existem por aí. É verdade que isto tem melhorado, até porque não é mais possível acompanhar a literatura internacional sem ter conhecimento razoável de técnicas econométricas.

Talvez alguns leitores deste blog ouçam falar muito em endogeneidade ou variáveis endógenas, principalmente no que se refere a modelos econométricos. Se pensamos em modelos de crescimento endógeno, o "endógeno" significa que a variável que causa o crescimento é determinada dentro do contexto do modelo. Mas em econometria, embora não seja muito diferente do que eu disse na frase anterior, endogeneidade se refere a "qualquer situação onde uma variável expicativa é correlacionada com o erro" (Wooldridge, 2011, p. 54, tradução livre).

Baseando-me em um único trecho do livro do Wooldridge (Econometric Analysis of Cross-Section and Panel Data, 2 ed, 2011, p. 54-55), listo aí as três fontes tradicionais de endogeneidade em econometria aplicada:

  1. Variáveis omitidas: se há uma variável omitida no modelo, ela acaba sendo incorporada ao erro. Caso esta variável omitida seja correlacionada com alguma das variáveis explicativas que já está no modelo (o que é bem comum), necessariamente haverá correlação entre variável explicativa e erro.
  2. Erro de mensuração: se há apenas uma variável com erro de mensuração e não temos a variável sem erro que deveria estar no modelo, podemos ter correlação entre a variável que temos (com erro) e o erro (porque o erro contém uma parte daquilo que não foi mensurado corretamente). Isso depende da relação entre a variável que temos (com erro) e a que não temos mas gostaríamos de ter (sem erro).
  3. Simultaneidade: quando uma das variáveis explicativas é determinada pela variável explicada no modelo. Ou seja, x influencia y, mas y também influencia x simultaneamente. Nesse caso, x e o erro geralmente possuem correlação entre si. 

E qual é o problema da endogeneidade? Além do viés, o grande problema que podemos ter é a inconsistência. Nesse caso, nossas estimativas não convergirão ao parâmetro populacional. Para que então rodar uma regressão? O importante de uma estimativa amostral é que, através dela, possamos dizer algo sobre a população.

PS: Agradeço algumas correções feitas pelo Prof. Fernando Sabino. 

Comentários

Postagens mais visitadas deste blog

Lutero e os camponeses

São raros os momentos que discorro sobre teologia neste blog. Mas eventualmente acontece, até porque preciso fazer jus ao subtítulo dele. É comum, na minha condição declarada de cristão luterano, que eu sempre seja questionado sobre as diferenças da teologia luterana em relação às outras confissões. Outra coisa sempre mencionada é o episódio histórico do massacre dos camponeses no século XVI, sancionado por escritos de Lutero. O segundo assunto merece alguma menção. Para quem não sabe (e eu nem devo esconder isso), Lutero escreveu que os camponeses, que na época estavam fazendo uma revolta bastante conturbada, deveriam ser impedidos de praticarem tais atos contrários à ordem - inclusive por meio de violência. Lutero não mediu palavras ao dizer isso, o que deu a justificativa para a violenta supressão da revolta que ocorreu subsequentemente. O objetivo deste post não é inocentar Lutero do sangue derramado sobre o qual ele, de fato, teve grande responsabilidade. Nem vou negar que Lutero

Exogeneidade em séries de tempo

Mais um texto de quem tem prova de econometria na segunda-feira. Quem não é economista não deve de forma alguma ler esse texto. Não digam que eu não avisei. Quando falamos de exogeneidade na econometria clássica, estamos falando da chamada exogeneidade "estrita", que nada mais consiste no fato de uma variável x não ser correlacionada com qualquer erro. Nas séries de tempo, no entanto, trabalha-se com três tipos de exogeneidade, dependendo do fim proposto. Na busca de resultados em inferência estatística (modos de estimar parâmetros e formulação de testes de hipótese), utiliza-se, em séries de tempo, o conceito de exogeneidade fraca. Para isso, precisamos 'fatorar a função de distribuição em duas partes: distribuição condicional e distribuição marginal . Define-se que uma variável é fracamente exógena em relação aos parâmetros de interesse se, e somente se, houver um certo tipo de reparametrização e atender duas condições: a variável de interesse precisa ser função de apen