Acessibilidade / Reportar erro

BOLSA FAMÍLIA OU DESEMPENHO DA ECONOMIA? DETERMINANTES DA REELEIÇÃO DE LULA EM 2006

Resumo

Este artigo investiga os determinantes dos resultados das eleições presidenciais brasileiras de 2006, em particular o papel do programa Bolsa Família e do desempenho econômico na migração da base eleitoral de Lula para regiões menos desenvolvidas. Os resultados indicam que, entre eleitores habituais de Lula, a participação no programa não aumenta a probabilidade de voto nesse candidato em 2006. Entre eleitores habituais de outros candidatos, esse efeito é positivo. Além disso, um maior crescimento econômico somente significou votos adicionais para Lula entre os eleitores mais ricos. Por fim, o impacto do programa Bolsa Família se mostrou bastante superior ao do desempenho econômico. No entanto, nenhum dos dois fatores foi capaz de explicar satisfatoriamente toda a extensão da mudança observada em 2006.

Palavras-chave:
Bolsa Família; Lula; Eleições Presidenciais; Viés de Agregação

Abstract

This paper investigates the determinants of the outcome of Brazilian presidential elections in 2006, in particular the role of the Bolsa Família Program and the economic performance in the migration of the electoral base of Lula for less developed regions. Among the usual Lula's electorate, joining the Bolsa Família program did not increase the likelihood of voting in this candidate. Among the other voters, this effect was positive. Moreover, higher economic growth only resulted in more votes for Lula among the richest voters. Regarding the elections results, the impact of Bolsa Família proved to be quite superior than the economic performance. However, neither of the two factors was able to satisfactorily explain the full extent of the observed change in 2006.

Keywords:
Bolsa Família; Lula; Presidential Elections; Aggregation Bias

1 Introdução

Embora tenha vencido as eleições presidenciais de 2002 e 2006 com praticamente a mesma votação percentual, ficou clara a mudança no perfil da votação do candidato reeleito, Luiz Inácio Lula da Silva (Lula). A Figura 1 ilustra essa afirmação. Cada ponto representa um município brasileiro. A princípio, seria esperada alguma relação positiva entre as votações obtidas por Lula entre duas eleições consecutivas, como ocorreu entre 1998 e 2002. Entretanto, nota-se que praticamente não há relação entre os percentuais de votos obtidos por Lula no primeiro turno, quando comparadas as eleições de 2002 e 2006.1 1 Esse último resultado vale também para a votação no segundo turno. Obviamente, não é possível comparar as votações de Lula no segundo turno em 1998 e 2002, pois em 1998 a eleição foi decidida no primeiro turno. Se tradicionalmente Lula era bem sucedido em regiões mais desenvolvidas do Brasil, em 2006 o candidato do Partido dos Trabalhadores (PT) viu sua base eleitoral migrar para regiões de menor desenvolvimento. Essa mudança teve uma contrapartida do ponto de vista geográfico (ver Figura 2). Lula melhorou seu desempenho na vasta maioria dos municípios das regiões Norte e Nordeste (são os pontos localizados acima da reta de 45o). Nas demais regiões a tendência de melhora e piora foi mais equilibrada.

Figura 1
Votação de Lula em Diferentes Eleições (% dos votos válidos no 1º Turno)

Figura 2
Votação de Lula em 2002 e 2006 (% dos votos válidos no 1º Turno)

Muitas hipóteses foram levantadas para explicar tal mudança. Em Hunter & Power (2007)Hunter, W. & Power, T. J. (2007), 'Rewarding Lula: Executive power, social policy, and the brazilian elections of 2006', Latin American Politics and Society 49(1), 1-30. elas foram organizadas em três grandes categorias (não excludentes). Em primeiro lugar, os eleitores mais pobres e menos escolarizados teriam menos acesso à informação sobre os escândalos de corrupção que surgiram no primeiro mandato de Lula. Em segundo lugar, os eleitores de menor renda seriam os mais beneficiados com a política econômica do primeiro governo de Lula. Por último, as políticas sociais, particularmente o programa Bolsa Família, explicariam grande parte do desempenho eleitoral de Lula nas regiões menos desenvolvidas. Além disso, Zucco (2008)Zucco, C. (2008), 'The president's 'new' constituency: Lula and the pragmatic vote in brazil's 2006 presidential elections', Journal of Latin American Studies 40(1), 29-39. aponta evidências de que no Brasil o candidato a presidente ligado ao governo sempre obtém desempenho eleitoral relativamente melhor em regiões menos desenvolvidas, naturalmente mais dependentes do governo. Tal regularidade também ajudaria a explicar o desempenho de Lula nessas regiões.

Sobre a relação entre os programas de transferência de renda e o desempenho de Lula nas eleições de 2006, existe um amplo debate público sobre os dividendos eleitorais do programa Bolsa Família.2 2 Para um resumo deste debate na imprensa ver Marques et al. (2009). Esse debate foi transplantado para o ambiente acadêmico. Os resultados são bastante díspares: variando desde evidências de que o programa não foi determinante para a reeleição de Lula (Shikida et al. 2009Shikida, C. D., Monasterio, L. M., Araujo Jr, A. F., Carraro, A. & Damé, O. M. (2009), " 'It is the economy, companheiro!": an empirical analysis of Lula's re-election based on municipal data', Economics Bulletin 29(2), 977-992.) até conclusões de que o programa teve papel decisivo na vitória do candidato do PT (Marques et al. 2009Marques, R. M., Leite, M. G., Mendes, A. & Ferreira, M. R. J. (2009), 'Discutindo o papel do programa bolsa família na decisão das eleições presidenciais brasileiras de 2006', Revista de Economia Política 29(1), 114-132.). A propósito, essa literatura não é restrita ao caso brasileiro: há artigos que investigam o impacto de programas de transferência de renda nos resultados de eleições em outros países (ver Labonne (2013)Labonne, J. (2013), 'The local electoral impacts of conditional cash transfers: Evidence from a field experiment', Journal of Development Economics 104, 73-88. e De La O (2013)De La O, A. (2013), 'Do conditional cash transfers affect electoral behavior? evidence from a randomized experiment in Mexico', American Journal of Political Science 57(1), 1-14., por exemplo).

A respeito do papel do desempenho da economia brasileira na mudança do padrão eleitoral de Lula em 2006, muitos autores defendem a prevalência de fatores econômicos. Para eles, os ganhos de bem-estar ligados à melhora das condições do mercado de trabalho para a parcela mais pobre da população e ao impacto do câmbio valorizado e da inflação controlada na cesta de consumo dos estratos de renda mais baixos - e não os ganhos auferidos como os programas de transferência de renda - teriam sido os fatores decisivos nas eleições presidenciais de 2006 (Shikida et al. 2009Shikida, C. D., Monasterio, L. M., Araujo Jr, A. F., Carraro, A. & Damé, O. M. (2009), " 'It is the economy, companheiro!": an empirical analysis of Lula's re-election based on municipal data', Economics Bulletin 29(2), 977-992.). Entretanto, apenas artigos mais recentes (ver, por exemplo Souza & Cribari Neto (2013)Souza, T. C. & Cribari Neto, F. (2013), 'Uma estimativa do impacto eleitoral do programa bolsa-família', Revista Brasileira de Biometria 31(1), 79-103.) tentaram inferir diretamente o efeito das variáveis econômicas na reeleição de Lula e contrapô-las ao efeito do programa Bolsa Família. Por exemplo, Shikida et al. (2009)Shikida, C. D., Monasterio, L. M., Araujo Jr, A. F., Carraro, A. & Damé, O. M. (2009), " 'It is the economy, companheiro!": an empirical analysis of Lula's re-election based on municipal data', Economics Bulletin 29(2), 977-992. inferem a importância dos fatores econômicos de maneira indireta: como o efeito do programa Bolsa Família mostra-se pequeno, o resultado das eleições é creditado ao desempenho da economia.3 3 Na verdade, os próprios autores reconhecem a necessidade de análise quantitativa adicional para identificar e medir adequadamente a importância relativa de cada fator. Sendo assim, outra contribuição deste artigo é a inclusão de uma medida de desempenho econômico na análise quantitativa do desempenho eleitoral de Lula em 2006, o que possibilita a comparação direta da importância dos fatores econômicos e do programa Bolsa Família.

Em termos metodológicos, a literatura sobre o tema costuma lançar mão de modelos lineares. Esses modelos não são adequados para descrever variáveis que assumem a forma de proporções. Nesse caso, são necessários modelos que se ajustem ao fato de que a variável dependente - proporção de votos em Lula - somente pode assumir valores entre zero e um. Nesse sentido, este trabalho busca suprir essa lacuna ao considerar adequadamente essa questão.

No entanto, existe outro problema metodológico, muito mais relevante, ainda não tratado nessa literatura. Por conta do mecanismo de voto secreto, é necessário o uso de dados agregados para investigar o impacto do programa Bolsa Família na votação de Lula em 2006. Tal procedimento é suscetível ao que se convencionou denominar falácia ecológica (King 1997King, G. (1997), A Solution to the Ecological Inference Problem: Reconstructing Individual Behavior from Aggregated Data, Princeton University Press, Princeton.) ou viés de agregação (Stoker 1993Stoker, T. M. (1993), 'Empirical approaches to the problem of aggregation over individuals', Journal of Economic Literature 31(4), 1827-1874.). Se os eleitores têm características heterogêneas, não seria possível inferir os padrões de comportamento individual com base em dados agregados.4 4 Dado o caráter secreto dos votos, este é um problema recorrente na literatura que analisa os resultados de eleições (ver, por exemplo, Brown & Payne 1986, Freedman et al. 1991, Heckelman 1997, 2000). Desse modo, conclusões tiradas a partir de dados agregados são potencialmente viesadas e podem não refletir o padrão de escolha individual. As exceções seriam situações em que o modelo individual é linear, o que claramente não é o caso quando a variável de decisão do eleitor é discreta (votar ou não votar em Lula, por exemplo).5 5 Alguns autores tentam contornar esse problema usando dados individuais extraídos de pesquisas de opinião (Bohn 2011, Licio et al. 2009, Zucco 2013). Entretanto, muitas dessas pesquisas sequer conseguem reproduzir o percentual de votação obtido pelos candidatos nas eleições de 2006. Desse modo, não há como escapar do uso de dados agregados. Trata-se de problema similar à agregação de demandas individuais, tal como descrito no trabalho seminal de Gorman (1953)Gorman, W. (1953), 'Community preference field', Econometrica 21(1), 63-80..

Sendo assim, outra contribuição deste artigo - inédita na literatura que estuda os determinantes da reeleição de Lula - é o tratamento adequado dessa questão. Para tanto será utilizado o método de agregação proposto em Kelejian (1995)Kelejian, H. H. (1995), 'Aggregated heterogeneous dependent data and the logit model: A suggested approach', Economics Letters 47(3-4), 243-248.. Esse método, se não permite inferir os parâmetros individuais de escolha, garante que o modelo agregado seja consistente com o modelo individual, evitando o problema de viés de agregação. Além disso, embora a identificação perfeita dos parâmetros individuais não seja possível, consegue-se fazer algumas inferências sobre o comportamento individual dos eleitores, mesmo com dados agregados.

Além desta introdução, este artigo conta com mais cinco seções. A seção 2 descreve o modelo de escolha dos eleitores, enquanto a seção 3 mostra como construir um modelo agregado compatível com as decisões individuais. Por sua vez, a seção 4 descreve os dados utilizados e a especificação exata do referido modelo. A seção 5 traz os resultados da estimação do modelo agregado, bem como uma discussão dos mesmos e algumas inferências sobre o processo de decisão individual dos eleitores. Seguem breves considerações finais.

2 As Escolhas Individuais

Defina-se a utilidade indireta do i-ésimo eleitor, que reside no município sS, caso tenha votado em Lula nas eleições presidenciais de 2006:

em que S é o total de municípios, Zs é vetor com variáveis que assumem o mesmo valor para todos os eleitores de um mesmo município, Xis é vetor com variáveis específicas dos eleitores, δ é parâmetro, β e γ são vetores de parâmetros e εis é o termo de erro aleatório. Por sua vez, a utilidade indireta do eleitor, caso não vote em Lula, é normalizada para zero.

Caso tivéssemos acesso aos votos de cada eleitor, somente seria possível observar a decisão do eleitor (e não a sua utilidade indireta). Sendo assim, é conveniente definir Dis tal que:

Desse modo, se εis é idêntico e independentemente distribuído com densidade simétrica e distribuição acumulada F(Zs ,Xis ), a probabilidade de um indivíduo votar em Lula em determinada eleição, ou seja, E(Dis | Zs ,Xis ) , é dada por:

Percebe-se que a utilização de modelos lineares se mostra inadequada, pois nesse caso não há como garantir que 0 ≤ δ + Zsβ + Xisγ ≤ 1 , como convém para uma probabilidade. Sob a hipótese de que μis = F(Zs ,Xis ) = chega-se aos modelos da família logit. Desse modo, a escolha dos eleitores que vivem em um determinado município pode ser modelada como (Train 2003Train, K. E. (2003), Discrete Choice Methods with Simulation, Cambridge University Press, Cambridge.):

Os coeficientes de 4 não são diretamente interpretáveis, mas é possível calcular os efeitos marginais de cada variável (Train 2003Train, K. E. (2003), Discrete Choice Methods with Simulation, Cambridge University Press, Cambridge.):

em que é vetor de parâmetros e Wis = é vetor que variáveis explicativas.

3 Das Escolhas Individuais Para o Resultado Agregado

A estimação dos coeficientes da equação 4 requer informações a respeito de cada eleitor. Infelizmente, uma vez que o voto é secreto, as informações individuais não estão disponíveis. Na estimação de modelos lineares de escolha individual, este problema pode ser contornado pela agregação dos atributos e escolhas individuais em diferentes regiões geográficas (municípios, no caso em análise) (Stoker 1993Stoker, T. M. (1993), 'Empirical approaches to the problem of aggregation over individuals', Journal of Economic Literature 31(4), 1827-1874.). Os parâmetros do modelo de decisão individual são então estimados pela regressão das médias da variável dependente nas regiões nas mesmas médias dos regressores e em variáveis dummy para as coortes.

Sendo assim, uma questão se impõe: seria possível uma abordagem análoga no caso de modelos da família logit, intrinsecamente não lineares? Para responder a essa questão definam-se:

em que Ns é o número de eleitores da região s na eleição presidencial de 2006. Perceba que as variáveis de caráter individual passam a ser expressas em termos de proporções ou médias relativas à região. Por exemplo, a variável dummy que indica a escolha individual de votar ou não votar em Lula é transformada na proporção de votos desse candidato na região (). Se a variável for, por exemplo, renda, passa a ser expressa como renda média dos eleitores da região. Tem-se que de forma geral:

em que η(.) e κ(.) são funções.

A especificação 7 levanta três questões. A primeira diz respeito à função η(.): é preciso preservar no modelo agregado a estrutura não linear do modelo de decisão individual descrito em 4 (Stoker 1993Stoker, T. M. (1993), 'Empirical approaches to the problem of aggregation over individuals', Journal of Economic Literature 31(4), 1827-1874.)6 6 A função η(.) é usualmente denominada função de ligação (Kieschnick & McCullough 2003). . De outra forma a variável dependente poderá assumir qualquer valor em real quando na verdade é definida no intervalo [0, 1]. Além disso, modelos lineares resultam em efeitos marginais que independem dos valores das variáveis explicativas. É razoável imaginar que tais efeitos sejam diferentes para valores distintos dessas variáveis.7 7 Para os valores médios das variáveis explicativas é bastante provável que os efeitos marginais sejam semelhantes para modelos não lineares e lineares, uma vez que estes últimos podem ser considerados aproximações de primeira ordem dos demais. No entanto, quanto mais distante das médias, pior será esta aproximação. Desse modo, não é adequado o uso de modelos lineares tal como em Nicolau & Peixoto (2007)Nicolau, J. & Peixoto, V. (2007), 'Uma disputa em três tempos: Uma análise das bases municipais das eleições presidenciais de 2006', Anais do XXXI Encontro Nacional da ANPOCS., Soares & Terron (2008)Soares, G. A. D. & Terron, S. L. (2008), 'Dois Lulas: a geografia eleitoral da reeleição (explorando conceitos, métodos e técnicas de análise geoespacial)', Opinião Pública 14(2), 269-301., Zucco (2008)Zucco, C. (2008), 'The president's 'new' constituency: Lula and the pragmatic vote in brazil's 2006 presidential elections', Journal of Latin American Studies 40(1), 29-39., Shikida et al. (2009)Shikida, C. D., Monasterio, L. M., Araujo Jr, A. F., Carraro, A. & Damé, O. M. (2009), " 'It is the economy, companheiro!": an empirical analysis of Lula's re-election based on municipal data', Economics Bulletin 29(2), 977-992. e Marques et al. (2009)Marques, R. M., Leite, M. G., Mendes, A. & Ferreira, M. R. J. (2009), 'Discutindo o papel do programa bolsa família na decisão das eleições presidenciais brasileiras de 2006', Revista de Economia Política 29(1), 114-132..8 8 Uma exceção é (Souza & Cribari Neto (2013), que usam a função de ligação logística. Nesse caso, a escolha mais óbvia é acompanhar o modelo de decisão individual e usar a função logística, ou seja, ln. Aliás, essa escolha é amparada pela constatação de que modelos com função de ligação logística obtêm desempenho bastante superior aos modelos com funções de ligação linear (ver Kieschnick & McCullough (2003)Kieschnick, R. & McCullough, B. D. (2003), 'Regression analysis of variates observed on (0, 1): percentages, proportions and fractions', Statistical Modelling 3(3), 193-213. para evidências e referências).

A segunda questão se refere à função κ(.). Usualmente ela é definida como sendo linear, ou seja, κ(Zs , ) = δ + β + γ. No entanto, tal especificação de κ(.) não é adequada se há heterogeneidade dos indivíduos dentro das regiões (Kelejian 1995Kelejian, H. H. (1995), 'Aggregated heterogeneous dependent data and the logit model: A suggested approach', Economics Letters 47(3-4), 243-248.). Na verdade, essa especificação parte do pressuposto equivocado de que E[κ(Zs, )] = κ[Zs, E(Xis)] dentro de cada região (Heckelman & Sullivan 2002Heckelman, J. C. & Sullivan, T. S. (2002), Testing for aggregation bias in a non-linear framework: Some Monte Carlo results, Mimeo, Winston-Salem, Edwardsville.). Essa igualdade somente vale no caso em que os atributos individuais não variam entre os eleitores da mesma região. Nesse caso, a princípio, a inclusão dos atributos individuais no modelo implica ter que fazer hipóteses mais específicas sobre a distribuição dos mesmos entre os indivíduos. Obviamente, isso tende a complicar a especificação do modelo agregado, pois se torna necessário incluir a estrutura da distribuição dos atributos individuais como parte do modelo (Stoker 1993Stoker, T. M. (1993), 'Empirical approaches to the problem of aggregation over individuals', Journal of Economic Literature 31(4), 1827-1874.). Esse tema será retomado com mais detalhes na seção 3.1.

Por sua vez, a terceira questão diz respeito à heterocedasticidade dos erros e à distribuição condicional de , tema que será tratado em maior profundidade na seção 3.2.

3.1 Correta Agregação das Decisões Individuais

A este respeito, Kelejian (1995)Kelejian, H. H. (1995), 'Aggregated heterogeneous dependent data and the logit model: A suggested approach', Economics Letters 47(3-4), 243-248. propõe um método que prescinde de qualquer hipótese sobre a distribuição exata dos atributos individuais e, ao mesmo tempo, leva em consideração a heterogeneidade dos mesmos. Esse método é baseado no resultado de que, sob condições bastante gerais, o equivalente agregado do modelo de decisão individual descrito em 4 é:9 9 O resultado não depende, por exemplo, da independência da distribuição dos atributos individuais dentro de cada município.

em que g(.) é uma função que pode ser interpretada como o viés de agregação causado pela heterogeneidade dos atributos individuais (Kelejian 1995Kelejian, H. H. (1995), 'Aggregated heterogeneous dependent data and the logit model: A suggested approach', Economics Letters 47(3-4), 243-248.). Em outras palavras, tem-se que κ(, ) = δ + β + γ + g(β + γ). Tal como sugerido em Stoker (1993)Stoker, T. M. (1993), 'Empirical approaches to the problem of aggregation over individuals', Journal of Economic Literature 31(4), 1827-1874., o viés e a forma funcional exata de g(.) dependem da distribuição de Xis entre os eleitores. No entanto, Kelejian (1995)Kelejian, H. H. (1995), 'Aggregated heterogeneous dependent data and the logit model: A suggested approach', Economics Letters 47(3-4), 243-248.sugere que g(.) é não linear e pode ser aproximada por um polinômio de ordem K:

em que bk é o parâmetro associado a k-ésima potência do polinômio.

Defina-se o vetor . Substituindo-se 9 em 8 e ignorando-se os erros de aproximação, chega-se a (Kelejian 1995Kelejian, H. H. (1995), 'Aggregated heterogeneous dependent data and the logit model: A suggested approach', Economics Letters 47(3-4), 243-248.):

Desse modo, em vista das hipóteses feitas, a equação 10representa a agregação apropriada do modelo exposto em 4. Além disso, a equação 10 pode ser usada para se testar a presença de viés de agregação: Kelejian (1995)Kelejian, H. H. (1995), 'Aggregated heterogeneous dependent data and the logit model: A suggested approach', Economics Letters 47(3-4), 243-248. sugere que nesse caso a hipótese nula seja definida como Φ2 = ... = Φk = 0. Observe que esse teste não é capaz de detectar viés de agregação quando este assume a forma puramente linear.

Revertendo a transformação logística, também é possível calcular (Kelejian 1995Kelejian, H. H. (1995), 'Aggregated heterogeneous dependent data and the logit model: A suggested approach', Economics Letters 47(3-4), 243-248.):

Basicamente 11 representa uma média ponderada da probabilidade individual, na qual os pesos são determinados pelas informações regionais agregadas. Note-se que não se trata da previsão de μis, que é a probabilidade condicionada ao vetor Wis. Como para cada eleitor a probabilidade de votar em Lula é função das características individuais, a melhor estimativa para uma pessoa escolhida aleatoriamente em determinada região é a média ponderada de todas as possíveis probabilidades heterogêneas naquela mesma região (Heckelman 1997Heckelman, J. C. (1997), 'Determining who voted in historical elections: An aggregated logit approach', Social Science Research 26(2), 121-134.).

Definindo-se Φ1 = 1, não é difícil mostrar que o efeito marginal das variáveis explicativas é:

3.2 Heterocedasticidade dos Erros e Distribuição Condicional de Dst

Tomando-se o modelo definido por 10, tem-se que σs ≡ Var(νs) = (Maddala 1983Maddala, G. S. (1983), Limited-Dependent and Qualitative Variables in Econometrics, Cambridge University Press, Cambridge., p. 29-30). Além disso, tais variâncias podem ser estimadas pela substituição de por sua contrapartida amostral. Sendo assim, o modelo 10 pode ser estimado por Mínimos Quadrados Não Lineares Generalizados (MQNLG), em que cada observação é ponderada por ws = Ns (1 - ).10 10 Na verdade, os pesos devem ser redefinidos para que sua soma seja igual ao número de observações.

Note-se que a variância de deve ser heterocedástica e se aproximar de zero nos limites inferior e superior do intervalo [0, 1] (Kieschnick & McCullough 2003Kieschnick, R. & McCullough, B. D. (2003), 'Regression analysis of variates observed on (0, 1): percentages, proportions and fractions', Statistical Modelling 3(3), 193-213.). Não é difícil mostrar que essa propriedade é satisfeita pelo modelo 10.11 11 Basta notar que υ ≅Maddala 1983, p. 30). Então σs = V ar(), o que estabelece o resultado de que V ar() = . Note que V ar() se aproxima de zero quando μs se aproxima de zero ou um. (

Além disso, embora usualmente o modelo 10 seja estimado pela minimização da soma dos quadrados dos resíduos, implicitamente faz-se a hipótese de que υ ~ N(0, σs ) (Kieschnick & McCullough 2003Kieschnick, R. & McCullough, B. D. (2003), 'Regression analysis of variates observed on (0, 1): percentages, proportions and fractions', Statistical Modelling 3(3), 193-213.). Em outras palavras, supõe-se que tem distribuição normal.12 12 Esta hipótese implica assumir que ( tem distribuição aditiva logística normal. No entanto, essa não é a única possibilidade. Em Kieschnick & McCullough (2003)Kieschnick, R. & McCullough, B. D. (2003), 'Regression analysis of variates observed on (0, 1): percentages, proportions and fractions', Statistical Modelling 3(3), 193-213. são abordadas outras opções, como as distribuições beta e simplex.

4 Dados e Especificação do Modelo

4.1 Dados

A Tabela 1 traz uma lista e uma breve descrição das variáveis utilizadas. As fontes desses dados são basicamente Zucco (2008)Zucco, C. (2008), 'The president's 'new' constituency: Lula and the pragmatic vote in brazil's 2006 presidential elections', Journal of Latin American Studies 40(1), 29-39. e Tribunal Superior Eleitoral (TSE), para as variáveis eleitorais, o Instituto Brasileiro de Geografia e Estatística (IBGE) para as variáveis geográficas, demográficas e socioeconômicas e Ministério do Desenvolvimento Social (MDS) para informações sobre a cobertura do programa Bolsa Família e do número de famílias pobres.

Tabela 1:
Variáveis Utilizadasa

Por sua vez, a Tabela 2 traz algumas estatísticas descritivas dessas variáveis. Fica bastante evidente a disparidade das características socioeconômicas e demográficas entre os municípios da amostra. A título de exemplo, a menor renda per capita da amostra é de R$ 28,38 por mês e a maior de R$ 954,65, mais do que trinta vezes superior. Os municípios mais desenvolvidos chegam a ter taxas de analfabetismos inferiores a 1%, enquanto os menos desenvolvidos podem ter mais do que 60% de sua população acima de 15 anos analfabeta.

Tabela 2:
Algumas Estatísticas Descritivas

4.2 Especificação do Modelo

Basicamente, foram estimadas diferentes versões do modelo definido em 10, tanto para os votos de Lula no primeiro turno (LULA20061T) quanto para os votos desse candidato no segundo turno (LULA20062T), ambos transformados pela função logística, obviamente. As demais variáveis listadas na Tabela 1 foram usadas como regressores. Adicionalmente, foram incluídas dummies estaduais para capturar o efeito de atributos não observáveis e de variáveis omitidas dentro das unidades federativas.13 13 Na verdade, para evitar multicolinearidade perfeita com outras variáveis, foram omitidas as dummies correspondentes aos estados de Roraima e Acre. As variáveis de maior interesse são BOLSA e CRESC, que capturam o alcance do programa Bolsa Família (BOLSA) e o desempenho econômico no primeiro mandato de Lula em termos de crescimento do PIB per capita (CRESC). As demais variáveis explicativas podem ser agrupadas em quatro categorias: (i) geográficas- URB, DENS, DIST; (ii) políticas e eleitorais - LULA20021T (ou LULA20022T), GOVPT, PREFPT e PT2004; (iii) características socioeconômicas dos eleitores - RENDA, GINI, ANALF, MORT, POBRES, PENT, NBRANCO; (iv) setor público - TXLOCAL, PUBLICO.

5 Resultados

A Tabela 3 e a Tabela 4 resumem os resultados encontrados a partir da estimação de diferentes versões do modelo descrito na seção 4.2. Em todas as especificações foi utilizado o método de Mínimos Quadrados Não-Lineares Generalizados (MQNLG). Entretanto, esses resultados podem ser mais bem interpretados se expressos em termos de efeitos marginais. Nesse sentido, a Tabela 5 apresenta os efeitos marginais e elasticidades calculados para alguns das especificações.

Tabela 3:
[Resultados das Regressões - 1ºTurno, Variável Dependente ln[LULA20061T/(1-LULA20061T)]
Tabela 4:
[Resultados das Regressões - 2ºTurno, Variável Dependente ln[LULA20062T/(1-LULA20062T)]
Tabela 5:
Efeitos Marginais e Elasticidades

5.1 Viés de Agregação

Pela inspeção da Tabela 3 e da Tabela 4 percebe-se que o viés de agregação é detectado em todos os modelos (com exceção dos Modelos A1 e B1, obviamente): a hipótese nula de que Φ2 = 0 (Modelos A2 e B2) ou Φ2 = Φ3 = 0 (Modelos A3 e B3) foi fortemente rejeitada.14 14 Os modelos indexados pela letra A se referem aos votos do 1º turno, os indexados pela letra B dizem respeito ao 2º turno.

Note-se que as evidências de Heckelman & Sullivan (2002)Heckelman, J. C. & Sullivan, T. S. (2002), Testing for aggregation bias in a non-linear framework: Some Monte Carlo results, Mimeo, Winston-Salem, Edwardsville. mostram que: (i) a presença de viés de agregação aumenta com a população das regiões; (ii) a capacidade do teste proposto por Kelejian (1995)Kelejian, H. H. (1995), 'Aggregated heterogeneous dependent data and the logit model: A suggested approach', Economics Letters 47(3-4), 243-248. em detectar esse viés também aumenta com o tamanho da população. Nesse sentido, a constatação de que o viés de agregação é importante mesmo com dados municipais lança muitas dúvidas sobre evidências baseadas em dados agregados estaduais, sujeitos a um viés ainda maior. Outro resultado dos mesmos autores indica que o poder desse teste aumenta sensivelmente com a ordem do polinômio (K) utilizado na aproximação da função g(.) e pode ser bastante baixo para valores pequenos de K . O fato de que a detecção foi conseguida mesmo para K = 2 reforça as evidências de que o viés de agregação não pode ser desprezado. Tanto é verdade, que os efeitos marginais e as elasticidades calculadas para modelos com K = 3 diferem substancialmente dos calculados para modelos com K = 1 (ver mais detalhes no apêndice Apêndice A Efeitos marginais, elasticidadese viés de agregação Na seção 5.1 foi mencionado que a incorporação da correção para o viés de agregação gerava diferenças não desprezíveis nas estimativas de efeitos marginais e de elasticidades. Nesse sentido, a Tabela A.1ilustra essa afirmação para as duas principais variáveis explicativas utilizadas (BOLSA e CRESC). Tabela A.1: Efeitos Marginais e Elasticidades - Comparação entre Modelos 1º Turno 2º Turno Modelo A1 Modelo A2 Modelo A3 Modelo B1 Modelo B2 Modelo B3 BOLSA Efeito Marginal 0,2176* 0,2094** 0,1930* 0,1783* 0,1763* 0,1621* (0,0059) (0,0852) (0,0067) (0,0049) (0,0060) (0,0052) Elasticidade 0,1217* 0,1130* 0,1034* 0,0826* 0,0800* 0,0735* (0,0021) (0,0022) (0,0017) (0,0015) (0,0014) (0,0014) CRESC Efeito Marginal 0,0353*** 0,0396** 0,0395** 0,0732* 0,0684* 0,0671* (0,0191) (0,0177) (0,0157) (0,0179) (0,0168) (0,0159) Elasticidade 0,0009*** 0,0010** 0,0010** 0,0016* 0,0015* 0,0014* (0,0005) (0,0005) (0,0004) (0,0004) (0,0004) (0,0003) Os símbolos ∗, ∗∗ e ∗∗∗ indicam significância a 1%, 5% e 10%, respectivamente Efeitos marginais e elasticidades calculados nas médias amostrais não ponderadas pela população dos municípios (ver Tabela 2). Os desvios-padrão foram calculados pelo método Delta. Para o primeiro turno, comparando-se os modelos A1 e A3, nota-se que o efeito marginal da variável BOLSA(CRESC) é aproximadamente 11,3% menor (11,7% maior) quando se controla o viés de agregação. Analogamente, para o segundo turno (modelos B1 e B3), o efeito marginal da variável BOLSA (CRESC) é aproximadamente 9,1% menor (11,0% menor). Resultados similares são encontrados para as elasticidades. A interpretação desses resultados é bastante difícil, na medida em que a magnitude e a direção do viés de agregação dependem da distribuição das variáveis explicativas entre os eleitores (ver seção 3.1). ao final do artigo).

Também foram estimadas versões do modelo para K > 3. No entanto, optou-se por apresentar somente os resultados para K ≤ 3, pois as estimativas são bastante similares. Além disso, para K > 3, o R 2 ajustado e o critério de informação de Akaike indicam que os ganhos em termos de ajuste não compensam as perdas de graus de liberdade.15 15 lém disso, para K = 4 as estimativas tornam-se quase todas não significativas. Sendo assim, os Modelos A3 e B3 foram selecionados como preferidos.

5.2 Interpretação dos Resultados: Primeiras Impressões

Primeiramente, ressalte-se que os resultados para o primeiro e segundo turnos são semelhantes. Para a maioria das variáveis observou-se o mesmo sinal e efeitos marginais (ou elasticidades) similares nos dois casos. Uma diferença importante é o ganho relativo de relevância da variável CRESC no segundo turno (o efeito marginal quase dobrou). Esse aspecto será explorado mais adiante.

Da Tabela 5 percebe-se também que, tomadas individualmente, as variáveis LULA20021T e LULA20022T possuem o maior impacto na votação de Lula nas eleições presidenciais de 2006. Um aumento de um ponto percentual na votação de Lula em 2002 significa incremento de 0, 4501(0, 5452) ponto percentual nos votos desse candidato no primeiro turno (segundo turno) em 2006. Nesse sentido, embora haja indicação de que o padrão de votos de Lula mudou entre 2002 e 2006, a votação do mesmo ainda se mostrou bastante influenciada pelo seu desempenho eleitoral passado.

O sinal das variáveis sociodemográficas relativas às minorias também foi o esperado. Tudo mais constante, a votação de Lula foi superior em municípios com maior participação de negros, pardos e índios na população (NBRANCO), o que seria de se esperar dado o apelo de seu primeiro governo no que tange às desigualdades raciais Zucco (2008)Zucco, C. (2008), 'The president's 'new' constituency: Lula and the pragmatic vote in brazil's 2006 presidential elections', Journal of Latin American Studies 40(1), 29-39.. Um aumento de 1% nessa variável gera incremento de 0,2520% (0,1946%) na votação de Lula no primeiro turno (segundo turno) em 2006 (ver Tabela 5). O mesmo com relação aos evangélicos ligados às igrejas pentecostais (PENT), embora com uma elasticidade inferior.16 16 O sinal é o contrário do encontrado em Zucco (2008).

Das variáveis políticas, a presença de governador do PT (GOV PT) e a votação dos candidatos do PT nas eleições municipais de 2004 (PT 2004) aparecem com o sinal esperado. No entanto, a presença de prefeito do PT apresentou sinal negativo, contrário do esperado. Trata-se do mesmo resultado encontrado em Zucco (2008)Zucco, C. (2008), 'The president's 'new' constituency: Lula and the pragmatic vote in brazil's 2006 presidential elections', Journal of Latin American Studies 40(1), 29-39.. Mas, provavelmente, o sinal dessa variável não indica que os prefeitos do PT atrapalharam o desempenho eleitoral de Lula em seus municípios. A variável pode ser uma medida da força dos eleitores habituais de Lula - movimentos sociais organizados, sindicatos e classe média - que provavelmente elegeram ou ajudaram a eleger os prefeitos do PT 2004. Se esse for o caso, o sinal negativo indica que esses eleitores habituais abandonaram Lula em 2006 (Zucco 2008Zucco, C. (2008), 'The president's 'new' constituency: Lula and the pragmatic vote in brazil's 2006 presidential elections', Journal of Latin American Studies 40(1), 29-39.). De todo o modo, trata-se de efeito incremental pequeno: em média a presença de prefeito do PT reduziu em 2, 4 (3, 8) pontos percentuais a votação de Lula no primeiro turno (no segundo turno). O efeito do governador mostra-se substancialmente maior: aumento médio de 17, 39 (28, 04) pontos percentuais no primeiro turno (segundo turno) (ver Tabela 5). Entretanto, ressalte-se que, na prática esse efeito teve pouca influência no resultado final, na medida em que em 2006 o PT somente governava estados com pequeno peso eleitoral (Acre, Piauí e Mato Grosso do Sul).

Nota-se também que, a despeito da melhora do desempenho eleitoral de Lula nas regiões menos desenvolvidas, tudo mais constante, o candidato do PT ainda obteve maior votação proporcional em regiões mais urbanizadas (URB), mais densamente povoadas (DENS), mais próximas das capitais (DIST) e menos desiguais (GINI).17 17 O sinal da variável GINI se mostrou contrário ao encontrado em Shikida et al. (2009). O mesmo pode ser dito a respeito dos municípios menos dependentes de transferências do governo estadual e federal (TXLOCAL).18 18 O aumento da taxa de mortalidade infantil (MORT) também deprime a votação de Lula, mas apenas no segundo turno. No primeiro turno o sinal encontrado foi positivo. Nesse sentido, os resultados indicariam que, a princípio, Lula foi relativamente menos votado nos chamados 'rincões'. Entretanto, os efeitos marginais com relação à renda per capita (RENDA), taxa de analfabetismo (ANALF), proporção de famílias pobres (POBRES) e do tamanho do setor público na economia (PUBLICO) indicam que tal conclusão é precipitada. Os resultados da Tabela 5 indicam que um incremento de 1% na renda per capita municipal gera uma redução de 0,0488% (0,0305%) na votação de Lula no primeiro turno (segundo turno) das eleições presidenciais de 2006. A mesma redução na taxa de analfabetismo (ou incremento na participação da administração pública no PIB municipal) gera aumentos de magnitude semelhantes na variável de interesse. No caso da proporção de famílias pobres o efeito não se mostrou estatisticamente significativo (ver Tabela 5).

5.3 Bolsa Família ou Economia?

Na prática, a diferença entre o impacto do programa Bolsa Família e do desempenho econômico nas eleições presidenciais é bem maior do que os efeitos marginais fazem supor. A média (sem ponderação) do crescimento do PIB per capita entre os municípios da amostra no período 2002-2006 é 1,4% (ver Tabela 2). Nesse caso, o aumento de um ponto percentual implica quase dobrar o crescimento médio no período. Por sua vez, o alcance médio do programa Bolsa Família é de 28,9% (ver Tabela 2). Em outras palavras, melhorar em um ponto percentual o desempenho econômico significa elevar em 70% a taxa de crescimento do PIB, enquanto o mesmo aumento no alcance do programa Bolsa Família implica incrementar em apenas 3,5% o número de famílias beneficiadas. Não por acaso, tomando-se as elasticidades da Tabela 5, um incremento de 1% na variável CRESC eleva em somente 0,0010% (0,0014%) os votos no candidato do PT no primeiro turno (segundo turno). O mesmo aumento percentual em BOLSA resulta em elevação de 0,1033% dos votos de Lula no primeiro turno e 0,0735% no segundo turno.

A diferença dos efeitos do programa Bolsa Família e do desempenho econômico também pode ser compreendida com a ajuda de exercícios contrafactuais. Nesse caso, como os resultados são similares para os dois turnos, o foco será mantido no segundo turno.19 19 A diferença principal é que no primeiro turno a relação entre a votação de Lula nas eleições de 2002 e 2006 é mais fraca do que no segundo turno. Tome-se primeiro o programa de transferência de renda. Na Figura 3, cada ponto do painel (a) é o valor previsto da votação de Lula no segundo turno caso o programa Bolsa Família não existisse e se a taxa de crescimento no município fosse nula (calculados a partir do modelo B3 - ver Tabela 4). Esses valores são contrapostos à votação do candidato do PT nas eleições presidenciais de 2002. Além disso, é reportado (acima à esquerda) o resultado da regressão da votação de Lula em 2006 sem os efeitos do crescimento e do programa Bolsa Família (eixo das ordenadas) na votação de Lula em 2002 (eixo das abscissas), bem como a reta ajustada correspondente. O painel (b) reporta as mesmas informações do painel (a), mas considerando a cobertura observada do programa.

Figura 3
Votação de Lula em 2006: Efeito do Programa Bolsa Família (2º Turno)

O que se percebe é que a distribuição de benefícios do programa Bolsa Família eleva o intercepto (de 0, 3444 para 0, 4330) e reduz a inclinação (de 0, 4056 para 0, 3246) da reta ajustada. Nota-se que, na média, o programa elevou a votação de Lula em todos os municípios, mas que o aumento foi maior justamente naqueles em que o seu desempenho foi relativamente pior em 2002.

Exercício análogo foi feito para o desempenho da economia, medido pela taxa de crescimento do PIB per capita (ver Figura 4). No entanto, o efeito do desempenho da economia foi bastante modesto se comparado ao impacto do programa Bolsa Família, tanto que sequer é discernível a olho nu como no gráfico da Figura 3.

Figura 4
Votação de Lula em 2006: Efeito do Crescimento do PIB Per Capita (2º Turno)

A Figura 5 e a Figura 6 ilustram a diferença entre os impactos do programa Bolsa Família e do desempenho econômico. No painel (a) da Figura 5 fica claro que o programa influenciou positivamente o desempenho eleitoral de Lula em 2006, e que esse efeito foi mais importante nos municípios em que tradicionalmente o seu desempenho era pior. A Tabela 6 e a Tabela 7 reforçam esse argumento. O efeito do programa Bolsa Família nos estados das regiões Norte e Nordeste foi superior ao impacto nos demais estados. Por exemplo, em Alagoas o programa aumentou em 9, 45 (7, 64) pontos percentuais a votação de Lula no primeiro turno (segundo turno), enquanto no Rio de Janeiro e São Paulo o incremento foi de somente 1, 51 (0, 98) e 1, 92 (1, 65) ponto percentual, respectivamente.

Figura 5:
Efeito Eleitoral do Programa Bolsa Família (2º Turno)

Tabela 6:
Votação de Lula: Valores Previstos por Estados - 1º Turno (Modelo A3)
Tabela 7:
Votação de Lula: Valores Previstos por Estados - 2º Turno (Modelo B3)

O painel (b) da Figura 5 explora a ligação entre o desempenho de Lula nas eleições presidenciais de 2002 e o nível de desenvolvimento dos municípios. O efeito do programa Bolsa Família na votação de Lula foi superior nos municípios mais pobres.

Por sua vez, o painel (a) da Figura 6 indica que o efeito eleitoral do crescimento foi relativamente menos importante do que o impacto do programa Bolsa Família, sendo praticamente nulo na média dos municípios da amostra. Mais uma vez, a Tabela 6 e a Tabela 7 reforçam este argumento: tomando-se o Brasil com um todo, o efeito do programa Bolsa Família na votação de Lula em 2006 foi de 3, 30 (2, 68) pontos percentuais no primeiro turno (segundo turno), o equivalente a pouco mais de 3, 1 milhões (2, 5 milhões) de votos. Trata-se de aproximadamente dezessete vezes (3, 30 ÷ 0, 19) o efeito do crescimento no primeiro turno e mais do que oito vezes (2, 68 ÷ 0, 31) no segundo turno.20 20 Novamente, a diferença entre os impactos do programa Bolsa Família e do crescimento da economia na votação de Lula no primeiro e no segundo turno está em linha com os resultados encontrados na Tabela 5. O efeito marginal da variável BOLSA é um pouco menor no segundo turno, enquanto o efeito marginal da variável CRESC é quase o dobro. É um impacto modesto, principalmente quando se considera que em 2006 o número de famílias atendidas pelo programa era aproximadamente onze milhões. Além disso, o painel (b) da Figura 6 mostra que a relação tênue entre o efeito eleitoral do desempenho da economia com a votação de Lula em 2002 se repete quando se considera a renda per capita dos municípios.

Figura 6:
Efeito Eleitoral do Desempenho da Economia (2º Turno)

5.4 Nem Bolsa Família nem Economia: o que Mudou Afinal?

Da seção 5.3 percebe-se que o desempenho da economia e o programa Bolsa Família, principalmente este último, tiveram impacto no resultado das eleições presidenciais de 2006. No entanto, fica claro que, sozinhos, não são capazes de explicar a mudança do padrão de votos de Lula entre 2002 e 2006. A Figura 7 ilustra esse argumento para o segundo turno (os resultados para o primeiro turno são similares). A linha pontilhada de 45º indica a votação do candidato do PT caso este tivesse mantido o desempenho de 2002. A linha tracejada em negrito aponta a votação média prevista de Lula levando em consideração os efeitos do desempenho econômico e do programa de transferência de renda.

Figura 7:
Mudança no Padrão Eleitoral de Lula: Resumo Esquemático (2º Turno)

Nota-se que ambos somente são capazes de explicar uma parte relativamente pequena da mudança: somente o deslocamento da linha em negrito para a linha tracejada em negrito. A diferença entre a linha de 45º e a linha em negrito - indicada por setas - deve ser creditada a outras variáveis (incluídas ou não no modelo).

Uma possível causa seriam mudanças nas características dos municípios - urbanização, densidade populacional e taxa de analfabetismo, por exemplo - ou no ambiente político - prefeitos e governadores, por exemplo. Entretanto, ou essas variáveis apresentam pequeno efeito marginal na votação de Lula (ver Tabela 5), ou não costumam se alterar significativamente em um período de apenas quatro anos a ponto de explicar tamanha modificação do padrão da votação do candidato do PT.

Nesse sentido, nos municípios mais desenvolvidos, a queda na votação de Lula poderia ser explicada pela percepção dos eleitores mais esclarecidos a respeito dos escândalos de corrupção que surgiram antes das eleições de 2006 (Hunter & Power 2007Hunter, W. & Power, T. J. (2007), 'Rewarding Lula: Executive power, social policy, and the brazilian elections of 2006', Latin American Politics and Society 49(1), 1-30.). No entanto, esse fator não explicaria a melhora no desempenho eleitoral de Lula nos municípios menos desenvolvidos.

Desse modo, talvez a melhora da votação de Lula nos municípios em que tradicionalmente ele obtinha desempenho relativamente pior se deva ao fato de que, em 2006, pela primeira vez ele representava o governo estabelecido. Tratase do argumento levantado em Zucco (2008)Zucco, C. (2008), 'The president's 'new' constituency: Lula and the pragmatic vote in brazil's 2006 presidential elections', Journal of Latin American Studies 40(1), 29-39. que, independentemente de quem é o candidato, os eleitores de municípios menos desenvolvidos, mais dependentes do Estado, seriam mais propensos a votar nas eleições para presidente a favor do governo. O contrário ocorreria nos municípios mais desenvolvidos. Esse argumento tenderia a ser reforçado pelo fato de que Lula não somente foi o candidato do governo, mas também concorreu à reeleição em 2006. Aliás, as análises de eleições e reeleições devem ser diferentes, pois nestas últimas o voto tende a ter vinculação com o desempenho anterior do candidato (Soares & Terron 2008Soares, G. A. D. & Terron, S. L. (2008), 'Dois Lulas: a geografia eleitoral da reeleição (explorando conceitos, métodos e técnicas de análise geoespacial)', Opinião Pública 14(2), 269-301.). Nesse sentido, a mudança no perfil de votos de Lula também pode estar relacionada com a percepção dos eleitores sobre o resultado de outras políticas de seu governo (que não o programa Bolsa Família e o crescimento econômico).

5.5 O Problema de Identificação, Especificações Alternativas e Alguns Testes de Robustez

Além do problema de identificação dos parâmetros do modelo de decisão individual a partir de regressões com dados agregados, que motivou o uso da metodologia proposta em Kelejian (1995)Kelejian, H. H. (1995), 'Aggregated heterogeneous dependent data and the logit model: A suggested approach', Economics Letters 47(3-4), 243-248., há outro problema de identificação que permeia a literatura que investiga o efeito eleitoral do programa Bolsa Família. Ao contrário de países como o México (ver De La O (2013)De La O, A. (2013), 'Do conditional cash transfers affect electoral behavior? evidence from a randomized experiment in Mexico', American Journal of Political Science 57(1), 1-14. para detalhes), não houve programas piloto aleatórios, tampouco descontinuidades que possam ser exploradas na identificação da causalidade entre as variáveis de interesse. Além disso, a elegibilidade e a cobertura do programa são altamente correlacionadas com diversas variáveis socioeconômicas, o que dificulta ainda mais essa identificação (Zucco 2013Zucco, C. (2013), 'When payouts pay off: Conditional cash transfers and voting behavior in brazil 2002-10', American Journal of Political Science 57(4), 810-822.).

Não há muito que fazer a esse respeito, salvo tentar descartar alguns problemas de identificação por meio de testes de robustez, quando possível. Nesse sentido, um possível problema pode estar associado à orientação ideológica dos eleitores. Se os beneficiários do programa Bolsa Família têm um viés ideológico esquerdista, parte do efeito da variável BOLSAna votação de Lula pode ser, na verdade, resultado desse viés. Desse modo, foram estimados modelos similares aos apresentados nas seções anteriores para outros candidatos à presidente nas eleições de 2006 (Geraldo Alckmin, Heloísa Helena e Cristovam Buarque). Os dois últimos são ideologicamente alinhados com a esquerda, como Lula. Caso se encontre algum efeito positivo da variável BOLSA na votação dos mesmos, seria uma indicação de que o viés esquerdista dos beneficiários contaminou a estimação do efeito do programa Bolsa Família.

Entretanto, os resultados da Tabela 8 mostra que para todos os candidatos o coeficiente da variável BOLSA se mostrou negativo. Embora esse resultado não permita descartar completamente a possibilidade de viés ideológico, trata-se de um indício a esse respeito.

Tabela 8:
Impacto do Programa Bolsa Família na Votação de Outros Candidatos

Outro problema de identificação está relacionado ao padrão espacial dos votos de Lula em 2006. Sendo assim, foram estimadas especificações nas quais a variável BOLSAinterage com variáveis binárias regionais. Se no Nordeste o efeito for mais forte do que em regiões mais desenvolvidas, é possível que o discurso mais populista de Lula tenha tido papel relevante na mudança do seu padrão de votação. Nesse caso, é possível que o efeito estimado do programa Bolsa Família seja, ao menos em parte, resultado da identificação do públicoalvo nordestino com Lula. A Tabela 9 indica que para o segundo turno não parece haver tal viés. As interações não são conjuntamente significativas ao nível de confiança de 95%. Também não é possível discernir, do ponto de vista estatístico, os coeficientes das interações que envolvem a variável binária do Nordeste e a do Sudeste. Entretanto, para o primeiro turno, as interações se mostram conjuntamente significantes e o coeficiente da interação que envolve a variável binária do Nordeste é claramente superior ao do Sudeste. Desse modo, os resultados do primeiro turno devem ser encarados com alguma reserva.

Tabela 9:
Resultados de Especificações Alternativas - Interações com Efeitos Regionais

Por fim, convém retomar o resultado de que o efeito do programa Bolsa Família e do crescimento da economia é distinto em municípios com diferentes rendas per capita e votações de Lula em 2002. Sendo assim, foram estimados modelos similares aos modelos A3 e B3 (ver Tabela 3 e Tabela 4), mas adicionando-se seguintes interações: BOLSAxRENDA, BOLSAxLULA20021T (ou BOLSAxLULA20022T, para o segundo turno), CRESCxRENDA e CRESCxLULA20021T (ou BOLSAxLULA20022i, para o segundo turno). A Tabela 10 apresenta os coeficientes das variáveis de interesse (BOLSA e CRESC) e das interações que as envolvem (os demais coeficientes não sofreram alterações importantes e, por isso, não foram apresentados).21 21 Também foram estimados modelos com apenas algumas das interações. Como os resultados não se alteraram muito, somente as estimativas do modelo com todas as interações foram apresentadas.

Tabela 10:
Resultados de Especificações Alternativas - Interações com LULA20021T (ou LULA20022T) e RENDA

Novamente, os coeficientes estimados são de difícil interpretação. De todo modo, é possível perceber que, nos dois turnos, o efeito do programa Bolsa Família se reduz com o incremento da renda per capita. Por sua vez, a proporção de votos em Lula nas eleições de 2002 aumenta (reduz) o impacto do crescimento econômico na votação de Lula em 2006 no primeiro (segundo) turno.

Entretanto, uma das vantagens da abordagem econométrica utilizada é que, embora não seja possível identificar os parâmetros do modelo de decisão individual, consegue-se inferir a importância relativa de cada variável na decisão do eleitor. Os parâmetros do modelo agregado permitem inferir algo sobre o comportamento individual. Mais especificamente, a razão entre cada um dos coeficientes do modelo de decisão individual - vetor υ, ver equação 4 - e cada um dos coeficientes do modelo agregado-vetor λ, ver equação 10-é a mesma (1 + b 1) (Heckelman 1997Heckelman, J. C. (1997), 'Determining who voted in historical elections: An aggregated logit approach', Social Science Research 26(2), 121-134.). Em outras palavras, tem-se que λ = (1 + b 1) υ.

Da equação 12 não é difícil perceber que, para o modelo agregado do primeiro turno, os efeitos marginais das variáveis BOLSA e CRESC na votação de Lula em 2006 () serão nulos quando:

em que λBOLSA é o coeficiente da variável BOLSA, λ CRESC é o coeficiente da variável CRESC, λ 1 é o coeficiente da variável BOLSA×RENDA, λ 2 é o coeficiente da variável BOLSA × LULA20021T , λ 3 é o coeficiente da variável CRESC × RENDA e λ 4 é o coeficiente da variável CRESC × LULA20021T . Para o segundo turno, o resultado é análogo.

A título de ilustração, em um município em que a votação de Lula foi 100% em 2002 (LULA20021T = 1) a renda per capita necessária para tornar nulo o efeito do programa Bolsa Família na votação de Lula em 2006 é:

Como λ = (1 + b1) υ, a condição que vale para o modelo agregado também vale para o modelo de decisão individual. Ou seja, para um eleitor que votou em Lula em 2002, a renda individual que torna nulo o efeito do recebimento do benefício do programa Bolsa Família na probabilidade de se votar nesse mesmo candidato em 2006 é exatamente a mesma calculada em 14:

em que υbolsa, υ1 e υ2 são as contrapartidas individuais de λBOLSA, λ 1 e λ 2. Nesse sentido, a Figura 8 apresenta um exercício bastante informativo para o primeiro turno das eleições. É calculado o valor de ΩBOLSA para diferentes níveis de renda individual mensal. Também são discriminados os eleitores habituais de Lula (LULA20021T = 1) dos demais eleitores (LULA20021T = 0). O mesmo é feito para o segundo turno na Figura 9. Note-se que, embora o exercício tenha sido feito para valores de renda até R$ 2.000 mensais, ele somente faz sentido para valores mais baixos, pois somente esses eleitores são elegíveis para participar do programa Bolsa Família.22 22 De acordo com dados da PNAD de 2006, 75% das pessoas beneficiadas pelo programa Bolsa Família tinham renda inferior R$ 575 (a preços de 2000). Desse modo, entre os eleitores habituais de outros candidatos que são elegíveis para participar do programa Bolsa Família, o efeito do recebimento do benefício é positivo. Por sua vez, tomando-se o mesmo grupo de renda, mas entre os eleitores habituais de Lula, e considerando-se intervalos de confiança calculados ao nível de significância de 5%, o efeito é nulo (ou algo muito próximo disso).

Figura 8
BOLSA e Renda (1º Turno)

Figura 9
BOLSA e Renda (2º Turno)

A Figura 10 (Figura 11) repete o exercício da Figura 8 (Figura 9) para o valor de ΩCRESC. No primeiro turno o crescimento econômico somente teve impacto positivo na votação de Lula em 2006 para eleitores mais ricos (a partir de R$ 890 para eleitores habituais de outros candidatos e a partir de R$ 520 para eleitores habituais de Lula, levando-se em consideração o intervalo de confiança de 95%). No segundo turno o efeito foi sempre positivo para eleitores habituais de outros candidatos. Para eleitores habituais de Lula o efeito chega a ser negativo entre os eleitores muito pobres (renda abaixo de R$ 415). Tais resultados parecem indicar que os eleitores mais pobres estão tão alijados dos ganhos advindos do crescimento econômico, que simplesmente não levaram essa variável em consideração quando decidiram seu voto nas eleições de 2006.

Figura 10
CRESC e Renda (1º Turno)

Figura 11
CRESC e Renda (2º Turno)

6 Considerações Finais

O que explicaria a mudança no padrão de votação de Lula nas eleições presidenciais de 2006: desempenho da economia ou a massificação do programa Bolsa Família? Ao contrário de boa parte da literatura anterior, a resposta é: nenhum dos dois. O impacto do programa de transferência de renda se mostrou bastante superior ao do crescimento da economia, mas parece não ser a principal explicação para a migração significativa de votos em direção do candidato do PT nas regiões menos desenvolvidas do Brasil.

Nesse sentido, ganha bastante apelo a conjectura de que, independente do partido e do candidato, os eleitores de regiões menos desenvolvidas, mais dependentes do setor público, seriam mais propensos a votar no governo estabelecido (Zucco 2008Zucco, C. (2008), 'The president's 'new' constituency: Lula and the pragmatic vote in brazil's 2006 presidential elections', Journal of Latin American Studies 40(1), 29-39.). O mesmo pode ser dito com relação à hipótese de Hunter & Power (2007)Hunter, W. & Power, T. J. (2007), 'Rewarding Lula: Executive power, social policy, and the brazilian elections of 2006', Latin American Politics and Society 49(1), 1-30. sobre os efeitos dos escândalos de corrupção na base eleitoral tradicional de Lula. No entanto, essas hipóteses são difíceis de serem empiricamente testadas. Uma possível abordagem é a utilização de dados de várias eleições.

Ressalte-se também que a metodologia empregada nesse artigo (Kelejian 1995Kelejian, H. H. (1995), 'Aggregated heterogeneous dependent data and the logit model: A suggested approach', Economics Letters 47(3-4), 243-248.) tem a vantagem de lidar adequadamente com o problema de viés de agregação. Além disso, mesmo com dados agregados, essa metodologia permite alguma inferência sobre o comportamento individual dos eleitores. A esse respeito, entre eleitores habituais de Lula, o recebimento do programa Bolsa Família não aumenta a probabilidade de voto nesse candidato em 2006. Entre os eleitores habituais de outros candidatos, esse efeito é positivo. Por sua vez, um maior crescimento econômico somente se traduziu em mais votos para Lula em 2006 entre os eleitores mais ricos. Esses resultados parecem indicar que os eleitores mais pobres estão tão alijados dos ganhos advindos do crescimento econômico, que simplesmente não levaram essa variável em conta quando decidiram seu voto nas eleições de 2006.

Por fim, boa parte das variáveis explicativas foi incluída com valores do ano 2000. Trata-se de uma restrição imposta pela agregação das decisões individuais em nível municipal, cuja maioria das informações remete ao Censo Demográfico de 2000. Sendo assim, não é possível, por exemplo, um exercício contrafactual para a renda per capita(RENDA) como os realizados para as variáveis que medem o alcance do programa Bolsa Família e o crescimento econômico. Nesse caso, a única solução é o uso de dados agregados estaduais, mais sujeitos ao viés de agregação, porém com informações disponíveis para os anos de 2002 e 2006.

Nesse sentido, o uso de dados da Pesquisa Nacional de Amostras por Domicílio (PNAD) pode ser bastante promissor, inclusive porque o suplemento de 2006 permite identificar se determinado indivíduo pertence a uma família beneficiária do programa Bolsa Família (e o valor do benefício recebido), o que abriria caminho para o uso de modelos logit com coeficientes aleatórios (Nevo 2000Nevo, A. (2000), 'A practitioner's guide to estimation of random-coefficients logit models of demand', Journal of Economics & Management Strategy 9(4), 513-548.). Esse tipo de modelagem permite considerar atributos individuais não observáveis e também a distribuição dos atributos individuais observáveis dos eleitores.23 23 Além disso, ao considerar a distribuição dos atributos individuais, este modelo contorna o problema de viés de agregação. Para uma aplicação deste modelo ao estudo de eleições ver (Glasgow (2001). Além disso, com as informações disponíveis na PNAD seria possível identificar melhor o efeito do desempenho da economia, na medida em que, além da taxa de crescimento do PIB, outras variáveis relacionadas ao ambiente econômico - renda do trabalho, desemprego e formalização, por exemplo - poderiam ser usadas. Nesse caso o efeito do crescimento pró-pobre na votação de Lula (Hunter & Power 2007Hunter, W. & Power, T. J. (2007), 'Rewarding Lula: Executive power, social policy, and the brazilian elections of 2006', Latin American Politics and Society 49(1), 1-30., Shikida et al. 2009Shikida, C. D., Monasterio, L. M., Araujo Jr, A. F., Carraro, A. & Damé, O. M. (2009), " 'It is the economy, companheiro!": an empirical analysis of Lula's re-election based on municipal data', Economics Bulletin 29(2), 977-992.) poderia ser mais bem medido. No entanto, tal estratégia somente será adotada em estudos subsequentes.

Agradecimentos

O autor agradece a César Zucco e Leonardo Monastério pelo compartilhamento das bases de dados usadas respectivamente em Zucco (2008) e Shikida et al. (2009). Agradecimento também a dois pareceristas anônimos, Adriana Hernandez-Perez, Samuel Pessôa, Régis Bonelli e diversos participantes de seminários no IBRE/FGV e na EPGE/FGV pelos comentários. Os erros remanescentes são de responsabilidade do autor e as opiniões expressas não refletem as posições da FGV ou do IBRE.

Referências Bibliográficas

  • Bohn, S. R. (2011), 'Social policy and vote in Brazil. Bolsa Familia and the Shifts in Lula's electoral base', Latin America Research Review 46(1), 54-79.
  • Brown, P. J. & Payne, C. D. (1986), 'Aggregate data, ecological regression, and voting transitions', Journal of American Statistical Association 81(394), 452-460.
  • De La O, A. (2013), 'Do conditional cash transfers affect electoral behavior? evidence from a randomized experiment in Mexico', American Journal of Political Science 57(1), 1-14.
  • Freedman, D. A., Klein, S. P., Sacks, J., Smyth, C. A. & Everett, C. G. (1991), 'Ecological regression and voting rights', Evaluation Review 15(6), 673-711.
  • Glasgow, G. (2001), 'Mixed logit models for multiparty elections', Political Analysis 9(2), 116-136.
  • Gorman, W. (1953), 'Community preference field', Econometrica 21(1), 63-80.
  • Heckelman, J. C. (1997), 'Determining who voted in historical elections: An aggregated logit approach', Social Science Research 26(2), 121-134.
  • Heckelman, J. C. (2000), 'Revisiting the relationship between secret ballots and turnout. a new test of two legal-institutional theories', American Politics Research 28(2), 194-215.
  • Heckelman, J. C. & Sullivan, T. S. (2002), Testing for aggregation bias in a non-linear framework: Some Monte Carlo results, Mimeo, Winston-Salem, Edwardsville.
  • Hunter, W. & Power, T. J. (2007), 'Rewarding Lula: Executive power, social policy, and the brazilian elections of 2006', Latin American Politics and Society 49(1), 1-30.
  • Kelejian, H. H. (1995), 'Aggregated heterogeneous dependent data and the logit model: A suggested approach', Economics Letters 47(3-4), 243-248.
  • Kieschnick, R. & McCullough, B. D. (2003), 'Regression analysis of variates observed on (0, 1): percentages, proportions and fractions', Statistical Modelling 3(3), 193-213.
  • King, G. (1997), A Solution to the Ecological Inference Problem: Reconstructing Individual Behavior from Aggregated Data, Princeton University Press, Princeton.
  • Labonne, J. (2013), 'The local electoral impacts of conditional cash transfers: Evidence from a field experiment', Journal of Development Economics 104, 73-88.
  • Licio, E. C., Rennó, L. R. & Castro, H. C. O. (2009), 'Bolsa família e o voto na eleição presidencial de 2006: em busca do elo perdido', Opinião Pública 15(1), 31-54.
  • Maddala, G. S. (1983), Limited-Dependent and Qualitative Variables in Econometrics, Cambridge University Press, Cambridge.
  • Marques, R. M., Leite, M. G., Mendes, A. & Ferreira, M. R. J. (2009), 'Discutindo o papel do programa bolsa família na decisão das eleições presidenciais brasileiras de 2006', Revista de Economia Política 29(1), 114-132.
  • Nevo, A. (2000), 'A practitioner's guide to estimation of random-coefficients logit models of demand', Journal of Economics & Management Strategy 9(4), 513-548.
  • Nicolau, J. & Peixoto, V. (2007), 'Uma disputa em três tempos: Uma análise das bases municipais das eleições presidenciais de 2006', Anais do XXXI Encontro Nacional da ANPOCS.
  • Shikida, C. D., Monasterio, L. M., Araujo Jr, A. F., Carraro, A. & Damé, O. M. (2009), " 'It is the economy, companheiro!": an empirical analysis of Lula's re-election based on municipal data', Economics Bulletin 29(2), 977-992.
  • Soares, G. A. D. & Terron, S. L. (2008), 'Dois Lulas: a geografia eleitoral da reeleição (explorando conceitos, métodos e técnicas de análise geoespacial)', Opinião Pública 14(2), 269-301.
  • Souza, T. C. & Cribari Neto, F. (2013), 'Uma estimativa do impacto eleitoral do programa bolsa-família', Revista Brasileira de Biometria 31(1), 79-103.
  • Stoker, T. M. (1993), 'Empirical approaches to the problem of aggregation over individuals', Journal of Economic Literature 31(4), 1827-1874.
  • Train, K. E. (2003), Discrete Choice Methods with Simulation, Cambridge University Press, Cambridge.
  • Zucco, C. (2008), 'The president's 'new' constituency: Lula and the pragmatic vote in brazil's 2006 presidential elections', Journal of Latin American Studies 40(1), 29-39.
  • Zucco, C. (2013), 'When payouts pay off: Conditional cash transfers and voting behavior in brazil 2002-10', American Journal of Political Science 57(4), 810-822.
  • 24
    JEL classification: H53, I38.
  • 1
    Esse último resultado vale também para a votação no segundo turno. Obviamente, não é possível comparar as votações de Lula no segundo turno em 1998 e 2002, pois em 1998 a eleição foi decidida no primeiro turno.
  • 2
    Para um resumo deste debate na imprensa ver Marques et al. (2009)Marques, R. M., Leite, M. G., Mendes, A. & Ferreira, M. R. J. (2009), 'Discutindo o papel do programa bolsa família na decisão das eleições presidenciais brasileiras de 2006', Revista de Economia Política 29(1), 114-132..
  • 3
    Na verdade, os próprios autores reconhecem a necessidade de análise quantitativa adicional para identificar e medir adequadamente a importância relativa de cada fator.
  • 4
    Dado o caráter secreto dos votos, este é um problema recorrente na literatura que analisa os resultados de eleições (ver, por exemplo, Brown & Payne 1986Brown, P. J. & Payne, C. D. (1986), 'Aggregate data, ecological regression, and voting transitions', Journal of American Statistical Association 81(394), 452-460., Freedman et al. 1991Freedman, D. A., Klein, S. P., Sacks, J., Smyth, C. A. & Everett, C. G. (1991), 'Ecological regression and voting rights', Evaluation Review 15(6), 673-711., Heckelman 1997Heckelman, J. C. (1997), 'Determining who voted in historical elections: An aggregated logit approach', Social Science Research 26(2), 121-134., 2000Heckelman, J. C. (2000), 'Revisiting the relationship between secret ballots and turnout. a new test of two legal-institutional theories', American Politics Research 28(2), 194-215.).
  • 5
    Alguns autores tentam contornar esse problema usando dados individuais extraídos de pesquisas de opinião (Bohn 2011Bohn, S. R. (2011), 'Social policy and vote in Brazil. Bolsa Familia and the Shifts in Lula's electoral base', Latin America Research Review 46(1), 54-79., Licio et al. 2009Licio, E. C., Rennó, L. R. & Castro, H. C. O. (2009), 'Bolsa família e o voto na eleição presidencial de 2006: em busca do elo perdido', Opinião Pública 15(1), 31-54., Zucco 2013Zucco, C. (2013), 'When payouts pay off: Conditional cash transfers and voting behavior in brazil 2002-10', American Journal of Political Science 57(4), 810-822.). Entretanto, muitas dessas pesquisas sequer conseguem reproduzir o percentual de votação obtido pelos candidatos nas eleições de 2006. Desse modo, não há como escapar do uso de dados agregados.
  • 6
    A função η(.) é usualmente denominada função de ligação (Kieschnick & McCullough 2003Kieschnick, R. & McCullough, B. D. (2003), 'Regression analysis of variates observed on (0, 1): percentages, proportions and fractions', Statistical Modelling 3(3), 193-213.).
  • 7
    Para os valores médios das variáveis explicativas é bastante provável que os efeitos marginais sejam semelhantes para modelos não lineares e lineares, uma vez que estes últimos podem ser considerados aproximações de primeira ordem dos demais. No entanto, quanto mais distante das médias, pior será esta aproximação.
  • 8
    Uma exceção é (Souza & Cribari Neto (2013)Souza, T. C. & Cribari Neto, F. (2013), 'Uma estimativa do impacto eleitoral do programa bolsa-família', Revista Brasileira de Biometria 31(1), 79-103., que usam a função de ligação logística.
  • 9
    O resultado não depende, por exemplo, da independência da distribuição dos atributos individuais dentro de cada município.
  • 10
    Na verdade, os pesos devem ser redefinidos para que sua soma seja igual ao número de observações.
  • 11
    Basta notar que υMaddala 1983Maddala, G. S. (1983), Limited-Dependent and Qualitative Variables in Econometrics, Cambridge University Press, Cambridge., p. 30). Então σs =
    V ar(
    ), o que estabelece o resultado de que V ar(
    ) =
    . Note que V ar(
    ) se aproxima de zero quando μs se aproxima de zero ou um.
    (
  • 12
    Esta hipótese implica assumir que (
    tem distribuição aditiva logística normal.
  • 13
    Na verdade, para evitar multicolinearidade perfeita com outras variáveis, foram omitidas as dummies correspondentes aos estados de Roraima e Acre.
  • 14
    Os modelos indexados pela letra A se referem aos votos do 1º turno, os indexados pela letra B dizem respeito ao 2º turno.
  • 15
    lém disso, para K = 4 as estimativas tornam-se quase todas não significativas.
  • 16
    O sinal é o contrário do encontrado em Zucco (2008)Zucco, C. (2013), 'When payouts pay off: Conditional cash transfers and voting behavior in brazil 2002-10', American Journal of Political Science 57(4), 810-822..
  • 17
    O sinal da variável GINI se mostrou contrário ao encontrado em Shikida et al. (2009)Shikida, C. D., Monasterio, L. M., Araujo Jr, A. F., Carraro, A. & Damé, O. M. (2009), " 'It is the economy, companheiro!": an empirical analysis of Lula's re-election based on municipal data', Economics Bulletin 29(2), 977-992..
  • 18
    O aumento da taxa de mortalidade infantil (MORT) também deprime a votação de Lula, mas apenas no segundo turno. No primeiro turno o sinal encontrado foi positivo.
  • 19
    A diferença principal é que no primeiro turno a relação entre a votação de Lula nas eleições de 2002 e 2006 é mais fraca do que no segundo turno.
  • 20
    Novamente, a diferença entre os impactos do programa Bolsa Família e do crescimento da economia na votação de Lula no primeiro e no segundo turno está em linha com os resultados encontrados na Tabela 5. O efeito marginal da variável BOLSA é um pouco menor no segundo turno, enquanto o efeito marginal da variável CRESC é quase o dobro.
  • 21
    Também foram estimados modelos com apenas algumas das interações. Como os resultados não se alteraram muito, somente as estimativas do modelo com todas as interações foram apresentadas.
  • 22
    De acordo com dados da PNAD de 2006, 75% das pessoas beneficiadas pelo programa Bolsa Família tinham renda inferior R$ 575 (a preços de 2000).
  • 23
    Além disso, ao considerar a distribuição dos atributos individuais, este modelo contorna o problema de viés de agregação. Para uma aplicação deste modelo ao estudo de eleições ver (Glasgow (2001)Glasgow, G. (2001), 'Mixed logit models for multiparty elections', Political Analysis 9(2), 116-136..

Apêndice A Efeitos marginais, elasticidadese viés de agregação

Na seção 5.1 foi mencionado que a incorporação da correção para o viés de agregação gerava diferenças não desprezíveis nas estimativas de efeitos marginais e de elasticidades. Nesse sentido, a Tabela A.1ilustra essa afirmação para as duas principais variáveis explicativas utilizadas (BOLSA e CRESC).

Tabela A.1:
Efeitos Marginais e Elasticidades - Comparação entre Modelos

Para o primeiro turno, comparando-se os modelos A1 e A3, nota-se que o efeito marginal da variável BOLSA(CRESC) é aproximadamente 11,3% menor (11,7% maior) quando se controla o viés de agregação. Analogamente, para o segundo turno (modelos B1 e B3), o efeito marginal da variável BOLSA (CRESC) é aproximadamente 9,1% menor (11,0% menor). Resultados similares são encontrados para as elasticidades. A interpretação desses resultados é bastante difícil, na medida em que a magnitude e a direção do viés de agregação dependem da distribuição das variáveis explicativas entre os eleitores (ver seção 3.1).

Datas de Publicação

  • Publicação nesta coleção
    Jan-Mar 2015

Histórico

  • Recebido
    23 Ago 2012
  • Aceito
    12 Dez 2014
Faculdade de Economia, Administração e Contabilidade de Ribeirão Preto da Universidade de São Paulo Avenida dos Bandeirantes, 3.900, CEP 14040-900 Ribeirão Preto SP Brasil, Tel.: +55 16 3315-3910 - Ribeirão Preto - SP - Brazil
E-mail: revecap@usp.br