SciELO - Scientific Electronic Library Online

 
vol.40 número4Símbolo e signo: o dinheiro no capitalismo contemporâneo índice de autoresíndice de assuntospesquisa de artigos
Home Pagelista alfabética de periódicos  

Serviços Personalizados

Artigo

Indicadores

Links relacionados

Compartilhar


Estudos Econômicos (São Paulo)

versão impressa ISSN 0101-4161

Estud. Econ. vol.40 no.4 São Paulo out./dez. 2010

http://dx.doi.org/10.1590/S0101-41612010000400001 

O impacto da escolaridade sobre a distribuição de renda

 

 

Marcio Antonio SalvatoI; Pedro Cavalcanti Gomes FerreiraII; Angelo José Mont'Alverne DuarteIII

IDepartamento de Economia, IBMEC-MG e Escola de Pós-Graduação em Economia, Fundação Getulio Vargas (EPGE-FGV/RJ). E-mail: marcio.salvato@gmail.com
IIEscola de Pós-Graduação em Economia, Fundação Getulio Vargas (EPGE-FGV/RJ). E-mail: ferreira@fgv.br
IIIBanco Central do Brasil. E-mail: angelo.duarte@fazenda.gov.br

Endereço para contato

 

 


RESUMO

Este trabalho investiga o impacto da escolaridade sobre a distribuição de renda do trabalho de Estados/ regiões do Brasil, usando um método semiparamétrico, seguindo DiNardo, Fortin e Lemieux (1996) e informações da PNAD de 1999. Foram construídas densidades contrafactuais, reponderando a distribuição da região/Estado mais pobre (Nordeste/Ceará) pelo perfil de escolaridade da mais rica (Sudeste/São Paulo). Resultados: entre 12% e 36% do diferencial de renda é explicado pelo diferencial de escolaridade; a reponderação pela escolaridade aumentou em cerca de 55% a renda média nos contrafactuais; a renda do contrafactual do Nordeste equivale a 93% da renda média brasileira; quanto mais elevado for o percentil de renda considerado, maior é a contribuição da diferença de escolaridade para a diferença de renda; a dispersão de renda das regiões mais pobres aumenta quando fornecemos a elas o nível de escolaridade das regiões mais ricas, mantendo-se o perfil salarial da região.

Palavras-Chave: distribuição de renda, educação, método semiparamétrico


ABSTRACT

This paper investigates the impact of education on income distribution of Brazilian states and regions, using a semi parametric method, following Dinardo, Fortin and Lemieux (1996) and dataset from the PNAD 1999. Contrafactual densities were constructed weighting the distribution of the poorest region/state (Northeast / Ceará) by the profile of education in the richer one (Southeast / São Paulo). Results: between 12% and 36% of the difference in income is explained by the educational differences; the weighting by education increased by about 55% the average income in counterfactuals; the counterfactual income of the Northeast amounts to 93% of the average Brazilian income; the higher the percentile considered income, the greater the contribution of the difference in schooling for the difference in income; and the income dispersion of the poorest regions increases when they provide the level of schooling of the richest regions, while the wage profile of the region is kept constant.

Keywords: income distribution, education, semiparametric method

JEL Classification C14, I20, J31


 

 

1 Introdução

A desigualdade de renda existente entre as regiões brasileiras, notadamente entre a região Sudeste e as regiões Norte e Nordeste, é objeto permanente de discussões entre acadêmicos, elaboradores de políticas governamentais e membros da classe política. Ainda no século XIX, o Imperador D. Pedro II já demonstrava sua preocupação ao afirmar que venderia sua coroa para matar a fome dos nordestinos. Ao longo desses quase 150 anos, vários foram os diagnósticos apresentados e as soluções e programas implementados com objetivo de diminuir essa desigualdade. As políticas governamentais se intensificaram e se tornaram sistemáticas a partir da década de 1950 quando, sob a liderança do economista Celso Furtado, foi publicado o documento Uma política para o desenvolvimento do Nordeste que sugeria a industrialização como forma de diminuir a disparidade entre as rendas das regiões Nordeste e Sudeste. Esse documento inspirou a criação da SUDENE e da SUDAM na qualidade de órgãos planejadores e executores das políticas de combate às desigualdades regionais, e do BNB e BASA na qualidade de agentes financeiros de desenvolvimento regional. A Constituição Federal de 1988 não foi silente em relação à questão e determinou a alocação de 3% das receitas de impostos sobre a renda e produtos industrializados em programas de financiamento ao setor produtivo nas regiões Norte, Nordeste e Centro-Oeste.

Apesar da elevada quantidade de órgãos e programas governamentais em nível federal e estadual que se prestam ao desenvolvimento econômico regional, as políticas governamentais implementadas nesses últimos 50 anos se utilizaram fortemente dos mesmos instrumentos: concessão de incentivos fiscais e crédito público subsidiado à iniciativa privada e investimento estatal em infraestrutura. Estima-se que, entre 1989 e 2002, os Fundos Constitucionais de desenvolvimento regional tenham aplicado recursos da ordem de US$ 10 bilhões (FERREIRA, 2004). Embora bem sucedidas em algumas dimensões, como a de acelerar o processo de industrialização nas regiões Nordeste e Norte, essas políticas não foram competentes em transformar os indicadores sociais, reduzir o nível de pobreza e modificar a distribuição de renda da região.

Entretanto, podemos pensar em uma abordagem alternativa para o problema de desigualdade regional no Brasil. Ela baseia-se na tese de que a baixa renda per capita nas regiões Norte e Nordeste está relacionada com a concentração de indivíduos com baixa escolaridade (baixo capital humano) e baixo capital físico, o que fazem com que suas rendas sejam pequenas. Dessa forma, a redução da desigualdade regional confunde-se com o combate à pobreza e, para tal, necessita-se de uma política de educação e qualificação profissional e programas de acesso ao crédito.

Pessoa (2000) sugere que há dois enfoques em relação ao problema de desigualdade de renda: o primeiro, e mais importante, está relacionado à diferença de renda per capita entre as regiões, e o segundo, bem menos significativo, se refere à distribuição espacial da produção. Segundo o autor, supondo-se que há perfeita mobilidade de mão de obra entre as regiões, só pode haver diferencial de renda per capita entre as regiões se as características dos indivíduos das regiões diferirem. Dessa forma, as políticas de desenvolvimento baseadas em subsídios e acumulação de capital físico, que foram adotadas no Brasil, sempre tentaram focar o primeiro problema, mas, na verdade, são mais adequadas ao segundo enfoque. Barros (1993), Barros e Mendonça (1995) e Barros, Camargo e Mendonça (1997) reforçam a tese da importância das características dos indivíduos, notadamente daquelas relacionadas à educação, na determinação da diferença de renda através de evidências empíricas.

Bourguignon, Ferreira e Leite (2002) investigaram as diferenças entre as distribuições de renda do Brasil, EUA e México, utilizando uma extensão de Oaxaca (1973) e de Blinder (1973), que consiste na simulação de distribuições contrafactuais construídas a partir da substituição dos valores originais dos parâmetros da distribuição pelos da distribuição de outro país. Dessa forma, pode-se medir o efeito na distribuição de renda de um país caso alguma característica dos indivíduos, representada por um parâmetro da distribuição de renda, seja equiparada a de outro país. Concluiu-se que a desigualdade de dotação de capital humano e transferências explica cerca de 2/3 da diferença de desigualdade entre o Brasil e o EUA.

Neste trabalho, analisaremos os efeitos de uma alteração nas características educacionais de uma região1 sobre a sua distribuição de renda do trabalho. Utilizamos uma abordagem não paramétrica apresentada em DiNardo, Fortin e Lemieux (1996) quando analisaram os efeitos de fatores institucionais e do mercado de trabalho, tais como valor do salário mínimo e grau de sindicalização, sobre a distribuição de salários-hora2 nos Estados Unidos. Nessa metodologia, os efeitos sobre

o valor dos salários de uma determinada característica da população ou fator que influencie o comportamento da mesma são mensurados ao aplicar-se um método não paramétrico de estimação da função de densidade, reponderando-se as amostras pela característica/fator que se pretende analisar. Constroe-se, dessa forma, o que denominamos de distribuição contrafactual, a qual pode ser comparada com a distribuição original dos salários da população. No nosso caso, trabalharemos com a distribuição da renda do trabalho a partir dos dados da Pesquisa Nacional por Amostra de Domicílios (PNAD), uma vez que não se dispõe de dados de salários para o Brasil.

Essa abordagem tem o mesmo fundamento da decomposição de Oaxaca (1973),3 que se baseia na construção de contrafactuais, mas, ao contrário deste - que realizou seu trabalho analisando somente as médias das distribuições -, analisaremos toda a distribuição. A metodologia que empregamos nos permite visualizar claramente a função de densidade da renda do trabalho, assim como observar as alterações que ocorreriam nessa distribuição caso a população sofresse qualquer alteração nas condições educacionais, mantendo-se a estrutura de remuneração do trabalho originalmente vigente. Neste sentido, ao invés de focarmos o estudo de diferencial de renda e educação em algum índice de desigualdade, como, por exemplo, os coeficientes de Gini e de Theil ou a variância do logaritmo dos rendimentos, pretendemos extrair nossas conclusões observando toda a distribuição de renda do trabalho, usando medidas de diferenças de distribuições e teste de desigualdade de distribuições de Kolmogorov-Smirnov.

A construção das distribuições contrafactuais se faz reponderando a amostra conforme alguma característica que se pretende estudar. Ou seja, para estudarmos os efeitos da escolaridade sobre a renda do trabalho, estimamos a distribuição da renda do trabalho reponderando-se as amostras disponíveis, de tal forma que as mesmas passem a compor uma população com o perfil de escolaridade que se deseja. Dessa forma, podemos obter a distribuição da renda do trabalho de uma região, caso ele tivesse o perfil de escolaridade de outra região, mantendo a sua estrutura de remuneração original. Deve ficar claro que existe uma limitação dessa metodologia, uma vez que são considerados apenas efeitos parciais, não sendo possível analisar os efeitos em equilíbrio geral. No entanto, esta abordagem será bastante útil para responder perguntas do tipo: qual seria a distribuição de renda do trabalho no Estado do Ceará se as condições de educação fossem semelhantes às do Estado de São Paulo, mantendo-se as demais características constantes?

No presente trabalho, mensuramos a mudança na distribuição de renda do trabalho do Estado do Ceará e da região Nordeste, caso a população residente nessas regiões obtivesse a mesma escolaridade do Estado de São Paulo e da região Sudeste.4

Na seção seguinte, apresentamos alguns fatos estilizados que ilustram o problema de desigualdade no Brasil. Na seção 3, apresentamos os dados utilizados na análise a que se propõe este trabalho. Na seção 4, discutimos detalhadamente a metodologia de estimação de densidade de núcleo ponderada (weighted kernel density estimator) e a construção de densidades contrafactuais, além de apresentarmos algumas medidas paramétricas e não paramétricas utilizadas para comparar as densidades estimadas. Os resultados são apresentados na seção 5 e, finalmente, na seção 6, concluímos.

 

2 Fatos Estilizados

A desigualdade entre as regiões e Estados brasileiros pode ser verificada tanto nos indicadores de bem-estar da população como no nível de renda dos seus habitantes. A diferença entre os Índices de Desenvolvimento Humano (IDH) das regiões diminuiu entre 1991 e 2000; a distância entre os IDHs das regiões Nordeste e Sudeste, por exemplo, que era 0,16 em 1991, passou para 0,12 em 2000 (Tabela 1).5 No entanto, a posição relativa das regiões não mudou desde 1970, quando o índice foi computado pela primeira vez. Além disso, a posição relativa dos Estados também não apresentou expressiva mudança no mesmo período, haja vista que os nove Estados nordestinos sempre se situaram entre as 11 unidades da Federação com piores IDH no período compreendido entre 1970 e 2000. A desigualdade de renda, medida pelos coeficientes de Theil e de Gini,6 se agravou em todas as regiões brasileiras nas décadas de 1970 e 1980, e apresentou uma leve melhora na década seguinte; no entanto, a piora foi mais acentuada nas regiões Norte e Nordeste, o que as tornou ainda mais desiguais quando comparadas com a região Sudeste (Tabela 2).

Em termos de PIB per capita, as diferenças regionais se mantêm desde a década de 1940 (Gráfico 1); nem mesmo a participação relativa da região Nordeste no PIB nacional se alterou, de fato, diminuiu de 16,7%, em 1939, para 14,8% em 1960, e chegou a 13,1% em 2000.7

 

 

Os dados do censo de 2000 mostram que há uma relação linear e positiva entre a renda per capita nos Estados e a escolaridade média da sua população acima de 25 anos (Gráfico 2), o que corroboraria a tese de que as disparidade regionais de renda refletem as diferenças de capital humano de seus habitantes.

 

 

3 Dados

Utilizamos os dados da Pesquisa Nacional por Amostras Domiciliares (PNAD) do ano de 1999, com as ponderações obtidas a partir dos resultados do censo de 2000. Os resultados da PNAD são apresentados tanto em termos de indivíduos como em termos de domicílios. No caso da pesquisa por indivíduos, que é a de nosso interesse, dispõe-se de informações sobre as características gerais (UF de residência atual, idade, gênero, raça, cor, etc.), características de migração (UF onde nasceu, UF onde morava cinco anos antes da pesquisa, etc.), educação, trabalho e renda dos pesquisados. A cada indivíduo entrevistado, é atribuído um peso, que traduz o quanto as pessoas com as suas características representam em relação à população.

A amostra utilizada consistiu nos indivíduos com renda do trabalho positiva no mês de referência da pesquisa (setembro/1999), com escolaridade conhecida e com jornada de trabalho maior ou igual a 40 horas semanais. Excluiu-se as pessoas com jornada inferior a 40 horas a fim de se tentar uniformizar o tamanho da jornada e aproximar as medidas de renda do trabalho e de salário, uma vez que essa última variável seria a ideal para esse tipo de estudo.

Foram entrevistadas 352.393 pessoas em todo o território nacional, sendo que 67.111 tinham menos de 10 anos de idade na época, e para as quais não se aplica o questionário de trabalho e renda. Das 285.282 pessoas restantes, somente 173.634 eram economicamente ativas8 e, destas, 3.265 pessoas tinham escolaridade ou renda ignoradas, restando, portanto, 170.369 pessoas. A partir dessa amostra, que engloba indivíduos em todo o Brasil, extraímos cinco subamostras de acordo com a UF de residência do entrevistado: Estado do Ceará (CE), Estado de São Paulo (SP); região Nordeste (NE); região Sudeste, excluindo o Estado do Espírito Santo (SE1), e região Sudeste excluindo os Estados do Espírito Santo e São Paulo (SE2).9

Foram escolhidas as regiões Nordeste e Sudeste por se tratarem das regiões com menor e maior renda per capita, respectivamente. Os Estados do Ceará e de São Paulo foram escolhidos entre os da região Nordeste e da região Sudeste, respectivamente, pelo fato de o primeiro, mesmo sendo um dos Estados mais pobres da Federação, ser apontado como exemplo de sucesso na implantação de políticas de desenvolvimento baseadas na atração de investimentos industriais privados, e o segundo por se tratar do ente mais rico da Federação. A exclusão do Estado do Espírito Santo se deve ao fato de sua economia ser bem menos desenvolvida e industrializada que a dos demais Estados da região, a ponto de o mesmo ser também alvo das políticas públicas de combate à desigualdade regional, fazendo parte da área de atuação da SUDENE. Optou-se também por considerar uma subamostra que não englobasse o Estado de São Paulo, por se tratar de um Estado peculiar no que tange à sua renda per capita e ao seu elevado grau de industrialização, que são muito superiores aos dos demais Estados da região Sudeste e da Federação. Ademais, como veremos adiante, São Paulo é o único Estado no qual o valor do salário mínimo, que é determinado exogenamente pela União, não se constitui numa forte restrição à distribuição de renda do trabalho. Nos demais Estados, a moda da distribuição da renda do trabalho é exatamente o valor do salário mínimo.

As tabelas a seguir apresentam os quantitativos da amostra utilizada por região/Estado de interesse e as principais estatísticas descritivas, que foram calculadas considerando-se a ponderação de cada indivíduo.

Verifica-se, a partir da Tabela 4, que, quanto maior a renda média, menor a desigualdade de renda e de escolaridade, medidas aqui pelo coeficiente de variação de Pearson e pelo coeficiente de Gini. Isso nos permite levantar a hipótese de que a desigualdade de renda e de escolaridade são fortemente correlacionadas e, por sua vez, menores nas regiões/Estados mais ricos. A escolaridade média nas regiões mais pobres é cerca de três anos menor que nas regiões mais ricas. De fato, observa-se que a renda é diretamente proporcional à escolaridade, o que vem reforçar a hipótese de que o diferencial de renda pode ser explicado pela diferença de escolaridade.

Computamos, para cada região/Estado, a mediana do logaritmo da renda por nível de escolaridade. As curvas escolaridades x renda, também conhecidas como curvas de Mincer, se encontram plotadas nos Gráficos 3a e 3b. Depreende-se que o retorno marginal da escolaridade é crescente para níveis de escolaridade acima de 10 anos, ao contrário do que se observa nos países desenvolvidos com alto nível escolaridade da sua população.

 

 

 

 

Apesar de dispormos dos dados de um expressivo número de pessoas entrevistadas, como pode ser observado na última linha da Tabela 3, a quantidade de informação contida nessas entrevistas é bem menor do que aparenta. A renda, além de ter sido coletada como um valor inteiro, foi quase sempre reportada em múltiplos de R$10 ou do salário mínimo (R$136 à época) e ainda os valores concentram-se bastante em múltiplos de R$100. A quantidade de níveis de renda do trabalho situam-se entre 480, para CE, e 1040, para SE1.

 

4 Metodologia

Utilizaremos um modelo semiparamétrico para construir funções de densidade contrafactuais. Essas densidades contrafactuais são estimadas a partir de uma amostra que se gerou tomando por base a amostra original dos dados, alterando o atributo do qual se deseja estudar o impacto sobre a distribuição de renda. O método compreende duas etapas: a primeira, paramétrica, que resume-se à construção de funções de reponderação, e a segunda, não paramétrica, que consiste na estimação, baseada em funções núcleo, de funções de densidade, conforme proposto por Rosenblatt (1956) e Parzen (1962).

Seja a estimativa de densidade de núcleo da densidade f , cujo suporte é a variável w, baseada em uma amostra aleatória de tamanho n, {W1, W2, ...,Wn}, com ponderação θ1,..., θn , respectivamente, e onde Σi θi = 1. Temos então:

onde h é a janela e K(·) é a função núcleo. Os núcleos mais utilizados são o uniforme, o gaussiano e o de Epanechnikov, sendo que a sua escolha é uma decisão ad hoc do econometrista, que deve levar em conta a natureza da variável, cuja densidade está sendo estimada. No presente trabalho, acompanhando as sugestões de DiNardo, Fortin e Lemieux (1996) e Butcher e DiNardo (1998), adotamos o núcleo gaussiano e trabalhamos com o logaritmo da renda do trabalho para reduzir o problema de assimetria.

A escolha da janela é um ponto importante em estimações de densidade de núcleo, pois há um trade-off entre viés (diferença entre a distribuição estimada e a real) e variância: janelas maiores resultam em maior viés e menor variância, e vice-versa. Há diversos métodos de seleção automática da janela, entre os quais destacam-se os métodos de validação cruzada e os métodos de plug-in.10 No entanto, esses métodos não são adequados para dados com as características dos que dispomos, visto que são censurados por intervalos (agrupados). Os métodos de validação cruzada, por exemplo, como apontado por Silverman (1986), tendem a gerar resultados inadequados, h=0. Adotamos, então, o método visual de seleção, conforme procedimento detalhado em Butcher e DiNardo (1998): iniciamos com uma janela extremamente estreita (baixa suavização), h=0,05, e a aumentamos até obtermos uma distribuição suave, o que veio a acontecer com h=0,12. Justifica-se o procedimento de se iniciar com uma janela pequena e ir aumentando-a pela crença de que o olho humano é mais habilidoso em suavizar do que no sentido contrário (BUTCHER; DINARDO, 1998). Subjacente a esse método, estamos adotando a hipótese que a distribuição de renda do trabalho, e consequentemente a produtividade marginal do trabalho, é suave, o que nos parece bastante razoável, haja vista o tamanho da população. A escolha do limite inferior das janelas que produzem distribuições suaves indica que priorizamos o viés em detrimento da variância.

A estimação de densidades contrafactuais é realizada conforme proposto por DiNardo, Fortin e Lemieux (1996), onde se escolhe funções de reponderação da amostra. Pode-se considerar que cada observação da amostra é um vetor (w,z), onde w representa os salários (uma variável contínua) e z, os atributos de cada indivíduo (consideraremos apenas a variável educação, medida em anos de escolaridade). Assim, temos distribuições de densidade conjuntas F(w,z) de renda do trabalho e educação, bem como a densidade da renda do trabalho da região 1, fR1(w), que pode ser escrita como a integral da densidade de renda do trabalho condicionada no nível de educação dos indivíduos, f(w\z), sobre a distribuição de educação, F(z):

onde Ωz é o domínio do conjunto de atributos, Ez representa a região de onde se considera a distribuição de educação e Ew representa a região de onde se considera a distribuição de renda do trabalho. Para fazer o estudo de contrafactuais, estaremos interessados em modificar a estrutura de atributos e, portanto, definiremos como f(w;Ew=R1,Ez=R1) a densidade real de renda do trabalho da região 1 e como f(w;Ew=R1,Ez=R2) a densidade de renda do trabalho da região 1, que prevaleceria se a distribuição de educação fosse aquela existente na região 2 no mesmo período. Sob a hipótese de que a estrutura de renda do trabalho da região 1, f(w| z,Ew=R1), não depende da distribuição de educação na região 2, podemos escrever a densidade hipotética f(w;Ew=R1,Ez=R2) como

em que Ψz (z) é uma função de reponderação definida por

A equação (3) define a densidade de renda do trabalho na região 1, que prevaleceria se as condições educacionais fossem similares às da região 2 e, conforme pode ser observado, é idêntica à definição em (2), exceto pela função de reponderação Ψz(z) . Na verdade, o problema de estimação da função de densidade contrafactual desejada fica reduzido ao cálculo de ponderações apropriadas. Logo, poderemos estimar funções de densidade contrafactuais usando o método de estimadores de núcleo ponderados, onde usamos um novo ponderador que contém uma estimativa para Ψz(z) . Assim temos,

em que θi (zi ) =1 e SR1 é o conjunto de índices da amostra de indivíduos da região 1. As diferenças observadas entre a densidade real da região 1 e a densidade hipotética criada representa o efeito de uma mudança na distribuição de educação. Pode-se observar que, aplicando uma regra de Bayes em (4), este quociente pode ser escrito por

Uma vez que o nível de educação é uma variável discreta que assume um número finito de valores, a estimação de Ψz(z) por um modelo probit é equivalente a uma simples contagem.

Há diversas formas, paramétricas e não paramétricas, de comparar as densidades estimadas (reais e contrafactuais) e medir a diferença entre as mesmas. Pode-se simplesmente tomar a diferença entre as densidades contrafactual e real, obtendo-se uma completa descrição das mudanças na distribuição da renda do trabalho oriundas da reponderação pela escolaridade. Outras medidas de comparação entre as densidades estimadas tentam reduzir em um único número as diferenças entre as mesmas: distância de Kullbach-Leibler, de Sibson, de Chernoff, de Bhattacharyya, de Matusita, diferença entre os desvios padrão, diferenças entre os percentis, diferenças entre os diferenciais de percentis (10-90, 10-50, 25-75, 5-95). Todas essas medidas são utilizadas neste trabalho. Além disso, faremos o teste de desigualdade de densidades de Kolmogorov-Smirnov.

 

5 Resultados

Aplicamos a metodologia descrita na seção anterior e estimamos as distribuições reais do logaritmo da renda do trabalho para as cinco subamostras e para a amostra completa (Brasil), conforme apresentado na seção 3. Em seguida, estimamos as distribuições contrafactuais para o Nordeste e para o Ceará, reponderando as amostras pelas características de escolaridade da região Sudeste (SE1 e SE2) e do Estado de São Paulo. Relatamos e comentamos, nesta seção, os resultados para o Estado do Ceará, reponderado pela escolaridade de São Paulo, e para a região Nordeste, reponderada pela escolaridade da região Sudeste (SE1 e SE2). Os resultados para os demais casos estão apresentados no Apêndice A.

Em cada um dos gráficos abaixo, 4 a 6, apresentamos três densidades: uma densidade contrafactual, a densidade real, da qual essa se originou, e a densidade real da região usada na reponderação.11 O eixo horizontal dos gráficos está em escala logarítmica.

 


Gráfico 4 - Clique para ampliar

 

 


Gráfico 5 - Clique para ampliar

 

 


Gráfico 6 - Clique para ampliar

 

Testamos a igualdade entre as distribuições empíricas originais e as suas contrafactuais usando o teste de Kolmogorov-Smirnov, no qual a estatística de teste é o máximo da diferença entre as densidades acumuladas: max |F1(w) - F2(w)|. Rejeitamos a hipótese nula de que as densidades são iguais a 1% de significância em todos os casos, evidenciando que a mudança do perfil de escolaridade altera a distribuição de renda do trabalho.

Fica evidente que as distribuições12 são sensíveis aos diferenciais de escolaridade e que o grau de sensibilidade depende do percentil de renda considerado. O valor do salário mínimo, R$136 na época da pesquisa, é fator determinante na renda dos trabalhadores do Nordeste, do Ceará e do Sudeste (SE2), haja vista a enorme concentração de massa em torno desse valor na distribuição. A distribuição de renda da região Sudeste (SE2) é bimodal, sendo que uma das modas corresponde ao valor do salário mínimo e a outra é igual à moda da distribuição de São Paulo, cerca de R$300. As distribuições de SP e SE1 são bem parecidas o que mostra a significância de São Paulo sobre o agregado da região Sudeste. Pode-se afirmar então que, em todos os Estados das regiões Nordeste e Sudeste, com exceção de São Paulo (SE2), o valor do salário mínimo tem forte impacto sobre a distribuição de renda do trabalho.

Comparando-se as caudas das distribuições contrafactuais e das distribuições originais verifica-se que as mesmas possuem uma boa aproximação, exceto por uma translação à direita das primeiras. Isso é decorrente da proporcionalidade direta entre escolaridade e renda em conjunto com a reponderação da amostra, cujos efeitos sobre a distribuição de renda assemelham-se ao que seria obtido caso adicionássemos uma constante à escolaridade de cada indivíduo. Observa-se que as áreas centrais das distribuições de renda, que é exatamente onde se concentram mais indivíduos e aqueles que têm renda próxima a um salário mínimo, pouco se modificam após a reponderação. Justifica-se esse comportamento pelo fato de a estrutura salarial não ser alterada nesse processo, sobrepondo-se ao efeito do aumento de escolaridade resultante do mesmo processo. A moda, por exemplo, permanece igual a um salário mínimo em todos os casos.

A Tabela 5 apresenta alguns pontos notáveis (percentis, médias, desvios padrão e diferenças de percentis) das distribuições estimadas, reais e contrafactuais. O suporte das distribuições estimadas é o logaritmo da renda do trabalho, o qual delimitamos, para efeitos computacionais, ao intervalo [1,10] com passo de 0,01. A partir dessas distribuições, construímos distribuições com o suporte sendo o nível da renda do trabalho, simplesmente tomando o exponencial de cada ponto das distribuições estimadas e renormalizando. Apresentamos nas Tabelas A.1 e A.2 (no Apêndice A) os pontos notáveis de todas as distribuições construídas e as razões dos percentis das distribuições estimadas.

Comparando-se as distribuições originais do Ceará e de São Paulo, verifica-se que a renda da primeira é de aproximadamente 1/3 da segunda em todos os percentis (Tabela 6). Por outro lado, ao compararmos a distribuição do Ceará, reponderada pela educação de São Paulo, com a distribuição original de São Paulo, observamos dois efeitos: (i) houve um ganho na distribuição de renda do Ceará em todos os percentis, e (ii) o ganho foi maior quanto maior era o nível de renda (percentil).13 O retorno marginal crescente da escolaridade, ilustrado no Gráfico 3, justifica o segundo efeito, pois os indivíduos mais escolarizados, e consequentemente com maior renda, ao receberem um "ganho" de escolaridade por efeito da reponderação, terão suas renda elevadas em proporção maior que os menos escolarizados, cuja renda evolui pouco após um aumento de escolaridade.

Comparando-se a região Nordeste com a Sudeste, verificou-se que a renda da primeira se situa entre 45% e 50% da renda do Sudeste para a amostra SE1, e entre 55% e 65% considerando a amostra SE2. Após a reponderação, observaram-se os mesmos efeitos verificados quando comparamos a distribuição do Ceará com a de São Paulo. Observou-se que o efeito da reponderação é diretamente proporcional à diferença entre as distribuições originais, logo sendo maior no caso CE x SP e menor para NE x SE2, para todos os percentis. Uma comparação interessante é que a renda média do Nordeste reponderada pela educação da região Sudeste (SE1) é 93% da renda média brasileira. Aqui, à semelhança da comparação CE x SP, o fato de a escolaridade apresentar retorno marginal crescente justifica um ganho de renda maior nos decis mais altos.

Os ganhos absolutos são significativos em todos os casos: em nenhum decil o ganho de renda com a reponderação é inferior a 13% da renda original, chegando a atingir 70% no nono decil para a comparação CE x SP. O mais relevante é que a renda dos nordestinos nunca é inferior a cerca de 60% da renda do sudestino, para a amostra SE1, e a 67%, para a amostra SE2, e que nos decis superiores, ela se aproxima bastante da renda dos moradores da região Sudeste, se aqueles possuíssem o mesmo nível de educação destes. A propósito, a renda do nono decil do NE, reponderado pela escolaridade da região SE2, atinge 90% da renda de SE2.

Este fato está melhor representado nos Gráficos 7 a 9 (e A.4 a A.6 no Apêndice A), onde a distribuição contrafactual e a distribuição de renda da região/Estado que foram utilizadas como base para a reponderação se aproximam nos níveis mais elevados de renda.

 

 

Nos Gráficos 10 a 12, a seguir, apresentamos a diferença entre as duas distribuições reais e a diferença entre a distribuição contrafactual e a real que a originou.14 Esses gráficos nos permitem visualizar o quanto as distribuições de renda se aproximaram após a reponderação pela escolaridade.

 

 

 

 

 

 

Note que a diferença entre as distribuições se reduz em todos os casos após reponderarmos a escolaridade. Note também que as diferenças são negativas nos níveis inferiores de renda e positivas para níveis elevados de renda, o que denota que prepondera o efeito de diferença de média entre as distribuições em relação ao efeito de diferença de dispersão. Caso esse último efeito prevalecesse, observaríamos diferenças positivas nas caudas e negativas no centro do suporte das distribuições.

Computamos a distância entre as distribuições, antes e depois da reponderação, pela medida paramétrica conhecida como distância de Kullbach-Leibler (J).15 Os resultados estão reportados na Tabela 7 a seguir. Basicamente, o que essa medida faz é representar a área entre duas distribuições, onde cada elemento de área (correspondendo a cada w) é ponderado pela diferença de densidade entre as distribuições. O efeito da ponderação é introduzir uma relação não linear entre a distância das distribuições, para cada w, e sua contribuição para J. Verifica-se que mais de 55% das distâncias entre o Ceará e São Paulo e entre as regiões Nordeste e Sudeste (SE1 e SE2) são explicadas pela escolaridade - 55,3% da distância entre São Paulo e Ceará e 55,0% (57,3%) da distância entre o Nordeste e a região SE1 (SE2). Isto mostra que mais da metade da diferença de renda entre a região/Estado mais pobre em relação ao mais rico é devida aos diferenciais de escolaridade da população. Computamos também a distância das distribuições pelas métricas de Chernoff16 e Sibson,17 sugeridas em Krzanowski (2003), e obtivemos resultados semelhantes, os quais se encontram apresentados na Tabela 9.

Uma vez calculadas as distâncias entre as densidades, considerou-se o porcentual

explicado pelas diferenças educacionais dado pela razão: . Por exemplo, para mensurar o quanto a escolaridade explica a distância entre as densidades de renda de Ceará e São Paulo usa-se a razão: . A Tabela 8 apresenta esses resultados para cada uma das medidas de distâncias utilizadas, além dos desvios padrão estimados, usando exercício de reamostragem (bootstrap) com 200 réplicas.

Os resultados reforçam que não se pode rejeitar a hipótese de que a mudança do perfil educacional pode explicar parte das diferenças de renda entre as regiões. Nota-se que as medidas de Kullbach-Leibler, Chernoff e Sibson tendem a estimar o ínfimo da contribuição da educação, enquanto que Matusita e Bhattacharyya estimam o seu supremo. Para todas as medidas, o desvio padrão é muito pequeno. As diferenças educacionais contribuem para explicar entre 12% e 36,4% da distância do perfil de renda entre São Paulo e Ceará; entre 14,7% e 39,3% da distância entre Sudeste 1 (RJ, MG e SP) e Ceará; entre 17,2% e 42,3% da distância entre Sudeste 2 (RJ e MG) e Ceará; entre 10% e 33% da distância entre São Paulo e Nordeste; entre 12,4% e 36% da distância entre Sudeste 1 (RJ, MG e SP) e Nordeste, e entre 15,2% e 39,4% da distância entre Sudeste 2 (RJ e MG) e Nordeste.

Comparando com o resultado da Tabela 7, verifica-se que, quanto mais distantes estão as densidades originais, menor é a capacidade da educação em explicar as diferenças de renda entre as regiões. Assim, a maior contribuição da educação se deu em explicar a distância entre CE e SE2 ou NE e SE2. Por outro lado, a menor contribuição se deu entre CE e SP ou NE e SP.

Calculamos ainda os coeficientes de entropia de Theil e de concentração de Gini das distribuições estimadas. Esses coeficientes são medidas de dispersão e são amplamente usados como medidas de desigualdade quando aplicados a distribuições de renda. De um modo geral, Ceará e Nordeste são mais desiguais que São Paulo e o Sudeste (SE1 e SE2). Após a reponderação usando o perfil educacional da região mais rica (e também menos desigual), verifica-se um ligeiro aumento das estatísticas estimadas de Theil e Gini. Os resultados estão apresentados na Tabela 9, a seguir, (e na Tabela A.4, no Apêndice A). Em suma, embora se observe um aumento dessas medidas de desigualdade, apenas para o coeficiente de Gini que esse aumento é estatisticamente significante, não ocorrendo para o coeficiente de Theil. O aumento da desigualdade é um resultado esperado por se tratar de um exercício de equilíbrio parcial, que ignora possíveis mudanças na estrutura de salários.

Mensuramos o efeito da reponderação pela escolaridade, computando a variação porcentual de algumas métricas, calculadas a partir das distribuições estimadas reais e contrafactuais. Os resultados estão reportados na Tabela 10 a seguir. Em termos de medidas de tendência central, a reponderação pela escolaridade explica 56% da distância entre a renda média do Ceará e São Paulo e 55,3% da distância entre Nordeste e Sudeste (SE1). A mediana foi menos sensível à reponderação, explicando 27,8% da distância entre Ceará e São Paulo e 27% da distância entre Nordeste e Sudeste (SE1). Considerando a diferença entre medidas de desigualdade, verifica-se que a reponderação pela escolaridade tem um efeito inverso, aumentando a diferença entre os coeficientes de Theil em 10,7% entre Ceará e São Paulo, e 18% entre Nordeste e Sudeste (SE1) e aumentando a diferença entre os coeficientes de Gini em 52% entre Ceará e São Paulo, e 67% entre Nordeste e Sudeste (SE1).

Comparando o efeito da reponderação nas medidas de tendência central e nas distâncias entre densidades, verifica-se que o efeito na média é maior que em toda a densidade, que, em grande parte, é também explicado pelo aumento verificado nas medidas de desigualdade. Ou seja, como a média é muito sensível aos extremos, verifica-se que a reponderação pela escolaridade teve um impacto desigual nos extremos da densidade, o que reforça a conclusão verificada pela observação dos Gráficos 7, 8 e 9. Em suma, a reponderação ocasionou dois efeitos: (i) as medidas de tendência central se aproximaram, revelando que a expansão da escolaridade é capaz de elevar o nível de renda per capita da região, e (ii) as medidas de dispersão se elevaram, sinalizando que a desigualdade de renda nas regiões mais pobres aumentaria caso herdasse o perfil de escolaridade das mais ricas, mantendo-se a estrutura de salários. Em outras palavras, o Nordeste, com o perfil de escolaridade do Sudeste, seria mais rico, porém mais desigual. O efeito a que nos referimos, no item (ii), decorre, em parte, do fato de nosso exercício não levar em conta a mudança na estrutura salarial decorrente da mudança de escolaridade; ou seja, em equilíbrio geral, esse fenômeno não seria observado em parte ou totalmente.

A robustez dos resultados apresentados ao tamanho da janela foi investigado reestimando-se todas as distribuições com h=0,09 (-25% de h original) e h=0,15 (+25%), e comparando os resultados com os obtidos com o valor original de h. Verificou-se que as alterações nos resultados não os comprometem, não tendo ainda se observado uma relação direta entre a variação do tamanho da janela e a variação dos indicadores apresentados nas Tabelas 5 a 10.

Cabe ressaltar que a parcela da diferença de renda explicada pela diferença de escolaridade talvez seja maior que a apresentada nesse trabalho, uma vez que o preço da cesta de consumo dos indivíduos é diferente entre as regiões. Os serviços e bens não comercializáveis são mais baratos nas regiões mais pobres, refletindo exatamente a diferença de renda do trabalho entre as regiões, uma vez que eles tendem a ser mais intensivos em mão de obra. O efeito da correção pelo poder de compra da renda em cada região seria menor nas camadas de renda mais baixa (consomem menos serviços) e maior para os indivíduos com renda elevada (consomem mais serviços), acentuando o efeito apresentado nos Gráficos 7 a 9.

 

6 Conclusão

Neste trabalho, procuramos identificar o quanto do diferencial de renda entre as regiões Nordeste e Sudeste e entre o Estado do Ceará e São Paulo é explicado pelo diferencial de escolaridade da população. Usou-se um modelo semiparamétrico para construir funções de densidade contrafactuais, reponderando os indivíduos da região/Estado base pela distribuição de educação da região a ser comparada. Estimamos as distribuições de renda do trabalho reais e contrafactuais do Estado do Ceará e da região Nordeste reponderadas pelas escolaridades da região Sudeste e do Estado de São Paulo.

Verificou-se que: (i) a dispersão de renda é maior nas distribuições com menor média, ou seja, a desigualdade renda, que é enorme em todas as regiões, é maior nas regiões mais pobres; (ii) entre 12% e 36% da diferença de renda do trabalho entre a região Nordeste e a região Sudeste (SE1) e entre os Estados de São Paulo e Ceará, quando medida pelas distâncias de Kullbach-Leibler, Chernoff, Sibson, Matusiba e Bhattacharyya, se deve às diferenças de escolaridade; (iii) a reponderação pela escolaridade aumentou em cerca de 55% a renda média da região Nordeste e do Estado do Ceará; (iv) a renda do Nordeste reponderada pela escolaridade do Sudeste equivale a 93% da renda média brasileira; (v) quanto mais elevado for o percentil de renda considerado, maior é a contribuição da diferença de escolaridade para a diferença de renda, e (vi) a dispersão de renda das regiões mais pobres aumenta quando fornecemos a elas o nível de escolaridade das regiões mais ricas, mantendo-se o perfil salarial da região.

Vários são os fatores que podem estar determinando a diferença de renda não explicada pelo diferencial de escolaridade, entre os quais podemos citar a expectativa de vida dos habitantes, fatores étnicos, estrutura etária da população, qualidade da infraestrutura existente, presença/ausência de estímulos ao desenvolvimento e fatores históricos. Uma extensão natural deste trabalho seria, aplicando a metodologia de contrafactuais, decompor o diferencial de renda em alguns destes fatores, além da escolaridade, de forma a conseguir explicar uma parcela maior do diferencial de renda. A importância relativa dos fatores posta em conjunto com o custo de eliminá-los pode ser de grande valor na orientação de políticas públicas de combate à "desigualdade regional". Outras extensões interesantes seriam: (i) reponderarmos a distribuição de renda da região Nordeste pela escolaridade do Brasil sem a região Norte,18 e (ii) reponderarmos a distribuição de renda de todas as regiões pelo perfil de escolaridade do Brasil, permitindo que se determine o tamanho das desigualdades regionais, controlando-se pela escolaridade.

 

Referências

BARROS, R. P. de. Regional disparities in education within Brazil: the role of quality of education. IPEA, 1993. (Texto para Discussão n. 311)         [ Links ]

BARROS, R. P. de; MENDONÇA, R. Os determinantes da desigualdade no Brasil. IPEA, 1995. (Texto para Discussão n. 377)         [ Links ]

BARROS, R. P. de; CAMARGO, J. M.; MENDONÇA, R.. A estrutura do desemprego no Brasil. IPEA, 1997. (Texto para Discussão n. 478)         [ Links ]

BLINDER, A. S. Wage discrimination: reduced form and structural estimates. Journal of Human Resources, v. 8, n. 4, p. 436-455, 1973.         [ Links ]

BOURGUIGNON, F.; FERREIRA, F.; LEITE, P. Beyond Oaxaca-blinder: accounting for differences in household income distributions across countries. 2002. Mimeo.         [ Links ]

BUTCHER, K. F.; DINARDO, J. The immigrant and native-born wage distributions: evidence from United States censuses. NBER Working Paper Series 6630, 1998.         [ Links ]

DINARDO, J.; FORTIN, N. M.; LEMIEUX, T. Labor market institutions and the distribution of wages, 1973-1992: A Semiparametric Approach. Econometrica, v. 64, n. 5, p. 1001-1044, 1996.         [ Links ]

FERREIRA, P. C. Regional policy in Brazil: a review. WorldBank, 2004. Mimeo. Available at: <http://www.fgv.br/professor/ferreira/RegionalPolicyFerreira.pdf>         [ Links ].

KRZANOWSKI, W. J. Non-parametric estimation of distance between groups. Journal of Applied Statistics, v. 30, n. 7, p. 743-750, 2003.         [ Links ]

OAXACA, R. Male-female wage differentials in urban labor markets. International Economic Review, v. 14, n. 3, p. 693-709, 1973.         [ Links ]

PARK, B. U.; MARRON, J. S. Comparision of data-driven bandwidth selectors. Journal of American Statistical Association, n. 85, p. 66-72, 1990.         [ Links ]

PARZEN, E. On estimation of a probability density function and mode. The Annals of Mathematical Statistics, v. 33, n. 3, p. 1065-1076, 1962.         [ Links ]

PESSOA, S. Existe um problema de desigualdade regional no Brasil? 2000. Mimeo.         [ Links ]

ROSENBLATT, M. Remarks on some non-parametric estimates of a density function. The Annals of Mathematical Statistics, v. 27, n. 3, p. 832-837, 1956.         [ Links ]

SHEATER, S. J.; JONES, M. C. A reliable data-based bandwidth selection method for kernel density estimation. Journal of Royal Statistical Society, v. 53, n. 3, p. 683-690, 1991.         [ Links ]

SILVERMAN, B. Density estimation for statistics and data analysis. London: Chapman & Hall, 1986.         [ Links ]

 

 

Endereço para contato:
Márcio A. Salvato
IBMEC-MG
R. Rio Grande do Norte, 300
Belo Horizonte. CEP: 30.130-130

(Recebido em abril de 2009. Aceito para publicação em setembro de 2010).

 

 

1 Entende-se aqui, como região, uma determinada área geográfica da qual desejamos estudar uma determinada característica dos seus habitantes, podendo ser um município, Estado, conjunto de Estados, região geográfica ou país.
2 A partir desse ponto, a palavra salário será usada para se referir a salário-hora ou, em inglês, wage.
3 A abordagem de Oaxaca é geralmente restrita à comparação de médias. Quando as distribuições são unimodais, simétricas e têm variâncias semelhantes, este procedimento é bem qualificado para analisar as mudanças na estrutura dos salários. No entanto, não se pode esperar que estas condições sejam válidas quando estamos comparando distribuições de rendimentos de regiões diferentes. Daí a opção por uma estimação de toda a função de densidade.
4 Como será visto na seção seguinte, de fato, não consideramos a região Sudeste integralmente.
5 Os IDHs das regiões foram calculados pelos autores seguindo a metodologia do PNUD.
6 O valor de ambos os coeficientes varia entre 0, quando não há desigualdade, e 1, quando a desigualdade é máxima.
7 Dados de PIB e população por região do IBGE.
8 Compreendem a população economicamente ativa as pessoas ocupadas ou que estão empreendendo esforços à procura de ocupação.
9 SE2 compreende os Estados do Rio de Janeiro e Minas Gerais, respectivamente a segunda e terceira unidades mais ricas da Federação.
10 Ver Park e Marron (1990) e Sheater e Jones (1991) como exemplos.
11 Todas as grandezas monetárias estão expressas em reais.
12 Leia-se nos gráficos: NE/SE1: contrafactual do Nordeste usando escolaridade do Sudeste (MG+RJ+SP); NE/SE2: contrafactual do Nordeste usando escolaridade do Sudeste (MG+RJ); CE/SP: contrafactual do Ceará usando escolaridade de SãoPaulo.
13 Para o primeiro decil, a renda do Ceará evoluiu de 33% para 47% da renda de S. Paulo e, para o nono decil, passou de 38% para 79%.
14 Para cada nível de renda, tomou-se a diferença (contrafactual - real), ou seja, f(w;Ew=R1,EZ=R2) - f(w;Ew=R1,EZ=R1).
15 A distância de Kullbach-Leibler, J, é uma medida de divergência entre duas distribuições f1 e f2: J = [ f1(w) - f2(w)]Indw.
16 A distância de Chernoff entre as distribuições f1 e f2 é definida como - log(dx).
17 A distância de Sibson entre as distribuições f1 e f2 é definida como -[f1(x)In+f2(x)In]dx, onde f(x)[f1(x)+f2(x)].
18 Isto porque a PNAD não entrevista a população rural, que é bastante significativa na região Norte.

 

 

Apêndice A - Tabelas e Figuras

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


Gráfico 6 - Clique para ampliar

 

 


Tabela A.1 - Clique para ampliar

 

 


Tabela A.2 - Clique para ampliar