Acessibilidade / Reportar erro

Testando as hipóteses do modelo de mincer para o Brasil

Resumos

Várias estimativas de taxas de retorno para educação têm sido produzidas, baseadas no modelo de Mincer. Mas algumas das hipóteses (linearidade e separabilidade), para que o coeficiente escolar ("minceriano") seja interpretado como taxa de retorno, são testadas e rejeitadas. Ao relaxar tais hipóteses, estimamos as taxas internas de retorno Becker (1975) e obtemos vieses que chegaram a 14 pontos percentuais em relação ao coeficiente "minceriano". Assim, a magnitude destes retornos é bem menor do que os estudos baseados no modelo de Mincer. Nas estimações incorporamos o desenho amostral da PNAD e corrigimos o problema do viés de seleção amostral.

Retorno da educação; seleção amostral; plano amostral; regressão linear local


Many estimates of rates of return for education have been produced, based on the Mincer's model. But some of the hyphoteses (linearity and separability), so that the ("mincer") school coefficient is interpreted as rate of return, are tested and rejected. When relaxing such hypotheses, we estimate the internal rates of return Becker (1975) and we get biases that arrive to 14 percentile points in relation to the "mincer coefficient". Thus, the magnitude of these returns is much lower than the papers based on Mincer's model. In the estimates we incorporate the sample design of PNAD and correct the problem of bias of sample selection.


Testando as hipóteses do modelo de mincer para o Brasil* * Agradeço ao Carlos Eugênio da Costa, da EPGE/FGV, pelos diversos comentários e orientação na elaboração deste artigo; a Petra Todd, da University of Pennsylvania, pelos códigos em R cedidos que foram importantes na realização de alguns testes neste artigo; ao Luis Henrique Braido, Luis Renato Lima, da EPGE/FGV, e a todos os participantes do Seminário de Almoço da EPGE por suas diversas sugestões e críticas; ao Breno Néri, doutorando da New York University, por seu auxílio em uma rotina; a Elaine Toldo Pazello, da FEA-RP/USP, por suas sugestões; ao Maurício Lila, Djalma Pessoa e Pedro Nascimento Silva, do IBGE, por seus auxílios em relação à PNAD e Censo; agradeço a todos os participantes do XXVIII Encontro Brasileiro de Econometria (SBE), quando da apresentação de uma versão preliminar deste artigo; e por fim agradeço os comentários de um parecerista anônimo. Os erros remanescentes são de inteira responsabilidade do autor.

Rodrigo Leandro de Moura

Doutor em Economia pela EPGE/FGV-RJ. Professor da Graduação em Economia da FGV-RJ

RESUMO

Várias estimativas de taxas de retorno para educação têm sido produzidas, baseadas no modelo de Mincer. Mas algumas das hipóteses (linearidade e separabilidade), para que o coeficiente escolar ("minceriano") seja interpretado como taxa de retorno, são testadas e rejeitadas. Ao relaxar tais hipóteses, estimamos as taxas internas de retorno Becker (1975) e obtemos vieses que chegaram a 14 pontos percentuais em relação ao coeficiente "minceriano". Assim, a magnitude destes retornos é bem menor do que os estudos baseados no modelo de Mincer. Nas estimações incorporamos o desenho amostral da PNAD e corrigimos o problema do viés de seleção amostral.

Palavras-chave: Retorno da educação; seleção amostral; plano amostral; regressão linear local.

Códigos JEL: I20; J24; C14; C42.

ABSTRACT

Many estimates of rates of return for education have been produced, based on the Mincer's model. But some of the hyphoteses (linearity and separability), so that the ("mincer") school coefficient is interpreted as rate of return, are tested and rejected. When relaxing such hypotheses, we estimate the internal rates of return Becker (1975) and we get biases that arrive to 14 percentile points in relation to the "mincer coefficient". Thus, the magnitude of these returns is much lower than the papers based on Mincer's model. In the estimates we incorporate the sample design of PNAD and correct the problem of bias of sample selection.

1. INTRODUÇÃO

A decisão de acumulação de capital humano (educação, treinamento no emprego, saúde etc) passa pela mensuração correta de seus retornos. Uma forma de medi-los é através da taxa interna de retorno (TIR), um conceito central da teoria do capital humano, desenvolvido na análise desta decisão dos investimentos dos agentes em capital humano. Esta medida remonta a Becker (1975) (daqui em diante Becker) e Schultz (1963). Assim, o agente investe em capital humano através da comparação dos fluxos de benefícios e custos, do qual se extrai a taxa de desconto que os igualam. Logo, um agente neutro ao risco, que maximiza a sua riqueza, tende a concentrar seus investimentos em idades precoces, pois: (i) com o passar do tempo o indivíduo tem um menor período para retomar o retorno do investimento em capital humano e (ii) o custo de oportunidade vai se elevando com o maior nível de capital humano. Aqui nos atemos a um componente do capital humano que seria a educação. Pessoas mais educadas tendem a obter maiores rendimentos. Essa lógica se aplica, pois com uma maior acumulação de educação tendem a melhorar suas habilidades, conhecimento e saúde, as quais aumentam a produtividade do trabalho. E esta última iguala os rendimentos em um mercado perfeitamente competitivo.1 1 Obviamente existem outros benefícios (não-monetários) derivados desse processo de aprendizagem, mas, segundo Becker, resultados apontam para uma menor importância destes outros benefícios. Assim, a mensuração correta da TIR depende da estimação do perfil de rendimentos dos indivíduos ao longo do seu ciclo de vida.

No entanto, na literatura empírica, várias estimativas de taxas de retorno têm sido reportadas, baseadas nos modelos seminais de Mincer (1958, 1974), (daqui em diante Mincer I e Mincer II respectivamente), que derivam a equação de salários:

em que, Y(s,x) é a renda ajustada pelas horas de trabalho, s é anos de estudo e x é a experiência. O coeficiente β é conhecido como coeficiente (ou retorno) minceriano de educação. Heckman (2005) aponta que, nos EUA, existem alguns aparentes puzzles empíricos, tais como: os altos retornos "mincerianos" da educação vis a vis outros investimentos; e dado isto, observa-se uma resposta lenta de matrículas das coortes recentes. Mas segundo Heckman et alii (2006)2 2 Uma versão anterior deste trabalho foi circulada sob o título Fifty Years of Mincer Earnings Regressions. (daqui em diante HLT), poucas destas estimativas são taxas de retorno verdadeiras. Muitas das hipóteses do modelo de Mincer, que tornariam o coeficiente minceriano uma taxa de retorno (TIR), são válidas sob circunstâncias muito restritas. Assim, o estudo de retornos educacionais passa, invariavelmente, pelos modelos originais de Mincer, em que suas hipóteses devem ser testadas.

No Brasil diversos estudos consideram o coeficiente minceriano como taxa de retorno, mas nenhum tem realizado qualquer tipo de teste. No entanto, diversos estudos já realizaram testes de linearidade Hungerford e Solon (1987), Jaeger e Page (1996), Heckman et alii (1996a) e recentemente paralelismo (HLT) para os EUA, rejeitando tais hipóteses, cruciais para esta interpretação do coeficiente ser um retorno educacional.

Assim, as TIR's podem ser entendidas como o custo de oportunidade de se investir em educação, em relação a outras alternativas. E, ao contrário do retorno "minceriano", a TIR considera os custos (diretos e indiretos). Portanto, somente no caso das hipóteses do modelo de Mincer serem satisfeitas e sob algumas restrições adicionais, podemos afirmar que a TIR é igual ao coeficiente minceriano. Algumas destas hipóteses são: o tempo da vida do trabalho seja igual para todos os indivíduos independentemente do nível educacional; durante a escolarização os agentes não trabalhem; os únicos custos incorridos sejam os custos de oportunidade, ou seja, os rendimentos sacrificados advindos do mercado de trabalho durante o período de escolarização; não exista incerteza; agentes neutros ao risco; não existam imperfeições no mercado de crédito; linearidade nos anos de estudo e separabilidade entre experiência e anos de estudo (paralelismo). Assim, a partir de dados semelhantes e a mesma estrutura do modelo de Mincer, testamos para as duas últimas hipóteses citadas e rejeitamos ambas. Portanto, neste caso, o retorno minceriano seria melhor entendido como uma taxa de crescimento dos salários de mercado devido ao acréscimo marginal nos anos de estudos, ou ainda, como o preço marginal da educação.

Em seguida calculamos as TIRs, tendo como referência os coeficientes mincerianos, e mostramos que o viés é relativamente alto quando relaxamos as hipóteses de linearidade e paralelismo. Obtemos vieses que chegaram a um pouco mais de 14 pontos percentuais, ao comparar o retorno minceriano (17.29%) com a TIR (3.03%) para o Mestrado-Doutorado em relação ao Ensino Superior. Diversos estudos no Brasil não consideram tais hipóteses e, conseqüentemente, suas estimativas estão imprecisas e o grau desta discrepância é relativamente grande, podendo levar à conclusões distorcidas ou mal interpretadas. Adicionalmente, relaxamos também algumas das outras hipóteses citadas.

Utilizamos duas técnicas econométricas, a saber: regressão paramétrica e não-paramétrica. Os testes de linearidade envolvem a primeira, os testes de paralelismo envolvem a segunda, enquanto o cálculo das TIRs envolve ambos instrumentais. Em todas estimativas, lançamos mão das bases de dados da PNAD e do Censo. Em relação à PNAD, por se tratar de uma pesquisa amostral complexa, a hipótese de uma amostra aleatória independente e identicamente distribuída não pode ser assumida. Por isso, incorporamos o desenho (plano) amostral da PNAD,3 3 Este ponto será discutido mais detalhadamente na seção 4.2. que pode ser considerado um ganho adicional na literatura empírica para o Brasil.4 4 Em relação ao Censo, a incorporação do desenho amostral não foi possível. As variáveis que permitiram a incorporação do desenho amostral do Censo são consideradas "dados sigilosos" pelo IBGE e por isso não podem ser divulgadas. Além disso, corrigimos também para o problema de viés de seleção amostral que surge devido ao fato de que alguns indivíduos escolhem não trabalhar pois o salário de mercado é fixado abaixo do seu salário de reserva. Esta correção também pode ser considerada um ganho adicional, visto que mesmo estudos recentes, como HLT, não incorporaram tal aspecto, o que altera a magnitude das TIRs. Assim, comparamos estimativas feitas sem correção, incorporando o desenho amostral, e estimando por heckit.5 5 A correção do viés de seleção amostral foi feita apenas para os modelos paramétricos. Para os modelos não-paramétricos não foi possível devido à grande complexidade e extensão do procedimento. Tal ajuste foi proposto por Das et alii (2003), o qual poderá ser incorporado em pesquisa futura.

O artigo segue a seguinte estrutura: seção 2 realiza uma revisão seletiva da literatura; seção 3 mostra através de um modelo simples a equivalência entre a TIR e o coeficiente minceriano; seção 4 apresenta a metodologia e os resultados dos testes de linearidade e paralelismo; seção 5 mostra a metodologia, resultados e discussão das TIRs; e seção 6 conclução.

2. REVISÃO DE LITERATURA

A revisão seletiva da literatura apresenta as evidências internacionais e nacionais em relação aos artigos que aplicam os modelos de Mincer e o conceito da TIR.

2.1. Evidência Internacional - Mincer

Em uma resenha recente, Card (1999) aponta que estudos que relacionam educação a rendimentos se baseiam quase sempre e fortemente nos modelos de Mincer. A forma funcional de Mincer tem levantando várias objeções. Card já apontava que uma forma dos rendimentos serem estimados poderia ser através de técnicas não paramétricas, como uma função geral de anos de estudo e idade. Já na linha de estimação paramétrica, Murphy e Welch (1990) mostram que um termo linear nos anos de estudo e um polinômio até de ordem três ou quatro na experiência provê uma melhora significativa no ajuste. Um fato importante destacado por estes dois estudos é que este modelo paramétrico tem problemas em ajustar o formato preciso dos perfis de rendimento-idade (experiência) para os dados americanos, pois tende a viesar a taxa de crescimento estimada dos rendimentos dos trabalhadores com determinado nível escolar, em relação ao valor amostral. Isso ocorre devido à má especificação do modelo. Outro problema que surge destes modelos é a redução da parcimônia ao se adicionar termos cúbico e quártico à especificação, levando a um problema de multicolinearidade maior nas estimativas. Estes problemas podem ser contornados pela estimação não paramétrica.

No entanto, Card destaca o alto poder explicativo do modelo minceriano. Segundo Park (1994), para os EUA, o termo linear na educação ajusta-se bem aos dados. Mas existem evidências contrárias ao modelo linear apontado por Hungerford e Solon (1987), Belman e Heywood (1991), que estimam o modelo minceriano adicionado de componentes de não linearidade, como por exemplo, dummies para os anos de conclusão do curso para captar efeitos diploma.6 6 Efeitos diploma ( sheepskin effects) captam os efeitos dos retornos maiores devido à obtenção de algum grau escolar. Este "diploma" pode ser interpretado como um sinal da produtividade para que o mercado contrate o trabalhador. Um teste F executado sobre estes termos não lineares rejeita fortemente o modelo linear.

Psacharopoulos e Patrinos (2004), Psacharopoulos (1994, 1985) revisa as estimativas da taxa de retorno baseadas no modelo minceriano, para diversos países, obtendo prêmios por educação maiores para América Latina/Caribe e África Subsaariana - países de baixa e média renda - que estão acima do retorno médio mundial. Além disso, nos últimos doze anos, os retornos mincerianos médios mundiais tem decaído 0.6%, enquanto o nível médio de escolarização aumentou.7 7 O período de referência depende do país, variando de 1970 em Marrocos até 1998 em Cingapura e Filipinas. Algumas destas estimativas foram obtidas pelo autor através de outros artigos. Psacharopoulos e Patrinos (2004) aponta que estas comparações não são exatas, devido a diferenças na metodologia e na cobertura amostral.

2.2. Evidência Brasileira - Mincer

Em relação ao Brasil, diversos estudos consideram e estimam o coeficiente minceriano como taxa de retorno. A maioria relaxa a hipótese de linearidade, estimando uma função spline nos anos de estudo, como em Leal e Werlang (1991). Blom e Verner (2001) é um estudo recente que atualiza os retornos mincerianos para o Brasil, utilizando o modelo de Mincer II, mas relaxando a linearidade ao utilizar uma função spline com nós nos anos de conclusão dos ciclos. Os autores, utilizando regressões de média e quantílicas condicionais, observam que o spread dos retornos entre os diferentes quantis é grande para todos os níveis, com exceção do terciário. Eles sugerem que esta dispersão grande poderia ser devido a fatores não controlados (qualidade da escola, capital social e habilidade não observada) relacionados aos retornos e que o seu modelo estimado deveria permitir interação entre educação e outros termos como experiência, o que relaxaria de uma forma a hipótese de paralelismo.

Sachsida, Sachsida et alii (2004), utilizando a PNAD de 1996 e diversos anos empilhados (1992-99), calculam o retorno minceriano segundo Mincer II, mas corrigindo para algumas fontes de vieses, tais como: seleção amostral, endogeneidade da variável educação e habilidade do indivíduo não observada. Soares e Gonzaga (1999), usando a PNAD de 1988, testam a existência de dualidade no mercado de trabalho brasileiro, no sentido da existência de estruturas salariais distintas associadas a ocupações boas (ligadas, por exemplo, a maiores retornos educacionais, dentre outros fatores) e a ocupações ruins. Estes dois estudos e o de Loureiro e Carneiro (2001) são um dos poucos que relaxam a hipótese de linearidade e paralelismo, mas impondo uma forma funcional à sua equação. Os resultados destes estudos apontam para significância do termo de interação de tempo de trabalho e anos de estudo e, assim, rejeitando a hipótese de paralelismo.

Outros estudos, que não tem o objetivo principal estimar taxas de retorno, utilizam o modelo de Mincer em suas análises. Fernandes e Filho (2000) avaliam a evolução da desigualdade dos rendimentos do trabalho, utilizando uma regressão minceriana (Mincer II) adicionada de alguns controles, e relaxando a hipótese de linearidade nos anos de estudo. O retorno educacional minceriano, em seu estudo, é um fator explicativo importante na redução da desigualdade, principalmente entre 1990 e 1991.8 8 Dada a enorme gama de estudos sobre retorno educacional, baseados no modelo minceriano, não foi possível descrevê-los em detalhes. Mas vale citar outros estudos recentes que utilizam o modelo de Mincer tais como:

2.3. Evidência Internacional - TIR

Voltando-se especificamente para a TIR, Becker dirime uma questão importante na relação rendimentos-custos-taxas de retorno: a dificuldade de isolar o efeito nos rendimentos derivado de uma mudança dos retornos ou de uma mudança da soma investida em educação. No contexto de um modelo estático, em que investimento é restrito a somente um único período e retornos a todos os períodos remanescentes, Becker afirma que custo e taxa de retorno são facilmente determinados tomando apenas os rendimentos líquidos. Para isso, comparam-se os fluxos de rendimentos de dois níveis de ensino, um com investimento no primeiro período e o outro que não requer soma dispendida. O custo de se investir em educação seria os rendimentos sacrificados líquidos de se investir. Este é o contexto do nosso modelo de estimação da TIR.9 9 Pesquisa futura pode incluir uma análise dinâmica. O problema aqui é a falta de base de dados no Brasil que siga o indivíduo por toda sua vida escolar e por, pelo menos, uma parte de sua vida profissional e que assim fosse possível mensurar estas decisões de investimento do agente.

Schultz (1963) já apontava também que os custos deveriam ser levados em consideração na análise de investimentos em educação. Estes custos se estendem além das despesas com mensalidades, anuidades e outras, onde os salários sacrificados compõem parte significativa dos custos. No contexto da economia como um todo, custos executados pelas escolas (manutenção da infra-estrutura, depreciação e serviços) são de relevância, enquanto num contexto de decisão individual, os custos diretos e indiretos dos estudantes são os mais importantes. Destes últimos, o custo do tempo do estudante na escola é destacado por Schultz, sendo estes estimados dos salários que os estudantes deixam de receber enquanto do período de escolarização. Como não existe um contrafactual perfeito, do qual extrairíamos o fluxo de renda para o caso do indivíduo freqüentar e não freqüentar escola, temos de tomar como referência agentes com características similares, mas que estejam no mercado de trabalho.

Psacharopoulos e Patrinos (2004) também estima a TIR, privada e social, para diversos países, e destaca que a América Latina/Caribe e a África Subsaariana são as regiões com maior retorno, para todos os níveis educacionais. Psacharopoulos (1994) destaca que o método da TIR é o mais apropriado, mas afirma que esta metodologia tem sido preterida em relação à Mincer II devido à falta de uma base com um número grande de observações em uma dada célula do nível educacional-idade para construir perfis de rendimentos-idade bem comportados (sem cruzamento e côncavo). Mas esse argumento têm se tornado fraco, dada a gama de bases existente atualmente.

2.4. Evidência Brasileira - TIR

Em relação ao Brasil, Langoni (1974) foi um dos pioneiros a estimar a TIR para o país, baseado em Schultz (1963) e Becker. Ele calculou os custos diretos (despesas com infra-estrutura da escola e sua depreciação, salários dos professores e despesas por parte dos estudantes) e os indiretos (rendimentos que os estudantes deixam de ganhar por estarem fora do mercado de trabalho, e do capital da escola medidos pelos juros sacrificados pela instituição de ensino). Vale notar que o autor incluiu custos da escola, pois a medida de interesse é a taxa social de retorno, diferente da taxa privada de retorno que não inclui tais componentes.10 10 Langoni aparentemente não incorpora os impostos do lado dos benefícios, o qual seria mais correto na estimação de uma taxa social de retorno. Para o cálculo da TIR é imprescindível a mensuração dos perfis de rendimentos por experiência (idade), e Langoni os mede através de médias amostrais e não através de regressões,11 11 O problema da média amostral é que ela é menos eficiente, em termos de menor variância, do que o estimador de mínimos quadrados ordinários. Assim, o gráfico do perfil de rendimentos-experiência (idade), por nível educacional, pelas regressões tende a ser extremamente suavizada, enquanto da média amostral não apresenta nenhuma suavização, podendo apresentar relações espúrias das variáveis. Contornamos este problema, utilizando regressões não paramétricas que não impõe uma forma funcional e controlamos o parâmetro de suavização do perfil de rendimentos. Vale ressaltar também que regredir uma variável contra outras impõe um relação de casualidade entre a endógena e as exógenas, enquanto a média amostra não. utilizando dados em cross section. As TIR's variam entre 1960 e 1969, de 48.1% para 32% para o primário em relação aos analfabetos; de 23.8% para 19.5% para o ginásio em relação ao primário; de 14.8% para 21.3% para o colegial em relação ao ginásio; de 4.9% para 12.1% para o superior em relação ao colegial. Barbosa Filho e Pessoa (2008) atualizam o trabalho de Langoni utilizando a sua metodologia. A seguir mostramos a equivalência entre a TIR e o coeficiente "minceriano".

3. EQUIVALÊNCIA ENTRE A TIR E O COEFICIENTE "MINCERIANO"

Mincer I e Mincer II chegam ao mesmo modelo, mas sob motivações diferentes.12 12 A revisão destes modelos seminais encontra-se na versão longa deste artigo que pode ser requisitada ao autor. Mincer I usa o princípio de diferenciais compensatórios para explicar porque agentes com níveis diferentes de educação recebem rendimentos diferentes ao longo de seus ciclos de vidas. Já Mincer II assume que os agentes podem investir em capital humano após a escola (treinamento no emprego) a fim de adquirir e aprimorar suas habilidades (skills), ampliar seu conjunto de informações sobre sua ocupação e aumentar seus rendimentos potenciais. Mincer II obtém exatamente a equação 1, enquanto Mincer I apresenta a mesma forma funcional, mas sem os termos de experiência.

Portanto, nesta seção mostramos que, sob determinadas hipóteses, o coeficiente minceriano β da equação 1 seja igual a TIR para educação. Seja Y(x,s) os rendimentos anuais de um indivíduo com x anos de trabalho e s anos de educação, e l o tempo total de trabalho. As hipóteses diretas e indiretas assumidas no modelo de Mincer para se mostrar essa equivalência13 13 Esta equivalência é mostrada também em HLT e Willis (1986), que derivam para o caso do tempo contínuo. são: (i) um agente neutro ao risco que maximize o valor presente da renda esperada ao longo do ciclo de vida, (ii) que l' (s) = 1 (ou seja, que o tempo de trabalho seja igual para todos indivíduos independentemente do nível educacional), (iii) que os únicos custos incorridos sejam o custo de oportunidade, ou seja, os rendimentos protelados advindos do mercado de trabalho durante o período de escolarização, (iv) que não exista incerteza, (v) que os agentes entrem no mercado de trabalho um período após o encerramento dos estudos, (vi) que durante a escolarização eles não trabalhem, (vii) que não exista imperfeições no mercado de crédito, (viii) que após a obtenção de um emprego, os agentes não retornam à educação, que a forma funcional dos rendimentos seja (ix) (em log) linear sobre a educação e (x) (em nível) separável multiplicativamente entre educação e experiência. Esta última hipótese não permite uma interação entre educação e experiência e pode ser melhor visualizada reescrevendo a equação 1 e obtendo a seguinte função de produção de capital humano:

Y(x,s) = l(s)θ(x),

em que, λ(s) = λ(0)eβs, e θ(x) = . Assim, temos que = 0, ou seja, os rendimentos em log são paralelos na experiência entre os diversos graus de educação (hipótese de paralelismo).

Willis (1986) aponta também uma hipótese adicional da economia como um todo: que a economia e a população estão no equilíbrio de estado estacionário de longo prazo, sem mudança da produtividade agregada e uma taxa constante do crescimento populacional, tal que o valor presente dos rendimentos do ciclo da vida é de um agente representativo. Assim, o agente maximiza o valor presente de seus rendimentos, escolhendo a quantidade discreta de anos de educação:

Supondo paralelismo e linearidade nos anos de estudo, ou seja, Y(x,s) = λ(0)eβs, e θ(x) < ∞, teremos como condição de primeira ordem:

Para r ≠ (-1,0) teremos:

Assim, para valer a equivalência, as hipóteses principais assumidas são linearidade e paralelismo. Estas hipóteses serão testadas. Antecipando os resultados, veremos que elas são rejeitadas, motivando assim seu relaxamento, bem como adicionalmente as hipóteses (ii), (iii) e (vi).

4. TESTANDO AS HIPÓTESES DE MINCER

Na subseção a seguir discutimos algumas limitações de nossa abordagem ao utilizar dados em cross-section. Na subseção seguinte apresentamos os dados e algumas estatísticas preliminares. A seguir apresentamos a metodologia do teste de linearidade e os seus resultados e na última parte desta seção apresentamos a metodologia do teste de paralelismo e seus resultados.

4.1. Discussão

Assim, como apontado por HLT, a utilização de dados em cross-section nos leva a uma hipótese que pode ser relativamente forte: que os indivíduos se baseiam, numa análise ex-ante de suas decisões de investimento, no perfil de rendimento-experiência dos indivíduos mais velhos em idade de trabalho ativa. Esta é uma versão da hipótese de expectativas racionais na qual os agentes prevêem seus rendimentos baseado no perfil de rendimentos de indivíduos mais velhos Heckman (2005). Assim, não se leva em consideração que os agentes podem antecipar mudanças futuras no preço da educação, por exemplo. Deve-se ressaltar, no entanto, que o fato dos indivíduos basearem suas decisões de investimento em capital humano em indivíduos mais velhos é válido pois não existe um contrafactual perfeito, do qual poderia se extrair o fluxo de renda para o caso do indivíduo freqüentar e não freqüentar escola. Assim, temos de tomar como referência agentes com características similares.

Além disso, o uso de cross section, segundo Card (1999), é válido se ele refletir, mediante os diferenciais de rendimentos, diferenças de produtividade verdadeiras, e não devido a diferenças de habilidade inerentes ao indivíduo, que poderia estar correlacionada com a educação. Este problema de endogeneidade tem sido abordado intensamente na literatura; e no Brasil, recentemente, Sachsida et alii (2004) estimaram os retornos mincerianos, corrigindo para diversas fontes de vieses. Vale destacar que o viés ocasionado por habilidade e outros fatores omitidos não ultrapassa 10% do valor do coeficiente minceriano para os EUA Card (2001). Para o Brasil, Binelli e Filho (2006) mostram que este viés, originado da heterogeneidade não observada, é relativamente pequeno para os retornos relativos.

4.2. Dados e Estatísticas Descritivas

A PNAD por se tratar de uma pesquisa amostral "complexa" merece um cuidado especial. Portanto, discutimos brevemente a literatura que explica e incorpora o desenho (plano) amostral de uma pesquisa e adverte para as conseqüências de sua não-consideração.

Desenho Amostral Os custos de se realizar uma pesquisa amostral baseada em um desenho amostral simples são muito altos. Por isso, segundo Chromy e Abeyasekara (2005), utilizam-se desenhos amostrais complexos para controlar tais custos. Segundo Yansaneh (2005), o desenho amostral complexo envolve estratificação, amostragem em multi-estágios (conglomeração ou cluster) e probabilidades de seleção diferentes. Em relação à conglomeração, a observação selecionada no primeiro estágio geralmente é denominada como unidade primária de amostragem (UPA). Estas UPAs podem ser divididas em áreas urbanas e rurais, ou ainda, em alguns países, seriam divididas em áreas geográficas ou administrativas. As observações selecionadas de cada UPA são denominadas unidades de segundo-estágio (USAs), e dentro destas as de terceiro estágio (UTAs), e assim sucessivamente. Geralmente as USAs são divididas como domicílios ou famílias e as UTAs seriam as pessoas. A estratificação é geralmente aplicada em cada estágio da amostragem, na qual particiona-se as unidades (de primeiro, segundo, terceiro estágios) em subgrupos mutuamente exclusivos. Estas unidades geralmente são selecionadas com probabilidades proporcionais ao seu tamanho (por exemplo, o número de famílias ou pessoas pertencentes a uma UPA) e, portanto, podendo ser desiguais em cada estágio. Assim, segundo e Pessoa e Silva (1998) e IBGE (2004), o desenho amostral complexo da PNAD emprega uma amostra estratificada de domicílios em três estágios, tendo como UPAs os municípios, que são estratificados segundo as unidades da federação (UFs), e regiões menores dentro das UFs. A seleção de municípios dentro de cada estrato é feita com probabilidades desiguais, proporcionais ao tamanho, havendo inclusive municípios incluídos na amostra com probabilidade igual a um (chamados de municípios auto-representativos). As USAs são setores censitários e da mesma forma, a seleção destes setores dentro de cada município é feita com probabilidades proporcionais ao número de domicílios em cada setor segundo o último Censo disponível. No último estágio foram selecionados os domicílios em cada um destes setores, com igual probabilidade. Todas as pessoas moradoras em cada domicílio da amostra são pesquisadas.

No entanto, os estudos em geral não consideram para tais aspectos, partindo de hipóteses básicas que só seriam válidas quando os dados são obtidos através de amostras aleatórias simples com reposição ou, equivalentemente, independência e igualdade de distribuição (iid). Geralmente, dados obtidos de pesquisas por amostragem, como a PNAD, não permitem o uso de tais hipóteses Silva et alii (2002).

Diversos estudos em Economia não consideram o desenho amostral complexo ao estimar a variância, na construção de intervalos de confiança e de testes de hipóteses, gerando, segundo Lumley (2004), estimativas viesadas, o que, a rigor, acaba invalidando os testes de hipóteses usuais. Assim, seus resultados estão imprecisos, podendo acarretar em uma mudança apenas quantitativa ou até uma mudança qualitativa, ao alterar a (não-)significância dos parâmetros estimados. Portanto, este estudo visa também contribuir nessa questão, ao incorporar o desenho amostral da PNAD.

Amostra e Estatísticas Descritivas Portanto, em todos os testes realizados utilizaram-se dados da PNAD de 1992 até 2004,14 14 Excetuando-se os anos de 1994 e 2000, nos quais não foi realizada a pesquisa. Além disso, em 2004, o IBGE incluiu na pesquisa a zona rural da região Norte, antes não incorporada. Então, para efeitos de comparação com os outros anos retiramos a zona rural da região Norte de 2004. e dos Censos de 1970, 1980, 1991 e 2000. Assim, realizamos os testes de linearidade sem realizar correções nas estimações e comparando ao se incorporar o desenho amostral da PNAD. O mesmo procedimento foi realizado no cálculo das TIRs que envolvem as especificações paramétricas e não paramétricas.

A subpopulação utilizada no teste de linearidade foi: indivíduos, entre 24 e 56 anos, apenas homens brancos, que não freqüentam escola, com uma jornada de trabalho superior a 36 horas e inferior a 44 horas, com renda positiva15 15 Ao corrigirmos o viés de seleção amostral, incluímos os que não trabalham. e abaixo de 100 salários mínimos reais, excluindo os trabalhadores do setor agrícola e público, na produção para o próprio consumo, na construção para o próprio uso e os não remunerados.

A exclusão dos trabalhadores agrícolas e funcionários públicos é devida ao fato que seu regime de salários é diferente do mercado. A remoção dos que freqüentam escola é para efeitos de comparação com o modelo minceriano, que assume que o indivíduo entra no mercado de trabalho um período após o encerramento de sua escolarização. Adicionalmente, notamos da quinta coluna das Tabelas A-1 A-2, no ApêndiceApêndice, que em torno de 10% apenas dos trabalhadores estudam, mas esta porcentagem tem se elevado ao longo dos anos. Dentre estes que trabalham e estudam, a maioria é de homens e, dentre os homens, de brancos. Mas estes grupos têm decaído relativamente nos últimos anos.

A restrição da faixa etária pode ser observada da nona a décima-segunda colunas das tabelas. A grande maioria dos trabalhadores tem 24 ou mais anos de idade, e tem se elevado nas últimas duas décadas, em detrimento das outras faixas etárias. Além de ser o maior grupo, esta faixa têm uma renda média em torno de 1000 reais em termos reais,16 16 A renda neste artigo foi deflacionada pelo INPC a preços de novembro de 2004. estando de 100% a 400%, aproximadamente, acima da segunda e quarta maiores faixas etárias, respectivamente. Assim, a não inclusão dos grupos menores na realização dos testes e no cálculo das TIRs compreende uma parte relativamente menor dos custos de oportunidade dos rendimentos sacrificados.17 17 Este ponto é retomado na seção 5.2 que discute as hipóteses assumidas no cálculo das TIRs. Em relação à restrição de 56 anos, nota-se do universo de aposentados que, a grande maioria está acima de 56 anos. A idade média deste grupo está em torno de 63 a 66 anos. No entanto, esta é uma medida que sobreestima a idade real da entrada na aposentadoria, a qual foi considerada devido a falta de uma variável que a mensurasse corretamente.

A restrição da jornada de trabalho para período integral, se deve ao fato que, segundo Freeman (1987), o modelo de investimento em capital humano, proposto por Becker, afirma que um indivíduo deve a cada ano decidir se vai para a escola e investe em educação ou vai para o mercado de trabalho em período integral. Outros estudos importantes, como Murphy e Welch (1992, 1990), que se baseiam no modelo minceriano para estimar os perfis de rendimentos dos indivíduos, também restringem a amostra para trabalhadores de tempo integral.

Em relação à exclusão das mulheres, citamos duas razões, a saber: (i) a inserção das mulheres no mercado de trabalho é mais tardia, ocorrendo em média com 14 a 15 anos, enquanto os homens iniciam um ano antes; (ii), Cameron e Heckman (2001),(apud Sachsida et alii (2004)), em um estudo sobre as fontes de disparidade étnica e racial na matrícula escolar, consideram apenas homens pois suas decisões de escolaridade são menos complicadas por considerações de fertilidade.

4.3. Teste de Linearidade

No teste de linearidade, foram utilizadas três especificações distintas. De forma geral, estimamos:

em que, Y é o salário-hora.18 18 Mais precisamente: Y = (renda do trabalho principal / número de horas trabalhadas * 4). Ressalta-se que para os censos de 1980/1970 as horas de trabalho estavam disponíveis apenas por faixas. Assim os valores assumidos seguem da tabela 1. Com exceção dos limites inferiores e superiores, os valores tomados referem-se a média da faixa horária. Devido à divisão por faixas, a amostra para 1980/1970 incorpora somente os agentes de 40 a 48/49 hs.

Na especificação 1, utilizamos uma função spline:

em que, Sj, j = 2,...,15, é uma dummy se o agente tem S j anos de estudo. Estas dummies captam o retorno educacional, permitindo descontinuidades e mudanças de inclinação após cada ano de estudo completo. Na especificação 2, utilizamos uma função cúbica:

em que, incluímos também algumas variáveis que captam descontinuidades,19 19 A especificação 2 é baseada em Hungerford e Solon (1987), que capta efeitos diplomas nos anos de conclusão referentes aos graus escolares (primário [ S 4], ginasial [ S 8], secundário [ S 11] e terciário [ S 15]). definição similar à 3. Por fim, estimamos a especificação 3 mais ampla, que permite obter estimativas de cada série cursada. Assim, não utilizamos mais anos de estudo, e sim se o indivíduo obteve a conclusão de determinada série. Optou-se também por esta especificação, visto que alguns agentes obtêm os graus escolares (EF, EM etc)20 20 As seguintes abreviações serão utilizadas daqui em diante em todo artigo. NEDUC: sem instrução, PRE: pré-escola, EFj: j-ésima série do Ensino Fundamental, EMj: j-ésima série do Ensino M édio, SUPj: j-ésima série do Ensino Superior, MD: Mestrado/Doutorado. com menos ou mais anos de estudo que o padrão da maioria. Para isso, substituímos S na equação 3 pela variável grau.21 21 Grau recebe os seguintes valores: 0, se nunca estudou, 1 se fez até a pré-escola ou alfabetização, 2 se 1 a série do EF, 3 se 2 a série do EF e assim sucessivamente até 17 se cursou o mestrado ou doutorado. E assim a especificação 3 é descrita como:

As variáveis EFj, EMj, SUPj e MD são dummies se o indivíduo tem o grau > j apresentando o mesmo aspecto técnico da especificação 1.22 22 As omissões de dummies relevantes para se evitar dependência linear perfeita na matriz de regressores foram realizadas.

Assim, efetuamos um teste F, sobre os coeficientes das especificações descritas afim de testar a hipótese nula favorável ao modelo linear, contra a hipótese alternativa favorável à não-linearidades nos retornos.

É importante ressaltar aqui as diferenças entre a especificação das séries equação 5 e de anos de estudo equação 3 e 4. A variável anos de estudo, na PNAD, é derivada da variável série. Portanto, quem cursou até a 4ª série do EF tem necessariamente 4 anos de estudo, ou seja, esta variável não capta diretamente atrasos ou repetências escolares. No entanto, quem não se instruiu ou quem fez somente pré-escola apresenta o mesmo valor de 0 anos de estudo, logo estes dois grupos não serão diferenciados na especificação de anos de estudo, ao passo que na especificação das séries é possível e serão diferenciados. Ressaltamos que a idade de início dos estudos tomada como referência base é 6 anos. Outro aspecto é que a PNAD tem como limite máximo 15 anos ou mais de estudo. Assim, podem existir diferenças de quem fez curso superior e mestrado/doutorado. Além disso, a especificação da série leva em consideração se o indivíduo concluiu ou não os graus. Em relação ao Censo, temos a mesma estrutura, mas a variável anos de estudo é mais dividida, tendo como maior valor 17 ou mais anos de estudo, com exceção dos anos de 1970 e 1980 que não apresentam esta variável, e portanto estimamos apenas a especificação das séries para estes anos.

4.3.1. Seleção Amostral

Na subseção 4.2 foi especificada a amostra a ser utilizada condicionada às variáveis explicativas, ou seja, filtrada por raça, gênero, idade etc. Mas problemas de viés de seleção amostral podem surgir se eu condiciono a amostra na variável dependente, ou seja, se considero na amostra somente indivíduos com salário positivo. O problema de seleção amostral surge pelo fato de não observarmos a oferta de salário-hora dos agentes que não trabalham, ou seja, quando esta oferta salarial for menor que o salário de reserva do indivíduo. Assim, alguns agentes decidem não trabalhar, mas, como já mencionado na subseção 4.1, tomamos como hipótese que a oferta de salário deles é também considerada por aqueles que estão tomando a decisão de quanto devem se educar, pois estes indivíduos ëxcluídos" da amostra selecionada estão em idade ativa de trabalho. A não incorporação destes agentes viesaria os retornos educacionais.

Para corrigir tal viés, utilizamos o procedimento de estimação de dois estágios de Heckman (1979), no qual estimamos, em uma primeira etapa, um probit utilizando toda a amostra, com uma dummy se o agente está empregado como variável dependente. Esta é a chamada equaç ão de seleção. Assim, obtemos a razão inversa de Mills e estimamos a equação de salários incorporando esta razão. Um teste t sobre o parâmetro desta razão de Mills é um teste válido da hipótese nula de não existência de viés de seleção.23 23 Rejeitou-se tal hipótese nula implicando em existência de viés de seleção amostral.

Para a equação de seleção, utilizamos, além das covariáveis da equação de salários, o número de filhos, dummy para casamento, renda não oriunda do trabalho, dummy se o agente pertence a algum sindicato e dummies para os estados de residência.24 24 O número de filhos é computado diretamente somente para as mulheres. Assim, para computarmos esta variável para os homens, identificamos os filhos presentes na família, sendo o pai o chefe ou pessoa de referência. Para a dummy de casamento, procedemos da mesma forma, computando valor 1 para as pessoas que são chefe e cônjuge na família, visto que para a PNAD não existe tal variável. A variável sindicato não foi incluída nas regressões envolvendo o Censo, pois este não a abrange. E para o Censo de 1970 não foi computada a renda oriunda do não-trabalho, pois somente está disponível a renda da ocupação principal.

4.3.2. Resultados

No ApêndiceApêndice seguem as Tabelas A-3 e A-6 dos testes de linearidade para as especificações definidas. Sob todas as especificações estimadas, rejeita-se a hipótese nula de que os coeficientes nos termos não lineares sejam nulos. Além disso, para todas as especificações nota-se que o valor da estatística apresenta uma tendência de crescimento, o que nos leva a concluir que a hipótese de linearidade do modelo de Mincer tem se tornado cada vez mais inadequada, levando a uma má especificação dos modelos que a utilizam. Em relação ao Censo, a estatística F tem se elevado para as duas primeiras especificações, enquanto para a última tem oscilado, mas mostrando-se de forma elevada.

Comparando as correções feitas aos modelos, nota-se que a inclusão do plano amostral e a correção do viés de seleção mostral através do heckit reduz a estatística do teste F, mas não a ponto de não se rejeitar a hipótese nula de linearidade da educação.

Portanto, rejeitamos fortemente a hipótese de linearidade para o Brasil, o que por si só já invalidaria a interpretação do coeficiente minceriano ser considerado um retorno educacional.

4.4. Teste de Paralelismo

Estimativas iniciais dos rendimentos como função da experiência para diversos níveis de educação serão reportadas. Para se obter tais estimativas, desejamos estimar a seguinte equação:

y = f(x) + u,

tal que E[u|x] = 0 e E[u2|x] < ∞, o que implicaria que E[y|x] = f(x). Portanto, uma estimativa para f(x) provê um estimador da média de y condicional em x. Para estimarmos f(x), temos a abordagem paramétrica (global) que impõe uma forma funcional a f(x).25 25 Tais métodos seriam, por exemplo, aproximação polinomial global e splines, sendo estes já utilizados nos testes de linearidade. Assim, poderíamos impor que f(x) = ax + bx2 + cx3, ou um polinô mio de ordem maior. A desvantagem deste método é que quanto maior a ordem do polinômio, maior são os problemas inerentes de multicolinearidade, sendo que as estimativas perdem em precisão e parcimônia. Além disso, estas técnicas são sensíveis a outliers, dado o fato de que as estimativas em cada ponto dependem da amostra inteira. Mas um dos maiores problemas referentes a métodos paramétricos é a imposição de uma forma funcional ao modelo a ser estimado, o que pode ocasionar problemas de má especificação. Assim, lançamos mão de uma abordagem local, utilizando o método de regressão linear local não paramétrica. A idéia deste método é minimizar, em uma vizinhança em torno dos pontos de um grid (x0), a soma dos resíduos quadráticos ponderados pelo formato e largura de uma seqüência de núcleos ( kernels) Härdle (1990). Assim, para uma amostra aleatória i.i.d., temos que:

em que, Ki = K é um núcleo quártico26 26 O núcleo quártico é definido como: hn é uma janela tal que hn 0. Das condições de primeira ordem obtemos:

em que, Wi (x0) =

Assim, e são estimadores para f(x0) e f'(x0) respectivamente.27 27 Intuitivamente estamos utilizando uma aproximação polinomial local, através de uma expansão de Taylor de ordem p,p = 1, em torno de x 0. No caso geral teríamos: Assim, a hipótese nula para o teste de que os perfis do log rendimento-experiência são paralelos entre anos de estudos diferentes é:

em que, xi, corresponde a i anos de experiência para i = 10,20,30. Assim, a idéia do teste é simples: verificar se a diferença da média do salário condicional no nível escolar s2 em relação a s1 é a mesma em dois níveis distintos de experiência.28 28 Além deste teste conjunto, efetuamos também testes separadamente para apenas uma diferença de médias, ou seja, para a hipótese nula: ,29 29 Estes valores para i (10,20,30) são válidos para comparação dos níveis escolares 15 ou mais anos de estudo (acima de SUP), 11 anos (EM3) e 8 anos (EF8). Mas os que envolvem 4 (EF4) e zero (PRE e NEDUC) anos de estudo, a faixa de anos de experiência não engloba 10 anos, logo os valores assumidos são {20,30,40}. Segundo Heckman et alii (1998), para testar esta independência de média em L valores diferentes de x, seleciona-se os valores de xi separados por pelo menos duas vezes a janela (2hn), tal que as estimativas sejam independentes e assim a estatística seja assintóticamente distribuída por χ2(L). Como utilizamos hn = 5, por isso selecionou-se valores de xi espaçados de 10 em 10.30 30 Realizamos estimativas para janelas variando de 2 a 10 e houve pouca alteração na suavização dos perfis de renda. Assim, escolhemos, através de um critério subjetivo, uma janela intermediária, semelhante a HLT. Logo, sendo a estimativa de E(yi|xi, s = sl), a estatística do teste de paralelismo para a hipótese nula definida acima será, segundo Heckman et alii (1998):

e

Para computar a variância utilizamos o estimador proposto por Heckman et alii (1996b) :

em que, i é o resíduo da regressão.

4.4.1. Resultados

Os gráficos dos perfis de renda-experiência foram obtidos através do estimador não paramétrico 5 para diversos níveis educacionais.31 31 Os gráficos apresentados referem-se apenas a alguns anos. Os outros anos podem ser requisitados ao autor. Tomando como referência a Figura A-1 do Censo, que apresenta medidas relativamente mais estáveis, notamos que os rendimentos tendem a ser uma função mais íngrime e côncava quanto maior o nível educacional. Este ponto está de acordo com a literatura Becker (1975), Willis (1986), Psacharopoulos (1994), em que os indivíduos tendem não apenas a ganhar mais com o maior nível educacional, mas apresentam maiores taxas de crescimento, as quais decaem mais rapidamente ao longo da vida de trabalho, para maiores graus de ensino. Uma investigação inicial através destes gráficos aponta contra o paralelismo, dado que alguns perfis de salário acabam se aproximando. No caso da PNAD (Painéis 2 e 4)32 32 Devido à aplicação de filtros à amostra, observou-se para algumas células educação-experiência um número muito reduzido de observações para os graus incompletos, principalmente no fim do ciclo de vida. Este é um problema recorrente destes métodos, observado também nos estudos de Murphy e Welch (1990, 1992) e HLT que utilizam o CPS (Current Population Survey) e o Censo americano, respectivamente. Por isso, os gráficos da PNAD apresentam apenas os perfis de salários para os graus completos, que têm um número bem maior de observações por célula. observamos também uma aproximação para alguns níveis, bem como na Figura A-3, que ocorre até um cruzamento dos perfis, comportamentos semelhantes ao observado por HLT.

Nas Tabelas A-7 e A-10 seguem os testes da estatística 6 para a hipótese conjunta, bem como para apenas dois pares de experiência distintos. Em relação às PNADs, notamos que para a maioria dos anos, nas duas especificações, rejeita-se a hipótese nula conjunta de paralelismo, para algum par de anos de estudo (séries) distintos. É importante destacar, dos resultados da PNAD, a grande variação do diferencial salarial, para um dado nível de experiência, de um ano para outro. Um dos motivos desta variação é a falta de um grande número de observações por célula requeridas pelos métodos de estimação não-paramétricos, ocorrida devido à necessidade de aplicação de filtros na amostra da PNAD. Assim, a média condicional estimada nestes pontos tende a oscilar mais de um ano para outro. Esta oscilação também pode ser notada dos gráficos dos perfis. Assim, realizamos também o teste para o Censo que, dada a nossa restrição amostral, inclui um maior número de observações por célula e, portanto, existe uma menor oscilação das estimativas. Para todas estimativas, com exceção do ginásio em relação ao primário em 1991 e 2000, rejeitamos o paralelismo. Assim, na seção a seguir, computamos as TIRs para se medir o viés destas estimativas em relação ao coeficiente minceriano.

5. TIR

Para o cálculo das TIRs, utilizamos:

em que, Ŷ(.) são os valores ajustados das regressões paramétricas (spline e expansão de Taylor33 33 Ao relaxar a hipótese de paralelismo, estimamos as TIRs através da especificação não paramétrica já discutida e através de uma especificação paramétrica, ou seja, uma expansão de Taylor de ordem 2 tal que: ) e não-paramétricas. Para a especificação de anos de estudo, h é simplesmente a diferença entre dois níveis educacionais. Ou seja, quando comparamos o valor presente dos rendimentos de quem tem 8 e 4 anos de estudo, este h seria igual a 8-4=4 anos. No entanto, quando utilizamos a especificação das séries, devemos considerar o tempo médio esperado de conclusão de cada série ou grau de ensino completo. Assim, quando comparamos o valor presente dos rendimentos de quem tem o ginásio (EF8) com o primário (EF4), o h seria o tempo médio esperado de conclusão do ginásio subtraído do primário. Mas devido a falta desta variável, utilizamos como proxy a idade média dos que freqüentam o determinado grau escolar.34 34 Assim, por exemplo, para o ano de 1992, a idade média de quem cursava EF8 era 16.33 anos e a de quem cursava EF4 era de 11.67. A diferença entre estas médias será de 4.66, maior do que 4 anos, que seria o tempo de conclusão sem repetência. Isso ocorre porque esta proxy para a especificação das séries considera a repetência dos alunos. E adicionamos 0.25 à estimativa do h, para minimizar o erro de medida que tende a subestimar a idade média de conclusão do dado nível escolar pois a PNAD e o Censo são realizados em meados de agosto-setembro, ou seja, faltando 1/4 de ano para ser concluído.35 35 Ressalta-se que o INEP provê uma estimativa do tempo médio de conclusão por série, mas esta estava disponível apenas de 1995 até 2001. Assim, para termos estimativas mais homogêneas para fins comparativos construímos esta medida a partir da idade do indivíduo, a qual diferiu pouco da medida do INEP. A seguir, apresentamos os resultados e depois discutimos outras hipóteses levantadas no cálculo das TIRs.

5.1. Resultados

As Tabelas A-11 A-13 apresentam as estimativas das TIRs. As primeiras duas linhas de cada ano (Mincer I e II) referem-se ao coeficiente minceriano36 36 O coeficiente minceriano foi ajustado para o tempo contínuo, como: - 1 = retorno minceriano. dos seus dois modelos originais. Eles são tomados como pontos de referência, para se medir a magnitude do viés em relação às estimativas das TIRs. Logo, as outras linhas referem-se às estimativas das taxas de desconto, relaxando primeiramente linearidade (função spline) (TIR-Não Linear, terceira linha) e depois paralelismo. Para esta última foram estimados modelos paramétricos (expansão de Taylor) (TIR-Não Paralelo param., quarta linha) e não paramétricos (TIR-Não Paralelo n-param., quinta linha). Estas estimativas estão divididas em três blocos de colunas para a PNAD: as regressões estimadas sem qualquer tipo de correção; incluindo o desenho amostral; e incorporando o desenho amostral e corrigindo o viés de seleção amostral através do heckit. E para o Censo: sem correções e estimando pelo heckit.

Notamos, tanto para os Censos como para as PNADs, que o viés37 37 O viés a ser mencionado nesta subseção é sempre baseado em relação ao modelo de Mincer II, o mais amplamente utilizado na literatura, a não ser que seja mencionado em relação a outra TIR como referência base. Assim, entende-se como viés positivo a diferença entre o retorno minceriano e uma determinada TIR sendo positiva. tende a ser positivo para todos níveis educacionais, especificações e tipos de correções; com exceção de quando se compara os maiores anos de estudo, que apresentam viés negativo, principalmente em 2000. Um ponto importante a ser destacado é que, este viés negativo para os retornos de maior nível educacional, se torna positivo, quando mudamos o foco para a especificação das séries, para todos os tipos de correções. Esta última especificação tende a medir mais corretamente os retornos de cursos superiores, enquanto a dos anos de estudo pode estar misturando retornos de graduação completo, incompleto e pós-graduação. Por isso, observam-se retornos relativamente mais elevados para o nível escolar mais alto na especificação dos anos de estudo (S15-S11 na PNAD e no Censo). Em termos de magnitude, quando incorporamos apenas o desenho amostral da PNAD, o viés chega a uma diferença de mais de 12 pontos percentuais (p.p.) quando comparamos as TIRs não paramétrica e Mincer II de EF4-PRE para o ano de 2003 (16.42% - 3.98%). Quando incorporamos o desenho amostral e corrigimos o problema de seleção amostral (heckit) obtemos vieses que chegam também a mais de 12 p.p. quando comparamos as TIRs não linear e Mincer II de EF4-PRE para o ano de 2003 (15.71% - 3.53%). Os vieses para os níveis escolares superiores são menores, mas ainda são significativos, podendo chegar à magnitude de quase 7 p.p., por exemplo, para o ano de 1993 nesta mesma última especificação para SUP-EM3. Para o Censo, os vieses são também elevados, podendo chegar a uma diferença de mais de 14 p.p. quando o retorno minceriano em 2000 passa de 17.29% para 3.03% para MD-SUP (TIR não-linear) no modelo usando heckit.

Vale notar que as TIRs não linear (terceira linha) e não paramétrica (última linha) diferem pouco. Por exemplo, quando se incorpora o desenho amostral, este viés chega a no máximo 2.08 p.p. na comparação S4-S0 (9.18% - 7.11%) de 2001, e a 1.08 p.p. (7.07% - 5.98%) quando se compara EF8-EF4 de 2003. Em relação ao Censo, chega a quase 2.4 p.p. de viés comparando os dois maiores níveis escolares (S17+-S15) em 2000 e, para as séries, com exceção de 1970, o viés não chega a 1.5 p.p., em termos absolutos. Isso nos leva a crer que, apesar de rejeitarmos o paralelismo, a função spline é uma boa aproximação ao se estimar as TIRs. No entanto, quando se compara a última linha com a quarta linha (TIR não paralela paramétrica), observa-se um viés grande. Assim, ao relaxar paralelismo, deve-se optar por uma abordagem não-paramétrica que não incorra em vieses ocasionados pela má especificação do modelo paramétrico.

Destacamos também duas TIRs para dois níveis escolares que se apresentaram relativamente baixas. A TIR de MD-SUP (Censo) é baixa, o que poderia ir contra o senso comum que cursos de pós-graduação elevam substancialmente os retornos. Mas o que torna estes retornos baixos é o tempo médio de conclusão, variando de 5 até 10 anos. Outra TIR é a que compara Pré-escola com os sem instrução (PRE-NEDUC, PNAD). Ela indica que quem não estudou ou fez apenas a Pré-Escola apresenta um diferencial de renda insignificante38 38 Em geral este retorno é bem baixo - podendo até ser negativo - o que era esperado, pois o mercado não tenderá a pagar muito mais para quem só estudou Pré-Escola ou quem nunca estudou. Por parte da decisão dos indivíduos estudarem só até a Pré-Escola uma explicação possível pode ser devido à qualidade dos pais (pois são estes que investem na educação dos filhos quando menores), a qual poderia ter como proxy seu nível educacional (dos pais) que seria baixo para esse grupo. Este é um aspecto interessante que pode servir de pesquisa futura. . Deve-se ressaltar que esta não deve ser tomada como parâmetro para políticas públicas, dada a vasta evidência que investimentos na Pré-Escola aumentam as habilidades, tempo de permanência dos alunos na escola e reduz sua repetência, e conseqüentemente aumenta a produtividade dos indivíduos no mercado de trabalho Heckman e Carneiro (2003). Barbosa Filho e Pessoa (2008) estimam TIR's para a pré-escola, desenvolvendo uma metodologia interessante, na qual quem estuda na Pré-escola aumenta a sua probabilidade de permanência na escola e aumenta a renda de quem a cursa. Assim, eles obtêm taxas da magnitude de 17%, a qual se mostrou estável nos últimos 10 anos.

Numa análise horizontal da tabela, podemos inferir os ganhos ao se incorporar o desenho amostral e ao utilizar heckit. Em relação à especificação de anos de estudo, nota-se que, para a TIR não linear, pode-se chegar a um viés negativo de quase -1.68 p.p. (12.58% - 14.26% comparando S4-S0 em 1993) e um viés positivo de 1.84 p.p. (13.73% - 11.9% para S11-S8 em 1996) ao não se incorporar o desenho amostral. De forma geral, a TIR tende a estar subestimada para níveis escolares menores e sobreestimada para níveis escolares mais elevados. E em relação à correção do viés de seleção amostral, os ganhos de estimar por heckit são para todos os níveis educacionais, chegando a um viés positivo de quase 2.56p.p. (8.78% - 6.21%, em 2002) comparando S4-S0 para a PNAD e a quase 14.4 p.p. (26.26% - 12.82%, em 2000) para o Censo comparando S17+-S15. Além disso, na maioria dos casos, o viés é positivo, o que implica que os retornos são menores ainda quando corretamente estimados. Assim, é altamente recomendável ao se estimar algum modelo, incluir o desenho amostral da PNAD e corrigir o viés de seleção amostral para a PNAD e Censo.

Assim, esses aspectos apontam para uma direção clara que os retornos mincerianos são viesados, diferindo bastante dos verdadeiros retornos educacionais mensurados pela TIR. Portanto, esse viés tem conseqüências particulares como os retornos estarem sobreestimados e assim não explicarem adequadamente os movimentos de demanda por educação. Logo, para o Brasil, retornos são bem menores quando corretamente mensurados. Isso ocorre devido, principalmente, à especificação das séries que não têm sido considerada na literatura, e como pode ser observado das Tabelas A-11 e A-12, provê retornos bem menores do que a abordagem dos anos de estudo, pois considera o tempo médio esperado de conclusão, ou seja, o termo h é maior para a primeira abordagem do que para a última.

Destacamos ainda que as TIRs da abordagem dos anos de estudo são próximas das obtidas por Barbosa Filho e Pessoa (2008), com exceção do ginasial e do terciário que diferiram em maior magnitude. Além disso, apresentam alguma semelhança com os estudos baseados no modelo de Mincer, como Blom e Verner (2001), pois estes autores obtiveram retornos do primário e ginásio bem menores em relação ao secundário e terciário. Logicamente, são viesados pela evidência apresentada em nosso estudo, sendo que nossos retornos (TIRs) obtidos são maiores para o primário e ginasial e menores para o secundário e superior. Esta mesma semelhança ocorre com os estudos de Fernandes e Filho (2000), Leal e Werlang (1991) e de Ueda (2002). São também próximos dos obtidos por Sachsida et alii (2004), com exceção do retorno do ginásio. Portanto, de forma geral, os retornos são razoavelmente próximos, com exceção do retorno ginasial que difere entre os estudos. Esta diferença pode ser causada por métodos e amostras distintos entre os artigos.

Dada a imensa gama de retornos estimados, surge a questão: qual é a TIR de cada grau escolar? Em relação às especificações, a das séries é a mais precisa pois incorpora o tempo médio esperado, cuja importância já foi destacada. No entanto, para comparação com outros trabalhos, apresentamos também a especificação dos anos de estudo. Em relação às correções, tomamos como referência os modelos com maiores correções, a saber: (i) não paramétrico e (ii) heckit paramétrico. O primeiro sem problemas de forma funcional e o segundo corrigindo o viés de seleção amostral. Assim, apresentamos dois modelos que realizam correções em dimensões diferentes, e, portanto, a diferença entre eles não é trivial de se medir.39 39 Necessitaríamos de um modelo que corrigisse o problema simultaneamente nas duas dimensões e ainda incorpora-se o desenho amostral da pesquisa. O artigo de Das et alii (2003), como mencionado na nota 5, propõe um heckit não-paramétrico, mas não permite incorporar o desenho amostral. Ou seja, esse é ainda um ponto em aberto na literatura. Desenvolvimentos posteriores nessa linha de pesquisa podem permitir uma análise futura dos ganhos das correções de todos os problemas citados. No entanto, ressaltamos que, para ambas as bases notamos que estas estimativas de referência são pouco sensíveis à escolha de modelagem. Portanto, tomamos como referência a TIR não-paramétrica e a TIR paramétrica (Heckit) para uma análise da evolução temporal. Diversos estudos, como já apontado Blom e Verner (2001), indicam uma queda dos retornos mincerianos para o Brasil, com exceção do nível superior, vis a vis um aumento da matrícula de todos os níveis escolares. Da Figura A-5, observamos mais facilmente a evolução temporal. Em relação ao Censo (Gráficos 5.3 e 5.4), os níveis de educação EF4-NEDUC, EM3-EF8 e MD-SUP aumentaram ou mantiveram-se estáveis em 1991 em relação à 1970 e/ou 1980 e decaíram na última década. EF8-EF4 decaiu ao longo das décadas e o SUP-EM3 elevou-se na última década. Em relação à PNAD (Gráficos 5.1 e 5.2), que analisa a evolução recente, notamos para ambas as referências um comportamento próximo do Censo para a última década.

5.2. Discussão

Alguns pontos são discutidos em relação às hipóteses e estimativas consideradas no cálculo da TIR. Uma hipótese assumida por Mincer é que os indivíduos primeiramente se educam e depois entram para o mercado de trabalho. Dois pontos são levantados: (i)segundo a Tabela A-1, poucos trabalham enquanto se educam, mas este percentual tem se elevado ao longo do tempo, o que tem aumentado a quantidade de cursos noturnos no país e; (ii) Mincer assume que custos de educação diretos são compensados pelo trabalho durante os estudos, ou que eles são negligenciáveis. Em relação a este último aspecto do custo da educação, Becker destaca que os investimentos em educação são concentrados em idades precoces, pois: (i) com o passar do tempo o indivíduo tem um menor período para retomar o retorno do investimento em capital humano e (ii) o custo de oportunidade vai se elevando com o maior nível de capital humano. Assim, o custo do tempo é uma fonte importante do custo total no cálculo da TIR. Becker assume que na literatura muitas vezes este custo é negligenciado e deve ser tratado do mesmo modo que os custos diretos. Schultz já estendia os custos além das despesas com mensalidades, anuidades e outras, onde os salários sacrificados compõem uma parte significativa. Além disso, Schultz levanta a questão da exclusão dos salários dos estudantes trabalhadores, da qual as estimativas do custo de oportunidade tendem a ser sobreestimadas. Assim, dada também a evidência anterior, de aumento dos estudantes trabalhadores, analisamos uma especificação adicional incluindo os que freqüentam escola a partir das especificações não paramétrica e não linear. Incorporamos também os trabalhadores de tempo parcial (acima de 20 horas de trabalho), pois muitas vezes este grupo para poder estudar, trabalha apenas meio período. No ApêndiceApêndice, a linha TIR - adicional 1 é comparada com a estimativa não paramétrica, incorporando sempre o plano amostral ou peso amostral (Tabela A-14 e A-16), e também partindo da estimativa não-linear com o plano amostral e correção do viés de seleção amostral (Tabela A-15 e A-17). Não existe uma grande diferença entre as taxas para todas as especificações. Isso é devido porque o percentual de estudantes trabalhadores apesar de ter se elevado ainda é pequeno.

Uma outra hipótese é que l'(s) = 1, supondo que o tempo de serviço possa não depender dos anos de estudo, podendo variar entre indivíduos com o mesmo nível educacional. Assim, relaxamos também esta hipótese. Vale ressaltar que o tempo de trabalho adotado até aqui é de 32 anos, devido à restrição na faixa etária,40 40 Ou seja, como x = i - s - 6, então = 56 - 24 = 32 anos, para um nível de educação fixado. Como consideramos a idade mínima como 24 anos, logo, para esta idade já existem pessoas formadas com o maior nível educacional. não havendo portanto diferença entre esta hipótese e uma tal que l'(s) = 0. Assim, na linha adicional 2, mantemos a hipótese de que l'(s) = 1, mas com a faixa etária incluindo as pessoas de 10 a 65 anos e com tempo de serviço igual aos primeiros 40 anos; e na linha adicional 3, permitimos que os indivíduos trabalhem até os 65 anos, quando se aposentam (l'(s) = 0).41 41 Ressaltamos que as TIRs adicionais 2 e 3 inclui a modificação da TIR adicional 1, e a TIR adicional 4, que será apresentada a seguir, inclui as modificações da TIR adicional 3. Ou seja, estamos relaxando estas hipóteses gradualmente e sucessivamente. A nota da tabela A-14 também reforça este ponto. Notamos uma diferença grande quando incluímos uma faixa etária maior, o que nos mostra que custos sacrificados em idades precoces são significativos; e sua exclusão tende a viesar para baixo os retornos para níveis escolares mais elevados e viesar para cima para as TIRs de S4-S0 e PRE-NEDUC/EF4-PRE para a PNAD. Para o Censo a mesma lógica se aplica. Agora, comparando o adicional 2 com o adicional 3, notamos que as diferenças das estimativas são pequenas. Isso é devido ao fato que os rendimentos no fim do ciclo da vida são mais intensamente descontados, tendo, portanto, pouco impacto no valor presente dos rendimentos e assim pouco impacto na TIR (HLT).

Por fim, incluímos os custos privados diretos (mensalidades) no cálculo da TIR.42 42 Mais precisamente, estimamos a TIR através de: Estes custos foram obtidos através da Pesquisa de Orçamentos Familiares (POF) de 1995/1996,43 43 Vale ressaltar que o INEP provê através de sua página na internet dados de apenas gastos públicos com educação. Estes gastos podem ser incluídos na análise das TIRs, em um contexto mais macroeconômico, o qual compara o investimento em educação com outros investimentos, como em capital, como já feito por Langoni (1974). do qual estimamos uma média por nível educacional e ajustamos para uma jornada padrão de 40 horas semanais, para comparação com a renda padronizada pelas horas de trabalho individual. Como os gastos de educação privados estão disponíveis apenas para a POF deste ano, realizamos uma simulação destes gastos para os outros anos para efeitos de comparação. Estimamos a renda total média das famílias que tinham membros na Pré-Escola, depois as que tinham membros no Primário e assim sucessivamente. E calculamos a porcentagem dos gastos com mensalidades em relação à renda média, obtida da POF, e supusemos constante para todos os anos. A partir desta porcentagem estimamos os gastos utilizando a renda média da PNAD da mesma forma. A Tabela A-18 apresenta tais estimativas. Assim, segundo as Tabelas A-14 e A-15, para o ano de 1996, a partir dos gastos originais da POF (linha TIR -adicional 4 (POF)) observamos taxas bem menores, chegando a uma queda de mais 3 p.p. (S15-S11) em relação à especificação 3. Da mesma forma, para os gastos simulados, observamos quedas relativamente grandes para todos anos, principalmente para os maiores níveis educacionais.

Destacamos que as TIRs adicionais 2-4 (Tabelas A-14 - A-16) são mais sensíveis entre a modelagem não paramétrica e paramétrica, principalmente em relação ao retorno do ensino ginasial em relação ao ensino primário (EF8-EF4 e S8-S4, PNAD).44 44 Este retorno ginasial diverge entre diversos estudos, como mencionado em seção anterior. Tomando como referência as TIRs adicionais 2-4 notamos que este retorno é bem maior para o não-paramétrico em relação ao não-linear.

Analisando ao longo dos anos do Censo, notamos, do Gráfico 6.4 na Figura A-6, uma tendência de queda de todos níveis na última década e um aumento da graduação e pós-graduação frente ao grau imediatamente anterior na última década. Estimando por heckit (Gráfico 6.3), notamos uma pequena diferença, em relação aos graus EF4-NEDUC que subiu e MD-SUP que caiu na última década. Em relação à PNAD, notamos que a TIR não-linear (Gráfico 6.1) apresenta comportamento semelhante em relação à seção anterior. A TIR não paramétrica (Gráfico 6.2) apresenta também o mesmo comportamento, com exceção do EF8-EF4 que apresentou uma queda até 1999 e um aumento a partir daí, e o nível superior que apresentou uma certa estabilidade nesta década.

6. CONCLUSÃO

Desde a publicação do trabalho seminal de Mincer, em 1958, e posteriormente uma versão estendida, em 1974, vários artigos empíricos têm-se utilizado da regressão minceriana a fim de se estimar a "taxa de retorno" para educação. No entanto, algumas das hipóteses por de trás do modelo original, para que o coeficiente de anos de estudo seja entendido como uma taxa de retorno, são rejeitadas neste artigo (linearidade e paralelismo). Assim, para o Brasil, corroboramos a evidência de estudos internacionais para os EUA. Assim, relaxamos diversas destas hipóteses a fim de se medir o viés originado da má estimação da taxa de retorno. Notamos que o viés tende a ser positivo para todos os níveis educacionais. Assim, as TIRs tendem a ser menores quando as hipóteses são relaxadas, dentre as quais, linearidade, paralelismo e a inclusão dos custos privados tendem a gerar um maior impacto na estimação das TIRs. Uma outra alteração significativa nas TIRs foi a ampliação da faixa etária, passando de 24-56 anos para 10-65 anos. Isso mostra que os custos sacrificados em idades precoces são significativos. Em relação às especificações de anos de estudo e séries, a última acrescenta um aspecto adicional importante na estimação das TIRs em relação à primeira: os agentes considerarem o tempo médio de conclusão das séries. Isto acarreta em uma redução significativa nas TIRs, principalmente para os níveis escolares maiores.

A incorporação do desenho amostral da PNAD é um ganho adicional na literatura empírica para o Brasil, a qual não tem sido considerada na estimação de diversos modelos econômicos. Esta correção apenas corroborou os testes feitos, mas influiu consideravelmente na mensuração correta dos retornos. A correção para o viés de seleção amostral também pode ser considerado um ganho adicional, visto que mesmo estudos recentes, como HLT, não estimaram por heckit, o que altera também a magnitude das TIRs.

Por fim, a maioria das TIRs estimadas tendem a corroborar a evidência da literatura que os retornos educacionais estão decaindo nos últimos anos, com exceção do nível superior que aponta para um crescimento nesta última década, mas em magnitude menor dos obtidos em diversos estudos recentes. Esta estimação correta das taxas de retorno possibilita para pesquisa futura uma análise detalhada das razões do aumento da TIR para o ensino superior, dada a evidência de aumento substancial das taxas de matrícula na última década. E é um indicador chave para direcionar as políticas públicas de diversos governos e órgãos e na avaliação de programas sociais.

BIBLIOGRAFIA

(i) Resende e Wyllie (2006) e Loureiro e Carneiro (2001) corrigem para o problema do viés de seleção amostral utilizando uma funçã o linear da educação, sendo que o primeiro controla para qualidade da educação utilizando a PPV entre 1996 e 1997 e o segundo utilizando a PNAD de 1998 conclui que existem diferenciais de salários entre os trabalhadores rurais e urbanos e discriminação por raça e gênero.

(ii) Ueda (2002) estimam o retorno educacional por mínimos quadrados e variáveis instrumentais, utilizando especificações linear e não-linear e incluindo variáveis sócio-econômicas. Utilizam a PNAD de 1996.

(iii) de Deus Vieira Silva e Kassouf (2000) avaliam o grau de segmentação do mercado de trabalho, corrigindo também para o problema de seleção amostral, mas utilizando um modelo logit multinomial na estimação da equação de seleção, a fim de diferenciar os não-ocupados e os ocupados do setor formal e informal. Utilizam a PNAD de 1995.

em que, é um estimador para . No caso de p = 0, seria o conhecido estimador Nadaraya-Watson.

[E(yi|xj, s = s1) – E(yi|xj, s = s2)] - [E(yi|xl, s = s1) - E(yi|xl, s = s2)] = 0,

para lj, (l,j) igual a (10,20) e (20,30).

ln Y = α + β1 exp + β2 exp2 + β3S + β4S2 + β5 (S x).

Esta estimativa foi realizada a fim de se comparar e verificar a discrepância em relação às estimativas não paramétricas.

onde, c são os custos médios diretos com mensalidade.

Clique para ampliar


Clique para ampliar

Clique para ampliar


Clique para ampliar

Clique para ampliar


Clique para ampliar


Clique para ampliar

  • Barbosa Filho, F. H. & Pessoa, S. (2008). Retornos da educação no Brasil. Pesquisa e Planejamento Econômico, 38(1):97125.
  • Becker, G. S. (1975). Human Capital: A Theoretical and Empirical Analysis, with Special Reference to Education New York: Columbia Uinversity Press, 2 edition.
  • Belman, D. & Heywood, J. S. (1991). Sheepskin effects in the returns to education: An examination on women and minorities. The Review of Economics and Statistics, 73(4):72024. available at http://ideas.repec.org/a/tpr/restat/v73y1991i4p720-24.html
  • Binelli, C., C. M. & Filho, N. M. (2006). Education and wages in Brazil. Apresentado no XXVIII Encontro Brasileiro de Econometria.
  • Blom, A., L. H.-N. & Verner, D. (2001). Education, earnings, and inequality in Brazil, 198298. Peabody Journal of Education, 76(3/4):180221.
  • Cameron, S. V. & Heckman, J. J. (2001). The dynamics of educational attainment for black, hispanic, and white males. Journal of Political Economy, 109(3):455499. available at http://ideas.repec.org/a/ucp/jpolec/v109y2001i3p455-499.html
  • Card, D. (1999). The causal effect of education on earnings. In Ashenfelter, O. & Card, D., editors, Handbook of Labor Economics, volume 3A, pages 18011863. Amsterdam: Elsevier.
  • Card, D. (2001). Estimating the return to schooling: Progress on some persistent econometric problems. Econometrica, 69(5):112760. available at http://ideas.repec.org/a/ecm/emetrp/v69y2001i5p1127-60.html
  • Chromy, J. R. & Abeyasekara, S. (2005). Statistical analysis of survey data. In of Economic, D. & of United Nations, S. A., editors, Household Sample Surveys in Developing and Transition Countries, chapter 19, pages 389417. New York: United Nations.
  • Das, M., Newey, W. K., & Vella, F. (2003). Nonparametric estimation of sample selection models. Review of Economic Studies, 70(1):3358. available at http://ideas.repec.org/a/bla/ restud/v70y2003i1p33-58.html
  • de Deus Vieira Silva, N. & Kassouf, A. L. (2000). Mercados de trabalho formal e informal: uma análise da discriminaçãoo e da segmentação. Nova Economia, 10(1):4177. available at http://ideas.repec.org/a/nov/artigo/v10y2000i1p41-77.html
  • Fernandes, R. & Filho, N. A. M. (2000). A evolução da desigualdade no Brasil metropolitano entre 1983 e 1997. Pesquisa e Planejamento Econômico, 30(4):549569.
  • Freeman, R. B. (1987). Demand for education. In Ashenfelter, O. & Layard, R., editors, Handbook of Labor Economics, volume 1 of Handbook of Labor Economics, chapter 6, pages 357386. Elsevier.
  • Härdle, W. (1990). Applied nonparametric regression Cambridge University Press.
  • Heckman, J., Ichimura, H., Smith, J., & Todd, P. (1998). Characterizing selection bias using experimental data. Econometrica, 66(5):10171098. available at http://ideas.repec.org/a/ecm/emetrp/v66y1998i5p1017-1098.html
  • Heckman, J., Layne-Farrar, A., & Todd, P. (1996a). Human capital pricing equations with an application to estimating the effect of schooling quality on earnings. The Review of Economics and Statistics, 78(4):562610. available at http://ideas.repec.org/a/tpr/restat/v78y1996i4p562-610.html
  • Heckman, J. J. (1979). Sample selection bias as a specification error. Econometrica, 47(1):15361. available at http://ideas.repec.org/a/ecm/emetrp/v47y1979i1p153-61.html
  • Heckman, J. J. (2005). Education policy. Apresentado no Econometric Society 9th World Congress, IFS Lecture.
  • Heckman, J. J. & Carneiro, P. (2003). Human capital policy. Discussion Paper 821, IZA.
  • Heckman, J. J., Ichimura, H., Smith, J., & Todd, P. (1996b). Making the asymptotic theory of semiparametric estimation empirically relevant. Technical report, University of Chicago.
  • Heckman, J. J., Lochner, L. J., & Todd, P. E. (2006). Earnings functions, rates of return and treatment effects: The mincer equation and beyond. In Handbook of the Economics of Education, volume 1, chapter 7, pages 307458. Hanushek, E. and F. Welch.
  • Hungerford, T. & Solon, G. (1987). Sheepskin effects in the returns to education. Review of Economics and Statistics, 69(1):175177.
  • IBGE (2004). Pesquisa nacional por amostra e domicílios (2004) - notas metodológicas.
  • Jaeger, D. A. & Page, M. E. (1996). Degrees matter: New evidence on sheepskin effects in the returns to education. Review of Economics and Statistics, 78(4):733740.
  • Langoni, C. G. (1974). As Causas do Crescimento Econômico do Brasil Apec Editora S.A.
  • Leal, C. I. S. & Werlang, S. R. C. (1991). Retornos em educação no Brasil: 1976/89. Pesquisa e Planejamento Econômico, 21(3):559574.
  • Loureiro, P. R. A. & Carneiro, F. G. (2001). Discriminação no mercado de trabalho: Uma análise dos setores rural e urbano no Brasil. Economia Aplicada, 5(3):519545.
  • Lumley, T. (2004). Analysis of complex survey samples. Journal of Statistical Software, 9(8):119. available at http://ideas.repec.org/a/jss/jstsof/09i08.html
  • Mincer, J. (1958). Investment in human capital and personal income distribution. Journal of Political Economy, 66:281. available at http://ideas.repec.org/a/ucp/jpolec/v66y1958p281.html
  • Mincer, J. (1974). Schooling, Experience, and Earnings New York:Columbia University Press.
  • Murphy, K. M. & Welch, F. (1990). Empirical age-earnings profiles. Journal of Labor Economics, 8(2):20229. available at http://ideas.repec.org/a/ucp/jlabec/v8y1990i2p202-29.html
  • Murphy, K. M. & Welch, F. (1992). The structure of wages. Quarterly Journal of Economics, 107(1):285326.
  • Park, J. H. (1994). Returns to schooling: A peculiar deviation from linearity. Technical Report 714, Princeton University, Department of Economics, Industrial Relations Section. Returnstoschooling:apeculiardeviationfromlinearity.
  • Pessoa, D. G. C. & Silva, P. L. N. (1998). Análise de dados amostrais. 13o Simpósio Nacional de Probabilidade e Estatística.
  • Psacharopoulos, G. (1985). Returns to education: a further international update and implications. Journal of Human Resources, 20:583604.
  • Psacharopoulos, G. (1994). Returns to investment in education: A global update. World Development, 22(9):13251343. available at http://ideas.repec.org/a/eee/wdevel/v22y1994i9p1325-1343.html
  • Psacharopoulos, G. & Patrinos, H. A. (2004). Returns to investment in education: a further update. Education Economics, 12(2):111134. available at http://ideas.repec.org/a/taf/edecon/v12y2004i2p111-134.html
  • Resende, M. & Wyllie, R. (2006). Retornos para educação no Brasil: Evidências empíricas adicionais. Economia Aplicada, 10(3):349365.
  • Sachsida, A., Loureiro, P. R. A., & de Mendonça, M. J. C. (2004). Um estudo sobre retorno em escolaridade no Brasil. Revista Brasileira de Economia, 58(2). available at http://ideas.repec.org/a/fgv/epgrbe/4993.html
  • Schultz, T. W. (1963). The Economic Value of Education New York:Columbia University Press.
  • Silva, P. L. N., Pessoa, D. G. C., & Lila, M. F. (2002). Análise estatística de dados da pnad: incorporando a estrutura do plano amostral. Ciência & Saúde Coletiva, 7(4):659670.
  • Soares, R. R. & Gonzaga, G. (1999). Determinação de salários no Brasil: Dualidade ou não-linearidade no retorno à educação? Revista de Econometria, 19(2):367404.
  • Ueda, E. M. e. R. H. (2002). Estimando o retorno da educação no Brasil. Economia Aplicada, 6(2):209238.
  • Willis, R. J. (1986). Wage determinants: A survey and reinterpretation of human capital earnings functions. In Ashenfelter, O. & Layard, R., editors, Handbook of Labor Economics, volume 1, chapter 10. Amsterdam: Elsevier.
  • Yansaneh, I. S. (2005). Overview of sample design issues for household surveys in developing and transition countries. In of Economic, D. & of United Nations, S. A., editors, Household Sample Surveys in Developing and Transition Countries, chapter 2. New York: United Nations.

Apêndice

  • *
    Agradeço ao Carlos Eugênio da Costa, da EPGE/FGV, pelos diversos comentários e orientação na elaboração deste artigo; a Petra Todd, da University of Pennsylvania, pelos códigos em R cedidos que foram importantes na realização de alguns testes neste artigo; ao Luis Henrique Braido, Luis Renato Lima, da EPGE/FGV, e a todos os participantes do Seminário de Almoço da EPGE por suas diversas sugestões e críticas; ao Breno Néri, doutorando da New York University, por seu auxílio em uma rotina; a Elaine Toldo Pazello, da FEA-RP/USP, por suas sugestões; ao Maurício Lila, Djalma Pessoa e Pedro Nascimento Silva, do IBGE, por seus auxílios em relação à PNAD e Censo; agradeço a todos os participantes do XXVIII Encontro Brasileiro de Econometria (SBE), quando da apresentação de uma versão preliminar deste artigo; e por fim agradeço os comentários de um parecerista anônimo. Os erros remanescentes são de inteira responsabilidade do autor.
  • 1
    Obviamente existem outros benefícios (não-monetários) derivados desse processo de aprendizagem, mas, segundo Becker, resultados apontam para uma menor importância destes outros benefícios.
  • 2
    Uma versão anterior deste trabalho foi circulada sob o título
    Fifty Years of Mincer Earnings Regressions.
  • 3
    Este ponto será discutido mais detalhadamente na seção 4.2.
  • 4
    Em relação ao Censo, a incorporação do desenho amostral não foi possível. As variáveis que permitiram a incorporação do desenho amostral do Censo são consideradas "dados sigilosos" pelo IBGE e por isso não podem ser divulgadas.
  • 5
    A correção do viés de seleção amostral foi feita apenas para os modelos paramétricos. Para os modelos não-paramétricos não foi possível devido à grande complexidade e extensão do procedimento. Tal ajuste foi proposto por Das et alii (2003), o qual poderá ser incorporado em pesquisa futura.
  • 6
    Efeitos diploma (
    sheepskin effects) captam os efeitos dos retornos maiores devido à obtenção de algum grau escolar. Este "diploma" pode ser interpretado como um sinal da produtividade para que o mercado contrate o trabalhador.
  • 7
    O período de referência depende do país, variando de 1970 em Marrocos até 1998 em Cingapura e Filipinas. Algumas destas estimativas foram obtidas pelo autor através de outros artigos. Psacharopoulos e Patrinos (2004) aponta que estas comparações não são exatas, devido a diferenças na metodologia e na cobertura amostral.
  • 8
    Dada a enorme gama de estudos sobre retorno educacional, baseados no modelo minceriano, não foi possível descrevê-los em detalhes. Mas vale citar outros estudos recentes que utilizam o modelo de Mincer tais como:
  • 9
    Pesquisa futura pode incluir uma análise dinâmica. O problema aqui é a falta de base de dados no Brasil que siga o indivíduo por toda sua vida escolar e por, pelo menos, uma parte de sua vida profissional e que assim fosse possível mensurar estas decisões de investimento do agente.
  • 10
    Langoni aparentemente não incorpora os impostos do lado dos benefícios, o qual seria mais correto na estimação de uma taxa
    social de retorno.
  • 11
    O problema da média amostral é que ela é menos eficiente, em termos de menor variância, do que o estimador de mínimos quadrados ordinários. Assim, o gráfico do perfil de rendimentos-experiência (idade), por nível educacional, pelas regressões tende a ser extremamente suavizada, enquanto da média amostral não apresenta nenhuma suavização, podendo apresentar relações espúrias das variáveis. Contornamos este problema, utilizando regressões não paramétricas que não impõe uma forma funcional e controlamos o parâmetro de suavização do perfil de rendimentos. Vale ressaltar também que regredir uma variável contra outras impõe um relação de casualidade entre a endógena e as exógenas, enquanto a média amostra não.
  • 12
    A revisão destes modelos seminais encontra-se na versão longa deste artigo que pode ser requisitada ao autor.
  • 13
    Esta equivalência é mostrada também em HLT e Willis (1986), que derivam para o caso do tempo contínuo.
  • 14
    Excetuando-se os anos de 1994 e 2000, nos quais não foi realizada a pesquisa. Além disso, em 2004, o IBGE incluiu na pesquisa a zona rural da região Norte, antes não incorporada. Então, para efeitos de comparação com os outros anos retiramos a zona rural da região Norte de 2004.
  • 15
    Ao corrigirmos o viés de seleção amostral, incluímos os que não trabalham.
  • 16
    A renda neste artigo foi deflacionada pelo INPC a preços de novembro de 2004.
  • 17
    Este ponto é retomado na seção 5.2 que discute as hipóteses assumidas no cálculo das TIRs.
  • 18
    Mais precisamente:
    Y = (renda do trabalho principal / número de horas trabalhadas * 4). Ressalta-se que para os censos de 1980/1970 as horas de trabalho estavam disponíveis apenas por faixas. Assim os valores assumidos seguem da
    tabela 1. Com exceção dos limites inferiores e superiores, os valores tomados referem-se a média da faixa horária. Devido à divisão por faixas, a amostra para 1980/1970 incorpora somente os agentes de 40 a 48/49 hs.
  • 19
    A especificação 2 é baseada em Hungerford e Solon (1987), que capta efeitos diplomas nos anos de conclusão referentes aos graus escolares (primário [
    S
    4], ginasial [
    S
    8], secundário [
    S
    11] e terciário [
    S
    15]).
  • 20
    As seguintes abreviações serão utilizadas daqui em diante em todo artigo.
    NEDUC: sem instrução,
    PRE: pré-escola,
    EFj: j-ésima série do Ensino Fundamental,
    EMj: j-ésima série do Ensino M édio,
    SUPj: j-ésima série do Ensino Superior,
    MD: Mestrado/Doutorado.
  • 21
    Grau recebe os seguintes valores: 0, se nunca estudou, 1 se fez até a pré-escola ou alfabetização, 2 se 1
    a série do EF, 3 se 2
    a série do EF e assim sucessivamente até 17 se cursou o mestrado ou doutorado.
  • 22
    As omissões de dummies relevantes para se evitar dependência linear perfeita na matriz de regressores foram realizadas.
  • 23
    Rejeitou-se tal hipótese nula implicando em existência de viés de seleção amostral.
  • 24
    O
    número de filhos é computado diretamente somente para as mulheres. Assim, para computarmos esta variável para os homens, identificamos os filhos presentes na família, sendo o pai o chefe ou pessoa de referência. Para a
    dummy de casamento, procedemos da mesma forma, computando valor 1 para as pessoas que são chefe e cônjuge na família, visto que para a PNAD não existe tal variável. A variável
    sindicato não foi incluída nas regressões envolvendo o Censo, pois este não a abrange. E para o Censo de 1970 não foi computada a renda oriunda do não-trabalho, pois somente está disponível a renda da ocupação principal.
  • 25
    Tais métodos seriam, por exemplo, aproximação polinomial global e
    splines, sendo estes já utilizados nos testes de linearidade.
  • 26
    O núcleo quártico é definido como:
  • 27
    Intuitivamente estamos utilizando uma aproximação polinomial local, através de uma expansão de Taylor de ordem
    p,p = 1, em torno de
    x
    0. No caso geral teríamos:
  • 28
    Além deste teste conjunto, efetuamos também testes separadamente para apenas uma diferença de médias, ou seja, para a hipótese nula:
  • 29
    Estes valores para
    i (10,20,30) são válidos para comparação dos níveis escolares 15 ou mais anos de estudo (acima de SUP), 11 anos (EM3) e 8 anos (EF8). Mas os que envolvem 4 (EF4) e zero (PRE e NEDUC) anos de estudo, a faixa de anos de experiência não engloba 10 anos, logo os valores assumidos são {20,30,40}.
  • 30
    Realizamos estimativas para janelas variando de 2 a 10 e houve pouca alteração na suavização dos perfis de renda. Assim, escolhemos, através de um critério subjetivo, uma janela intermediária, semelhante a HLT.
  • 31
    Os gráficos apresentados referem-se apenas a alguns anos. Os outros anos podem ser requisitados ao autor.
  • 32
    Devido à aplicação de filtros à amostra, observou-se para algumas células educação-experiência um número muito reduzido de observações para os graus incompletos, principalmente no fim do ciclo de vida. Este é um problema recorrente destes métodos, observado também nos estudos de Murphy e Welch (1990, 1992) e HLT que utilizam o CPS (Current Population Survey) e o Censo americano, respectivamente. Por isso, os gráficos da PNAD apresentam apenas os perfis de salários para os graus completos, que têm um número bem maior de observações por célula.
  • 33
    Ao relaxar a hipótese de paralelismo, estimamos as TIRs através da especificação não paramétrica já discutida e através de uma especificação paramétrica, ou seja, uma expansão de Taylor de ordem 2 tal que:
  • 34
    Assim, por exemplo, para o ano de 1992, a idade média de quem cursava EF8 era 16.33 anos e a de quem cursava EF4 era de 11.67. A diferença entre estas médias será de 4.66, maior do que 4 anos, que seria o tempo de conclusão sem repetência. Isso ocorre porque esta
    proxy para a especificação das séries considera a repetência dos alunos.
  • 35
    Ressalta-se que o INEP provê uma estimativa do tempo médio de conclusão por série, mas esta estava disponível apenas de 1995 até 2001. Assim, para termos estimativas mais homogêneas para fins comparativos construímos esta medida a partir da idade do indivíduo, a qual diferiu pouco da medida do INEP.
  • 36
    O coeficiente minceriano foi ajustado para o tempo contínuo, como:
    - 1 =
    retorno minceriano.
  • 37
    O viés a ser mencionado nesta subseção é sempre baseado em relação ao modelo de Mincer II, o mais amplamente utilizado na literatura, a não ser que seja mencionado em relação a outra TIR como referência base. Assim, entende-se como viés positivo a diferença entre o retorno minceriano e uma determinada TIR sendo positiva.
  • 38
    Em geral este retorno é bem baixo - podendo até ser negativo - o que era esperado, pois o mercado não tenderá a pagar muito mais para quem só estudou Pré-Escola ou quem nunca estudou. Por parte da decisão dos indivíduos estudarem só até a Pré-Escola uma explicação possível pode ser devido à qualidade dos pais (pois são estes que investem na educação dos filhos quando menores), a qual poderia ter como proxy seu nível educacional (dos pais) que seria baixo para esse grupo. Este é um aspecto interessante que pode servir de pesquisa futura.
  • 39
    Necessitaríamos de um modelo que corrigisse o problema simultaneamente nas duas dimensões
    e ainda incorpora-se o desenho amostral da pesquisa. O artigo de Das et alii (2003), como mencionado na nota 5, propõe um heckit não-paramétrico, mas não permite incorporar o desenho amostral. Ou seja, esse é ainda um ponto em aberto na literatura. Desenvolvimentos posteriores nessa linha de pesquisa podem permitir uma análise futura dos ganhos das correções de todos os problemas citados.
  • 40
    Ou seja, como
    x =
    i -
    s - 6, então
    = 56 - 24 = 32 anos, para um nível
    de educação fixado. Como consideramos a idade mínima como 24 anos, logo, para esta idade já existem pessoas formadas com o maior nível educacional.
  • 41
    Ressaltamos que as TIRs adicionais 2 e 3 inclui a modificação da TIR adicional 1, e a TIR adicional 4, que será apresentada a seguir, inclui as modificações da TIR adicional 3. Ou seja, estamos relaxando estas hipóteses gradualmente e sucessivamente. A nota da
    tabela A-14 também reforça este ponto.
  • 42
    Mais precisamente, estimamos a TIR através de:
  • 43
    Vale ressaltar que o INEP provê através de sua página na internet dados de apenas gastos públicos com educação. Estes gastos podem ser incluídos na análise das TIRs, em um contexto mais macroeconômico, o qual compara o investimento em educação com outros investimentos, como em capital, como já feito por Langoni (1974).
  • 44
    Este retorno ginasial diverge entre diversos estudos, como mencionado em seção anterior. Tomando como referência as TIRs adicionais 2-4 notamos que este retorno é bem maior para o não-paramétrico em relação ao não-linear.
  • Datas de Publicação

    • Publicação nesta coleção
      17 Mar 2009
    • Data do Fascículo
      Dez 2008
    Fundação Getúlio Vargas Praia de Botafogo, 190 11º andar, 22253-900 Rio de Janeiro RJ Brazil, Tel.: +55 21 3799-5831 , Fax: +55 21 2553-8821 - Rio de Janeiro - RJ - Brazil
    E-mail: rbe@fgv.br