SciELO - Scientific Electronic Library Online

 
vol.61 issue3Uma análise da hipótese da convergência para os municípios brasileiros(Un)sustainability and reform of the social security system in Brazil: a generational accounting approach author indexsubject indexarticles search
Home Pagealphabetic serial listing  

Revista Brasileira de Economia

Print version ISSN 0034-7140

Rev. Bras. Econ. vol.61 no.3 Rio de Janeiro July/Sept. 2007

http://dx.doi.org/10.1590/S0034-71402007000300004 

Uma avaliação experimental dos impactos da política de qualificação profissional no Brasil

 

 

Ana Maria Hermeto Camilo de Oliveira*; Eduardo Luiz Gonçalves Rios-Neto†

CEDEPLAR/UFMG

 

 


RESUMO

O principal objetivo deste artigo é determinar em que medida o Plano Estadual de Qualificação Profissional (PEQ) em Minas Gerais tem servido como instrumento efetivo para a redução do nível e da duração do desemprego dos seus participantes. A análise se baseia no estudo experimental de uma amostra de egressos do treinamento na Região Metropolitana de Belo Horizonte, que constitui o grupo de tratamento, incorporando informações sobre a evolução de um grupo de controle, desde dezembro de 1996 até dezembro de 2000, em um banco de dados longitudinais com painéis retrospectivos de informações mensais, que permite a avaliação da duração do impacto do treinamento sobre o desemprego, que tende a ser cumulativo. Foram utilizados métodos de análise de sobrevivência não paramétricos, paramétricos e semi-paramétricos. Os resultados apontam que o impacto foi positivo para o total da amostra, reduzindo o número e a duração dos episódios de desemprego. No entanto, os efeitos variam com o grau de desfavorecimento no mercado de trabalho, definido pela condição de desemprego no momento do treinamento. Os impactos estimados foram melhores para os que não enfrentavam esta barreira no mercado de trabalho.

Palavras-chave: avaliação de políticas públicas; treinamento e alocação de mão-de-obra; análise de sobrevivência.
Código JEL: J08; J64.


ABSTRACT

This paper aims to evaluate the employment impacts of the National Vocational Training Program (PLANFOR). The evaluation is based on the experimental data basis designed to evaluate the case of Minas Gerais state in 1996. The findings indicate positive employment impacts. The employment impacts were felt more strongly with the increased duration after the provision of treatment. The data came from an experimental survey conducted by CEDEPLAR between 1996 and 2000, and provide retrospective occupational data. The employment impact is evaluated through the application of event history analysis (non-parametric, parametric, and semi-parametric) to the longitudinal experimental data. Results indicated that the unemployment duration of the control's group spells is greater than the treatments one. This difference is greater as the spell's length increases. There is no impact when the analysis is restricted to individuals that were unemployed in the beginning of the experiment.


 

 

1. INTRODUÇÃO

O objetivo deste artigo é determinar em que medida a política de qualificação profissional no Brasil tem servido como instrumento efetivo para melhorias nas condições de inserção no mercado de trabalho, no que se refere à redução do desemprego. O artigo apresenta a metodologia e resultados da avaliação de impactos do programa público de treinamento conduzido na Região Metropolitana de Belo Horizonte no âmbito do Plano Nacional de Qualificação Profissional (PLANFOR), que tem como objetivo central melhorar as condições de empregabilidade das populações mais vulneráveis no Brasil, priorizando os desempregados e outras populações excluídas.1 Recentemente, o interesse neste tipo de política de trabalho vem aumentando, alimentado por preocupações sobre o nível e duração do desemprego dos trabalhadores com qualificação limitada e sobre a crescente desigualdade de rendimentos. A literatura internacional relativa a avaliações de impactos dos programas de treinamento governamentais para os economicamente desfavorecidos vem se acumulando por mais de três décadas, tendo sido consolidada na última década.

Abordagens convencionais à avaliação de programas sociais estimam impactos médios dos programas. Entretanto, há várias questões interessantes relativas à distribuição de benefícios dos programas, que exigem o conhecimento da distribuição dos impactos ou alguns de seus aspectos. Neste artigo, a questão abordada é se os impactos do programa são positivos e suficientes para produzir efeitos sobre os níveis e durações do emprego dos seus participantes. Neste caso, a eficácia poderia ser definida como o resultado efetivamente obtido com as ações em termos de geração e manutenção do trabalho. Há um crescente consenso de que programas de treinamento providos pelo setor público podem melhorar as perspectivas de emprego dos economicamente desfavorecidos . Estudos sugerem que os ganhos resultam usualmente mais de aumentos da duração do emprego do que de aumentos dos salários por hora ou das horas trabalhadas por semana para os que já estão empregados.

Neste artigo, a análise se baseia em uma avaliação do impacto do PLANFOR sobre o desemprego, a partir de um estudo experimental conduzido pelo CEDEPLAR entre 1996 e 2000, que acompanhou uma amostra de egressos do treinamento, que constitui o grupo de tratamento, incorporando informações sobre a evolução de uma amostra de comparação (grupo de controle), através de painéis retrospectivos de informações mensais com cerca de 1200 indivíduos acompanhados ao longo de quatro anos. A abordagem experimental de avaliação de programas de treinamento avança em relação às comparações tradicionais "antes-depois", que atribuem todas as melhorias aos resultados relativos aos níveis pré-programa avaliado. Contudo, se há melhorias gerais devido a efeitos econômicos amplos ou a efeitos de ciclo de vida, os estimadores dos impactos do programa estariam viesados. A chave para resolver este problema é construir o resultado contrafactual, que representa o que teria acontecido na ausência do programa. O grupo de controle experimental fornece este resultado, permitindo identificar o que teria ocorrido aos participantes de um programa de treinamento, se não tivessem dele participado, em termos de emprego e renda, eliminando fatores de ciclo de vida e da economia ampla. As mudanças "antes-depois" para o grupo de tratamento - participantes - são então comparadas àquelas para o grupo de controle - não participantes. Os membros do grupo de controle eram elegíveis, se candidataram e foram aceitos inicialmente no programa, antes de serem excluídos aleatoriamente, constituindo o grupo mais similar possível ao grupo de tratamento. Dado que o status de tratamento é independente de características observáveis e não observáveis, estes dados experimentais são valiosos para identificar o efeito do treinamento.2 Tendo sido verificada a boa qualidade dos grupos de tratamento e controle, não foi necessária a investigação dos determinantes da participação no programa.

Além do impacto imediato, busca-se avaliar a duração deste impacto, que tende a ser cumulativo, com base em informações coletadas de forma longitudinal, com a utilização de parâmetros de eficácia experimental. A questão do prazo de avaliação do desempenho após o programa é crucial para a avaliação de possíveis vieses. Um curto prazo de acompanhamento após o treinamento tenderia a levar a uma avaliação inadequada. No Brasil há poucos estudos de avaliação de programas sociais, e este experimento forneceu um banco de dados longitudinais único. O banco de dados construído, com informações sobre o estado dos indivíduos em vários pontos no tempo, permitiu utilizar modelos longitudinais sofisticados para analisar as transições - mudanças de estados na força de trabalho - ao longo do tempo, dentro do arcabouço dos métodos de análise de sobrevivência. Os objetivos desta análise são estimar, interpretar e comparar funções de sobrevivência e de risco entre os grupos de tratamento e controle do nosso experimento. Neste caso, a sobrevivência se refere à duração no estado de desemprego3 e o risco se refere ao risco de se ocupar. Além disto, buscamos verificar a relação de variáveis explicativas, como raça, idade, nível de escolaridade, sexo, entre outras, e o tempo de sobrevivência, através de modelos de regressão.

Os principais resultados encontrados apontam que o impacto de participar do PLANFOR sobre a duração do desemprego foi para o total da amostra, reduzindo o número e a duração dos episódios de desemprego. No entanto, os efeitos variam com o grau de "desfavorecimento" no mercado de trabalho, definido por aspectos como a condição de desemprego no momento do treinamento. Os impactos estimados foram melhores para os que não enfrentavam esta barreira no mercado de trabalho. Para os desempregados no momento do treinamento, a participação no treinamento não tem um efeito positivo significativo em termos de geração e manutenção do trabalho.

Tendo em vista os objetivos propostos neste trabalho, em primeiro lugar são apresentadas metodologias para avaliação de programas de treinamento profissional e descrita brevemente a nossa implementação de uma metodologia experimental e o processo de amostragem. Em seguida, efetuamos a análise da eficácia do PLANFOR, utilizando métodos de análise de sobrevivência para comparar as taxas de risco de saída dos episódios de desemprego empíricas dos grupos de tratamento e controle, com o propósito de captar os efeitos do treinamento, que correspondem ao impacto de ser membro do grupo de tratamento sobre as taxas de emprego alterando a duração dos episódios de emprego e desemprego.

 

2. METODOLOGIAS DE AVALIAÇÃO DE POLÍTICAS DE QUALIFICAÇÃO

Programas de treinamento e qualificação profissional podem ser definidos como uma tentativa de adicionar capital humano à força de trabalho. Embora estes programas não gerem empregos diretamente, reduzem o desemprego na medida em que, ao expandir a qualificação dos trabalhadores, dá acesso aos desempregados a postos de trabalho vagos que não seriam acessíveis na ausência do treinamento. Dentre as variáveis dependentes que podem ser utilizadas no processo de avaliação do impacto de um programa de qualificação profissional, há duas que se destacam: a renda média e o emprego gerado depois do curso de treinamento. Nesse artigo, a ênfase é no emprego. Ao controlar por características individuais e correlacionar a probabilidade de emprego com os programas, deve-se ter em mente o contexto econômico e institucional. Deve-se levar em conta que a maioria dos empregos disponíveis para os grupos mais vulneráveis são no mercado secundário, onde as condições de trabalho são piores e os efeitos de longo prazo devem ser mais sistematicamente estudados, porque podem ser diferentes dos de curto prazo. Uma questão importante é avaliar se os empregos conseguidos são estáveis ou meramente oferecem um alívio temporário ao desemprego; assim, o problema dos grupos com dificuldades de colocação se torna um problema de dificuldades de manutenção.

Três metodologias são comumente utilizadas no processo de avaliação dos resultados dos programas: "antes/depois", "não-experimental" e "experimental". A metodologia de avaliação antes/depois diz respeito à avaliação do desempenho dos casos de tratamento, antes e depois da participação no curso de treinamento. As outras metodologias diferem e avançam por constituir um grupo de controle para medir a eficácia do programa: o desempenho do grupo de tratamento, antes e depois, medido em termos de emprego, é cotejado com o desempenho obtido pelo grupo de controle.

A metodologia de avaliação antes/depois é de fácil implementação, mas pode induzir a erros de avaliação. Este critério consiste em se comparar os indicadores de eficácia do grupo de tratamento antes e depois do programa. Definindo-se t = 0 para período antes do programa, t = 1 para período depois do programa, Y0 para emprego antes do programa, Y1 para emprego depois do programa, Y1 - Y0 é o ganho obtido pelo programa. A maioria dos estudos utilizando esta metodologia tende a mostrar resultados de ganhos com o treinamento. No entanto, alguns problemas podem decorrer desta estimativa. Primeiro, a auto-seletividade, segundo a qual apenas aquelas pessoas com avaliação subjetiva de que ganharão com o programa se candidatarão. Desta forma, os ganhos verificados se referem a como o programa afeta as pessoas motivadas a participar. Outro problema diz respeito ao fato de que as variações antes e depois do programa estão sujeitas a flutuações econômicas de conjuntura e tendências, que são independentes do tratamento. Como não há um grupo de controle, estas flutuações e tendências são inadequadamente incorporadas como ganhos com o treinamento.

Dado que, além das características observáveis, a motivação individual (heterogeneidade não observável) também afeta o desempenho relativo de tratamento e controle no mercado de trabalho, constata-se que a comparação entre os grupos é complicada. A literatura sobre avaliação sugere dois tipos de métodos que utilizam grupos de controle: não-experimental e experimental. A principal diferença entre estes métodos se refere à natureza do grupo de controle. No método não-experimental, o grupo de controle é composto de indivíduos que possuem características similares ao grupo de tratamento, utilizando uma fonte alternativa de informações.4 Este método utiliza a econometria para se corrigir o viés decorrente do problema de heterogeneidade não observada, já que o grupo de controle não é constituído através de um mecanismo de alocação aleatória sob controle do pesquisador. Os indicadores de eficácia são comparados entre os grupos e os resultados são interpretados em termos de "diferenças em diferenças": diferenças entre os grupos das diferenças entre os indicadores nos períodos depois e antes do programa, que devem ser estatisticamente significantes. Todavia, uma comparação simples entre os indicadores de eficácia dos grupos não permite obter estimativas consistentes, porque os grupos podem não ser equilibrados em relação a todas as variáveis associadas ao resultado. Desse modo, uma diferença observada após o tratamento pode se dever ao efeito real do tratamento ou a diferenças pré-existentes entre os grupos. Como são as próprias pessoas que decidem se vão participar do treinamento, e assim ser parte do grupo de tratamento ou controle, não se elimina a dúvida sobre a existência de alguma variável não-observada determinada previamente ao tratamento e que ocorre distintamente entre os grupos (Burtless, 1995).

Seguindo o critério experimental, o viés de auto-seletividade e heterogeneidade não observada não ocorre, uma vez que a alocação de indivíduos entre tratamento e controle é feita aleatoriamente. Ou seja, o método experimental consiste na condução de um experimento onde pessoas de um mesmo conjunto de candidatos ao programa de treinamento são alocadas aleatoriamente ao grupo de tratamento (no qual participam do treinamento) ou ao grupo de controle (no qual não participam do treinamento). Com isso, o viés de motivação é controlado e se garante que a alocação aos grupos é independente das características não observadas dos candidatos, as quais constituem a base do viés de seletividade. Após algum tempo, os grupos são comparados com relação a características supostamente influenciadas pelo tratamento e, caso existam diferenças estatisticamente significativas, devem ser causadas pelo efeito do tratamento já que, por meio da aleatorização, os dois grupos são basicamente idênticos. Neste caso, a comparação da diferença entre os desempenhos depois e antes entre os grupos de tratamento e controle é um indicativo do ganho causado pelo programa.

2.1 A Pesquisa Experimental com Participantes do PLANFOR na RMBH

Esta avaliação de eficácia do PLANFOR parte de um projeto de desenvolvimento metodológico, cuja grande novidade foi a efetivação de uma análise amostral e domiciliar de acompanhamento de participantes em quatro rodadas (follow-ups). O questionário âncora, ou primeira rodada, foi aplicado a uma amostra de 3721 entrevistados, sendo 2891 do grupo de tratamento e 746 do grupo de controle, em Dezembro de 1996. O primeiro follow-up, ou segunda rodada, foi a campo em Junho de 1997; e o segundo follow-up, ou terceira rodada, foi conduzido em Março de 1998 e conseguiu recuperar para Minas Gerais 2839 indivíduos (2212 do grupo de tratamento e 627 do grupo de controle). Uma decisão operacional tomada foi de restringir a amostra do terceiro follow-up, ou quarta rodada, realizada em Dezembro de 2000, somente para a RMBH, que contava com uma base de 1351 indivíduos. Foram realizadas 1159 entrevistas, ou seja, houve uma perda, após 33 meses decorridos da terceira rodada, de somente 14% da amostra. Portanto, para a RMBH, a série completa de dados retrospectivos remonta a Junho de 1996 e segue até Novembro de 2000.

Os procedimentos de amostragem e aleatorização do experimento adotados inicialmente tiveram de ser adaptados a diversas contingências encontradas ao longo do processo. O processo de amostragem consistiu de duas fases: a amostragem dos municípios representativos da implementação do programa em Minas Gerais e a amostragem do experimento aleatório com a análise dos cursos e candidatos e o sorteio daqueles que seriam treinados (tratamento) ou não seriam (controle). No ano de 1996 as limitações administrativas e a falta de informações acuradas dificultaram a condução de um experimento verdadeiramente experimental. Foi feita uma reformulação do plano amostral para adequar a amostra ao novo cenário surgido das investigações, tendo em vista a baixa demanda por alguns cursos. Apesar das dificuldades, várias delas comuns em pesquisas de amostragem, a coleta de dados trouxe as informações necessárias para a avaliação do programa de qualificação profissional em termos de sua eficácia no aumento da empregabilidade dos treinandos.

Uma análise da qualidade do processo de aleatorização no que tange às variáveis observáveis foi feita através de regressões logísticas para a determinação da participação no grupo de tratamento vs. controle para homens e mulheres na RMBH. A análise indicou que nenhuma covariável foi capaz de distinguir os indivíduos dos grupos de tratamento e controle; em outras palavras, o experimento parece ter sido bem sucedido (Rios-Neto e Assunção, 1998). A análise univariada mostrou uma pequena diferença de composição por sexo entre os grupos tratamento e controle. Parte desta diferença pode ser explicada pelo desenho amostral que não teve intenção de balancear estes fatores. Com relação às outras covariáveis (idade, nível de escolaridade, condição de atividade, rendimentos, sindicalização, participação anterior em treinamento), de maneira geral, os grupos tratamento e controle são equivalentes. A questão é se as covariáveis também são relevantes quando todas elas são consideradas simultaneamente; é possível que variáveis julgadas importantes individualmente, perderem poder discriminatório entre os grupos quando outras são também consideradas. A análise multivariada, através de regressões logísticas,5 buscou responder esta questão, analisando as diferenças entre os grupos de tratamento e controle no que concerne às covariáveis observáveis de forma simultânea. Tanto para os homens, quanto para as mulheres, concluiu-se que as covariáveis não são capazes de diferenciar os grupos de tratamento e controle, e, portanto, a aleatorização parece ter funcionado muito bem na RMBH.

2.2 Análise Descritiva: Comparação entre os Grupos de Tratamento e Controle

Para analisar de forma descritiva possíveis variações no grupo de tratamento com relação ao emprego, tendo como referência o grupo de controle, que possam ser atribuíveis ao treinamento, verificamos se foram observadas mudanças nas taxas de ocupação do grupo de tratamento, em vários períodos após o curso de treinamento, em relação ao período anterior ao treinamento. Para esta análise, foram estimadas médias, mês a mês, das taxas de ocupação. As informações contidas no Gráfico mostram a evolução das taxas de ocupação, ao longo do período pesquisado.

 

 

Não verificamos de forma razoavelmente clara diferenciais entre os grupos de tratamento e controle ao longo do período pesquisado. Constata-se uma superioridade destas taxas para o grupo de controle no período anterior e no período imediatamente posterior ao treinamento. Após o período do treinamento, as taxas de ocupação de ambos os grupos assumem uma tendência ascendente, o que sugere a presença de efeitos de idade atuando sobre toda a amostra estudada. Após um médio prazo decorrido a partir do treinamento, as tendências dos grupos parecem mudar, o que se pode constatar através das diferentes inclinações das curvas. A série temporal de taxas de ocupação do grupo de tratamento assume uma inclinação maior, superando à curva do grupo de controle, o que indica uma maior ocupação de fato para os indivíduos que participaram de cursos de treinamento em relação aos que não participaram, a partir do médio prazo (ver Gráfico 1).

 

3. ANÁLISE DE SOBREVIVÊNCIA

3.1 Aspectos Conceituais da Análise de Sobrevivência Aplicada ao Estudo

Neste estudo, o plano de observações é misto: prospectivo e retrospectivo. Prospectivo porque o início da observação dos indivíduos é feito em um ponto bem definido no tempo e há um acompanhamento durante um período, com pesquisas em pontos posteriores no tempo. Tais pesquisas indagam aos indivíduos sobre as datas dos eventos, registrando através de quesitos retrospectivos os tempos (meses) nos quais o evento de interesse - transição do desemprego para a ocupação - ocorreu.

Para analisar os dados longitudinais obtidos, são utilizados de métodos estatísticos de análise de sobrevivência. O interesse principal é a ocorrência de eventos ou taxas de transições, e a acumulação de tempo em risco, ou duração, até (e incluindo) a ocorrência do evento ou censura. Neste estudo, o evento de interesse é a mudança qualitativa na força de trabalho, do desemprego para a ocupação; tal mudança é situada no tempo, correspondendo à transição de um estado discreto para outro: saída do estado de desempregado - entrada no estado de ocupado. Portanto, o estado de cada indivíduo na força de trabalho - desempregado ou ocupado - no mês da pesquisa é registrado e por quanto tempo este estado foi verificado, ou seja, a duração em cada estado. Tais dados são usados para modelar probabilidades de transição entre os estados. A unidade de análise não é o próprio evento, mas as trajetórias, ou seqüências individuais de eventos (e estados), ou duração (sobrevivência) nos estados de desemprego e ocupação.

A análise destas histórias de eventos, ou análise de sobrevivência, situa as transições individuais ao longo do tempo em seu contexto social, as relacionando com outras características. A questão é identificar como a participação no treinamento influencia a trajetória de cada indivíduo, mudando a probabilidade de transição do desemprego para o emprego, e como algumas de suas características o levam a se diferenciar dos outros indivíduos na medida que o tempo passa. Dado que diferentes seqüências de eventos não são igualmente prováveis, deseja-se estimar a distribuição de probabilidade destas trajetórias, que apresentam variáveis aleatórias de duração da permanência nos diferentes estados. Em outras palavras, a observação da história de eventos fornece um número de ocorrências de eventos, cuja distribuição ao longo do tempo deseja-se comparar entre os grupos do experimento.

Ao se atribuir um valor ao tempo de ocorrência do evento, implicitamente se está escolhendo uma escala e uma origem. A escala é a unidade comum na qual o tempo é mensurado: meses. Em estudos experimentais como este, a origem comum e bem definida corresponde ao tempo de aleatorização ao tratamento - dezembro de 1996 - após o qual os eventos estudados podem ocorrer. Como o principal objetivo é estimar o risco diferenciado associado ao treinamento, é somente no ponto de alocação ao tratamento que tais diferenciais de risco se tornam operativos. Portanto, a variável resposta de interesse é o tempo em meses a partir do início do acompanhamento dos indivíduos dos grupos de tratamento e de controle até a ocorrência do evento. A variável de tempo corresponde ao tempo de sobrevivência, porque indica o tempo que um indivíduo sobreviveu - permaneceu desempregado - ao longo dos meses de acompanhamento após o treinamento.

É importante ressaltar que eventos de transição para ocupação são repetidos, ou seja, podem ocorrer uma ou mais vezes com o mesmo indivíduo. As múltiplas ocorrências deste evento são observadas e registradas, sendo necessários métodos específicos de análise de sobrevivência para lidar com tais dados. Portanto, além das transições, a análise envolve as durações nos estados, ou seja, os indivíduos diferem no montante de tempo em risco, e esta exposição diferenciada tende a ser influenciada por vários fatores explicativos. A duração é uma variável contínua cujo valor é observado somente quando uma transição ocorre; em geral, uma parcela da população não muda de estado dentro do período de observação ou é removida do risco por outras razões. Nestes casos, as durações são censuradas e os métodos para a análise de sobrevivência consideram este aspecto dos dados. A partir dos dados desagregados em episódios, as taxas de transição são modeladas como funções de variáveis independentes.

Diversos métodos de análise de sobrevivência, não paramétricos, paramétricos e semiparamétricos foram utilizados de forma complementar neste estudo. Os objetivos são: (1) estimar e interpretar funções de sobrevivência e risco, comparando-as entre os subgrupos da amostra: grupos do experimento - tratamento e controle; (2) estimar e comparar a relação entre variáveis explicativas e o tempo de sobrevivência dos diferentes grupos do experimento.

Nosso principal objetivo é encontrar a probabilidade do indivíduo permanecer desempregado, ou seja, sobreviver, após o tempo t, dado que estava desempregado até o tempo t.T corresponde à variável aleatória do tempo de sobrevivência do indivíduo, ou tempo de ocorrência do evento, cujos valores possíveis são não negativos (T > 0); t é qualquer valor específico de interesse para a variável aleatória T; e d é uma variável aleatória (0,1) que indica ocorrência do evento (d = 1) ou censura (d = 0). Todas as abordagens padrões para a análise de sobrevivência são probabilísticas; ou seja, os tempos nos quais os eventos ocorrem são assumidos como realizações de algum processo aleatório. Se segue que T é uma variável aleatória que tem uma distribuição de probabilidade. O que distingue diferentes modelos para dados de sobrevivência é a distribuição de probabilidade de T. As principais maneiras de descrever distribuições de probabilidade contínuas são as funções de sobrevivência e de risco.

A função de sobrevivência, S(t), fornece a probabilidade de que o indivíduo permaneça desempregado além do tempo t, ou seja, indica a probabilidade de que a variável aleatória T exceda o tempo t: S(t) = P(T > t), eqüivalendo ao produto das probabilidades condicionais de ter sobrevivido todos os prévios pontos do tempo. Sendo uma probabilidade, seus limites são 0 e 1. A função de risco (hazard), h(t), é usada para descrever distribuições para dados contínuos de sobrevivência. Esta função é igual ao limite, na medida que Dt se aproxima de 0, de uma probabilidade relativa à sobrevivência, dividida por Dt, onde Dt denota um pequeno intervalo de tempo:

Sua interpretação conceitual é o risco instantâneo por unidade de tempo de um evento ocorrer no tempo t, dado que o indivíduo sobreviveu até este tempo. Isto significa que fornece o outro lado da informação dada pela função de sobrevivência: quanto maior S(t) para um dado t, menor é h(t). A probabilidade condicional fornece a probabilidade de que o evento ocorra no intervalo entre t e t + Dt, dado que o tempo de sobrevivência T é maior ou igual a t, isto é, dado que ele não tenha ocorrido até o início do intervalo. Para se ajustar pelo fato de que a probabilidade é uma função não decrescente de Dt - quanto maior o intervalo, mais provável é que um evento ocorra no intervalo - divide-se a probabilidade por Dt. Dada a condicionalidade, a função de risco é uma taxa condicional de ocorrência. O intervalo para esta razão varia entre 0 e ¥, e depende da escala de medida do tempo.

3.2 Análise Não Paramétrica

Com o propósito de fazer uma investigação preliminar dos dados na forma de uma análise univariada sobre a duração até a ocorrência do evento, utilizamos métodos não paramétricos para estimar e comparar funções de sobrevivência. Foram gerados funções e gráficos de curvas de sobrevivência6 para a duração dos episódios de desemprego. No nosso desenho experimental, testes de hipóteses simples sobre diferenças da sobrevivência entre os grupos do experimento são relevantes para a análise dos dados; tendo sido o tratamento experimental aplicado a um grupo, mas não a outro, a questão é: "o tratamento fez diferença na experiência de sobrevivência dos dois grupos?". Dado que a função de sobrevivência fornece um relato completo da experiência de sobrevivência de cada grupo do experimento, uma função separada foi estimada para cada estrato corresponde ao grupo, sendo realizados testes de homogeneidade dos estratos. Neste caso, os métodos testam a hipótese nula de que as funções de sobrevivência são as mesmas nos grupos do experimento, ou seja: S1(t) = S2(t) para todos os t, onde os subscritos distinguem os grupos. Tendo sido produzidas tabelas com de tábua de vida para cada grupo do experimento, foram feitos gráficos das funções de sobrevivência, para comparação das curvas. Além disto, foram especificadas covariáveis constantes no tempo e calculadas estatísticas lineares para testar as associações destas covariáveis e os tempos de ocorrência dos eventos, sem estimativas de parâmetros.

 

 

 

 

Os dados consistem de durações dos episódios de desemprego, mensuradas desde o mês de entrada no desemprego até o mês em que o desempregado se ocupou. As durações após o 47° mês são censuradas. Conhece-se o mês em que o desempregado se ocupou, tal que os tempos de sobrevivência têm valores 1 a 46 (ver anexo A).

Em primeiro lugar é analisada a sobrevivência para o total da amostra, comparando os grupos do experimento. O gráfico mostra que as duas curvas de sobrevivência são bastante próximas nos curtos intervalos de duração dos episódios de desemprego. Estas curvas indicam que o grupo de controle sempre apresenta uma sobrevivência maior no estado de desemprego, ou seja, seus membros permanecem mais tempo desempregados e a diferença em relação ao grupo de tratamento tende a aumentar na medida em que aumenta a duração do desemprego, embora visualmente nunca seja muito grande.

O gráfico 3 mostra a função de risco de sair do estado de desemprego e se ocupar para os dois grupos do experimento. Os intervalos de duração dos episódios de desemprego foram definidos de acordo com uma proporcionalidade do número de casos. Assim, é possível verificar a importância da análise que vá além do curto prazo, considerando comportamentos distintos ao longo do tempo. O risco de sair do desemprego é sempre menor para o grupo de controle, mas as curvas seguem tendências diferentes. Enquanto para o grupo de controle, o risco é sempre descendente na medida em que aumenta a duração do desemprego, e parece até haver uma aceleração deste declínio no longo prazo, para o grupo de tratamento, o risco declina até um ponto de média duração dos episódios de desemprego, a partir do qual se estabiliza. Isto significa que o grupo de tratamento parece ser mais favorecido no sentido em que seu risco de sair do desemprego se mantém o mesmo após uma média ou longa duração do desemprego.

Em seguida, buscando o impacto específico do treinamento sobre os desempregados, estimamos a sobrevivência e o risco somente para a subamostra de desempregados no momento do treinamento. O gráfico 4 mostra que as curvas de sobrevivência dos dois grupos do experimento são quase indistinguíveis para os episódios de desemprego com duração mais curta. Assim como para o total da amostra, estas curvas também indicam que o grupo de controle tende a sobreviver mais no estado de desemprego, ou seja, seus membros permanecem mais tempo desempregados e a diferença em relação ao grupo de tratamento tende a aumentar na medida em que aumenta a duração do desemprego. Estas curvas da subamostra de desempregados no momento do treinamento são bastante similares às curvas da amostra total, mas a análise visual somente é insuficiente.

 

 

 

 

O gráfico 5 mostra a função de risco de sair do estado de desemprego e se ocupar para a subamostra de desempregados dos grupos do experimento. Os intervalos de duração dos episódios de desemprego foram definidos da mesma forma acima. O risco de sair do desemprego também é sempre menor para o grupo de controle e as curvas seguem tendências diferentes. Para o grupo de controle, o risco é sempre descendente na medida em que aumenta a duração do desemprego, e para o grupo de tratamento, o risco declina até o ponto de média duração dos episódios de desemprego, a partir do qual se estabiliza. Da mesma forma, isto significa que o grupo de tratamento parece ser mais favorecido no sentido em que seu risco de sair do desemprego se mantém o mesmo após uma média ou longa duração do desemprego. Este gráfico permite visualizar uma maior diferença da subamostra de desempregados em relação ao total da amostra. Os níveis de risco de saída do desemprego para os desempregados são sempre menores do que os riscos do total da amostra, o que sugere um impacto menor do treinamento para os desempregados.

A tabela 1, calculada a partir das estimativas de sobrevivência acima, confirma as diferenças entre os grupos do experimento, favorecendo o grupo de tratamento, o que, em princípio, sugere um impacto positivo do treinamento. A duração média do desemprego para o grupo de tratamento do total da amostra é de 10 meses e para o grupo de controle é de 12 meses. Para os desempregados, esta duração média é 1 mês maior para ambos os grupos do experimento. Tanto os gráficos quanto estes valores médios de sobrevivência não são suficientes para afirmarmos que a diferença entre os grupos do experimento é estatisticamente significativa.

 

 

Testes da hipótese nula de que as curvas de sobrevivência são estatisticamente equivalentes para os dois grupos do experimento foram feitos através do cálculo de estatísticas alternativas: testes log-rank, Wilkinson7 e estatística da razão de verossimilhança. Estas estatísticas se baseiam em testes c2 onde os valores observados de ocorrência de eventos são comparados com valores esperados se as distribuições fossem homogêneas, ou seja, são como uma função dos desvios dos números observados dos eventos dos números esperados. O p-valor do teste da razão de verossimilhança é menor do que os outros testes porque parte do pressuposto adicional de que a função de risco é constante em cada grupo, implicando em uma distribuição exponencial para os tempos de ocorrência dos eventos (tabela 2).

 

 

Segundo os resultados apresentados na tabela 2, para o total da amostra, os três testes são unânimes em rejeitar a hipótese nula de não haver diferença entre as curvas de sobrevivência dos grupos de tratamento e controle. Isto confirma a impressão visual e descritiva de que o treinamento tem um impacto positivo sobre a duração dos episódios de desemprego para o total da amostra. Buscando verificar se este impacto também pode ser inferido para o grupo de desempregados no momento do treinamento, os testes log-rank e razão de verossimilhança rejeitam a hipótese de não haver diferença entre os grupos do experimento, mas o teste Wilcoxon não a rejeita. Este teste Wilcoxon dá mais peso aos tempos iniciais do que os finais, sendo menos sensível a diferenças entre grupos que ocorrem nos tempos mais avançados. Neste sentido, é mais sensível para se medir diferenças no início da curva, ou a ausência delas, como pudemos visualizar no gráfico 4, no qual as curvas de sobrevivência dos desempregados nos dois grupos do experimento são quase indistinguíveis para os episódios de desemprego com duração mais curta. Novamente, estas constatações reforçam a importância da distinção entre prazos de durações do desemprego na avaliação dos impactos do programa de treinamento.8

3.3 Análise Semiparamétrica: Modelo de Riscos Proporcionais de Cox

Estimamos modelos de regressão de Cox, porque estes, ao contrário dos métodos paramétricos,9 não requerem a escolha de alguma distribuição específica de probabilidade para representar os tempos de sobrevivência, ou seja, é semi-paramétrico e, assim, mais robusto.

Assim como nos modelos de regressão, um objetivo da análise de sobrevivência é obter alguma medida do efeito que descreva a relação tratamento-resposta ajustada por variáveis relevantes exógenas, comparando a experiência de sobrevivência dos grupos. Na regressão linear, a medida do efeito é um coeficiente b, e, na logística, é uma odds ratio expressa em termos de uma exponencial de um ou mais coeficientes eb. Na análise de sobrevivência, a medida do efeito é a razão de riscos (hazard ratio), expressa em termos de uma exponencial do coeficiente da regressão, eb. Apesar de diferente da odds ratio, a razão de riscos tem uma interpretação similar da força do efeito: o valor 1 significa que não há efeito; o valor 10 significa que o grupo exposto tem dez vezes o risco do grupo não exposto. Quanto maior a probabilidade de sobrevivência no tempo t, menor a taxa de risco correspondente. Se a taxa de riscos para um grupo exposto no tempo t é maior do que para o grupo não exposto, a probabilidade de sobrevivência correspondente é menor. A distinção entre os métodos é o tipo de variável dependente usada: na análise de sobrevivência é a duração até o evento (e há dados censurados), na regressão linear é uma variável contínua e na logística é uma variável dicotômica.

Os modelos semi-paramétricos permitem um tipo de análise estratificada que é efetiva no controle de variáveis de confundimento e facilitam o ajuste por períodos de tempo nos quais um indivíduo não está em risco de um evento, acomodando mensurações diretas e contínuas de tempos de eventos. Cox (1972) inovou ao propor o modelo de riscos proporcionais e um método de estimação - verossimilhança parcial. O modelo básico é:

Esta equação diz que o risco para o indivíduo i no tempo t é o produto de dois fatores: uma função de risco de base (baseline hazard), l0(t), que não é especificada, exceto que não pode ser negativa; e uma função linear de um conjunto de k covariáveis Xi fixas, as quais são exponenciadas. A função l0(t) é vista como a função de risco para um indivíduo cujas covariáveis têm valor 0, ou seja, que prevaleceria caso Xi não existissem. Tomando o logaritmo em ambos os lados:

onde a(t) = log(l0(t)). Especificando a(t) = a, o modelo exponencial é obtido, e a(t) = a*log t, o modelo Weibull é obtido. Todavia, a maior vantagem da regressão de Cox é que tais escolhas são desnecessárias e a função a(t) pode assumir qualquer forma, mesmo a de uma função em degraus. A função de verossimilhança para o modelo de riscos proporcionais pode, portanto, ser dividida em duas partes: 1) uma parte depende de l0(t) e de b (vetor de coeficientes); 2) a outra parte depende somente de b. O que a verossimilhança parcial faz é descartar a primeira parte e tratar a segunda - a função de verossimilhança parcial - como se fosse uma função comum de verossimilhança. As estimativas são obtidas achando valores de b que maximizam a verossimilhança parcial, independente da forma da função de risco de base.10 bi mede o efeito de cada variável Xi na função de risco.

O modelo de riscos proporcionais implica que o risco para um indivíduo i com características X* é uma proporção fixa do risco para outro indivíduo j com características X. A razão de riscos (hazard ratio) para estes indivíduos então é:

O que é importante nesta equação é que l0(t) se cancela no denominador e no numerador, resultando em uma razão de riscos constante ao longo do tempo. Isto significa que a razão de riscos não depende do tempo, e, uma vez que X* e X forem definidos, ela se torna constante. Esta propriedade dos riscos proporcionais, a constância da razão de riscos, implica que as curvas dos logaritmos dos riscos para quaisquer dois indivíduos são paralelas e não se cruzam.

A fórmula para a equação de verossimilhança parcial é válida somente para dados nos quais dois eventos não ocorrem ao mesmo tempo. Todavia, são comuns dados que contém tempos de eventos empatados, sendo portanto necessária alternativas para lidar com estas situações. Utilizamos neste estudo um método exato que assume que há uma ordem verdadeira mas desconhecida para os tempos de eventos empatados. Isto porque assumimos que os eventos podem ocorrer em qualquer momento em um continuum de tempo, no caso ao longo de cada mês, sendo razoável supor que os empates são meramente o resultado de uma imprecisa mensuração do tempo, devido ao agrupamento dos dados contínuos, não empatados, e que há uma verdadeira ordenação no tempo para os eventos. Para estes dados de duração do desemprego, seria possível se ocupar em qualquer ponto no mês.

As variáveis utilizadas são: trata indica o grupo do experimento (tratamento=1 vs. controle=0); ocpdez96 representa o estado na força de trabalho no momento do treinamento (1=ocupado vs. 0=desempregado); sexo (1=homens vs. 0=mulheres); branca (1=brancos vs. 0=outras raças); jovem (14-19 anos=1 vs. 20 anos ou +=0); casado (1=casado vs. 0=outros estados conjugais); tem filho (1=tem filhos vs. 0=não tem filhos); estuda (1=freqüenta escola vs. 0=não freqüenta escola); serie4 (1=até 4 anos de estudo vs. 0=mais de 4 anos de estudo).11

Foram então estimados os coeficientes e suas estatísticas associadas (tabela 3).12 Foram realizados testes c2 Wald para a hipótese nula de que cada coeficiente é igual a 0 e o teste global da hipótese nula de que b = 0, isto é, todos os coeficientes são 0, usando as estatísticas de testes da razão de verossimilhança, score e Wald. Para a estatística da razão de verossimilhança, são mostrados os resultados para o modelo com covariáveis e para o modelo sem covariáveis. A estatística c2 da razão de verossimilhança é a diferença entre estes números. Tendo visto que são elevadas, os p-valores são pequenos, e conclui-se que ao menos um dos coeficientes das covariáveis não é 0 tanto para o total da amostra quanto para a subamostra dos desempregados.

 

 

Analisando os parâmetros estimados para cada covariável, a razão de riscos (hazard ratio), eb para variáveis categóricas é interpretada como a razão do risco estimado para aqueles com valor de 1 sobre o risco estimado para aqueles com valor de 0, controlando pelas outras covariáveis. Por exemplo, para a variável indicativa do grupo do experimento, significativa para o total da amostra, o valor 1,227 significa que o risco de se ocupar para o grupo de tratamento é cerca de 23% maior do que o risco para o grupo de controle. Da mesma forma, este risco é maior para os ocupados no momento do treinamento e para os homens, e menor para os mais jovens, para os que têm filhos e para os menos escolarizados. Quanto aos desempregados, o efeito do treinamento sobre a duração dos episódios de desemprego não é estatisticamente significante.13

Finalmente, estimamos modelos semi-paramétricos para os episódios ordenados de desemprego. Esta abordagem consiste em conduzir uma análise separada para cada episódio sucessivo, o que corresponde a estimar um modelo para o intervalo entre o início e o final do primeiro episódio, um segundo modelo para o intervalo entre o primeiro e o segundo episódios, e assim por diante. Isto é útil se esperamos que o modelo seja diferente de um episódio para o outro. De fato, como mostra a tabela 4, para o total da amostra, o efeito do treinamento só é significante para os primeiros episódios de desemprego, no sentido de significar um maior risco de saída do desemprego; risco este mais expressivo para o segundo episódio. Do terceiro episódio para frente, ou seja, entre aqueles que recorrentemente se ocupam e se desempregam, o efeito do treinamento não é significante.14 A tabela reforça os modelos anteriores, no sentido de que o efeito do treinamento para os desempregados não é significativo, independentemente da ordem do episódio de desemprego.

 

 

 

 

3.4 O Modelo Exponencial por Partes

Os modelos paramétricos assumem que o risco é uma função suave e relativamente simples do tempo. O modelo semiparamétrico de Cox é menos restritivo neste aspecto, mas não é capaz de testar hipóteses sobre a forma da função de risco. Uma maneira de obter alguma da flexibilidade do modelo de Cox, sem perder a capacidade de testar hipóteses, é empregar o modelo exponencial por partes (piecewise exponential), que exigiu uma restruturação dos dados com registros múltiplos para cada indivíduo, dividindo a escala de tempo em intervalos e assumindo que o risco é constante em cada intervalo, mas pode variar entre os intervalos. Definindo uma série de J intervalos, com pontos de corte a0,a1,...,aJ, onde a0 = 0 e aJ = ¥, o intervalo j é dado por [aj-1, aj) e o risco para o indivíduo i teria a forma: log hi(t) = aj + bxi, onde para aj-1 < t < aj. Portanto, o intercepto pode variar de um intervalo para outro. Cada registro é tratado como uma observação distinta, com o tempo refixado em 0 no início de cada intervalo e as covariáveis fixas no tempo são replicadas em cada intervalo.

Para este estudo, dividimos o período de 47 meses de observações em quatro prazos: até 8 meses após o treinamento, entre 9 e 16 meses após o treinamento, entre 17 e 35 meses após o treinamento e acima de 36 meses após o treinamento. Esta divisão se baseou nos riscos estimados pelo modelo não paramétrico e parece ser bastante razoável para analisarmos as diferenças entre os riscos de sair do desemprego dos grupos do experimento, de acordo com a duração dos episódios de desemprego. O teste de Wald para as covariáveis individuais indicou que a variável referente aos prazos tem um efeito significante, implicando que o risco não é constante ao longo do tempo de duração dos episódios de desemprego, mas pode ser constante dentro de cada prazo.

Sendo todas as covariáveis categóricas, reestimamos o modelo dentro do arcabouço dos modelos lineares generalizados para dados agrupados, tratando o número de eventos ocorrendo em uma célula de intervalo de tempo-covariável como tendo uma distribuição de Poisson. O parâmetro desta distribuição é tomado como uma função log-linear das covariáveis. A estatística de teste da log-verossimilhança, os coeficientes, o nível de significância, etc. estimados desta forma são idênticos aos estimados pelo modelo paramétrico, com os sinais invertidos na tabela. A tabela 6 mostra os resultados desta forma de estimação do modelo exponencial por partes aplicado aos dados da amostra total e da subamostra de desempregados.

 

 

Para o total da amostra, o padrão temporal estimado é monotônico: o risco estimado diminui do primeiro para o segundo prazos e do segundo para o terceiro. Além disto, a variável indicativa do grupo do experimento é estatisticamente significativa e seu coeficiente aponta para um risco de saída do desemprego 15% maior ao longo do tempo para o grupo de tratamento em relação ao grupo de controle. Ao contrário, para a subamostra dos desempregados, o padrão temporal estimado não é monotônico: o risco estimado aumenta do primeiro para o segundo prazos e diminui do segundo para o terceiro. Adicionalmente, a variável indicativa do grupo do experimento não é estatisticamente significativa. Todos estes resultados novamente apontam para a importância da análise particionada por prazos, que levam a conclusões diversas.

 

4. CONCLUSÕES

Este artigo apresentou a metodologia e os resultados da avaliação de impactos do programa público de treinamento conduzido na RMBH no âmbito do PLANFOR. Especificamente, procurou-se determinar em que medida este programa tem servido como instrumento efetivo para melhorias nas condições de inserção no mercado de trabalho, no que se refere à redução do nível e da duração do desemprego dos seus participantes.

O impacto de participar do PLANFOR sobre a duração do desemprego pareceu ser positivo para o total da amostra, reduzindo o número e a duração dos episódios de desemprego. No entanto, os efeitos variam com o grau de "desfavorecimento" no mercado de trabalho, definido por aspectos como a condição de desemprego no momento do treinamento. Os impactos estimados foram melhores para os que não enfrentavam esta barreira no mercado de trabalho. Para os desempregados no momento do treinamento, a participação no treinamento não tem um efeito positivo significativo em termos de geração e manutenção do trabalho. Um ponto fundamental a ser destacado é a questão do prazo de avaliação do desempenho após o programa; um curto prazo de acompanhamento após o treinamento tenderia a levar a uma avaliação inadequada. Dado o aumento do interesse neste tipo de política de trabalho, devido às crescentes preocupações sobre o nível e duração do desemprego dos trabalhadores com qualificação limitada, este artigo pretendeu contribuir para a discussão sobre metodologias de avaliação de políticas públicas no Brasil.

 

Referências Bibliográficas

Alisson, P. D. (1995). Survival analysis using the SAS System: a practical guide. SAS Institute, Cary, NC.        [ Links ]

Allison, P. (1984). Event history analysis. Sage, Beverly Hills,CA.        [ Links ]

Ashenfelter, O. (1978). Estimating the effect of training program on earnings. Review of Economics and Statistics, 60.         [ Links ]

Bell, S., Orr, L., Blomquist, J., & Cain, G. (1995). Program applicants as a comparison group in evaluating training programs. Upjohn Institute for Employment Research, Michigan.        [ Links ]

Bivar, W. (1991). Estimativas da duração média do desemprego no brasil. Pesquisa e Planejamento Econômico, 23:275–312.        [ Links ]

Bloom, D. E. (1984). On the nature and estimation of age, period and cohort effects in demographic data. Discussion Paper 84-7, Harvard University.        [ Links ]

Blossfeld, H., Hamerle, A., & Mayer, K. (1989). Event history analysis: statistical theory and application in the social sciences. Lawrence Erlbaum, Hillsdale,NJ.        [ Links ]

Burtless, G. (1995). The case for randomized field trials in economic and policy research. Journal of Economic Perspectives, 9(2):63–84.        [ Links ]

Card, D. & Sullivan, D. G. (1988). Measuring the effect of subsidized training programs on movements in and out of employment. Econometrica, 56(3):497–530. available at http://ideas.repec.org/a/ecm/emetrp/v56y1988i3p497-530.html.        [ Links ]

Couch, K. A. (1992). New evidence on the long-term effects of employment training programs. Journal of Labor Economics, 10(4):380–88. available at http://ideas.repec.org/a/ucp/jlabec/v10y1992i4p380-88.html.        [ Links ]

Cox, R. (1972). Regression models and lifet tables. Journal of the Royal Statistical Society, 34(B):187–220.        [ Links ]

Danziger, S. H., Sandefur, G. D., & Weinberg, D. H. (1994). Confronting poverty: prescriptions for change. Harvard University, Cambridge, MA.        [ Links ]

Eberwein, C., Ham, J. C., & LaLonde, R. J. (1997). The impact of being offered and receiving classroom training on the employment histories of disadvantaged women: Evidence from experimental data. Review of Economic Studies, 64(4):655–82. available at http://ideas.repec.org/a/bla/restud/v64y1997i4p655-82.html.        [ Links ]

Fernandes, R., Menezes-Filho, N. A., & Zylberstajn, H. (2000). Avaliando o planfor: o programa de treinamento do sindicato dos metalúrgicos de são paulo. Pesquisa e Planejamento Econômico, 30(2).        [ Links ]

Fernandes, R. & Pazello, E. T. (2001). Avaliação de políticas sociais: incentivos adversos, focalização e impacto. In Lisboa, M. & Menezes-Filho, N., editors, Microeconomia e sociedade no Brasil, pages 151–171.        [ Links ]

Friedlander, D., Greenberg, D. H., & Robins, P. K. (1997). Evaluating government training programs for the economically disadvantaged. Journal of Economic Literature, 35(4):1809–1855. available at http://ideas.repec.org/a/aea/jeclit/v35y1997i4p1809-1855.html.        [ Links ]

Greene, W. H. (1998). Econometric analysis. Prentice-Hall, New Jersey, 3 edition.        [ Links ]

Ham, J. C. & LaLonde, R. J. (1996). The effect of sample selection and initial conditions in duration models: Evidence from experimental data on training. Econometrica, 64(1):175–205. available at http://ideas.repec.org/a/ecm/emetrp/v64y1996i1p175-205.html.        [ Links ]

Heckman, J. J. (1979). Sample selection bias as a specification error. Econometrica, 47(1):153–61. available at http://ideas.repec.org/a/ecm/emetrp/v47y1979i1p153-61.html.        [ Links ]

Heckman, J. J., Ichimura, H., & Todd, P. E. (1997). Matching as an econometric evaluation estimator: Evidence from evaluating a job training programme. Review of Economic Studies, 64(4):605–54. available at http://ideas.repec.org/a/bla/restud/v64y1997i4p605-54.html.        [ Links ]

Heckman, J. J., Lalonde, R. J., & Smith, J. A. (1999). The economics and econometrics of active labor market programs. In Ashenfelter, O. & Card, D., editors, Handbook of Labor Economics, volume 3 of Handbook of Labor Economics, chapter 31, pages 1865–2097. Elsevier. available at http://ideas.repec.org/h/eee/labchp/3-31.html.        [ Links ]

Heckman, J. J. & Smith, J. (1997). Making the most out of programme evaluations and social experiments: Accounting for heterogeneity in programme impacts. Review of Economic Studies, 64(4):487–535. available at http://ideas.repec.org/a/bla/restud/v64y1997i4p487-535.html.        [ Links ]

Heckman, J. J. & Smith, J. A. (1995). Assessing the case for social experiments. Journal of Economic Perspectives, 9(2):85–110. available at http://ideas.repec.org/a/aea/jecper/v9y1995i2p85-110.html.        [ Links ]

Hosmer JR., D. & Lemeshow, S. (1999). Applied survival analysis. John Wiley, New York.        [ Links ]

Kiefer, N. M. (1988). Economic duration data and hazard functions. Journal of Economic Literature, 26(2):646–79. available at http://ideas.repec.org/a/aea/jeclit/v26y1988i2p646-79. html.        [ Links ]

Kleinbaum, D. G. (1996). Survival analysis: a self-learning text. Springer-Verlag, New York.        [ Links ]

LaLonde, R. J. (1986). Evaluating the econometric evaluations of training programs with experimental data. American Economic Review, 76(4):604–20. available at http://ideas.repec.org/a/aea/aecrev/v76y1986i4p604-20.html.        [ Links ]

LaLonde, R. J. (1995). The promise of public sector-sponsored training programs. Journal of Economic Perspectives, 9(2):149–68. available at http://ideas.repec.org/a/aea/jecper/v9y1995i2p149-68.html.        [ Links ]

Manski, C. F. (1995). Identification problems in the social sciences. Harvard University, Cambridge, M.A.        [ Links ]

Menezes-Filho, N. A. & Picchetti, P. (2000). Os determinantes da duração do desemprego em são paulo. Pesquisa e Planejamento Econômico, 30(1):23–47.        [ Links ]

Menezes-Filho, N. A. & Picchetti, P. (2001). Desemprego. In Lisboa, M. & Menezes-Filho, N., editors, Microeconomia e sociedade no Brasil, pages 227–249. available at http://ideas.repec.org/h/eee/labchp/3-31.html.        [ Links ]

Rios-Neto, E. (2001). Continuidade à metodologia de acompanhamento e avaliação do PLANFOR. UFMG/CEDEPLAR, Belo Horizonte.         [ Links ]

Rios-Neto, E. & Assunção, R. (1998). Metodologia de acompanhamento e avaliação do Plano Estadual de Qualificação (PEQ). UFMG/CEDEPLAR, Belo Horizonte.        [ Links ]

Rios-Neto, E. & Barros, R. P. (2000). Uma proposta de avaliação do Plano Nacional de Formação Profissional (PLANFOR). UFMG/CEDEPLAR, Belo Horizonte.        [ Links ]

Rios-Neto, E. & Oliveira, A. (1999). Políticas voltadas para a pobreza: o caso da formação profissional. In Henriques, R., editor, Desigualdade e pobreza no Brasil. IPEA, Rio de Janeiro.        [ Links ]

Schiller, B. (1998). The economics of poverty and discrimination. Prentice Hall, New York.        [ Links ]

Schmid, G., O'Reilly, J., & Schömann, K. (1996). International handbook of labour market policy and evaluation. Edward Elgar, Aldershot, U.K.        [ Links ]

 

 

* Endereço: Rua Curitiba, 832 – sala 717. 30315-430, Belo Horizonte, MG. Fone: (31) 3279.9181. Fax: (31) 3201-3657. E-mail: ahermeto@cedeplar.ufmg.br
† Endereço: Rua Curitiba, 832 - 9o. 30315-430, Belo Horizonte, MG. Fone: (31) 3279.9100. Fax: (31) 3201-3657. E-mail: eduardo@cedeplar.ufmg.br
1 O PLANFOR foi elaborado em fevereiro de 1996 e cerca de 70 mil treinandos foram beneficiados com os recursos de 1996.
2 Vale ressaltar que os resultados são condicionados ao fato dos indivíduos terem se inscrito no programa. Se de um lado isto torna possível comparar os dois grupos, de outra a generalizacão dos resultados para outros grupos não é automática.
3 Desemprego aqui definido no sentido de desocupacão, ou seja, incluindo os indivíduos que não trabalharam e que procuraram ou não trabalho no mês de referência.
4 Por exemplo, dados de pesquisas amplas sobre mercado de trabalho, como a Pesquisa Mensal de Emprego.
5 A variável dependente assume os valores 1, se o indivíduo é do grupo de tratamento e 0, se é controle. As covariáveis consideradas foram: idade, nível educacional, dummies para ser sindicalizado, ser associado, ter trabalhado na semana de referência, ter participado de treinamento nos últimos 5 anos. Sendo p a probabilidade de que um indivíduo pertenca ao grupo de tratamento, o modelo de regressão logística trabalha com a chance relativa de pertencer ao tratamento vs. pertencer ao controle que, de acordo com o modelo, relaciona-se com as covariáveis através de uma equacão linear no logaritmo da razão de chances de modo que . A interpretacão do parâmetro bi é dada em termos do efeito da covariável na razão de chances: se a covariável Xi sofrer um acréscimo de uma unidade, a razão de chances deverá mudar por um fator multiplicativo de ebi.
6 Foram utilizados dois métodos: Kaplan-Meier e tábua de vida. Os resultados são similares e apresentamos aqui somente os referentes à tábua de vida, que agregam os períodos e assim são mais convenientes à nossa análise.
7 O teste de Wilkinson difere da estatística log-rank somente pela presenca do número total em risco em cada ponto no tempo; assim é uma soma dos desvios dos números observados vs. esperados de eventos ponderada pelo total de expostos ao início de cada intervalo. Neste sentido, é mais sensível para se medir diferencas no início da curva.
8 Dentro da análise não paramétrica, além dos testes de diferencas entre grupos, é possível testar se covariáveis quantitativas são associadas com o tempo de sobrevivência. Cada variável é testada individualmente, sem controlar pelas outras. Estas estatísticas são generalizacões dos testes log-rank e Wilkinson e podem ser interpretadas como testes não paramétricos dos coeficientes do modelo (ver anexo D).
9 Fizemos estimativas de modelos paramétricos de regressão com dados de sobrevivência censurados usando o método de máxima verossimilhanca, como uma extensão dos modelos não paramétricos para cobrir situacões mais complexas. Como os resultados das análises paramétricas e semi-paramétricas são similares, apresentamos somente os resultados dos modelos de Cox e colocamos em anexo os resultados paramétricos.
10 A funcão L de máxima verossimilhanca é parcial porque se considera apenas as probabilidades dos casos de ocorrências do evento (falhas), não se considerando os casos censurados. A funcão L é o produto de vários Lj que representam a verossimilhanca de 'falha' naquele momento, dado que tenha sobrevivido até aquele momento. Neste sentido os casos censurados são considerados como expostos até aquele momento.
11 No anexo B constam as médias destas variáveis para cada grupo na amostra total e na subamostra de desempregados.
12 Não há uma estimativa de intercepto - aspecto característico da estimacão de verossimilhanca parcial; o intercepto é parte de a(t), a funcão arbitrária do tempo, que se cancela nas equacões estimadoras.
13 Foram feitas estimativas robustas levando em consideracão efeitos aleatórios para testar a hipótese nula global e as hipóteses nulas de parâmetros individuais. Os resultados seguiram na mesma direcão, sendo o efeito do tratamento significante para o total da amostra, mas com uma razão de riscos maior (1,264); e não significante para a subamostra dos desempregados.
14 Do quarto episódio em diante, a hipótese nula global de que todos os coeficientes são iguais a zero é aceita.
15 Os resultados referentes ao teste Wilcoxon são bastante similares, não diferindo na significância e sinal das variáveis.
16 Um modelo é um caso especial de outro se pode ser obtido pela imposicão de restricões sobre os parâmetros, o que é o caso dos modelos AFT, que englobam vários sub-modelos que diferem na distribuicão pressuposta da duracão.

 

 

A. ORGANIZAÇÃO DOS DADOS

A pesquisa gerou informações retrospectivas ao nível individual sobre a ocupação em cada mês e assim as durações, e a forma do banco de dados é uma história de eventos na qual o tempo de ocorrência da transição é então registrado. A seqüência de dados binários, igual a 1 se o indivíduo está ocupado no tempo t e 0 caso contrário, representa a história de eventos para cada indivíduo. Apesar da estrutura básica de dados parecer simples, é árduo colocar os dados nesta forma em estudos de histórias de vida que contêm informação sobre eventos repetidos. Se o estado de destino fosse absorvente, modelos de episódio único poderiam ser aplicados. Ao lidar com durações que representam intervalos de tempo para os quais nem todos os estados são absorventes, é possível que cada indivíduo apresente mais de uma transição. Neste estudo, nos interessa a duração dos episódios de desemprego, que podem ser repetidos para cada indivíduo. Uma abordagem seria conduzir uma análise separada para cada evento sucessivo, estimando um modelo para cada episódio, se assumimos que o modelo é diferente de um evento para o outro. Por outro lado, sendo o processo essencialmente o mesmo entre os eventos sucessivos, fazer uma análise separada para cada evento é estatisticamente ineficiente. A abordagem apropriada então é tratar cada intervalo entre eventos para cada indivíduo como uma observação separada. Assim, partimos de um banco de dados individuais, com informações mensais sobre o estado na força de trabalho e variáveis explicativas de interesse, como idade, grupo do experimento (tratamento=1 e controle=0), raça, etc., e o transformamos em um arquivo de dados orientado para eventos ou com episódios separados, organizando as observações como pseudo-observações. O banco de dados orientado para episódios permite que os indivíduos contribuam números variados de vezes à expressão de verossimilhança, dependendo de quando e se mudaram de estado ao longo do curso do painel. Além disto, o banco de dados orientado para episódios permite que os tempos ordenados de ocorrência do evento sejam agrupados entre os indivíduos para o cálculo das funções de sobrevivência e risco agregadas.

 

B. MÉDIAS DE VARIÁVEIS, SEGUNDO O GRUPO DO EXPERIMENTO, AMOSTRA TOTAL E DESEMPREGADOS

 

 

C. MODELOS PARAMÉTRICOS

As variáveis utilizadas são: trata indica o grupo do experimento (tratamento=1 vs. controle=0); ocpdez96 representa o estado na força de trabalho no momento do treinamento (1=ocupado vs. 0=desempregado); sexo (1=homens vs. 0=mulheres); branca (1=brancos vs. 0=outras raças); jovem (14-19 anos=1 vs. 20 anos ou +=0); casado (1=casado vs. 0=outros estados conjugais); tem filho (1=tem filhos vs. 0=não tem filhos); estuda (1=freqüenta escola vs. 0=não freqüenta escola); serie4 (1=até 4 anos de estudo vs. 0=mais de 4 anos de estudo).

A tabela 8 mostra os resultados referentes ao teste log-rank.15 Para o total da amostra, o efeito da variável de tratamento é significativo, indicando que a participação no treinamento tem uma associação significante com o tempo de sobrevivência no desemprego, o que vem a confirmar os resultados descritivos anteriores. O sinal negativo da estatística para o grupo do experimento indica menores durações para o grupo de tratamento, o que também reafirma o visto anteriormente.

 

 

 

 

Para a subamostra dos desempregados, a tabela mostra que o efeito da variável de tratamento é menos significativo, sugerindo a associação da participação no treinamento com o tempo de sobrevivência no desemprego, ainda que mais fraca do que para o total da amostra. O sinal negativo da estatística para o grupo do experimento também indica menores durações para o grupo de tratamento.

Testes por efeitos incrementais de adicionar variáveis ao conjunto foram feitos através de um procedimento de inclusão para frente, que consiste em primeiro encontrar a variável com a maior estatística c2 e colocá-la na série a ser testada, e depois encontrar a variável que produz o maior incremento no c2 conjunto das duas variáveis. Este c2 conjunto testa a hipótese nula de que os coeficientes das variáveis no modelo são ambas 0. O incremento do c2 é um teste da hipótese nula de que o coeficiente da segunda variável é 0 quando a primeira é controlada. Este processo é repetido até que todas as variáveis tenham sido incluídas. Para cada variável, é obtido um teste da hipótese de que a variável não tem efeito sobre o tempo de sobrevivência, controlando por todas as variáveis acima dela. O procedimento de inclusão pode levar a conclusões bastante diferentes da análise univariada; um dos motivos é que variáveis que antes tinham efeitos significativos podem ser relacionadas a outras covariáveis, que tenham ainda maiores efeitos sobre o tempo de sobrevivência. Isto é exatamente o que ocorre com a variável de tratamento entre os desempregados, cujos efeitos sobre a duração do desemprego perdem significância ao se controlar pelo sexo, nível de escolaridade, idade e presença de filhos. Para a amostra total, as conclusões são as mesmas da análise univariada.

Embora seja um procedimento útil para análises preliminares de dados de sobrevivência e para testar hipóteses simples sobre diferenças da sobrevivência entre grupos, a análise não paramétrica não permite examinar os efeitos das covariáveis. Por não fornecer estimativas dos coeficientes, não há como quantificar o efeito de uma covariável sobre o tempo de sobrevivência. Além disto, os testes incrementais não testam realmente o efeito de cada variável controlando por todas as outras, mas efeito de cada variável controlando pelas variáveis que já foram incluídas. Dado que não se tem controle sobre a ordem de inclusão, estes testes podem levar a conclusões erradas; entretanto, o método nos forneceu evidências iniciais importantes antes de procedermos à estimação de modelos de regressão.

 

D. ANÁLISE PARAMÉTRICA

Mesmo tendo uma idéia da forma da curva de risco através da análise não paramétrica e semi-paramétrica, estimamos alguns modelos paramétricos alternativos para buscar uma descrição mais refinada da sobrevivência dos grupos do experimento. Modelos paramétricos permitem introduzir o efeito de um grande número de características sobre a duração da permanência em um dado estado, sendo possível testar hipóteses sobre a forma da função de risco.

Em primeiro lugar, estimamos modelos de tempo de vida acelerado (Accelerated Failure Time - AFT), com o objetivo de verificar a possibilidade de escolher uma forma paramétrica que descreva a sobrevivência dos grupos estudados. Os modelos AFT fazem parte da classe de modelos de regressão que, em sua forma geral, descrevem uma relação entre as funções de sobrevivência de quaisquer dois indivíduos. Sendo Si(t) a função de sobrevivência para o indivíduo i, então para qualquer outro indivíduo j, o modelo AFT diz que: Si(t) = Sj(fijt) para todos os t, onde fij é uma constante específica ao par (i,j) . O que realmente estimamos é um caso especial deste modelo: sendo Ti uma variável aleatória que denota o tempo do evento para o indivíduo j na amostra e sendo xj1,...,xjk os valores das k covariáveis para o mesmo indivíduo, o modelo é:

onde i é um termo de erro aleatório, e b0,...,bk e s são parâmetros a serem estimados. Exponenciando a equação:

As diferenças entre este modelo e o de regressão linear são que há um s antes do , o que significa que a variância de eé fixada em algum valor e s muda de valor para acomodar mudanças na variância do erro; e a variável dependente é uma transformação logarítmica (de T), cujo propósito é assegurar que os valores preditos de T sejam positivos, independente dos valores dos x's e b's. Em um modelo de regressão linear, assume-se que i tem uma distribuição normal com média e variância constantes, e que os 's são independentes entre as observações. O modelo AFT log-normal tem exatamente estes pressupostos. Os outros modelos AFT permitem distribuições de além da normal, mas retêm os pressupostos de média e variância constantes e de independência entre observações. Na análise de sobrevivência, é importante considerar estas distribuições alternativas de , porque elas têm diferentes implicações para as funções de risco que podem levam a diferentes interpretações substantivas. Algumas destas distribuições, para as quais há uma distribuição correspondente de T são: valores extremos (1 parâmetro) - exponencial, valor extremo (2 parâmetros) - Weibull, log-gamma - gamma e logística - log-logística.

Os modelos AFT são estimados pelo método de máxima verossimilhança (ML), que lida bem com dados que contém informações censuradas. O princípio básico de ML é escolher as estimativas cujos valores maximizam a probabilidade de observar o que de fato é observado. Primeiro é construída uma função de verossimilhança, que é uma expressão para a probabilidade dos dados como função dos parâmetros desconhecidos. Deve-se especificar um modelo dentre os descritos acima, o que significa escolher uma distribuição de probabilidade para a variável dependente e uma forma funcional que relacione os parâmetros desta distribuição aos valores das covariáveis. Em seguida, é feita a maximização, achando os valores dos parâmetros desconhecidos que tornam o valor desta expressão o maior possível. Isto requer um método numérico iterativo, ou seja, que envolve aproximações sucessivas.

Para a amostra total, a estatística c2 do multiplicador de Lagrange calculada para o modelo exponencial não rejeitou a hipótese nula de que o parâmetro de escala fosse igual a 1, o que sugere que a função de risco de saída do desemprego para a amostra total poderia ser constante ao longo do tempo. Quando estimado o modelo Weibull, o parâmetro de escala calculado foi maior que 1, indicando que o risco diminui com o tempo na seguinte proporção: um aumento de 1% no tempo desde o tratamento produziria uma diminuição de 1,6% no risco. O modelo log-normal estimado revelou um parâmetro de escala maior que 1, indicando que o risco apresenta um pico rapidamente, tal que a função é similar à Weibull e à log-logística. Quanto ao modelo log-logístico, a estimativa da escala foi menor que 1, implicando que a função estimada de risco segue a forma de U invertido; dada a similaridade dos riscos log-normal e log-logístico, os resultados são similares. No modelo gamma generalizado ajustado, os parâmetros de escala (1,08) e de forma (-0,53) estimados não permitiram inferir a adequação de nenhum caso especial, mas uma maior aproximação do modelo log-normal (parâmetro de forma =0).

 

 

 

 

Todos os modelos produziram estimativas similares de coeficientes e p-valores, sendo necessária alguma maneira de decidir entre eles, já que esta escolha tem diferentes implicações para a forma da função de risco. Utilizamos então um método para escolher os melhores ajustes, através da comparação dos valores das log-verossimilhanças. Para a amostra total, dentre estes modelos, as menores magnitudes das log-verossimilhanças foram fornecidas pelos modelos gamma generalizado, log-normal e log-logístico. Além desta indicação, fizemos testes de qualidade do ajuste com a estatística da razão de verossimilhança para comparar modelos hierarquizados.16 Quando comparado ao Weibull, o modelo exponencial deveria ser aceito, implicando que o risco seria constante ao longo do intervalo. Isto é consistente com o resultado anterior do teste do multiplicador de Lagrange; todavia, este modelo e os outros casos especiais do modelo gamma generalizado são rejeitados na comparação com este.

Concluindo, nossa escolha de modelo para a amostra total recaiu sobre os modelos log-logístico e gamma generalizado. O modelo log-logístico não se encaixa no esquema dos modelos hierarquizados, ou seja, não é um caso especial de outros e portanto não pôde ser a eles comparado pela razão de verossimilhança. Como apresentou uma menor log-verossimilhança do que os outros modelos e bastante próxima do modelo gamma generalizado, sugere um bom ajuste aos dados. Além disto, a desvantagem de se optar somente pelo modelo gamma generalizado é que sua função de risco é muito complicada, sendo difícil julgar a forma da função de risco a partir dos parâmetros estimados (Alisson, 1995).

 

 

 

 

A tabela 14 mostra a estimativa dos coeficientes das covariáveis para os modelos escolhidos para a amostra total - log-logístico e gamma generalizado. Os valores estimados dos coeficientes e sua significância são similares, portanto a análise aqui recai sobre o modelo log-logístico. Nesta métrica mostrada, suas magnitudes numéricas não são muito informativas, mas uma transformação simples leva a uma interpretação intuitiva: eb fornece a razão estimada dos tempos de sobrevivência médios esperados para os grupos. Por exemplo, para a variável de tratamento, e-0,1535 = 0,8577 indica que, controlando pelas outras covariáveis, a duração dos episódios de desemprego para o grupo de tratamento é 14,2% menor do que para o grupo de controle.

 

 

Para os desempregados, os resultados da análise paramétrica são semelhantes aos da amostra total. Uma diferença foi a estatística c2 do multiplicador de Lagrange calculada para o modelo exponencial, que rejeitou a hipótese nula de que a função de risco de saída do desemprego para a amostra total seria constante ao longo do tempo. O parâmetro de escala estimado pelo modelo Weibull foi maior que 1, indicando que o risco diminui com o tempo, mas em um ritmo maior (3,8%). No modelo gamma generalizado, os parâmetros estimados também não permitiram inferir a adequação de nenhum caso especial. Novamente, os modelos produziram estimativas similares de coeficientes e p-valores, sendo necessária alguma maneira de decidir entre eles. Os modelos que melhor descrevem a função de risco verdadeira dos desempregados parecem ser gamma generalizado, log-normal e log-logístico. Os testes de qualidade do ajuste com a estatística da razão de verossimilhança para comparar modelos hierarquizados indicaram que, quando comparado ao Weibull, o modelo exponencial deveria ser aceito, o que, neste caso, não é consistente com o resultado anterior do teste do multiplicador de Lagrange. Todos os modelos foram rejeitados na comparação com o modelo gamma generalizado. Portanto, a escolha de forma do risco para os desempregados também recaiu sobre os modelos log-logístico e gamma generalizado.

Os coeficientes destes modelos para a subamostra de desempregados estão na tabela 15. Enfatizando os valores estimados pelo modelo log-logístico, a grande diferença em relação ao total da amostra é a perda de significância da variável indicativa do grupo do experimento. Isto significa que, controlando pelas outras covariáveis, a duração dos episódios de desemprego para o grupo de tratamento é estatisticamente equivalente à do grupo de controle.