Acessibilidade / Reportar erro

Migração seletiva de retorno e distribuição salarial: Evidências para população migrante em São Paulo

Resumo

O objetivo deste trabalho é investigar o impacto da migração seletiva de retorno sobre a distribuição salarial de migrantes residentes em São Paulo. Para tanto, foram utilizados os dados do Censo Demográfico de 2010 e um método de estimação que leva em conta a seleção em não observáveis. Os achados deste estudo apontam para seleção negativa em observáveis e não observáveis no fluxo dirigido ao estado de São Paulo. Considerando a seletividade, a população migrante estaria recebendo mais se todos permanecessem, e a desigualdade dentro do grupo diminuiria substancialmente entre os percentis extremos.

Classificação JEL. R23, J24, C14.

Palavras-chave
Migração de retorno; Autosseleção; Desigualdade salarial


1. Introdução

Segundo dados dos censos demográficos no Brasil, houve uma expansão da migração interestadual de retorno nas últimas décadas. Em termos absolutos, a população de remigrados subiu de 1,14 milhões entre 1995 e 2000 para 1,23 milhões no quinquênio de 2005/2010, representando 22,02% e 24,52% do total de migrantes interestaduais do país, respectivamente (IBGE, 2012IBGE (2012): “Resultados gerais da amostra,” Ibge censo, Instituto Brasileiro de Geografia e Estatística. [1]).

Esse regresso, no entanto, não ocorre de forma aleatória dentro do processo migratório. Segundo Biavaschi (2016)Biavaschi, Costanza (2016): “Recovering the counterfactual wage distribution with selective return migration,” Labour Economics, 38, 59-80. [1, 3, 7, 8, 11, 12, 14, 15, 18, 19, 20, 27], a escolha de residência ótima de um migrante racional está condicionada à decisão inicial de migração. Borjas e Bratsberg (1996)Borjas, George J e Bernt Bratsberg (1996): “Who leaves? The outmigration of the foreignborn,” Rel. téc., National Bureau of Economic Research. [1, 8, 30], por sua vez, argumentam que a dinâmica de retorno reforça a seleção que caracterizou o fluxo de migração inicialmente. Isso significa que se o fluxo inicial de migrantes for positivamente selecionado em termos de suas habilidades inatas, então os retornados serão aqueles com habilidades inferiores dentro do grupo inicial de partida A volta de indivíduos negativamente selecionados, no entanto, levaria a uma redução no bem-estar da população, isso porque esses indivíduos tenderiam a ser desmotivados e menos favorecidos no mercado de trabalho (Siqueira e Matos Magalhaes, 2006Siqueira, Liedje Bettizaide Oliveira de e André Matos Magalhaes (2006): “Uma análise do fluxo migratório brasileiro: migração para regiões pobres e migração de retorno,” Tese de Doutorado, Universidade Federal de Pernambuco. [2, 30]).

A hipótese de autosseleção é, portanto, uma questão central nos movimentos populacionais. Ela sugere que os migrantes não são pessoas aleatórias na população de origem isto é, esses indivíduos dispõe de características não observáveis como agressividade, empreendedorismo, ambição, propensão ao risco, entre outras (Chiswick, 1999Chiswick, Barry (1999): “Are immigrants favorably self-selected?” American Economic Review, 89, 181-185. [2, 8]). Além das características pessoais, os custos de migração e os diferencias de salários líquidos entre as regiões podem influenciar a seleção dos migrantes (Sjaastad, 1962Sjaastad, Larry A (1962): “The costs and returns of human migration,” Journal of political Economy, 70, 80-93. [2]; Cattaneo, 2007Cattaneo, Cristina (2007): “The Self-Selection in the Migration Process: What Can We Learn?” LIUC Papers in Economics 199, LIUC. [2]; McKenzie e Rapoport, 2010McKenzie, David e Hillel Rapoport (2010): “Self-selection patterns in Mexico-US migration: the role of migration networks,” The Review of Economics and Statistics, 92, 811- 821. [2]).

Existem evidências de que os migrantes interestaduais no Brasil são positivamente selecionados, isto é, possuem características não observáveis favoráveis ao seu sucesso no mercado de trabalho tanto em relação aos seus conterrâneos quanto em relação aos não migrantes dos estados que os recebem (Santos Júnior et al., 2005Santos Júnior, Enestor da Rosa dos, Naércio Menezes-Filho, Pedro Cavalcanti Ferreira, et al. (2005): “Migração, seleção e diferenças regionais de renda no Brasil,” Pesquisa e Planejamento Econômico, 35. [2, 8]; Freguglia e Procópio, 2013Freguglia, Ricardo da Silva e Thais Salzer Procópio (2013): “Efeitos da mudança de emprego e da migração interestadual sobre os salários no Brasil formal: evidências a partir de dados em painel,” Pesquisa e Planejamento Econômico, 43, 255-278. [2, 8]; Gama e Machado, 2014Gama, Luiz Carlos Day e Ana Flávia Machado (2014): “Migração e rendimentos no Brasil: análise dos fatores associados no período intercensitário 2000-2010,” estudos avançados, 28, 155-174. [2, 8, 13, 15, 18]). Ramalho e Queiroz (2011)Ramalho, Hilton Martins de Brito e Vívian dos Santos Queiroz (2011): “Migração interestadual de retorno e autosseleção: evidências para o Brasil,” Pesquisa e Planejamento Econômico, 41. [2, 15, 16] identificam seleção positiva dos migrantes não retornados em relação aos não migrantes em fatores não observados. O grupo de retornados, por sua vez, também registra vantagens frente aos não migrantes em termos de características inatas. A conclusão dos autores foi que a migração gera benefícios mesmo quando o individuo opta por retornar devido aos ganhos de capital humano. Gama e Machado (2014)Gama, Luiz Carlos Day e Ana Flávia Machado (2014): “Migração e rendimentos no Brasil: análise dos fatores associados no período intercensitário 2000-2010,” estudos avançados, 28, 155-174. [2, 8, 13, 15, 18], por sua vez, corroboram esse resultado, os autores identificam seleção positiva em habilidades não observáveis para os remigrados e migrantes permanentes em relação aos não migrantes, mas não comparam relações entre permanentes e retornados.

Em se tratando do progresso do migrante no destino, Silveira Neto e Magalhães (2006)Silveira Neto, Raul da Mota e André Mato Magalhães (2006): “O progresso econômico do migrante em São Paulo: Evidências a partir dos censos demográficos de 1991 e 2000,” Economia & Desenvolvimento, 5. [2, 25], ao estudar a migração para o estado de São Paulo, verificam que há uma lacuna significativa entre nativos e migrantes perdurando ao longo do tempo, favorecendo o grupo de paulistas. Portanto, para os migrantes, a valoração de seus atributos é feita de forma diferenciada pelo mercado, em termos de características observáveis como educação e estado de origem. Outros estudos apontam para a mesma característica de migração. Segundo Batista e Cacciamali (2009)Batista, Natalia Nunes Ferreira e Maria Cristina Cacciamali (2009): “Diferencial de salários entre homens e mulheres segundo a condição de migração,” Revista Brasileira de Estudos de População, 26, 97-115. [2, 25] esse resultado é presente entre entre migrantes e não migrantes na própria região Sudeste. Os autores Assis et al. (2012)Assis, RS de, Edward Martins Costa, e JL Mariano (2012): “Impacto da migração de não naturais e da migração de retorno sobre a distribuição de renda dos estados da Bahia e de São Paulo: um olhar sobre a inserção desses indivíduos no mercado de trabalho local,” 40º Encontro Nacional de Economia. [2, 4, 25], ao analisar a migração entre os estados de São Paulo e Bahia identificam, mais uma vez, um hiato salarial entre baianos e paulistas, favorável ao último grupo.

O progresso econômico do migrante no destino, no entanto, pode sofrer efeitos da saída de trabalhadores. A depender da natureza de seleção desses indivíduos a desigualdade salarial entre os grupos pode ser mitigada ou intensificada. Com isso, a assimilação do migrante no destino pode ser subestimada ou superestimada se não levarmos em conta a migração seletiva de retorno (Cohen e Haberfeld, 2001Cohen, Yinon e Yitchak Haberfeld (2001): “Self-selection and return migration: Israeliborn Jews returning home from the United States during the 1980s,” Population Studies, 55, 79-91. [2]; Ambrosini et al., 2010Ambrosini, J William, Karin Mayr, Giovanni Peri, e Dragos Radu (2010): The selection of migrants and returnees: Evidence from Romania and implications, World Bank. [2, 18]). Isso posto, surgem duas questões relevantes a serem investigadas: como se comportaria a distribuição de salários dos migrantes interestaduais na ausência da migração de retorno? A migração de retorno é um mecanismo que facilita ou dificulta a assimilação dos migrantes na região de destino?

Portanto, o objetivo geral deste trabalho é analisar o impacto da migração interestadual de retorno na distribuição de salários dos migrantes que permaneceram na região de destino. De forma específica, procura-se: (i) analisar o tipo de seletividade em características inatas dos migrantes; (ii) investigar o efeito da migração de retorno considerando grupos por níveis educacionais; (iii) verificar diferenciais salariais dentro do grupo de migrantes permanentes e entre migrantes e naturais da região de destino mediante a ausência de migração de retorno.

Para alcance dos objetivos citados serão feitas estimativas de distribuição de salários mediante dois cenários: com e sem migração de retorno, considerando o estado de São Paulo como região de destino dos fluxos de migração. O estado de São Paulo possui o maior Produto Interno Bruto (PIB) frente as demais unidades federativas do Brasil, tem um mercado de trabalho dinâmico e competitivo, além de se caracterizar como destino principal dos migrantes brasileiros (Santos e Ferreira, 2007Santos, Cézar Augusto Ramos e Pedro Cavalcanti Ferreira (2007): “Migração e distribuição regional de renda no Brasil,” Pesquisa e Planejamento Econômico, 37. [3, 15, 16]; Oliveira et al., 2011Oliveira, ATR de, Leila Regina Ervatti, e MMVC O’Neill (2011): “O panorama dos deslocamentos populacionais no Brasil: PNADs e Censos Demográficos,” Reflexões sobre os deslocamentos populacionais no Brasil, 1. [3, 16]; Ramalho et al., 2016Ramalho, Hilton Martins de Brito, Erik Figueiredo, e José Luis da Netto Júnior (2016): “Determinantes das migrações interestaduais no Brasil: evidências a partir de um modelo gravitacional,” Pesquisa e Planejamento Econômico, 46. [3, 4, 16]).

Nesse contexto, procura-se recuperar a distribuição de salários na ausência de migração de retorno, conforme método proposto por Biavaschi (2016)Biavaschi, Costanza (2016): “Recovering the counterfactual wage distribution with selective return migration,” Labour Economics, 38, 59-80. [1, 3, 7, 8, 11, 12, 14, 15, 18, 19, 20, 27]. Esse método amplia aquele apresentado por DiNardo et al. (1995)DiNardo, John, Nicole M Fortin, e Thomas Lemieux (1995): “Labor market institutions and the distribution of wages, 1973-1992: A semiparametric approach,” Rel. téc., National bureau of economic research. [3, 12, 21] e aplicado em Chiquiar e Hanson (2005)Chiquiar, Daniel e Gordon H Hanson (2005): “International migration, self-selection, and the distribution of wages: Evidence from Mexico and the United States,” Journal of political Economy, 113, 239-281. [3, 12] apenas para características observáveis, ao considerar a seleção dos migrantes em características não observadas. Também parte do pressuposto de que o viés de seleção amostral desaparece para migrantes com alta probabilidade de permanência na região de destino. Esse procedimento é conhecido na literatura como identificação no infinito (Chamberlain, 1986Chamberlain, Gary (1986): “Asymptotic efficiency in semi-parametric models with censoring,” Journal of Econometrics, 32, 189-218. [3, 8, 11]) e foi defendido por Heckman (1990)--- (1990): “Varieties of selection bias,” The American Economic Review, 80, 313. [3, 8, 12, 19] na estimação do termo constante em modelos de seleção de amostra semiparamétrica. A seleção amostral é tratada através de um modelo de regressão de cópula. Esse método assegura flexibilidade na distribuição dos dados e eficiência do modelo paramétrico, além de lidar com relações de resposta não linear das covariadas do modelos.

Destarte, esse trabalho avança em relação à literatura nacional ao considerar o efeito da migração seletiva de retorno sobre a distribuição salarial dos migrantes remanescentes no destino. Bem como pela utilização de um método ainda não explorado que considera características não observadas, identificação no infinito e a utilização de função cópula na modelagem de dependência entre o processo salarial e de migração de retorno.

Entre os principais achados temos que a população migrante em São Paulo estaria ganhando mais caso não houvesse migração de retorno. Além disso, a desigualdade entre os próprios migrantes diminuiria substancialmente no cenários em que todos os trabalhadores não naturais decidem permanecer em São Paulo.

Afora essa introdução, esta pesquisa está organizada da seguinte forma: (ii) resumo de fatos observados na migração interestadual brasileira; (iii) detalhamento do modelo empírico e uma descrição dos dados e variáveis utilizadas no estudo; (iv) resultados empíricos e discussões (v) considerações finais.

2. Migração interestadual no Brasil: fatos observados

Nesta seção são apresentados dados mais recentes sobre a migração interestadual no Brasil, considerando o cruzamento das questões de estado de residência na data de entrevista, estado de residência anterior e estado de naturalidade. Conforme dados do Censo Demográfico Brasileiro de 2010, entende-se o migrante permanente o indivíduo que declarou residência em uma unidade federativa na data da da entrevista, tendo como residência anterior o estado de nascimento. O migrante retornado, por sua vez é o indivíduo declarou residir no seu estado de nascimento, tendo anteriormente residido em outro estado. Tais conceitos permitem estimar estoques de migrantes para o período de 2000 a 2010.

A Tabela 1 contém dados do quantitativo de migrantes interestaduais segundo a unidade federativa de residência em 2010 - migrantes não retornados - coluna (1) e migrantes remigrados de São Paulo - coluna (3) - e unidade federativa de residência anterior - migrantes retornados - coluna (2) -. Observa-se que o estado de São Paulo concentra não somente a maior parcela de migrantes permanentes (23%), mas também é o estado de origem da maior parcela de migrantes retornados, ou seja, 24,28% dos remigrados para seu estado de nascimento residiam anteriormente no estado. Destarte, mesmo atraindo muitos migrantes, São Paulo também é um grande emissor para outros estados.

Tabela 1
Distribuição dos migrantes interestaduais segundo estado de residência na data censitária e estado de residência anterior - 2010

Dada a grande relevância do estado de São Paulo na atração de fluxos migratórios, em particular, como residência anterior de quase 1/4 dos remigrados no período analisado, a coluna (3) da tabela em destaque apresenta a distribuição dos migrantes retornados de São Paulo segundo seu estado de nasciment. Destaca-se que do total de remigrados provenientes de São Paulo, cerca de 47% tiveram como destino os estados da região Nordeste e o estado de Minas Gerais, 20,37%.

Os dados apresentados na Figura 1 mostram entre que entre os Censos Demográficos de 2000 e 2010 não houve mudanças significativas nos padrões de representatividade dos estados de origem dos migrantes residentes em São Paulo (SP). Os cinco estados com maior população migrante em SP são os mesmos nos dois censos. Note-se que o estado da Bahia é o maior fornecedor nos dois períodos. O fluxo São Paulo-Bahia tem sido observado como recorrente nos estudos sobre mobilidade populacional. Assis et al. (2012)Assis, RS de, Edward Martins Costa, e JL Mariano (2012): “Impacto da migração de não naturais e da migração de retorno sobre a distribuição de renda dos estados da Bahia e de São Paulo: um olhar sobre a inserção desses indivíduos no mercado de trabalho local,” 40º Encontro Nacional de Economia. [2, 4, 25], por exemplo, ressaltam que 60% dos migrantes retornados baianos residiam anteriormente em São Paulo, segundo dados da PNAD de 2009. Minas Gerais é o segundo estado mais representativo entre os migrantes, no censo de 2010 há um ligeiro aumento de envio. No entanto, no período de 2005 a 2010 apresentou equilíbrio na entrada e saída de migrantes, passando para categoria de estado com rotatividade migratória conforme (Ramalho et al., 2016Ramalho, Hilton Martins de Brito, Erik Figueiredo, e José Luis da Netto Júnior (2016): “Determinantes das migrações interestaduais no Brasil: evidências a partir de um modelo gravitacional,” Pesquisa e Planejamento Econômico, 46. [3, 4, 16]).

Figura 1
Distribuição de migrantes em São Paulo por estado de origem - Censos de 2000 e 2010. Valores expandidos para população. Fonte: Elaboração própria a partir dos dados do Censo Demográfico de 2000 e 2010.

São Paulo tem se sobressaído como absorvedor de migrantes há décadas e as tendências de origem dos migrantes também não sofreram significativas mudanças ao longo do tempo. O que vem se destacando é a grande perda de população sofrida pelo estado, fruto especialmente da migração de retorno de nordestinos e de mineiros. O fluxo de migrantes oriundos de São Paulo para a região Nordeste constitui-se basicamente de migrantes retornando aos seus estados, o que vinha contribuindo para saldos migratórios positivos. Os dados apresentados acima sugerem que esse movimento continua na mesma direção.

Em se tratando de capital humano, a Tabela 2 relata os percentuais de migrantes interestaduais residentes no estado de São Paulo em 2010 e de acordo com a região de nascimento (residência anterior) e o nível de escolaridade. Observa-se uma maior concentração de migrantes com baixa instrução de origem na região Nordeste, 69,50% dos migrantes sem instrução são oriundos dessa região. Esse padrão se repete para os níveis fundamentais e médio com 67,14% e 56,27%, respectivamente. Nos níveis de instrução mais altos encontram-se em destaque os sulistas com 43% dos migrantes com ensino superior e aqueles oriundos da região Centro-Oeste do país (23,63%). Dos migrantes que possuem pós-graduação, 43,97% são oriundos da região Sul. No geral, a população migrante em São Paulo é de baixa instrução, com cerca 53% de pessoas no nível mais baixo, apenas 6,04% dessa população declarou possuir nível superior e 0,73% disse possuir pós-graduação.

Tabela 2
Distribuição dos migrantes permanentes em São Paulo segundo faixa de instrução e por região de residência anterior (nascimento)

As informações trazidas nessa seção são úteis para identificar as tendências e padrão de migração interestadual no Brasil. Chama atenção o estado de São Paulo enquanto grande polo de absorção e de residência anterior de remigrados. No entanto, a influência da migração de retorno assumiu papel relevante nos movimentos populacionais do Brasil. Uma questão relevante é investigar os efeitos da migração de retorno sobre a desigualdade salarial do grande quantitativo de migrantes residentes em São Paulo. As seções a seguir procuram responder como esse problema pode ser investigado.

3. Metodologia

3.1 Modelo Empírico

Seguindo Biavaschi (2016)Biavaschi, Costanza (2016): “Recovering the counterfactual wage distribution with selective return migration,” Labour Economics, 38, 59-80. [1, 3, 7, 8, 11, 12, 14, 15, 18, 19, 20, 27], a decisão de ficar na região de destino ou retornar para a região de nascimento vai depender do valor do benefício líquido da permanência. Caso ele seja maior do que zero, o trabalhador deve permanecer na região de destino, caso contrário deve remigrar. Dessa forma, façamos Si = 1 um indicador que o trabalhador migrante permaneceu em São Paulo e Si = 0 caso tenha retornado para o estado de nascimento. A decisão em destaque será determinada por:

(1) S = 1 , Z i ' α > ϵ i 0 , Z i ' α ϵ i para i = 1 , , r + n ,

onde r é o número de retornados; n de migrantes permanentes; Zi uma matriz de variáveis que influenciam na decisão de ficar no destino; α um vetor de parâmetros (inclusive intercepto) e ɛi um termo randômico. Portanto, (Zi'αϵi) mensura o benefício líquido da decisão de permanência.

A equação de determinação de salários do tipo minceriana para um migrante selecionado aleatoriamente na população de migrantes presentes em São Paulo é dada por:

(2) Y i * = X i ' β + u i * i = 1 , , r + n ,

onde Yi* é o logaritmo do salário-hora dos migrantes; Xi é o conjunto de variáveis observáveis que determinam o processo de pagamentos de salários; β um vetor de parâmetros (inclusive intercepto) e ui* é o termo aleatório que mensura atributos produtivos não observáveis na determinação desses rendimentos.

Alguns pressupostos devem ser admitidos em relação às equações (1) e (2). Primeiro, Yi*,Si,Xi,Zi são variáveis aleatórias observadas. Segundo, devemos assumir que Xi,Zi,ui*,ϵi são variáveis aleatórias independentemente e identicamente distribuídas (i.i.d) e (Xi, Zi) são variáveis aleatórias exógenas. Terceiro, os termos randômicos ui* e ɛi podem ser correlacionados, pois características não observáveis podem influenciar tanto a decisão de permanência do migrante quanto o seu salário.

Cabe ressaltar que o salário Yi é observado apenas para os migrantes permanentes. Logo:

(3) Y i = S i Y i * i = 1 , , r + n

Desejamos obter a distribuição de salários Yi* para todos os migrantes, incluindo salários dos remigrados caso tivessem permanecido na região de destino, isto é, f (Yi*). No entanto, tal distribuição é dada por um deslocamento da função de densidade f (ui* ) pelo valor médio de salários preditos na região de destino Xi'β (Biavaschi, 2016Biavaschi, Costanza (2016): “Recovering the counterfactual wage distribution with selective return migration,” Labour Economics, 38, 59-80. [1, 3, 7, 8, 11, 12, 14, 15, 18, 19, 20, 27]). Portanto, precisamos de métodos para estimativas não tendenciosas para a função de densidade de probabilidade f (ui* ) e dos vetores de parâmetros β .

Usamos duas estratégias de identificação conforme discutido a seguir. No primeiro caso, usamos o método de identificação no infinito para a distribuição contrafatual (Chamberlain, 1986Chamberlain, Gary (1986): “Asymptotic efficiency in semi-parametric models with censoring,” Journal of Econometrics, 32, 189-218. [3, 8, 11]; Heckman, 1990--- (1990): “Varieties of selection bias,” The American Economic Review, 80, 313. [3, 8, 12, 19]) f (ui* ), uma vez que não observamos ui* para os trabalhadores remigrados. Na segunda etapa, estimamos o modelo (1) e (2) relaxando a hipótese de normalidade com especificação semi-paramétrica e distribuição conjunta modelada por funções cópulas. Também introduzimos uma restrição de exclusão, isto é, uma variável instrumental que supostamente não determina diretamente a formação de salários, mas se relaciona com a decisão de permanência na região de destino - local de nascimento do filho do migrante (Biavaschi, 2016Biavaschi, Costanza (2016): “Recovering the counterfactual wage distribution with selective return migration,” Labour Economics, 38, 59-80. [1, 3, 7, 8, 11, 12, 14, 15, 18, 19, 20, 27]).

Cabe ressaltar que a estratégia de identificação causal no infinito proposta por Heckman (1990)--- (1990): “Varieties of selection bias,” The American Economic Review, 80, 313. [3, 8, 12, 19] não requer o uso de variáveis instrumentais. Ao contrário, as próprias características do grupo de controle composto por indivíduos com elevada probabilidade de autosseleção permitem estimar uma distribuição salarial contrafactual livre de viés de seleção amostral em variáveis não observadas (Mulligan e Rubinstein, 2008Mulligan, Casey B e Yona Rubinstein (2008): “Selection, investment, and women’s relative wages over time,” The Quarterly Journal of Economics, 123, 1061-1110. [8]; Biavaschi, 2016Biavaschi, Costanza (2016): “Recovering the counterfactual wage distribution with selective return migration,” Labour Economics, 38, 59-80. [1, 3, 7, 8, 11, 12, 14, 15, 18, 19, 20, 27]). Por outro lado, conforme discutido a seguir, o modelo empírico baseado em cópulas minimiza a dependência de identificação de parâmetros com o uso de instrumentos (Marra e Radice, 2013--- (2013): “Estimation of a regression spline sample selection model,” Computational Statistics & Data Analysis, 61, 158-173. [8, 27]; Wojtys et al., 2016Wojtys, Malgorzata, Giampiero Marra, e Rosalba Radice (2016): “Copula regression spline sample selection models: the R Package SemiParSampleSel,” Journal of Statistical Software, 71. [8, 9, 10, 11, 16, 27, 34]).

3.2 Estimação dos parâmetros

O problema de seleção amostral acontece quando as observações disponíveis não provêm de uma amostra aleatória da população. Há evidências de que o grupo de migrantes brasileiros são positivamente selecionados em relação aos não migrantes (Santos Júnior et al., 2005Santos Júnior, Enestor da Rosa dos, Naércio Menezes-Filho, Pedro Cavalcanti Ferreira, et al. (2005): “Migração, seleção e diferenças regionais de renda no Brasil,” Pesquisa e Planejamento Econômico, 35. [2, 8]; Freguglia e Procópio, 2013Freguglia, Ricardo da Silva e Thais Salzer Procópio (2013): “Efeitos da mudança de emprego e da migração interestadual sobre os salários no Brasil formal: evidências a partir de dados em painel,” Pesquisa e Planejamento Econômico, 43, 255-278. [2, 8]; Gama e Machado, 2014Gama, Luiz Carlos Day e Ana Flávia Machado (2014): “Migração e rendimentos no Brasil: análise dos fatores associados no período intercensitário 2000-2010,” estudos avançados, 28, 155-174. [2, 8, 13, 15, 18]). Da mesma forma, temos que os migrantes de retorno se autosselecionam na decisão de retornar e isto deve ser considerado para que estimativas não tendenciosas do resultado no mercado de trabalho do migrante interestadual sejam produzidas (Chiswick, 1999Chiswick, Barry (1999): “Are immigrants favorably self-selected?” American Economic Review, 89, 181-185. [2, 8]; Borjas e Bratsberg, 1996Borjas, George J e Bernt Bratsberg (1996): “Who leaves? The outmigration of the foreignborn,” Rel. téc., National Bureau of Economic Research. [1, 8, 30]; Biavaschi, 2016Biavaschi, Costanza (2016): “Recovering the counterfactual wage distribution with selective return migration,” Labour Economics, 38, 59-80. [1, 3, 7, 8, 11, 12, 14, 15, 18, 19, 20, 27]).

O modelo bivariado proposto por Heckman (1979)Heckman, James (1979): “Sample selection bias as a specification error,” Econometrica: Journal of the econometric society, 153-161. [8, 9, 16, 27, 32], conhecido como Tobit-2, é um dos modelos mais utilizados em problemas de seleção amostral. Ele pode ser representado pela equação de seleção (1) e a equação de resultado potencial (2). Sua estimativa por Máxima Verossimilhança pressupõe os termos aleatórios ui* e ɛi seguem uma distribuição normal bivariada. No entanto, como essa suposição está sujeita a erros de especificação de distribuição, modelos que relaxem essa hipótese têm sido sugeridos na literatura especializada (Cameron e Trivedi, 2005Cameron, A Colin e Pravin K Trivedi (2005): , Cambridge university press. [8]; Toomet et al., 2008Toomet, Ott, Arne Henningsen, et al. (2008): “Sample selection models in R: Package sampleSelection,” Journal of statistical software, 27, 1-23. [8, 27]; Wojtys et al., 2016Wojtys, Malgorzata, Giampiero Marra, e Rosalba Radice (2016): “Copula regression spline sample selection models: the R Package SemiParSampleSel,” Journal of Statistical Software, 71. [8, 9, 10, 11, 16, 27, 34]).

O uso de funções cópulas, por exemplo, assegura flexibilidade distributiva ao relaxar a hipótese de normalidade conjunta de ui* e ɛi, e garante eficiência na estimação das equações (1) e (2). Além disso, a opção oferecida pela abordagem de cópula é útil sempre que a precisão das estimativas dos parâmetros estruturais for a prioridade, de modo que não necessariamente precisamos de uma identificação de parâmetros por meio de restrição de exclusão (Wiesenfarth e Kneib, 2010Wiesenfarth, Manuel e Thomas Kneib (2010): “Bayesian geoadditive sample selection models,” Journal of the Royal Statistical Society: Series C (Applied Statistics), 59, 381- 404. [9, 27]).

Como visto na equação (3), a variável Si controla se a variável de resultado Yi* é observada ou não. Seja Fi a função de distribuição cumulativa (FDC) conjunta de (Si,Yi*) e F1i e F2i a FDC marginal de (Si,Yi*), respectivamente. Assumimos a normalidade das distribuições marginais, a dependência entre elas, por sua vez, é modelada usando a abordagem de cópula. Logo, SiN (µ1i, 1) (modelo probit) e Yi*N (µ2i, 1), onde µ1i e µ2i são preditores lineares e σ > 0. F1i e F2i estão relacionadas à equação de seleção e de salários respectivamente. Assim, a distribuição conjunta é determinada da seguinte forma:

(4) F i S i , Y i * = C F 1 i S i , F 2 i Y i * ; θ ,

onde θ é um parâmetro de dependência e C é uma função cópula bidimensional. As famílias de cópulas implementadas neste estudo são as arquimedianas: Clayton, Frank, Ali- Mikhail-Haq (AMH), Farlie-Gumbel-Morgenstern (FGM), Gumbel e Joe, bem como as versões rotacionadas (90º, 180 º e 270º) para Clayton, Joe e Gumbel. A cópula elíptica Gaussiana juntamente com covariadas lineares ou pré-especificadas não lineares corresponde ao modelo de Heckman (1979)Heckman, James (1979): “Sample selection bias as a specification error,” Econometrica: Journal of the econometric society, 153-161. [8, 9, 16, 27, 32] usando o método de máxima verossimilhança (Wojtys et al., 2016Wojtys, Malgorzata, Giampiero Marra, e Rosalba Radice (2016): “Copula regression spline sample selection models: the R Package SemiParSampleSel,” Journal of Statistical Software, 71. [8, 9, 10, 11, 16, 27, 34]). Mais detalhes sobre as características das famílias selecionadas encontram-se na Tabela A.2 do apêndice, que contém as equações e os intervalos do parâmetro de dependência para cada família de cópula.

Para as cópulas normais, Frank, FGM e AMH o teste para viés de seleção de amostra pode ser baseado no parâmetro de dependência θ , pois a ausência de viés de seleção de amostra é equivalente à condição θ = 0 e θ = 1 para a cópula de Gumbel. As cópulas Clayton, Joe e Gumbel não têm uma interpretação direta de θ . Nesses casos a estatística de Kendall, que apresenta uma relação matemática com θ , pode facilitar a interpretação e comparação do grau de dependência obtido por diferentes cópulas1. Esse parâmetro geralmente situa-se no intervalo [-1, 1], e indica independência entre variáveis aleatórias modeladas na cópula. Quanto mais próximo τ estiver de -1, mais forte será a associação negativa, valores mais próximos de 1 indicam forte dependência positiva (Brechmann e Schepsmeier, 2013Brechmann, E e Ulf Schepsmeier (2013): “Cdvine: Modeling dependence with c-and dvine copulas in r,” Journal of Statistical Software, 52, 1-27. [9]; Marra e Wyszynski, 2016Marra, Giampiero e Karol Wyszynski (2016): “Semi-parametric copula sample selection models for count responses,” Computational Statistics & Data Analysis, 104, 110-129. [9, 10]).

Outra vantagem das cópulas é que elas permitem uma especificação de modelo por partes, isto é, as distribuições marginais não são limitadas a pertencer à mesma família da distribuição de cópula bivariada escolhida. Utilizar uma versão rotacionada, disponível para Clayton, Joe e Gumbel, é útil quando a cobertura da cópula não é completa. A dependência negativa entre as equações só pode ser capturada pelas versões rotacionadas a 90º e 270º (Marra e Wyszynski, 2016Marra, Giampiero e Karol Wyszynski (2016): “Semi-parametric copula sample selection models for count responses,” Computational Statistics & Data Analysis, 104, 110-129. [9, 10]). Quando rotacionadas a 180º obtêm - se as cópulas de sobrevivência (Brechmann e Schepsmeier, 2013Brechmann, E e Ulf Schepsmeier (2013): “Cdvine: Modeling dependence with c-and dvine copulas in r,” Journal of Statistical Software, 52, 1-27. [9]).

Com a função cópula incorporada à estimação dos parâmetros das equações (1) e (2) temos que a equação log-verossimilhança a ser maximizada será a seguinte (Wojtys et al., 2016Wojtys, Malgorzata, Giampiero Marra, e Rosalba Radice (2016): “Copula regression spline sample selection models: the R Package SemiParSampleSel,” Journal of Statistical Software, 71. [8, 9, 10, 11, 16, 27, 34]):

(5) l = i = 1 n 1 S i log F 1 i 0 + S i log f 2 i Y i * Y F i 0 , Y * Y * Y i * .

Essa função é uma soma de dois conjuntos disjuntos da amostra: um para aqueles valores não observados do salários, ou seja, que representam os migrantes retornados, e outro para as demais observações. Utilizando (4), temos:

(6) l = i = 1 n 1 S i log F 1 i 0 + S i log f 2 i Y i * 1 z i ,

onde zi=vCF1i0,v;θvF2iYi* e F1i e F2i são funções de distribuição cumulativas marginais2 de (Si,Yi*), respectivamente.

Em muitos estudos variáveis contínuas como idade e anos de estudo podem guardar uma relação não linear com as variáveis de interesse, já que envolvem questões como produtividade e ciclo de vida. Nesse casos, a relação é feita de forma pré-especificada o que não garante que a complexidade dessa relação seja devidamente capturada e entendida. Dessa forma, o modelo bivariado de seleção amostra com cópula pode flexibilizar a modelagem de covariadas contínuas utilizando funções suaves que são representadas por splines3 de regressão (Marra e Radice, 2010Marra, Giampiero e Rosalba Radice (2010): “Penalised regression splines: theory and application to medical research,” Statistical Methods in Medical Research, 19, 107-125. [10]; Marra e Wyszynski, 2016Marra, Giampiero e Karol Wyszynski (2016): “Semi-parametric copula sample selection models for count responses,” Computational Statistics & Data Analysis, 104, 110-129. [9, 10]; Wojtys et al., 2016Wojtys, Malgorzata, Giampiero Marra, e Rosalba Radice (2016): “Copula regression spline sample selection models: the R Package SemiParSampleSel,” Journal of Statistical Software, 71. [8, 9, 10, 11, 16, 27, 34]). Portanto, as matrizes dos modelos de seleção e salários podem ser construídas como a soma de componentes paramétricos (intercepto, dummies e variáveis categóricas) e funções suaves desconhecidas das covariáveis contínuas K1,2. Logo, as equações (1) e (2), na abordagem semiparamétrica, podem ser reescritas da seguinte forma:

(7) S = 1 , Z i ' α + k 1 = 1 K 1 s 1 k 1 z 1 k 1 i > ϵ i 0 , Z i ' α + k 1 = 1 K 1 s 1 k 1 z 1 k 1 i ϵ i for i = 1 , , r + n ,
(8) Y i * = X i ' β + k 2 = 1 K 2 s 2 k 2 z 2 k 2 i + u i * i = 1 , , r + n ,

onde s1k1 e s2k2 são os termos suavizados desconhecidos dos regressores contínuos das equações de seleção e salário, respectivamente. Tanto a abordagem totalmente paramétrica quando esta abordagem são discutidas neste estudo.

A definição da cópula utilizada é feita através de testes que consistem em estimar vários modelos e selecionar aquele com melhor critério de informação. Utiliza-se o critério de penalização por parcimônia Bayesiano Akaike ou Schwarz (AIC e BIC, respectivamente), o que permite identificar a cópula e o modelo que melhor se ajusta aos dados (Wojtys et al., 2016Wojtys, Malgorzata, Giampiero Marra, e Rosalba Radice (2016): “Copula regression spline sample selection models: the R Package SemiParSampleSel,” Journal of Statistical Software, 71. [8, 9, 10, 11, 16, 27, 34])4.

3.3 Estimação de densidade contrafatual

A estratégia de recuperação da densidade contrafatual de salários f (Yi*), isto é, da densidade salarial dos migrantes caso não houvesse migração de retorno, foi dividida em duas etapas. Na primeira foi recuperada a distribuição das características não observáveis, isto é, f (ui∗). Nesse ponto apenas as características produtivas não mensuráveis são levadas em conta. Note que não é possível recuperar essa distribuição diretamente da equação de salários (2), tendo em vista que os resíduos ui∗ apenas poderiam ser calculados para os trabalhadores que decidiram permanecer em São Paulo. Logo, não podemos determinar, a partir dos dados, o componente não observável da equação de salários ao incluir remigrados na amostra (“devolvê-los para São Paulo”). Para superar essa dificuldade utilizamos a técnica proposta por Biavaschi (2016)Biavaschi, Costanza (2016): “Recovering the counterfactual wage distribution with selective return migration,” Labour Economics, 38, 59-80. [1, 3, 7, 8, 11, 12, 14, 15, 18, 19, 20, 27].

Considerando que a distribuição f (ui∗) pode ser escrita a partir do pressuposto da Lei da Probabilidade Total como a soma ponderada da distribuição dos termos de erro nas subamostras de permanentes e retornados cujos pesos são dados pela probabilidade de estar em qualquer subamostra, temos que:

(9) f u i * | Z i ' α = f u i * | S i = 1 , Z i ' α Pr S i = 1 | Z i ' α + f u i * | S i = 0 , Z i ' α Pr S i = 0 | Z i ' α

Como explicado, o componente não observável fui*|Si=0),Zi'α dessa soma é desconhecido. No entanto, se a probabilidade de ficar em São Paulo PrSi=1|Zi'α, condicionada às variáveis que influenciam essa decisão, for próxima de 1, então: fui*|Zi'α=fui*fui*|S=1,Zi'α=fui*|Si=15, então o viés desaparece e a distribuição contrafatual de fatores não observáveis pode ser estimada diretamente nessa subamostra na qual quase todos os indivíduos são permanentes. A intuição por trás dessa estratégia é que a seleção desaparece no limite para aqueles indivíduos no conjunto de alta probabilidade (Chamberlain, 1986Chamberlain, Gary (1986): “Asymptotic efficiency in semi-parametric models with censoring,” Journal of Econometrics, 32, 189-218. [3, 8, 11]). Devemos adicionar dois pressupostos básicos para que essa técnica garanta uma estimativa consistente da quantidade de interesse, são eles: o conjunto de características que seleciona a amostra (Z) deve conter variáveis exógenas e as observações precisam ser i.i.d.

Essa estratégia é conhecida como identificação no infinito e tem sido utilizada na literatura para estimar o termo constante em modelos de seleção semiparamétrica 6. O trabalho de Biavaschi (2016)Biavaschi, Costanza (2016): “Recovering the counterfactual wage distribution with selective return migration,” Labour Economics, 38, 59-80. [1, 3, 7, 8, 11, 12, 14, 15, 18, 19, 20, 27] foi o primeiro a aplicar essa estratégia para recuperação de distribuição contrafatual com objetivo de considerar a seleção em características não observáveis em uma densidade contrafatual. O presente estudo buscou aplicar essa estratégia na estimativa da distribuição das características não observáveis baseandose em uma subamostra selecionada nas características observadas (Z), na qual quase todos os indivíduos permanecem no estado de São Paulo.

Seja Hi o indicador se a observação faz parte do conjunto de alta probabilidade e seja Hi=1PrSi=1|Zi'α^>p¯n], o estimador proposto para f (ui∗) será:

(10) f u i * ^ = i = 1 n 1 h K u u i * h S i H i i = 1 n S i H i ,

onde K(·) é um estimador de densidade de Kernel da variável aleatória ui∗ para um conjunto de observações cuja probabilidade de estar na amostra selecionada é próxima de 1 e h é o parâmetro bandwidth ou largura dos intervalos de classe. Seguindo DiNardo et al. (1995)DiNardo, John, Nicole M Fortin, e Thomas Lemieux (1995): “Labor market institutions and the distribution of wages, 1973-1992: A semiparametric approach,” Rel. téc., National bureau of economic research. [3, 12, 21], Chiquiar e Hanson (2005)Chiquiar, Daniel e Gordon H Hanson (2005): “International migration, self-selection, and the distribution of wages: Evidence from Mexico and the United States,” Journal of political Economy, 113, 239-281. [3, 12] e Biavaschi (2016)Biavaschi, Costanza (2016): “Recovering the counterfactual wage distribution with selective return migration,” Labour Economics, 38, 59-80. [1, 3, 7, 8, 11, 12, 14, 15, 18, 19, 20, 27] será utilizado o Kernel gaussiano com parâmetro de suavização ótimo dado por h=1,06σ^N1/5 (Silverman, 2018Silverman, Bernard W (2018): Density estimation for statistics and data analysis, Routledge. [12]), onde σˆ é o desvio-padrão da distribuição gaussiana, N o total de observações e p¯n é o valor que define o percentil que limita os indivíduos no grupo de alta probabilidade. Seguindo Biavaschi (2016)Biavaschi, Costanza (2016): “Recovering the counterfactual wage distribution with selective return migration,” Labour Economics, 38, 59-80. [1, 3, 7, 8, 11, 12, 14, 15, 18, 19, 20, 27], esse limite será o percentil 95º calculado a partir da predição de probabilidade pela equação de seleção (1).

Cabe observar que para determinar Hi precisamos antes da estimativa consistente de α^ para determinar as observações com alta probabilidade de permanência por meio da predição PrSi=1|Zi'α^ com a equação (2).

A segunda etapa da estimação contrafatual da densidade de salários dos migrantes consistiu em recupe(rar a distribuição completa dos salários somando a f (ui∗) pela média do valor predito Xi'β^. Em outras palavras, os salários previstos reais e contrafactuais que foram calculados como o produto do retorno sobre as habilidades incluídas na equação de salários e as características dos migrantes permanentes (população total migrante) para distribuição real (contrafatual) prevista dos salário, isto é, β^Xj, onde j = apenas permanentes (população total migrante - devolvendo os remigrados para São Paulo). Nesse ponto são levadas em conta tanto caraterísticas não observáveis quanto as observáveis na análise das diferenças entre retornados e permanentes. Essa separação é útil para identificar em que tipo de características se concentram as diferenças entre os migrantes.

3.4 Base de Dados e Tratamento

Neste estudo foram utilizados os microdados do Censo Demográfico 2010. Essa base de dados permite identificar as diferentes categorias de migrantes a partir do cruzamento dos dados sobre lugar de residência, lugar de nascimento, lugar de última residência e duração de residência.

A amostra selecionada para a análise empírica é composta de homens com idade entre 18 e 70 anos que estavam empregados no momento do recenseamento. Em relação à posição do domicilio foram incluídos na amostra os chefes de domicílio e cônjuges7 que não estivessem frequentando algum curso, essa estratégia foi aplicada afim de excluir migrantes agregados. Também foram excluídos da análise os indivíduos que não declaram cor e que não responderam o questionário referente à migração, além dos funcionários públicos, militares, sem remuneração e empregadores, essa exclusão foi feita de modo que a análise esteja voltada para decisões de migração e mercado de trabalho (Gama e Machado, 2014Gama, Luiz Carlos Day e Ana Flávia Machado (2014): “Migração e rendimentos no Brasil: análise dos fatores associados no período intercensitário 2000-2010,” estudos avançados, 28, 155-174. [2, 8, 13, 15, 18]; Lima et al., 2015Lima, Ana Carolina da Cruz, Rodrigo Simões, e Ana Maria Hermeto (2015): “Privação relativa e deslocamentos da mão de obra no Brasil entre 1980 e 2010: evolução das interações entre pobreza, desigualdade de renda e migração,” Pesquisa e Planejamento Econômico, 45, 7-36. [13]).

Após os cortes mencionados a amostra final totalizou 28.049 migrantes interestaduais, sendo deste total 24.175 (86,18%) migrantes que ficaram no estado de São Paulo e 3.874 (13,81%) migrantes retornados.

Define-se migrante de retorno aquele que morava, na data do recenseamento, em seu estado de naturalidade, tendo declarado residência anterior no estado de São Paulo. O migrante não retornado é definido como aquele que, na data da entrevista, declarou residir fora de seu estado de naturalidade (residência em São Paulo). Existem dois critérios para definir a condição migratória: última etapa e data fixa (curto prazo). No critério de data fixa o indivíduo é questionado sobre o local de residência há cinco anos da entrevista. Com o objetivo de captar um fluxo de retornados em maior espaço de tempo foi utilizado o critério última etapa combinado ao quesito lugar de nascimento para identificação dos migrantes.

O modelo de seleção foi construído a partir de quatro grupos de variáveis. O primeiro grupo refere-se às características pessoais do indivíduo como idade, raça, posição e nível de instrução. O segundo grupo diz respeito aos vínculos familiares como: posição no domicílio (chefe), chefe de família casado, e chefe casado com cônjuge nascido em SP, chefe com filho menor de 14 anos e número de pessoas no domicílio, como essas variáveis estão relacionadas aos custos de migração e vínculos à pessoas no destino elas devem funcionar bem como preditores da decisão de permanecer. Outro grupo de covariadas utilizado é o relacionado às variáveis de residência, como setor do domicílio e região de origem do migrante8.

A variável filho nascido no destino, isto é, no estado de São Paulo, foi incluída como restrição de exclusão, e deve ser incluída na equação de seleção e excluída da equação de salários. É esperado que ter um filho nascido em São Paulo seja um forte indutor da decisão de permanência já que se trata de proxy para vínculo social no destino e perspectivas de investimento em capital humano, o que aumenta o custo de oportunidade da migração de retorno. Existem diversas evidências na literatura especializada de que os vínculos familiares são decisivos no campo da migração. Mincer (1978)Mincer, Jacob (1978): “Family migration decisions,” Journal of political Economy, 86, 749-773. [14, 15] considerou os laços familiares como importantes para decisões de migração. O tamanho da família é importante porque o retorno da migração aumenta menos que os custos com a presença de filhos e cônjuges. Dustmann (2003)Dustmann, Christian (2003): “Children and return migration,” Journal of population economics, 16, 815-830. [14], por exemplo, apresenta evidências de que as preocupações de pais altruístas sobre a criança podem levar a um aumento ou a uma diminuição na tendência de voltar ao local de origem dependendo da percepção deles em relação ao bem-estar e ganhos econômicos futuros dos filhos no destino. Nesse ponto é importante destacar que o local de destino objeto deste estudo (São Paulo) está entre os primeiros em qualidade na educação básica segundo os resultados do IDEB (Índice de Desenvolvimento da Educação Básica), aumentando o retorno futuro do investimento em capital humano da criança 9.

Desse modo, quando o migrante inicia uma nova família ou altera a composição familiar na região de destino são criados novos vínculos e perspectivas para escolhas futuras. Preocupações dos pais no tocante à qualidade de vida, oferta e qualidade de serviços educacionais, saúde, lazer e cultura podem reduzir a chance dessa família retornar para uma região onde tais características são precárias. Portanto, uma vez controlada a composição familiar (cônjuge, outros filhos), o nascimento de um filho na região de destino é um evento que pode induzir novos vínculos sociais e parâmetros para escolhas futuras, o que pode se correlacionar com a decisão de permanência.10

Por outro lado, conforme defendido por Biavaschi (2016)Biavaschi, Costanza (2016): “Recovering the counterfactual wage distribution with selective return migration,” Labour Economics, 38, 59-80. [1, 3, 7, 8, 11, 12, 14, 15, 18, 19, 20, 27], não é provável que existam canais que liguem o local de nascimento do filho ao salário do chefe de família do sexo masculino, uma vez que mulheres tendem a sacrificar mais horas de trabalho para os cuidados dos filhos. Portanto, ao usar uma amostra só de migrantes homens, o nascimento de um filho no local destino pode não ter influência sobre a produtividade do trabalho do migrante, mitigando a endogeneidade da variável instrumental 11.

O modelo de salários12 também foi construído a partir dessas variáveis educacionais, socioeconômicas e de estrutura familiar (exceto pela restrição de exclusão), incluindo a variável possuir esposa nascida no destino, pois essa variável deve capturar os efeitos das redes de sociais (Biavaschi, 2016Biavaschi, Costanza (2016): “Recovering the counterfactual wage distribution with selective return migration,” Labour Economics, 38, 59-80. [1, 3, 7, 8, 11, 12, 14, 15, 18, 19, 20, 27]). A Tabela A.1 do apêndice contém um resumo das variáveis disponíveis na base de dados relacionadas à migração, às condições socioeconômicas e educacionais que foram utilizadas utilizadas nas regressões. Vale ressaltar que esse conjunto de variáveis está de acordo com a literatura nacional e internacional especializada conforme a disponibilidade do Censo Demográfico de 2010 (Mincer, 1978Mincer, Jacob (1978): “Family migration decisions,” Journal of political Economy, 86, 749-773. [14, 15]; Santos e Ferreira, 2007Santos, Cézar Augusto Ramos e Pedro Cavalcanti Ferreira (2007): “Migração e distribuição regional de renda no Brasil,” Pesquisa e Planejamento Econômico, 37. [3, 15, 16]; Ramalho e Queiroz, 2011Ramalho, Hilton Martins de Brito e Vívian dos Santos Queiroz (2011): “Migração interestadual de retorno e autosseleção: evidências para o Brasil,” Pesquisa e Planejamento Econômico, 41. [2, 15, 16]; Justo e Ferreira, 2012Justo, Wellington Ribeiro e R de A Ferreira (2012): “Migração interestadual no Brasil: perfil do retornado: evidências para o período de 1998-2008,” XVIII Encontro Nacional de Estudos Populacionais. [15]; Gama e Machado, 2014Gama, Luiz Carlos Day e Ana Flávia Machado (2014): “Migração e rendimentos no Brasil: análise dos fatores associados no período intercensitário 2000-2010,” estudos avançados, 28, 155-174. [2, 8, 13, 15, 18]; Biavaschi, 2016Biavaschi, Costanza (2016): “Recovering the counterfactual wage distribution with selective return migration,” Labour Economics, 38, 59-80. [1, 3, 7, 8, 11, 12, 14, 15, 18, 19, 20, 27]).

A Tabela 3 contém as estatísticas descritivas das características socioeconômicas e demográficas amostra de trabalhadores selecionados de migrantes permanentes, retornados e dos não migrantes naturais do estado de São Paulo. Há importantes diferenças entre esses grupos que merecem destaque. Primeiro, os migrantes permanentes são, em média, mais jovens e menos escolarizados que os migrantes retornados, fato que pode indicar uma seleção positiva dos migrantes de retorno. Em relação aos não migrantes, tanto migrantes retornados quanto permanentes são, em média, mais jovens e menos escolarizados.

Tabela 3
Médias das características socioeconômicas e demográficas observáveis de migrantes e não migrantes (amostra)

As variáveis demográficas indicam que para permanentes e retornados há grande predominância da origem no Nordeste, principalmente para o grupo de permanentes. Diversos trabalhos já destacaram não só a preferência dos nordestinos pelo destino São Paulo, mas também que há um crescente movimento de retorno para essa região (Sachsida et al., 2009Sachsida, Adolfo, Paulo Furtado de Castro, Mario Jorge Cardoso de Mendonça, e Pedro H Albuquerque (2009): “Perfil do migrante brasileiro,” Rel. téc., Texto para Discussão, Instituto de Pesquisa Econômica Aplicada (IPEA). [16]; Santos e Ferreira, 2007Santos, Cézar Augusto Ramos e Pedro Cavalcanti Ferreira (2007): “Migração e distribuição regional de renda no Brasil,” Pesquisa e Planejamento Econômico, 37. [3, 15, 16]; Ramalho e Queiroz, 2011Ramalho, Hilton Martins de Brito e Vívian dos Santos Queiroz (2011): “Migração interestadual de retorno e autosseleção: evidências para o Brasil,” Pesquisa e Planejamento Econômico, 41. [2, 15, 16]; Oliveira et al., 2011Oliveira, ATR de, Leila Regina Ervatti, e MMVC O’Neill (2011): “O panorama dos deslocamentos populacionais no Brasil: PNADs e Censos Demográficos,” Reflexões sobre os deslocamentos populacionais no Brasil, 1. [3, 16]; Ramalho et al., 2016Ramalho, Hilton Martins de Brito, Erik Figueiredo, e José Luis da Netto Júnior (2016): “Determinantes das migrações interestaduais no Brasil: evidências a partir de um modelo gravitacional,” Pesquisa e Planejamento Econômico, 46. [3, 4, 16]).

4. Resultados

4.1 Determinantes da decisão de remigrar e salários

Uma série de especificações empíricas para o modelo de determinação conjunta da decisão de remigração e salários (equações (1) e (2)) foram previamente estimados considerando vários tipos de cópulas, covariadas e formas paramétricas e semiparamétricas. A Tabela A.3 do Apêndice contém os valores do critério de informação AIC13. Os resultados sugerem que a cópula Joe14 com rotação 180º se ajusta melhor aos dados em todas as especificações. O modelo mais completo, contendo variáveis referentes às características pessoais, familiares, trabalho e residência obteve o menor valor de referência. A especificação semiparamétrica não favorece uma cópula diferente dos outros modelos, mas apresenta menor valor AIC em relação à especificação totalmente paramétrica. O parâmetro de dependência das distribuições marginais de (1) e (2) registra valor θ = 2,44, estatisticamente diferente de zero, cujo parâmetro τ de Kendall é 0,439, sugerindo que fatores não observados que afetam a decisão de permanência também afetam os salários positivamente.

Os resultados da Tabela 4 referem-se ao modelo de seleção amostral bivariado semiparamétrico baseado na cópula Joe 180º. Em se tratando da restrição de exclusão: trabalhador que reside com filho nascido em São Paulo, expectativa teórica é que tal variável tenha uma relação importante na predição da decisão de permanência do indivíduo, pois se trata de um forte vínculo familiar no destino. Segundo os resultados do modelo de seleção essa variável é significativa a 1% e indica que ter um filho nascido em São Paulo pode aumentar a probabilidade de o trabalhador migrante permanecer no estado em relação a ter um filho migrante. Ter cônjuge nascido em São Paulo também deve aumentar essa probabilidade, evidenciando o papel dos laços familiares formados no destino.

Tabela 4
Estimativas das equações de seleção e salários

As variáveis refentes ao nível de instrução indicam uma relação inversa com a decisão do trabalhador não remigrar. Comparados àqueles sem instrução (categoria omitida), indivíduos com nível médio e superior tem menos chances de permanecer. A grande predominância de indivíduos sem instrução na amostra (55,46%) pode indicar que esse resultado está relacionado à frustração das expectativas de salários de migrantes com alto nível de instrução. Ao se deparar com um mercado de trabalho acirrado e seletivo esse grupo pode sofrer frustração em relação às suas expectativas de pagamento do capital humano, facilitando o retorno de trabalhadores mais instruídos. Já os trabalhadores sem instrução podem acessar uma maior oferta de empregos de baixa qualidade. Essa suposição é consistente com Ambrosini et al. (2010)Ambrosini, J William, Karin Mayr, Giovanni Peri, e Dragos Radu (2010): The selection of migrants and returnees: Evidence from Romania and implications, World Bank. [2, 18], onde defende-se que as decisões de migração e retorno estão relacionadas ao prêmio salarial oferecido para uma classe específica de habilidades na origem e no destino.

Migrantes com origem no Norte e Nordeste apresentam maior propensão de permanecer em São Paulo. Migrantes nascidos na região Sul ou no Centro-Oste, por sua vez, têm mais chances de retornar. Apesar de um movimento mais intenso de retorno para o Nordeste, a migração ainda é fortemente relacionada aos níveis de pobreza e desigualdade de renda nas regiões tradicionalmente emissoras, sendo esse um fator de expulsão populacional (Gama e Machado, 2014Gama, Luiz Carlos Day e Ana Flávia Machado (2014): “Migração e rendimentos no Brasil: análise dos fatores associados no período intercensitário 2000-2010,” estudos avançados, 28, 155-174. [2, 8, 13, 15, 18]). Paralelamente, a dinâmica migratória brasileira sofreu significativas mudanças, a região Centro-Oeste passou a ser uma região de grande absorção e retenção de migrantes, e São Paulo passou a apresentar perdas migratórias para essa região e para o Sul do país (Baeninger, 2016Baeninger, Rosana (2016): “Rotatividade migratória: um novo olhar para as migrações internas no Brasil,” REMHU: Revista Interdisciplinar da Mobilidade Humana, 20, 77-100. [18]).

Em relação à equação de salários: o logaritmo do salário-hora responde positivamente ao nível de instrução. Quanto maior esse nível, maiores os coeficientes da equação de salários. Note-se ainda que a variável referente à raça aponta para discriminação no mercado de trabalho, com uma diferença desfavorável aos não brancos de 1,91%. Em termos de vínculos familiares temos que, um chefe de família cujo cônjuge é natural de SP aufere salários maiores em relação a um chefe de família solteiro. Esse fato pode estar relacionado às redes sociais construídas no destino (Biavaschi, 2016Biavaschi, Costanza (2016): “Recovering the counterfactual wage distribution with selective return migration,” Labour Economics, 38, 59-80. [1, 3, 7, 8, 11, 12, 14, 15, 18, 19, 20, 27]).

Residir em área urbana aumenta os rendimentos em 10,56%. Com relação à origem do migrante foram significativas as variáveis de nascimento no Nordeste e Centro- Oeste. Migrantes com origem no Nordeste (Centro-Oeste) auferem salários inferiores (superiores) em relação aos de origem Sudeste. Esse resultado pode ser explicado em termos de atributos educacionais tendo em vista a concentração de migrantes nordestinos com níveis de escolaridade mais baixos. Como visto na Tabela 2, 69,5% dos migrantes sem instrução são oriundos dos estados do Nordeste, enquanto o Centro-Oeste se destaca nos níveis mais elevados de instrução.

A Figura 2 registra os resultados não paramétricos das equações de seleção e salários para o modelo cópula selecionado. Os resultados para variável idade são consistentes com a suposição de tanto rendimentos quando a probabilidade de permanência respondem não linearmente à medida que as pessoas envelhecem. A estimativa suavizada da equação seleção indica que a probabilidade de permanecer no destino tende a diminuir à proporção que a idade aumenta, até por volta dos 40 anos, quando há uma ligeira mudança para uma tendência positiva até por volta dos 50 anos, voltando a diminuir. O resultado não paramétrico para os salários sugere que o salário aumenta com a idade até por volta dos 30 anos, se tornando quase constante dos 30 aos 40 anos e declinando após essa faixa até o os 60 anos. A partir desse ponto a relação é crescente. Os intervalos do resultado suavizado para o número de pessoas no domicílio (numpessoasdom) na equação de seleção e salários contêm linha zero para a maior parte da faixa de valores da covariável, indicando que esse pode ser um preditor fraco da permanência e dos rendimentos.

Figura 2
Resultados das estimativas não paramétricas das equações de seleção e salários. Estimativas das funções suaves do modelo bivariado cópula Joe 180º. Intervalos de confiança a 95%. O "tapete"na parte inferior dos gráficos representa os valores das covariadas. Os números mostrados no eixo y em cada gráfico indicam os graus estimados de liberdade das curvas suaves. P-valores para os termos idade e número de pessoas no domicílio da equação de seleção (a): 0,000, 0,000, respectivamente; equação de salários (b): 0,000, 0,003. Fonte: Elaboração própria a partir dos dados do Censo Demográfico de 2010.

5. Perfil do Grupo de Controle

Este estudo usa a estratégia de identificação no infinito para recuperar a distribuição de salários contrafatual em características não observadas, isto é, a distribuição que vigoraria caso não houvesse migração de retorno (Heckman, 1990--- (1990): “Varieties of selection bias,” The American Economic Review, 80, 313. [3, 8, 12, 19]; Andrews e Schafgans, 1998Andrews, Donald WK e Marcia MA Schafgans (1998): “Semiparametric estimation of the intercept of a sample selection model,” The Review of Economic Studies, 65, 497-517. [12, 19]; Biavaschi, 2016Biavaschi, Costanza (2016): “Recovering the counterfactual wage distribution with selective return migration,” Labour Economics, 38, 59-80. [1, 3, 7, 8, 11, 12, 14, 15, 18, 19, 20, 27]). Conforme discutido nas equações (9) e (10), essa distribuição pode ser estimada livre de viés de seleção amostral usando um grupo de controle formado por migrantes com Alta Probabilidade de Permanência (GAP) na região de destino. A Tabela 5 contém as médias das características observáveis para os indivíduos do GAP, isto é, aqueles trabalhadores migrantes cuja probabilidade predita de permanência em São Paulo se encontra acima do percentil 95º (vide equação (1) e Tabela 4). Os dados permitem identificar as características que compõem o perfil desses trabalhadores.

Tabela 5
Características médias dos migrantes do GAP versus demais migrantes

O primeiro ponto importante a ser destacado é a grande concentração de indivíduos no GAP cuja origem é a região Nordeste. Ou seja, 96,79% daqueles migrantes com alta probabilidade de permanência são oriundos dessa região. Esses indivíduos também apresentam nível de instrução baixo, com maior proporção de indivíduos na categoria sem instrução, 69,14%, nenhum migrante com nível superior ou pós graduação foi identificado, nessa amostra, como pertencente ao conjunto. Eles ainda são mais jovens em relação àqueles migrantes fora do grupo de controle, com uma diferença de idade de ≈ 10 anos. Os vínculos familiares também se destacam nas diferenças entre esses grupos. Os indivíduos no GAP são, em média, mais propensos a ter um cônjuge nascido em São Paulo, em relação aos outros. Em contrapartida, são, na maioria, chefes de família solteiros e sem filhos.

Conforme colocado na Seção 3.3, calculamos os resíduos da equação de salários (vide Tabela 4) para grupo de controle (GAP) e usamos o estimador de núcleo Kernel (vide (10)) para estimar a distribuição contrafatual de salários em características não observadas. Em seguida, conforme Biavaschi (2016)Biavaschi, Costanza (2016): “Recovering the counterfactual wage distribution with selective return migration,” Labour Economics, 38, 59-80. [1, 3, 7, 8, 11, 12, 14, 15, 18, 19, 20, 27], modificamos tal densidade pela média da distribuição de salários previstos para toda população migrante, o que corresponde à estimativa completa da distribuição dos salários dos migrantes interestaduais de São Paulo caso não houvesse migração de retorno. A seção seguinte relata as densidades dessas distribuições em ambos os cenários.

6. Efeitos da migração de retorno sobre os salários dos imigrantes

A Tabela 6 resume a comportamento das densidades de salários por horas de trabalho estimadas para os migrantes conforme as métricas de decis, médias e diferenças de percentis (valores em logaritmo). A coluna (1) - fatual - foi obtida a partir da amostra de migrantes permanentes (residentes em São Paulo) com a aplicação do estimador de densidade Kernel. Sua primeira parte corresponde à densidade de salários-hora preditos em características observadas fX'β^. A segunda resulta da estimativa de densidade sobre a distribuição dos resíduos fYiX'β^, que corresponde aos fatores não observáveis. Na terceira parte, tem-se a estimativa de densidade de salários totais, isto é, considerando a distribuição dos resíduos e o deslocamento pelos salários médios previstos. A coluna (2) - contrafatual - foi calculada no cenário em que não há migração de retorno. Assim, no primeiro painel foi utilizada a amostra completa de migrantes interestaduais caso todos tivessem permanecido (salários previstos devolvendo os retornados para São Paulo) para recuperação da distribuição em variáveis observadas. No segundo painel, os valores foram obtidos a partir do cálculo de resíduos de salários para grupo de alta probabilidade de permanência (grupo de controle), como visto na Seção 3. Já o terceiro painel refere-se aos salários totais, considerando a distribuição dos resíduos e o deslocamento pelos salários médios previstos. Em outras palavras, essa distribuição corresponde à soma das características observáveis médias Y^i com o componente não observado ui^ da população migrante em cada decil.

Tabela 6
Decis das distribuições de salários dos migrantes com e sem migração de retorno

Em termos de características observáveis os migrantes interestaduais em São Paulo estariam, em média, ganhando mais caso não houvesse migração de retorno. Note-se que, na Tabela 6 a diferença logarítmica ao longo dos decis é quase sempre positiva, exceto pelos primeiros decis daqueles indivíduos na parte inferior da distribuição, para esses indivíduos há evidências de seleção negativa em observáveis. No cenário contrafatual, considerando apenas diferenças observáveis, a população migrante estaria recebendo 0,29% a mais, em média, e 0,14% na mediana.

O último painel da Tabela 6 mostra os decis da distribuição total de salários-hora. É possível ver que há uma influência mais evidente das características não observadas no efeito da migração de retorno para os decis extremos. Quando reintroduzidos no mercado de trabalho paulista, os retornados acabam aumentando o salario médio da população migrante em quase toda distribuição. Quando não consideramos características inatas, somente a parte média e superior da distribuição mostram melhora. As características não observáveis acabam melhorando o desempenho da cauda inferior e piorando parte da causa superior, sugerindo que aqueles com rendimentos mais baixos se diferem dos demais em termos de caraterísticas como: ambição, empreendedorismo, agressividade, propensão ao risco, motivação e etc. Destarte, a parcela de migrantes na parte inferior da distribuição estaria ganhando mais caso não houvesse migração de retorno. Ademais, a população total migrante estaria ganhando 1,76% a mais na média e 2,42% na mediana, devido à diferenças não observáveis entre migrantes permanentes e retornados.

As diferenças entre os grupos de migrantes permanentes e migrantes retornados mudam com a introdução de uma análise baseada em características não mensuráveis. Apesar do grupo de trabalhadores de baixa qualificação ser menos favorecido no mercado de trabalho, suas habilidades não mensuráveis parecem compensar essa falha. O que não ocorre para parte do grupo com habilidades observáveis superiores.

As Figuras 3 e 4 descrevem os resultados das distribuições de salários reais (linha sólida) e contrafatuais (linha pontilhada) graficamente. As diferenças estatisticamente não nulas entre essas linhas representam os efeitos da migração de retorno sobre a densidade dos salários dos imigrantes (DiNardo et al., 1995DiNardo, John, Nicole M Fortin, e Thomas Lemieux (1995): “Labor market institutions and the distribution of wages, 1973-1992: A semiparametric approach,” Rel. téc., National bureau of economic research. [3, 12, 21]; De Coulon e Piracha, 2005De Coulon, Augustin e Matloob Piracha (2005): “Self-selection and the performance of return migrants: the source country perspective,” Journal of Population Economics, 18, 779-807. [21]).

Figura 3
Densidade real e contrafatual do salário-hora para migrantes e paulistas - observáveis. Fonte: Elaboração própria a partir dos dados do Censo Demográfico de 2010. Nota 1: A distribuição real representa a distribuição dos salários dos trabalhadores migrantes em São Paulo, considerando apenas as características observáveis. A distribuição contrafatual representa a distribuição dos salários caso todos os migrantes tivessem permanecido em SP, isto é, da população total migrante. Nota 2: Um teste K-S rejeitou a hipótese nula de que as distribuições sejam iguais, a 1% de significância: estatística D = 0.022 e p-valor = 0,0000. Nota 3: As predições de salários foram baseadas nos parâmetros estimados para o modelo bivariado do tipo cópula Joe rotacionada a 180º.

Figura 4
Densidade reais e contrafatuais do salário-hora total para migrantes. Nota 1 : (a) A distribuição real corresponde à distribuição dos salários totais (características observáveis e não observáveis) dos migrantes permanentes (residentes em SP), o contrafatual corresponde a distribuição dos salários totais dos migrantes interestaduais caso não houvesse migração de retorno, i.é, caso todos perecessem no destino. Nota 2: (b) Intervalo de confiança representado pelas linhas pontilhadas, supondo um nível de 95% de confiança.A estimação dos erros-padrão foi feita usando a técnica de reamostragem bootstrap. Nota 3: O teste Kolmogorov - Smirnov rejeitou-se a hipótese nula de que as densidades reais e contrafatuais sejam iguais, ao nível de 1% de significância: estatística D = 0.08 e p-valor = 0,0000 Nota 4: As predições de salários foram baseadas nos parâmetros estimados para o modelo bivariado do tipo cópula Joe rotacionada a 180º. Fonte: Elaboração própria a partir dos dados do Censo Demográfico de 2010.

A Figura 3 mostra as distribuições condicionadas ao conjunto de variáveis observáveis. É possível observar que essas distribuições são muito próximas, indicando que retornados e permanentes são bastante semelhantes em termos das suas habilidades mensuráveis. A distribuição contrafatual da população total migrante mostra mais massa na parte inferior e menos massa na parte superior da distribuição quando comparada a distribuição real dos residentes em SP.

A Figura 4 (a) e (b), por sua vez, refere-se às estimativas de distribuição de salários totais. Elas evidenciam maiores diferenças entre as distribuições. Na ausência de migração de retorno mais migrantes apareceriam na metade superior e topo da distribuição, além de haver um deslocamento à direita na parte esquerda da distribuição, aumentando o salário médio dessa população. Como constatado na análise dos decis, parte da cauda superior dessa distribuição possui menos massa no cenário em que não há migração de retorno, indicando uma piora salarial. Essa figura dá maior suporte à seleção positiva em não observáveis dos migrantes de retorno oriundos de São Paulo.

Há evidências de que uma análise baseada apenas em características observáveis subestima o efeito da migração de retorno sobre a distribuição dos salários da população migrante. Além disso, observa-se que ao contar com não mensuráveis a distância entre as distribuições de migrantes de paulistas diminui em relação à análise em características observáveis.

As diferenças entre as distribuições reais e contrafatuais são melhor visualizadas a partir da Figura 4 (b). Observa-se que as diferenças entre as densidades são maiores nos níveis mais baixos e médios de rendimento, indicando um efeito maior da migração de retorno. Abaixo da média salarial total (linha pontilhada mais clara) a diferença é em grande parte positiva, enquanto acima da média, por volta do salário-hora de R$ 1,7, a diferença é sempre negativa.

A Tabela 6 mostra que a migração de retorno também afeta a desigualdade salarial entre os migrantes que permanecem no estado, a partir da diferença entre os percentis 10-90, 10-50 e 50-90 das distribuições reais e contrafatuais. A diferença salarial entre os percentis extremos diminuiria significativamente caso não houvesse migração de retorno, representando uma variação de -44,77% nos diferenciais de salários. Na parte inferior da distribuição também há um movimento de arrefecimento substancial das desigualdades, caso não houvesse migração de retorno a diferença entre os percentis 90 e 50 seria -39,97%. Já na parte superior da distribuição (10-50) há um efeito mais discreto da migração de retorno sobre as diferenças salariais (-4,7%).

No geral, a desigualdade salarial entre a população migrante diminuiria se todos os migrantes decidissem ficar em São Paulo. Tendo em vista que sem migração de retorno, a média salarial dos migrantes aumenta na parte inferior e diminui na parte superior. Portanto, há uma tendência de aprofundamento da desigualdade entre os migrantes permanentes devido à saída de trabalhadores positivamente selecionados e com maiores níveis de instrução, aumentando a dispersão dos salários, considerando paralelamente a grande proporção de trabalhadores sem instrução que tendem a permanecer no destino.

Em relação à população não migrante natural de São Paulo é fato que há uma diferença substancial em relação aos migrantes não só devido à características observáveis e não observáveis entre aqueles que optam por não de deslocar, já evidenciada na literatura, mas também pelas grandes disparidades regionais que são identificadas no país. Segundo Batista e Cacciamali (2009)Batista, Natalia Nunes Ferreira e Maria Cristina Cacciamali (2009): “Diferencial de salários entre homens e mulheres segundo a condição de migração,” Revista Brasileira de Estudos de População, 26, 97-115. [2, 25] há um distanciamento entre migrantes e não migrantes na região sudeste. Silveira Neto e Magalhães (2006)Silveira Neto, Raul da Mota e André Mato Magalhães (2006): “O progresso econômico do migrante em São Paulo: Evidências a partir dos censos demográficos de 1991 e 2000,” Economia & Desenvolvimento, 5. [2, 25], por sua vez, apontam para magnitude dos diferenciais de renda dentro do universo de migrantes e não migrantes no estado de São Paulo devido aos diferenciais de capital humano. Já os autores Assis et al. (2012)Assis, RS de, Edward Martins Costa, e JL Mariano (2012): “Impacto da migração de não naturais e da migração de retorno sobre a distribuição de renda dos estados da Bahia e de São Paulo: um olhar sobre a inserção desses indivíduos no mercado de trabalho local,” 40º Encontro Nacional de Economia. [2, 4, 25], ao analisar a migração entre os estados de São Paulo e Bahia identificam, mais uma vez, um hiato salarial entre baianos e paulistas, favorável ao último grupo. No que se refere ao estudo em questão, na Figura A.2 do apêndice observa-se uma ligeira aproximação e, portanto, uma diminuição da desigualdade entre migrantes e não migrantes caso não houvesse migração de retorno.

6.1 Efeitos da Migração de Retorno considerando heterogeneidades

6.1.1 Mercado de trabalho formal e informal

O grupo de trabalhadores formais representa 71,93% da amostra total utilizada neste estudo. Desses, 68,35% são migrantes permanentes. Há também predominância desse grupo no conjunto de alta probabilidade de permanência com 82,91%. Esses dados indicam que embora a população de migrantes em São Paulo seja de baixa instrução é também, em sua maioria, de trabalhadores com carteira de trabalho assinada, em regime de formalidade. Os trabalhadores do setor informal, por sua vez, são aqueles sem carteira de trabalho assinada, na maioria autônomos (conta-própria).

Sem migração de retorno, o grupo de migrantes do setor formal estaria ganhando mais na metade inferior e grande parte da metade superior da distribuição, resultado próximo ao da análise da amostra total. As diferenças reforçam esse resultado ( fig. 5 (b)). No caso do grupo na informalidade e autônomos há certa irregularidade no comportamento da distribuição contrafatual (tracejada). A metade inferior, próximo à cauda inferior mostra aumento da média salarial sem migração de retorno, enquanto na metade superior as diferenças entre as distribuições são quase sempre negativas, mesmo abaixo da média do salário-hora, indicando piora salarial.

Figura 5
Densidade reais e contrafatuais do salário-hora total para migrantes. (1) Setor Formall (2) Setor Informal. Nota 1: O teste Kolmogorov - Smirnov rejeitou-se a hipótese. nula de que as densidades reais e contrafatuais sejam iguais, ao nível de 1% de significância: estatística D = 0.09 e p-valor = 0,0000. Nota 2: As predições de salários foram baseadas nos parâmetros estimados para o modelo bivariado do tipo cópula Joe rotacionada a 180º. Fonte: Elaboração própria a partir dos dados do Censo Demográfico de 2010.

Uma característica interessante desse processo é que migrantes vivendo em formalidade, embora com nível escolar baixo e, portanto, rendimentos mais baixos na distribuição são beneficiados, caso não houvesse migração de retorno, de forma mais contundente quando levamos em conta suas características inatas.

6.1.2 Migração Nordeste - São Paulo

Ao longo do trabalho foi observada a predominância da população nordestina como principal fonte de emissão, população permanente, grupo de alta probabilidade e com níveis de escolaridade mais baixa. Nesse sentido é interessante observar as distribuições considerando apenas a população dos estados do nordeste. Portanto, no cenário real temos migrantes nordestinos vivendo em São Paulo. No cenário em que nordestinos não retornam, podemos observar que as distribuição são mais próximas que aquelas observadas na amostra total, indicando que a população nordestina tenha características observáveis e não observáveis menos divergentes. No entanto, permanece a análise de um ligeiro deslocamento à direita na metade inferior e topo da distribuição. Na parte superior, daqueles decis mais altos, não há afastamento significativo.

6.1.3 Escolaridade

Foi possível verificar os resultados para os níveis de escolaridade: Sem Instrução, Fundamental e Médio, não existem indivíduos com nível superior ou pósgraduação no GAP, o que impossibilita a construção do cenário contrafactual nesses casos.

Na Fig. 7 temos as densidades reais e contrafatuais nesses níveis educacionais. Para o nível sem instrução (a e b), há uma grande aproximação do resultado para amostra total, devido a grande proporção de indivíduos com esse nível de escolaridade. As densidades (b) e (c), para o nível fundamental, indicam um resultado semelhante, embora menos significativo, há um ligeiro deslocamento à direita da na parte esquerda e topo da distribuição contrafatual. As densidades referentes ao ensino médio indicam um deslocamento à esquerda na meta inferior da distribuição, bem como menos migrantes na metade superior, mostrando que as diferenças entre as densidades para valores mais altos de rendimento são fortemente negativas. Destarte, para o nível médio o retorno representa uma piora salarial.

Figura 6
Densidade reais e contrafatuais do salário-hora total para migrantes - Região Nordeste. Nota 1: O teste Kolmogorov - Smirnov rejeitou-se a hipótese nula de que as densidades reais e contrafatuais sejam iguais, ao nível de 1% de significância: estatística D = 0.07 e p-valor = 0,0000. Nota 2: As predições de salários foram baseadas nos parâmetros estimados para o modelo bivariado do tipo cópula Joe rotacionada a 180º. Fonte: Elaboração própria a partir dos dados do Censo Demográfico de 2010.

Figura 7
Densidades reais e contrafatuais do salário-hora total para migrantes e paulistas por nível educacional. Nota 1: A distribuição real foi construída a partir da amostra de migrantes residentes em SP condicionada aos três níveis de instrução supracitados. A distribuição contrafatual corresponde a distribuição dos salários totais no cenário em que não há migração de retorno condicionada aos mesmos níveis educacionais, calculada pela mudança dos resíduos no GAP pela média dos salários previstos dos migrantes caso todos tivessem permanecido. Nota 2: O teste K-S indicou diferença entre a distribuição real e contrafatual significativa a 1% apenas no nível sem instrução com estatística D = 0.4669 e p-valor = 0,0000. No nível fundamental: p-valor = 0,1547. Nível médio: p-valor = 0,4644. Nota 4: As predições de salários foram baseadas nos parâmetros estimados para o modelo bivariado do tipo cópula Joe rotacionada a 180º. Fonte: Elaboração própria com base nos dados do Censo 2010.

7. Análise de Robustez

7.1 Modelo sem restrição de exclusão e validade do instrumento

Muitas aplicações empíricas apoiam-se no uso de restrições de exclusões com o objetivo de auxiliar na correta identificação do modelo com viés de seleção amostral (Toomet et al., 2008Toomet, Ott, Arne Henningsen, et al. (2008): “Sample selection models in R: Package sampleSelection,” Journal of statistical software, 27, 1-23. [8, 27]). No modelo de Heckman (1979)Heckman, James (1979): “Sample selection bias as a specification error,” Econometrica: Journal of the econometric society, 153-161. [8, 9, 16, 27, 32], por exemplo, além da premissa restritiva de normalidade conjunta das equações de seleção e salários, a correlação dos seus termos randômicos requer o uso de restrição de exclusão (variável instrumental) para garantir a correta identificação dos parâmetros estimados. O modelo semi-paramétrico determinação conjunta de remigração e salários tem sua distribuição conjunta baseada em cópulas (vide eq. (1)-(2)). Isso assegura maior flexibilidade ao relaxar a hipótese de distribuição normal dos resíduos e não necessariamente precisamos de uma identificação de parâmetros por meio de restrição de exclusão (Wiesenfarth e Kneib, 2010Wiesenfarth, Manuel e Thomas Kneib (2010): “Bayesian geoadditive sample selection models,” Journal of the Royal Statistical Society: Series C (Applied Statistics), 59, 381- 404. [9, 27]). Todavia, podemos obter estimativas mais consistentes quando ao menos um regressor a mais é incluído na equação de seleção (Wojtys et al., 2016Wojtys, Malgorzata, Giampiero Marra, e Rosalba Radice (2016): “Copula regression spline sample selection models: the R Package SemiParSampleSel,” Journal of Statistical Software, 71. [8, 9, 10, 11, 16, 27, 34]; Marra e Radice, 2013--- (2013): “Estimation of a regression spline sample selection model,” Computational Statistics & Data Analysis, 61, 158-173. [8, 27]).

A variável filho nascido em São Paulo foi usada neste estudo entrando na equação de seleção e excluída da equação de salários (instrumento de exclusão), sob a premissa de que a convivência com filhos na região de destino cria um vínculo familiar que pode dificultar a migração de retorno (Biavaschi, 2016Biavaschi, Costanza (2016): “Recovering the counterfactual wage distribution with selective return migration,” Labour Economics, 38, 59-80. [1, 3, 7, 8, 11, 12, 14, 15, 18, 19, 20, 27]). A Figura 8 (e) mostra as densidades reais e contrafatuais para um modelo15 de seleção amostral semelhante ao empregado na análise principal que não usa essa variável como restrição de exclusão16. Verifica-se que que os resultados são consistentes com a análise principal. Ademais, para verificar a validade desse instrumento, no entanto, tendo em vista que os pressupostos requeridos ao usar essa estratégia de identificação, foram aplicados os testes propostos por Huber e Mellace (2014)Huber, Martin e Giovanni Mellace (2014): “Testing exclusion restrictions and additive separability in sample selection models,” Empirical Economics, 47, 75-92. [27, 29, 35] e os métodos de Chen e Szroeter (2014)Chen, Le-Yu e Jerzy Szroeter (2014): “Testing multiple inequality hypotheses: a smoothed indicator approach,” Journal of econometrics, 178, 678-693. [27, 29, 35] e Bennett et al. (2009)Bennett, Christopher J et al. (2009): “Consistent and asymptotically unbiased minP tests of multiple inequality moment restrictions,” Vanderbilt University Department of Economics Working Papers, 908. [27, 29, 35] para testar estatisticamente restrições de desigualdade.

Figura 8
Densidade reais e contrafatuais do salário-hora total para migrantes - (1) Amostra de mulheres, (2) Modelo incluindo homens e mulheres e (3) Modelo sem restrição de exclusão. Nota 1 : (2)(a) Amostra incluindo homens e mulheres. Nota 2: (1)(b) e (2)(d) Intervalos de confiança representado pelas linhas pontilhadas, supondo um nível de 95% de confiança. A estimação dos erros-padrão foi feita usando a técnica de reamostragem bootstrap. Nota 3: O teste Kolmogorov - Smirnov rejeitou-se a hipótese nula de que as densidades reais e contrafatuais sejam iguais, ao nível de 1% de significância em todos os modelos conforme os seguintes dados: (1) p-valor = 0,0000; (2) e p-valor = 0,0000; (3) p-valor = 0,0000. Nota 4: As predições de salários foram baseadas nos parâmetros estimados para o modelo bivariado do tipo cópula Joe rotacionada a 180º em todos os modelos. Fonte: Elaboração própria a partir dos dados do Censo Demográfico de 2010.

Huber e Mellace (2014)Huber, Martin e Giovanni Mellace (2014): “Testing exclusion restrictions and additive separability in sample selection models,” Empirical Economics, 47, 75-92. [27, 29, 35] propõem testar a validade do instrumento e a separabilidade aditiva do termo de erro na equação de seleção conjuntamente17. A intuição do teste é que duas restrições de desigualdade surgem da identificação pontual e delimitação da distribuição dos indivíduos sempre selecionados (aqueles selecionados independente do instrumento - always takers) na subpopulação selecionada que não recebe o instrumento, considerando que a população que recebe o instrumento inclui compliers, cuja seleção reage ao instrumento. O ponto identificado na ausência do instrumento deve estar dentro dos limites na presença dele, gerando duas restrições testáveis:

(11) H 0 : E Y | Z = 1 , S = 1 , Y y q E Y | Z = 0 , S = 1 E Y | Z = 0 , S = 1 E Y | Z = 1 , S = 1 , Y y 1 q θ 1 m θ 2 m 0 0

onde q é a proporção de migrantes sempre selecionados na população mista de indivíduos com e sem filho nascido em São Paulo e yq é o quantil da variável de resultado (logaritmo do salário-hora) condicionado à probabilidade q. Para testar essas restrições conjuntamente Huber e Mellace (2014)Huber, Martin e Giovanni Mellace (2014): “Testing exclusion restrictions and additive separability in sample selection models,” Empirical Economics, 47, 75-92. [27, 29, 35] utilizam os métodos de Chen e Szroeter (2014)Chen, Le-Yu e Jerzy Szroeter (2014): “Testing multiple inequality hypotheses: a smoothed indicator approach,” Journal of econometrics, 178, 678-693. [27, 29, 35]. Foram também utilizados os métodos de Bennett et al. (2009)Bennett, Christopher J et al. (2009): “Consistent and asymptotically unbiased minP tests of multiple inequality moment restrictions,” Vanderbilt University Department of Economics Working Papers, 908. [27, 29, 35] baseados em reamostragem por bootstrap para obtenção de p-valores robustos em amostras finitas18.

Os resultados dos testes das restrições em (11) estão dispostos na Tabela A.4 do Apêndice. São reportados os resultados para várias subamostras condicionadas à diferentes subconjuntos das covariadas utilizadas neste estudo. A terceira coluna contém a porcentagem de compliers19 em cada subamostra, a quarta coluna contém a distância padronizada, que indica o grau de violação das restrições de desigualdade em (11) (Huber e Mellace, 2014Huber, Martin e Giovanni Mellace (2014): “Testing exclusion restrictions and additive separability in sample selection models,” Empirical Economics, 47, 75-92. [27, 29, 35]). A partir da quinta coluna são dispostos os p-valores obtidos a partir dos métodos de Chen e Szroeter (2014)Chen, Le-Yu e Jerzy Szroeter (2014): “Testing multiple inequality hypotheses: a smoothed indicator approach,” Journal of econometrics, 178, 678-693. [27, 29, 35] e Bennett et al. (2009)Bennett, Christopher J et al. (2009): “Consistent and asymptotically unbiased minP tests of multiple inequality moment restrictions,” Vanderbilt University Department of Economics Working Papers, 908. [27, 29, 35] com recentramento completo e parcial, respectivamente.

A partir dos resultados 20 verificamos que a distância padronizada é negativa em grande parte das subamostras. Ademais, todas as estatísticas de p-valor são consideravelmente maiores que 10%. Assim posto, no geral, não há evidências para rejeitar a validade do instrumento utilizado neste estudo, especialmente nos casos em que o poder do teste é maior pela menor presença de compliers.

7.2 Análise incluindo mulheres

As mulheres representam 36,36% da amostra total caracterizada pelos recortes adotados na Seção 3. Ao incluir esse grupo na amostra, no entanto, dois problemas podem surgir na análise. Primeiro, em muitos estudos sobre migração foi mostrado que as mulheres têm maiores chances de serem migrantes agregados (Siqueira e Matos Magalhaes, 2006Siqueira, Liedje Bettizaide Oliveira de e André Matos Magalhaes (2006): “Uma análise do fluxo migratório brasileiro: migração para regiões pobres e migração de retorno,” Tese de Doutorado, Universidade Federal de Pernambuco. [2, 30]; Avelino, 2010Avelino, Ricardo RG (2010): “Self-selection and the impact of migration on earnings,” Brazilian Review of Econometrics, 30, 69-89. [30]; de Oliveira e de Martino Jannuzzi, 2005de Oliveira, Kleber Fernandes e Paulo de Martino Jannuzzi (2005): “Motivos para migração no Brasil: Padrões etários, por sexo e origem/destino,” São Paulo em Perspectiva, 19, 1-13. [30]; Aguiar, 2017Aguiar, Maria Adreciana Silva de (2017): “Autosseleção e impacto da migração de retorno sobre a distribuição salarial: análise para os migrantes da Região Nordeste,” Dissertação de Mestrado, Universidade Federal do Ceará. [30]). Segundo, a restrição de exclusão (residente com filho nascido em São Paulo) no modelo de seleção tem relação com a produtividade da mulher no mercado de trabalho. Há evidências de que a maternidade cria uma série de barreiras para a participação da mulher no mercado de trabalho, principalmente no curto prazo. Apesar disso, a participação das mulheres vem aumentando, enquanto as desigualdades e a problemática da jornada dupla persistem (Pazello e Fernandes, 2004Pazello, Elaine Toldo e Reynaldo Fernandes (2004): “A maternidade e a mulher no mercado de trabalho: Diferença de comportamento entre mulheres que têm e mulheres que não têm filhos,” em Anais do 31º Encontro da Associação Nacional de Pós-Graduação em Economia, vol. 31. [30]; Costa, 2007Costa, JSM (2007): “Determinantes da participação feminina no mercado de trabalho brasileiro. 2007,” Tese de Doutorado, Tese (Mestrado)-Universidade de Brasília, Brasília. [30]; Fontoura e Gonzalez, 2009Fontoura, Natália de Oliveira e Roberto Gonzalez (2009): “Aumento da participação de mulheres no mercado de trabalho: mudança ou reprodução da desigualdade?” Nota técnica, Instituto de Pesquisa Econômica Aplicada. [30]; Queiroz e Aragón, 2015Queiroz, Vívian dos Santos e Jorge Alberto Orellana Aragón (2015): “Alocação de tempo em trabalho pelas mulheres brasileiras,” Estudos Econômicos (São Paulo), 45, 787-819. [30]).

Assim posto, ao longo deste estudo a análise empírica foi realizada a partir de uma amostra composta apenas por trabalhadores homens. Essa estratégia foi implementada afim de possibilitar maior confiança na exogeneidade da variável de restrição de exclusão em relação à equação de resultados (rendimentos), isto é, ao reduzir risco de correlação entre cuidado com os filhos e produtividade do trabalho. No entanto, pode haver uma preocupação de que uma amostra que inclua as mulheres altere os resultados. Para verificar se os resultados são consistentes na presença de mulheres foram estimados dois modelos: o primeiro modelo considera apenas mulheres, enquanto o segundo inclui ambos homens e mulheres.

Considerando somente as mulheres, a Figura 8 (a) relata as densidades reais e contrafatuais do logaritmo do salário-hora. Verifica-se que os resultados são muito próximos aos da análise principal, embora mais discretos. Note-se que há um deslocamento à direita da distribuição de salários sem migração de retorno, principalmente no topo e metade e inferior, mais uma vez sugerindo que migrantes com rendimentos mais baixos e médios estariam auferindo maiores salários caso não houvesse migração de retorno. A Figura 8 (c) representa amostra em que são considerados homens e mulheres conjuntamente. Esses resultados são, mais uma vez, consistentes com as conclusões da amostra principal, o deslocamento dessa vez se destaca de forma mais perceptível na parte inferior e topo da distribuição.

8. Considerações finais

Conforme resultado teórico de Borjas e Bratsberg (1996)Borjas, George J e Bernt Bratsberg (1996): “Who leaves? The outmigration of the foreignborn,” Rel. téc., National Bureau of Economic Research. [1, 8, 30], os efeitos do fenômeno da migração de retorno podem se rebater na população migrante que não optou pela remigração, uma vez que o fluxo de migração inicial tenha se autosselecionado em atributos produtivos não observados. Tal questão permanecia pouco explorada na literatura nacional.

Este estudo procurou preencher a lacuna reportada ao investigar empiricamente qual seriam os efeitos da migração de retorno sobre a distribuição de salários dos migrantes interestaduais que optaram pela permanência no estado de São Paulo. Tal estado, além de representar a maior economia dentre as demais unidades federativas do Brasil, tem recebido historicamente o maior contingente de migrantes, bem como se diferenciado como origem principal dos remigrados. Além de características mensuráveis como escolaridade, idade, entre outras, foram também consideradas características inatas na construção dessas distribuições, de forma a verificar se o impacto da migração de retorno sobre a população migrante pode ser explicado por questões intrínsecas ao trabalhador.

Os achados deste estudo revelam que o fluxo de migração interestadual dirigido ao maior polo econômico do Brasil parece ser formado por trabalhadores negativamente selecionados, não apenas em atributos produtivos observáveis (baixa instrução), mas também em características produtivas não observadas. O último fato é reforçado pelas evidências de que os migrantes retornados têm características produtivas não observadas melhores quando comparadas aos migrantes permanentes, as quais, em geral, aumentariam o salário médio da população migrante e reduziria a desigualdade caso não houvesse migração de retorno.

  • 1
    Por exemplo, para cópula normal o parâmetro τ de Kendall em termos de θ é obtido através da expressão 2πarcsinθ, mais detalhes da relação entre os parâmetros τ e θ podem ser consultados em Marra e Wyszynski (2016)Marra, Giampiero e Karol Wyszynski (2016): “Semi-parametric copula sample selection models for count responses,” Computational Statistics & Data Analysis, 104, 110-129. [9, 10], página 6.
  • 2
    A normalidade dessas funções implica em F1i0=Φμ1ief2iYi*=σ1ϕYi*μ2iσ1
  • 3
    Funções suaves são utilizadas com o intuito de flexibilizar o relacionamento entre as variáveis de interesse e variáveis explicativas contínuas e assim evitar as desvantagens da abordagem paramétrica. Essas funções suaves são representadas por splines ( funções polinomiais particionadas). O spline de regressão de uma determinada variável explicativa é composto por um combinação linear de funções básicas conhecidas bjkxj* e parâmetros de regressão desconhecidos δ jk . Logo, sjxj*=k=1qjδjkbjkxj*, onde j indica o termo suave da j-ésima variável explicativa e qj é o numero de parâmetros de regressão (bases do spline) usados para representar o j-ésimo termo suave, o cálculo dessa expressão para cada j produzirá qj curvas que multiplicadas pelo vetor de parâmetros e somadas produzirão estimativas lineares ou não lineares para sjxj*. A base q escolhida para uma função suave determina o grau de flexibilidade máxima para um termo suave e bases devem possuir propriedades matemáticas e numéricas adequadas (Marra e Radice, 2010Marra, Giampiero e Rosalba Radice (2010): “Penalised regression splines: theory and application to medical research,” Statistical Methods in Medical Research, 19, 107-125. [10]; Wojtys et al., 2016Wojtys, Malgorzata, Giampiero Marra, e Rosalba Radice (2016): “Copula regression spline sample selection models: the R Package SemiParSampleSel,” Journal of Statistical Software, 71. [8, 9, 10, 11, 16, 27, 34]).
  • 4
    Os critérios AIC e BIC podem ser calculados, respectivamente, por AIC=2l^+2k e BIC=2l^+lognk, onde l^ é o valor maximizado da função de log-verossimilhança e k o grau de liberdade do modelos de seleção e salário. Ambos os critérios penalizam a adição de variáveis nas estimações (Wojtys et al., 2016Wojtys, Malgorzata, Giampiero Marra, e Rosalba Radice (2016): “Copula regression spline sample selection models: the R Package SemiParSampleSel,” Journal of Statistical Software, 71. [8, 9, 10, 11, 16, 27, 34]).
  • 5
    Assumindo fui*|S=1,Zi'α=fui*|S=1 e fui*|Zi'α=fui*
  • 6
    Em trabalhos como o de Heckman (1990)--- (1990): “Varieties of selection bias,” The American Economic Review, 80, 313. [3, 8, 12, 19]; Andrews e Schafgans (1998)Andrews, Donald WK e Marcia MA Schafgans (1998): “Semiparametric estimation of the intercept of a sample selection model,” The Review of Economic Studies, 65, 497-517. [12, 19]; Liu et al. (2009)Liu, Echu, Cheng Hsiao, Tomoya Matsumoto, e Shinyi Chou (2009): “Maternal fulltime employment and overweight children: Parametric, semi-parametric, and nonparametric assessment,” Journal of Econometrics, 152, 61-69. [12]; Chzhen e Mumford (2011)Chzhen, Yekaterina e Karen Mumford (2011): “Gender gaps across the earnings distribution for full-time employees in Britain: Allowing for sample selection,” Labour Economics, 18, 837-844. [12] e Shen (2013)Shen, Chan (2013): “Determinants of health care decisions: insurance, utilization, and expenditures,” Review of Economics and Statistics, 95, 142-153. [12].
  • 7
    A partir dos dados do Censo Demográfico de 2010 não é possível identificar o parentesco direto de um indivíduo cuja posição no domicílio seja filho ou enteado. Dessa forma a amostra é limitada aos responsáveis e cônjuges de modo que se torne viável construir a variável de restrição de exclusão (filho nascido em SP).
  • 8
    Uma limitação dos dados do Censo Demográfico consiste na impossibilidade de identificação do momento (antes ou após o retorno) em que as característica dos indivíduos como foram adquiridas.
  • 9
  • 10
    O trabalho de Biavaschi (2016)Biavaschi, Costanza (2016): “Recovering the counterfactual wage distribution with selective return migration,” Labour Economics, 38, 59-80. [1, 3, 7, 8, 11, 12, 14, 15, 18, 19, 20, 27] considerou que o efeito de ter um filho nascido nos EUA não deve prever o salário de um indivíduo após controlar os efeitos de vínculo e rede por meio da variável cônjuge nascido nos EUA e do tempo de permanência nos EUA. Variável semelhante ao tempo de permanência na UF não está disponível na base de dados do Censo demográfico brasileiro de 2010 para o caso dos migrantes retornados.
  • 11
    Ainda é preciso reconhecer que o uso de variáveis instrumentais não é trivial por si só. O caso em que necessitamos de uma variável que seja exógena em relação à variável de resultado e endógena em relação à escolha do indivíduo representa um desafio na formulação de modelos e cenários preditivos adequados, limitado ainda pela indisponibilidade de dados. Na grande maioria das pesquisas publicadas tais limitações são reconhecidas, porém contrapostas com hipóteses e argumentações teóricas em linha com aquelas que já apresentamos. Todavia, foram aplicadas metodologias e testes com diferentes especificações que permitem contornar a dependência de variável instrumental.
  • 12
    A variável de salário-hora é construída como rendimentos do trabalho principal divididos por horas de trabalho. O salário em São Paulo para os retornados não é observado.
  • 13
    A partir de simulações, Wojtys et al. (2016)Wojtys, Malgorzata, Giampiero Marra, e Rosalba Radice (2016): “Copula regression spline sample selection models: the R Package SemiParSampleSel,” Journal of Statistical Software, 71. [8, 9, 10, 11, 16, 27, 34] mostram que a escolha da cópula verdadeira é melhor executada a parir o critério AIC.
  • 14
    Especificações totalmente paramétricas, utilizando a cópula Joe 180º e a cópula Normal (equivalente ao modelo de Heckman (1979)Heckman, James (1979): “Sample selection bias as a specification error,” Econometrica: Journal of the econometric society, 153-161. [8, 9, 16, 27, 32] em dois estágios estimado por máxima verossimilhança, Tobit-2), são disponibilizadas no apêndice. A partir da figuras A.1 verifica-se que os resultados são muito próximos aos da abordagem semiparamétrica, mantendo-se as conclusões do modelo selecionado.
  • 15
    Na Tabela A.3 do apêndice estão dispostos os valores do critério de informação AIC para o modelo sem restrição de exclusão. A cópula Joe rotacionada a 180º obteve o menor valor AIC.
  • 16
    O mesmo vetor de variáveis foi usado nas duas equações (1) e (2).
  • 17
    A restrição de exclusão é independente de ui*,ϵi|X. Em termos de monotonicidade isso implica que o estado potencial de seleção de cada indivíduo aumenta ou diminui fracamente monotonicamente com o instrumento. Dessa forma, denotando por S(z) o estado potencial de seleção do instrumento, temos que Pr(S(1) ≥ S(0)|X ) = 1 (monotonicidade positiva) e Pr(S(1) ≤ S(0)|X ) = 1 (monotonicidade negativa) (Huber e Mellace, 2014Huber, Martin e Giovanni Mellace (2014): “Testing exclusion restrictions and additive separability in sample selection models,” Empirical Economics, 47, 75-92. [27, 29, 35]).
  • 18
    Detalhes sobre algoritmos em Chen e Szroeter (2014)Chen, Le-Yu e Jerzy Szroeter (2014): “Testing multiple inequality hypotheses: a smoothed indicator approach,” Journal of econometrics, 178, 678-693. [27, 29, 35] e Bennett et al. (2009)Bennett, Christopher J et al. (2009): “Consistent and asymptotically unbiased minP tests of multiple inequality moment restrictions,” Vanderbilt University Department of Economics Working Papers, 908. [27, 29, 35]
  • 19
    Huber e Mellace (2014)Huber, Martin e Giovanni Mellace (2014): “Testing exclusion restrictions and additive separability in sample selection models,” Empirical Economics, 47, 75-92. [27, 29, 35] destacam que o poder do teste diminui quanto maior o percentual desse grupo.
  • 20
    O valor p associado é 1, portanto, não rejeitamos a hipótese nula de validade e monotonicidade nos níveis de significância convencionais.

Apêndice A Figuras e tabelas adicionais

Figura A.1
Densidade real e contrafatual do salário-hora para migrantes - abordagem paramétrica. Notas: (a) e (b): predições dos salários baseadas na cópula Normal com especificação paramétrica (Heckman, 1979Heckman, James (1979): “Sample selection bias as a specification error,” Econometrica: Journal of the econometric society, 153-161. [8, 9, 16, 27, 32]). (c) e (d): predições de salários baseadas nas estimativas para o modelo bivariado paramétrico - cópula Joe rotacionada a 180º. 2: Intervalos de 95% de confiança representados pelas linhas pontilhadas. Erros-padrão estimados via bootstrap. 3: Teste Kolmogorov-Smirnov rejeitou a hipótese nula de que as densidades reais e contrafatuais sejam iguais (sig. 1%) em ambos os modelos. Fonte: Elaboração própria com base nos dados do Censo Demográfico de 2010.

Tabela A.1
Descrição das variáveis utilizadas nos modelos de seleção e salários
Tabela A.2
Características das famílias de cópulas selecionadas
Tabela A.3
Critério de informação AIC: seleção do modelo segundo a função cópula - modelo principal
Tabela A.4
Teste para restrição de exclusão (filho nascido em SP) - Huber e Mellace (2014)Huber, Martin e Giovanni Mellace (2014): “Testing exclusion restrictions and additive separability in sample selection models,” Empirical Economics, 47, 75-92. [27, 29, 35]

Figura A.2
Densidade real e contrafatual do salário-hora para migrantes e paulistas. Nota 1: Os parâmetros das equações salariais para os paulistas foram estimados a partir de modelos aditivos generalizados com estimativa integrada de suavidade, mais detalhes em Wood e Wood (2015)Wood, Simon e Maintainer Simon Wood (2015): “Package ‘mgcv’,” R package version, 1, 29. [35]. As predições de salários de migrantes foram baseadas nos parâmetros estimados pelo modelo bivariado do tipo cópula Joe rotacionada a 180º. Nota 2: Um teste K-S rejeitou a hipótese nula de que as distribuições sejam iguais, a 1% de significância: p-valor = 0,0000. Fonte: Elaboração própria a partir dos dados do Censo Demográfico de 2010.

Referências Bibliográficas

  • Aguiar, Maria Adreciana Silva de (2017): “Autosseleção e impacto da migração de retorno sobre a distribuição salarial: análise para os migrantes da Região Nordeste,” Dissertação de Mestrado, Universidade Federal do Ceará. [30]
  • Ambrosini, J William, Karin Mayr, Giovanni Peri, e Dragos Radu (2010): The selection of migrants and returnees: Evidence from Romania and implications, World Bank. [2, 18]
  • Andrews, Donald WK e Marcia MA Schafgans (1998): “Semiparametric estimation of the intercept of a sample selection model,” The Review of Economic Studies, 65, 497-517. [12, 19]
  • Assis, RS de, Edward Martins Costa, e JL Mariano (2012): “Impacto da migração de não naturais e da migração de retorno sobre a distribuição de renda dos estados da Bahia e de São Paulo: um olhar sobre a inserção desses indivíduos no mercado de trabalho local,” 40º Encontro Nacional de Economia [2, 4, 25]
  • Avelino, Ricardo RG (2010): “Self-selection and the impact of migration on earnings,” Brazilian Review of Econometrics, 30, 69-89. [30]
  • Baeninger, Rosana (2016): “Rotatividade migratória: um novo olhar para as migrações internas no Brasil,” REMHU: Revista Interdisciplinar da Mobilidade Humana, 20, 77-100. [18]
  • Batista, Natalia Nunes Ferreira e Maria Cristina Cacciamali (2009): “Diferencial de salários entre homens e mulheres segundo a condição de migração,” Revista Brasileira de Estudos de População, 26, 97-115. [2, 25]
  • Bennett, Christopher J et al. (2009): “Consistent and asymptotically unbiased minP tests of multiple inequality moment restrictions,” Vanderbilt University Department of Economics Working Papers, 908. [27, 29, 35]
  • Biavaschi, Costanza (2016): “Recovering the counterfactual wage distribution with selective return migration,” Labour Economics, 38, 59-80. [1, 3, 7, 8, 11, 12, 14, 15, 18, 19, 20, 27]
  • Borjas, George J e Bernt Bratsberg (1996): “Who leaves? The outmigration of the foreignborn,” Rel. téc., National Bureau of Economic Research. [1, 8, 30]
  • Brechmann, E e Ulf Schepsmeier (2013): “Cdvine: Modeling dependence with c-and dvine copulas in r,” Journal of Statistical Software, 52, 1-27. [9]
  • Cameron, A Colin e Pravin K Trivedi (2005): , Cambridge university press. [8]
  • Cattaneo, Cristina (2007): “The Self-Selection in the Migration Process: What Can We Learn?” LIUC Papers in Economics 199, LIUC. [2]
  • Chamberlain, Gary (1986): “Asymptotic efficiency in semi-parametric models with censoring,” Journal of Econometrics, 32, 189-218. [3, 8, 11]
  • Chen, Le-Yu e Jerzy Szroeter (2014): “Testing multiple inequality hypotheses: a smoothed indicator approach,” Journal of econometrics, 178, 678-693. [27, 29, 35]
  • Chiquiar, Daniel e Gordon H Hanson (2005): “International migration, self-selection, and the distribution of wages: Evidence from Mexico and the United States,” Journal of political Economy, 113, 239-281. [3, 12]
  • Chiswick, Barry (1999): “Are immigrants favorably self-selected?” American Economic Review, 89, 181-185. [2, 8]
  • Chzhen, Yekaterina e Karen Mumford (2011): “Gender gaps across the earnings distribution for full-time employees in Britain: Allowing for sample selection,” Labour Economics, 18, 837-844. [12]
  • Cohen, Yinon e Yitchak Haberfeld (2001): “Self-selection and return migration: Israeliborn Jews returning home from the United States during the 1980s,” Population Studies, 55, 79-91. [2]
  • Costa, JSM (2007): “Determinantes da participação feminina no mercado de trabalho brasileiro. 2007,” Tese de Doutorado, Tese (Mestrado)-Universidade de Brasília, Brasília. [30]
  • De Coulon, Augustin e Matloob Piracha (2005): “Self-selection and the performance of return migrants: the source country perspective,” Journal of Population Economics, 18, 779-807. [21]
  • de Oliveira, Kleber Fernandes e Paulo de Martino Jannuzzi (2005): “Motivos para migração no Brasil: Padrões etários, por sexo e origem/destino,” São Paulo em Perspectiva, 19, 1-13. [30]
  • DiNardo, John, Nicole M Fortin, e Thomas Lemieux (1995): “Labor market institutions and the distribution of wages, 1973-1992: A semiparametric approach,” Rel. téc., National bureau of economic research. [3, 12, 21]
  • Dustmann, Christian (2003): “Children and return migration,” Journal of population economics, 16, 815-830. [14]
  • Fontoura, Natália de Oliveira e Roberto Gonzalez (2009): “Aumento da participação de mulheres no mercado de trabalho: mudança ou reprodução da desigualdade?” Nota técnica, Instituto de Pesquisa Econômica Aplicada. [30]
  • Freguglia, Ricardo da Silva e Thais Salzer Procópio (2013): “Efeitos da mudança de emprego e da migração interestadual sobre os salários no Brasil formal: evidências a partir de dados em painel,” Pesquisa e Planejamento Econômico, 43, 255-278. [2, 8]
  • Gama, Luiz Carlos Day e Ana Flávia Machado (2014): “Migração e rendimentos no Brasil: análise dos fatores associados no período intercensitário 2000-2010,” estudos avançados, 28, 155-174. [2, 8, 13, 15, 18]
  • Heckman, James (1979): “Sample selection bias as a specification error,” Econometrica: Journal of the econometric society, 153-161. [8, 9, 16, 27, 32]
  • --- (1990): “Varieties of selection bias,” The American Economic Review, 80, 313. [3, 8, 12, 19]
  • Huber, Martin e Giovanni Mellace (2014): “Testing exclusion restrictions and additive separability in sample selection models,” Empirical Economics, 47, 75-92. [27, 29, 35]
  • IBGE (2012): “Resultados gerais da amostra,” Ibge censo, Instituto Brasileiro de Geografia e Estatística. [1]
  • Justo, Wellington Ribeiro e R de A Ferreira (2012): “Migração interestadual no Brasil: perfil do retornado: evidências para o período de 1998-2008,” XVIII Encontro Nacional de Estudos Populacionais [15]
  • Lima, Ana Carolina da Cruz, Rodrigo Simões, e Ana Maria Hermeto (2015): “Privação relativa e deslocamentos da mão de obra no Brasil entre 1980 e 2010: evolução das interações entre pobreza, desigualdade de renda e migração,” Pesquisa e Planejamento Econômico, 45, 7-36. [13]
  • Liu, Echu, Cheng Hsiao, Tomoya Matsumoto, e Shinyi Chou (2009): “Maternal fulltime employment and overweight children: Parametric, semi-parametric, and nonparametric assessment,” Journal of Econometrics, 152, 61-69. [12]
  • Marra, Giampiero e Rosalba Radice (2010): “Penalised regression splines: theory and application to medical research,” Statistical Methods in Medical Research, 19, 107-125. [10]
  • --- (2013): “Estimation of a regression spline sample selection model,” Computational Statistics & Data Analysis, 61, 158-173. [8, 27]
  • Marra, Giampiero e Karol Wyszynski (2016): “Semi-parametric copula sample selection models for count responses,” Computational Statistics & Data Analysis, 104, 110-129. [9, 10]
  • McKenzie, David e Hillel Rapoport (2010): “Self-selection patterns in Mexico-US migration: the role of migration networks,” The Review of Economics and Statistics, 92, 811- 821. [2]
  • Mincer, Jacob (1978): “Family migration decisions,” Journal of political Economy, 86, 749-773. [14, 15]
  • Mulligan, Casey B e Yona Rubinstein (2008): “Selection, investment, and women’s relative wages over time,” The Quarterly Journal of Economics, 123, 1061-1110. [8]
  • Oliveira, ATR de, Leila Regina Ervatti, e MMVC O’Neill (2011): “O panorama dos deslocamentos populacionais no Brasil: PNADs e Censos Demográficos,” Reflexões sobre os deslocamentos populacionais no Brasil, 1. [3, 16]
  • Pazello, Elaine Toldo e Reynaldo Fernandes (2004): “A maternidade e a mulher no mercado de trabalho: Diferença de comportamento entre mulheres que têm e mulheres que não têm filhos,” em Anais do 31º Encontro da Associação Nacional de Pós-Graduação em Economia, vol. 31. [30]
  • Queiroz, Vívian dos Santos e Jorge Alberto Orellana Aragón (2015): “Alocação de tempo em trabalho pelas mulheres brasileiras,” Estudos Econômicos (São Paulo), 45, 787-819. [30]
  • Ramalho, Hilton Martins de Brito, Erik Figueiredo, e José Luis da Netto Júnior (2016): “Determinantes das migrações interestaduais no Brasil: evidências a partir de um modelo gravitacional,” Pesquisa e Planejamento Econômico, 46. [3, 4, 16]
  • Ramalho, Hilton Martins de Brito e Vívian dos Santos Queiroz (2011): “Migração interestadual de retorno e autosseleção: evidências para o Brasil,” Pesquisa e Planejamento Econômico, 41. [2, 15, 16]
  • Sachsida, Adolfo, Paulo Furtado de Castro, Mario Jorge Cardoso de Mendonça, e Pedro H Albuquerque (2009): “Perfil do migrante brasileiro,” Rel. téc., Texto para Discussão, Instituto de Pesquisa Econômica Aplicada (IPEA). [16]
  • Santos, Cézar Augusto Ramos e Pedro Cavalcanti Ferreira (2007): “Migração e distribuição regional de renda no Brasil,” Pesquisa e Planejamento Econômico, 37. [3, 15, 16]
  • Santos Júnior, Enestor da Rosa dos, Naércio Menezes-Filho, Pedro Cavalcanti Ferreira, et al. (2005): “Migração, seleção e diferenças regionais de renda no Brasil,” Pesquisa e Planejamento Econômico, 35. [2, 8]
  • Shen, Chan (2013): “Determinants of health care decisions: insurance, utilization, and expenditures,” Review of Economics and Statistics, 95, 142-153. [12]
  • Silveira Neto, Raul da Mota e André Mato Magalhães (2006): “O progresso econômico do migrante em São Paulo: Evidências a partir dos censos demográficos de 1991 e 2000,” Economia & Desenvolvimento, 5. [2, 25]
  • Silverman, Bernard W (2018): Density estimation for statistics and data analysis, Routledge. [12]
  • Siqueira, Liedje Bettizaide Oliveira de e André Matos Magalhaes (2006): “Uma análise do fluxo migratório brasileiro: migração para regiões pobres e migração de retorno,” Tese de Doutorado, Universidade Federal de Pernambuco. [2, 30]
  • Sjaastad, Larry A (1962): “The costs and returns of human migration,” Journal of political Economy, 70, 80-93. [2]
  • Toomet, Ott, Arne Henningsen, et al. (2008): “Sample selection models in R: Package sampleSelection,” Journal of statistical software, 27, 1-23. [8, 27]
  • Wiesenfarth, Manuel e Thomas Kneib (2010): “Bayesian geoadditive sample selection models,” Journal of the Royal Statistical Society: Series C (Applied Statistics), 59, 381- 404. [9, 27]
  • Wojtys, Malgorzata, Giampiero Marra, e Rosalba Radice (2016): “Copula regression spline sample selection models: the R Package SemiParSampleSel,” Journal of Statistical Software, 71. [8, 9, 10, 11, 16, 27, 34]
  • Wood, Simon e Maintainer Simon Wood (2015): “Package ‘mgcv’,” R package version, 1, 29. [35]

Datas de Publicação

  • Publicação nesta coleção
    28 Abr 2023
  • Data do Fascículo
    2023
Fundação Getúlio Vargas Praia de Botafogo, 190 11º andar, 22253-900 Rio de Janeiro RJ Brazil, Tel.: +55 21 3799-5831 , Fax: +55 21 2553-8821 - Rio de Janeiro - RJ - Brazil
E-mail: rbe@fgv.br