Acessibilidade / Reportar erro

Efeito do desenho em amostragem de conglomerado para estimar a distribuição de ocupações entre trabalhadores

Effect of design in cluster sampling to estimate the distribution of occupations among workers

Resumos

OBJETIVO: Descrever o desenho amostral efetuado para estimar a distribuição de população economicamente ativa, apresentando o efeito do desenho encontrado. MÉTODOS: A partir de um cadastro universal, foram amostrados 4.782 domicílios residenciais do município de Botucatu, SP, por intermédio de amostra aleatória sistemática de conglomerados, realizada entre junho e julho de 1997. RESULTADOS: Os 4.782 domicílios residenciais corresponderam a 17.219 moradores de Botucatu, entre junho e julho de 1997. Em decorrência da perda de heterogeneidade da distribuição das ocupações dentro dos domicílios amostrados, o efeito do desenho encontrado variou entre 1,00 e 1,96. CONCLUSÕES: Com base nos resultados obtidos, sugere-se que, em amostras de conglomerados para estimativas da distribuição de ocupações em populações economicamente ativas, o efeito do desenho seja estimado como e=1,50, para amostragens em zona urbana; e e=2,00 para amostragens em zona rural.

Amostragem por conglomerados; Força de trabalho; Distribuição espacial; Ocupações; População rural; População urbana; Trabalhadores


OBJECTIVE: To describe the effect of design associated with a sample survey carried out to estimate the distribution of occupations within an economic active population. METHODS: A cluster sample of households, chosen from a comprehensive directory via systematic random sampling, was performed including 4,782 of all residences in Botucatu, Brazil, between June and July 1997. RESULTS: Of the 4,782 households, 17,219 subjects were assessed. Due to the loss of distribution heterogeneity of the occupations within the households, the effect of design found ranged from 1.00 to 1.96. CONCLUSIONS: The results suggest that when planning similar studies aiming at estimating the distribution of occupations among economic active populations, the effect of design should be estimated as e=1.50 for surveys in urban areas, and e=2.00 for surveys in rural areas.

Cluster sampling; Labor force; Residence characteristics; Occupations; Rural population; Urban population; Workers


Efeito do desenho em amostragem de conglomerado para estimar a distribuição de ocupações entre trabalhadores* * Trabalho financiado pela Fapesp (Processos n os 96/7583-4, 96/7584-0, 96/7585-7, 97/12782-9, 97/12783-5 e 97/12784-1) e pelo CNPq (Processo nº 520605/96-9).

Effect of design in cluster sampling to estimate the distribution of occupations among workers

Ricardo Cordeiro

Departamento de Saúde Pública da Faculdade de Medicina de Botucatu da Universidade Estadual Paulista. Botucatu, SP, Brasil

DESCRITORES
Amostragem por conglomerados.# Força de trabalho.# Distribuição espacial.# Ocupações, classificação. População rural. População urbana. ¾ Trabalhadores. RESUMO

OBJETIVO:

Descrever o desenho amostral efetuado para estimar a distribuição de população economicamente ativa, apresentando o efeito do desenho encontrado.

MÉTODOS:

A partir de um cadastro universal, foram amostrados 4.782 domicílios residenciais do município de Botucatu, SP, por intermédio de amostra aleatória sistemática de conglomerados, realizada entre junho e julho de 1997.

RESULTADOS:

Os 4.782 domicílios residenciais corresponderam a 17.219 moradores de Botucatu, entre junho e julho de 1997. Em decorrência da perda de heterogeneidade da distribuição das ocupações dentro dos domicílios amostrados, o efeito do desenho encontrado variou entre 1,00 e 1,96.

CONCLUSÕES:

Com base nos resultados obtidos, sugere-se que, em amostras de conglomerados para estimativas da distribuição de ocupações em populações economicamente ativas, o efeito do desenho seja estimado como e=1,50, para amostragens em zona urbana; e e=2,00 para amostragens em zona rural.

KEYWORDS
Cluster sampling.# Labor force.# Residence characteristics. Occupations, classification. Rural population. Urban population. ¾ Workers. ABSTRACT

OBJECTIVE:

To describe the effect of design associated with a sample survey carried out to estimate the distribution of occupations within an economic active population.

METHODS:

A cluster sample of households, chosen from a comprehensive directory via systematic random sampling, was performed including 4,782 of all residences in Botucatu, Brazil, between June and July 1997.

RESULTS:

Of the 4,782 households, 17,219 subjects were assessed. Due to the loss of distribution heterogeneity of the occupations within the households, the effect of design found ranged from 1.00 to 1.96.

CONCLUSIONS:

The results suggest that when planning similar studies aiming at estimating the distribution of occupations among economic active populations, the effect of design should be estimated as e=1.50 for surveys in urban areas, and e=2.00 for surveys in rural areas.

INTRODUÇÃO

Estudos de epidemiologia ocupacional no País costumam geralmente enfocar grupos populacionais restritos a uma empresa em particular, bases sindicais ou usuários de serviços de saúde especializados. Em parte, essa tendência ¾ adequada a depender da pergunta de investigação ¾ é favorecida pelo acesso relativamente mais fácil que os pesquisadores têm a grupos ocupacionalmente estáveis, principalmente aqueles compostos por trabalhadores mais especializados e de maior organização sindical. Entretanto, o predomínio dessa tendência torna difícil a abordagem de questões quando é necessário apreender a relação saúde/trabalho na população geral.

Parcialmente em decorrência dessa tendência, é grande a desinformação sobre a distribuição da população na faixa etária economicamente ativa nas cidades brasileiras, com respeito a ocupações e ramos de atividades. Exceção é feita a algumas regiões metropolitanas, onde, não por iniciativa de estudos de saúde, há uma prática de coleta sistemática de dados contemplando a distribuição da população economicamente ativa segundo grupos profissionais.6,10

A falta de informações sobre bases populacionais, somada à má qualidade das informações sobre ocupação nos registros de saúde,2 dificulta sobremaneira a estimativa de indicadores de saúde para as populações trabalhadoras classificadas segundo ocupações. A superação dessa deficiência passa pelo empenho na construção de estimadores de bases populacionais segundo categorias profissionais. Tal construção é feita por intermédio de estudos amostrais. Entretanto, diferentemente do que acontece nas fábricas, nos sindicatos ou nos serviços especializados de saúde ocupacional, não existem cadastros populacionais universais que sirvam de base para amostragens aleatórias simples. Nessa situação, costuma-se recorrer a amostras de conglomerados, geralmente domicílios residenciais, como estratégia para o acesso aos trabalhadores na população geral. Domicílios residenciais, em um bom número de localidades, são objeto de cadastros quase universais, como os que podem ser obtidos em companhias fornecedoras de energia elétrica, de água encanada e em prefeituras.

Por um lado, a amostra de conglomerados tem como vantagem, em relação à amostra aleatória simples, um barateamento no custo por elemento amostrado, devido a um menor gasto na elaboração de cadastros e na localização de indivíduos.7 Mas por outro, implica duas desvantagens importantes: maior complexidade e dificuldade na análise estatística e, geralmente, um incremento na variância dos estimadores utilizados,1 com conseqüente diminuição da precisão do estudo.

As dificuldades analíticas são atualmente superáveis com recursos de programação e computação. Entretanto, os problemas associados ao aumento das variâncias dos estimadores utilizados podem implicar dificuldades importantes no planejamento amostral, principalmente no que se refere à especificação da precisão amostral (questão relacionada ao tamanho da amostra) e à previsão de custos. Isto ocorre porque a magnitude do aumento da variância dos estimadores, ao se utilizar um desenho de conglomerados, é difícil de ser prevista.

Fixados a precisão e o intervalo de confiança desejados, o tamanho amostral necessário é proporcional ao efeito do desenho na amostra de conglomerados.7 Assim sendo, uma noção prévia desse efeito associado à amostragem de conglomerado é bastante útil no planejamento amostral, principalmente no que se refere às projeções do trabalho de campo necessário e dos custos envolvidos.

Os objetivos do presente trabalho são descrever o desenho amostral efetuado para estimar a distribuição da população economicamente ativa de Botucatu, segundo categorias ocupacionais, e apresentar o efeito do desenho encontrado como contribuição para o planejamento de amostras com intuitos semelhantes em outras localidades.

MÉTODOS

Estimou-se a distribuição da população economicamente ativa (PEA) de Botucatu, localizada na região Centro-Oeste do Estado de São Paulo, efetuando-se uma amostragem populacional durante os meses de junho e julho de 1997. As informações sobre os integrantes da PEA na zona urbana do município foram obtidas por intermédio de amostragem aleatória sistemática de conglomerados (domicílios residenciais). Para tanto, foram utilizados os mapas dos setores censitários da região urbana de Botucatu, construídos durante a contagem populacional de 1996,5 como um cadastro universal e ordenado de domicílios residenciais. Entre os sete primeiros números naturais, sorteou-se o número três, que demarcou o terceiro domicílio residencial de cada setor censitário urbano como sendo o primeiro amostrado. A partir deste, seguindo a orientação dos setores, foram sistematicamente amostrados os domicílios residenciais de ordem múltipla de sete. Todos os moradores com 10 anos ou mais de idade dos domicílios amostrados foram incluídos no estudo.

Não há mapas censitários da zona rural de Botucatu. Segundo dados da Contagem Populacional de 1996,5 nesse ano foram contados 2.296 domicílios residenciais na área rural do município, desordenadamente distribuídos. Assumindo-se que o número de domicílios na zona rural permaneceu constante entre 1996 e 1997, foram amostrados 1/7 deles (328) por amostra de conveniência, obtida amostrando-se 100% dos domicílios existentes em quatro aglomerados rurais, cuja escolha deveu-se ao acesso relativamente fácil a esses domicílios e à sua pequena dispersão. De modo análogo ao processo realizado na zona urbana, todos os moradores com 10 anos ou mais de idade dos domicílios amostrados na zona rural foram incluídos no estudo.

Em ambas as regiões, urbana e rural, foram obtidas informações sobre sexo, idade, descrição detalhada da ocupação atual dos moradores selecionados, bem como do seu local de trabalho. Aqueles não pertencentes à PEA foram classificados, segundo os critérios adotados pela Fundação IBGE,4 em uma das seguintes situações: desempregado, dona-de-casa, estudante, doente ou inválido, aposentado ou pensionista. Também foi anotado o número de moradores menores de 10 anos no domicílio selecionado. As informações foram obtidas por entrevistas domiciliares com um morador adulto presente no momento da visita.

As entrevistas foram realizadas por entrevistadores selecionados e treinados para a tarefa, que preenchiam um formulário específico a partir das respostas do entrevistado em seu domicílio. Cerca de 10% dos domicílios amostrados foram revisitados por coordenadores de campo, que reaplicavam parcialmente a entrevista. Os dados eram comparados com as entrevistas originais para avaliar sua qualidade, visando identificar eventuais imprecisões, erros sistemáticos ou mesmo fraudes. No início da amostragem, constataram-se algumas imprecisões na caracterização das ocupações associadas a um dos entrevistadores, que após novo ciclo de treinamento refez todas as entrevistas de um dos setores censitários. Não foram encontrados erros sistemáticos ou fraudes.

Sendo amostrado um domicílio permanentemente desocupado, este era substituído pelo imediatamente seguinte no setor. Sendo amostrado um domicílio habitado, porém fechado na ocasião da visita, este era visitado uma segunda vez em dia e período diferentes da primeira visita. Encontrando-se fechado o domicílio na segunda visita, este era ainda outra vez visitado, também em dia e período diferentes. Após ter sido encontrado fechado em três visitas, o domicílio era excluído da amostra, não havendo reposição.

No recebimento do material de campo, todos os questionários foram verificados pelos coordenadores de campo. Após essa verificação, a partir da descrição das ocupações, estas foram codificadas em um segundo momento por pessoal especificamente treinado para essa tarefa.

As ocupações identificadas para cada indivíduo da população amostrada foram classificadas segundo a classificação de ocupações de Rumel,9 que agrupou ocupações da Classificação Brasileira de Ocupações8 com base na classificação de ocupações utilizada pelo Fundação IBGE.3 Também as ocupações foram classificadas de acordo com o setor da economia e a posição na ocupação.

Para o cálculo dos intervalos de confiança, pressupôs-se que os domicílios de área urbana (93,1%) e os de área rural (6,9%) foram originados de uma mesma amostra de conglomerados. Assim, a variância amostral dos estimadores utilizados foi estimada segundo a fórmula abaixo:1

onde:

f = fração amostral;

n = número de domicílios amostrados;

= número médio de moradores nos domicílios;

ai = número de indivíduos com o atributo de interesse no domicílio i;

p = proporção de indivíduos com o atributo de interesse na amostra;

mi = número de moradores no domicílio i.

Para cada uma das estimativas da proporção de grupos e subgrupos ocupacionais dentro da PEA, estimou-se o efeito do desenho (e) da amostra de conglomerados segundo a fórmula abaixo:7

RESULTADOS

Durante a amostragem, foram catalogados 31.604 domicílios residenciais na área urbana. Estes, somados aos 2.296 domicílios residenciais na área rural catalogados no ano anterior,5 totalizaram 33.900 domicílios. Foram amostrados 4.782 domicílios residenciais: 4.454 (93,1%) por amostra aleatória sistemática de conglomerados na zona urbana e 328 (6,9%) por amostra de conveniência de conglomerados na zona rural. Nesse processo, foram encontrados 111 domicílios habitados fechados em três visitas, o que correspondeu a 2,3% de perda. Em oito ocasiões, um morador da residência amostrada recusou-se a informar, sendo também esses domicílios excluídos sem reposição. Tais recusas corresponderam a 0,2% da amostra. No processo amostral, foram visitados 776 domicílios permanentemente desocupados, todos eles substituídos. Estimou-se o número de domicílios residenciais permanentemente desocupados, multiplicando-se por sete o total encontrado no processo amostral, o que perfaz 5.432 domicílios. Portanto, estima-se em 28.468 (33.900 ¾ 5.432) o número de domicílios residenciais habitados no município na ocasião, e em 0,1680 (4.782/28.468) a fração amostral obtida. Foram identificados 17.219 moradores residindo nos domicílios amostrados na data-referência de 1/7/1997. Isto projeta uma população de 102.494 moradores na cidade nessa data, com um intervalo de confiança de 95% igual a 101.810-103.179.

A Tabela 1 apresenta a distribuição da população amostrada de acordo com algumas categorias de interesse. Podem ser verificadas nas Tabelas 2, 3 e 4, respectivamente, a distribuição da PEA de Botucatu, de acordo com o setor da economia a que pertence, bem como as respectivas estimativas do efeito do desenho; a posição do trabalhador na ocupação, bem como as respectivas estimativas do efeito do desenho; e os grupos e os subgrupos ocupacionais, bem como as respectivas estimativas do efeito do desenho.

DISCUSSÃO

Para se obter uma boa estimativa da distribuição de ocupações na PEA de Botucatu, foi imprescindível contemplar no desenho amostral a zona rural do município. Caso a amostragem fosse restrita à zona urbana da cidade, as ocupações associadas ao setor primário da economia seriam, obviamente, bastante subestimadas. A maior dificuldade encontrada no planejamento amostral deste estudo deveu-se à impossibilidade de amostrar aleatoriamente conglomerados na zona rural. A opção de se amostrar os domicílios na zona rural (6,3% do total de domicílios) conforme a conveniência de acesso, em vez de proceder-se segundo um algoritmo aleatório, foi feita por ser a única maneira viável, com o financiamento disponível para esse projeto, de conduzir a amostragem. Uma vez que, diferentemente da região urbana da cidade, não se dispõe de mapas dos setores censitários rurais de Botucatu, a construção desses mapas para a posterior realização de amostragem aleatória sistemática, seguida da amostragem propriamente dita, consumiria praticamente todo o recurso e o tempo disponíveis para a presente pesquisa, devido à grande dispersão dos domicílios na zona rural e seu difícil acesso. Entretanto, dada a pequena proporção de domicílios originados da zona rural incluídos na amostra, pressupõe-se que as imprecisões nas estimativas dos intervalos de confiança apresentados, que podem advir dessa inclusão, são negligenciáveis.

Em relação a uma amostra aleatória simples de n elementos, quando se amostram a conglomerados contendo n elementos, o número de seleções independentes se reduz de n para a, aumentando a variância do estimador de proporção, dado que quase invariavelmente as classes de interesse dentro dos conglomerados não têm distribuição independente entre si.7 Intuitivamente, é fácil aceitar que onde já more um trabalhador do campo, a probabilidade de se encontrar outro trabalhador do campo é maior que a de encontrar um trabalhador, por exemplo, bancário.

A razão entre a variância do estimador de proporção em uma amostra de a conglomerados contendo n indivíduos e a variância do estimador de proporção em uma amostra aleatória simples de n indivíduos é definida como o efeito do desenho da amostragem de conglomerado7 (p. 196). Uma vez especificados um intervalo de confiança (1-a) 100%, um erro amostral d e uma expectativa de prevalência da classe amostrada p, o tamanho amostral pode ser calculado como o que seria necessário caso a amostra fosse aleatória-simples, multiplicado pelo efeito do desenho de conglomerado (e).7 Desse modo, desprezando-se o ajuste relativo à fração populacional amostrada, o tamanho amostral é estimado como:

Dado um determinado desenho amostral e para um determinado tamanho de conglomerados, o efeito do desenho é função do grau de homogeneidade intraconglomerado para as classes amostradas. No presente estudo, ele variou entre 1,00 e 2,13, conforme se observa nas Tabelas 2, 3 e 4. Efeitos de desenho iguais ou muito próximos de 1,00 significam que, para fins práticos, o grau de homogeneidade das categorias ocupacionais dentro dos conglomerados pode ser desprezado no planejamento amostral, podendo-se estimar a variância do estimador de proporção como se o procedimento fosse o de uma amostra aleatória simples. Isto ocorreu para alguns subgrupos ocupacionais pouco freqüentes na PEA de Botucatu, como o de eletricitários (e=1,00), trabalhadores de transportes (e=1,03), trabalhadores de empresas de comunicação (e=1,00), trabalhadores da segurança (e=1,00), trabalhadores de indústrias de alimentação (e=1,00), marceneiros e carpinteiros (e=1,04), gráficos (e=1,00), movimentadores de cargas (e=1,00) e trabalhadores braçais (e=1,07).

Conforme mostra a Tabela 4, todas as demais estimativas de proporção de grupos e subgrupos ocupacionais associaram-se a efeitos do desenho, compreendidos entre 1,10 e 1,50, exceto para o grupo II ¾ agricultores ¾ que apresentou e=1,96. Isto sugere que a aglutinação de trabalhadores rurais dentro dos domicílios é maior do que a que ocorre em outros grupos ocupacionais. Tal fato é corroborado pelo efeito do desenho encontrado para o setor primário da economia, que foi igual a 2,13, conforme mostra a Tabela 3. Para todos esses grupos e subgrupos ocupacionais, o efeito do desenho não pode ser desprezado no planejamento amostral, sob pena de se subestimar consideravelmente o número de unidades amostrais necessárias e os custos administrativos envolvidos na condução do estudo, frustrando-se as expectativas de precisão definidas no planejamento.

Com base nos resultados obtidos, sugere-se que em amostras de conglomerados para estimativas da distribuição da PEA em regiões urbanas de cidades com características semelhantes às de Botucatu, o efeito do desenho seja estimado como e=1,50. Tal estimativa, que implica aumentar em 50% o tamanho amostral necessário caso a amostra realizada fosse aleatória simples, deve ser suficiente para atender as especificações de precisão previamente estabelecidas, quando se deseja conhecer a distribuição de ocupações nos setores secundários e terciários da economia. Entretanto, se as necessidades de pesquisa contemplam também a zona rural, envolvendo ocupações do setor primário da economia, os dados aqui apresentados sugerem que a estimativa do efeito do desenho deve ser estabelecida em torno de 2,00, implicando duplicar o tamanho amostral calculado com base em amostragem aleatória simples.

Correspondência para/Correspondence to:

Ricardo Cordeiro

Caixa Postal 543

18618-970 Botucatu, SP, Brasil

E-mail: cordeiro@fmb.unesp.br Edição subvencionada pela Fapesp (Processo no 00/01601-8).

Recebido em 3/1/2000. Reapresentado em 9/6/2000. Aprovado em 13/9/2000.

  • 1. Cochran W. Sampling techniques New York: John Wiley & Sons; 1975.
  • 2. Cordeiro R , Peńaloza ERO, Cortez DB, Kakinami E, Souza JJGD, Souza MT de M et al. Validade das informaçőes ocupaçăo e causa básica em declaraçőes de óbito de Botucatu. Cad Saúde Pública 1999;15:71928.
  • 3
    Fundação IBGE. Censo demográfico: mão de obra; São Paulo Rio de Janeiro; 1983. v.1, t. 5, nº 10.
  • 4
    Fundação IBGE. Censo demográfico 1991: resultados do universo relativos às características da população e dos domicílios, São Paulo Rio de Janeiro; 1994. v. 21.
  • 5
    Fundação IBGE. Contagem da população, 1996. Rio de Janeiro; 1997. v 1.
  • 6. Fundaçăo IBGE. Pesquisa mensal de emprego, 1999. [online]. Disponível em http://www.ibge.br/estatistica/indicadores/trabalhoerendimento/pme/ [1999 dez 11].
  • 7. Kish L. Muestreo de encuestas. Mexico (DF): Editorial Trillas; 1972.
  • 8
    Ministério do Trabalho. Secretaria de Emprego e Salário. Classificação brasileira de ocupações Brasília (DF): SINE; 1982.
  • 9. Rumel D. Indicadores de mortalidade por categorial ocupacional e nível social [Dissertaçăo ]. Săo Paulo: Faculdade de Saúde Pública da Universidade de Săo Paulo; 1987.
  • 10. [Seade] Fundaçăo Sistema Estadual de Análise de Dados. Pesquisa de emprego e desemprego, 1999 [online]. Disponível em http://www.seade.gov.br/cgibin/titabp.ksh?COLTAB [1999 dez 11].
  • *
    Trabalho financiado pela Fapesp (Processos n
    os 96/7583-4, 96/7584-0, 96/7585-7, 97/12782-9, 97/12783-5 e 97/12784-1) e pelo CNPq (Processo nº 520605/96-9).
  • Datas de Publicação

    • Publicação nesta coleção
      23 Jun 2009
    • Data do Fascículo
      Fev 2001

    Histórico

    • Aceito
      13 Set 2000
    • Recebido
      03 Jan 2000
    • Revisado
      09 Jun 2000
    Faculdade de Saúde Pública da Universidade de São Paulo Avenida Dr. Arnaldo, 715, 01246-904 São Paulo SP Brazil, Tel./Fax: +55 11 3061-7985 - São Paulo - SP - Brazil
    E-mail: revsp@usp.br