Acessibilidade / Reportar erro

Desafios no estudo de famílias nucleares: etapas iniciais de análise

Challengers in nuclear family studies: first steps in data analysis

Resumos

Os estudos em famílias nucleares possibilitam a avaliação da existência de agregação familiar numa dada característica, permitindo avaliar o quanto da variação dessa característica na população pode ser atribuída à variação genética existente entre os sujeitos. Os resultados desses estudos possibilitam a elaboração de estratégias de intervenção mais eficientes e direcionadas, além de serem o ponto de partida para estudos mais complexos de epidemiologia genética, como a identificação de genes responsáveis pela característica em análise. Nas áreas de Ciências do Desporto e Educação Física, alguns estudos têm sido realizados para verificar a existência de agregação familiar e a influência genética em traços relacionados a estados de saúde, atividade e desempenho físicos. Entretanto, esses esforços revelam-se escassos em populações lusófonas e são, praticamente inexistentes, na população brasileira. Dessa forma, o presente artigo teve como propósito abordar, de forma simples e introdutória, aspectos importantes de estudos em famílias nucleares. Para tanto, foram analisadas as duas fases iniciais dos estudos de Epidemiologia Genética, ou seja, a identificação e quantificação da agregação familiar e da heritabilidade. As diferentes etapas de análise foram exemplificadas com dados reais, coletados em famílias nucleares pertencentes a um estudo realizado na cidade de Muzambinho-MG. Espera-se que esse artigo forneça subsídios e estímulo aos pesquisadores iniciantes neste tipo de investigação.

Agregação familiar; Heritabilidade; Perímetro da cintura; Volume semanal de atividade física; Muzambinho


Studies with nuclear families allow the identification of familiar aggregation, as well as the estimation of how much of the variability in a characteristic might be attributed to genetic differences among subjects. Results from these studies are starting points for more complex genetic research, including the identification and relevance of candidate genes. In Sport Science, studies have analyzed the possible existence of familiar aggregation and genetic influence on phenotypes marking physical activity, fitness, and health status. However, few studies were conducted with Portuguese speaking populations, and even fewer with Brazilian populations. Therefore, the present paper aims to discuss, at an introductory level, important aspects about nuclear family studies. The first two phases of Genetic Epidemiology research outline - familiar aggregation and heritability - were approached. The different steps of analysis were exemplified with real data collected in nuclear families from a study conducted in Muzambinho-MG. We hope this paper provides enough background and stimuli for the newcomers in this area of study.

Familiar aggregation; Heritability; Waist circumference; Weekly volume of physical activity; Muzambinho


ENSAIOS

Desafios no estudo de famílias nucleares: etapas iniciais de análise

Challengers in nuclear family studies: first steps in data analysis

Cláudia Lúcia de Moraes ForjazI; Teresa BartholomeuI; Januária Andréa Souza RezendeII; Jorge Alberto de OliveiraI; Luciano BassoI; Go TaniI; Antonio PristaIII; José António Ribeiro MaiaIV

IEscola de Educação Física e Esporte, Universidade de São Paulo

IIEscola Superior de Educação Física de Muzambinho

IIIFaculdade de Ciências de Educacão e Desporto, Universidade Pedagógica de Moçambique - Moçambique

IVFaculdade de Desporto, Universidade do Porto - Portugal

Endereço Endereço: Cláudia Lúcia de Moraes Forjaz Escola de Educação Física e Esporte - USP Av. Prof. Mello Moraes, 65 05508-030 - São Paulo - SP - BRASIL e-mail: cforjaz@usp.br

RESUMO

Os estudos em famílias nucleares possibilitam a avaliação da existência de agregação familiar numa dada característica, permitindo avaliar o quanto da variação dessa característica na população pode ser atribuída à variação genética existente entre os sujeitos. Os resultados desses estudos possibilitam a elaboração de estratégias de intervenção mais eficientes e direcionadas, além de serem o ponto de partida para estudos mais complexos de epidemiologia genética, como a identificação de genes responsáveis pela característica em análise. Nas áreas de Ciências do Desporto e Educação Física, alguns estudos têm sido realizados para verificar a existência de agregação familiar e a influência genética em traços relacionados a estados de saúde, atividade e desempenho físicos. Entretanto, esses esforços revelam-se escassos em populações lusófonas e são, praticamente inexistentes, na população brasileira. Dessa forma, o presente artigo teve como propósito abordar, de forma simples e introdutória, aspectos importantes de estudos em famílias nucleares. Para tanto, foram analisadas as duas fases iniciais dos estudos de Epidemiologia Genética, ou seja, a identificação e quantificação da agregação familiar e da heritabilidade. As diferentes etapas de análise foram exemplificadas com dados reais, coletados em famílias nucleares pertencentes a um estudo realizado na cidade de Muzambinho-MG. Espera-se que esse artigo forneça subsídios e estímulo aos pesquisadores iniciantes neste tipo de investigação.

Unitermos: Agregação familiar; Heritabilidade; Perímetro da cintura; Volume semanal de atividade física; Muzambinho.

ABSTRACT

Studies with nuclear families allow the identification of familiar aggregation, as well as the estimation of how much of the variability in a characteristic might be attributed to genetic differences among subjects. Results from these studies are starting points for more complex genetic research, including the identification and relevance of candidate genes. In Sport Science, studies have analyzed the possible existence of familiar aggregation and genetic influence on phenotypes marking physical activity, fitness, and health status. However, few studies were conducted with Portuguese speaking populations, and even fewer with Brazilian populations. Therefore, the present paper aims to discuss, at an introductory level, important aspects about nuclear family studies. The first two phases of Genetic Epidemiology research outline - familiar aggregation and heritability - were approached. The different steps of analysis were exemplified with real data collected in nuclear families from a study conducted in Muzambinho-MG. We hope this paper provides enough background and stimuli for the newcomers in this area of study.

Uniterms: Familiar aggregation; Heritability; Waist circumference; Weekly volume of physical activity; Muzambinho.

Introdução

Numa pesquisa científica é comum partir-se de problemas complexos para descrever as variáveis em estudo e interpretar os seus significados. Essas variáveis, geralmente contínuas, possuem um atributo essencial - têm valores distintos entre sujeitos, apresentando uma grande variabilidade de expressão numa dada população (Bouchard, Malina & Pérusse, 1997; Maia, Seabra, Garganta, Chaves, Souza & Santos, 2010a). Por exemplo, em 204 adultos de ambos os sexos da cidade de Muzambinho, o perímetro da cintura (importante indicador de risco cardiovascular) variou de 66 a 125 cm, enquanto o volume semanal de atividade física apresentou resultados que se situavam entre 0 e 5400 min/semana1 1 . O valor zero representa o relato, por parte dos entrevistados, de que não se locomoviam com meios que necessitassem de atividade física, sua atividade laboral era basicamente sedentária e não praticavam atividades físicas em seu tempo de lazer. (FIGURA 1).


A variação quantitativa ocorrida num determinado traço (fenótipo ou característica) parece depender de um conjunto de fatores denominados, genericamente, de genéticos e ambientais, sendo relevante quantificar a participação relativa de cada um na explicação da variância total da característica em análise (Beunen & Thomis, 1999; Bouchard, Malina & Pérusse, 1997; Burton, Tobin & Hopper, 2005; Feitosa & Krieger, 2002; Maia et al., 2010a; Rao, 2001; Rice & Borecki, 2001). Se a variância de um dado fenótipo for explicada na sua totalidade (i.e.100%) por fatores genéticos (como são, por exemplo, as características de algumas doenças monogênicas raras), intervenções ambientais (como, por exemplo, a dieta ou os fármacos) têm pouca chance de conseguir modificá-lo. Porém, na medida em que o componente ambiental ganha maior contribuição relativa na expressão da característica, as manipulações do ambiente passam a ter maior relevância. O conhecimento preciso e esclarecido acerca dos modos de transmissão de determinadas características permite a identificação de subconjuntos de sujeitos aparentados com maior ou menor propensão a apresentar aquela característica, possibilitando a intervenção atempada em indivíduos de maior risco.

A Epidemiologia Genética (EG) é uma área de estudo confluente entre a Epidemiologia, a Genética Humana e a Estatística, que se ocupa, genericamente, dos determinantes de um conjunto multifacetado de fenótipos descritores de estados patológicos (i.e., doenças) e de saúde, fazendo a ligação entre fatores genéticos e ambientais transmitidos ao longo de gerações (Burton, Tobin & Hopper, 2005; Feitosa & Krieger, 2002; Maia et al., 2010a). A exploração interpretativa oriunda da EG percorre sequencialmente diferentes etapas(Beunen & Thomis, 1999; Bouchard, Malina & Pérusse, 1997; Burton, Tobin & Hopper, 2005; Feitosa & Krieger, 2002; Maia et al., 2010a; Rice & Borecki, 2001):

1) Estudos de agregação familiar - analisam a presença de associações significantes (razão de chances, correlações intraclasse, análise de variância) de um determinado fenótipo entre membros de uma família com diferentes graus de parentesco;

2) Estudos de heritabilidade - quantificam a magnitude da contribuição relativa da agregação familiar expressa pelos fatores genéticos num dado fenótipo;

3) Estudos de "linkage" - pesquisam a cossegregação (cotransmissão) de marcadores genéticos em sujeitos aparentados com o propósito de identificar regiões cromossômicas que contêm genes candidatos para explicar a associação evidenciada;

4) Estudos de associação - avaliam a magnitude da relação entre um determinado gene candidato e respectivos alelos e a ocorrência do fenótipo em causa em indivíduos geralmente não aparentados, num delineamento clássico de caso-controle.

Este artigo aborda as duas primeiras etapas, que são passos essenciais num estudo de EG, pois a investigação acerca da arquitetura genética de um fenótipo só se justifica perante evidências inequívocas da existência de agregação familiar e de contribuição genética substancial nessa agregação (Rao, 2001).

Na literatura internacional, alguns pesquisadores têm avaliado as contribuições relativas - genéticas e ambientais - em diversos fenótipos de saúde e atividade física. A heritabilidade (h2) - proporção da variância total que pode ser atribuída a fatores genéticos - de diferentes indicadores de gordura corporal, por exemplo, foi reportada em 19 estudos (Fermino, Garaganta, Seabra & Maia, 2007), enquanto nove trabalhos estimaram o contributo genético para os níveis de atividade física (Chaves, Souza, Santos, Garganta, Seabra & Maia, 2010).

A pesquisa centrada no paradigma da EG no território das Ciências do Desporto e Educação Física é relativamente reduzida no espaço lusófono, sendo praticamente inexistente no Brasil. Na base de dados MedLine, só foi possível localizar sete trabalhos relacionados com distintos marcadores de saúde cardiovascular (Colletto, Cardon & Fulker, 1993; De Oliveira, Pereira, De Andrade, Soler & Krieger, 2008; Krieger, Morton, Rao & Azevedo, 1980; Province & Rao, 1985; Rao, MacLean, Morton & Yee, 1975; Robinson, Borges-Osorio, Callegari-Jacques, Achutti, Da Silveira, Klein & Costa, 1991; Velasquez-Melendez, Parra, Gazzinelli, Williams-Blangero & Correa-Oliveira, 2007) e nenhum sobre aptidão física ou atividade física, conduzido em uma população brasileira (pesquisa realizada em junho de 2010).

Estrutura do artigo

Para facilitar a compreensão, o artigo foi dividido em cinco partes, que percorrem os aspectos relacionados: 1) ao delineamento de um estudo e coleta dos dados; 2) à tabulação da informação; 3) à análise exploratória inicial e normalização das distribuições; 4) à representação gráfica da agregação familiar e suas medidas descritivas; e 5) à quantificação e interpretação da heritabilidade.

Partiu-se de dados provindos de 138 famílias nucleares da cidade de Muzambinho-MG, que participaram de um estudo temático cujos objetivos e características foram anteriormente descritos (Basso, Junior, Oliveira, Forjaz, Souza, Prista, Maia & Tani, 2009). Esse estudo teve a aprovação do Comitê de Ética da Escola de Educação Física e Esporte da USP (processo CEP-EEFE-USP: CAAE-0033.0.342.000-07). Os dados foram coletados de abril/08 a novembro/09.

Duas variáveis foram abordadas: o perímetro da cintura (C), que foi medido na altura da cicatriz umbilical, e o volume semanal de atividade física (VAF), que foi avaliado a partir da informação coletada numa entrevista sobre práticas físicas realizadas em diversos contextos: locomoção, trabalho, escola, recreio e lazer.

Dessa forma, o propósito do presente artigo foi abordar, de forma simples e introdutória, aspectos importantes de estudos de agregação familiar e heritabilidade, visando fornecer subsídios e estímulo aos iniciantes neste tipo de investigação.

Delineamento de estudos e coleta de dados

Num delineamento centrado na agregação familiar e heritabilidade, a viabilidade da execução, o poder estatístico e a relação custo-efetividade devem ser considerados (Rao, 2001). Para tanto, aspectos relativos à amostragem, fenotipagem e procedimentos analíticos precisam ser cuidadosamente planejados (Feitosa & Krieger, 2002).

Os estudos de agregação familiar e heritabilidade englobam, geralmente, famílias nucleares (pais e filhos), "pedigrees" extensos (filhos, pais, avôs, tios, primos, etc.) ou gêmeos mono e dizigóticos (Bouchard, Malina & Pérusse, 1997; Rice & Borecki, 2001). O delineamento envolvendo famílias nucleares, i.e. duas gerações, permite avaliar aspectos da agregação familiar de uma determinada característica, mas não fraciona, da variância total, a parte que se refere aos fatores genéticos daquela relativa ao ambiente cultural da família. A diferenciação dessas contribuições pode ser obtida em estudos de pedigrees extensos a partir da inclusão de um novo parâmetro no modelo - um índice de ambiente compartilhado - elaborado com base na obtenção de várias informações provenientes da família, e que é designado por "household effect" (Bouchard, Malina & Pérusse, 1997; Burton, Tobin & Hopper, 2005; Rice & Borecki, 2001). Entretanto, a amostragem em "pedigrees" extensos é de difícil obtenção, havendo normalmente perda substancial de informação (dados omissos), o que torna difícil estimar a magnitude e significado do "household effect" (Bouchard, Malina & Pérusse, 1997; Rice & Borecki, 2001). Torna-se, portanto, importante conhecer as limitações de cada procedimento de amostragem a fim de se utilizar ferramentas estatísticas para minimizar os problemas associados à estimação de parâmetros e respectiva precisão, bem como a sua consideração na interpretação dos resultados.

O número de sujeitos necessários deve ser definido em razão do poder estatístico do estudo, que leva em consideração a precisão da medição do fenótipo; deve-se considerar também a viabilidade, os custos e a efetividade (Feitosa & Krieger, 2002; Rao, 2001). Em estudos de famílias nucleares, nem sempre é fácil se obter amostras de grandes dimensões, i.e., centenas de famílias. Assim, algumas vezes as famílias são recrutadas em virtude de terem membros portadores dos fenótipos desejados o que, se por um lado aumenta o poder estatístico, por outro viola, num certo sentido, a noção de aleatoriedade da seleção. Contudo, quando se lida com famílias, esse pressuposto pode ser relaxado em função dos propósitos da pesquisa, sem a perda de seu poder de generalização. Há métodos de correção para amostras selecionadas, designados por correção para "ascertainment" (Burton, Tobin & Hopper, 2005).

No estudo das famílias de Muzambinho, as crianças-alvo (que não foram escolhidas em função de nenhuma particularidade) foram as que tinham 10 anos entre os alunos de escolas públicas sorteados para o projeto temático anteriormente descrito. Foram estudadas 251 (135 meninos e 116 meninas) crianças (4,4% dos habitantes de cinco e 18 anos da cidade) (Brasil. MEC.INEP, 2009), que pertenciam a 138 famílias, das quais foram avaliados 95 pais e 129 mães.

O fenótipo a ser investigado precisa ser definido e medido com grande precisão. Um problema frequente no estudo de famílias se relaciona à métrica das variáveis face ao efeito geracional em causa. Por exemplo, a aptidão aeróbia de pais e filhos pode ser medida pelo teste de uma milha nas crianças e o teste de Cooper nos adultos, o que gera variáveis que expressam, indiretamente, o mesmo aspecto fisiológico mas com unidades diferentes (tempo e distância, respectivamente). A comparação entre gerações, portanto, torna necessária a equiparação dessa variável, o que dificulta, de algum modo, a análise dos dados. Procedimentos de avaliação da qualidade dos dados, como a execução de medidas múltiplas e a obtenção de informações suplementares de reprodutibilidade da medida são altamente desejáveis (Feitosa & Krieger, 2002).

A identificação de possíveis covariáveis (características que podem influenciar a variabilidade do fenótipo em questão) bem como a determinação da quantidade de variância que extraem do fenótipo em estudo são necessárias. Essa etapa permite obter um refinamento adequado do fenótipo (Bouchard, Malina & Pérusse, 1997). Nos estudos de agregação familiar e heritabilidade, a idade, o sexo e suas interações são covariáveis importantes. É também provável que outras características dos sujeitos possam ser coinfluentes. Por exemplo, o efeito do índice de massa corporal num estudo sobre o perímetro da cintura deve ser considerado.

Uma vez definido o delineamento do estudo, estrutura-se e executa-se o plano de trabalho: obtenção de parcerias e permissões; esclarecimento aos envolvidos; treinamento da equipe; e obtenção de consentimento dos sujeitos.

A qualidade dos resultados depende, sobremaneira, da coleta dos dados. O local deve permitir a realização adequada de cada medida, a preservação do anonimato da família e o conforto da mesma. Os instrumentos de anotação precisam ser de fácil compreensão e manuseio. Para minimizar as desistências, comuns neste tipo de estudo, estratégias de motivação e busca de perdas devem ser instituídas.

Tabulação de dados

No estudo completo das famílias de Muzambinho foram avaliadas cerca de 40 variáveis nos 475 sujeitos, totalizando mais de 19000 células de dados. Para minimizar a chance de erros de entrada, a dupla digitação em "softwares" adequados, como o Access (Office for Windows), e a comparação dos dois arquivos em programas como o EpiInfo (United States Department Of Health And Human Services, 2005) são indicadas.

A estrutura familiar, conhecida como árvore familiar ou "pedigree", deve ser estabelecida e se compõe da descrição de quem são os pais (fundadores), os filhos e a relação de parentesco biológico entre eles. Para exemplificar, tomemos por base as famílias apresentadas na FIGURA 2.


Uma forma de tabulação desses pedigrees, chamada de formato "linkage", é a colocação dos dados de cada membro da família em linhas de tabulação e a utilização de cinco colunas para definir a estrutura familiar: família, posição, pai, mãe e sexo. Esse formato é utilizado em praticamente todos os "softwares" de EG. Como se observa na TABELA 1, na coluna família, estabelece-se a que núcleo familiar pertence cada sujeito. Na coluna posição, faz-se para cada família uma numeração contínua, seguindo das gerações ascendentes para as descendentes e iniciando-se com o ascendente do sexo masculino. Num estudo de famílias, todos os descendentes precisam ter relações familiares estabelecidas, mesmo que não haja dados de um dos fundadores, sendo necessário criar uma linha de tabulação para o pai ou a mãe ausente, como na família 2, o pai 3. As colunas pais e mães estabelecem o vínculo biológico (quem é pai de quem) a partir da identificação do número de posição dos pais e mães de cada sujeito. No caso de famílias nucleares, os fundadores não têm ascendentes e, portanto, coloca-se zero ou deixa-se em branco essas colunas. Na coluna sexo, no exemplo, 1 é homem e 2 mulher.

As demais colunas da tabulação devem conter os fenótipos (contínuos ou binários) de interesse, bem como todas as covariáveis. No exemplo, são apresentadas variáveis numéricas contínuas. Os dados de C, por exemplo, poderiam ser classificados em normais (1) ou alterados (2) numa nova coluna. No caso de variáveis com mais de duas categorias, essas precisam ser transformadas em binárias, visto que não estão disponíveis "softwares" que estimem contributos genéticos de variáveis com mais de duas categorias, i.e., variáveis numa escala ordinal. Quando há dados omissos, a célula deve ficar em branco, sem dados.

Análise exploratória de dados

A análise exploratória dos dados pode ser feita em qualquer "software" de análise estatística (SPSS, SAS, STATA) e tem por finalidade: identificar valores anormais, verificar a presença de valores extremos, analisar a dimensão e estrutura da informação omissa, e verificar a normalidade da distribuição de cada variável. Valores máximos e mínimos incoerentes com valores biológicos devem ser revistos. A presença de valores extremos ("outliers") deve ser, preferencialmente, inspecionada nos diagramas de caule e folhas (do inglês "stem and leaf" ) e no gráfico de extremos e quartis (do inglês "box-plot"). Os extremos identificados devem ser inicialmente avaliados quanto à sua exatidão e, posteriormente, deve-se decidir por sua exclusão, substituição ou permanência. Dados omissos em excesso reduzem o poder dos testes estatísticos e a generalização dos resultados, enquanto a distribuição não aleatória dessas omissões fere pressupostos importantes da análise, sendo necessário identificar sua causa e considerá-la nos cálculos e na interpretação dos resultados. Há algum esforço de estudo(Fridley & De Andrade, 2008) sobre a influência de métodos de imputação de dados no viés das estimativas obtidas em estudos de famílias, mas a sua discussão foge ao escopo deste artigo.

A normalidade da distribuição dos dados é uma dos pressupostos para a análise da agregação familiar e da heritabilidade. Ela pode ser identificada graficamente (histogramas com curva normal da FIGURA 1) ou por testes formais, como por exemplo o de Kolmogorov-Smirnov. Sempre que há violação desse pressuposto, deve-se recorrer a transformações adequadas em qualquer programa de estatística. Existem "softwares", como o STATA(STATACORP, 1996), que têm automatizado diferentes tipos de transformações (logarítmica, inversa, entre outras) e testam, formalmente, a mais adequada em cada situação. Além disso, alguns "softwares" de EG possuem procedimentos internos para resolver o problema da normalização da distribuição dos dados. Por exemplo, o "software" SOLAR(Southwest Foundation for Biomedical Research - SFBR, 1995) tem implementado um método baseado no inverso da distribuição normal para normalizar as variáveis (ALMASY & BLANGERO, 1998).

Análise de agregação familiar

A agregação familiar numa dada característica acontece quando a semelhança dessa característica entre os seus membros é maior do que a esperada por mero acaso (Beunen & Thomis, 1999; Bouchard, Malina & Pérusse, 1997; Burton, Tobin & Hopper, 2005; Feitosa & Krieger, 2002; Maia et al., 2010a). Essa agregação reflete, na sua essência, a similaridade genética e cultural (por exemplo, hábitos de vida, crenças, conceitos) dentro do seio de cada família (Beunen & Thomis, 1999; Bouchard, Malina & Pérusse, 1997; Burton, Tobin & Hopper, 2005; Feitosa & Krieger, 2002; Maia et al., 2010a).

Uma etapa prévia à identificação da agregação familiar reclama uma inspeção detalhada à estrutura das famílias, o que pode ser realizada em diferentes "softwares", dos quais o PEDSTATS (Wigginton & Abecasis, 2005) é um bom exemplo. Como se observa na FIGURA 3 ("output" do PEDSTATS), as 138 famílias de Muzambinho são formadas por 537 pessoas, sendo 286 fundadores e 254 mulheres. Em média, apresentam 3,89 membros, variando de três a nove. Como se trata de um estudo de famílias nucleares há apenas duas gerações presentes. O "output" contém também estatísticas básicas dos fenótipos C e VAF, além das possíveis covariáveis, no caso, sexo, idade e índice de massa corporal (IMC).


Um procedimento gráfico adequado para mostrar a presença de agregação é o referido na FIGURA 4, que foi construído no "software" HLM 6.02 (Raudenbush, Bryk & Congdon, 2004). Os valores da variável nos diferentes elementos de cada família, já ajustados para as covariáveis significantes, são representados por uma caixa de extremos e quartis. As caixas são ordenadas em função dos valores medianos de cada família, na esperança de se encontrar um comportamento ascendente, como o observado nos dois painéis da FIGURA 4, o que evidencia a presença de maior variação entre as famílias do que dentro das famílias e, portanto, sugere a agregação familiar relevante nos fenótipos estudados (Maia et al., 2010a).


A análise quantitativa da agregação familiar avalia o quanto da variância total (VT) do fenótipo se deve à variância entre famílias (VF). Quando há agregação, a VF deve ser maior que variação residual ou intrafamílias, o que pode ser testado por um modelo de ANOVA com efeitos aleatórios ou pelo cálculo da correlação inter-cluster (Beunen & Thomis, 1999; Burton, Tobin & Hopper, 2005). Na TABELA 2, o valor da razão de F das duas variáveis é significante e maior do que um, o que reflete a existência de agregação familiar nos fenótipos em causa, i.e. há cerca de duas vezes mais variação entre famílias do que intrafamília.

Essa agregação também é evidenciada quando os coeficientes de correlação entre os membros da família são maiores que zero (Beunen & Thomis, 1999; Bouchard, Malina & Pérusse, 1997; Burton, Tobin & Hopper, 2005; Maia et al., 2010a; Rice & Borecki, 2001). Esses coeficientes variam entre os diferentes pares de parentes em virtude da relação genética existente entre eles. Assim, espera-se que a correlação seja elevada entre gêmeos monozigóticos. Em pares de parentes que partilham, em média, metade dos genes idênticos por descendência (pais-filhos, gêmeos dizigóticos e irmãos), essa correlação deve ser metade da observada nos monozigotos. Correlações maiores que as esperadas indicam a influência do ambiente familiar comum, o que também é sugerido pela existência de correlação significante entre mãe e pai, que não compartilham informação genética (Beunen & Thomis, 1999).

O cálculo das correlações pode ser feito por diversos "softwares", como por exemplo, o SAGE (Case Western Reserve University, 2009). O teste formal dos resultados é feito pela divisão do valor obtido nas correlações pelo seu erro padrão, sendo a significância aceita quando o resultado for superior a 1,96.

Um exemplo pode ser observado na TABELA 3. Considerando-se a variável C, as correlações variaram de 0,105 a 0,390, sendo significantes entre irmã-irmão, irmã-irmã e pai-mãe. A ausência de significância nos diferentes pares formados por fundadores e descendentes pode ser parcialmente explicada pelo tamanho amostral, visto que se a correlação fosse calculada para os dados desses pares em conjunto, a dimensão amostral seria bem maior e o coeficiente de correlação (r = 0,157) passaria a ser significante. Esse resultado realça o aspecto anteriormente discutido sobre a importância do tamanho da amostra(KEEN & ELSTON, 2003).

Avaliando-se os resultados relativos ao VAF, observa-se que as correlações entre os diferentes pares variaram de 0,055 a 0,484 e foram significantes nos pares: mãe-filha, irmão-irmão, irmã-irmão e pai-mãe. Além do tamanho amostral, outro aspecto que pode ser levantado para a discussão da grande variedade de resultados entre as correlações de parentes de primeiro grau, diz respeito à precisão do indicador utilizado para se avaliar o fenótipo. Qualquer técnica de medição tem limitações. No exemplo, o VAF foi avaliado por entrevista, o que implica em imprecisões decorrentes da capacidade de lembrança do entrevistado, do entendimento das questões formuladas, da clareza da resposta e da interpretação feita pelo avaliador. Embora cuidados sejam tomados para padronizar esses aspectos, na maioria das vezes as limitações são irremediáveis. De fato, elas podem reduzir, em maior ou menor grau, a precisão dos fenótipos, afetando a magnitude e significância das correlações obtidas.

É interessante observar ainda no exemplo, que a correlação entre mãe e pai foi significante nas duas variáveis, o que sugere a influência do ambiente compartilhado pelos progenitores.

Cálculo da heritabilidade

Quando uma característica se agrega em famílias, o próximo passo é estimar, quantitativamente, a contribuição genética, ou seja, a heritabilidade (h2) desse fenótipo (Beunen & Thomis, 1999; Bouchard, Malina & Pérusse, 1997; Burton, Tobin & Hopper, 2005; Maia et al., 2010a; Rice & Borecki, 2001).

O cálculo da h2 se baseia num modelo teórico explicativo dos fatores de influência na variabilidade de fenótipos complexos. Num modelo simplificado, a VT compreende, basicamente, dois componentes: a variância genética (VG) e a ambiental (VA). Num segundo momento, a VA pode ser segmentada em ambiente compartilhado pela família (VC) e ambiente único ou específico de cada sujeito (VE). Assim: VT = VG + VC + VE (Beunen & Thomis, 1999; Bouchard, Malina & Pérusse, 1997; Burton, Tobin & Hopper, 2005; Maia, Seabra, Silva, Freitas, Gouveia & Basso, 2010b; Rice & Borecki, 2001). As contribuições relativas de cada componente são estimadas pela razão entre suas variâncias específicas e a variância total. Por exemplo: h2 = VG/VT.

O cálculo da h2 assume alguns pressupostos: 1) efeito genético aditivo (múltiplos genes somam pequenos efeitos à VT); 2) inexistência de interação entre ambiente e genes (diferentes genótipos respondem da mesma forma ao mesmo fator ambiental); 3) inexistência de correlação entre genes e ambiente (todos os genótipos são expostos a ambientes semelhantes); e 4) acasalamento não seletivo (Beunen & Thomis, 1999; Bouchard, Malina & Pérusse, 1997; Burton, Tobin & Hopper, 2005; Maia et al., 2010b; Rice & Borecki, 2001).

Nos estudos de famílias nucleares, como a diferenciação das contribuições únicas do ambiente comum e dos fatores genéticos não é possível2 2 . A não se que se especifique com rigor o que se entende por ambiente comum e se possa obter medidas fidedignas desse ambiente. , a h2 estimada reflete o limite superior da contribuição genética para a VT do fenótipo na população.

A estimativa mais simples é calculada por duas vezes a média das correlações obtidas entre pares de parentes de primeiro grau (pais-filhos e irmãos) (Rice & Borecki, 2001):

h2= 2 (média rparentes 1ºgrau).

Essa estimativa pode ser refinada, incluindo-se a correlação observada entre o casal de progenitores biológicos:

h2 = [(rirmãos + rpais-filhos) x (1+ rpais)] / (1 + rpais+2 x rpais x rpais-filhos)

Previamente à estimativa da h2, os dados devem ser ajustados às covariáveis, e os resíduos obtidos é que são utilizados no cálculo (Bouchard, Malina & Pérusse, 1997; Maia et al., 2010a). Diversos softwares estimam h2, mas o SOLAR (SFBR, 1995) é bastante interessante para essa finalidade, pois possui ferramentas que possibilitam o ajuste da normalidade da distribuição dos resíduos e a correção de curtose (achatamento), quando necessários.

Para a análise da h2, usualmente, testam-se, de forma sequencial, modelos de complexidade crescente. Nos exemplos apresentados (FIGURAS 5 e 6), um modelo designado por esporádico (sem efeito de semelhança familiar) é testado relativamente a um modelo poligênico (que contém um parâmetro adicional de efeito genético). A qualidade de cada modelo é definida por uma quantidade designada por verossimilhança e essas quantidades são comparadas, obtendo-se um valor de χ2 (qui-quadrado). Na presença de heritabilidade significante, espera-se que o melhor modelo, o poligênico, tenha um logaritmo de verossimilhança significantemente menor que o esporádico.



Para exemplificar, tomemos o cálculo da h2 do VAF apresentado na FIGURA 5. O modelo incluiu como covariáveis idade e sexo*idade que, em conjunto, explicaram cerca de 15% da VT do fenótipo. Os resíduos apresentaram distribuição e curtose normais e a h2 foi estimada em 0,24 com erro padrão de 0,09, sendo significante. Assim, aproximadamente 24% da VT do VAF é atribuída ao fato de os sujeitos de Muzambinho serem geneticamente distintos3 3 . Lembramos os leitores que por ser um estudo de famílias nucleares, a h 2 calculada corresponde ao limite superior . Cabe atentar para a grande magnitude do erro padrão, o que nos remete à questão anteriormente discutida quanto ao tamanho da amostra.

A mesma análise é apresentada na FIGURA 6 para a variável C. No entanto, essa análise requer mais cuidado. No modelo 1, considerando-se as covariáveis "clássicas" (idade, sexo e suas derivadas), identifica-se claramente um problema de curtose e a h2 não é significante. Por outro lado, incluindo-se o IMC como covariável, a curtose torna-se normal e a estimativa de h2 aumenta consideravelmente (11 para 31%), tornando-se significante. Ressalta-se, no entanto, que a inclusão do IMC fez com que 92% da VT fosse explicada pelas covariáveis, o que reduziu a magnitude de variância do fenótipo em causa. Por ser uma medida relativa, a magnitude da h2varia consideravelmente em função da magnitude de VT na população estudada e das covariadas que são incluídas na análise e, por esses motivos, esses aspectos precisam ser vistos com cautela (Burton, Tobin & Hopper, 2005).

Considerações finais

Os estudos em famílias nucleares permitem avaliar a contribuição das influências genéticas e ambientais para a variação de uma determinada característica, que se expressa numa dada população. Os estudos de agregação familiar e heritabilidade se referem às primeiras duas etapas da EG e possibilitam responder progressivamente às seguintes questões:

a) A variabilidade do fenótipo dentro do seio familiar é menor que entre diferentes famílias? A análise gráfica do comportamento das caixas de extremos e quartis ordenadas pela mediana e o cálculo da ANOVA permitem a resposta a essa primeira pergunta.

b) Se sim, será que os indivíduos com maior grau de parentesco apresentam maior associação do fenótipo em causa? O cálculo dos coeficientes de correlação entre os diferentes pares de familiares é utilizado para responder a essa pergunta.

c) Se há agregação, quanto da VT do fenótipo pode ser explicada pelos fatores genéticos? As estimativas de h2 permitem responder a essa questão.

Em relação aos dados de Muzambinho usados como exemplo neste artigo, a h2 de C e VAF foram significantes, explicando 31 e 24% da VT dos respectivos fenótipos. Esses valores estão de acordo com a variação evidenciada na literatura. Revisões bibliográficas relatam que as h2de diferentes fenótipos da composição corporal variam de 30 a 76% (Fermino et al., 2007), enquanto as do nível de atividade física oscilam de 19 a 57% (Chaves et al., 2010).

Apesar da grande variação na magnitude de h2, a existência de significância em diferentes populações fortalece a presença de um substrato genético importante na determinação daquela característica. Conhecer a magnitude da contribuição específica em cada população permite a elaboração de estratégias também específicas de atuação, o que provavelmente resulta em maior efetividade das mesmas.

Desta forma, continuar estudando diferentes aspectos de similaridade no seio de famílias em diferentes fenótipos da população brasileira, cuja informação seja escassa, é desejável. Esse artigo espera ter estimulado os iniciantes nessa área de investigação, dando-lhes alguma noção do caminho a ser trilhado.

Notas

Recebido para publicação: 06/07/2010

Aceito: 26/01/2011

  • ALMASY, L.; BLANGERO, J. Multipoint quantitative-trait linkage analysis in general pedigrees. American Journal Human of Genetics, Chicago, v.62, n.5, p.1198-211, 1998.
  • BASSO, L.; JUNIOR, C.M.; OLIVEIRA, J.A.; FORJAZ, C.L.M.; SOUZA, J.A.D.; PRISTA, A.; MAIA, J.A.R.; TANI, G. Crescimento e desenvolvimento motor de escolares de Muzambinho: um estudo com implicações acadêmicas, sociais e de política interinstitucional. Revista Portuguesa de Ciências do Desporto, Porto, v.9, n.2-3, p.247-57, 2009.
  • BEUNEN, G.; THOMIS, M. Genetic determinants of sports participation and daily physical activity. International Journal of Obesity and Related Metabolic Disorders, London, v.23, p.S55-63, 1999. Supplement 3.
  • BRASIL. MINISTÉRIO DA EDUCAÇÃO. INSTITUTO NACIONAL DE ESTUDOS E PESQUISAS EDUCACIONAIS. Censo da Educação Superior. 2007 Brasília: INEP, 2009. Disponível em: <http://download.inep.gov.br/download/superior/censo/2007/Resumo_tecnico_2007.pdf>
  • BOUCHARD, C.; MALINA, R.M.; PÉRUSSE, L. Genetics of fitness and physical performance Champaign: Human Kinetics 1997.
  • BURTON, P.R.; TOBIN, M.D.; HOPPER, J.L. Key concepts in genetic epidemiology. Lancet, New York, v.366, n.9489, p.941-51, 2005.
  • CASE WESTERN RESERVE UNIVERSITY. Department of Epidemiology and Biostatistics. S.A.G.E: Statistical Analysis for Genetic Epidemiology. Cleveland: Case Western Reserve University, 2009. Disponível em: <http://darwin.cwru.edu/sage/>
  • CHAVES, R.N.; SOUZA, M.C.; SANTOS, D.; GARGANTA, R.; SEABRA, A.; MAIA, J.A.R. Agregação familiar nos níveis de atividade física: um resumo do estado da arte. Revista Brasileira de Atividade Física e Saúde, Londrina, v.15, n.1, p.19-26, 2010.
  • COLLETTO, G.M.; CARDON, L.R.; FULKER, D.W. A genetic and environmental time series analysis of blood pressure in male twins. Genetic Epidemiology, New York, v.10, n.6, p.533-8, 1993.
  • DE OLIVEIRA, C.M.; PEREIRA, A.C.; DE ANDRADE, M.; SOLER, J.M.; KRIEGER, J.E. Heritability of cardiovascular risk factors in a Brazilian population: Baependi Heart Study. BMC Medical Genetics, London, v.9, p.32, 2008.
  • FEITOSA, M.F.; KRIEGER, H. O futuro da epidemiologia genética de característivas complexas. Ciência e Saúde Coletiva, Rio de Janeiro, v.7, n.1, p.73-83, 2002.
  • FERMINO, R.C.; GARAGANTA, R.; SEABRA, A.; MAIA, J.A.R. Efeitos genéticos e ambientais no indicadores da composição corporal. Uma revisão centrada em estrudos de agregação familiar. Revista Brasileira de Cineantropometria e Desempenho Humano, Florianópolis, v.9, n.4, p.414-23, 2007.
  • FRIDLEY, B.L.; DE ANDRADE, M. Missing phenotype data imputation in pedigree data analysis. Genetic Epidemiology, New York, v.32, n.1, p.52-60, 2008.
  • KEEN, K.J.; ELSTON, R.C. Robust asymptotic sampling theory for correlations in pedigrees. Statistics in Medicine, Chichester, v.22, n.20, p.3229-47, 2003.
  • KRIEGER, H.; MORTON, N.E.; RAO, D.C.; AZEVEDO, E. Familial determinants of blood pressure in northeastern Brazil. Human Genetics, Berlin, v.53, n.3, p.415-8, 1980.
  • MAIA, J.A.R.; SEABRA, A.; GARGANTA, R.; CHAVES, R.N.; SOUZA, M.C.; SANTOS, D. Factores geneticos e ambientais nos níveis de actividade físico-desportivas: um estudo em famílias nucleares portuguesas. In: BENTO, J.O.; TANI, G.; PRISTA, A. (Ed.). Desporto e educação física em português Porto: Multitema, 2010. p.188-216.
  • MAIA, J.A.R.; SEABRA, A.; SILVA, R.M.G.; FREITAS, D.L.; GOUVEIA, E.Q.R.; BASSO, L. Análise de dados gemelares: uma aventura guiada para investigadores das Ciências do Desporto. Revista Brasileira de Educação Física e Esporte, São Paulo, v.25, n.2, p.351-68, 2010.
  • PROVINCE, M.A.; RAO, D.C. Path analysis of family resemblance with temporal trends: applications to height, weight, and Quetelet index in northeastern Brazil. American Journal of Human Genetics, Chicago, v.37, n.1, p.178-92, 1985.
  • RAO, D.C. Genetic dissection of complex traits: an overview. In: RAO, D.C.; PROVINCE, M.A. (Eds.). Genetic dissection of complex traits San Diego: Academic Press, 2001. p.13-34.
  • RAO, D.C.; MacLEAN, C.J.; MORTON, N.E.; YEE, S. Analysis of family resemblance. V. Height and weight in northeastern Brazil. American Journal of Human Genetics, Chicago, v.27, n.4, p.509-20, 1975.
  • RAUDENBUSH, S.; BRYK, A.; CONGDON, R. HLM6: Hierarchical Linear and Nonlinear Modeling. Lincolnwood: Scientific Software International, 2004.
  • RICE, T.K.; BORECKI, I.B. Familial ressemblance and heritability. In: RAO, D.C.; PROVINCE, M.A. (Eds.). Genetic dissection of complex traits San Diego: Academic Press, 2001. p.35-43.
  • ROBINSON, W.M.; BORGES-OSORIO, M.R.; CALLEGARI-JACQUES, S.M.; ACHUTTI, A.C.; DA SILVEIRA, L.G.; KLEIN, C.H.; COSTA, E.A. Genetic and nongenetic determinants of blood pressure in a southern Brazilian sample. Genetic Epidemiology, New York, v.8, n.1, p.55-67, 1991.
  • SOUTHWEST FOUNDATION FOR BIOMEDICAL RESEARCH (SFBR). SOLAR: Sequential Oligogenic Linkage Analysis Routines. San Antonio: SFBR, 1995. Disponível em: <http://www.sfbr.org>
  • STATACORP. STATA: Data analysis and statistical software. College Station: StataCorp LP, 1996. Disponível em: <http://www.stata.com>
  • UNITED STATES DEPARTMENT OF HEALTH AND HUMAN SERVICES. Centers for Disease Conrol and Prevention (CDC). EpiInfo TM 2005 Atlanta: CDC, 2005. Disponível em: <www.cdc.gov/epiinfo>
  • VELASQUEZ-MELENDEZ, G.; PARRA, F.C.; GAZZINELLI, A.; WILLIAMS-BLANGERO, S.; CORREA-OLIVEIRA, R. Genetic determinants of risk factors for cardiovascular disease in a population from rural Brazil. Human Biology, Detroit, v.79, n.2, p.179-90, 2007.
  • WIGGINTON, G.E.; ABECASIS, G.R. PEDSTATS: descriptive statistics, graphics and quality assessment for gene mapping data. Bioinformatics, Oxford, v.21, n.16, p.3445-7, 2005.
  • 1
    . O valor zero representa o relato, por parte dos entrevistados, de que não se locomoviam com meios que necessitassem de atividade física, sua atividade laboral era basicamente sedentária e não praticavam atividades físicas em seu tempo de lazer.
  • 2
    . A não se que se especifique com rigor o que se entende por ambiente comum e se possa obter medidas fidedignas desse ambiente.
  • 3
    . Lembramos os leitores que por ser um estudo de famílias nucleares, a h
    2 calculada corresponde ao limite superior
  • Endereço:

    Cláudia Lúcia de Moraes Forjaz
    Escola de Educação Física e Esporte - USP
    Av. Prof. Mello Moraes, 65
    05508-030 - São Paulo - SP - BRASIL
    e-mail:
  • Datas de Publicação

    • Publicação nesta coleção
      24 Jan 2012
    • Data do Fascículo
      Dez 2011

    Histórico

    • Aceito
      26 Jan 2011
    • Recebido
      06 Jul 2010
    Escola de Educação Física e Esporte da Universidade de São Paulo Av. Prof. Mello Moraes, 65, 05508-030 São Paulo SP/Brasil, Tel./Fax: (55 11) 3091 3147 - São Paulo - SP - Brazil
    E-mail: reveefe@usp.br