Acessibilidade / Reportar erro

Algoritmo para cálculo da proporção de genes idênticos por descendência, para mapear QTL em famílias de meio-irmãos

Algorithm to calculate proportion of genes identity by descent, to map QTL in half-sibs families

Resumos

O desenvolvimento de mapas de ligação tem estimulado a procura por métodos que permitam mapear genes responsáveis por variação em loci de características quantitativas (QTL). O método de pares-de-irmãos com base na relação entre indivíduos idênticos por descendência (IBD) tem sido utilizado para mapear QTLs. O objetivo deste trabalho foi estender o método de HASEMAN e ELSTON (1972) para se estimar a proporção (pi) de genes IBD em famílias de meio-irmãos. Os resultados obtidos sugerem que os procedimentos usados foram eficientes para se estimar p, mesmo quando os genótipos dos pais foram parcial ou totalmente desconhecidos.

genes idênticos por descendência; meio-irmãos; QTL


The development of linkage maps has stimulated the search for methods to map genes involved with quantitative trait loci (QTL). A sib par method based on the relation between individuals identic by descent (IBD) has been used to map QTLs. The objective of this paper was to extend the HASEMAN and ELSTON (1972) method to estimate the proportion (pi) of genes IBD in half-sib families. The obtained results suggested that the used procedures were efficient to estimate p even when parents genotypes were partial or totally unknown.

genes identity by descent; half-sibs; QTL


Algoritmo para Cálculo da Proporção de Genes Idênticos por Descendência, para Mapear QTL em Famílias de Meio-irmãos

Mario Luiz Martinez1 1 Pesquisador da Embrapa Gado de Leite - CNPGL - 36038-330 - Juiz de Fora - MG. E. mail: martinez@cnpgl.embrapa.br , Natascha Vukasinovic2 1 Pesquisador da Embrapa Gado de Leite - CNPGL - 36038-330 - Juiz de Fora - MG. E. mail: martinez@cnpgl.embrapa.br

RESUMO - O desenvolvimento de mapas de ligação tem estimulado a procura por métodos que permitam mapear genes responsáveis por variação em loci de características quantitativas (QTL). O método de pares-de-irmãos com base na relação entre indivíduos idênticos por descendência (IBD) tem sido utilizado para mapear QTLs. O objetivo deste trabalho foi estender o método de HASEMAN e ELSTON (1972) para se estimar a proporção (p) de genes IBD em famílias de meio-irmãos. Os resultados obtidos sugerem que os procedimentos usados foram eficientes para se estimar p, mesmo quando os genótipos dos pais foram parcial ou totalmente desconhecidos.

Palavras-chave: genes idênticos por descendência, meio-irmãos, QTL

Algorithm to Calculate Proportion of Genes Identity by Descent, to Map QTL in Half-sibs Families

ABSTRACT - The development of linkage maps has stimulated the search for methods to map genes involved with quantitative trait loci (QTL). A sib par method based on the relation between individuals identic by descent (IBD) has been used to map QTLs. The objective of this paper was to extend the HASEMAN and ELSTON (1972) method to estimate the proportion (p) of genes IBD in half-sib families. The obtained results suggested that the used procedures were efficient to estimate p even when parents genotypes were partial or totally unknown.

Key Words: genes identity by descent, half-sibs, QTL

Introdução

O desenvolvimento de mapas de ligação com grande número de marcadores moleculares tem estimulado a procura por métodos que permitam mapear genes responsáveis por variação em características quantitativas. HASEMAN e ELSTON (1972) propuseram o método de pares-de-irmãos com base na relação entre indivíduos idênticos por descendência. O método assume que a diferença no valor fenotípico da característica entre dois irmãos é menor quando eles têm grande proporção de genes idênticos por descendência (IBD) que influenciam a característica. Assim, se houver ligação entre um locus de característica quantitativa (QTL) que influencie a característica e o locus do marcador, a proporção esperada de IBD do QTL pode ser estimada por intermédio da proporção de IBD do locus marcador. A detecção da ligação entre QTL e marcador pode ser realizada por meio de simples regressão linear. Este método de pares-de-irmãos tem mostrado ser robusto quanto a diversos tipos de distribuição dos dados e independe do modelo genético do QTL (AMOS, 1989). Todavia, o método em sua forma original é limitado, pois há confundimento entre o efeito genético do QTL e a taxa de recombinação entre QTL e o locus marcador. Isto significa que se pode apenas detectar a ligação entre o QTL e o marcador, mas não é possível estimar se é devido a um QTL de grande efeito localizado longe do marcador, ou devido a um QTL de pequeno efeito, mas muito próximo do marcador.

FULKER e CARDON (1994) desenvolveram o procedimento para mapeamento de QTL pelo par-de-irmãos associado ao método do intervalo, que utiliza dois marcadores simultaneamente para separar o efeito da localização do QTL de seu efeito propriamente dito. GOLDGAR (1990) desenvolveu um método de pontos múltiplos de IBD com base na máxima verossimilhança, para estimar a variância genética devido à determinada região do cromossomo. Este método foi expandido por SCHORK (1993) para estimar simultaneamente a variância de várias regiões do cromossomo e o efeito de ambiente comum partilhado por todos os irmãos em um mesmo ambiente. XU e ATCHLEY (1995) desenvolveram um procedimento geral para o mapeamento de QTL, assumindo uma única distribuição normal dos valores fenotípicos do QTL.

A aplicação de qualquer um dos procedimentos acima mencionados requer o conhecimento da proporção de IBD para cada par-de-irmão de uma família. Em geral, o valor real desta proporção não é conhecida, mas pode ser estimada. HASEMAN e ELSTON (1972) usaram o método Bayesiano para estimar a proporção de IBD (p) entre irmãos completos, quando os genótipos dos irmãos e dos pais eram conhecidos. Esses autores propuseram também um algoritmo para calcular p em famílias de irmãos completos, quando apenas os genótipos dos irmãos eram conhecidos.

O objetivo deste trabalho foi estender o algoritmo de HASEMAN e ELSTON (1972), para estimar a proporção de IBD entre irmãos em famílias de meio-irmãos, em situações nas quais se conhece o genótipo de todos os indivíduos da família, apenas dos meio-irmãos e do pai ou apenas dos meio-irmãos.

Material e Métodos

Segundo HASEMAN e ELSTON (1972), para o caso geral de sistemas multialélicos com quatro ou mais alelos, haverá sete diferentes tipos de acasalamentos e semelhantemente sete diferentes tipos de pares-de-irmãos, conforme definido por KEMPTHORNE (1957). Assim, considerando-se um locus A com os alelos i, j, k, l, ter-se-ão os seguintes tipos:

Observa-se que o tipo I envolve apenas um alelo, os tipos II, III e V dois alelos, os tipos IV e VI três alelos e o tipo VII quatro alelos, e, independente do número total de alelos em um locus, ter-se-ão no máximo quatro diferentes alelos em determinado acasalamento.

É importante observar ainda que AiAi x AiAi e AjAj x AjAj são dois acasalamentos genotipicamente diferentes, mas ambos de um mesmo tipo I, pois são acasalamentos de indivíduos homozigotos idênticos (AiAi ou AjAj). Semelhantemente, AiAj x AiAj, AiAk x AiAk, AiAl x AiAl, AjAk x AjAk, AjAl x AjAl e AkAl x AkAl são todos de um mesmo tipo V de acasalamento.

Assumindo que a represente qualquer par de meio-irmãos, a estimativa da proporção de IBD entre dois meio-irmãos será dada por:

em que fa é a probabilidade que o par de meio-irmãos a tenha um IBD em um locus ao acaso, condicional ao genótipo do par-de-irmãos e dos pais.

Famílias de meio-irmãos têm apenas um pai em comum e, portanto, o número possível de combinações de acasalamento é igual a [n (n + 1)/2]3, em que n é o número de alelos em um determinado locus, e o número de genótipos possíveis é igual a (n + 1)/2, pois existem três indivíduos (um pai e duas mães) envolvidos para a produção de um determinado par de meio-irmãos. A princípio pode parecer uma tarefa quase que impossível estimar a proporção de IBD para todas as combinações possíveis, visto que um locus com quatro alelos produz 1000 combinações. Entretanto, como mencionado anteriormente, muitos acasalamentos genotipicamente diferentes pertencem a um mesmo tipo de acasalamento, e isto reduz substancialmente o número de combinações de acasalamentos. No caso de quatro alelos, o número de combinações de acasalamentos de tipos diferentes se reduz a 25 (10 para o caso em que o pai comum é homozigoto e 15 quando o pai comum é heterozigoto).

Algoritmo para o cálculo de p em famílias de meio-irmãos

Ambos os pais e as progênies têm o genótipo conhecido

Considere o acasalamento de um pai com duas mães em que não há nenhum parentesco entre eles (entre pai com as mães e entre as mães). Considere um determinado locus A que tenha seis alelos com a mesma freqüência. Assuma que o pai é heterozigoto para este locus e tenha o genótipo AiAj. Assuma que a primeira mãe tenha o mesmo genótipo Ai1Aj1, em que o índice 1 indica que os alelos (i e j) do pai e dessa mãe não são idênticos por descendência, ou seja, os dois animais não são parentes. Assuma que o genótipo da segunda mãe é Ai2Ak, em que o índice 2 indica que o alelo i dessa mãe não tem a mesma origem que os alelos do pai e da primeira mãe. Segundo a definição dada por HASEMAN e ELSTON (1972), o acasalamento do pai com a primeira mãe é do tipo V, e o acasalamento do pai com a segunda mãe, do tipo VI. Assim, para obter-se , deve-se proceder da seguinte maneira:

1º.) Obter todos os possíveis genótipos das progênies resultantes dos acasalamentos deste pai com as duas mães, como apresentado na Figura 1.


2º.) Determinar os tipos para todas as possíveis combinações de pares-de-irmãos. Isso pode ser feito estabelecendo-se uma tabela de dupla entrada, conforme apresentado na Tabela 1. Observa-se que, neste exemplo, têm-se um par-de-irmãos do tipo I, um do tipo II, seis do tipo III, dois do tipo IV, dois do tipo V e quatro do tipo VI. O número máximo de combinações será sempre 16, independente do número de alelos ser maior do que quatro.

3º.) Determinar o número de alelos IBD entre os pares-de-irmãos. Para o caso de meio-irmãos, quando os pais não são consangüíneos, o número de alelos IBD será 1 (se ambos os irmãos receberam o mesmo alelo do pai comum) ou 0 (se os irmãos receberam alelos diferentes do pai comum). O número de alelos IBD para o exemplo apresentado encontra-se na Tabela 1. Observa-se que o par-de-irmão tipo I (AiAi1 - AiAi2), embora tenha apenas o alelo Ai, tem apenas um alelo IBD (no caso representado por i), os demais Ai1 e Ai2 são provenientes das mães que não são parentes e, portanto, não são IBD. O mesmo raciocínio se aplica aos demais pares-de-irmãos.

4º.) Calcular a probabilidade (fa) de que determinado par-de-irmão a tenha um alelo IBD no locus A. Para se calcular fa, usa-se:

em que NIBD é o número de pares-de-irmãos do tipo a, que têm um alelo IBD, e Nt é o número total de pares-de-irmãos do tipo a.

Neste exemplo, no caso do par-de-irmãos do tipo III, têm-se Nt = 6 e NIBD = 4 e, portanto,

5º.) Calcular a proporção de alelos IBD para determinado par-de-irmão do tipo a.

A proporção é calculada por intermédio da expressão (1):

Neste exemplo, para o par-de-irmãos do tipo III, tém-se:

Assim, utilizando-se das expressões fa, pa e das informações da Tabela 1, calculam-se as demais proporções de alelos IBD para cada um dos tipos de pares-de-irmãos. O resultado para a combinação de acasalamento deste exemplo encontra-se na Tabela 2.

Utilizando-se o algoritmo acima descrito, obteve-se a Tabela 3, que contém a proporção de alelos IBD para todas as possíveis combinações de acasalamentos, quando ambos, pais e progênies, têm genótipos conhecidos.

Progênie e pai em comum têm os genótipos conhecidos

Quando apenas o genótipo do pai em comum e das progênies é conhecido, pa pode ser aproximado por intermédio da seguinte expressão:

em que Pa = prob (par-de-irmão tipo a | tipos de acasalamento m1 e m2), ou seja, Pa é a probabilidade da ocorrência de determinado tipo a de par-de-irmãos, dado os tipos de acasalamentos m1 e m2, em que m1 e m2 são tipos de combinações de acasalamentos que possam gerar determinado tipo a de par-de-irmãos.

Como exemplo, considere que o pai é heterozigoto com genótipo AiAj; os genótipos das mães são desconhecidos; e o par-de-irmãos é do tipo VI. Neste caso, para calcular pVI, pode-se usar a expressão (3), substituindo os valores apresentados na Tabela 3 para os pares-de-irmãos do tipo VI, obtidos quando o pai comum tem o genótipo AiAj. Como pode ser visto na Tabela 3, existem várias combinações de tipos de acasalamentos que geram pares-de-irmãos do tipo VI. A primeira combinação que interessa é a do acasalamento do tipo III (AiAj x AiAi) com a do acasalamento do tipo III (AiAj x AkAk). Essa combinação pode produzir três diferentes tipos de pares-de-irmãos: III, IV e VI. Neste caso, o par-de-irmãos do tipo VI tem uma probabilidade de ocorrência igual a 1/2 e = 1/4. A segunda combinação de tipos de acasalamento é a do tipo III (AiAj x AiAi) com a do tipo VI (AiAj x AiAk), que pode produzir pares-de- irmãos do tipo I, III, IV, V e VI. Nessa situação, o par-de-irmãos do tipo VI tem 1/4 de probabilidade de ocorrer e = 1/4. No total, existem 22 combinações de tipos de acasalamentos que podem gerar o par-de-irmãos do tipo VI. Assim, o numerador da equação 3 é dado pela soma do produto da probabilidade de ocorrência do tipo VI com VI, ou seja:

e o denominador é:

Finalmente,

Da mesma forma, para todos os demais tipos de pares-de-irmãos pode ser calculado como no exemplo apresentado, utilizando-se das informações da Tabela 3 e considerando-se todas as combinações possíveis de acasalamentos.

Apenas os genótipos das progênies são conhecidos

Quando os genótipos dos pais são desconhecidos, mas os genótipos das progênies são conhecidos, a proporção de alelos IBD entre pares-de-irmãos pode ser estimada utilizando-se da freqüência dos alelos estimada na população. Assim, se um pai é acasalado a duas mães não-aparentadas, escolhidas ao acaso na população, a proporção de IBD em determinado locus será:

em que é a média estimada da proporção de alelos IBD para um par-de-irmãos do tipo a; (hom) e (het) são as médias da proporção de IBD para aquele tipo a de par de meio-irmãos, obtida por intermédio de todas as combinações de acasalamento que possam gerar aquele tipo a, quando o pai em comum é homozigoto e heterozigoto, respectivamente; e (hom) e (het) podem ser estimados por intermédio da equação (3). P(hom) e P(het) são as possibilidades que um pai em comum, escolhido ao acaso na população, possa ser homozigoto ou heterozigoto, respectivamente, para determinado locus e pj (j = 1, ..., n), a freqüência do jth alelo na população.

Cálculo da porcentagem de pares de meio-irmãos

Os genótipos dos pais e das progênies de meio-irmãos foram simulados considerando-se seis loci marcadores, cada um com 2, 4, 6 ou 10 alelos separados entre si por uma distância de 20 cM, por intermédio da alocação ao acaso dos alelos em cada um dos locus e assumindo equilíbrio Hardy-Weinberg e fases de ligação desconhecidas. Cada um dos 100 pais não-aparentados entre si foi acasalado com 50 fêmeas diferentes e não-aparentadas entre si e com o pai, para produzirem uma única progênie. Os genótipos foram simulados assumindo-se que a taxa de recombinação entre dois loci não influencia a taxa de recombinação no intervalo adjacente. Assim, foram simuladas 100 famílias, cada uma com 50 progênies de meio-irmãos. Após a constituição das famílias, procedeu-se à formação dos pares de meio-irmãos, conforme o algoritmo apresentado anteriormente. A porcentagem de pares de meio-irmãos foi estimada considerando-se 637.500 pares de loci, para os casos em que se conheciam os genótipos de todos os indivíduos de cada família, apenas o pai comum e as progênies e apenas as progênies.

Resultados e Discussão

As proporções ( ) estimadas de alelos idênticos por descendência para os diferentes tipos de pares-de-irmãos, assim como a probabilidade da ocorrência de determinado tipo de par-de-irmãos, encontram-se na Tabela 3. Na primeira parte da tabela, estão para os casos em que o pai em comum é homozigoto. Pode-se observar que neste caso todos os pares-de-irmãos têm = 0,25, independente das mães serem ou não homozigotas. Segundo ROBERTSON (1973), quando a proporção de genes idênticos por descendência é igual a 0,25 para o caso de pares de meio-irmãos e 0,50 para pares-de-irmãos completos, estes são ditos "não-informativos", o que significa que estes pares-de-irmãos não contribuem com nenhuma informação para a detecção de ligação entre QTL e marcador. Na segunda parte da Tabela 3, são apresentadas , quando o pai comum é heterozigoto. Nesta situação, observa-se que varia de 0 a 0,5 e um mesmo tipo de par-de-irmão pode ser proveniente de diferentes combinações de acasalamentos dos pais. Observa-se também que os tipos de pares de meio-irmãos II, IV e VII têm sempre = 0, independente dos genótipos dos pais. Semelhantemente, o par-de-irmão do tipo I terá sempre = ¼, quando o pai em comum for homozigoto, ou = 1/2 quando o pai for heterozigoto.

Na Tabela 4, são apresentadas as proporções ( ) de alelos IBD, quando os genótipos das mães são desconhecidos. Pode-se observar que, independente do número de alelos considerados, quatro, seis ou mais de seis, é praticamente a mesma e as mesmas combinações que geram pares-de-irmãos não-informativos ( = 0,25 ) são as mesmas, exceto para um caso em particular em que o tipo de par-de-irmão é AiAj - AjAx (Tipo VI) proveniente de um pai heterozigoto AiAj. Todavia, quando ambos os pais são desconhecidos, a proporção ( ) é aproximada (Tabela 5) e os pares-de-irmãos não-informativos deixam de existir. Observa-se nesta tabela que é praticamente o mesmo, independente de se considerarem quatro ou dez alelos de igual freqüência em um mesmo locus A.

A porcentagem para 637.500 pares de meio-irmãos com um ou dois locus de marcadores ligados entre si com = 0,25 estão na Tabela 6. É importante observar que a porcentagem de pares com 1 e 2 iguais a 0,25, o que indica que estes pares não contribuirão com nenhuma informação para a detecção e o mapeamento de QTLs, diminui consideravelmente com o aumento do número de alelos dos locus marcadores, independente dos genótipos das mães serem conhecidos ou não. Pode-se observar também que há aumento da porcentagem de pares-de-irmãos com 1 e 2 = 0,25, quando se aumenta a porcentagem de mães com genótipos desconhecidos até o máximo de quatro alelos por locus. É importante notar que, se o locus tiver seis ou mais alelos, a porcentagem de pares de meio-irmãos não-informativos será menor, mesmo quando se desconhece o genótipo das mães. Embora não apresentado, quando se conhece apenas o genótipo dos pares de meio-irmãos, a porcentagem de 1 e 2 = 0,25 foi zero, ou seja, não houve nenhum par-de-irmão não-informativo, independentes do número de alelos.

A porcentagem estimada para os diferentes tipos de pares de meio-irmãos resultante de simulação de 100 famílias de 50 meio-irmãos cada uma encontra-se na Tabela 7. Observa-se que os tipos IV, VI e VII de pares de meio-irmãos não existem quando apenas dois alelos estão presentes em um locus. Enquanto o tipo VI se torna o mais presente, quando o locus tem quatro ou mais alelos, os tipos I e II têm a sua porcentagem reduzida drasticamente com o aumento do polimorfismo do locus. Esta variação no percentual dos diferentes tipos de pares-de-irmãos, quando o locus é mais polimórfico, acarreta redução na porcentagem de pares-de-irmãos não-informativos, conforme observado na Tabela 6.

Assim, considerando-se que, quanto maior for o número de pares de indivíduos informativos ( ¹ 0,25 ), maior será a probabilidade de se detectar e mapear um QTL localizado entre dois marcadores (ROBERTSON, 1973), deduz-se, pelos resultados apresentados, que os locus marcadores polimórficos com quatro ou mais alelos são os mais eficientes para se alcançarem estes objetivos. Da mesma forma, embora haja perda de informações quando os genótipos dos pais são desconhecidos parcial ou totalmente, devido ao procedimento sugerido para se estimar a proporção de alelos idênticos por descendência nestas situações, verificou-se que a porcentagem de pares-de-irmãos não- informativos se manteve ou mesmo decresceu, quando o locus marcador é bastante polimórfico (seis ou mais alelos).

Conclusões

Estes resultados sugerem que os procedimentos adotados nesta pesquisa podem levar à maior eficiência, quando da utilização de pares-de-irmãos para se detectarem ou mapearem QTLs nas situações em que os genótipos dos pais são desconhecidos parcial ou totalmente.

É importante, todavia, que se possam testar estes procedimentos por intermédio de simulações nas quais deverão ser avaliados outros fatores que afetem diretamente a eficiência de se detectarem QTLs e a precisão com que são estimados.

Referências Bibliográficas

Recebido em: 13/07/99

Aceito em: 10/09/99

2 Swiss Federal Institute of Technology. Clausiusstr. 50, 8092 Zurich, Switzerland. E.mail: vukasinovic@inw.agrl.ethz.ch

  • AMOS, C.I., ELSTON, R.C., WILSON, A.F. et al. 1989. A more powerfull robust sib-pair test of linkage for quantitative traits. Genet. Epidemiology, 6:435-449.
  • FULKER, D.W., CARDON, L.R. 1994. A sib-pair approach to interval mapping of quantitative trait loci Am. J. Hum. Genet., 54:1092-110.
  • GOLDGAR, D.E. 1990. Multipoint analysis of human quantitative genetic variation. Am. J. Hum. Genet., 47:957-967.
  • HASEMAN, J.M., ELSTON, R.C. 1972. The investigation of linkage between a quantitative trait and a marker locus Behav. Genet., 2:3-19.
  • KEMPTHORNE, O. 1957. An introduction to genetics statistics New York: John Wiley. 545p.
  • ROBERTSON, A. 1973. Linkage between marker loci and those affecting a quantitative trait. Behav. Genet., 3:389-391.
  • SCHORK, N.J. 1993. Extended multipoint identical-by-descent analysis of human quantitative traits: efficiency, power, and modeling considerations. Am. J. Hum. Genet., 53:1386-1393.
  • XU, S., ATCHLEY, R.W. 1995. A random model approach to interval mapping of quantitative trait loci Genetics, 141:1189-1197.
  • 1
    Pesquisador da Embrapa Gado de Leite - CNPGL - 36038-330 - Juiz de Fora - MG. E. mail:
  • Datas de Publicação

    • Publicação nesta coleção
      12 Jan 2004
    • Data do Fascículo
      Abr 2000

    Histórico

    • Recebido
      13 Jul 1999
    • Aceito
      10 Set 1999
    Sociedade Brasileira de Zootecnia Universidade Federal de Viçosa / Departamento de Zootecnia, 36570-900 Viçosa MG Brazil, Tel.: +55 31 3612-4602, +55 31 3612-4612 - Viçosa - MG - Brazil
    E-mail: rbz@sbz.org.br