Acessibilidade / Reportar erro

Uso da iteração nos dados para resolução de equações de modelo misto

Use of iteration on data to solve the mixed model equations

Resumos

Valores genéticos foram preditos usando-se a iteração nos dados em um modelo animal reduzido. O peso corporal, aos 35 dias de idade, de duas linhas de aves de corte foi medido em duas gerações, cujo arquivo de dados consistia de 1044 pais (população-base), 829 progênies-pais e 9039 progênies-não-pais. O número de iterações e o tempo de processamento, para obtenção das soluções das equações de modelo misto via iteração nos dados, foram avaliados por sete critérios de convergência (10¹ a 10-5 ). Seis iterações foram necessárias, com 9 s de tempo, e 158 iterações, com 5 min e 38 s, para se obterem as soluções para os critérios de convergência de 10¹ e 10-5, respectivamente. As correlações entre os valores genéticos preditos foram perfeitas (r=1,00), e não houve diferenças entre as tendências genéticas estimadas pelos critérios de convergência de 10-1 a 10-5. Com base nestes resultados, conclui-se que a iteração nos dados pode ser eficientemente usada em microcomputadores, na avaliação genética animal, sem grande demanda de tempo e memória computacional.

avaliação genética; iteração nos dados; modelos mistos


Breeding values were predicted by iterating on data using reduced animal model. Body weight at 35 days of age from two lines of meat-type chickens was measured in two generations and data file was consisted on 1044 parents (base population), 829 progeny parents and 9039 progeny non-parents. The number of iterative rounds and processing time for mixed model equations solutions via iterating on data were evaluated using seven convergence criteria (10¹ to 10-5). A total of six rounds of iteration and 9 s of time and 158 rounds and 5 min and 38 s were required to reach the solutions for 10¹ and 10-5 convergence criteria, respectively. The correlation between predicted breeding values were perfect (r=1,00) and there were no significant differences between estimated genetic trends using 10-1 to 10-5 as a convergence criteria. Based on these results, it was concluded that iterating on data could be efficiently used for animal genetic evaluation in microcomputer without great computational requirements.

genetic evaluation; iteration on data; mixed model


Uso da Iteração nos Dados para Resolução de Equações de Modelo Misto

Paulo Sávio Lopes1 1 Professor da UFV e bolsista do CNPq. E.mail: plopes@mail.ufv.br

RESUMO - Valores genéticos foram preditos usando-se a iteração nos dados em um modelo animal reduzido. O peso corporal, aos 35 dias de idade, de duas linhas de aves de corte foi medido em duas gerações, cujo arquivo de dados consistia de 1044 pais (população-base), 829 progênies-pais e 9039 progênies-não-pais. O número de iterações e o tempo de processamento, para obtenção das soluções das equações de modelo misto via iteração nos dados, foram avaliados por sete critérios de convergência (101 a 10-5 ). Seis iterações foram necessárias, com 9 s de tempo, e 158 iterações, com 5 min e 38 s, para se obterem as soluções para os critérios de convergência de 101 e 10-5, respectivamente. As correlações entre os valores genéticos preditos foram perfeitas (r=1,00), e não houve diferenças entre as tendências genéticas estimadas pelos critérios de convergência de 10-1 a 10-5. Com base nestes resultados, conclui-se que a iteração nos dados pode ser eficientemente usada em microcomputadores, na avaliação genética animal, sem grande demanda de tempo e memória computacional.

Palavras-chave: avaliação genética, iteração nos dados, modelos mistos

Use of Iteration on Data to Solve the Mixed Model Equations

ABSTRACT - Breeding values were predicted by iterating on data using reduced animal model. Body weight at 35 days of age from two lines of meat-type chickens was measured in two generations and data file was consisted on 1044 parents (base population), 829 progeny parents and 9039 progeny non-parents. The number of iterative rounds and processing time for mixed model equations solutions via iterating on data were evaluated using seven convergence criteria (101 to 10-5). A total of six rounds of iteration and 9 s of time and 158 rounds and 5 min and 38 s were required to reach the solutions for 101 and 10-5 convergence criteria, respectively. The correlation between predicted breeding values were perfect (r=1,00) and there were no significant differences between estimated genetic trends using 10-1 to 10-5 as a convergence criteria. Based on these results, it was concluded that iterating on data could be efficiently used for animal genetic evaluation in microcomputer without great computational requirements.

Key Words: genetic evaluation, iteration on data, mixed model

Introdução

HENDERSON (1963, 1973, 1974) propôs a metodologia de modelos mistos, para obtenção da melhor predição linear não-viesada (BLUP), dos valores genéticos dos animais. A utilização do modelo animal que possibilita a inclusão de toda informação de pedigree na análise é uma das grandes vantagens dessa metodologia. Entretanto, existe o inconveniente de o número total de equações a serem resolvidas simultaneamente em grande volume de dados demandar grande esforço computacional, quanto à memória e ao tempo de processamento.

Com o objetivo de contornar esse problema computacional na resolução das equações, diversas técnicas têm sido propostas. QUAAS e POLLAK (1980) propuseram o uso do modelo animal reduzido, em que as equações referentes aos indivíduos que não tiverem filhos são absorvidas, de maneira implícita, na construção do sistema. Outra técnica, proposta posteriormente por SCHAEFFER e KENNEDY (1986), foi o uso da iteração nos dados, que consiste em obter as soluções, sem construir as equações de forma explícita, ou seja, sem armazená-las na memória.

Outras estratégias utilizadas são algoritmos eficientes de obtenção das soluções. De modo geral, os métodos iterativos são recomendados (LOPES et al., 1993; QUAAS e POLLAK, 1980).

Comparações têm sido feitas entre essas várias alternativas, que vão desde a escolha de métodos numéricos apropriados até a utilização de algoritmos eficientes para formação e, ou, resolução dos sistemas de equações. A opção por um método ou outro vai depender da disponibilidade de computadores com maior capacidade de memória e, ou, velocidade de processamento e da precisão desejada nas soluções.

BLAIR e POLLAK (1984) verificaram que o uso do modelo animal reduzido em relação ao modelo animal diminuiu em 40% o tamanho do sistema de equações; com isso, foram necessários 40% do número de iterações, sendo o tempo por iteração 20% menor.

SCHAEFFER e KENNEDY (1986) verificaram que, na utilização do modelo animal, por meio do método da iteração nos dados, gastou-se metade do tempo despendido no modelo animal reduzido, com sistema de equações armazenado na memória. Entretanto, esses autores não testaram o modelo animal reduzido com iteração dos dados, o que, certamente, reduziria ainda mais o tempo de processamento.

É importante salientar que, com a evolução na área computacional, pode haver mudança na eficiência de cada método. LOPES et al. (1994) enfatizaram que, quando se propõe apenas ordenar os animais para fins de seleção, não há necessidade de grande acurácia nas soluções, visto que o que interessa é a não-mudança na ordem de classificação dos animais. Nesse caso, não há necessidade de grande número de iterações. No entanto, quando se buscam soluções mais precisas, como é o caso de avaliação de tendências genéticas, deve-se avaliar a precisão das soluções (BLAIR e POLLAK, 1984). Nesse caso, além da memória computacional, deve-se avaliar o tempo de processamento.

O objetivo deste trabalho foi verificar o tempo de processamento e a memória computacional necessários para resolução de equações de modelo misto, utilizando-se o modelo animal reduzido e a iteração nos dados.

Material e Métodos

Utilizaram-se dados de aves de corte obtidos na Universidade Federal de Viçosa (UFV) e avaliou-se a característica peso corporal aos 35 dias de idade, medido em duas linhas, durante duas gerações. Na Tabela 1, é apresentado o número total de aves, pais (população-base), progênies-pais e progênies-não-pais.

Os dados foram analisados pelo seguinte modelo:

em que

yij = observação do animal j, do grupo contemporâneo i;

GCi = efeito fixo do grupo contemporâneo i, com efeitos de linha, sexo, incubação e geração;

gij = valor genético do animal j, do grupo contemporâneo i; e

eij = erro aleatório associado a cada observação.

Utilizando-se o modelo animal reduzido (QUAAS e POLLAK, 1980; MARTINS et al., 1997), descrito na forma matricial, tem-se

em que

= vetor de observações das características medidas nos animais, sendo p = pais e n = não-pais;

X = matriz de incidência de efeitos fixos;

= vetor de efeitos fixos de grupo contemporâneo;

Z = matriz de incidência de valores genéticos;

= vetor de valores genéticos;

Pnp = matriz que relaciona pais com progênies;

= vetor de efeitos de amostra mendeliana; e

= vetor de resíduos.

As soluções dos efeitos fixos e dos valores genéticos dos pais são obtidas pelo seguinte sistema de equações de modelo misto, após a absorção dos não-pais (MARTINS et al., 1997):

em que ,

sendo e

As soluções dos não-pais são obtidas por (MARTINS et al., 1997):

ou, ainda, por

em que

= vetor de valores genéticos preditos do indivíduo i;

e = vetores de valores genéticos preditos do pai e da mãe de i;

= i-ésimo elemento da diagonal da matriz;

Zii = bloco diagonal da matriz Z, referente ao indivíduo i; e

Xi = formada pelas linhas da matriz X, referentes ao indivíduo i.

Na iteração nos dados, que consiste em obter as soluções sem construir as equações de forma explicita, ou seja, sem necessidade de armazená-las na memória do computador, dividiram-se os dados em três categorias: pais (população-base), progênies-pais (indivíduos que são filhos e pais) e progênies-não-pais (filhos que não são pais) (QUAAS, 1995).

Esse método consiste em obter a solução para cada indivíduo, separadamente, a partir de três contribuições: dos pais, das progênies-pais e das progênies-não-pais. Essas contribuições foram apresentadas por QUAAS (1995) e são dadas a seguir.

1.a) Contribuição dos pais do indivíduo para a diagonal: , em que G0 e R0 são matrizes de variâncias e covariâncias genética aditiva e residual e x recebe 2, se o animal tem dois pais; 4/3, se tem um pai; e 1, se não tem nenhum dos pais;

1.b) Contribuição dos pais para o lado direito (RHS):

em que y, , e são, respectivamente, observação do indivíduo, efeito estimado do grupo contemporâneo do indivíduo e valor genético predito do pai e da mãe do indivíduo.

2.a) Contribuição das progênies-pais na diagonal:

2.b) Contribuição das progênies-pais para o lado direito: , em que e são, respectivamente, valor genético predito da progênie-pai e do par acasalado.

3.a) Contribuição das progênies-não-pais na diagonal: , em que .

3.b) Contribuição das progênies pais para o lado direito:

O valor genético predito de cada indivíduo é dado por:

A solução de cada grupo contemporâneo é obtida a partir de duas contribuições, de pais e de não-pais (QUAAS, 1995), conforme a seguir.

1.a) Contribuição dos pais para a diagonal ,

1.b) Contribuição dos pais para o lado direito:

em que é o valor genético predito do indivíduo.

2.a) Contribuição dos não-pais para a diagonal: ,

2.b) Contribuição dos não-pais para o lado direito:

.

A solução de cada grupo contemporâneo é dada por:

.

Para obtenção das soluções dos valores genéticos e de grupos contemporâneos utilizou-se o método iterativo de Gauss-Seidel (VARGA, 1962). Foi implementado um programa computacional em linguagem Fortran, em microcomputador Micro Pentium MMX, 200 mHz e128 mB RAM.

Avaliaram-se o número de iterações e o tempo de processamento, utilizando-se critérios de convergência de 101 a 10-5 (10 a 0,00001), dados pela diferença entre o resultado obtido numa iteração e na anterior. Obtiveram-se correlações entre os valores genéticos preditos dos animais e estimaram-se as tendências genéticas anuais por critério de convergência, a fim de determinar qual seria o mais adequado.

Resultados e Discussão

Na Tabela 2, apresentam-se o número de iterações e o tempo de processamento necessários para se obterem as soluções dos valores genéticos dos animais via iteração nos dados, utilizando-se critérios de convergência de 101 a 10-5 (10 a 0,00001). Na Tabela 3, apresentam-se as correlações entre os valores genéticos preditos dos animais, por critério de convergência.

Verifica-se que os tempos de processamento foram relativamente baixos, mesmo quando se trabalhou com critérios de convergência mais precisos, os quais variaram de 9 segundos, para o critério de 101, a 3 minutos e 38 segundos, para o de 10-5, tendo o número de iterações variado de 6 a 158.

Pelas correlações entre os valores genéticos preditos, observa-se que, a partir do critério de convergência de 10-1, a correlação é igual à unidade, em relação aos critérios de convergência mais precisos (10-2 a 10-5). Esse valor corresponde, aproximadamente, ao limite mínimo de 0,099, utilizado na obtenção das soluções das equações de modelo misto, para ganho de peso em suínos, por SCHENKEL (1991).

LOPES et al. (1994 e 1995), ao utilizarem critério de convergência na obtenção da inversa da matriz (Z'R-1Z+G-1) das equações de modelo misto, dividindo-se cada elemento pela variância fenotípica da característica, consideraram o critério de convergência de 10-4, para o qual foram necessárias 16 iterações na obtenção das soluções. Comparando-se os resultados deste trabalho com os desses autores, verifica-se que o critério de convergência de 100, que precisou de 17 iterações, parece ser o equivalente.

Entretanto, segundo BLAIR e POLLAK (1984), quando se deseja avaliar as tendências genéticas, essa correlação entre valores genéticos ou entre ordem de classificação dos animais não seria recomendável para determinar critério de convergência. Por isso, foram estimadas as tendências genéticas anuais para cada um dos critérios utilizados, cujos resultados se encontram na Tabela 4, assim como as predições dos valores genéticos mínimo e máximo.

Verifica-se que, a partir de 10-3, não houve mais mudanças nas tendências genéticas e nas predições dos valores genéticos mínimos e máximos.

Verifica-se que, ao se utilizar o critério de 100, semelhante ao proposto por LOPES et al. (1994 e 1995), a tendência genética estaria sendo subestimada em 6,76%, enquanto, ao se utilizar o de 10-1, de acordo com a correlação entre os valores genéticos da Tabela 3 e os utilizados por SCHENKEL (1991), a tendência genética estaria sendo subestimada em apenas 0,66%.

Tendo em vista que valor de 10-1, para o qual foram necessárias 45 iterações em apenas 1 minuto e 2 segundos, foi eficiente para se avaliarem 10.912 aves, das quais 1873 eram pais, conclui-se que essa metodologia pode ser usada em microcomputadores para avaliação genética animal, sem grande demanda de tempo e memória computacional.

Conclusões

A iteração nos dados pode ser eficientemente usada em microcomputadores, na avaliação genética animal, sem grande demanda de tempo e memória computacional.

Referências Bibliográficas

Recebido em: 08/03/99

Aceito em: 10/09/99

  • BLAIR, H.T., POLLAK, E.J. 1984. Comparison of an animal model and an equivalent reduced animal model for computational efficiency using mixed model methodology. J. Anim. Sci, 58(5):1090-1096.
  • HENDERSON, C.R. 1963. Selection index and genetic expected advance. In: HANSON, W.D., ROBISON, H.F. (Eds.). Statistical genetics and plant breeding. Washington: NAS-NRC. p.141-163. (Publication, 982).
  • HENDERSON, C.R. Sire evaluation and genetic trends. In: ANIMAL BREEDING AND GENETICS SYMPOSIUM IN HONOR OF DR. JAY L. LUSH, 1973, Blacksburg. Proceedings.. Champaign: ASAS/ASDA, 1973. p.10-41.
  • HENDERSON, C.R. 1974. General flexibility of linear model techniques for sire evaluation. J. Dairy Sci, 57(8):963-972.
  • LOPES, P.S., MARTINS, E.N., SILVA, M.A. et al. 1993. Métodos de resolução de sistemas de equações lineares. Viçosa, MG: Editora UFV. 55p.
  • LOPES, P.S., SILVA, M.A., REGAZZI, A.J. et al. 1994. Critérios de convergência para resolução de equações de modelo misto. R. Soc. Bras. Zootec, 23(6):1008-1020.
  • LOPES, P.S., SILVA, M.A., REGAZZI, A.J. et al. 1995. Avaliação de métodos iterativos de resolução de equações de modelo misto. R. Soc. Bras. Zootec., 24(3):461-472.
  • MARTINS, E.N., LOPES, P.S., SILVA, M.A. et al. 1997. Uso de modelos mistos na avaliação genética animal. Viçosa, MG: Editora UFV. 121p.
  • QUAAS, R.L. 1995. Iterating on data. Cornell University, Ithaca, NY. 9p.
  • QUAAS, R.L., POLLAK, E.J. 1980. Mixed model methodology for farm and ranch beef cattle testing programs. J. Anim. Sci, 51(6):1277-1287.
  • SCHAEFFER, L.R., KENNEDY, B.W. Computing solutions to mixed model equations. In: WORLD CONGRESS ON GENETICS APPLIED TO LIVESTOCK PRODUCTION, 3, 1986, Lincoln. Proceedings.. Lincoln, 1986, v.12, p.382-393.
  • SCHENKEL, F.S. Aplicação da metodologia dos modelos mistos na avaliação genética de suínos Porto Alegre, RS: UFRGS, 1991. 218p. Dissertação (Mestrado em Zootecnia) - Universidade Federal do Rio Grande do Sul, 1991.
  • VARGA, R.S. 1962. Matrix iterative analysis Englewood Cliffs: Prentice-Hall. 322p.
  • 1
    Professor da UFV e bolsista do CNPq. E.mail:
  • Datas de Publicação

    • Publicação nesta coleção
      12 Jan 2004
    • Data do Fascículo
      Abr 2000

    Histórico

    • Aceito
      10 Set 1999
    • Recebido
      08 Mar 1999
    Sociedade Brasileira de Zootecnia Universidade Federal de Viçosa / Departamento de Zootecnia, 36570-900 Viçosa MG Brazil, Tel.: +55 31 3612-4602, +55 31 3612-4612 - Viçosa - MG - Brazil
    E-mail: rbz@sbz.org.br