SciELO - Scientific Electronic Library Online

 
vol.33 issue6  suppl.1Chemical characterization and in vitro digestibility of sunflower silagesOvarian follicular population during estrous cycle in Gir breed (Bos indicus) cows author indexsubject indexarticles search
Home Pagealphabetic serial listing  

Services on Demand

Journal

Article

  • Portuguese (pdf)
  • Article in xml format
  • How to cite this article
  • SciELO Analytics
  • Curriculum ScienTI
  • Automatic translation

Indicators

Related links

Share


Revista Brasileira de Zootecnia

Print version ISSN 1516-3598

R. Bras. Zootec. vol.33 no.6 supl.1 Viçosa Dec. 2004

https://doi.org/10.1590/S1516-35982004000700006 

MELHORAMENTO, GENÉTICA E REPRODUÇÃO

 

Comparação de metodologias de predição de valores genéticos utilizando dados simulados1

 

Comparison of methodologies for predicting breeding values using simulated data

 

 

José Braccini NetoI; Martinho de Almeida e SilvaII, V; Ricardo Frederico EuclydesIII; Paulo Sávio LopesIII, V; Robledo de Almeida TorresIII, V; Adair José RegazziIV, V

IProfessor do DZ, UFRGS, Porto Alegre, RS, CEP: 90001-970. E.mail: jose.braccini@ufrgs.br
IIProfessor da Escola de Veterinária da UFMG, Belo Horizonte, MG, CEP: 30161-970. E.mail: martinho@vet.ufmg.br
IIIProfessor do DZO, UFV, Viçosa - MG, CEP: 36571-000
IVProfessor do DPI, UFV, Viçosa - MG, CEP: 36571-000
VBolsista do CNPq

 

 


RESUMO

Foram simuladas, utilizando o programa GENESYS, sete populações com diferentes médias genéticas e estruturas de dados resultantes da substituição de 0, 10, 25, 50, 75, 90 e 100% de reprodutores, com o objetivo de comparar a metodologia de modelos mistos (MMM) com a metodologia GenSys, por meio de suas acurácias e variâncias do erro de predição (PEV), estimadas com base no modelo de reprodutor e no modelo animal. No modelo de reprodutor, à medida que se aumentava a intensidade de seleção, ocorriam diminuição na acurácia e aumento da PEV de ambas as metodologias, em razão da menor acurácia na estimação dos níveis do efeito fixo e da diminuição do número médio de progênies/reprodutor. A superioridade da MMM no modelo de reprodutor foi atribuída à maior acurácia de estimação dos efeitos fixos. No modelo animal, as tendências foram diferentes. Na MMM, à medida que se aumentava a intensidade de seleção, a acurácia se elevava e a PEV permanecia praticamente constante, enquanto, na GenSys, ocorriam diminuição da acurácia e aumento da PEV. O aumento da acurácia, na MMM, decorreu do maior número de conexões genéticas, enquanto a diminuição, na GenSys, foi atribuída à menor acurácia de estimação dos níveis do efeito fixo. A superioridade da MMM foi decorrente da maior acurácia na estimação dos níveis do efeito fixo e do uso da matriz de parentesco completa, que inclui a população-base com indivíduos não-aparentados, não-endogâmicos e não-selecionados. Conclui-se que a MMM foi superior à GenSys, quanto à acurácia e à PEV, para a estrutura de dados selecionados simulada, principalmente para o modelo animal.

Palavras-chave: GenSys, modelo animal, modelo de reprodutor, modelos mistos


ABSTRACT

Seven populations with different genetic means and different data structures resulting from replacing 0, 10, 25, 50, 75, 90 and 100% of sires simulated by GENESYS program were used to compare the mixed-model methodology (MMM) with the GenSys methodology, according to the accuracies and predicted error variances (PEV) of the breeding values, estimated under a sire or an animal model. Under the sire model, lower accuracy and greater PEV for both methodologies were observed as selection intensity increased, due to the reduced accuracy of estimation of the fixed effects and the reduced average number of progenies per sire. The superiority of MMM under the sire model was due to increase in the accuracy of the estimated fixed effects. Under the animal model, the tendencies were different. For the MMM, accuracy increased and PEV remained practically constant, as selection intensity increased, whereas for the GenSys methodology, reduced accuracy and an increase on the PEV as selection intensity increased were observed. Greater accuracies for MMM were due to the increased number of genetic ties, whereas the reduced accuracy for GenSys was due to the lower accuracy of the estimation of the fixed effects. The superiority of MMM was a result of the greater accuracy of the levels of fixed effect estimates and the use of the full relationship matrix, which included a base-population of unrelated, non-endogamic and non-selected individuals. The MMM was superior to GenSys according to the accuracy and PEV, for this structure of simulated selected data, mainly under the animal model.

Key words: animal model, GenSys, mixed-model, sire model


 

 

Introdução

A maioria dos dados disponíveis aos melhoristas da espécie animal não apresenta os requerimentos de amostragem aleatória, ou seja, os dados são provenientes de experimentos de seleção ou de rebanhos que estão sob seleção (Henderson, 1973; Meyer & Thompson, 1984; Gianola et al., 1988; Fries & Schenkel, 1993).

Como conseqüência, as esperanças, as variâncias e as (co)variâncias entre as observações e os valores genéticos são alteradas (Henderson, 1982, 1985), o que resulta em estimativas e predições viesadas, sendo que alguns métodos são menos vulneráveis à seleção que outros (Henderson, 1975b).

Além disso, dados de campo apresentam número desigual de observações por subclasse, muitas subclasses vazias e problemas de conexidade. Em populações de bovinos de corte, ovinos e suínos, em que a inseminação artificial é pouco utilizada, rebanhos ou grupos de animais contemporâneos podem estar isolados geneticamente ou pobremente conectados. Assim, erros na seleção são, provavelmente, maiores (Kennedy & Trus, 1993). A menor acurácia na predição de valores genéticos tem papel mais importante em rebanhos nos quais se utiliza inseminação artificial, pois um único indivíduo pode contribuir com muitos filhos para a próxima geração.

De modo geral, dados provenientes de populações submetidas à seleção são analisados, ignorando-se os efeitos da seleção (Schaeffer, 1987).

Entretanto, Brito (1992) e Brito & Fries (1994) propuseram a metodologia GenSys para dados selecionados provenientes de condições reais e práticas da produção bovina de corte, na qual se considera a conexidade dos dados para fornecer estimadores não-viesados com propriedades robustas frente a observações extremas.

Henderson (1975b) sugeriu a comparação de metodologias por meio de simulação no caso em que os métodos analíticos envolviam manipulações matemáticas difíceis.

Objetivou-se, neste trabalho, comparar, quanto à acurácia e à variância do erro de predição, a metodologia de modelos mistos (MMM) e a metodologia GenSys, em situações de dados simulados com efeito de seleção.

 

Material e Métodos

Os dados deste trabalho foram simulados por meio do programa GeneSyS (Euclydes, 1996).

Para simulação de uma variável resposta objetivando-se comparar as metodologias, foi definido, arbitrariamente, um genoma de 4.000 centimorgans com 14 pares de cromossomos autossômicos e um par de cromossomos sexuais contendo 500 genes de ação aditiva. As freqüências gênicas iniciais dos locos foram simuladas com base na distribuição uniforme, com média e variância 0,5. Foram simulados dois alelos por loco, cujos efeitos apresentaram distribuição normal padrão.

Os efeitos de ambiente foram simulados conforme distribuição normal, com média zero e variância variável, de modo a permitir herdabilidade igual a 0,23.

Primeiramente, foi simulada uma população-controle; posteriormente, 10, 25, 50, 75, 90 ou 100% dos machos da G0 (população-base), com fenótipos inferiores, foram substituídos por animais mais jovens da primeira geração (G1), que apresentaram maiores valores fenotípicos. Esses procedimentos foram repetidos até a décima primeira geração (G11), o que resultou em sete diferentes níveis de desbalanceamento, conexidade e progresso genético, de acordo com o diferencial de seleção paterno empregado.

Para a população-controle, considerando-se o modelo de reprodutor, a estrutura de dados foi balanceada, pois foram utilizados os mesmos reprodutores (20) em todos as gerações (12), tendo cada um deles apresentado o mesmo número de progênies (60), por geração. Essa estrutura de dados apresentou conexidade entre efeito de reprodutor e geração, pois cada reprodutor tinha progênie em cada geração, enquanto no caso de 100% de substituição, considerando-se o modelo fixo, a estrutura de dados foi desbalanceada, apresentando subclasses vazias para os reprodutores substituídos, e desconexa, pois cada reprodutor somente foi usado em uma geração. Para os outros casos, considerando-se o modelo misto, o desbalanceamento e a conexidade foram intermediários entre essas duas.

Simulou-se um efeito fixo de ambiente de mais uma unidade, a cada geração, para caracterizar um progresso ambiental além do genético, ou seja, foi acrescido o valor um ao valor fenotípico dos indivíduos da G0; o valor dois ao valor fenotípico dos indivíduos da G1; e assim sucessivamente, até a G11.

Comparou-se a MMM com a GenSys, utilizando-se o modelo animal (MA) e o modelo de reprodutor (MR), que são descritas a seguir:

Metodologia de modelos mistos

No modelo animal, utilizaram-se dados de teste de progênie, teste de desempenho individual e os valores fenotípicos dos pais.

A avaliação genética dos indivíduos foi feita com base no seguinte modelo:

y = Xb + Zu + e

em que y é um vetor coluna com 13.620 observações; X, uma matriz (13.620 x 12) conhecida, que relaciona os elementos de b com os elementos de y; b, um vetor coluna com 12 elementos desconhecidos, representando o efeito fixo de geração; Z, uma matriz (13.620 x 13.620) conhecida, que relaciona os elementos de u com os elementos de y; u, um vetor coluna com 13.620 elementos desconhecidos assumidos aleatórios, representando os valores genéticos aditivos; e e, um vetor com 13.620 elementos também desconhecidos e aleatórios, que representam os resíduos associados às observações.

Admite-se que as variáveis aleatórias dos vetores u e e tenham o primeiro e o segundo momento dados por:

Como conseqüência, E(y) = Xb e Var(y) = ZGZ' + R

Cada elemento de u e e tem média zero. A matriz de (co)variância dos elementos de u é G = A, em que A é uma matriz (13.620 x 13.620) não-singular do numerador da matriz de parentesco entre os indivíduos; e , um escalar que representa a variância genética aditiva dos indivíduos não-aparentados e não-endogâmicos da população-base. Os elementos de e não são correlacionados e têm variância comum , ou seja, a matriz de (co)variância dos elementos de e é R = I, em que I é uma matriz identidade de dimensão 13.620.

Para obtenção das equações de modelos mistos (EMM), admite-se que as variâncias genética aditiva e residual sejam conhecidas. Na prática, esses valores paramétricos são substituídos pelas suas respectivas estimativas. Mediante simulação, esses valores foram conhecidos e, então, utilizados.

A estimação dos efeitos fixos e a predição dos valores genéticos foram obtidas pela solução das EMM, apresentadas a seguir:

Para obter bº e û, empregou-se o programa computacional MTDFREML (Boldman et al., 1995).

Na análise dos dados, por meio do modelo de reprodutor, utilizaram-se somente os dados dos filhos (teste de progênie).

A avaliação genética dos reprodutores foi feita com base no seguinte modelo:

y = Xg + Zs + e,

em que y é o vetor de observações; X e Z, as matrizes de incidência para geração (g) e reprodutor (s ~ (0, A)); e e, o vetor de resíduos aleatórios ~ (0, I).

Metodologia GenSys

Utilizando-se o mesmo modelo matricial da MMM, admite-se que os elementos de u tenham média u e os de e, média zero. As matrizes de (co)variância dos elementos de u e e são, respectivamente, G = I e R = I, em que I é uma matriz identidade de dimensão n.

A estimação dos efeitos fixos é obtida pela resolução do sistema de equações abaixo:

As Diferenças Esperadas nas Progênies (DEPs) dos pais são estimadas por:

que representa as equações de índice de seleção de Lush, em que os valores verdadeiros dos efeitos de b são substituídos pelas suas estimativas.

As DEPs das progênies são obtidas pela metade da soma das DEPs dos pais mais metade da segregação mendeliana.

Para estimar e û, utilizou-se o software GenSys.

Na análise dos dados, por meio do modelo de reprodutor, foram usados somente os dados dos filhos.

A avaliação genética dos reprodutores foi feita com base no seguinte modelo:

y = Xg + Zs + e,

em que y é vetor de observações; X e Z são matrizes de incidência para geração (g) e reprodutor (s ~ (s, I)) e e, vetor de resíduos aleatórios ~ (0, I).

A acurácia de ambas as metodologias foi avaliada pela correlação de Spearman entre os valores genéticos verdadeiros e os preditos.

A variância do erro de predição (PEV) foi calculada com base em sua definição teórica (Kennedy & Trus, 1993): PEV = Var(û – u).

Para o cálculo da PEV na MMM, com base no modelo de reprodutor, e na metodologia GenSys, com base em ambos os modelos, as DEPs foram multiplicadas por dois.

 

Resultados e Discussão

Na Tabela 1, são apresentadas as correlações de Spearman entre os valores genéticos verdadeiros e os valores genéticos preditos, utilizando-se o MR e o MA na MMM e na metodologia GenSys.

 

 

No MR, verificou-se tendência similar para ambas as metodologias. À medida que se aumentava a intensidade de seleção, a acurácia diminuía.

Essa relação foi, possivelmente, atribuída à menor acurácia de estimação dos níveis do efeito fixo, à medida que se aumentou o efeito da seleção. Em ambas as metodologias, houve superestimação dos níveis do efeito fixo, ou seja, ambas as metodologias não foram capazes, com base no MR, de separar efeitos ambiental e genético. Provavelmente, o aumento do desbalanceamento ou do número de subclasses vazias, a diminuição da conexidade e o uso da matriz de parentesco incompleta (não-uso da G = A) tenham interferido na estimação dos níveis do efeito fixo.

Segundo Sorensen & Kennedy (1984), para a partição correta da tendência fenotípica, deve-se utilizar a matriz de parentesco completa, ou seja, incluir todos os animais envolvidos no processo de seleção, não levando em conta se eles tiveram ou não progênies. Caso essa condição não seja satisfeita, como é o caso do modelo de reprodutor, estimadores de efeitos fixos e de resposta à seleção serão viesados (Henderson, 1975a).

Com relação ao modelo de reprodutor, além do problema de estimação do efeito fixo, outro fator que influencia na acurácia é o número de progênies/reprodutor; para 0, 10, 25, 50, 75, 90 e 100% de substituição, o número médio de progênies/reprodutor foi de 660; 330; 186,6; 110; 77,6; 66 e 60, respectivamente. Ojala et al. (1985) e Tosh & Wilton (1994) observaram aumento na correlação entre o valor genético verdadeiro e o predito, à medida que se aumentava o número de progênies/reprodutor. A superioridade da MMM deveu-se à pequena superioridade na precisão de estimação dos efeitos fixos, em razão, possivelmente, do uso da matriz A em vez de I, utilizada pela GenSys.

Para o modelo animal, os resultados foram opostos. Na MMM, à medida que se elevava a intensidade de seleção, aumentava-se a acurácia, enquanto, na GenSys, ocorria diminuição.

No caso da MMM, observou-se que não houve relação entre qualidade de estimação de efeito fixo e efeito de seleção; assim, o fator que deve estar atuando na acurácia é a matriz de parentesco. Isto é possível, pois, segundo Tosh & Wilton (1994), conexões genéticas (um reprodutor aparentado incluído na matriz A é uma conexão genética) têm importante efeito na acurácia. Para 0, 10, 25, 50, 75, 90 e 100% de substituição, os números de reprodutores foram, respectivamente, 20, 40, 70, 120, 170, 200 e 220. À medida que se elevava o número de reprodutores, ocorria aumento do número de conexões genéticas e, conseqüentemente, da acurácia.

No caso da GenSys, observou-se menor precisão de estimação dos níveis do efeito fixo, semelhantemente ao MR.

A superioridade da MMM foi atribuída à melhor qualidade de estimação dos níveis do efeito fixo e ao uso da matriz de parentesco completa, que inclui a população-base com indivíduos não-aparentados, não-endogâmicos e não-selecionados. Segundo Kennedy et al. (1988), pela matriz de parentesco, os valores genéticos dos animais são expressos como funções lineares de valores genéticos dos animais da população-base e subseqüentes contribuições de amostragem Mendeliana, que não são influenciadas pela seleção e consideram a endogamia.

Ao comparar os modelos dentro de cada metodologia, observa-se que, na MMM, as tendências do MR e do MA foram opostas, cruzando próximo ao nível 25% de seleção. A superioridade do MR em relação ao MA, nas menores proporções de substituição, decorreu possivelmente do maior número de progênies/reprodutor (Tosh & Wilton, 1994). Apesar da maior acurácia na estimação dos efeitos fixos do MA, nas menores proporções de substituição, o uso das (co)variâncias entre os indivíduos é que determina sua superioridade após o nível 25% de seleção. Para a GenSys, as tendências do MR e do MA foram semelhantes, sendo a superioridade do MR, em relação ao MA, atribuída, possivelmente, à maior acurácia do teste de progênie, para a mesma qualidade de estimação de efeito fixo em ambos os modelos e para a mesma quantidade de informação.

Na Tabela 2, constam as variâncias dos erros de predição com base no MR e no MA, para ambas as metodologias.

 

 

Para o modelo de reprodutor, houve tendência semelhante em ambas as metodologias, ou seja, como o aumento da intensidade de seleção, ocorreu incremento da PEV com mais intensidade na metodologia GenSys, em decorrência da menor qualidade de estimação dos níveis do efeito fixo e da redução do número de progênies/reprodutor, à medida que se aumentou o efeito da seleção. A superioridade da MMM foi atribuída à maior precisão de estimação dos efeitos fixos.

Para a MMM sob modelo animal, à medida que se aumentou a intensidade de seleção, a PEV permaneceu praticamente constante, enquanto, na metodologia GenSys, ocorreu aumento da PEV.

No caso da MMM, o maior número de conexões genéticas não interferiu na PEV. Tosh & Wilton (1994) encontraram correlação de -0,10 entre conexões genéticas e PEV. Esses autores afirmaram que a diminuição na PEV, por meio do uso de animais aparentados, depende de muitos fatores, como acurácia do registro do teste de desempenho individual, número e coeficientes de parentesco e acurácia da avaliação dos parentes.

Para a metodologia GenSys, constatou-se menor precisão de estimação dos níveis do efeito fixo, à semelhança do que ocorreu com o MR.

Assim como na correlação, a superioridade da MMM foi atribuída à melhor qualidade de estimação dos níveis do efeito fixo e ao uso da matriz de parentesco completa.

Quando se compararam os modelos dentro de cada metodologia, observou-se que, na MMM, houve aumento da PEV para o MR, enquanto o MA permaneceu constante, à medida que se elevou a intensidade de seleção. O ponto de interseção das curvas ocorreu logo após o nível de 25% de substituição. Na metodologia GenSys, houve incremento na PEV, quando aumentou a intensidade, em ambos os modelos, reprodutor e animal. Na MMM, a superioridade do MR em relação ao MA, nas menores proporções de substituição, decorreu possivelmente do maior número de progênies/reprodutor, apesar de sua menor acurácia na estimação dos efeitos fixos. Na metodologia GenSys, a superioridade do MR, em relação ao MA, foi possivelmente atribuída à maior acurácia do teste de progênie em relação ao teste de performance para mesma qualidade de estimação de efeito fixo, em ambos os modelos, e para a mesma quantidade de informação.

 

Conclusões

A metodologia de modelos mistos foi superior à GenSys, quanto à acurácia e à variância do erro de predição, para a estrutura de dados selecionados simulada, principalmente para o modelo animal.

 

Agradecimento

Ao Prof. Luiz Alberto Fries, por sua gentileza em nos ceder o software GenSys.

 

Literatura Citada

BOLDMAN, K.G.; KRIESE, L.A.; Van VLECK, L.D. et al. A manual for use of MTDFREML. A set of programs to obtain estimates of variances and covariances [DRAFT]. Lincoln: USDA/ARS, 1995. 114p.         [ Links ]

BRITO, F.V.; FRIES, L.A. Proposta de um método para avaliação genética de bovinos de corte. Revista Brasileira de Zootecnia, v.23, n.2, p.181-188, 1994.         [ Links ]

BRITO, F.V. Comparações entre metodologias para avaliação genética de bovinos de corte. Porto Alegre: Universidade Federal do Rio Grande do Sul, 1992. 177p. Dissertação (Mestrado em Zootecnia) - Universidade Federal do Rio Grande do Sul, 1992.         [ Links ]

FRIES, L.A.; SCHENKEL, F.S. Estimation and predtiction under a selection model. In: SIMPÓSIO SOBRE PRODUÇÃO E CLASSIFICAÇÃO DE CARCAÇAS, 30., 1993, Rio de Janeiro. Anais... Rio de Janeiro: Sociedade Brasileira de Zootecnia, 1993. p.1-22.         [ Links ]

GIANOLA, D.; IM, S.; FERNANDO, R.L. Prediction of breeding value under Henderson's selection model: a revisitation. Journal of Dairy Science, v.71, n.10, p.2790-2798, 1988.         [ Links ]

HENDERSON, C.R. Best linear unbiased estimation and prediction under a selection model. Biometrics, v.31, n.2, p.423-447, 1975a.         [ Links ]

HENDERSON, C.R. Best linear unbiased prediction in populations that have undergone selection. In: WORLD CONGRESS ON SHEEP AND BEEF CATTLE BREEDING, 1:Technical, 1980, Palmerston North. Proceedings... Palmerston North: The Dunmore Press Limited, 1982. v.2, p.191-200.         [ Links ]

HENDERSON, C.R. Best linear unbiased prediction using relationship matrices derived from selected base populations. Journal of Dairy Science, v.68, n.2, p.443-448, 1985.         [ Links ]

HENDERSON, C.R. Comparison of alternative sire evaluation methods. Journal of Animal Science, v.41, n.3, p.760-770, 1975b.         [ Links ]

HENDERSON, C.R. Sire evaluation and genetic trends. In: ANIMAL BREEDING AND GENETICS SYMPOSIUM IN HONOR OF DR. JAY L. LUSH, 1972, Blacksburg. Proceedings... Champaign: ASAS/ADSA, 1973. p.10-41.         [ Links ]

KENNEDY, B.W.; SCHAEFFER, L.R.; SORENSEN, D.A. Genetic properties of animal models. Journal of Dairy Science, v.71, p.17-26, 1988. Supl.2.         [ Links ]

KENNEDY, B.W.; TRUS D. Considerations on genetic connectedness between management units under na animal model. Journal of Animal Science, v.71, p.2341-2352, 1993.         [ Links ]

MEYER, K.; THOMPSON, R. Bias in variance and covariance component estimators due to selection on a correlated trait. Journal of Animal Breeding and Genetics, v.101, p.33-50, 1984.         [ Links ]

OJALA, M.; SYVÄJÄRVI, J., HELLMAN, T. Effect of the size of the class of comparison on the accuracy of a sire's evaluation. Journal of Animal Breeding and Genetics, v.102, p.91-94, 1985.         [ Links ]

SCHAEFFER, L.R. Estimation of variance components under a selection model. Journal of Dairy Science, v.70, n.3, p.661-671, 1987.         [ Links ]

SORENSEN, D.A.; KENNEDY, B.W. Estimation of response to selection using least squares and mixed model methodology. Journal of Animal Science, v.58, n.5, p.1097-1106, 1984.         [ Links ]

TOSH, J.J., WILTON, J.W. Effects of data structure on variance of prediction error and accuracy of genetic evaluation. Journal of Animal Science, v.72, n.10, p.2568-2577, 1994.         [ Links ]

 

 

Recebido em: 22/11/02
Aceito em: 07/04/04

 

 

1 Parte da tese do primeiro autor apresentada à UFV para obtenção do título de Doutorado em Zootecnia - UFV. Bolsa CAPES.

Creative Commons License All the contents of this journal, except where otherwise noted, is licensed under a Creative Commons Attribution License