Efeito da violação de pressuposições da metodologia de modelos mistos na avaliação genética animal

Effect of assumption violations of the mixed model methodology on the genetic evaluation

Resumos

Estudos de simulação foram conduzidos para verificar o efeito da violação de pressuposições da metodologia de modelos mistos, variâncias genéticas conhecidas sem erro e distribuição normal dos erros aleatórios sobre os ganhos genéticos obtidos durante 10 gerações de seleção. Outros parâmetros, como valor fenotípico e acurácia, também foram avaliados. Inicialmente, foi simulado um genoma constituído de uma única característica quantitativa governada por 500 locos. O genoma foi utilizado na construção de uma população-base, na qual a característica quantitativa possuía herdabilidade inicial de 0,10. Para se obter uma estrutura de parentesco a partir das populações-base, foi gerada uma população inicial a partir da qual o processo de seleção teve início e os erros nos componentes de variâncias e as distribuições dos efeitos de ambiente foram introduzidos. Para pressuposição de que a variância genética era conhecida, utilizaram-se as intensidades de erro de 0%, -10%, -30%, -50%, 10%, 30% e 50%, enquanto que para a pressuposição de que a distribuição dos erros aleatórios era normal, utilizaram-se as distribuições normal, exponencial, poisson e uniforme. A cada geração foram selecionados 20 machos e 100 fêmeas, acasalados ao acaso, cada macho acasalado com cinco fêmeas, produzindo cinco descendentes por acasalamento. Esse processo foi repetido 30 vezes para minimização dos efeitos da flutuação gênica. Para a primeira pressuposição, não foi verificado efeito das intensidades de erro, aplicadas ao componente de variância genética aditiva sobre o ganho genético durante as 10 gerações de seleção. O mesmo resultado foi verificado para a distribuição dos erros aleatórios, ou seja, não houve influência de diferentes distribuições nos ganhos genéticos verificados.

BLUP; metodologia de modelos mistos; pressuposições; variância genética aditiva; distribuição dos erros aleatórios


Simulation studies were conducted to evaluate the effects of two assumption violations of the methodology of mixed models (the variances are known without errors and normal distribution of the random errors) on the genetic gains. Phenotypic values and accuracy during 10 generations of selection were also studied. Initially, a genome of only one quantitative trait governed by 500 loci was simulated. The genome was used to construct the base population in which the initial heritability of the quantitative trait was 0.10. To obtain a relationship structure from the base population, a initial population was generated. To this population a selection process and the errors in the components of variance and the distribution of the environment effects were introduced. To violate the assumption that the genetic variance is known without errors, the following errors intensities 0%, -10%, -30%, -50%, 10%, 30% and 50% were tested, and to violate the assumption that the distribution of the random errors is normal, the following distribution were considered: normal, exponential, poisson and uniform. In each generation 20 males and 100 females were selected and they were mated in the ratio of one male to five females and five offspring per each mating. To minimize random drift this process was reapeted 30 times. There was no evidence of the effect of both assumption violations on the genetic gain, the phenotypic value and accuracy over 10 generations of selection.

BLUP; mixed model methodology; assumptions; additive genetic variance; ramdon error distribution


Efeito da violação de pressuposições da metodologia de modelos mistos na avaliação genética animal

[Effect of assumption violations of the mixed model methodology on the genetic evaluation]

R. Fonseca1, R.F. Euclydes2*, R.A. Torres2, J.I. Ribeiro Júnior3, P.S. Lopes2, M.A. Silva4

1Estudante de doutorado da Universidade Federal de Viçosa

Rua P.H. Rolfs, s/n

36571-000 – Viçosa, MG

2Departamento de Zootecnia Universidade Federal de Viçosa

3Departamento de Informática Universidade Federal de Viçosa

4Escola de Veterinária da UFMG

Recebido para publicação, após modificações, em 18 de julho de 2000.

*Autor para correspondência

E-mail: rbaja@mail.ufv.br

Agência financiadora: CAPES

RESUMO

Estudos de simulação foram conduzidos para verificar o efeito da violação de pressuposições da metodologia de modelos mistos, variâncias genéticas conhecidas sem erro e distribuição normal dos erros aleatórios sobre os ganhos genéticos obtidos durante 10 gerações de seleção. Outros parâmetros, como valor fenotípico e acurácia, também foram avaliados. Inicialmente, foi simulado um genoma constituído de uma única característica quantitativa governada por 500 locos. O genoma foi utilizado na construção de uma população-base, na qual a característica quantitativa possuía herdabilidade inicial de 0,10. Para se obter uma estrutura de parentesco a partir das populações-base, foi gerada uma população inicial a partir da qual o processo de seleção teve início e os erros nos componentes de variâncias e as distribuições dos efeitos de ambiente foram introduzidos. Para pressuposição de que a variância genética era conhecida, utilizaram-se as intensidades de erro de 0%, -10%, -30%, -50%, 10%, 30% e 50%, enquanto que para a pressuposição de que a distribuição dos erros aleatórios era normal, utilizaram-se as distribuições normal, exponencial, poisson e uniforme. A cada geração foram selecionados 20 machos e 100 fêmeas, acasalados ao acaso, cada macho acasalado com cinco fêmeas, produzindo cinco descendentes por acasalamento. Esse processo foi repetido 30 vezes para minimização dos efeitos da flutuação gênica. Para a primeira pressuposição, não foi verificado efeito das intensidades de erro, aplicadas ao componente de variância genética aditiva sobre o ganho genético durante as 10 gerações de seleção. O mesmo resultado foi verificado para a distribuição dos erros aleatórios, ou seja, não houve influência de diferentes distribuições nos ganhos genéticos verificados.

Palavras-chave: BLUP, metodologia de modelos mistos, pressuposições, variância genética aditiva, distribuição dos erros aleatórios

ABSTRACT

Simulation studies were conducted to evaluate the effects of two assumption violations of the methodology of mixed models (the variances are known without errors and normal distribution of the random errors) on the genetic gains. Phenotypic values and accuracy during 10 generations of selection were also studied. Initially, a genome of only one quantitative trait governed by 500 loci was simulated. The genome was used to construct the base population in which the initial heritability of the quantitative trait was 0.10. To obtain a relationship structure from the base population, a initial population was generated. To this population a selection process and the errors in the components of variance and the distribution of the environment effects were introduced. To violate the assumption that the genetic variance is known without errors, the following errors intensities 0%, -10%, -30%, -50%, 10%, 30% and 50% were tested, and to violate the assumption that the distribution of the random errors is normal, the following distribution were considered: normal, exponential, poisson and uniform. In each generation 20 males and 100 females were selected and they were mated in the ratio of one male to five females and five offspring per each mating. To minimize random drift this process was reapeted 30 times. There was no evidence of the effect of both assumption violations on the genetic gain, the phenotypic value and accuracy over 10 generations of selection.

Keywords: BLUP, mixed model methodology, assumptions, additive genetic variance, ramdon error distribution

INTRODUÇÃO

A obtenção do BLUP por meio das equações de modelos mistos tem sido a técnica mais utilizada nas predições de valores genéticos dos animais para características de interesse econômico.

A aplicação das equações de modelos mistos envolve modelos matemáticos e não-matemáticos, nos quais estão embutidas várias pressuposições que devem ser cumpridas para obtenção de predições confiáveis e de qualidade. Porém, as situações consideradas como verdadeiras são difíceis de serem observadas na prática em que as equações de modelos mistos são utilizadas, desconsiderando-se que algumas pressuposições estão sendo violadas. Nesse contexto, é importante que o pesquisador conheça as pressuposições envolvidas pelos modelos utilizados e o efeito da violação dessas pressuposições na qualidade e confiabilidade da avaliação genética realizada. Assim, essas informações podem ser utilizadas no planejamento de experimentos, na construção e reestruturação de modelos e na verificação da confiabilidade dos resultados de uma análise.

Poucas dessas pressuposições são expostas nos trabalhos de melhoramento animal. É preciso reconhecer que são escassos os trabalhos que auxiliam na análise dos modelos (por intermédio do estudo dos efeitos das pressuposições admitidas). Dessa forma, ao estudar um método e suas aplicações, deve-se fazer a identificação das pressuposições envolvidas e procurar verificar se algumas delas são incompatíveis com o contexto do experimento. Além disso, é importante entender o motivo pelo qual as pressuposições são admitidas e, por meio dessas informações, tirar conclusões sobre a viabilidade da aplicação do método, utilizando-se determinado modelo.

De modo geral, nas análises dos dados em que se utilizam equações de modelos mistos, admite-se que os erros aleatórios são normalmente e independentemente distribuídos e que a variância genética aditiva seja conhecida sem erros, situações que podem não ser observadas na prática.

Exemplos de trabalhos que se utilizam dessas pressuposições são Henderson (1959, 1963, 1973, 1974, 1975, 1978), Schaeffer (1993), entre outros. Os valores não estão disponíveis na prática, e estimativas obtidas por meio de amostras são empregadas.

Portanto, este trabalho visa testar o efeito da violação de pressuposições sobre parâmetros genéticos de interesse no melhoramento animal, mediante técnicas de simulação, utilizando a metodologia de modelos mistos.

MATERIAL E MÉTODOS

Para simulação dos dados utilizou-se o programa Genesys, segundo Euclides (1996), que é capaz de simular genomas, complexos o suficiente para avaliar os efeitos do não-cumprimento das pressuposições, e compararam-se populações nas quais diferentes intensidades de erros no valor paramétrico das variâncias genéticas aditivas foram aplicadas.

Na simulação do genoma foi considerada uma única característica influenciada por 500 locos, com herdabilidades de 0,10.

O genoma foi simulado com base nos seguintes parâmetros: comprimento total de cromossomos igual a 4.000 centimorgans, 15 pares de cromossomos de tamanho aleatório, efeitos aditivos dos locos quantitativos simulados com distribuição normal, locos dialélicos sem desvios de dominância e epistáticos; inexistência de cromossomos sexuais, freqüências gênicas iniciais iguais em ambos os sexos, efeito fixo de sexo, freqüências iniciais dos locos quantitativos simuladas com distribuição uniforme e média igual a 0,5 e efeitos de ambiente simulados conforme distribuição normal.

A população-base foi simulada com 500 machos e 500 fêmeas

Os gametas (espermatozóides e óvulos) foram gerados e, posteriormente, pareados para formação dos zigotos. Todo este trabalho, bem como a definição do sexo dos zigotos, foi realizado por meio de processos aleatórios. Portanto, os indivíduos foram gerados de maneira diferente do que ocorre em animais, isto é, os gametas não foram resultado de segregações mendelianas, conseqüentemente o grau de parentesco entre os animais pôde ser considerado zero.

Apesar da existência da população-base, outra população, denominada inicial, foi gerada para dar origem a uma estrutura de parentesco entre os animais, com vistas ao aproveitamento de todo o potencial do BLUP e da metodologia de modelos mistos.

A partir das duas populações-base foi simulada a população inicial. Foram escolhidos, aleatoriamente, 20 machos e 100 fêmeas para progenitores da geração seguinte. Os gametas foram submetidos à segregação mendeliana por meio de um processo denominado caminhada cromossômica, que simula a gametogênese, assim como ocorre nos animais. Posteriormente, procedeu-se à zigotogênese, ou seja, pareamento dos gametas para formação dos zigotos. Para cada acasalamento foram gerados cinco descendentes que resultaram em populações de 500 animais.

Formada a população inicial, pôde-se iniciar o processo de seleção por meio do BLUP. O melhor preditor linear não-viesado dos valores genéticos foi obtido por meio das equações de modelos mistos, utilizando-se o modelo animal. Foram considerados dois efeitos aleatórios, o efeito genético do animal e o efeito de ambiente, em adição ao efeito fixo de sexo.

A seleção foi realizada durante 10 gerações e o processo foi repetido 30 vezes, com o objetivo de reduzir os efeitos da flutuação genética.

Para o teste da pressuposição de que os erros possuíam distribuição normal, foram simuladas quatro populações nas quais não havia erros nos componentes de variância. Para cada população foi simulada uma das seguintes distribuições matemáticas para o erro aleatório: normal, exponencial, poisson e uniforme.

A segunda pressuposição de que as variâncias genéticas são conhecidas sem erro foi testada por meio da simulação de sete populações, nas quais a distribuição dos erros aleatórios foi normal e as intensidades de erro no componente de variância genética aditiva variaram: 0%, -10%, -30%, -50%, 10%, 30% e 50%.

O componente de variância genética aditiva foi calculado, a cada geração, por meio dos valores genéticos aditivos dos animais, os quais eram armazenados pelo programa. Em seguida, para o componente calculado em determinada geração, os erros foram calculados e adicionados.

Foram geradas quatro populações para o teste da distribuição dos erros aleatórios e sete populações para o teste do efeito dos erros nos componentes de variância genética aditiva.

Para verificação do efeito da violação das pressuposições anteriormente citadas, observaram-se os parâmetros genéticos descritos a seguir.

Pk = Gk + Ek, em que

Pk = valor fenotípico do indivíduo k; Gk = valor genético do indivíduo k; e Ek = efeito do ambiente sobre o indivíduo k.

O ganho genético foi calculado pela diferença entre as médias fenotípicas das populações da geração atual e da geração anterior.

A acurácia foi calculada pela correlação entre os valores genéticos verdadeiros e os valores genéticos preditos pela metodologia de modelos mistos. O valor genético foi predito com base nas informações dos pais e da progênie.

RESULTADOS E DISCUSSÃO

Na Fig. 1 é apresentado o comportamento dos valores fenotípicos médios, durante 10 gerações de seleção, para a característica considerada, nas sete intensidades de erro introduzidas nos componentes de variância genética. Observa-se que não houve efeito das intensidades de erro sobre o aumento do valor fenotípico médio, durante as 10 gerações de seleção. Como conseqüência, não foi observado também efeito do erro nos componentes de variância sobre o ganho genético, uma vez que este é obtido pela subtração do valor fenotípico da geração atual do valor fenotípico da geração anterior (Fig. 2). A Fig. 3 mostra os resultados obtidos para a variância do erro de predição (PEV).




A pressuposição que as variâncias sejam conhecidas sem erros pode ser verificada em todos os trabalhos de avaliação genética que utilizam as equações de modelos mistos na obtenção do BLUP dos animais. Entretanto, em poucos essa pressuposição é realmente atendida. Assim, as estimativas dos valores genéticos dos animais são viesadas pelos erros nas estimativas de componentes de variância.

De fato as estimativas são viesadas mas o viés (com qualquer intensidade de erro no componente de variância) não alterou os ganhos genéticos realizados durante as 10 gerações de seleção. Essa situação é também relatada por Kennedy (1991), segundo o qual a classificação dos animais é freqüentemente insensível a erros nas variâncias admitidas para análises de característica simples, mas não necessariamente para análise de características múltiplas.

A explicação para os resultados observados é que os erros nos componentes de variância genética aditiva foram distribuídos a todos os animais, quando ocorreu a multiplicação da matriz de parentesco por esses componentes. Portanto, independente da intensidade de erro, o melhor animal, sob a situação em que não ocorreu erro, continuou sendo o melhor, sob uma situação em que o erro foi introduzido.

Ainda, é interessante a discussão dos resultados de acurácia. Neste trabalho as PEVs foram analisadas, indiretamente, pela acurácia das predições. Segundo Schaeffer (1984), a acurácia pode ser definida pela variância do erro de predição que, por sua vez, decresce quando a acurácia aumenta. Então, se variâncias incorretas forem usadas na predição, os preditores não são mais considerados BLUP e os seus erros de predição são aumentados (acurácias diminuídas), elevando-se, conseqüentemente, a probabilidade de erros na classificação dos animais e reduzindo-se a eficiência de seleção. Também Annala et al. (1995) relataram que o viés causado pelo uso de estimativas de componentes de variância não influi na classificação dos animais avaliados, sendo esta classificação influenciada somente pela variância do erro de predição.

Uma vez que componentes com erros foram utilizados no trabalho, era esperado que a PEV fosse aumentada influenciando a classificação dos animais. Os resultados observados indicaram a ausência de efeitos das intensidades de erros no comportamento da acurácia.

Slanger & Henderson (1975) estudaram o efeito do uso de valores incorretos de variâncias e covariâncias de variáveis aleatórias sobre o aumento da PEV, utilizando-se do modelo de reprodutor. Os resultados mostraram que os aumentos na PEV foram pequenos quando se usavam as equações de modelos mistos, mas grandes incrementos foram verificados quando se utilizou o método dos mínimos quadrados generalizados.

Com base na informação anterior e nos resultados obtidos pode-se inferir que as equações de modelos mistos obtidas a partir do modelo animal também são eficientes no controle da PEV, sugerindo que a não ocorrência de variação entre as curvas de acurácia foi atribuida à utilização das equações de modelos mistos para a obtenção dos valores genéticos dos animais.

As Fig. 4, 5 e 6 mostram os resultados obtidos para a característica em consideração quando foram simuladas populações com diferentes distribuições matemáticas para o efeito do erro aleatório. Para todos os casos não foi observado efeito da distribuição dos erros sobre os parâmetros genéticos avaliados.




A distribuição do erro aleatório não influi diretamente na classificação dos animais mas, primeiramente, na estimação dos componentes de variância, os quais, por sua vez, influem no resultado fornecido pelas equações de modelos mistos.

Segundo Kennedy (1988), admite-se que o vetor de valores genéticos aditivos e o vetor de erros aleatórios sejam normalmente distribuídos para fins de testes de hipóteses. Conforme Schaeffer (1991), as equações de modelos mistos podem ser obtidas sem o conhecimento da distribuição de y. Entretanto, para testes de hipóteses e estimação de componentes de variância por máxima verossimilhança ou máxima verossimilhança restrita, a normalidade é admitida. E ainda, Taylor (sd) cita que quando se realiza um teste de hipótese sobre um efeito no modelo, ou se estimam componentes de variância e covariância, deve-se admitir, invariavelmente, que o vetor de valores genéticos, que o vetor de erros aleatórios e que o vetor de observações sejam normalmente distribuídos.

A independência da distribuição dos erros com predições obtidas também pode ser observada em Henderson (1973). Portanto, as distribuições simuladas para os erros aleatórios não interferem nas predições obtidas do BLUP.

Portanto, para utilização dos métodos de estimação de componentes de variância, pressupõe-se normalmente que o vetor de observações tenha distribuição normal. Esse fato tem suporte em duas outras pressuposições: os valores genéticos aditivos e os erros aleatórios também têm distribuição normal. Uma vez que o vetor y é combinação linear desses dois outros vetores, admite-se que também tenha distribuição normal (teorema da combinação linear, Fonseca, 1995). Mas o erro é composto, na maioria das vezes, pelos efeitos de dominância, efeitos epistáticos, efeitos de ambiente permanente e efeitos de ambiente temporários. Assim, somente é razoável admitir que esse termo siga distribuição normal se todos os efeitos que o compõem forem independentes e normalmente distribuídos. Fica evidente que a definição da distribuição é difícil na prática e que de fato outras distribuições do erro e conseqüentemente do vetor y (que não a normal) podem ocorrer, apesar das estimações serem realizadas pressupondo-se normalidade.

Estimativas de componentes de variância obtidas utilizando-se o método REML, que assume distribuição normal do vetor y quando de fato a distribuição é outra, contém erros (são viesadas) que poderiam prejudicar a predição dos valores genéticos dos animais quando utilizadas nas equações de modelos mistos. Mas como citado anteriormente, para análises de característica única utilizando as equações de modelos mistos, problemas referentes a erros nos componentes de variância são minimizados e de fato não alteram a classificação e conseqüentemente o progresso genético.

CONCLUSÕES

Os erros nos componentes de variância e distribuições dos erros aleatórios não têm efeito no progresso genético de uma população quando analisada para uma característica via metodologia de modelos mistos utilizando-se o modelo animal.

  • ANNALA, M., SANCHES-PALMA, A., MUŃOZ-SERRANO, A. et al. Simulation analysis with BLUP methodology of different data structures in goat selection schemes in Spain. Small Rum. Res., v.17, p.51-55, 1995.
  • EUCLYDES, R.F. Uso do sistema para simulaçăo Genesys na avaliaçăo de métodos de seleçăo clássicos e associados a marcadores moleculares Viçosa: UFV, 1996. 150p. (Tese, Doutorado).
  • FONSECA, J. S., MARTINS, G.A. Curso de estatística Săo Paulo: Atlas, 1995. 317p.
  • HENDERSON, C.R. The estimation of environmental and genetic trends from records subject to culling. Biometrics, v.15, p.192-218, 1959.
  • HENDERSON, C.R. Selection index and expected genetic advance. In: National academy of science/national research council. Statistical genetics and plant breeding. Washington: NAS/NRC, 1963. p.141.
  • HENDERSON, C.R. Sire evaluation and genetic trends. In: Animal breeding genetics symposium in honor of Dr. J.l. Lush, 1973, Blacksburg. Proceedings.. Champaign: ASAS/ADSA, 1973. p.10.
  • HENDERSON, C.R. General flexibility of linear model techniques for sire evaluation. J. Dairy Sci., v.57, p.963-972, 1974.
  • HENDERSON, C.R. Comparison of alternative sire evaluation methods. J. Anim. Sci., v.41, p.760-770, 1975.
  • HENDERSON, C.R. Undesirable properties of regressed least squares prediction of breeding values. J. Dairy Sci., v. 61, p. 114-120, 1978.
  • KENNEDY, B.W. Workshop on estimation of breeding values with the animal model. Ontario: University of Guelph, 1988. 134 p.
  • KENNEDY, B.W. C.R. Henderson, the unfinished legacy. J. Dairy Sci, v.74, p.4067-4081, 1991.
  • SCHAEFFER, L.R. Sire and cow evaluation under multiple trait models. J. Dairy Sci., v.67, p.1566-1580, 1984.
  • SCHAEFFER, L.R. Linear models and computing strategies in animal breeding. Ontario: University of Guelph, 1993, 213 p.
  • SCHAEFFER, L.R. C.R. Henderson: contributions to predicting genetic merit. J. Dairy Sci., v.74, p.4052-4066, 1991.
  • SLANGER, W.D., HENDERSON, C.R. Effect of error in variances and covariances on prediction error variance. J. Dairy Sci., v.58, p.774-775, 1975.
  • TAYLOR, J.F. A course on best linear unbiased prediction of genetic merit under the framework of the general mixed linear model, and also on agricultural decision analysis Texas: Texas A&M University, s.d. 183p.

Datas de Publicação

  • Publicação nesta coleção
    26 Jun 2001
  • Data do Fascículo
    Fev 2001

Histórico

  • Recebido
    18 Jul 2000
Universidade Federal de Minas Gerais, Escola de Veterinária Caixa Postal 567, 30123-970 Belo Horizonte MG - Brazil, Tel.: (55 31) 3409-2041, Tel.: (55 31) 3409-2042 - Belo Horizonte - MG - Brazil
E-mail: abmvz.artigo@abmvz.org.br