Acessibilidade / Reportar erro

Dos desvios das médias dos grupos contemporâneos aos modelos animais

From means deviations of the contemporary groups up to animal models

Resumos

O objetivo deste trabalho foi apresentar a reparametrização de um modelo de desvios das médias dos grupos contemporâneos até um modelo animal não-restrito (equações dos modelos mistos de Lush - EMML). Aplicando restrições sobre as EMML, foi obtido o modelo animal segundo Henderson (equações dos modelos mistos de Henderson - EMMH). Para obter as EMMH, restrições do tipo <img border=0 width=32 height=32 id="_x0000_i1026" src="../../../../img/revistas/rbz/v28n3/a07fr1.gif">foram impostas e estas geraram a necessidade de pressuposições fortes, como ausência de seleção, para que as propriedades das EMMH pudessem ser provadas. Para diferentes situações examinadas, as restrições foram confirmadas. O somatório destas restrições pode ser erroneamente interpretado como propriedade das soluções de um modelo animal de que os animais-base tenham a soma dos seus valores genéticos igual a zero.

modelo misto sob seleção; propriedade genética; reparametrização; restrição


The objective of this work was to present a reparametrization of a means deviation model from contemporary groups up to an unrestricted animal model (Lush's mixed model equations - LMME). Applying restrictions on the LMME, the animal model was obtained in accordance with Henderson (Henderson's mixed model equations - HMME). To obtain the HMME, restrictions of the type <img border=0 width=32 height=32 id="_x0000_i1028" src="../../../../img/revistas/rbz/v28n3/a07fr1.gif">were imposed and these demanded the necessity of unrealistic assumptions, as the absence of selection, so that the HMME properties could be proved. For the different examined situations, the restrictions were confirmed. The summation of these restrictions can be incorrectly understood as property of the solutions of an animal model in that the animals-base have the summation of their genetic values equal to zero.

mixed model under selection; genetic property; reparameterization; restriction


Dos desvios das médias dos grupos contemporâneos aos modelos animais

From means deviations of the contemporary groups up to animal models

Luiz Alberto Fries

GenSys Consultores Associados S/C Ltda e DZ-MGA/UNESP/Jaboticabal-FAPESP. Endereço atual: Animal Genetics and Breeding Unit (AGBU) - UNE - Armidale, NSW 2351. fries@fcav.unesp.br

RESUMO

O objetivo deste trabalho foi apresentar a reparametrização de um modelo de desvios das médias dos grupos contemporâneos até um modelo animal não-restrito (equações dos modelos mistos de Lush - EMML). Aplicando restrições sobre as EMML, foi obtido o modelo animal segundo Henderson (equações dos modelos mistos de Henderson - EMMH). Para obter as EMMH, restrições do tipo foram impostas e estas geraram a necessidade de pressuposições fortes, como ausência de seleção, para que as propriedades das EMMH pudessem ser provadas. Para diferentes situações examinadas, as restrições foram confirmadas. O somatório destas restrições pode ser erroneamente interpretado como propriedade das soluções de um modelo animal de que os animais-base tenham a soma dos seus valores genéticos igual a zero.

Palavras-chave: modelo misto sob seleção, propriedade genética, reparametrização, restrição

ABSTRACT

The objective of this work was to present a reparametrization of a means deviation model from contemporary groups up to an unrestricted animal model (Lush's mixed model equations - LMME). Applying restrictions on the LMME, the animal model was obtained in accordance with Henderson (Henderson's mixed model equations - HMME). To obtain the HMME, restrictions of the type were imposed and these demanded the necessity of unrealistic assumptions, as the absence of selection, so that the HMME properties could be proved. For the different examined situations, the restrictions were confirmed. The summation of these restrictions can be incorrectly understood as property of the solutions of an animal model in that the animals-base have the summation of their genetic values equal to zero.

Key Words: mixed model under selection, genetic property, reparameterization, restriction

Introdução

Durante décadas, o critério de seleção (LUSH, 1945) básico disponível foi o "desvio da média do Grupo Contemporâneo (GC)" e/ou funções destes desvios. Em gado de corte, por exemplo, pertencem ao mesmo GC de desmama os animais que nascem na mesma fazenda, ano e estação, são do mesmo sexo e manejados nos mesmos grupos e pastos até a sua desmama, realizada na mesma data. A pressuposição utilizada para o uso deste critério é a de que não existem diferenças genéticas entre as médias dos GC, o que restringe o uso pleno do método a comparações dentro de GC.

Esta situação pode ser descrita por intermédio da equação em que

y é um vetor de produções medidas nos n indivíduos;

X é uma matriz de incidência que indica a distribuição dos n indivíduos nos p GC;

é um vetor de efeitos fixos dos p GC (note que neste modelo conterá todos os efeitos comuns aos animais do mesmo GC, inclusive diferentes valores genéticos médios); e

é um vetor de resíduos ou desvios das médias dos GC.

Por meio da teoria dos índices de seleção, o problema é resolvido em dois passos:

(1) obtém-se uma solução para que é igual à média aritmética de cada GC; e

(2) os desvios das médias dos GC's são calculados como

Depois disso, o valor genético dos animais é predito por Portanto, com o conhecimento da herdabilidade (LUSH, 1945), os desvios das médias dos GC são decompostos em:

(1) ao, a parte genética aditiva (pelo menos no quanto ela é diferente da média do GC); e

(2) eo, o resíduo (efeitos ambientais mais efeitos genéticos não-aditivos e de interação).

Ou seja:

Assim, mesmo na falta de informações sobre a genealogia dos animais ou de capacidade operacional para utilizar esta informação, a teoria dos índices de seleção (LUSH, 1945) indica como estes desvios podem ser utilizados para predizer o valor genético dos animais.

No final da década de 40, por meio de modificação nas equações normais do método dos quadrados mínimos, Henderson (HENDERSON, 1984) desenvolveu as bases para a metodologia dos modelos mistos (MMMH), que passa a ser utilizada rotineiramente em gado de corte na década de 80, inclusive no Brasil. A regra mundial em gado de corte é a utilização dos modelos animais (MA), nas suas várias aplicações. SCHAEFFER (1996) apresenta e discute alguns exemplos de modelos animais.

A equação matemática de um modelo animal pode ser descrita por Além dos termos já definidos, a matriz Z é utilizada nesta equação como uma matriz de incidência que associa observações aos efeitos aleatórios (por exemplo, os genéticos aditivos) de cada animal. Em alguns casos, a matriz Z é igual a uma identidade. Com relação à equação do modelo de desvios da médias dos GC, na equação do modelo animal substitui-se por Za + e ou, possivelmente,

O presente trabalho tem por objetivo demonstrar que as equações de um modelo animal podem ser obtidas a partir de uma reparametrização do modelo de desvios das médias dos GC. Como resultado, obtêm-se as equações de Lush. Quando restrições são impostas, obtêm-se as equações da MMMH/MA, que geram soluções condicionais. Este espaço restrito destas soluções condicionais fornecidas pela MMMH/MA é entendido como "propriedades genéticas do modelo animal".

O presente trabalho também objetiva demonstrar, por meio do uso de alguns exemplos clássicos da literatura, que estas "propriedades genéticas" são dependentes:

(1) da distribuição dos dados nos GC e do nível de conectabilidade/conexidade destes;

(2) se a matriz de restrições possui posto máximo (ou completo) de linhas; e

(3) se a matriz de parentesco é completa ou não.

Materiais e Métodos

Solução do problema por intermédio do método dos quadrados mínimos (MQM)

A equação de um modelo animal, representada por pode ser utilizada para formular o problema de se estimarem simultaneamente os p efeitos ambientais dos GC () e os n efeitos genéticos aditivos (a). Por meio do método dos quadrados mínimos, isto seria eqüivalente a resolver o seguinte problema (super-parametrizado, com p+n equações), contando com n unidades de informação:

A alternativa oferecida pelo MQM, para fornecer a solução , é impor a restrição Esta matriz de restrições significa que a soma dos valores genéticos estimados (ou a soma dos desvios das médias dos GC) dos animais pertencentes a cada GC deve ser zero para cada um e para todos os GC's e contém, portanto, p restrições, correspondendo às p linhas de X'. É uma restrição não-paradoxal, alinhada com a teoria predominante em genética quantitativa e que não cria impasse de interpretação dos parâmetros ou das soluções; mas, mesmo assim, não menos importante e restritiva.

Como faz parte da primeira das equações em {1}, ou seja é a primeira linha de {1}, a restrição X'Ia = 0 pode ser diretamente substituída nesta (ou aplicada na pri-meira equação de {1}) resultando então em Sob esta restrição, quebra-se a dependência entre equações (não são mais simultâneas), embora nada impeça que elas sejam mantidas em conjunto único, e, sob as equações {1} se tornam

A solução βo (um vetor com as médias aritméti-cas das observações de cada GC), obtida da primeira equação de {2} e usada na segunda equação, permite a solução Note que o agora exposto é idêntico ao descrito acima, na Introdução, como o primeiro de um processo em dois passos ou estádios, ou seja, continua sendo exatamente o mesmo "desvio da média do GC".

Portanto, a equação {1} poderia ter sido escrita como

enquanto a equação {2} poderia ter sido escrita como

Combinando o MQM com a Teoria dos Índices de Seleção

A regressão dos valores genéticos aditivos a sobre os valores fenotípicos y é uma das muitas definições da herdabilidade (h2). Esta pode ser representada por:

Usar o conhecimento da h2 ou de λ para as n últimas equações do sistema pode ser interpretado como estar utilizando n unidades extras de informação e, portanto, a condição está dada para que o sistema se torne determinado. Portanto, não é necessário impor as p restrições ou ou quando o conhecimento de h2 é utilizado.

Para adicionar esta informação de forma estatisticamente correta ou ortodoxa, o sistema de equações deve ser reparametrizado, considerando que o desejado é um preditor/estimador de a (será usado o símbolo aL para o critério de seleção de Lush, definido abaixo).

Para o caso de valores genéticos ou DEP's de touros, LUSH (1945) faz o seguinte comentário: "O valor numérico real da solução para cada touro é em parte determinado pelo seu valor genético real, mas parcialmente também por quaisquer erros tendenciosos que as soluções contenham além dos resíduos aleatórios. Assim sendo, estas soluções irão variar mais do que os valores genéticos reais dos touros. Os touros com as soluções/estimativas mais altas são geralmente bons touros, mas provavelmente não tão bons quanto as suas soluções. Similarmente, os touros com soluções baixas são geralmente touros deficientes, mas usualmente não tão pobres quanto suas soluções. Nós erraremos menos se estimarmos o valor genético de cada touro como um ponto localizado entre a sua solução e a média da raça."

Com escalares, para errar menos e no caso de desvios das médias dos GC, deve-se usar a relação e, portanto, a reparametrização necessária é dada pelo inverso da herdabilidade, pois

Para os vetores e a, é necessário definir:

, em que A é a matriz de coeficientes de parentesco;

A distribuição condicional da densidade de a dado o vetor é dada por

GIANOLA et al. (1989) definem este produto G V-1 como H e chamam H de "versão ou equivalente multivariado da herdabilidade" e, portanto, é apenas a versão multivariada de

O uso do MQM, da teoria dos índices de seleção (LUSH, 1945) e da matriz de parentesco de Wright permite obter o seguinte critério de seleção ou estimador/preditor dos valores genéticos dos animais:

em que representa verdadeiramente os efeitos ambientais e só os efeitos ambientais dos GC.

Portanto, a relação necessária para a reparametrização, mantendo a definição de , fazendo L= , é

Para reparametrizar de {3} para γ = por intermédio de γ = C , dada a matriz usa -se:

Nota-se que este resultado é obtido usando apenas o MQM e a teoria dos índices de seleção. Portanto, é apropriado denominá-las de equações dos modelos mistos de Lush (EMML), ou, no caso específico de um modelo animal, de EMML/MA.

Por estarem baseadas no MQM, as EMML dependem:

(1) de que as matrizes de incidência (no caso, X e I) sejam conhecidas com exatidão total; e

(2) de que os resíduos tenham distribuição idêntica (entre níveis dos efeitos do modelo) e independente de todos os outros resíduos (representada por e ~ IID (0,).

No caso do MQM ponderado, esta pressuposição é suavizada para Var(e)=R, para uma matriz R qualquer. A extensão das EMML para este caso é simples e direta. Nota-se que a forma da distribuição dos resíduos é livre para a etapa de estimação dos parâmetros de tendência central; ou seja, não é necessário pressupor/invocar normalidade ou qualquer outra distribuição para usar as EMML ou suas soluções.

As únicas outras pressuposições utilizadas para obter as EMML para um modelo descrito por uma equação geral são aquelas necessárias para obter as matrizes de variância/covariância das variáveis aleatórias e que são explicitadas por:

Uma maneira mais direta e elegante de chegar ao mesmo resultado {5} é pela substituição da mesma expressão de nas duas equações do sistema {3}, obtendo-se diretamente as equações que permitem a estimação simultânea de e a. Substituindo por em {3} obtêm-se igualmente:

Se na segunda equação de {3} for substituído diretamente por estar-se-ia "emendando" {3} e obtendo as EMMH (ver {6} abaixo) de forma heterodoxa.

Note que a MMMH é baseada no (quase) mesmo conjunto de pressuposições utilizadas na MMML, à exceção de que, para a MMMH:

o valor esperado de qualquer observação é dado apenas pelos efeitos fixos de GC, ou seja, todos os animais de um mesmo GC possuem o mesmo valor esperado, independentemente do valor genético do indivíduo ou do de seus pais ou da genealogia do indivíduo; e/ou

um vetor de zeros, ou seja, o valor esperado de todo e qualquer animal é zero; por isso, nenhuma informação prévia ou processo seletivo pode existir.

Outra maneira de obter as EMMH é por intermédio da imposição da restrição sobre as recém obtidas EMML, eliminando-as da primeira equação de {5}, quando então se obtêm as equações simétricas, condicionais a esta restrição e chamadas de equações dos modelos mistos de Henderson (EMMH) ou EMMH para o modelo animal (EMMH\MA):

Um dos objetivos deste trabalho é demonstrar que esta restrição dá origem às chamadas "propriedades" das soluções do modelo animal. Por exemplo, se a base (ou cerne ou 'kernel') de X contiver uma coluna de 1's, então a soma das estimativas dos valores genéticos dos animais-base será zero, pois, para as linhas correspondentes aos animais-base, 1'A-1 fornece o valor 1 (se a matriz A for completa, conforme alertado por ALBUQUERQUE, 1997), enquanto para os animais restantes (com pais conhecidos) sua soma de linha ou coluna é igual a 0. Em geral, 1'A-1 = [ 1 ... 1 0 ... 0 ]'. Caso X não contenha uma coluna de 1's explicitamente, mesmo assim esta propriedade será constatada quando um modelo tipo "médias de subclasses ou de caselas" for utilizado. Nas EMMH/MA, se X definir os GC, então a soma das soluções dos valores genéticos dos animais-base presentes em cada GC será zerada. Se um GC não contiver nenhum animal-base e todos os animais presentes tivessem informação completa de genealogia, então este GC não estaria gerando nenhuma restrição. Como regra, apenas o conjunto destas restrições (a soma dos valores genéticos de todos os animais-base, presentes no total dos GC's) é visualizado.

Para resolver {1} ou {3}, pelo MQM, X' =0 são impostas. Em {5}, nas EMML, nenhuma restrição sobre os efeitos genéticos ou aleatórios é imposta e X' = está presente. Em {6}, nas EMMH, restrições são impostas e, quanto menor a h2 (ou maior ), maior a soma de quadrados associada a esta restrição (SEARLE, 1971).

Note que em o segundo termo, correspondendo ao chamado 'resíduo' e que é utilizado na restrição para obter {6}, contém as estimativas dos efeitos genéticos não-aditivos, das interações e do não-especificado no modelo. A decomposição de se dá por intermédio das relações de variâncias. Restrições sobre o complemento dos efeitos aditivos estimados implicam em forçar o estabelecimento de relações sobre os efeitos aditivos estimados.

Outra maneira de obter as EMML é seguir HENDERSON (1984), o qual apresenta que, caso fosse conhecido, o melhor preditor (BP) de a seria Definindo tem-se que permite reparametrizar {3} (que poderia ser igualmente um problema MQM Generalizado ou Ponderado), por meio da relação fornecendo as equações:

Os coeficientes das equações {5.1} e {5.2} são iguais aos das EMML {5} e sua única diferença com as EMMH reside na primeira equação de {6}, na qual inexiste o termo correspondendo a porque a substituição é realizada apenas na segunda equação de {3}, "emendando" esta com

A conseqüência da ausência de um termo nas EMMH/MA {6} é que as soluções obtidas obedecem a este fato e se comportam como se a restrição tivesse sido imposta.

O exemplo de KENNEDY, SCHAEFFER e SORENSEN (1988)

No exemplo de KENNEDY et al. (1988), oito observações são feitas sobre oito animais representados por a' = [ a1 a2 a3 a4 a5 a6 a7 a8]. Os quatro primeiros animais formam a população base, com pais desconhecidos. Os animais 5 e 6 são filhos de 1 e 2, sendo, portanto, irmãos completos. O animal 7 é filho de 3 e 4, enquanto o animal 8 é filho de 5 e 6 e, portanto, consangüíneo.

As EMMH/MA são:

No exemplo original, todos os animais, das três gerações, têm as performances medidas num único ambiente e estas são: [ 10 9 8 7 9 10 8 11]. A relação entre as variâncias residual e genética é 1.0.

O exemplo de HENDERSON, KEMPTHORNE, SEARLE e VON KROSIGK (1959)

Neste trabalho clássico, o modelo animal (com medidas repetidas de produção de leite de uma mesma vaca em diferentes anos - note que o próprio HENDERSON (1988) aponta este trabalho como 'aparentemente a primeira aplicação de BLUP para um modelo animal') contém o efeito fixo ambiental de ano de parto, o efeito fixo de grupo genético (o trabalho sugere que estes grupos genéticos seriam os próprios touros-pais das vacas), ambos representados pela parte do modelo, e o efeito aleatório da ima vaca, representado pela "capacidade mais provável de produção" (CMPP) e descrito por intermédio da parte Zc do modelo. Tentando manter a notação do trabalho original (ver pg 195-6 deste, em que é definido que Var(c)= D), as matrizes de coeficientes das EMML e as das EMMH, junto com o seu lado direito ('RHS') comum, são apresentadas abaixo, nesta ordem, como nova versão de {5} e {6}.

As equações acima resultam de uma adaptação do original, usando a pressuposição que FRIES e SCHENKEL (1993) demonstraram que o MQM ponderado, considerando os efeitos genéticos como fixos, ou as equações da MMML ou o MQM generalizado de um modelo completo, fornecem as mesmas soluções verdadeiramente BLUE para . As equações da MMMH produzem soluções de um MQM generalizado de um modelo incompleto ou parcial, que apenas contempla os efeitos , conforme provado por (HENDERSON et al., 1959), e ignora os efeitos genéticos ou aleatórios.

Resultados e Discussão

Resultados do exemplo de KENNEDY, SCHAEFFER e SORENSEN (1988)

A estimativa da média geral pelo MQM Ordinário é 9.00 e, usando este como um valor paramétrico, a teoria dos índices de seleção fornece:

aBP = [ 0.6786 0.1786 -0.5357 -1.0357 0.4405 0.7738 -0.8571 1.0714 ]'.

Usando as EMMH, a solução para o efeito fixo é 8.7059 e

aH = [ 0.8676 0.3676 -0.3676 -0.8676 0.6716 1.0049 -0.6471 1.3235]'.

A soma de todas as soluções (X'aH = 1'aH) é 2.352941. Estes resultados são também apresentados na publicação original.

Note que a soma das soluções para os quatro primeiros animais é zero e, portanto, se verifica pois e esta "propriedade genética das soluções" é interpretada como "os animais-base da população (sem genealogia conhecida) têm valor genético médio esperado zero".

KENNEDY, SCHAEFFER e SORENSEN (1988) chamam a atenção de que: "Um entendimento e a correta definição da população base são críticas para modelos animais. Com o uso de A, animais com pais não identificados são tratados/considerados como animais da população base e pressupostos como tomados ao acaso de uma mesma população, com mérito genético 0 e variância comum A aplicação de modelos animais, sem a devida consideração para a definição dos animais que formam a população base e em relação aos quais todas as estimativas de mérito genético subseqüentes estão ligadas, pode conduzir a erros. Se os animais da população base na verdade são tomados de populações com diferentes médias genéticas, como no caso de populações em cruzamento ou quando animais jovens com paternidade desconhecida entram na população continuamente, então o modelo deverá levar em consideração a estrutura destas subpopulações e permitir diferentes valores médios esperados para os animais base de cada subpopulação."

Infelizmente, estas notas acauteladoras são pouco valorizadas. Como um exemplo rudimentar disto, pode ser mencionada a falta de uso rotineiro de testes de conectabilidade/conexidade antes da realização de avaliações genéticas em populações não-experimentais. Infelizmente, apenas a parte 'fácil' do trabalho de KENNEDY, SCHAEFFER e SORENSEN (1988) é utilizada para convencer os usuários de que as soluções do modelo animal obedecem a certas dogmáticas 'propriedades genéticas'.

Para avaliar as conseqüências destas restrições, o mesmo exemplo foi utilizado, alterando apenas a possível distribuição dos animais através de GC's. Três situações (A, B e C) foram examinadas e são abaixo descritas, com seus resultados. Em algumas destas situações, foi mantido o parâmetro para a média geral, para facilitar a discussão dos resultados (obviamente então impondo limitações de estimabilidade de que a soma das soluções para GC's seja igual a zero).

Situação A

Os animais 1 e 2 pertencem ao GC 1; os animais 3 e 4, ao GC 2; e o restante (5, 6, 7 e 8), ao GC 3. Portanto, os animais-base estariam divididos em GC's distintos e apenas animais-base estariam representados nestes GC's. Todos os descendentes (filhos e netos) destes animais-base encontram-se reunidos num único GC.

A solução das EMMH para os efeitos fixos é dada por [ 8.7333 0.4667 -0.9333 0.4667 ] e aH = [ 0.5500 0.0500 -0.0500 -0.5500 0.2833 0.6167 -0.6000 0.9000 ]. É interessante notar que X'aH = [ 1.2 0.6 -0.6 1.2].

Estas soluções são obtidas como conseqüência de A verificação de que as restrições se cumprem é simples e podem ser feitas por inspeção. Para a presente situação, a matriz representa o conjunto de restrições de nulidade sobre aH (as linhas da matriz são separadas por //):

A restrição imposta por intermédio da primeira linha da matriz acima, originada do fato de o parâmetro para média geral ter sido incluído no modelo, estabelece a restrição S (sigma ou somatório), conhecida como "propriedade genética das soluções" e interpretada como "os animais-base da população (sem genealogia conhecida) têm valor genético esperado zero".

A restrição representada pela segunda linha determina que 3*( a1 + a2 ) = 2*( a5 + a6 ). Esta restrição, geneticamente, é arbitrária e não depende dos valores y observados. Por que, em qualquer situação, o valor genético médio dos filhos deveria ser igual a 1,5 vezes a média do valor genético dos pais? Note que (a5 + a6 ) = (3/2)*( a1 + a2 ) se cumpre, pois (0,9)=(1,5)(0,60).

Na terceira linha é estabelecido um contraponto ou uma contradição às outras restrições, pois aqui o valor genético estimado para o filho é igual a soma (note que é a soma, e não a média) dos valores genéticos estimados dos pais, ou seja, a7 = (a3 + a4) ou -0.6 = -0.05 -0.55.

A melhor maneira encontrada para interpretar a quarta restrição é a de que esta linha determina que o duplo da soma dos valores genéticos estimados dos filhos (animais 5, 6 e 7), com o valor 0.6, seja igual à soma ponderada dos valores genéticos dos pais, considerando o número de filhos de cada pai. Esta última relação até seria discutível/aceitável, como situação geral.

As três últimas linhas/restrições estabelecem relações genéticas conceitualmente não-congrüentes entre si e a soma destas resulta na primeira, que impõe a conhecida restrição sobre os animais-base. Por outro lado, nenhuma das linhas envolve o animal 8, constatando-se que qualquer valor medido em y para este animal poderia ter sido observado, e isto não seria capaz de alterar em nada a s relações/valores genéticos determinados pelas restrições acima.

Tendo conhecimento e considerando estas restrições, como delinear e definir, por exemplo, os pré-requisitos de um teste de progênie? Como distribuir os acasalamentos/progênies de cada touro nos GC de maneira que os resultados não sejam resultantes/dependentes desta distribuição? Como evitar que as restrições tipo da segunda e da terceira linha acima influenciem os resultados?

Com certeza, se delineamentos simples fossem utilizados, com testes realizados dentro de unidades experimentais, as restrições teriam uma forma simples, poderiam ser evidenciadas e talvez chamassem a atenção. Contudo, a verificação de problemas deste tipo por intermédio da mera inspeção/constatação de sumários de touros ou resultados de avaliações genéticas é dificultada pela participação nestes de grande número de touros, possibilitando que os erros determinados por estas restrições fiquem dissimulados. Mesmo assim, quanto dos saltos/inversões/discrepâncias que ocorrem entre sumários poderiam ser explicados por estas restrições?

Situação B

Os animais 1, 2, 5, 6 e 8 pertencem ao GC 1 e os animais 3, 4 e 7, ao GC 2; portanto, os animais-base estariam divididos em GC's distintos e todos os descendentes (filhos e netos) de cada subconjunto de animais-base encontram-se reunidos no GC da sua base. Claramente existe uma situação de dados desconectados ou desconexos, sem nenhum laço genético entre os dois grupos.

As soluções das EMMH/MA são obtidas sem qualquer problema ou mesmo sem que alguém necessariamente se dê conta de que existem problemas de conectabilidade/conexidade.

As estimativas para os efeitos dos GC's para esta situação são [ 9.6667 7.6250 ] e

aH = [ 0.2500 -0.2500 0.2500 -0.2500 -0.0833 0.2500 0.1250 0.5000 ]. Vale a pena comparar e notar as discrepâncias entre os valores obtidos para aH nas duas situações.

Quando todos os animais de cada subpopulação estão dentro de um mesmo GC, a propriedade associada à primeira das restrições da situação anterior (restrição ) aplica-se a cada uma dessas populações isoladas.

Pode-se inferir que é justamente a aplicação destas restrições que permite que soluções sejam fornecidas pelas EMMH, sempre, corrigindo problemas de deficiência de posto causados por dados desconexos. Assim, é possível identificar a causa da enorme facilidade computacional (pelo menos em relação às EMML), na solução das EMMH, de sempre fornecerem uma solução e da rápida convergência dos processos iterativos baseados nestas.

A soma das restrições acima resulta na restrição maior (), válida para todos os animais-base, independentemente de suas equações serem conexas ou não.

KENNEDY et al. (1988) alertam para a necessidade de definir bem as populações e os animais-base de cada uma delas e relatam que a interpretação dos resultados é dependente desta distribuição. Esses autores reportam ainda que situações deste tipo, com problemas de estrutura e formação de subpopulações, "podem ser complementados através do uso de uma estratégia de agrupamento judiciosa/cuidadosa, como a proposta por Westell e Van Vleck (1987), e que este problema foi discutido com maiores detalhes por Henderson (1988)." Grupos genéticos podem ser bom remédio ou 'mal menor', em algumas situações. Outra opção é fazer real análise de conectabilidade, separando populações desconectadas e oferecendo relatórios separados por subpopulações, para os criadores. Porém, este assunto de conectabilidade e grupos genéticos merece mais espaço para ser discutido.

Situação C

Os animais 1, 2, 3 e 4 pertencem ao GC 1; os animais 5, 6 e 7, ao GC 2; e o animal restante, 8, está sozinho no GC 3. Portanto, todos os animais-base estariam presentes em um só GC, seus filhos estariam em um segundo GC e seus netos estariam presentes no último destes GC's. É uma situação com confundimento total entre GC's e gerações, o que é uma situação extrema, mas em linha com o que acontece na prática. Pelo menos, normalmente existe alta correlação entre o ano de nascimento do animal e o número de sua geração.

As soluções para os efeitos dos três GC's são dadas por [ 8.5000 8.8182 10.4091 ] e

aH = [ 0.7955 0.2955 -0.2955 -0.7955 0.4242 0.7576 -0.6364 0.5909 ].

Estas soluções são condicionais às seguintes restrições:

A primeira restrição estabelece uma relação entre os somatórios dos valores genéticos dos animais da primeira e da segunda geração, para determinada (e geneticamente injustificável) ponderação (10 vs. 6). Nota-se que o número de animais-base (cuja soma de linha é 1,0) a mais no GC 1 é de quatro a mais que no GC 2. Apenas a título de especulação, note-se que se um resultado assim for repetido nos diferentes rebanhos de uma população comercial, estaria criado mecanismo espúrio para fabricar progressos genéticos que não existem.

A segunda restrição estabelece relação entre os somatórios dos animais da segunda geração e o resto (primeira mais terceira geração). Não é possível justificar ou entender os valores dos coeficientes mas, pelo menos, para esta segunda linha, a soma dos coeficientes positivos é igual à soma dos coeficientes negativos.

A terceira linha é lógica: como o animal 8 está sozinho no GC 3, o seu valor genético só pode ser estimado como função média dos valores genéticos estimados/preditos dos seus pais.

Em qualquer situação, a soma das linhas de restrições sempre resulta em um vetor que corresponde à restrição imposta aos animais-base para que tenham soma igual a zero (restrição ).

Resultados do exemplo de HENDERSON, KEMPTHORNE, SEARLE e VON KROSIGK (1959)

Para este exemplo, a matriz de restrições que determina os valores das soluções para as CMPP das nove vacas, e que possui sete linhas, correspondendo aos sete parâmetros: média geral, os três anos de partos e os três grupos fixos (em uma das possibilidades apresentadas pelo autor, estes grupos poderiam ser interpretados como os três pais) das vacas, é:

Como esperado, as mesmas deficiências de posto coluna de X aparecem como deficiências de posto linha da matriz de restrições. Por exemplo, nota-se que a primeira linha é igual à soma das três seguintes, que também é igual à soma das três últimas. Além disso, algumas linhas são incongruentes com as outras. Para este exemplo, com uma matriz X' com posto linha igual a 3, apenas as três últimas restrições (e a soma destas) se verificam. Qual restrição prepondera (se verifica) sobre quais outras é uma questão a ser resolvida.

Por exemplo, a segunda linha impõe 1/3c1+ 1/3c2+1/2c3+c4 = 0, enquanto a quinta linha de restrições força c1 +c2+c3+c4 = 0. Esta última restrição estabelece que a soma dos valores genéticos das filhas do touro 1 é igual a zero. Nota-se que esta última restrição tem sido entendida como propriedade das soluções, em modelos mistos com efeitos aleatórios aninhados. Nota-se também que a soma das últimas três restrições resulta na primeira, que estabelece a conhecida restrição .

Para este exemplo, [X'Z(Z'Z)-1D-1cH ]'= { 0 -17.5 0.8 16.7 0 0 0} e a soma das restrições 2, 3 e 4 resultam em zero. Vale a pena indicar ainda que, como conseqüência destas restrições, as soluções das EMMH indicam que o ano 2 foi sensivelmente pior que o ano 3, ao passo que as soluções pelo MQM Generalizado de um modelo completo (e portanto com propriedades BLUE) indicam o oposto. Isto indica que, embora as restrições sejam sobre os efeitos genéticos, as soluções para os outros efeitos (fixos ou ambientais) simultâneos do modelo também serão influenciados por estas restrições.

Este exemplo mostra que restrições reais, e não apenas limitações/constrições sobre as soluções (SEARLE, 1971), foram impostas sobre as equações, alterando os valores de funções estimáveis e formas quadráticas.

Como comentário final, pode ser dito que a simplificação das equações, por intermédio da restrição da forma , é a origem das "propriedades das soluções" e da necessidade de fazer pressuposições, como a de ausência de seleção para que as soluções das EMMH tenham propriedades BLUE e BLUP (HENDERSON (1975) e SCHAEFFER (1996)).

Nota-se que esta restrição implica que diferentes grupos de animais-base utilizados em diferentes níveis de X (diferentes locais ou anos ou GC) terão valor médio zero (ou a soma de suas soluções será zero), sendo, portanto, necessário que, na prática, seja viável e plausível pressupor que estes diferentes grupos de animais-base tenham idêntica esperança.

Nota-se a semelhança com: "A pressuposição utilizada para o uso deste critério [desvios de médias ou teoria dos índices de seleção] é a de que não existem diferenças genéticas entre as médias dos GC." Por outro lado, as EMML que não contêm esta restrição mantêm suas propriedades mesmo na presença de seleção dos futuros pais, conforme demonstrado por FRIES e SCHENKEL (1993).

Esta restrição, ainda, lembra as várias equações propostas para serem adicionadas sobre as EMMH para contemplarem os diferentes processos seletivos (HENDERSON, 1975) e também as equações para grupos genéticos, sempre uma função aproximada da parte de X, que descreve tempo e/ou origem dos animais-base. Quando isto é feito, as equações se tornam mais complexas que as EMMH, talvez até mais que as EMML, e o resultado produzido é sempre uma alteração/redução nos efeitos da seleção. O grau de redução dos efeitos de seleção dependerá do fato de a estratégia de grupamento ser capaz de reproduzir/captar as decisões seletivas que de fato foram tomadas.

HENDERSON (1975) demonstra que, se a seleção for do tipo 'invariante à translação', quando então L'X = 0 ou X'L = 0, as EMMH fornecerão soluções que não serão viesadas por este tipo de seleção. As decisões tomadas com relação ao valor genético dos animais, representadas por L, podem ser apenas re-expressões da matriz de dimensão n x n, e estar apenas criando formas equivalentes ou alternativas às p restrições que de qualquer forma serão impostas.

Deveria ser melhor divulgado que a única seleção compatível com manutenção das propriedades das EMMH é a seleção entre animais dentro dos níveis de X, ou seja, dentro dos GC. Portanto, "seleção dentro dos GC's" seria tradução operacional (e com interpretação clara) da obscura "seleção invariante à translação".

Pode ser dito que a teoria dos índices de seleção não proporciona comparações entre animais de diferentes GC's, a não ser que se pressuponha que as médias genéticas dos animais dos diferentes GC's sejam semelhantes e iguais a zero. Enquanto isto, a MMMH obtém estimativas/preditores por meio de pressuposição ainda mais forte (a de que o valor genético esperado de cada um dos animais é zero) e não permite que informações entre animais de diferentes GC's sejam comparadas e utilizadas para a seleção, se as propriedades do método quiserem ser mantidas. Isto significa que um método não proporciona comparações e o outro não permite que estas comparações sejam utilizadas.

Em gado de corte, a maior limitação que existia em relação à teoria dos índices de seleção era justamente a incapacidade de comparar animais de diferentes GC's, ou de diferentes rebanhos ou entre anos.

Conclusões

Para diferentes situações, verificam-se restrições do tipo para as soluções das EMMH. Caso a matriz de restrições seja de posto linha incompleto, então apenas parte destas restrições será verificada. Outros estudos deverão ser realizados para tentar determinar quais das restrições impostas (limitadas pelo posto de X) preponderam sobre as restantes e qual a causa da maior ascendência de algumas destas restrições. Sem ter este ponto esclarecido, fica difícil falar em funções estimáveis ou em propriedades das soluções.

Em cada uma das situações examinadas, o somatório das restrições sobre as soluções das EMMH pode ser interpretado como uma propriedade genética de que os animais-base tenham valor genético esperado igual a zero. Estas restrições são a origem das chamadas "propriedades genéticas" do modelo animal, ou seja, as 'propriedades genéticas' das soluções são conseqüência das relações entre as colunas de X.

A dependência que foi aqui estabelecida entre o valor das soluções fornecidas pelas EMMH, em sinal e magnitude, e as restrições impostas gera inquietações mesmo quando a pressuposição de ausência de seleção for rigorosamente verdadeira.

As restrições que são impostas sobre as soluções das EMMH não dependem dos valores observados y (são funções apenas de elementos da mão esquerda das equações), mas sim da definição de X, da distribuição dos animais nos níveis de X, do número de gerações utilizadas para definir A, se esta matriz de parentesco for completa ou não, e das relações de variâncias.

Agradecimentos

Aos colegas do GenSys e UFRGS (especialmente Flávio Schenkel), da UNESP (especialmente Lucia Albuquerque) e, de forma especial, ao Dr. Larry Schaeffer, pelas saudáveis e frutíferas discussões, pela troca de idéias e pela novas compreensão destes assuntos. Contudo, a responsabilidade do trabalho é exclusivamente do autor.

Aos revisores da Revista Brasileira de Zootecnia, pelo exame detalhado, pelas sugestões valiosas e sucessivas correções.

Recebido em: 23/09/97

Aceito em: 08/12/98

  • ALBUQUERQUE, L.G. 1997. Comunicação Pessoal.
  • FRIES, L.A., SCHENKEL, F.S. Estimation and prediction under a selection model. In: REUNIÃO ANUAL DA SOCIEDADE BRASILEIRA DE ZOOTECNIA, 30, 1993, Rio de Janeiro. Anais..Viçosa:SBZ, 1993, p.1-20.
  • GIANOLA, D, R.L. FERNANDO, S. I.M., FOULLEY, J.L. 1989. Likelihood estimation of quantitative genetic parameters when selection occurs: models and problems. Genome, 31:768-777.
  • HENDERSON, C.R. 1975. Best linear unbiased estimation and prediction under a selection model. Biometrics, 31: 423-447.
  • HENDERSON, C.R. 1984. Applications of linear models in animal breeding University of Guelph. 462p.
  • HENDERSON, C.R. 1988. Theoretical basis and computational methods for a number of different animal models. J. Dairy Sci, 71:1-16 (Suplemento 2).
  • HENDERSON, C.R., KEMPTHORNE, O., SEARLE, S.R. et al. 1959. The estimation of environmental and genetic trends from records subject to culling. Biometrics, 15:192-218.
  • KENNEDY, B.W., SCHAEFFER, L.R., SORENSEN, D.A. 1988. Genetic properties of animal models. J. Dairy Sci, 71:17-26 (Suplemento 2).
  • LUSH, J.L.1945. Animal Breeding Plans Ames: Iowa State University Press.
  • SCHAEFFER, L.R. Animal models: why, how and when to use them. In: SIMPÓSIO NACIONAL DE MELHORAMENTO ANIMAL, 1, 1996, Ribeirão Preto, SP. Anais ... Ribeirão Preto: SBMA 1996, p.21-40.
  • SEARLE, S.R. 1971. Linear models New York: John Wiley & Sons.

Datas de Publicação

  • Publicação nesta coleção
    16 Out 2012
  • Data do Fascículo
    1999

Histórico

  • Recebido
    23 Set 1997
  • Aceito
    08 Dez 1998
Sociedade Brasileira de Zootecnia Universidade Federal de Viçosa / Departamento de Zootecnia, 36570-900 Viçosa MG Brazil, Tel.: +55 31 3612-4602, +55 31 3612-4612 - Viçosa - MG - Brazil
E-mail: rbz@sbz.org.br