Acessibilidade / Reportar erro

Estimação e predição por modelo linear misto com ênfase na ordenação de médias de tratamentos genéticos

Estimation and prediction using linear mixed models: the ranking of means of genetic treatments

Resumos

O presente artigo propôs-se a refletir teoricamente o processo de estimação/predição de médias de tratamentos, nos delineamentos em blocos, com ênfase nas suas aplicações em testes de genótipos, no melhoramento vegetal. Neste sentido, procurou-se comparar as análises baseadas no modelo linear fixo (análise intrablocos) e no modelo linear misto com genótipos aleatórios (análise recuperando informação intertratamentos), buscando identificar os fatores que podem determinar diferentes classificações genotípicas. A análise teórica permitiu constatar que a abordagem de modelo misto (com tratamentos aleatórios), comparativamente às análises tradicionais (médias marginais e análise intrablocos), em geral, leva a: i) maior homogeneidade das médias de tratamentos; e ii) seleção de diferentes tratamentos genéticos, quando a variância genotípica for baixa em relação à variância do erro e os ensaios forem não ortogonais e desbalanceados. Ademais, se os tratamentos forem oriundos de várias populações, a predição BLUP poderá determinar diferente classificação das médias de tratamentos, em relação à análise intrablocos, mesmo sob ortogonalidade e balanceamento.

recuperação de informação; delineamento em bloco; média BLUP; seleção genotípica; ordenamento


This study reviewed the theory of estimation/prediction of treatment means, in randomized block designs, emphasizing aspects of interest to plant breeders. Comparisons were made between analyses based on fixed (intrablock) and mixed (with random treatments effects - recovering intergenotypic information) linear models for identifying the determining factors that may affect the classification of genotypes. The mixed model approach, in comparison with the traditional analyses (marginal means and intrablock analysis), in general, leads to: i) more uniformly distributed treatment means; and ii) selection of different genetic treatments when the genetic variance is small relative to the environmental variance, as well as designs being non-orthogonal and unbalanced. In addition, if treatments of distinct reference populations are evaluated in the same experiment, BLUP prediction can lead to different ranking of means, in comparison with the intrablock analysis, even if designs are balanced and orthogonal.

information recovering; block design; BLUP mean; genotypic selection; shrinkage


ESTIMAÇÃO E PREDIÇÃO POR MODELO LINEAR MISTO COM ÊNFASE NA ORDENAÇÃO DE MÉDIAS DE TRATAMENTOS GENÉTICOS11 Parte da Tese de Doutorado do primeiro autor, apresentada à USP/ESALQ - Piracicaba, SP. Parte da Tese de Doutorado do primeiro autor, apresentada à USP/ESALQ - Piracicaba, SP.

João Batista Duarte2*; Roland Vencovsky2,3

2Escola de Agronomia - UFG, C.P. 131 - CEP: 74001-970 - Goiânia, GO.

3Depto. de Genética - USP/ESALQ, C.P. 83 - CEP: 13400-970 - Piracicaba, SP.

*Autor correspondente <jbduarte@uol.com.br>.

RESUMO: O presente artigo propôs-se a refletir teoricamente o processo de estimação/predição de médias de tratamentos, nos delineamentos em blocos, com ênfase nas suas aplicações em testes de genótipos, no melhoramento vegetal. Neste sentido, procurou-se comparar as análises baseadas no modelo linear fixo (análise intrablocos) e no modelo linear misto com genótipos aleatórios (análise recuperando informação intertratamentos), buscando identificar os fatores que podem determinar diferentes classificações genotípicas. A análise teórica permitiu constatar que a abordagem de modelo misto (com tratamentos aleatórios), comparativamente às análises tradicionais (médias marginais e análise intrablocos), em geral, leva a: i) maior homogeneidade das médias de tratamentos; e ii) seleção de diferentes tratamentos genéticos, quando a variância genotípica for baixa em relação à variância do erro e os ensaios forem não ortogonais e desbalanceados. Ademais, se os tratamentos forem oriundos de várias populações, a predição BLUP poderá determinar diferente classificação das médias de tratamentos, em relação à análise intrablocos, mesmo sob ortogonalidade e balanceamento.

Palavras-chave: recuperação de informação, delineamento em bloco, média BLUP, seleção genotípica, ordenamento

ESTIMATION AND PREDICTION USING LINEAR MIXED MODELS: THE RANKING OF MEANS OF GENETIC TREATMENTS

ABSTRACT: This study reviewed the theory of estimation/prediction of treatment means, in randomized block designs, emphasizing aspects of interest to plant breeders. Comparisons were made between analyses based on fixed (intrablock) and mixed (with random treatments effects - recovering intergenotypic information) linear models for identifying the determining factors that may affect the classification of genotypes. The mixed model approach, in comparison with the traditional analyses (marginal means and intrablock analysis), in general, leads to: i) more uniformly distributed treatment means; and ii) selection of different genetic treatments when the genetic variance is small relative to the environmental variance, as well as designs being non-orthogonal and unbalanced. In addition, if treatments of distinct reference populations are evaluated in the same experiment, BLUP prediction can lead to different ranking of means, in comparison with the intrablock analysis, even if designs are balanced and orthogonal.

Key words: information recovering, block design, BLUP mean, genotypic selection, shrinkage

INTRODUÇÃO

No melhoramento de plantas tem sido comum o uso de análise baseada em modelo fixo para a estimação de médias de tratamentos (ex: genótipos), mesmo quando estes foram obtidos por amostragem numa população. Isto é, em situações em que o modelo é tipicamente misto, pois inclui, além de efeitos fixos (ex: blocos), os efeitos aleatórios dos genótipos. Em boa parte dos casos, a modelagem mista é utilizada, com o rigor da suposição, apenas para a estimação de componentes de variância e para a construção dos testes F apropriados na análise da variância.

Entre as razões que levam os melhoristas práticos a não utilizarem predições baseadas em modelos mistos estão a falta de vivência com estes métodos e a sua pequena divulgação (Bueno Filho, 1997). Acrescenta-se que os efeitos prejudiciais da abordagem tradicional normalmente são tidos como mínimos, a ponto de não recompensar os esforços com a adoção da nova metodologia. A ordem de classificação dos genótipos, em geral, não se altera no caso de ensaios que seguem delineamentos ortogonais e balanceados. Assim, a estimação de médias admitindo-se modelo fixo, quando na verdade o modelo é misto, não modificaria o resultado final da seleção.

Por outro lado, a ocorrência de desbalanceamento não planejado, decorrente da perda de parcelas, é um fato normal nesse tipo de experimentação. Ademais, nas fases preliminares do processo seletivo, quando os genótipos são numerosos e ainda possuem natureza aleatória (Piepho, 1994), é comum o uso de delineamentos não ortogonais como BIB (blocos incompletos balanceados) e PBIB (blocos incompletos parcialmente balanceados). Também têm ganhado aplicação crescente os delineamentos aumentados (Federer, 1956), os quais, por construção, são desbalanceados e não ortogonais. Nestes casos, a possibilidade de classificações genotípicas diferenciadas entre as duas abordagens analíticas é uma realidade. Assim, optar-se pela conveniência da suposição de um fator como fixo ou aleatório pode estar longe de ser prática inofensiva (Bueno Filho, 1997).

Atualmente, a metodologia de modelos mistos tem-se tornado mais acessível aos usuários graças à sua implementação em sistemas estatístico-computacionais de ampla divulgação como o SASâ (Statistical Analysis System). Logo, a sua rigorosa aplicação é perfeitamente exeqüível sempre que o modelo subjacente aos dados for de tal natureza. Neste caso, covariâncias biologicamente conhecidas (ex: genótipos relacionados por origem e/ou parentesco) passam a ser levadas em conta não só nos testes estatísticos, mas também na estimação e predição de efeitos de implicação direta no ordenamento e na seleção dos genótipos. Os estimadores correspondentes, em geral, têm variância menor do que os de modelo fixo, resultando, assim, em estimativas de maior confiabilidade (Henderson, 1975; Verbeke & Molenberghs, 1997; Federer, 1998).

O propósito deste artigo é apontar, por meio de explicitações teóricas, os fatores que podem determinar diferenças na classificação das médias genotípicas (de tratamentos), quando estas forem obtidas por modelos fixo ou misto, de análise. O desenvolvimento centra-se na abordagem de modelos lineares mistos, por razões de generalidade e de divulgação. A ênfase principal está num modelo de delineamento em blocos, admitindo-se os efeitos de blocos como fixos e os de tratamentos como aleatórios. Ademais, procurou-se avaliar a extensão das constatações obtidas em algumas variações deste modelo.

UM MODELO DE DELINEAMENTO EM BLOCOS

Considere-se um delineamento experimental em blocos, com a tratamentos (genótipos) de efeitos gi (i=1,2,...,a) e b blocos (completos ou incompletos) de efeitos bj (j=1,2,...,b). Com o propósito de generalização, faz-se nij ser o número de vezes que o tratamento i aparece no bloco j (nij=0,1,2,...). Portanto: SiSjnij = n (número de observações); Sinij=n.j=k j (tamanho ou número de parcelas do bloco j); e Sjnij=ni.=n i (número de repetições do tratamento i); além de que Sini=Sjk j=n. Denota-se ainda por Yijr a observação num caráter ou variável aleatória Y (observável), relativa à r-ésima parcela (r=1,2,...,ni) que recebeu o tratamento i, identificada também pelo bloco j. Um modelo linear que caracteriza esse conjunto de dados pode ser:

Neste modelo, o efeito de bloco (bj) é assumido como fixo e o de tratamento (gi), como aleatório. A constante m é de natureza sempre fixa e eijr é uma variável aleatória não observável. Isso caracteriza o que se conhece na literatura por um modelo misto, pois incorpora uma mistura de tipos de efeitos, fixos e aleatórios (Searle, 1987). Dessa forma, os tratamentos testados representam uma amostra de uma população de genótipos, cujas respostas são distribuídas normalmente, em torno de uma média comum () e com variância sg2; ou seja, os tratamentos são realizações de variáveis aleatórias não observáveis, as quais correspondem aos efeitos gi's (desvios genotípicos aleatórios em relação à média mP). O tratamento estatístico desse tipo de modelo, no campo do melhoramento genético vegetal, tem recebido ultimamente a denominação de análise com recuperação da informação intervarietal ou intergenotípica (Federer & Wolfinger, 1996; Wolfinger et al.,1997; Federer & Wolfinger, 1998; Federer, 1998).

Matricialmente, a expressão que generaliza essa e outras modelagens mistas alternativas pode ser escrita a partir do vetor y(nx1) de observações, na forma do chamado modelo linear misto geral:

Neste caso tem-se: todos os efeitos fixos reunidos no vetor paramétrico b(px1); os efeitos aleatórios no vetor paramétrico g(qx1), exceto os erros que compõem o vetor e(nx1); X(nxp) e Z(nxq) são as matrizes de incidências dos efeitos contidos em b e g, respectivamente; e G(q) e R(n) são as matrizes de variâncias-covariâncias dos vetores aleatórios g e e, respectivamente, as quais compõem V(n), a matriz de variâncias-covariâncias das observações. As covariâncias entre vetores diferentes são assumidas nulas (Henderson, 1984). Aqui, por simplificação, adotar-se-á: G=I(a)s g2 e R=I(n)s e2; onde I(.) denota uma matriz identidade e a=q (número de níveis do fator aleatório).

ESTIMAÇÃO E PREDIÇÃO NUM MODELO LINEAR MISTO

Sob as condições anteriormente definidas, o método de quadrados mínimos ordinário (OLS) não é mais um bom procedimento de estimação, pois assume a simples estrutura V=Ise2, minimizando: (y-Xb)'(y-Xb). A recomendação recai, então, sobre o método de quadrados mínimos generalizado (GLS), o qual contempla qualquer estrutura não singular de V, o que leva a minimizar a expressão mais genérica: (y-Xb)'V-1(y -Xb). Todavia, para isso é necessário conhecer a matriz V, através de G e R, ou, alternativamente, inserir alguma estimativa de V no problema de minimização GLS. Nesta última situação, o que deve ser feito é encontrar razoáveis estimativas de G e de R por meio de algum método de estimação. Entre estes, destacam-se pelo volume de aplicações, os procedimentos ANOVA baseados no método dos momentos (Fisher, 1918; Henderson, 1953) e os métodos de máxima verossimilhança, ML (Hartley & Rao, 1967) e REML (Patterson & Thompson, 1971).

Em várias situações, a preferência tem sido dada aos métodos baseados em verossimilhança, os quais exploram a suposição de que g e e têm distribuição normal (Littell et al., 1996; Verneque, 1994). Todavia, no caso de modelos mistos, não existe consenso sobre a melhor forma de estimar componentes de variância (Christensen et al., 1992). Optando-se por ML ou REML é necessário, então, construir uma função objetivo e maximizá-la em relação a todos os parâmetros desconhecidos. Segundo a abordagem do SAS Institute (1997), com alguns cálculos é possível reduzir o problema de maximização apenas aos parâmetros em G e R. Assim, os correspondentes logaritmos da função de verossimilhança (lML) e da função de verossimilhança restrita/residual (lREML) são:

lML (G,R)= -(1/2) log|V| - (n/2) log(r'V-1r) - (n/2) [1+ log(2p/n)] ; e

lREML(G,R)= -(1/2)log|V|-(1/2)log|X'V -1X|-[(n-p)/2]log (r'V-1r)-[(n-p)/2]{1+log [2p/(n-p)}.

onde: r = y – X(X'V-1X) - X'V-1y; p, aqui, é o posto (rank) de X; e, dada uma matriz

A qualquer, A- denota uma inversa generalizada de A (tal que AA-A=A).

Do processamento numérico de uma destas expressões, através de algoritmos iterativos como Newton-Raphson (implementado no PROC MIXED do sistema SAS) ou EM (Expectation Maximization), pode-se obter as estimativas ML ou REML de interesse ( e ). Nos outros métodos, a estimação fundamenta-se na construção de formas quadráticas do tipo y'Pty (t=1,2,...,s; onde s é o número de parâmetros s2t a serem estimados), as quais são equacionadas com suas esperanças matemáticas, E(y'Pty). As formas quadráticas equivalem às somas de quadrados obtidas na correspondente análise de variância e E(y'Pty) é uma função dos parâmetros s2t. Descrições detalhadas destes métodos são disponíveis em Valério Filho (1991), Searle et al. (1992) e Lopes et al. (1993).

De posse dos valores paramétricos dos componentes de (co)variância (G e R) ou de suas estimativas ( e ), passa-se, então, aos problemas de estimar o vetor de efeitos fixos b (ou uma função a ele associada) e de predizer o vetor de efeitos aleatórios g (ou também alguma função de g). Ambos os problemas podem ser resolvidos, simultaneamente, através das chamadas equações de modelo misto (EMM), desenvolvidas por Henderson em 1948 (Littell et al., 1996; Henderson, 1984):

Não se conhecendo as matrizes G e R, simplesmente substituem-nas por e . Manipulações de álgebra matricial levam, por conseguinte, às soluções do sistema:

onde: C=GZ' é a matriz de covariâncias entre y e g (covariância entre observações fenotípicas e valores genotípicos verdadeiros).

A obtenção das soluções do sistema por meio destas expressões não são, todavia, usuais, haja vista a dimensão nxn da matriz V a ser invertida. O uso de uma inversa generalizada da matriz de coeficientes em EMM representa uma opção de menor esforço computacional, uma vez que esta matriz tem dimensão (p+q)x(p+q), inferior a nxn (McLean et al., 1991). Outras alternativas ainda são disponívies (André, 1999).

É notório que, se G-1 tende para a matriz nula (ex: sg2®¥, no caso particular G=Isg2), as EMM tendem para as equações de GLS para estimar b e g, quando os componentes de g são considerados fixos (Robinson, 1991). Por outro lado, quando G-1 domina as EMM (ex: sg2®0, sob G=Isg2), tende para zero. Nos casos intermediários, G-1 opera reduzindo (shrinking, em inglês) a magnitude das estimativas de g supostamente fixo, até zero (SAS Institute, 1997).

Se G e R forem conhecidas, b0 (ou, mais provavelmente, alguma função estimável L'bo) é chamado melhor estimador linear não viesado (BLUE - best linear unbiased estimator) de b (ou de L'bo), e é denominado melhor preditor linear não viesado (BLUP - best linear unbiased predictor) de g. O uso do termo preditor tem apenas o propósito de distinguir estimadores de efeitos aleatórios daqueles de efeitos fixos (Robinson, 1991). Porém, como já mencionado, G e R geralmente são desconhecidas, dispondo-se apenas de estimativas obtidas por algum método. Neste caso, os termos BLUE e BLUP não mais se aplicam, sendo apropriado substituí-los por EBLUE (empirical best linear unbiased estimator) e EBLUP (empirical best linear unbiased preditor), respectivamente (SAS Institute, 1997; Littell et al., 1996). O termo empírico é adicionado, portanto, para indicar esse tipo de aproximação.

A correspondente matriz de variâncias-covariâncias dos parâmetros, ou , é dada por:

Dado que os resultados de partição destas matrizes são gerais, conhecendo-se ou não as matrizes paramétricas G e R, pode-se simplesmente escrever:

Note-se que C11 é a fórmula familiar da matriz de variâncias-covariâncias de bo, solução de quadrados mínimos generalizados. Assim, entre outras propriedades, tem-se (Henderson, 1984; Searle et al., 1992):

Var (L'b0) = L'C11L;

Var ()= CV-1C'-CV-1XC 11X'V-1C = G – C22; e

Var (L'b0 + )= Var (L'b0) + Var ()

EXPLICITAÇÃO DO BLUP DE g

Para entender as conseqüências da suposição de aleatoriedade dos efeitos de tratamentos sobre suas estimativas de médias é necessário primeiramente analisar o preditor . É conveniente, portanto, derivar a expressão de componentes individuais do vetor , isto é, de cada 1, o BLUP de gi (i=1,2,...,a). Sem perda de generalidade, omite-se, neste momento, o índice j (de blocos), mantendo-se apenas i e r, relativos ao tratamento e a sua repetição. Sob a estrutura de componentes de variância G=Isg2 e R=I se2, tem-se: (onde indica a operação matricial soma direta, ou seja, a obtenção de uma matriz bloco diagonal com as a matrizes Bi; e J(ni) é uma matriz quadrada com todos os elementos unitários). Logo:

sendo: 1'(ni) um vetor linha (de ordem ni) com todos os elementos unitários.

Portanto, a matriz CV-1, de ordem axn, assume o formato:

Por conseguinte, como ilustram Searle et al. (1992), o preditor do efeito genotípico de um tratamento i, ou seja, o BLUP(gi), fica determinado por:

Isto resulta do produto da i-ésima linha de CV-1 pelo vetor (y- Xb0)=(y–):

Sabendo-se que: tem-se, finalmente:

em que: =m0, representa a média dos valores ajustados (para os efeitos fixos) nas parcelas que receberam o tratamento i, ou seja, a média ambiental esperada naquelas parcelas.

Nos delineamentos em blocos, m0i representa: (média geral) + (efeito médio dos blocos que receberam o tratamento i), o que pode ser demonstrado reintroduzindo-se o índice de blocos (j):

em que: m0e b0j (j=1,2,...,b) são os elementos do vetor solução b0, e denota o efeito médio dos blocos que receberam o tratamento i.

Desse modo, o preditor do valor genotípico do tratamento i, o BLUP(gi ), pode ainda ser escrito como:

Este desenvolvimento mostra que o uso de uma constante m0, comum para todo i, como apresentam Searle et al. (1992, p. 271), não se aplica a todas as situações e delineamentos. Por isso, deu-se aqui preferência à notação m0i. Mas Yi, também estima tudo isso (m+bi) mais o efeito do tratamento (gi). Assim, a diferença () contém, de fato, só a informação relativa ao efeito aleatório do tratamento i, ou seja, a média de seus efeitos genotípicos estimados por parcela. É também oportuno observar que o termo nili é equivalente à herdabilidade de médias de tratamentos (), conceito de ampla aplicação em genética.

Sob o ponto de vista experimental, é notória a importância de repetições e casualização para uma predição imparcial de gi através de i. Embora isto também seja fundamental no caso de modelos fixos e seus respectivos BLUE's, o raciocínio a seguir procurará ilustrar a relevância destes princípios no contexto da abordagem de modelos mistos.

Para contornar as dificuldades de um tratamento matemático através de esperanças condicionais, considere-se apenas as observações relacionadas a um dado genótipo i, cujo valor genotípico tenha sido predito por uma das expressões de i (1, 2 ou 3). Para simplificação, considere-se ainda um delineamento binário, com nij=0 ou nij=1. Assim, pode-se afirmar que, sob as condições da predição, o valor esperado de cada unidade experimental é:. Todavia, para esse conjunto particular de dados (relativos ao genótipo i), gi é uma constante, desconhecida, mas não uma variável aleatória. Logo, E(gi)=gi. Ademais, desconhecendo-se o número de repetições e as regras de alocação dos tratamentos às parcelas, não se pode, ainda, assumir: E(eijr)=0; mas, sim: E(eijr)=eijr. Neste caso, reintroduzindo-se o índice j (de blocos) na expressão (1) de i, tem-se:

Sob ni muito baixo e na ausência de casualização, E(i) carrega um termo . Isto prejudica a qualidade do preditor i que terá um viés no sentido do efeito ambiental médio incidente nas parcelas que receberam o genótipo i. Todavia, sob casualização e ni grande pode-se assumir, tranqüilamente, que e, nestas condições, i resulta em predições não tendenciosas de gi. Isto porque, garantidas as condições que tornam E(eijr)=0, tem-se: E(i)= niligi; e, sob ni grande, nili ®1(herdabilidade máxima), o que implica em E(igi. Mas, sendo 0£nili£1, à medida que a herdabilidade diminui (nili ®0), o valor absoluto de i reduz-se, proporcionalmente, no sentido do valor esperado populacional, E(gi)=0. Isto revela o aumento da importância do relacionamento entre os genótipos, na predição do valor genético de cada um. Em síntese: E(igi quando ®1; senão, E(iE(gi) à medida que ® 0.

De fato, assumir E(i)=gi somente é desejável se o experimento der condições para tal, isto é, se for capaz de fornecer informações individuais em número suficientemente grande (® 1). Senão, à medida que a informação individual diminui (® 0), é preferível predizer a performance de cada genótipo atribuindo-se um peso crescente às informações de seus "parentes", ou seja, fica cada vez mais seguro admitir E(i)=E(gi). Assumir E(i)=gi (suposição do modelo fixo), nestes casos, implica num risco crescente de i produzir estimativas pobres de gi (parâmetro). Enfim, a abordagem de modelos mistos usufrui da flexibilidade de ponderar a informação individual, em detrimento daquela dos genótipos aparentados, conforme a confiabilidade associada à primeira. Já a metodologia de modelos fixos (OLS) não dispõe desta prudência.

O EFEITO "SHRINKAGE" NAS MÉDIAS BLUP

Inicialmente, convém introduzir o conceito de médias BLUP. Como o vetor g contém apenas os desvios genotípicos associados aos tratamentos, para predizer, por exemplo, a resposta fenotípica de um genótipo i num bloco j é necessário construir uma função linear de parâmetros fixos e aleatórios: . Tal expressão representa: (valor médio do ambiente j) + (efeito do genótipo i). Contudo, se o pesquisador estiver interessado não apenas na informação dos efeitos genotípicos i (suficientes para o ordenamento e a seleção de genótipos), nem em predições de parcelas individuais (), mas na resposta média de cada genótipo, a expressão anterior não responderá ao seu questionamento.

A nova função deve levar em conta o efeito médio de blocos, assumido comum para todos os genótipos sob comparação. Isto corresponde às chamadas médias de tratamentos ajustadas para os efeitos fixos do modelo. A expressão é aqui denominada BLUP (mP+gi) ou médias genotípicas BLUP, sendo dada por: . Esta, sim, determina o ajuste das médias de cada tratamento para um mesmo referencial, a constante () Computacionalmente, esse último termo é obtido construindo-se uma função linear dos efeitos fixos, L'b, comum para todos os tratamentos. A matriz L'[ax(1+b)] pode ter suas linhas todas iguais a: [1 k1/n k2/n ... kb/n], o que gera uma média ponderada dos efeitos de blocos pelos seus respectivos tamanhos, b0, à qual é adicionada a constante m0. Acrescentando-se o preditor i tem-se, então, a média de interesse.

Searle et al. (1992) tratam do problema de "estimar" ou "predizer" uma função linear do tipo: w=L'b+g. Os autores comentam que, para L'b estimável, tem propriedades de melhor preditor linear não viesado (erro médio quadrático mínimo, linearidade em relação a y e não tendenciosidade), sendo, por isso, chamado de BLUP(w): . No presente caso, tem-se: BLUP(w)= , o que corresponde à média BLUP do genótipo i. Littell et al. (1996) ilustram o tratamento desse tipo de problema através do sistema SAS. Os autores referem-se a tais combinações lineares como funções predizíveis, para diferenciá-las das funções estimáveis que combinam apenas efeitos fixos.

Definido o significado das médias BLUP, reconsidere-se agora a expressão de i. O termo nili (a herdabilidade de médias) representa um peso aplicado ao mais simples estimador de gi, o desvio (). Para avaliar a sua influência sobre este desvio, considere-se a relação fg=sg2 /se2, a qual reflete a herdabilidade em nível de parcelas . Assim, tem-se:

Numa situação de variabilidade genética muito superior à ambiental ( de valor elevado) tem-se: fg®¥ e nili®1 . Isto significa que a diferença () reflete, integralmente, o valor genotípico do tratamento i em relação à média mP da população, estimada por: . Nesta situação, a resposta média esperada do genótipo i, o BLUP (mp + gi), tende para: . Em blocos completos balanceados, m0i = m0=mP; logo, sob nili®1 , o BLUP (mp + gi) reduz-se a Yi. Neste caso, as respostas genotípicas obtidas pelo preditor BLUP (mp + gi) dispersam ao máximo entre si, igualmente às respectivas médias marginais simples não ajustadas

Por outro lado, quando essa relação de variâncias for muito baixa (fg®0), o referido peso também diminui (nili ®0) e a diferença () pouco ou nada informará sobre o valor genotípico individual do tratamento i. Seja porque os tratamentos não diferem substancialmente entre si (sg2@0), seja por erro experimental muito elevado (se2®¥). Neste caso, a resposta média esperada de um genótipo i, o BLUP (mp+gi), tende para , pois, i®0; ou seja, todos os tratamentos terão respostas preditas idênticas (). Desse modo, variações fenotípicas observadas entre genótipos não são mais do que flutuações erráticas em torno da média populacional mP; pois suas propriedades genéticas individuais não são significativamente importantes ou, pelo menos, não puderam ser discriminadas pelo experimento. Nestas circunstâncias não haverá dispersão alguma entre as respostas genotípicas médias preditas. Com efeito, não seria aceitável qualquer variação entre estas numa situação de ausência de variabilidade genética. Logo, a abordagem de modelos mistos mostra-se coerente com a realidade e, por isso, é tida como conceitualmente mais completa (Resende et al., 1996; Bueno Filho, 1997).

Na maioria das situações práticas, entretanto, nili será um número entre zero e um, implicando num aproveitamento parcial da informação contida no desvio . Aproveitamento este proporcional à herdabilidade , o que determina uma dispersão intermediária das médias BLUP. Portanto, conclui-se que uma redução na variância genética relativa (fg) implica num estreitamento da dispersão das respostas genotípicas médias preditas (Figura 1); podendo isto chegar ao limite teórico das médias se igualarem (quando fg=0). Trata-se do chamado efeito shrinkage, relatado na literatura de modelos lineares mistos, que nada mais é do que o "encolhimento" da distribuição das médias ajustadas de tratamentos em torno da média geral, quando se passa de uma análise assumindo-os como de efeitos fixos para outra em que tais efeitos são tidos como aleatórios. Quanto menor a herdabilidade, maior será o shrinkage. Este efeito é tido como uma propriedade desejável dos preditores (EBLUP, BLUP, BLP, BP), haja vista influenciar notadamente as médias Yi extremas (Latour & Littell, 1996). Por razões desse tipo, tais preditores são também denominados estimadores shrinkage (Stroup & Mulitze, 1991).


Segundo Duchateau & Janssen (1997), em síntese, o BLUP representa uma contração da diferença (Yi-m) De forma que, se o componente da variância genotípica for bem maior do que o ambiental (sg2>>se 2), o preditor i será muito próximo de (Yi-m). Isto significa que a informação de outros genótipos relacionados não é muito útil para se fazer predições acerca do genótipo i. Mas, se sg2<<se 2, o preditor encolherá no sentido do valor esperado populacional (zero). Além disso, quanto maior o número de repetições (ni), mais o valor () será considerado na predição individual.

Nota-se, portanto, que a abordagem BLUP é consistente com a intuição dos melhoristas de se suspeitar de um novo genótipo cujas respostas, em poucas repetições, têm média excepcionalmente alta ou baixa em relação aos demais (Hill Jr. & Rosenberger, 1985). Isto pois, a solução BLUP (à semelhança de outros preditores) leva em conta a informação de que os efeitos gi têm menor variação do que as respostas dentro de cada genótipo i (Robinson, 1991).

ORDENAMENTO COMPARATIVO DAS MÉDIAS BLUP

Dado que no modelo em estudo mP é comum a todos os tratamentos (amostrados de uma mesma população), o ordenamento de suas médias preditas fica determinado apenas pelo dei:ranking[BLUP(mP+g i)]=ranking[(i)]. Por isso, para fins de seleção de genótipos, em geral, dispensa-se a obtenção das respostas médias preditas de cada tratamento. Em alguns estudos, todavia, o resultado das médias pode ser de interesse.

Da expressão de

i pode-se escrever: BLUP (mP+gi)= + nili. Assim, dado que numa situação de blocos completos balanceados m0i é comum para todo i e, inclusive, igual a , tem-se: ranking =ranking (Yi). Ademais, sob balanceamento, o peso nili também é comum para todo i (nl), implicando em: ranking (i) =ranking(Yi). E, se a variância genética for bastante elevada (fg®¥ e n1), tem-se o resultado já obtido: BLUP(mP+gi)=Yi. Por outro lado, se nl afasta-se de um (logicamente no sentido de zero) esta última igualdade não mais se verifica, embora a dos ordenamentos ainda permaneça, com a peculiaridade de shrinkage das médias BLUP(mP+gi) em relação às médias Yi. Isto pois, à medida que nl tende para zero, a amplitude de variação de nlYi (termo determinante do ordenamento) reduz-se sensivelmente. Além disso, a constante passa a ser multiplicada por (1-nl), de valor também inferior à unidade. Logo: ranking[BLUP(mP+gi )]=ranking(i) =ranking(Yi). Isto significa que, no caso de blocos completos balanceados, uma seleção baseada em médias marginais (Yi) levará à retenção e descarte dos mesmos genótipos que uma seleção baseada em BLUP(mP+gi), ou em i (Figura 1).

Resta, portanto, a questão de maior interesse prático relacionada ao processo de seleção de tratamentos: Existem ou não diferenças entre os ordenamentos de médias produzidas pela abordagem de modelo misto e por uma análise convencional intrablocos (modelo fixo)? A resposta é sim. Em blocos incompletos, balanceados ou não, m0i não é mais comum para todo i e os ajustes para os efeitos de blocos podem fazer com que os ordenamentos dos genótipos por i e Yi não sejam os mesmos. Ressalta-se que a condição de desbalanceamento por si só (em qualquer delineamento) já é suficiente para não mais garantir a concordância perfeita desses dois tipos de seleção; sobretudo, se os tratamentos diferirem muito em números de repetições. A influência do nível de desbalanceamento sobre as médias preditas e seus postos pode ser avaliada diretamente na expressão de i (3): Maior amplitude de desbalanceamento implica numa maior probabilidade de as duas classificações diferirem.

Independentemente do desenho experimental, do grau de desbalanceamento e dos números de repetições, quando fg®¥ e nili=1, tem-se: i=1. (Yi – m0i)=t0i; onde t0i é a solução do sistema de equações normais reduzidas da análise intrablocos, sob Snit0i=0 . Em razão disso, as médias preditas da análise de modelo misto, BLUP(mP+gi), serão iguais às médias ajustadas pela análise intrablocos (Yi (ajust./fixo)). Mas, à medida que se afasta dessa condição limite (fg®¥ e nili=1), a igualdade entre i e t0i, bem como entre as médias correspondentes, não mais se verifica. E, embora a relação fg deva atingir a ordem dos milhares (fg®¥) para uma igualdade quase absoluta das médias BLUP(mP+gi) e Yi (ajust./fixo), seus respectivos ordenamentos podem permanecer idênticos mesmo sob relações bem menores. Na prática, valores de fg na casa das centenas, em geral, garantem coincidência absoluta das classificações. E, uma concordância razoável já é conseguida com valores de fg na casa das dezenas, o que resulta também em seleções muito similares (não obrigatoriamente idênticas) pelos dois procedimentos.

A relação fg não interfere somente no valor de li, mas também no de (Yi – m0i), pois m0i advém de Xb0 e b0 = (X'V-1X)-X'V-1 y. Logo, na abordagem de modelos mistos, a solução para efeitos fixos também leva em conta a estrutura de variâncias e covariâncias das observações. Ademais, esta influência vai além da estimação pontual, interferindo também nos testes de hipóteses relacionados aos efeitos fixos, o que justifica sempre uma cuidadosa especificação da estrutura de erros (Littell et al., 1996; Duchateau & Janssen, 1997).

Diante disso, o costumeiro uso de análises fundamentadas na suposição de tratamentos fixos (ex: análise intrablocos) para fins de seleção de genótipos, quando, na realidade, eles forem aleatórios, desperta especial preocupação se a relação fg for baixa. E, sem dúvida, esse é o caso de boa parte dos ensaios de avaliação de genótipos em programas de seleção de espécies já bastante melhoradas, ou seja, com baixa variabilidade genética. É verdade que, nas fases preliminares do processo, a variância genética pode ser consideravelmente alta. Em contrapartida, nestas etapas, os erros experimentais, em geral, são elevados (grande número de tratamentos e pequeno número de repetições), implicando em baixos valores de fg. Nestes casos, o número de repetições (ni) e o grau de desbalanceamento voltam a ter influência decisiva na ordenação dos genótipos pela abordagem aqui apresentada (modelo misto com tratamentos aleatórios). Isso porque, sob desbalanceamento, nilipondera diferentemente o valor do desvio (Yi – m0i) de cada genótipo, o que pode resultar em ordenações distintas dos tratamentos pelas médias BLUP(mP+gi) e Yi (ajust./fixo),(ou por i e t0i, respectivamente).

DUAS OUTRAS VARIAÇÕES NO MODELO

Com base no desenvolvimento teórico apresentado procurar-se-á estender algumas constatações anteriores, sem demonstrações, a duas outras variações no modelo estudado. Na primeira, os efeitos de blocos serão admitidos como aleatórios ao lado dos de tratamentos (modelo aleatório). Na outra, os tratamentos (de efeitos aleatórios), são supostamente oriundos de diferentes populações, cada uma com propriedades específicas em termos de média e variância (ex: genótipos em estrutura de famílias).

Modelo com blocos aleatórios

A suposição de aleatoriedade para os efeitos de blocos e de tratamentos, num delineamento em blocos, corresponde à adoção de um modelo de análise com recuperação das informações interblocos e intertratamentos. Neste caso, apesar da modificação na estrutura da matriz V, o termo m0i da expressão do BLUP(gi) torna-se comum a todos os tratamentos , haja vista um único efeito fixo no modelo, a constante m. Logo, uma possível modificação na ordem de i, em relação à de Yi, dependeria somente dos efeitos diferenciados de análogos de nili (componentes de CV-1), pois: ranking(Yi)=ranking. Sob pequena variação entre blocos, condição para o uso eficiente da informação interblocos (Malheiros, 1982; Kempton et al., 1994), tais efeitos aproximam-se de nili, cuja influência no ordenamento das médias já foi anteriormente discutida.

Nos delineamentos em blocos incompletos (BIB e PBIB), a alta eficiência da análise com recuperação da informação interblocos requer uma relação sb2/se 2<1/k (onde: s2b é a variância de blocos e k é o tamanho dos blocos); ou ainda, um valor de r<2, onde: r=1+kfb e fb=sb2 /se2 (Malheiros, 1982). Analogamente, resultados obtidos por Duarte (2000) sugerem que a eficiência do uso da informação intertratamentos exige relações fg inferiores ao inverso do número de repetições, o que implica, obrigatoriamente, em fg<1. Logo, esta informação é especialmente importante quando a discriminação dos tratamentos torna-se dificultada pela baixa variabilidade genética (pequenos valores de fg). Esse fato aponta, mais uma vez, para os ensaios preliminares dos programas de melhoramento de espécies com uma longa história de seleção artificial, já bastante melhoradas e com pequena variância genotípica.

A recuperação da informação interblocos por si só, embora possa determinar trocas nas posições relativas das médias dos tratamentos (em relação às abordagens de médias marginais ou de análise intrablocos), não é responsável por shrinkage no conjunto das médias. Assim, uma possível maior concentração das médias de tratamentos obtidas a partir do modelo aleatório (médias BLUP), decorre do uso da informação intertratamentos.

Modelo com tratamentos de diferentes populações

Outro questionamento natural que surge ao discutir a ordenação das médias de tratamentos pelas abordagens de modelo fixo e de modelos mistos é: Como fica o ordenamento comparativo para um conjunto de tratamentos que são oriundos de diversas populações? Nos ensaios de melhoramento genético, os tratamentos podem representar diferentes linhagens ou progênies (genótipos) e as populações suas diferentes procedências, cruzamentos ou famílias. A análise de modelo misto aqui considerada, assume os efeitos de blocos e de populações como fixos e os efeitos de genótipos dentro de populações como aleatórios. Corresponde, portanto, a um modelo de delineamento em blocos com tratamentos hierarquizados em populações.

Dado que somente a abordagem de modelo misto utiliza a informação relativa às variabilidades genotípicas das populações, é possível surgir classificações bastante distintas pelos dois enfoques. Conforme já constatado, é de se esperar que as médias de progênies relacionadas a populações de baixa variabilidade genotípica apresentem valores próximos (shrinkage). Isto representa um mecanismo de agrupamento das estimativas de médias do qual a análise intrablocos (sob tratamentos fixos) não pode usufruir; haja vista não levar em conta a informação intergenotípica (Figura 2).


Este afunilamento das médias preditas quando se compara os dois enfoques, sobretudo para as populações de baixa variabilidade genotípica (ex: população P2, na Figura 2), pode determinar a troca de posicionamento relativo entre progênies de populações distintas, mesmo na presença de ortogonalidade e balanceamento. E, nas situações usuais de blocos incompletos, sujeitos a desbalanceamentos planejados ou não, esperam-se, inclusive, mudanças de classificações dentro da mesma população, o que pode, conseqüentemente, ter um forte impacto na seleção.

Finalmente, ainda se poderia perguntar: O uso dessa abordagem de modelos mistos não dificultaria a detecção dos chamados segregantes transgressivos, uma vez que há uma tendência dos i's convergirem para o valor esperado populacional? A resposta é não. Primeiramente, porque, se as exigências da modelagem fixa forem satisfeitas, a de modelos mistos produz resultados equivalentes; mas, se não o forem, esta última reduz a chance de apontar genótipos comuns como transgressivos. Ademais, nesse tipo de abordagem não se pode ignorar a seleção intrapopulacional, concebida pela própria estrutura hierárquica do modelo. Os genótipos segregantes transgressivos caracterizam-se por valores de i discrepantes em relação aos demais genótipos relacionados (da mesma população), podendo ser facilmente identificados. O melhorista deve, portanto, estar atento a este fato, praticando seleção entre e dentro das populações. Caso contrário, não estará explorando adequadamente os recursos da modelagem estatística menos restritiva.

CONSIDERAÇÕES FINAIS

É um equívoco admitir que na análise de um modelo com um fator aleatório, ao invés de fixo, apenas os componentes de variância (esperanças de quadrados médios) e os teste F podem se alterar. As constatações reforçam também a preocupação acerca dos problemas de especificação dos modelos de análise estatística na área do melhoramento genético vegetal.

AGRADECIMENTOS

À Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES), pela concessão da bolsa de estudos ao primeiro autor.

Recebido em 22.12.99

  • ANDRÉ, C.M.G. Avaliaçăo da melhor prediçăo linear năo tendenciosa (BLUP) associada ao uso de marcadores moleculares na análise dialélica. Lavras, 1999. 101p. Dissertaçăo (Mestrado) Universidade Federal de Lavras.
  • BUENO FILHO, J.S. de S. Modelos mistos na prediçăo de valores genéticos aditivos em testes de progęnies florestais. Piracicaba, 1997. 118p. Tese (Doutorado) Universidade de Săo Paulo, Escola Superior de Agricultura "Luiz de Queiroz".
  • CHRISTENSEN, R.; PEARSON, L.M.; JOHNSON, W. Case-deletion diagnostics for mixed models. Technometrics, v.34, p.38-45, 1992.
  • DUARTE, J.B. Sobre o emprego e a análise estatística do delineamento em blocos aumentados no melhoramento genético vegetal. Piracicaba, 2000. 293p. Tese (Doutorado) - Universidade de Săo Paulo, Escola Superior de Agricultura "Luiz de Queiroz".
  • DUCHATEAU, L.; JANSSEN, P. An example-based tour in linear mixed models. In: VERBEKE, G.; MOLENBERGHS, G. Linear mixed models in practice: a SAS-oriented approach. New York: Springer, 1997. cap.2, p.10-61. (Lecture notes in Statistics, 126).
  • FEDERER, W.T. Augmented (or hoonuiaku) designs. Hawaiian Planter's Records, v.55, p.191-208, 1956.
  • FEDERER, W.T. Recovery of interblock, intergradient, and intervarietal information in incomplete block and lattice rectangle designed experiments. Biometrics, v.54, p.471-481, 1998.
  • FEDERER, W.T.; WOLFINGER, R.D. SAS PROC GLM and PROC MIXED for recovering inter-effect information Ithaca: Cornell University, 1996. 8p. (Technical Report Biometrics Unit, BU-1330-M).
  • FEDERER, W.T.; WOLFINGER, R.D. SAS code for recovering intereffect information in experiments with incomplete block and lattice rectangle designs. Agronomy Journal, v.90, p.545-551, 1998.
  • FISHER, R. The correlation between relatives on the supposition of Mendelian inheritance. Transactions of Royal Society of Edinburgh, v.52, p.399433, 1918.
  • HARTLEY, H.O.; RAO, C.R. Maximum-likelihood estimation for the mixed analysis of variance model. Biometrika, v.54, p.93-108, 1967.
  • HENDERSON, C.R. Estimation of variance and covariance components. Biometrics, v.9, p.226-252, 1953.
  • HENDERSON, C.R. Best linear unbiased estimation and prediction under a selection model. Biometrics, v.31, p.423-447, 1975.
  • HENDERSON C.R. Applications of linear models in animal breeding. Guelph: University of Guelph - Canada, 1984. 462p.
  • HILL JUNIOR, R.R; ROSENBERGER, J.L. Methods for combining data from germoplasm evaluation trials. Crop Science, v.25, p.467-470, 1985.
  • KEMPTON, R. A.; SERAPHIN, J. C.; SWORD, A. M. Statistical analysis of two-dimensional variation in variety yield trials. Journal of Agricultural Science, v.122, p.335-342, 1994.
  • LATOUR, D.; LITTELL, R. Advanced general linear models with an emphasis on mixed models: course notes. Cary: Statistical Analysis System Institute, 1996. 614p.
  • LITTELL, R.C.; MILLIKEN, G.A.; STROUP, W.W.; WOLFINGER, R.D. SASâ system for mixed models Cary: Statistical Analysis System Institute, 1996. 633p.
  • LOPES, P.S; MARTINS, E.N.; SILVA, M.de A.; REGAZZI, A.J. Estimaçăo de componentes de variância Viçosa: UFV, 1993. 61p.
  • McLEAN, R.A.; SANDERS, W.L.; STROUP, W.W. A unified approach to mixed linear models. The American Statistician, v.45, p.5465, 1991.
  • MALHEIROS, E.B. Efeitos da recuperaçăo da informaçăo interblocos na inferęncia estatística em ensaios em blocos incompletos equilibrados. Piracicaba, 1982. 110p. Tese (Doutorado) - Universidade de Săo Paulo, Escola Superior de Agricultura "Luiz de Queiroz".
  • PATTERSON, H.D.; THOMPSON, R. Recovery of inter-block information when block sizes are unequal. Biometrika, v.58, p.545-554, 1971.
  • PIEPHO, H.P. Best linear unbiased prediction (BLUP) for regional yield trials: a comparison to additive main effects and multiplicative interaction (AMMI) analysis. Theoretical Applied of Genetics, v.89, p.647-654, 1994.
  • RESENDE, M.D.V. de; PRATES, D.F.; JESUS, A. de. YAMADA, C.K. Melhor prediçăo linear năo viciada (BLUP) de valores genéticos no melhoramento de Pinus Boletim de Pesquisa Florestal, n.32/33, p.3-22, 1996.
  • ROBINSON, G.K. That BLUP is a good thing: the estimation of random effects. Statistical Science, v.6, p.15-51, 1991.
  • SAS INSTITUE. SAS/STATâ software: changes and enhancements through release 6.12. Cary: Statistical Analysis System Institute, 1997. 1167 p.
  • SEARLE, S.R. Linear models for unbalanced data New York: John Wiley & Sons, 1987. 536p.
  • SEARLE, S.R.; CASELLA, G.; McCULLOCH, C.E. Variance components. New York: John Wiley & Sons, 1992. 501p.
  • STROUP, W.W.; MULITZE, D.K. Nearest neighbor adjusted best linear unbiased prediction. The American Statistician, v.45, p.194200, 1991.
  • VALÉRIO FILHO, W.V. Comparaçăo de métodos para estimaçăo de componentes de variância através de simulaçăo de dados. Piracicaba, 1991. 160p. Tese (Doutorado) Universidade de Săo Paulo, Escola Superior de Agricultura "Luiz de Queiroz".
  • VERBEKE, G.; MOLENBERGHS, G. Linear mixed models in practice: a SAS-oriented approach. New York: Springer, 1997. 306p. (Lecture notes in Statistics, 126).
  • VERNEQUE, R.S. Procedimentos numéricos e estimaçăo de componentes de variância em análise multivariada pelo método da máxima verossimilhança restrita modelos mistos aplicados ao melhoramento animal. Piracicaba, 1994. 157p. Tese (Doutorado) Universidade de Săo Paulo, Escola Superior de Agricultura "Luiz de Queiroz".
  • WOLFINGER, R.D.; FEDERER, W.T.; CORDERO-BRANA, O. Recovering information in augmented designs, using SAS PROC GLM and PROC MIXED. Agronomy Journal, v.89, p.856859, 1997.
  • 1 Parte da Tese de Doutorado do primeiro autor, apresentada à USP/ESALQ - Piracicaba, SP.
    Parte da Tese de Doutorado do primeiro autor, apresentada à USP/ESALQ - Piracicaba, SP.
  • Datas de Publicação

    • Publicação nesta coleção
      09 Fev 2001
    • Data do Fascículo
      Mar 2001

    Histórico

    • Recebido
      22 Dez 1997
    Escola Superior de Agricultura "Luiz de Queiroz" USP/ESALQ - Scientia Agricola, Av. Pádua Dias, 11, 13418-900 Piracicaba SP Brazil, Phone: +55 19 3429-4401 / 3429-4486 - Piracicaba - SP - Brazil
    E-mail: scientia@usp.br