SciELO - Scientific Electronic Library Online

 
vol.46 issue1Biomass production and nutrient accumulation and release by cover crops in the off-seasonBayesian genetic parameters for body weight and survival of Nile tilapia farmed in Brazil author indexsubject indexarticles search
Home Pagealphabetic serial listing  

Services on Demand

Journal

Article

  • Portuguese (pdf)
  • Article in xml format
  • How to cite this article
  • SciELO Analytics
  • Curriculum ScienTI
  • Automatic translation

Indicators

Related links

Share


Pesquisa Agropecuária Brasileira

Print version ISSN 0100-204X

Pesq. agropec. bras. vol.46 no.1 Brasília Jan. 2011

https://doi.org/10.1590/S0100-204X2011000100004 

GENÉTICA

 

Abordagem bayesiana para avaliação da adaptabilidade e estabilidade de genótipos de alfafa

 

Bayesian approach for the evaluation of adaptability and stability of alfalfa genotypes

 

 

Moysés NascimentoI; Fabyano Fonseca e SilvaI; Thelma SáfadiII; Ana Carolina Campana NascimentoI; Reinaldo de Paula FerreiraIII; Cosme Damião CruzIV

IUniversidade Federal de Viçosa (UFV), Departamento de Estatística, Avenida P.H. Rolfs, s/nº, CEP 36571-000 Viçosa, MG. E-mail: moysesnascim@ufv.br, fabyanofonseca@ufv.br, ana.campana@ufv.br
IIUniversidade Federal de Lavras, Departamento de Ciências Exatas, Setor de Estatística e Experimentação, Campus Universitário, Caixa Postal 3037, CEP 37200-000 Lavras, MG. E-mail: safadi@ufla.br
IIIEmbrapa Pecuária Sudeste, Rodovia Washington Luiz, Km 234, CEP 13560-970 São Carlos, SP. E-mail: reinaldo@cppse.embrapa.br
IVUFV, Departamento de Biologia Geral. E-mail: cdcuz@ufv.br

 

 


RESUMO

O objetivo deste trabalho foi propor uma abordagem bayesiana do método de Eberhart & Russell para avaliar a adaptabilidade e da estabilidade fenotípica de genótipos de alfafa (Medicago sativa), bem como avaliar a eficiência da utilização de distribuições a priori informativas e pouco informativas. Foram utilizados dados de um experimento em blocos ao acaso, no qual se avaliou a produção de massa de matéria seca de 92 genótipos. A metodologia bayesiana proposta foi implementada no programa livre R por meio da função MCMCregress do pacote MCMCpack. Para representar as distribuições a priori pouco informativas, utilizaram-se distribuições de probabilidade com grande variância; e, para representar distribuições a priori informativas, adotou-se o conceito de meta-análise, que se caracteriza pela utilização de informações provenientes de trabalhos anteriores. A comparação entre as distribuições a priori foi realizada por meio do fator de Bayes, com a função BayesFactor do pacote MCMCpack, que indicou a priori informativa como a mais adequada nas condições deste estudo.

Termos para indexação: Medicago sativa, fator de Bayes, priori informativa, interação genótipo x ambiente, MCMC.


ABSTRACT

The objective of this work was to propose a Bayesian approach for the Eberhart & Russell method to evaluate the phenotypic adaptability and stability of alfafa (Medicago sativa) genotypes, as well as to evaluate the efficiency of the use of prior informative and noninformative distributions. Data from a randomized block design experiment evaluating the forage dry weight of 92 genotypes were used. The Bayesian methodology proposed was implemented in the free software R by the MCMCregress function of the MCMCpack package. To represent the noninformative prior distributions, a probability distribution with high variance was used; and, to represent the informative prior, a meta-analysis concept was adopted, characterized by the use of information provided by previous studies. The comparison between the prior distributions was done using the Bayes Factor, with the BayesFactor function of the MCMCpack package, which indicated that an informative prior is more appropriate under the conditions of this study.

Index terms: Medicago sativa, Bayes factor, informative prior, genotype x environment interaction, MCMC.


 

 

Introdução

No melhoramento genético de plantas o estudo pormenorizado da interação entre genótipo x ambiente é de extrema importância, quando o objetivo é selecionar ou recomendar genótipos para o plantio. Diversas metodologias são usadas para esse fim, como o método de Annicchiarico (1992), que se baseia em análise da variância, e o método de Eberhart & Russell (1966), que se baseia em análise de regressão linear simples. Métodos não paramétricos, como os desenvolvidos por Rocha et al. (2005) e Nascimento et al. (2009a, 2009b, 2010c), também podem ser empregados.

Apesar da grande quantidade de metodologias, nenhuma faz uso de informações a priori na estimação dos parâmetros. A inserção de informações prévias pode ser realizada por meio de inferência bayesiana. Nesta abordagem, a incerteza sobre os parâmetros de interesse é representada por meio de distribuições de probabilidade específicas, que retratam o maior ou menor conhecimento sobre os parâmetros.

O método de Eberhart & Russell (1966) é de grande utilidade e possibilita que a abordagem bayesiana seja realizada sem grandes dificuldades. Embora não seja recente, esse método é de extrema importância e bastante relatado na literatura especializada, como em Ferreira et al. (2004), que estudaram a adaptabilidade e a estabilidade de 35 genótipos de alfafa, em Lédo et al. (2005), que avaliaram a adaptabilidade e estabilidade de cultivares de alfafa cultivadas em diferentes regiões do Estado de Minas Gerais, e em Vasconcelos et al. (2008), que avaliaram e selecionaram genótipos de alfafa por meio de metodologias de adaptabilidade e estabilidade fenotípica. Miranda et al. (2009) fizeram uso da metodologia de Eberhart & Russell (1966) para corroborar os resultados de duas técnicas de análise de adaptabilidade e estabilidade multivariadas em milho-pipoca. Pereira et al. (2009) compararam métodos de análise de adaptabilidade e estabilidade fenotípica em feijoeiro-comum.

O objetivo deste trabalho foi apresentar uma abordagem bayesiana do método de Eberhart & Russell para análise da adaptabilidade e da estabilidade fenotípica de genótipos de alfafa (Medicago sativa L.), e avaliar a eficiência da utilização de distribuições a priori informativas e pouco informativas.

 

Material e Métodos

Foram utilizados dados de um experimento conduzido pela Embrapa Pecuária Sudeste, para o desenvolvimento de genótipos de alfafa adaptados a diferentes ecossistemas brasileiros. Neste experimento, que utilizou o delineamento de blocos ao acaso com duas repetições, foi avaliada a produção de massa de matéria seca de 92 genótipos de alfafa, submetidos a 20 cortes no período de novembro de 2004 a junho de 2006. Os cortes foram caracterizados como diferentes condições ambientais, porque foram realizados em épocas diferentes.

Para a análise bayesiana, foram considerados apenas os genótipos avaliados em ao menos dois dos seguintes trabalhos: Ferreira et al. (2004), Lédo et al. (2005) e Vasconcelos et al. (2008), utilizados como referência para a especificação das distribuições a priori.

O método proposto por Eberhart & Russell (1966) baseia-se na análise de regressão linear simples, que mede a resposta de cada genótipo às variações ambientais. Para um experimento com g genótipos, a ambientes e r repetições, define-se o seguinte modelo estatístico:

em que: Yij, média do genótipo i no ambiente j; b0i, coeficiente linear referente ao i-ésimo genótipo; βli, coeficiente de regressão, que mede a resposta do i-ésimo genótipo à variação do ambiente; Ij, índice ambiental codificado, yij, erros aleatórios, que podem ser descompostos como: em que: δij, desvio da regressão, e erro experimental médio.

As estimativas de Ij indicam a qualidade do ambiente, em que valores negativos de Ij identificam ambientes desfavoráveis, e valores positivos de Ij, ambientes favoráveis.

Os parâmetros de adaptabilidade são dados por:

enquanto o de estabilidade é dado por: , em que QMDi é o quadrado médio do desvio da regressão de cada genótipo e QMD, o quadrado médio do resíduo fornecido pela análise da variância (Cruz et al., 2004).

Na abordagem frequentista, em geral empregada, as hipóteses de interesse, H0:βli = 1 versus H1:βli 1 e versus são avaliadas pelas estatísticas t e F, respectivamente.

Na abordagem bayesiana, fundamentada no teorema de Bayes - posteriori verossimilhança x priori - toda informação a respeito dos parâmetros a serem estimados está contida na distribuição a posteriori, que é composta de informações prévias sobre os parâmetros, representadas pela distribuição a priori, e de informações contidas nos dados a serem analisados, representadas pela função de verossimilhança.

Ao se considerar o modelo estatístico Yij = β0i + βliIj + ψij e assumir-se que cada observação Yij tem distribuição a função de verossimilhança para cada genótipo i é dada por:

Para a estimação dos parâmetros de adaptabilidade e estabilidade, é necessário atribuir distribuições a priori para os parâmetros. Para β0i, li e foram consideradas as seguintes distribuições: GamaInv(αi:βi); esta última uma gama inversa com média e variância iguais a respectivamente.

Ao assumir-se a independência entre os parâmetros dessas distribuições, a priori conjunta para cada genótipo é dada por:

Para fazer inferências sobre os parâmetros de interesse, é necessário obter suas distribuições marginais a posteriori. Ao denotar o vetor de parâmetros para cada genótipo i por em que p=1,2,3, a distribuição marginal a posteriori para o parâmetro θpi é obtida pela seguinte integral: P(θpi|x)=+P(θi|x)dθ.pi, isto é, a integral em relação a todos os parâmetros do vetor, exceto o p-ésimo componente.

Na maioria dos casos, essas integrais são complexas e não apresentam soluções exatas. Para contornar esse problema, utiliza-se outra metodologia. Obtém-se uma amostra da distribuição conjunta a posteriori ao se utilizar as cadeias de Markov e o método de Monte Carlo, para a obtenção dos momentos de interesse das distribuições marginais (Cassela & George, 1992). Neste estudo, a metodologia foi implementada no programa R (R Development Core Team, 2010), e a amostra da distribuição conjunta foi obtida por meio da função MCMCregress do pacote MCMCpack.

Para avaliar a influência de informações a priori na estimação dos parâmetros de adaptabilidade e estabilidade, optou-se pela utilização de dois modelos diferentes.

No Modelo 1, foram consideradas distribuições a priori informativas, cujas informações advém da aplicação da técnica de meta-análise, que se caracteriza pela utilização de informações de trabalhos anteriores: Ferreira et al. (2004), Lédo et al. (2005) e Vasconcelos et al. (2008). As informações foram inseridas na análise por meio dos valores assumidos para os parâmetros das distribuições a priori, denominados de hiperparâmetros.

Estes valores foram dados pela média e variância da amostra composta pelas estimativas dos parâmetros obtidas das referências citadas (Tabela 1), o que resultou nas distribuições: GamaInv(αl,βi), em que: médias das estimativas dos médias das estimativas dos variância dos valores médios de variância dos valores médios de βli; αi e βi, valores obtidos pela resolução do sistema:

 

 

Dos 92 genótipos avaliados no experimento, apenas 12 foram avaliados em ao menos dois dos trabalhos usados como referência para a especificação da priori. Por isso, somente os 12 genótipos apresentados na Tabela 2 foram considerados para a análise bayesiana.

No Modelo 2, foram utilizadas distribuições a priori pouco informativas, que representam distribuições de probabilidade com grande variância. Foram adotadas as seguintes distribuições: GamaInv(αl=0,00001; βi=5000). A Figura 1 apresenta as distribuições pouco informativas obtidas por meio dos hiperparâmetros fornecidos.

A comparação entre os modelos 1 e 2, ou seja, entre distribuições a priori informativas e não informativas, foi realizada com base no fator de Bayes (Kass & Raftery, 1995). O cálculo do fator de Bayes foi realizado por meio da função BayesFactor do pacote MCMCpack.

De acordo com Jeffreys (1961), o fator de Bayes pode ser interpretado da seguinte forma: FBij<1 demonstra evidência a favor do modelo j; 1<FBij<3 demonstra evidência moderada a favor do modelo i; 3< FBij<10 demonstra evidência substancial a favor do modelo i; 10< FBij<30 demonstra evidência forte a favor de i; 30< FBij<100 demonstra evidência muito forte a favor de i; e FBij>100 demonstra evidência decisiva a favor do modelo i.

Com relação ao parâmetro de estabilidade as amostras de sua distribuição marginal foram obtidas indiretamente, uma vez que esse parâmetro representa uma função de Ao se obter valores para indiretamente em cada iteração, obtém-se valores para s2di por meio da seguinte expressão: em que: QMR, quadrado médio do resíduo fornecido pela análise da variância e r, número de repetições do experimento.

As hipóteses de interesse foram testadas pela construção de intervalos de credibilidade para os parâmetros; os intervalos foram obtidos diretamente da distribuição marginal a posteriori dos parâmetros. Assim, seja o vetor de parâmetros, o intervalo de credibilidade para qi, com probabilidade de cobertura d, é dado por:

em que: θ* e θ* representam, respectivamente, os limites inferiores e superiores do intervalo de credibilidade.

Como o Gibbs sampler é um algoritmo iterativo, faz-se necessário a verificação de sua convergência, que foi constatada, neste trabalho, por meio da aplicação dos critérios de Heidelberger & Welch (1983), Raftery & Lewis (1992) e Geweke (1992), implementados no pacote BOA (Bayesian Output Analysis) do programa R (R Development Core Team, 2010).

Na análise bayesiana de adaptabilidade e estabilidade, para cada parâmetro do modelo de regressão adotado, foram consideradas 110.000 iterações no algoritmo Gibbs sampler, com um período de aquecimento ("burn-in") de 10.000 iterações. Para obter-se uma amostra não correlacionada, considerou-se um espaçamento entre os pontos amostrados de duas iterações ("thinning"), o que resultou em uma amostra final de tamanho 50.000. As amostras representam amostras das distribuições marginais a posteriori de cada parâmetro, sob as quais foi feita a inferência de cada parâmetro.

 

Resultados e Discussão

A Tabela 1 apresenta a análise da variância para a produção de massa de matéria seca. Os resultados mostram a significância da interação entre genótipos x cortes, o que indica que estes genótipos apresentaram desempenho diferenciado sob diferentes condições ambientais. Por causa dessas variações, foi necessário um estudo pormenorizado do comportamento dos genótipos por meio da análise de adaptabilidade e estabilidade.

Em relação à convergência, para todas as cadeias simuladas, o fator de dependência de Raftery & Lewis (1992) forneceu valores menores que cinco, e o p-valor do critério de Geweke (1992) foi sempre maior que o nível de significância pré-fixado (5%), ou seja, ambos os critérios indicaram a convergência das cadeias geradas pelo Gibbs sampler. Para confirmar essa convergência, também utilizou-se o critério de Heidelberger & Welch (1983), que verifica se os valores das cadeias são provenientes de uma distribuição estacionária.

Os valores das estimativas dos parâmetros de adaptabilidade e estabilidade foram obtidos pelo cálculo da média a posteriori, que são apresentadas, juntamente com os seus respectivos intervalos de credibilidade, na Tabela 3. No Modelo 1 (prioris informativas), dos 12 genótipos avaliados por meio da metodologia bayesiana, apenas o genótipo Costera SP INTA foi classificado como de adaptabilidade específica a ambientes favoráveis (β1i>1), por causa dos limites do intervalo de credibilidade de 95%. Os demais genótipos foram classificados como de adaptabilidade geral, já que o valor 1 pertence aos IC de 95%. Em relação à estabilidade, somente o genótipo WL 516 foi classificado como de baixa estabilidade (previsibilidade), uma vez que o valor zero pertence ao IC de 95% para σdi.

A análise dos genótipos por meio do Modelo 2 (prioris não informativas) indicou que apenas o genótipo Flórida 77 foi de adaptabilidade específica a ambientes favoráveis, enquanto os demais foram de adaptabilidade geral. Como no Modelo 1, somente o genótipo WL 516 teve a hipótese de estabilidade rejeitada. Os critérios usados para a classificação destes genótipos foram os mesmos considerados ao se utilizar o modelo 1, isto é, os limites do IC de 95%.

Ao se comparar as estimativas dos parâmetros obtidas pelos dois modelos, as estimativas do intercepto e do coeficiente angular foram semelhantes para cada genótipo. Houve apenas uma inversão de resultados; no Modelo 1, o genótipo Costera SP INTA foi considerado como adaptável a ambientes favoráveis, e de adaptabilidade geral no Modelo 2. A mesma inversão ocorreu para o genótipo Flórida, ao ser analisado pelo Modelo 2. Nesse modelo, três dos 12 genótipos avaliados tiveram seus intervalos de credibilidade com limite inferior exatamente igual a 1, o que pode gerar dúvida quanto à classificação do cultivar. É necessário informar qual dos dois modelos apresentou maior qualidade de ajuste; e a resposta é dada pelo cálculo do fator de Bayes.

Na Tabela 4, são apresentados os valores fornecidos pelo fator de Bayes, que indicam que o Modelo 1 apresentou fortes evidências a seu favor para todos os genótipos avaliados. O menor valor do fator de Bayes obtido foi de 13,90, ao se considerar a análise do genótipo Crioula, e o maior valor foi de 23,79 para o genótipo Sutter. Embora as estimativas dos parâmetros de adaptabilidade apresentem resultados semelhantes, o fator de Bayes revela que existem evidências de que o uso de prioris informativas fornece resultados mais acurados. Apesar da informação a priori ter-se baseado em apenas três artigos, ela mostrou-se de grande importância para este estudo. Espera-se que, em estudos de adaptabilidade e estabilidade em outras culturas, que possuam maior quantidade de informação disponível para meta-análise, os resultados sejam ainda mais precisos.

 

 

Conclusões

1. A abordagem bayesiana aplicada a estudos de adaptabilidade e estabilidade por meio de modelos de regressão linear simples é eficiente para a classificação dos genótipos.

2. Com base nos resultados de seleção de modelos via fator de Bayes, o uso de distribuições a priori informativas é superior à qualidade de ajuste às distribuições a priori não informativas.

 

Referências

ANNICCHIARICO, P. Cultivar adaptation and recommendation from alfalfa trials in Northern Italy. Journal of Genetics and Plant Breeding, v.4, p.269-278, 1992.         [ Links ]

CASSELA, G.; GEORGE, E.I. Explaining the Gibbs sampler. The American Statistician, v.46, p.167-174, 1992.         [ Links ]

CRUZ, C.D.; REGAZZI, A.J.; CARNEIRO, P.C.S. Modelos biométricos aplicados ao melhoramento genético. 3.ed. Viçosa: UFV, 2004. 480p.         [ Links ]

EBERHART, S.A.; RUSSELL, W.A. Stability parameters for comparing varieties. Crop Science, v.6, p.36-40, 1966.         [ Links ]

FERREIRA, R. de P.; BOTREL, M. de A.; RUGGIERI, A.C.; PEREIRA, A.V.; COELHO, A.D.F.; LÉDO, F.J. da S.; CRUZ, C.D. Adaptabilidade e estabilidade de cultivares de alfafa em relação a diferentes épocas de corte. Ciência Rural, v.34, p.265-269, 2004.         [ Links ]

GEWEKE, J. Evaluating the accuracy of sampling-based approaches to the calculation of posterior moments. In: BERNARDO, J.M.; BERGER, J.O.; DAVID, A.P.; SMITH, A.F.M. (Ed.). Bayesian statistics. New York: Oxford University, 1992. Cap.4, p.625-631.         [ Links ]

HEIDELBERGER, P.; WELCH, P.D. Simulation run length control in the presence of an initial transient. Operations Research Landing, v.31, p.1109-1144, 1983.         [ Links ]

JEFFREYS, H. Theory of probability. 3rd ed. Oxford: Claredon, 1961. 447p.         [ Links ]

KASS, R.E.; RAFTERY, A.E. Bayes factors. Journal of the American Statistical Association, v.90, p.773-795, 1995.         [ Links ]

LÉDO, F.J. da S.; BOTREL, M. de A.; EVANGELISTA, A.R.; VIANA, M.C.M.; PEREIRA, A.V.; SOUZA SOBRINHO, F. de; OLIVEIRA, J.S. e; XAVIER, D.F.; HEINEMANN, A.B. Adaptabilidade e estabilidade de cultivares de alfafa avaliadas em Minas Gerais. Ciência e Agrotecnologia, v.29, p.409-414, 2005.         [ Links ]

MIRANDA, G.V.; SOUZA, L.V. de; GUIMARÃES, L.J.M.; NAMORATO, H.; OLIVEIRA, L.R.; SOARES, M.O. Multivariate analyses of genotype x environment interaction of popcorn. Pesquisa Agropecuária Brasileira, v.44, p.45-50, 2009.         [ Links ]

NASCIMENTO, M.; CRUZ, C.D.; CAMPANA, A.C.M.; TOMAZ, R.S.; SALGADO, C.C; FERREIRA, R. de P. Alteração no método centróide de avaliação da adaptabilidade genotípica. Pesquisa Agropecuária Brasileira, v.44, p.263-269, 2009a.         [ Links ]

NASCIMENTO, M.; FERREIRA, A.; CAMPANA, A.C.M.; SALGADO, C.C.; CRUZ, C.D. Multiple centroid methodology to analyze genotype adaptability. Crop Breeding and Applied Biotechnology, v.9, p.8-16, 2009b.         [ Links ]

NASCIMENTO, M.; FERREIRA, A.; FERRÃO, R.G.; CAMPANA, A.C.M.; BHERING, L.L.; CRUZ, C.D.; FERRÃO, M.A.G.; FONSECA, A.F.A. da. Adaptabilidade e estabilidade via regressão não paramétrica em genótipos de café. Pesquisa Agropecuária Brasileira, v.45, p.41-48, 2010c.         [ Links ]

PEREIRA, H.S.; MELO, L.C.; DEL PELOSO, M.J.; FARIA, L.C. de; COSTA, J.G.C. da; DÍAZ, J.L.C.; RAVA, C.A.; WENDLAND, A. Comparação de métodos de análise de adaptabilidade e estabilidade fenotípica em feijoeiro-comum. Pesquisa Agropecuária Brasileira, v.44, p.374-383, 2009.         [ Links ]

RAFTERY, A.L.; LEWIS, S.M. Comment: one long run with diagnostics: implementation strategies for Markov chain Monte Carlo. Statistical Science, v.7, p.493-497, 1992.         [ Links ]

R DEVELOPMENT CORE TEAM. R: a language and environment for statistical computing. Vienna: R Foundation for Statistical Computing. Available at: <http://www.R- project.org>. Accessed on: 10 Jan. 2010.         [ Links ]

ROCHA, R.B.; MURO-ABAD, J.I.; ARAÚJO, E.F.; CRUZ, C.D. Avaliação do método centróide para estudo de adaptabilidade ao ambiente de clones de Eucalyptus grandis. Ciência Florestal, v.15, p.255-266, 2005.         [ Links ]

VASCONCELOS, E.S. de; BARIONI JÚNIOR, W.; CRUZ, C.D.; FERREIRA, R. de P.; RASSINI, J.B.; VILELA, D. Seleção de genótipos de alfafa pela adaptabilidade e estabilidade da produção de matéria seca. Acta Scientiarum. Agronomy, v.30, p.339-343, 2008.         [ Links ]

 

 

Recebido em 17 de maio de 2010 e aprovado em 14 de dezembro de 2010

Creative Commons License All the contents of this journal, except where otherwise noted, is licensed under a Creative Commons Attribution License