Acessibilidade / Reportar erro

Análise bayesiana do modelo de herança monogênica no melhoramento vegetal: um exemplo com abobrinha

Bayesian analisys of monogenic inheritance model in plant breeding: a case study with zucchini

Resumos

Uma estratégia comum em programas de melhoramento é conduzir estudos básicos de herança para investigar a hipótese de controle do caráter por um ou poucos genes de efeito principal, associados ou não a genes modificadores de pequeno efeito. Neste trabalho, foi utilizada a inferência bayesiana para ajustar modelos de herança genética aditiva-dominante a experimentos de genética vegetal com várias gerações. Densidades normais com médias associadas aos efeitos genéticos das gerações foram consideradas em um modelo linear em que a matriz de delineamento dos efeitos genéticos tinha coeficientes indeterminados (precisando ser estimada para cada indivíduo). A metodologia foi ilustrada com um conjunto de dados de um estudo de herança da partenocarpia em abobrinha (Cucurbita pepo L). Tal ajuste permitiu explicitar a distribuição a posteriori das probabilidades genotípicas. . A análise corrobora resultados anteriores da literatura, porém foi mais eficiente que alternativas prévias que supunham a matriz de delineamento conhecida para as gerações. Conclui-se que a partenocarpia em abobrinha é governada por um gene principal com dominância parcial.

Algoritmo Metropolis; Amostragem Gibbs; Cucurbita pepo; Gene Principal; Partenocarpia


A common breeding strategy is to carry out basic studies to investigate the hypothesis of a single gene controlling the trait (major gene) with or without polygenes of minor effect. In this study we used Bayesian inference to fit genetic additive-dominance models of inheritance to plant breeding experiments with multiple generations. Normal densities with different means, according to the major gene genotype, were considered in a linear model in which the design matrix of the genetic effects had unknown coefficients (which were estimated in individual basis). An actual data set from an inheritance study of partenocarpy in zucchini (Cucurbita pepo L.) was used for illustration. Model fitting included posterior probabilities for all individual genotypes. Analysis agrees with results in the literature but this approach was far more efficient than previous alternatives assuming that design matrix was known for the generations. Partenocarpy in zucchini is controlled by a major gene with important additive effect and partial dominance.

Cucurbita pepo; Gibbs sampler; major gene; Metropolis algorithm; partenocarpy


Análise bayesiana do modelo de herança monogênica no melhoramento vegetal: um exemplo com abobrinha

Bayesian analisys of monogenic inheritance model in plant breeding: a case study with zucchini

Maria Imaculada de Sousa SilvaI; Eduardo BearzotiII; Júlio Sílvio de Sousa Bueno FilhoIII

IDoutoranda em Estatística e Experimentação Agropecuária. DEX-UFLA. Caixa postal 3037, 37200-000, Lavras, MG. Bolsista do CNPq-Brasil - maissilva@gmail.com

IIDr.,IA - UNICAMP, Caixa Postal 6159, 13083-854, Campinas, SP - edbearzoti@yahoo.com.br

IIIProf. Dr. DEX-UFLA. Caixa postal 3037, 37200-000, Lavras, MG. Bolsista do CNPq-Brasil - jssbueno@ufla.br

RESUMO

Uma estratégia comum em programas de melhoramento é conduzir estudos básicos de herança para investigar a hipótese de controle do caráter por um ou poucos genes de efeito principal, associados ou não a genes modificadores de pequeno efeito. Neste trabalho, foi utilizada a inferência bayesiana para ajustar modelos de herança genética aditiva-dominante a experimentos de genética vegetal com várias gerações. Densidades normais com médias associadas aos efeitos genéticos das gerações foram consideradas em um modelo linear em que a matriz de delineamento dos efeitos genéticos tinha coeficientes indeterminados (precisando ser estimada para cada indivíduo). A metodologia foi ilustrada com um conjunto de dados de um estudo de herança da partenocarpia em abobrinha (Cucurbita pepo L). Tal ajuste permitiu explicitar a distribuição a posteriori das probabilidades genotípicas. . A análise corrobora resultados anteriores da literatura, porém foi mais eficiente que alternativas prévias que supunham a matriz de delineamento conhecida para as gerações. Conclui-se que a partenocarpia em abobrinha é governada por um gene principal com dominância parcial.

Termos para indexação: Algoritmo Metropolis, Amostragem Gibbs, Cucurbita pepo, Gene Principal, Partenocarpia.

ABSTRACT

A common breeding strategy is to carry out basic studies to investigate the hypothesis of a single gene controlling the trait (major gene) with or without polygenes of minor effect. In this study we used Bayesian inference to fit genetic additive-dominance models of inheritance to plant breeding experiments with multiple generations. Normal densities with different means, according to the major gene genotype, were considered in a linear model in which the design matrix of the genetic effects had unknown coefficients (which were estimated in individual basis). An actual data set from an inheritance study of partenocarpy in zucchini (Cucurbita pepo L.) was used for illustration. Model fitting included posterior probabilities for all individual genotypes. Analysis agrees with results in the literature but this approach was far more efficient than previous alternatives assuming that design matrix was known for the generations. Partenocarpy in zucchini is controlled by a major gene with important additive effect and partial dominance.

Índex terms:Cucurbita pepo, Gibbs sampler, major gene, Metropolis algorithm, partenocarpy.

INTRODUÇÃO

Em estudos de herança genética de uma característica contínua, a hipótese de herança monogênica frequentemente é testada por meio da aderência à distribuição de qui-quadrado (Arias et al., 1994; Souza Sobrinho, 1998; Freitas et al., 2002). Supondo a ação de poligenes, em geral a inferência é feita estimando componentes de média por meio do teste de escala conjunto, e os componentes de variância pela análise de variância (Mather & Jinks, 1984; Ramalho et al., 1993). Recentemente, estudos de herança propõem investigar simultaneamente a ação de um único gene (gene principal) e ou de vários genes de pequeno efeito (poligenes) (Changjian et al., 1994; Lou & Zhu, 2002; Silva, 2003). Com este enfoque, a inferência bayesiana também tem sido usada para inferir sobre tal herança, porém, no melhoramento animal (Janss et al., 1995, 1997; Sorensen, 1996).

Neste trabalho, objetivou-se apresentar estimadores bayesianos de parâmetros referentes ao gene principal, contemplando as particularidades dos experimentos com plantas, tais como a existência de várias gerações e a consideração de efeitos de dominância. A técnica é ilustrada com um conjunto de dados reais, com a finalidade de estudar a herança do fenômeno da partenocarpia em abobrinha (Cucurbita pepo L.). A partenocarpia, que consiste na formação de frutos sem que ocorra fertilização, é um caráter de crescente importância no melhoramento de abobrinha, pois permite a boa produção de frutos, mesmo na ausência de agentes polinizadores, ou em situações em que a polinização ou a fecundação seja deficiente por incompatibilidades morfológicas ou outras (Nogueira, 2007).

MATERIAL E MÉTODOS

Foi analisado um conjunto de dados oriundos de um experimento desenvolvido no setor de Olericultura da Universidade Federal de Lavras, sobre a herança do fenômeno da partenocarpia em abobrinha. O método empregado foi o da condução de um cruzamento segregante (Mather & Jinks, 1984). Foram consideradas seis gerações, sendo que os genitores contrastantes considerados foram a variedade Caserta (P1) e a variedade Whitaker (P2); o cruzamento entre elas (geração 'F1"), o cruzamento entre indivíduos P1 e F1 ('RC11"); o cruzamento entre indivíduos P2 e F1 ('RC12") e o cruzamento entre indivíduos F1 (geração 'F2"). O número de plantas amostradas foi de 562, sendo destas, 94 da geração P1, 51 de P2, 53 de F1, 86 do RC11, 75 do RC12 e 203 de F2. As plantas amostradas foram avaliadas com notas de 1 a 5, conforme menor ou maior ocorrência de partenocarpia, respectivamente, tomando-se as médias das notas por planta atribuídas por três avaliadores. O modelo linear proposto tem a seguinte representação:

em que ~N(a,b) representa a distribuição multivariada normal com média "a" e covariância "b". Nesse modelo, Y é o vetor dos dados (notas médias), b contém uma constante de referência m, m é um vetor de efeitos fixos, aditivos (A) e de dominância (D), do gene principal, de forma que m' = [A, D], X é o vetor de incidência de b (suposto conhecido) e e é o vetor de erros aleatórios. A matriz de delineamento dos efeitos genéticos W (desconhecida) contém vetores aleatórios wi para cada observação, referentes à incidência de m, de forma que W' = (w1, w2, ... , wn), sendo n o número de plantas observadas. Os vetores wi podem assumir os valores [1, 0], [-1, 0] ou [0, 1], associados respectivamente ao homozigoto cujos alelos são favoráveis à incidência da partenocarpia, ao homozigoto cujos alelos são desfavoráveis, ou ao heterozigoto. Portanto, para cada uma das gerações P1, P2 e F1, por apresentarem apenas um genótipo, o vetor wi pode assumir apenas um valor, diferente para cada uma delas, enquanto que para as gerações RC11, RC12 e F2 existem duas ou três possibilidades, conforme a Tabela 1, sendo que em tais casos, os vetores wi constituem um parâmetro a ser estimado, com distribuições a priori p(wi) independentes, apresentadas na própria Tabela 1 .

Para os vetores b e m foram atribuídas distribuições a priori não informativas e degeneradas, ou seja, proporcionais a constantes. Para a componente da variância ó2 (variância ambiental), considerou-se como priori uma distribuição qui-quadrado escalada invertida com v =6 graus de liberdade e parâmetro de escala Se =7.

Supondo distribuição normal, a função de verossimilhança é dada pela expressão (2.1), e a distribuição conjunta de todos os parâmetros, supondo independência entre eles, é dada pela expressão (2.2), nas quais o símbolo µ representa proporcionalidade.

As distribuições condicionais completas para cada parâmetro são obtidas a partir da distribuição conjunta pela solução da seguinte identidade :

em que p(c | a,b) é a condicional completa para c, p(b,c | a) é distribuição conjunta para b e c, e p(b|a) é a distribuição marginal para b. Isso pode ser obtido com métodos práticos de simplificação das condicionais para distribuições proporcionais que dispensam o cálculo explícito das integrais do denominador (Gelfand & Smith, 1990; Sörensen, 1996).

Assim, obteve-se que a distribuição condicional completa para b é normal com média (X'X)-1X'(Y-Wm) e variância ó2.A distribuição condicional completa para m é normal com vetor de médias (W'W)-1W'(Y-Xb) e matriz de covariâncias igual a Ió2.

A distribuição condicional completa para os vetores wi da matriz W é dada por:

sendo que w-i representa todos os vetores da matriz W, com exceção de wi .

A condicional completa para o parâmetro ó2 é dada por (2.4) a seguir. Pode-se notar que a forma dessa distribuição é de uma gama invertida.

As condicionais completas dos parâmetros b, m e ó2 são todas densidades conhecidas, a partir das quais as amostras podem ser obtidas, utilizando-se o algoritmo do amostrador de Gibbs. Para a matriz W, deve-se utilizar o algoritmo Metropolis-Hastings, um método de simulação Monte Carlo via cadeias de Markov usado para aproximar uma distribuição de interesse, quando esta não apresenta a forma de uma densidade conhecida.

Para a análise, foi desenvolvido um programa utilizando o software R, gerando duas cadeias com 10.000 iterações, descartando as 2.000 iniciais e tomando amostras a cada duas iterações, totalizando duas sequências de 4.000 amostras da densidade de cada parâmetro.

RESULTADOS E DISCUSSÃO

As cadeias foram submetidas aos critérios de convergência de Gelman e Rubin e de Geweke, os quais apontaram a convergência para os parâmetros b, A, D, e ó2, concluindo-se que a amostra gerada aproxima-se da distribuição desejada. A distribuição a posteriori dos parâmetros estão representadas graficamente pelas Figuras 1 e 2. Tais figuras sugerem que as distribuições dos parâmetros m, A e D apresentam uma tendência à simetria, porém a variância (ó2) apresentou distribuição a posteriori ligeiramente assimétrica (Figura 1.b).



Para exemplificar a utilidade de estimar a matriz W, foram escolhidos aleatoriamente alguns indivíduos de cada geração segregante, e analisada a probabilidade a posteriori que cada um tem de corresponder a cada vetor wi e, os resultados estão apresentados na tabela 2.

Na Tabela 2, estão apresentados também os fenótipos (Y) dos indivíduos em questão. Percebe-se uma clara coerência entre estes e as probabilidades a posteriori de cada vetor wi.

Por exemplo, na geração RC11, os dois indivíduos com valor fenotípico 1,00 tiveram alta probabilidade de serem homozigóticos, ou seja, de estarem associados ao vetor wi igual a [-1,0]. Como as plantas foram avaliadas com notas de 1 a 5, de acordo com uma menor ou maior incidência de partenocarpia, fica evidente a coerência do resultado, já que uma planta com a menor nota (1) é aquela em que a característica não se manifestou e assim seria mais lógico que ela apresentasse apenas os alelos que diminuem a expressão do caráter, como ocorre no indivíduo homozigótico dessa geração. Na geração RC12 , o indivíduo com valor fenotípico igual a 1,00 apresentou probabilidade nula de ser homozigoto associado ao vetor wi = [0,1], o que também foi perfeitamente coerente, pois, com uma nota tão baixa seria improvável que ele apresentasse dois alelos que aumentassem a expressão do caráter, como ocorre com os indivíduos homozigóticos dessa geração. Ainda na geração RC12, um indivíduo com nota igual a 4,33 apresentou uma alta probabilidade de ser homozigoto contra uma baixa probabilidade de ser heterozigoto. Portanto, percebe-se claramente pela Tabela 2 que, na geração RC11, quanto maior o valor fenotípico, maior a probabilidade de o indivíduo ser heterozigoto, e na geração RC12, maior a probabilidade de o indivíduo ser homozigoto dominante com o aumento do fenótipo. Comportamentos coerentes com a escala de valores fenotípicos também foram observados na geração F2. Exemplos disso são as plantas avaliadas com notas mais altas (4,00 ou mais), que apresentaram probabilidades nulas de serem homozigotas recessivas (wi = [-1, 0]) e as plantas avaliadas com notas baixas (1,667), que apresentaram probabilidade nula de serem homozigotas dominantes (wi = [1, 0]).

Na Tabela 2 ilustra-se uma vantagem da inferência bayesiana, no presente contexto, pois possibilita explicitar claramente probabilidades de cada indivíduo ser de um ou outro genótipo de um gene principal. Isso auxiliaria o geneticista de plantas a selecionar aqueles indivíduos com maiores probabilidades de terem fixado o alelo favorável ao caráter sob estudo.

Na Tabela 3, estão dispostas as estimativas a posteriori por ponto e por intervalo dos parâmetros b, A, D, e ó2, e do erro de Monte Carlo. Os valores estimados de A e D permitem concluir que o fenômeno da partenocarpia possui herança monogênica com efeito de dominância parcial e efeito aditivo um pouco mais expressivo. Esses resultados estão de acordo com Menezes et al. (2005), que também registram a presença de um gene principal controlando a característica.

Verifica-se na Tabela 3 que, apesar de o modelo aqui sugerido levar em conta fatores antes não considerados, as estimativas a posteriori para os parâmetros b, A e D tiveram valores semelhantes àqueles obtidos por Silva (2003), com esse mesmo conjunto de dados, pelo método da máxima verossimilhança. As medidas de qualidade de ajuste do modelo, no entanto, são melhores. A amplitude dos IC para as estimativas diminuiu e, principalmente, houve redução significativa na estimativa da variância não explicada pelo delineamento (variância ambiental). Para a variância ambiental (ó2), o valor obtido (0,29) mostrou-se abaixo da estimativa de máxima verossimilhança (ó2 = 0,8). A rigor, a diferença não é apenas nas estimativas, mas nos modelos, pois o autor supôs a matriz W como sendo conhecida, com os vetores que no modelo apresentado constituem apenas as probabilidades a priori para wi. Assim, por exemplo, um indivíduo fenotipicamente extremo na geração RC11 tem probabilidades diferenciadas de ser homozigoto ou heterozigoto, no presente modelo, enquanto que no modelo de Silva (2003) essas chances são iguais. É possível que essa seja a razão para a maior precisão na forma de análise ora apresentada, pois parte da variação que é essencialmente genética dentro de cada classe genotípica é confundida com variação ambiental no modelo com W constante. É improvável que a análise bayesiana tenha introduzido per se a maior precisão, pois as distribuições a priori empregadas para b, A, D foram constantes e para ó2, pouco informativa, ou seja, o resultado da análise bayesiana deveria ser muito próximo à análise de verossimilhança pura. No modelo apresentado a estimação da matriz W permite levar em conta pesos mais adequados para cada indivíduo, levando a uma estimativa mais realista de ó2. Pode-se assim concluir que o ajuste do modelo com W aleatória é mais eficiente que o do modelo com W fixa, conforme Silva (2003).

CONCLUSÕES

Corrobora-se a hipótese de que a partenocarpia em abobrinha seja governada por um gene com efeito aditivo pronunciado e dominância parcial. O cálculo de probabilidades genotípicas para cada indivíduo aumentou a precisão das estimativas de efeitos aditivos e dominantes e diminuiu a estimativa do erro associado ao modelo.

AGRADECIMENTOS

À Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES, pela bolsa de estudos concedida à primeira autora no estágio inicial de realização deste trabalho.

Recebido em 18 de junho de 2007

Aprovado em 12 de dezembro de 2008

  • ARIAS, C.A.A.; TOLEDO, J.F.F.;YORINORI, J.T. An improved procedure for testing theoretical segregation in qualitative genetic studies of soybeans. Revista Brasileira de Genética, Ribeirão Preto, v.17,n.3, p.291-297, 1994.
  • CHANGJIAN, J.; XUEBIAO, P.; MINGHONG, G. The use of mixture models to detect effects of major genes on quantitative characters in a plant breeding experiment. Genetics, Berlin, v.136, p.383-394, 1994.
  • FREITAS, J.A.; MALUF, W.R.; CARDOSO, M.G.; GOMES, L.A.A.; BEARZOTI, E. Inheritance of foliar zingiberene contents and their relationship to trichome densities and whitefly resistance in tomatoes. Euphytica, Wageningen, v.127, n.2, p.275-287, 2002.
  • GELFAND, A.E.; SMITH, A.F.M. Sampling-based approaches to calculating marginal densities. Journal of the American Statistical Association, Madison, v.85, n.410, p.127-131, 1990.
  • JANSS, L.L.G.;ARENDONK, J.A.M. van; BRASCAMP, E.W. Bayesian statistical analyses for presence of single genes affecting meat quality traits in a crossed pig population. Genetics, Berlin, v.145, p.395-408, 1997.
  • JANSS, L.L.G.; THOMPSON, R.;ARENDONK, J.A.M. van. Application of Gibbs sampling for inference in a major gene-polygenic inheritance model in animal populations. Theoretical and Applied Genetics, Berlin, v.91, p.1137-1147, 1995.
  • LOU, X.Y.; ZHU, J. Analysis of genetics effects of major genes and polygenes on quantitative traits. Theoretical and Applied Genetics, Berlin, v.104, p.414-421, 2002.
  • MATHER, K.; JINKS, J.L. Introdução à genética biométrica Ribeirão Preto: Sociedade Brasileira de Genética, 1984. 242p.
  • MENEZES, C.B.; MALUF, W.R.;AZEVEDO, S.M.; FARIA, M.V.; NASCIMENTO, I.R.; NOGUEIRA, D.W.; GOMES, L.A.A.; BEARZOTI, E. Inheritance of parthenocarpy in summer squash (Cucurbita pepo L.). Genetics and Molecular Research, Cambridge, v.4, p.39-46, 2005.
  • NOGUEIRA, D.W. Heterose e capacidade combinatória de linhagens de abobrinha partenocárpicas e resistentes ao Papaya ringspot vírus (PRSV-W) 2007. 25p. Dissertação (Mestrado em Genética e Melhoramento de Plantas)-Universidade Federal de Lavras, Lavras, 2007.
  • RAMALHO, M.A.P.; SANTOS, J.B. dos; ZIMMERMANN, M.J. de O. Genética quantitativa em plantas autógamas: aplicação ao melhoramento do feijoeiro. Goiânia: UFG, 1993. 271p.
  • SILVA, W.P. Estimadores de máxima verossimilhança em misturas de densidades normais: uma aplicação em genética 2003. 60p. Dissertação (Mestrado em Estatística e Experimentação Agropecuária)-Universidade Federal de Lavras, Lavras, 2003.
  • SORENSEN, D. Gibbs Sampling in quantitative genetics Denmark: Danish Institute of Animal Science, 1996. 186p.
  • SOUZA SOBRINHO, F. Herança da reação de resistência à raça 2 de Meloidogyne incognita na pimenta Capsicum annuum L. cv Carolina Cayenne 1998. 57p. Dissertação (Mestrado em Genética e Melhoramento de Plantas)-Universidade Federal de Lavras, Lavras, 1998.

Datas de Publicação

  • Publicação nesta coleção
    29 Jan 2010
  • Data do Fascículo
    Dez 2009

Histórico

  • Recebido
    18 Jun 2007
  • Aceito
    12 Dez 2008
Editora da Universidade Federal de Lavras Editora da UFLA, Caixa Postal 3037 - 37200-900 - Lavras - MG - Brasil, Telefone: 35 3829-1115 - Lavras - MG - Brazil
E-mail: revista.ca.editora@ufla.br