Acessibilidade / Reportar erro

Uma abordagem bayesiana para o mapeamento de QTLS utilizando o método MCMC com saltos reversíveis

A bayesian approach to map QTLs using reversible jump MCMC

Resumos

A utilização de metodologias bayesianas tem se tornado frequente nas aplicações em Genética, em particular em mapeamento de QTLs usando marcadores moleculares. Mapear um QTL significa identificar sua localização ao longo do genoma, estimar seus efeitos genéticos: aditivo, dominância, epistasia, etc. A abordagem bayesiana permite combinar a verossimilhança dos dados fenotípicos com distribuições a priori atribuídas a todas as quantidades desconhecidas no modelo (número, localização no genoma e efeitos genéticos dos QTLs) de forma a fornecer distribuições a posteriori a respeito dessas quantidades. Métodos de mapeamento bayesiano podem incorporar a incerteza relativa ao número desconhecido de QTLs na análise; essa incerteza, no entanto, resulta em complicações na obtenção da amostra da distribuição conjunta a posteriori, uma vez que a dimensão do espaço do modelo pode variar. O método MCMC com Saltos Reversíveis (MCMC-SR), proposto por Green (1995), é uma excelente ferramenta para explorar a distribuição conjunta a posteriori nesse contexto. Neste trabalho, explora-se o método MCMC-SR, utilizando dados artificiais gerados no software WinQTLCart, atribuindo-se diferentes prioris para o número de QTLs.

Mapeamento de QTLs; gibbs-sampler; metropolis-hastings; MCMC com saltos reversíveis


The use of Bayesian methodology in genetic applications has grown increasingly popular, in particular in the analysis of quantitative trait loci (QTL) for studies using molecular markers. In such analyses the objectives are mapping QTLs, estimating their locations in the genome and their genotypic effects (additive, dominance, and epistatic). The Bayesian approach proceeds by setting up a likelihood function for the phenotype and assigning prior distributions to all unknown quantities in the model (number, chromosome, locus, and genetic effects of QTL). These induce a posterior distribution of the unknown quantities that contains all of the available information for inference of the genetic architecture of the trait. Bayesian mapping methods can treat the unknown number of QTL as a random variable, which has several advantages but results in the complication of varying the dimension of the model space. The reversible jump MCMC algorithm (MCMC-RJ), proposed by Green (1995), offers a powerful and general approach to exploring posterior distributions in this setting. The method was evaluated by analyzing simulated data in WinQTLCart, attributing different priors distributions on the QTL numbers.

Mapping QTLs; gibbs-sampler; metropolis-hastings; reversible jump MCMC


CIÊNCIAS AGRÁRIAS

Uma abordagem bayesiana para o mapeamento de QTLS utilizando o método MCMC com saltos reversíveis

A bayesian approach to map QTLs using reversible jump MCMC

Joseane Padilha da SilvaI; Roseli Aparecida LeandroII

IUSP/ESALQ – Programa de Pós-Graduação em Estatística e Experimentação Agronômica. E-mail: joseane_padilha@hotmail.com

IIUSP/ESALQ – Departamento de Ciências Exatas, C.P. 9 – 13418-900 – Piracicaba, SP – Brasil

RESUMO

A utilização de metodologias bayesianas tem se tornado frequente nas aplicações em Genética, em particular em mapeamento de QTLs usando marcadores moleculares. Mapear um QTL significa identificar sua localização ao longo do genoma, estimar seus efeitos genéticos: aditivo, dominância, epistasia, etc. A abordagem bayesiana permite combinar a verossimilhança dos dados fenotípicos com distribuições a priori atribuídas a todas as quantidades desconhecidas no modelo (número, localização no genoma e efeitos genéticos dos QTLs) de forma a fornecer distribuições a posteriori a respeito dessas quantidades. Métodos de mapeamento bayesiano podem incorporar a incerteza relativa ao número desconhecido de QTLs na análise; essa incerteza, no entanto, resulta em complicações na obtenção da amostra da distribuição conjunta a posteriori, uma vez que a dimensão do espaço do modelo pode variar. O método MCMC com Saltos Reversíveis (MCMC-SR), proposto por Green (1995), é uma excelente ferramenta para explorar a distribuição conjunta a posteriori nesse contexto. Neste trabalho, explora-se o método MCMC-SR, utilizando dados artificiais gerados no software WinQTLCart, atribuindo-se diferentes prioris para o número de QTLs.

Termos para indexação: Mapeamento de QTLs, gibbs-sampler, metropolis-hastings, MCMC com saltos reversíveis.

ABSTRACT

The use of Bayesian methodology in genetic applications has grown increasingly popular, in particular in the analysis of quantitative trait loci (QTL) for studies using molecular markers. In such analyses the objectives are mapping QTLs, estimating their locations in the genome and their genotypic effects (additive, dominance, and epistatic). The Bayesian approach proceeds by setting up a likelihood function for the phenotype and assigning prior distributions to all unknown quantities in the model (number, chromosome, locus, and genetic effects of QTL). These induce a posterior distribution of the unknown quantities that contains all of the available information for inference of the genetic architecture of the trait. Bayesian mapping methods can treat the unknown number of QTL as a random variable, which has several advantages but results in the complication of varying the dimension of the model space. The reversible jump MCMC algorithm (MCMC-RJ), proposed by Green (1995), offers a powerful and general approach to exploring posterior distributions in this setting. The method was evaluated by analyzing simulated data in WinQTLCart, attributing different priors distributions on the QTL numbers.

Index terms: Mapping QTLs, gibbs-sampler, metropolis-hastings, reversible jump MCMC.

INTRODUÇÃO

A utilização de metodologias estatísticas tem se tornado um componente indispensável em análises de dados nas mais diversas áreas de conhecimento, sendo imprescindível recorrer ao auxílio delas para desenvolver pesquisas confiáveis e tomar decisões importantes. Dentre as diversas áreas que a estatística pode atuar, destaca-se o ramo da Biologia que estuda a herança e a variação de caracteres quantitativos: a Genética Quantitativa.

Caracteres quantitativos são aqueles cuja expressão fenotípica apresenta variações contínuas, atribuídas à segregação simultânea de muitos genes distribuídos pelo genoma, em regiões definidas como QTLs ("Quantitative Trait Loci"). Com o apoio de modelagens estatísticas pode-se realizar o mapeamento de QTLs. Mapear um QTL significa identificar sua posição no genoma e estimar seus efeitos. É importante salientar que um QTL pode apresentar efeitos de diferentes magnitudes.

Na Agronomia, é economicamente relevante localizar e estimar os efeitos genéticos de QTLs responsáveis pela variação genética de caracteres tais como: produção de grãos, altura da planta, teor de proteína, resistência a doenças, ganho de peso, consumo alimentar, produção de leite etc, que resultam da ação cumulativa de um conjunto de genes.

Conforme Paterson et al. (1991), do ponto de vista prático, os resultados obtidos por meio do mapeamento de QTL podem auxiliar os pesquisadores no melhoramento genético de plantas ou animais e/ou responder questões básicas sobre os processos evolutivos.

Para que se possa realizar um mapeamento de QTLs, é fundamental que se disponha de um conjunto de marcadores genéticos, pois esses auxiliam na construção da distribuição de probabilidades dos genótipos dos QTLs, uma vez que na prática, eles são desconhecidos.

No presente artigo, o mapeamento de QTLs será feito utilizando a inferência bayesiana. A abordagem bayesiana combina a verossimilhança com a distribuição a priori atribuídas a todas as quantidades desconhecidas (número, localização e efeitos genéticos dos QTLs), obtendo-se uma distribuição conjunta a posteriori para essas quantidades. Métodos bayesianos de mapeamento podem incorporar a incerteza relativa ao número, desconhecido, de QTLs na análise, implicando em vantagens consideráveis para a modelagem. Entretanto, resulta em complicações na obtenção da amostra aleatória da distribuição conjunta a posteriori, uma vez que a dimensão do espaço do modelo pode variar. O algoritmo MCMC com Saltos Reversíveis (MCMC-SR) proposto por Green (1995) é uma excelente ferramenta para obtenção dessa amostra, uma vez que ele permite saltar entre modelos de dimensões diferentes por meio da especificação de distribuições propostas eficientes.

O presente artigo visou a: (i) avaliar o desempenho do método MCMC-SR utilizando vários conjuntos de dados artificiais de populações originadas de cruzamentos controlados, supondo-se que a característica de interesse é afetada por uma quantidade desconhecida de QTLs e que não existe interação entre os QTLs, e nem desses com o ambiente; (ii) avaliar a influência da escolha de distribuições a priori para o número de QTLs sobre as inferências a posteriori dos efeitos genéticos, localizações e número de QTLs que afetam a expressão fenotípica.

A simulação dos mapas de ligações e das populações de cruzamentos foi realizada no programa WinQTLCart versão 2.5 e para obtenção da amostra da distribuição conjunta a posteriori utilizou-se módulo BIM (Bayesian Interval Mapping) do WinQTLCart.

MATERIAL E MÉTODOS

Métodos

Modelo QTL

Considerando-se uma população originada de cruzamentos controlados, supondo-se que a característica de interesse é afetada por S QTLs e que não existe interação entre os eles, e nem desses com o ambiente, o valor fenotípico observado para o i-ésimo indivíduo, yi, pode ser descrito através do seguinte modelo de regressão linear (Satagopan et al., 1996):

em que µ é uma constante, e são vetores de dimensão S x 1 que denotam o efeito aditivo e o efeito de dominância relativos aos S QTLs e é o vetor de dimensão n x 1 de erros, tal que e ~ N(0, Is2). Considerando-se uma população F2, Satogopan et al. (1996) assumem a seguinte parametrização para o genótipo do QTL Qij : se o genótipo for ( i ) QQ, Qij = 1; ( ii ) Qq, Qij = 0; (iii) qq, Qij = -1.

A expressão (1) pode ser reescrita, matricialmente, como

em que denota o genótipo dos S QTLs associados ao i-ésimo indivíduo e v1v2 denota o produto interno entre os vetores v1 e v2.

Ocorre que, na prática os genótipos dos QTLs, Qij, j = 1,...,S , i = 1,...,n não são observáveis. No entanto, com base nas informações de marcadores moleculares pode-se encontrar a distribuição de probabilidade de Qij. É importante observar que Qij é uma variável categórica.

Dessa forma, na prática observamos o valor fenotípico e um conjunto de dados de marcadores genotípicos em que n é o número de indivíduos e K é o número de marcadores. Admitindo-se:

(i) A existência de uma mapa de ligação , então as localizações dos marcadores em cada cromossomo é conhecida;

(ii) A existência de apenas um QTL entre os marcadores adjacentes (essa é uma suposição razoável se o mapa for denso);

(iii) A concatenação dos grupos de ligação feita pelos marcadores finais e iniciais de cada grupo;

e considerando-se o modelo dado pela expressão (2), o objetivo é fazer inferências sobre os parâmetros θ = (µ,a,d,ι2) e sobre as localizações, dos S QTLs no genoma.

Adotando-se a abordagem bayesiana para o processo inferencial torna-se necessário:

(i) a construção da função de verossimilhança;

(ii) a atribuição de distribuições a priori para as quantidades desconhecidas de interesse.

(i) Construção da função de verossimilhança

Tem-se que a distribuição conjunta de Yi e Qi é dada por:

f(yi, Qi) = f(yi | Qi) f(Qi),

ou ainda,

f(yi, Qi) = f(yi | Qi) f(Qi | λ,M).

Considerando-se que o genótipo do j-ésimo QTL do i-ésimo indivíduo é condicionalmente independente de outros genótipos do mesmo indivíduo, tem-se:

Sendo assim, a distribuição marginal de Yi será dada por:

ou seja, a distribuição marginal de Yi é dada por uma mistura de distribuições, nesse caso, mistura de distribuições normais, visto que:

A distribuição de probabilidade f(Qij | λ, M) será obtida utilizando-se a informação dos marcadores flanqueadores: Mk e Mk+1 (Mk,k+1). Sabe-se que, as frequências dos genótipos marcadores MM, Mm e mm em uma população F2 são 1/4, 1/2 e 1/4, respectivamente. Cada componente de f(Qi | λ, M) é obtido em termos de recombinação entre os marcadores mk e mk+1 e o j-ésimo QTL e o j-ésimo QTL e a marca mk+1, a Tabela 1 resume essa informação.

Portanto, a função de verossimilhança dos dados fenotípicos pode ser expressa como:

Adotando-se a abordagem bayesiana, as inferências são baseadas na distribuição conjunta a posteriori das quantidades não observáveis dadas as observáveis, π(θ,λ,Q | y,M), em que . A distribuição conjunta a posteriori π(θ,λ,Q | y,M) é obtida combinando-se a verossimilhança, L(θ,λ|y) com as distribuições a priori para os parâmetros, π(θ,λ), isto é,

π(θ,λ,Q | y,M) ∝ L(θ,λ|y) π(θ, λ),

ou equivalentemente,

π(µ,a,d2,λ, Q | y, M) ∝ L(µ,a,d2,λ | y) π(µ,a,d2,λ)

Assumindo-se independência entre os efeitos genéticos e demais parâmetros do modelo, a expressão anterior pode ser reescrita como:

em que são as densidades a priori para os parâmetros do modelo.

(ii) Atribuição de distribuições a priori para as quantidades desconhecidas de interesse

Segundo Gaffney (2001), as distribuições a priori para as quantidades desconhecidas do modelo podem ser especificadas conforme Tabela 2.

Considerando-se que os S QTLs estão ordenados, ou seja,

λ1 < λ2 < ... < λS,

e, atribuindo-se distribuição a priori Uniforme ao longo do comprimento do genoma e somando uma constante db para garantir apenas um QTL por intervalo, isto é, assumindo-se que:

λ1 ~ U [0, comprimento do genoma]

λ2 ~ U [λ1 + db, comprimento do genoma]

.

.

.

λS ~ U [λS – 1 + db, comprimento do genoma],

a distribuição conjunta a posteriori é dada por:

Na abordagem bayesiana, as inferências sobre as quantidades de interesse são baseadas em suas distribuições marginais a posteriori, as quais podem ser obtidas integrando-se a distribuição conjunta a posteriori (3). As distribuições marginais a posteriori para os parâmetros do modelo nesse caso não podem ser obtidas analiticamente, sendo assim, métodos MCMC, tais como Gibbs sampler e Metropolis-Hastings, serão utilizados na construção de amostras da distribuição conjunta a posteriori, que, por sua vez, sob certas condições de regularidade (Casella & George, 1992) fornecerá uma amostra da distribuição marginal a posteriori de cada quantidade de interesse de interesse.

Distribuições condicionais completas a posteriori

Para a implementação dos algoritmos Gibbs sampler e Metropolis-Hastings é necessário a obtenção das distribuições condicionais completas a posteriori para as quantidades de interesse.

Distribuição condicional completa a posteriori para µ.

Distribuição condicional completa a posteriori para σ2.

Distribuição condicional completa a posteriori para aj e dj.

dj* | λ, µ,, {dj}j#j*, σ2, y, Q ~ N (média, variância),

em que,

Uma vez obtidas as distribuições condicionais completas a posteriori constrói-se sob certas condições de regularidade, uma amostra da distribuição conjunta a posteriori conjunta, Π(θ, λ, Q | y), Cabe ressaltar que, no caso das distribuições condicionais completas a posteriori possuírem forma conhecida utiliza-se o método MCMC- Gibbs-Sampler. Caso contrário, utiliza-se o algoritmo de Metropolis-Hastings.

Entretanto, o método MCMC tradicional é útil somente num contexto em que a dimensão do espaço paramétrico é fixa, pode-se observar em (3) que a dimensão do espaço paramétrico varia de acordo com o número de QTLs presentes no modelo. O método MCMC com Saltos Reversíveis (MCMC-SR) proposto por Green (1995) é uma excelente proposta para a obtenção de distribuições a posteriori nesse contexto, uma vez que permite saltar entre modelos de diferentes dimensões.

O Método MCMC com saltos Reversíveis

O método MCMC com saltos reversíveis permite construir uma cadeia de Markov reversível (Xi)i>1 com distribuição invariante π, utilizando o algoritmo de Metropolis-Hastings modificado. A modificação consiste na inclusão do Jacobiano da transformação no cálculo da probabilidade de aceitação do algoritmo de Metropolis-Hastings de forma a contemplar a diferença existente na dimensão dos espaços paramétricos envolvidos no movimento. Mais especificamente, suponha que (s, z) é o estado atual da cadeia de Markov denotado por X(t), em que s é a variável indicadora do número de QTL existente no modelo e z é o vetor de parâmetros associado a este modelo e que uma proposta Xt=1 = (S(t+1), Z(t+1)) é gerada para o novo estado da Cadeia de Markov. Com probabilidade bss' a proposta S(t+1) é igual a s' QTLs. Então, o movimento do modelo contendo s QTLs para o modelo contendo s' QTLs é aceito de acordo com a seguinte probabilidade de aceitação:

Deve-se notar que o Jacobiano que aparece na equação (4) é decorrente da transformação determinística usada no mecanismo proposto por Green (1995) para mudança da dimensão do espaço paramétrico. Os movimentos entre modelos são vistos como: (1) passo de nascimento de QTL, nesse caso, propõe-se saltar de um modelo com s QTL para um modelo contendo s' QTLs, em que s<s', com probabilidade bn; (2) passo morte de QTL, em que deseja-se saltar de um modelo contendo s QTLs para um modelo contendo s' QTLs, em que s>s', com probabilidade bm; (3) passo de permanência, onde o número de QTLs permanece fixo para o próximo estado da cadeia com probabilidade bp = 1 - bn - bm. Green (1995) propõe que bm + bn < 0,9.

De acordo com Gaffney (2001), não existe restrição quanto ao número de QTLs a serem adicionados ou removidos do modelo. No entanto, salienta que esta escolha pode afetar a taxa de aceitação e, portanto, afetar o desempenho da cadeia gerada e, consequentemente, a estimação dos parâmetros. Sendo assim, restringe-se o passo de nascimento ou morte de apenas um QTL. Obviamente a proposta de nascimento ou morte de um QTL não garante sua aceitação e como em MCMC a razão de aceitação calculada, depende da contribuição da verossimilhança, da razão de prioris para os parâmetros e da densidade proposta. Além disso, é importante salientar, que em mapeamento de QTL o Jacobiano da equação (4) é igual a um.

Indicando a probabilidade de aceitação para o nascimento de um QTL como min(1,A), então a probabilidade de aceitação para a morte de um QTL será:

Método de Seleção de Modelos Fator de Bayes

Dado um problema de seleção de modelos, em que temos que comparar o modelo M1 com o modelo M2, um critério muito utilizado é o Fator de Bayes (FB), definido como:

sendo π(Mi | y) a probabilidade a posteriori condicionada às observações do modelo Mi e π(Mi) a probabilidade a priori para o modelo Mi, em que i=1,2. A Tabela 3 apresenta a calibração para o Fator de Bayes baseado no valor FB(M1, M2) proposta por Jeffreys (1935), citado por Raftery (1995).

Materiais

Para avaliar o desempenho do método MCMC com Saltos Reversíveis, bem como verificar a influência da escolha de diferentes distribuições a priori para o número de QTLs sobre sua estimativa a posteriori gerados vários conjuntos de dados utilizando o software WinQTLCart versão 2.5. O WinQTLCart é um software inteiramente gratuito para universidades e pode ser obtido no site http://statgen.ncsu.edu/qtlcart/WQTLCart.htm. Este software permite simular o mapa genético, a população de mapeamento para o experimento QTL e obter uma amostra da distribuição conjunta a posteriori, utilizando o método MCMC-SR. As distribuições a priori disponíveis nesse software são as apresentadas na Tabela 2.

Para simular os conjuntos de dados artificiais foram construídos vários mapas de ligação e populações de cruzamento. Neste artigo, apresenta-se um conjunto de dados obtidos da seguinte forma: simulou-se um mapa de ligação contendo 10 cromossomos, sendo que cada um desses cromossomos tem comprimento de 200cM; no mapa foram alocados 200 marcadores moleculares: 20 marcadores igualmente espaçados por cromossomo. Posteriormente, foram inseridos 3 QTLs ao longo do mapa simulado: o primeiro foi alocado no cromossomo 3, na posição 131,0cM; o segundo no cromossomo 4, na posição 75,7cM e o terceiro no cromossomo 6, na posição 77,3cM . O tamanho amostral considerado foi de 300 indivíduos de uma população F2 com herdabilidade de 90%; supondo o modelo (1) foram atribuídos os efeitos aditivos e de dominância dos três QTLs, como segue: (a1 = 1,1371; d1 = 0,0929), (a2 = -0,8868 2; d2 = -0,2708), (a3 = 1,0347; d3 = -0,4275).

RESULTADOS E DISCUSSÃO

Para a construção da amostra da distribuição conjunta a posteriori utilizou-se módulo BIM do programa QTLCartographer, versão 2.5 para Windows. Foi gerada uma cadeia de 100.000, "burn-in" de 10.000, "pré burn-in" de 10.000 e "thin" de 100 iterações, obtendo-se uma amostra de tamanho 4005. A convergência da cadeia gerada foi monitorada por meio de: (i) análise gráfica; (ii) testes de diagnóstico, tendo sido, neste trabalho, utilizado o teste proposto por Geweke (1992), disponível no CODA (Convergence Diagnosis and Output Analysis) da linguagem de programação R. Foram atribuídas diferentes distribuições a priori para o número de QTLs, afetando a característica de interesse e para os demais parâmetros do modelo utilizou-se o default do programa. As distribuições a priori utilizadas para o número de QTLs foram: (i) a distribuição Geométrica com média 3, 5 e 10; (ii) distribuição de Poisson com média 4, 5 e 10 e a distribuição Uniforme no intervalo [0, comprimento do genoma], ou seja, [0, 200 cM]. As distribuições a priori utilizadas estão resumidas na Tabela 4.

De acordo com a Figura 1, a atribuição da distribuição geométrica para o número de QTLs sugere a existência de três QTLs independentemente da média utilizada. O mesmo não é observado quando considera-se a distribuição Poisson com diferentes médias e nem com a distribuição uniforme. Quando a distribuição a priori Poisson com média igual a quatro ou cinco QTLs, é utilizada não se observa, claramente, qual o número de QTLs presentes. Devese decidir entre três, quatro ou cinco QTLs; já o modelo com média igual a dez QTLs sugere quatro, cinco ou seis QTLs. No caso da distribuição a priori uniforme[0,200] a incerteza é em relação a três, quatro ou cinco QTLs presentes no modelo.


Neste contexto, surge a necessidade de calcular o Fator de Bayes para selecionar o modelo mais adequado. No caso da distribuição geométrica, nos três casos, comparamos o modelo contendo quatro QTLs (G4) com o modelo contendo três QTLs (G3). Pela Tabela 5, verificam-se que as evidências são fortes ou positivas a favor de G3.

Quando atribuímos distribuição a priori Poisson para o número de QTLs, todas as possíveis comparações (duas a duas) evidenciaram que o modelo contendo três QTLs (P3) é o mais adequado (Tabela 6). Ao utilizar a distribuição a priori Poisson com média de dez QTLs, o Fator de Bayes mostra evidências a favor ou positiva a favor do modelo contendo quatro QTLs.

No caso da atribuição de distribuição a priori uniforme no intervalo do comprimento do genoma, o Fator de Bayes mostra evidências a favor do modelo que contém três QTLs (U3), conforme mostra a Tabela 7.

Na Tabela 9, apresentamos as estimativas a posteriori para os efeitos genéticos e localizações dos QTLs (cromossomo e posição) juntamente com o intervalo HPD 95% para os modelos que indicaram a presença de três QTLs, afetando a característica fenotípica. Nota-se que a escolha das diferentes prioris para o número de QTLs não influencia na estimativa a posteriori dos parâmetros. Além disso, observa-se que as estimativas para todos os parâmetros do modelo QTL, exceto para o efeito de dominância do QTL1 (d1), se aproximaram dos valores simulados. Cabe observar que d1=0,0929 é um efeito pequeno sobre a característica de interesse. Observa-se também que o modelo QTL com distribuição a priori Poisson com média de dez QTLs não apresenta estimativa a posteriori razoáveis para os parâmetros, uma vez que detectou várias localizações (cromossomo) para cada QTL, conforme mostra a Tabela 8.

A convergência das cadeias dos parâmetros foi diagnosticada; não existindo evidências contra a convergência das cadeias pelo teste de diagnóstico de Geweke (Geweke, 1992), o qual é um dos testes indicados na literatura para diagnosticar convergência quando trabalha-se com cadeias únicas de tamanho grande.

CONCLUSÕES

Com base nos resultados obtidos, nota-se que o método MCMC-SR implementado software WinQTLCart, teve um excelente desempenho. Tanto para as estimativas a posteriori para o número de QTLs como para os demais parâmetros de interesse do modelo QTL, o método mostrou-se eficiente. Foi visto que é de extrema importância ao utilizar-se a abordagem bayesiana em mapeamento de QTLs, a escolha cautelosa das distribuições a priori para os parâmetros de interesse. Quando o pesquisador for completamente ignorante a despeito do número de QTLs que afetam a característica de interesse , os resultados mostraram que a distribuição geométrica é recomendada.

CONSIDERAÇÕES FINAIS

Com o desenvolvimento deste trabalho, surgiu o questionamento sobre a importância de considerar a inclusão de efeitos de epistasia no modelo QTL para pesquisar traços genéticos complexos. Observa-se que o programa WinQTLCart permite simular cruzamentos, considerando o efeito de epistasia, no entanto, o módulo BIM do WinQTLCart não está preparado para realizar análise sob o enfoque bayesiano, uma vez que não permite atribuir distribuições a priori para os efeitos epistásticos.

Nesse contexto, é de extrema necessidade a implementação de programas capazes de realizar o mapeamento bayesiano de QTLs, considerando efeito de epistasia. Entretanto, a inclusão de mais efeitos do modelo QTL aumenta a complexidade dos passos do MCMC-SR e, consequentemente, aumenta a demanda computacional e pode impedir o bom desempenho do algoritmo, é importante pesquisar formas alternativas para simular da distribuição conjunta a posteriori.

(Recebido em 10 de janeiro de 2007 e aprovado em 11 de julho de 2008)

  • CASELA, G.; GEORGE, E.I. Explaining the gibbs sarnpler. The American Statistician, Washington, v.46, n.3, p.167-74, 1992.
  • GAFFNEY, P.J. An efficient reversible jump markov chain monte carlo approach to detect multiple loci and their effects in inbred crosses 2001. 174p. Thesis (Doctor in Philosophy in Statistcs)-University of Winconsin, Madison, 2001.
  • GEWEKE, J. Evaluating the accuracy of sampling-based approaches to calculating posterior moments. In: BERNARDO, J.M.; BERGER, J.O.; DAWID, A.P.; SMITH, A.F.M. (Ed.). Bayesian statistics Oxford: Clarendon, 1992. v.4.
  • GREEN, P.J. Reversible jump markov chain monte carlo computation and bayesian model determination. Biometrics, Washington, v.82, p.711-732, 1995.
  • PATERSON, A.H.; DAMON, S.; HEWITT, J.D.; ZAMIR, D.; RAQBINOWITCH, H.D. Mendelian factors underlying quantitative traits in tomato comparison across species generations and environments. Genetics, Austin, v.127, p.181-197, 1991.
  • RAFTERY, A.E. Bayesian model selection in social research. Sociological Methodology, Oxford, v.25, p.111-163, 1995.
  • SATAGOPAN, J.M.; YANDELL, B.S.; NEWTON, M.A.; OSBORN, T.C. A bayesian approach to detece quantitative trait loci using markov chain Monte Carlo. Genetics, Austin, p.805-816, 1996.

Datas de Publicação

  • Publicação nesta coleção
    28 Ago 2009
  • Data do Fascículo
    Ago 2009

Histórico

  • Aceito
    11 Jul 2008
  • Recebido
    10 Jan 2007
Editora da Universidade Federal de Lavras Editora da UFLA, Caixa Postal 3037 - 37200-900 - Lavras - MG - Brasil, Telefone: 35 3829-1115 - Lavras - MG - Brazil
E-mail: revista.ca.editora@ufla.br