Comparação entre modelos para predição do nitrogênio mineralizado: uma abordagem bayesiana

Comparison of the models for prediction of the mineralized nitrogen: a bayesian approach

Janser Moura Pereira Joel Augusto Muniz Thelma Sáfadi Carlos Alberto Silva Sobre os autores

Resumos

Neste trabalho, desenvolveu-se uma abordagem bayesiana para predizer as quantidades de nitrogênio mineralizados por intermédio de modelos não lineares. Os modelos não lineares considerados para avaliar a dinâmica da mineralização do nitrogênio e para ilustrar o procedimento bayesiano foram: modelo de Cabrera, Marion, Stanford e Smith. A comparação dos modelos foi feita por meio do Fator de Bayes (FB) e do Critério de Informação Bayesiano (BIC). A inferência sobre os parâmetros realizou-se por intermédio do Amostrador de Gibbs e do Metropolis Hastings. O modelo de Cabrera (1993) foi o que proporcionou melhor qualidade de ajuste ao conjunto de dados de mineralização de nitrogênio, sendo seguido pelo modelo de Stanford & Smith (1972) e, por último, o de Marion et al. (1981).

Amostrador de Gibbs; Metropolis Hastings; Fator de Bayes; Critério de Informação Bayesiano


In this work one developed a Bayesian approach to predict the amount of mineralized nitrogen through nonlinear models. The nonlinear models considered to evaluate the mineralization of organic nitrogen and to illustrate the Bayesian procedure were: models of Cabrera, Marion, Stanford and Smith. The comparison of the models was promoted through the Bayes Factor (FB) and Bayes Information Criterion (BIC). Inference on the parameters was carried out through the Gibbs Sampling and Metropolis Hastings. The model that provided better adjustment quality to the group of data was Cabrera's model (1993), followed by the model of Stanford & Smith (1972) and the last one by Marion et al. (1981).

Nitrogen mineralization; Nonlinear models; Bayesian inference


COMUNICAÇÃO

Comparação entre modelos para predição do nitrogênio mineralizado: uma abordagem bayesiana

Comparison of the models for prediction of the mineralized nitrogen: a bayesian approach

Janser Moura PereiraI; Joel Augusto MunizII; Thelma SáfadiIII; Carlos Alberto SilvaIV

IDoutor em Estatística e Experimentação Agropecuária - Faculdade de Ciências Integradas do Pontal - Universidade Federal de Uberlândia/UFU - Avenida José João Dib, 2545 - Progresso - 38302-000 - Ituiutaba, MG - janser@pontal.ufu.br

IIEngenheiro Agrônomo, Doutor em Estatística e Experimentação Agropecuária, Professor Titular - Departamento de Ciências Exatas/DEX - Universidade Federal de Lavras/UFLA - Cx. P. 3037 - 37200-000 - Lavras, MG - joamuniz@ufla.br

IIIProfessora Adjunta do Departamento de Ciências Exatas/UFLA, CP 37 - 37200-000 - Lavras/MG, email: safadi@ufla.br

IVProfessor Adjunto do Departamento de Ciência do Solo/UFLA, CP 37 - 37200-000 - Lavras/MG, email: csilva@ufla.br

RESUMO

Neste trabalho, desenvolveu-se uma abordagem bayesiana para predizer as quantidades de nitrogênio mineralizados por intermédio de modelos não lineares. Os modelos não lineares considerados para avaliar a dinâmica da mineralização do nitrogênio e para ilustrar o procedimento bayesiano foram: modelo de Cabrera, Marion, Stanford e Smith. A comparação dos modelos foi feita por meio do Fator de Bayes (FB) e do Critério de Informação Bayesiano (BIC). A inferência sobre os parâmetros realizou-se por intermédio do Amostrador de Gibbs e do Metropolis Hastings. O modelo de Cabrera (1993) foi o que proporcionou melhor qualidade de ajuste ao conjunto de dados de mineralização de nitrogênio, sendo seguido pelo modelo de Stanford & Smith (1972) e, por último, o de Marion et al. (1981).

Termos para indexação: Amostrador de Gibbs, Metropolis Hastings, Fator de Bayes, Critério de Informação Bayesiano.

ABSTRACT

In this work one developed a Bayesian approach to predict the amount of mineralized nitrogen through nonlinear models. The nonlinear models considered to evaluate the mineralization of organic nitrogen and to illustrate the Bayesian procedure were: models of Cabrera, Marion, Stanford and Smith. The comparison of the models was promoted through the Bayes Factor (FB) and Bayes Information Criterion (BIC). Inference on the parameters was carried out through the Gibbs Sampling and Metropolis Hastings. The model that provided better adjustment quality to the group of data was Cabrera's model (1993), followed by the model of Stanford & Smith (1972) and the last one by Marion et al. (1981).

Index terms: Nitrogen mineralization, Nonlinear models, Bayesian inference.

O nitrogênio potencialmente mineralizável do solo (N0) é uma medida da quantidade de nitrogênio mineralizado sob condições ótimas de umidade e temperatura, podendo ser empregado para estimar o nitrogênio (N) que será disponibilizado durante o ciclo de uma cultura. Compreender as transformações do N no solo constitui um fator importante para a maximização de seu uso pelas plantas, e também para uma maior eficiência na adubação nitrogenada, uma vez que o nitrogênio é essencial ao crescimento e à produção das culturas, constituindo, na maioria dos casos, no elemento que mais limita o crescimento e desenvolvimento das plantas (SILVA et al., 1994).

Na agricultura comercial moderna, grande quantidade de nitrogênio é adicionada ao solo, constituindo-se fonte potencial de poluição ambiental. Embora tal contaminação seja proveniente de várias fontes, como resíduos municipais e industriais, as práticas agrícolas, em especial a adubação do solo com nitrogênio que têm aumentado abusivamente nos últimos anos, têm sido consideradas as principais delas (FERGUSON et al., 1991). Para que este problema decresça, é necessário que os agricultores usem adubos nitrogenados e orgânicos em quantidades adequadas que, ao mesmo tempo, aumentem a produtividade das culturas e diminuam ao mínimo possível os teores de N-NO-3 (nitrato) e N-NH+4 (amônia) no solo (UNLU et al., 1999). De preferência, é preciso sincronizar melhor a liberação de N pelos resíduos, com as fases de maior requerimento nutricional das culturas. É possível alcançar essa sincronização por meio de modelos não lineares que descrevem a mineralização do N em função do tempo. Estes modelos apresentam leis de formação em função de parâmetros como: N potencialmente mineralizável (N0) e taxas de mineralização. Segundo Pereira et al. (2005), ao se ajustar um modelo não linear em estudos desta natureza consegue-se levantar informações sobre a quantidade de nitrogênio mineralizado e disponibilizado durante o ciclo de uma cultura ao longo do tempo e, também, informações sobre a taxa ou constante de mineralização do nitrogênio.

Conduziu-se este trabalho, com o objetivo de implementar uma ilustração de uso da metodologia bayesiana para predizer as quantidades de N mineralizados por intermédio de modelos não lineares. Para comprovação dos resultados, utilizaram-se dados experimentais associados à mineralização de N em Latossolo do sul de Minas Gerais sob efeito da calagem, descritos em Silva et al. (1994). Assim, foram consideradas as quantidades acumuladas de N mineralizado durante onze tempos de incubação (1, 2, 3, 4, 6, 8, 10, 12, 14, 21 e 28 semanas). A acidez do solo foi corrigida visando-se elevar a saturação por bases a 60%, com o pH em água do solo atingindo valores na faixa de 6,0-6,2. A extração do N mineral (nitrato + amônio) formado durante a incubação foi feita pela lavagem periódica do solo com solução de CaCl2 (Cloreto de Cálcio) 0,01 mol L-1. A quantificação do N mineralizado foi feita em destilador de arraste de vapores, sendo o N-amônio quantificado após a adição de MgO (Óxido de Magnésio) no extrato de CaCl2 e, o nitrato, após o uso de liga de Devarda no extrato remanescente. As amostras de solo foram incubadas em condições ambientais do Laboratório de Relação Solo-Planta do DCS/UFLA, com a temperatura ambiente oscilando entre 21 e 28ºC. O delineamento experimental utilizado foi o inteiramente ao acaso com três repetições. Os modelos não lineares utilizados para descrever a mineralização do nitrogênio no solo em função do tempo, e para ilustrar o procedimento bayesiano estão apresentados na Tabela 1.

A descrição dos termos (parâmetros) nos diversos modelos é a seguinte:

yi é o nitrogênio mineralizado até o tempo ti; ti é o tempo de incubação, com i = 1, ..., n; N0 é o nitrogênio potencialmente mineralizável; N1 é o nitrogênio facilmente mineralizável; k, k0 e k1 são taxas ou constantes de mineralização; b é um parâmetro que não tem interpretação biológica (constante qualquer); ei é um vetor de erros com distribuição normal com média zero e variância σ2e.

No contexto de inferência bayesiana, todos os parâmetros do modelo, são considerados como variáveis aleatórias, conforme o conceito subjetivo de probabilidade. A partir de uma generalização do Teorema de Bayes, informações a priori sobre parâmetros são utilizadas em associação com os dados amostrais, possibilitando uma inferência a posteriori sobre os parâmetros (BOX & TIAO, 1992). A inferência sobre os parâmetros consiste em determinar a posteriori conjunta do modelo, com o objetivo de encontrar uma distribuição para um parâmetro específico, chamada distribuição marginal de θi. Para isso, integra-se a posteriori conjunta em relação aos outros parâmetros do modelo. Porém, muitas vezes a forma analítica da marginal é complexa e multidimensional ou até mesmo impossível de ser calculada analiticamente. Nesse caso, utilizam-se métodos numéricos iterativos como método de Monte Carlo via Cadeias de Markov, (MCMC) para gerar valores de uma distribuição condicional a posteriori para cada parâmetro (SORENSEN, 1996). Dentre os métodos de simulação que fazem o uso de cadeias de Markov destacam-se o Amostrador de Gibbs e o Metropolis Hastings (HASTINGS, 1970). O Amostrador de Gibbs é indicado quando as distribuições condicionais completas são identificáveis (CASELLA & GEORGE, 1993). Caso isso não ocorra, pode-se utilizar o algoritmo de "Metropolis Hastings" (HASTINGS, 1970).

Neste trabalho, a monitoração da convergência das cadeias foi realizada por meio do critério de Geweke (1992) e Raftery & Lewis (1992). A regra de decisão do critério de Raftery & Lewis (1992) é baseada no fator de dependência. Se o fator de dependência for maior que 5, pode-se concluir que a cadeia não atingiu convergência. A regra de decisão do critério de Geweke (1992) é baseada na estimativa do p-valor. Se o p-valor for menor que um nível de significância adotado pelo pesquisador, conclui-se que a cadeia não atingiu convergência. A comparação dos modelos realizou-se por intermédio do Fator de Bayes (BERKHOF et al., 2003) e do Critério de Informação Bayesiano (CARLIN & LOUIS, 2000). Se o Fator de Bayes (FB) for maior que 1, o modelo 1 apresenta uma probabilidade a posteriori maior, ou seja, o modelo 1 é mais plausível ou verossímil do que o modelo 2, então, opta-se por escolher o modelo 1 para predizer o fenômeno em questão. A regra de decisão baseada no Critério de Informação Bayesiano (BIC) consiste na escolha do modelo que apresentar maior valor de BICi.

Os elementos necessários para uma análise bayesiana dos modelos não lineares (1), (2) e (3) estão descritos a seguir. Primeiramente, para o modelo de Stanford & Smith, equação (1), supondo que ei ~ iid N(0,τe-1), τe = (σ2e)-1, então, a verossimilhança pode ser escrita da seguinte forma:

em que i = 1, ..., n , y = {y1, y2,..., yn} e H são os hiperparâmetros: αe e βe.

O passo seguinte consiste na definição das distribuições a priori dos parâmetros do modelo (1). De acordo com Sorensen (1996), admitindo que não haja informação prévia a respeito dos parâmetros N0 e k, definiu-se uma priori do tipo função constante no espaço paramétrico (priori não informativa), ou seja,

Para a precisão τe, assumiu-se como priori, uma distribuição Gama com hiperparâmetros αe e βe, ou seja,

Combinando a verossimilhança (4) com as priori (5) e (6), pelo Teorema de Bayes, obtém-se a distribuição a posteriori conjunta do modelo de Stanford & Smith (1):

ou seja,

Analogamente, tem-se que as distribuições aposteriori conjuntas dos modelos de Marion (2) e Cabrera(3), são respectivamente (9) e (10):

A estimação dos parâmetros realizou-se por meio de rotinas elaboradas no software R e para o procedimento de amostragem utilizou-se o Amostrador de Gibbs e o Metropolis Hastings. No processo foram geradas 450.000 iterações, considerando-se um "burn-in" de 50.000, isto é, as 50.000 primeiras iterações foram descartadas, e um "thin" a cada 100 iterações para assegurar a independência da amostra.

A inferência sobre cada parâmetro dos modelos não lineares (1), (2) e (3) se realiza por meio das distribuições marginais dos parâmetros. Portanto, a partir das posteriori conjuntas, (8), (9) e (10), foram obtidas as distribuições a posteriori condicionais completas para cada parâmetro dos modelos (1), (2) e (3), respectivamente. A implementação do algoritmo do Amostrador de Gibbs, o qual permite obter aproximações das distribuições marginais foi realizada no software R, conforme R Development Core Team (2004).

A obtenção das distribuições condicionais completas dos parâmetros dos modelos de Marion e Cabrera está detalhada no Anexo. Para o modelo de Stanford & Smith (1972) (1), segundo a sua posteriori conjunta (8), a posteriori condicional completa para o parâmetro N0, tem como distribuição condicional uma Normal, dada por:

Considere ai = 1- exp(kti) e a como vetor dos elementos ai para o tempo i, com i = 1,2,...,n e y = {y1, y2, ..., yn} pode-se definir (11) como:

isto é,

em que e

Logo, a posteriori condicional completa para N0 pode ser reescrita da seguinte forma:

Para o parâmetro k do modelo (1), tem-se:

E, finalmente, para o parâmetro τe, tem-se:

ou seja, a distribuição a posteriori condicional completa para τe é uma Gama:

Com base na Tabela 2, verifica-se que o critério de Geweke (1992) não apresentou nenhuma evidência contra a convergência dos parâmetros dos modelos, ao nível de 5%, e com relação ao critério de Raftery & Lewis (1992) observa-se que os fatores de dependência para cada parâmetro dos modelos são inferiores a "cinco", o que caracteriza a convergência das cadeias.

De acordo com a Tabela 3, pode-se afirmar que as estimativas dos intervalos HPD mostraram-se adequadas ao ajuste dos modelos, pois foram obtidas a partir da distribuição empírica dos parâmetros, e observa-se também que todos os parâmetros dos modelos (1), (2) e (3) foram significativos, pois seus respectivos intervalos HPD não continham o valor zero em sua extensão. Nota-se ainda que os Erros de Monte Carlo apresentaram valores baixos, confirmando a boa qualidade das estimativas dos parâmetros.

Por intermédio do Fator de Bayes (Tabela 4), compararam-se os modelos de Stanford & Smith vs Cabrera e Marion vs Cabrera os resultados foram, 0,0507 e 0,0307, respectivamente. Com isso, pode-se afirmar que o modelo de Cabrera se mostrou melhor que os demais no ajuste aos dados. O Fator de Bayes para a comparação Stanford & Smith vs Marion apresentou resultado de 1,6504, isto é, o modelo de Stanford & Smith é mais plausível ou verossímil que o modelo de Marion. Portanto, o modelo que melhor se ajustou aos dados de mineralização de nitrogênio foi o modelo de Cabrera, sendo seguido pelo modelo de Stanford & Smith e por último o de Marion.

A comparação de modelos por meio do Critério de Informação Bayesiano (BIC) consiste na escolha do modelo que apresentar o maior valor de BIC. Portanto, com base nos resultados apresentados na Tabela 5, o modelo que melhor se ajustou ao conjunto de dados de mineralização do nitrogênio foi o modelo de Cabrera, sendo seguido pelo modelo de Stanford & Smith e por último o de Marion.

A inferência bayesiana é uma metodologia de grande potencial para o estudo da mineralização do nitrogênio, pois considera a incerteza existente sobre todos os parâmetros dos modelos estudados, além de possibilitar a inclusão de informações por meio do uso de distribuições a priori informativas. Nas condições em que foram realizados os estudos (tipo de solo, região, presença de calagem), o modelo que proporcionou melhor qualidade de ajuste ao conjunto de dados de mineralização de nitrogênio foi o modelo de Cabrera, tanto utilizando o Fator de Bayes quanto o Critério de Informação Bayesiano.

AGRADECIMENTOS

À Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES, pela bolsa de estudo concedida e à Fundação de Amparo à Pesquisa do Estado de Minas Gerais pelo financiamento do projeto de pesquisa.

Recebido em 22 de fevereiro de 2007

Aprovado em 6 de agosto de 2007

  • BERKHOF, J.; MECHELEN, I. V.; GELMAN, A. A bayesian approach to the selection and testing of mixture models. Statistica Sinica, [S.l.], v. 13, p. 423-442, 2003.
  • BOX, G. E. P.; TIAO, G. C. Bayesian inference in statistical analysis New York: J. Wiley & Sons, 1992. 588 p.
  • CABRERA, M. L. Modeling the flush of nitrogen mineralization caused by drying and rewetting soils. Soil Science Society of America Journal, Madison, v. 57, p. 63-66, 1993.
  • CASELLA, G.; GEORGE, E. Explaning the gibbs sampler. The American Statitician, Washington, v. 46, p. 167-174, 1993.
  • CARLIN, B. P.; LOUIS, T. A. Bayes and empirical bayes methods for data analysis 2. ed. London: Chapman and Hall, 2000. 419 p.
  • FERGUSON, R. B.; SHAPIRO, C. A.; HERGERT, G. W.; KRANZ, W. L.; KLOCKE, N. L.; KRULL, D. H. Nitrogen and irrigation management practices to minimize nitrate leaching from irrigate corn. Journal of Production Agriculture, Madison, v. 4, p. 186-192, 1991.
  • GEWEKE, J. Evaluating the accuracy of sampling-based approaches to the calculation of posterior moments. In: BERNARDO, J. M.; BERGER, J. O.; DAWID, A. P.; SMITH, A. F. M. (Eds.). Bayesian statistics 4 New York: Oxford University, 1992. 526 p.
  • HASTINGS, W. K. Monte carlo sampling methods using Markov chains and their applications. Biometrika, London, v. 57, n. 1, p. 97-109, 1970.
  • MARION, G. M.; KUMMEROW, J.; MILLER, P. C. Predicting nitrogen mineralization in chaparral soils. Soil Science Society of America Journal, Madison, v. 45, p. 956-961, 1981.
  • PEREIRA, J. M.; MUNIZ, J. A.; SILVA, C. A. Nonlinear models to predict nitrogen mineralization in a Oxisol. Scientia Agricola, Piracicaba, v. 62, n. 4, p. 395-400, 2005.
  • RAFTERY, A. L.; LEWIS, S. Comment: one long run with diagnostics: implementation strategies for Markov chain Monte Carlo. Statistical Science, Hayward, v. 7, n. 4, p. 493-497, 1992.
  • R DEVELOPMENT CORE TEAM. The R manuals: current version: 1.9.1. 2004. Disponível em: <http://www.r-project.org>. Acesso em: 10 out. 2006.
  • SILVA, C. A.; VALE, F. R.; GUILHERME, L. R. Efeito da calagem na mineralização do nitrogênio em solos de Minas Gerais. Revista Brasileira Ciência do Solo, Campinas, v. 18, p. 471-476, 1994.
  • SORENSEN, D. Gibbs sampling in quantitative genetics Foulun: [s.n.], 1996. 186 p.
  • STANFORD, G.; SMITH, S. J. Nitrogen mineralization potentials of soil. Soil Science of America Journal, Madison, v. 36, p. 465-472, 1972.
  • UNLU, K.; OZENIRLER, G.; YURTERI, C. Nitrogen fertilizer leaching from cropped and irrigated sandy soil in Central Turkey. European Journal of Soil Science, Oxford, v. 50, n. 4, p. 609-620, 1999.

Datas de Publicação

  • Publicação nesta coleção
    09 Mar 2010
  • Data do Fascículo
    2009

Histórico

  • Recebido
    22 Fev 2007
  • Aceito
    06 Ago 2007
Editora da UFLA Editora da UFLA, Caixa Postal 3037 - 37200-900 - Lavras - MG - Brasil, Telefone: 35 3829-1115 - Lavras - MG - Brazil
E-mail: revista.ca.editora@ufla.br