Acessibilidade / Reportar erro

A aplicação da distribuição exponencial geométrica estendida para modelagem de dados pluviométricos

The extended geometric exponential distribution applied for modeling rainfall data

Resumos

Neste trabalho propõem-se o uso da distribuição Exponencial Geométrica Estendida (EGE) como um modelo alternativo às distribuições comumente utilizadas tais como Gama, Weibull, Lognormal, entre outras, para a modelagem de dados de precipitação pluvial. Pouco explorada na literatura, a distribuição EGE tem se mostrado eficiente em diversos campos de pesquisa como biologia, demografia, confiabilidade de produtos eletrônicos e pode ser aplicada para analisar fenômenos meteorológicos. Proposta por Adamidis e colaboradores em 2005, uma de suas particularidades é que sua função de risco pode ser crescente ou decrescente. Outra característica importante é a facilidade em se obter diferentes níveis de probabilidade, sem a necessidade de recorrer a métodos numéricos. Testou-se o ajustamento da distribuição EGE para a estimação da precipitação pluvial total mensal de Presidente Prudente-SP. Os resultados mostraram que houve um bom ajuste do modelo para os dados ao serem comparados com outros modelos como Gama, Weibull e Lognormal, de acordo com o critério de informação de Akaike, o teste Kolmogorov-Smirnov e o teste Qui-quadrado ao nivel de 5% de significância. A partir do ajustamento da distribuição EGE aos dados, os estimadores dos parâmetros da distribuição foram obtidos através do método de máxima verossimilhança permitindo assim a estimação da precipitação pluvial total mensal para diferentes níveis de probabilidade.

Distribuição Exponencial Geométrica Estendida; precipitação pluvial; máxima verossimilhança; níveis de probabilidade


In this paper we propose to use the Extended Geometric Exponential distribution (EGE) as an alternative model to the commonly used distributions such as Gamma, Weibull, Lognormal among others, for modeling rainfall data. The distribution EGE has been little explored in the literature although it can be applied in many research fields such as biology, demography, and reliability of electronic products and can also be applied to analyze meteorological phenomenon. The EGE distribution has been proposed by Adamidis and collaborators in 2005 and one of its peculiarities is that the hazard function can be increasing or decreasing. Another important characteristic is the easiness to obtain different probability levels which do not demand numerical approaches. Several distributions such as Gamma, Weibull and Lognormal were used to fit the rainfall data measured at Presidente Prudente city. The results showed EGE being the best fit for the data according to the Akaike information criterion, the Kolmogorov-Smirnov test and the Chi-square test. The estimators of the EGE distribution parameters were obtained by the maximum likelihood approach and thus allowing the estimation of monthly rainfall for different probability levels.

Extended Geometric Exponential Distribution; rainfall; maximum likelihood; probability levels


ARTIGOS

Pedro Luiz RamosI; Fernando Antonio MoalaII

IUniversidade Estadual Paulista "Julio de Mesquita Filho", Faculdade de Ciências e Tecnologia (UNESP/FCT), Presidente Prudente. SP, Brasil. pedrolramos@hotmail.com

IIUniversidade Estadual Paulista "Julio de Mesquita Filho", Faculdade de Ciências e Tecnologia (UNESP/FCT), Presidente Prudente. SP, Brasil. femoala@fct.unesp.br

RESUMO

Neste trabalho propõem-se o uso da distribuição Exponencial Geométrica Estendida (EGE) como um modelo alternativo às distribuições comumente utilizadas tais como Gama, Weibull, Lognormal, entre outras, para a modelagem de dados de precipitação pluvial. Pouco explorada na literatura, a distribuição EGE tem se mostrado eficiente em diversos campos de pesquisa como biologia, demografia, confiabilidade de produtos eletrônicos e pode ser aplicada para analisar fenômenos meteorológicos. Proposta por Adamidis e colaboradores em 2005, uma de suas particularidades é que sua função de risco pode ser crescente ou decrescente. Outra característica importante é a facilidade em se obter diferentes níveis de probabilidade, sem a necessidade de recorrer a métodos numéricos. Testou-se o ajustamento da distribuição EGE para a estimação da precipitação pluvial total mensal de Presidente Prudente-SP. Os resultados mostraram que houve um bom ajuste do modelo para os dados ao serem comparados com outros modelos como Gama, Weibull e Lognormal, de acordo com o critério de informação de Akaike, o teste Kolmogorov-Smirnov e o teste Qui-quadrado ao nivel de 5% de significância. A partir do ajustamento da distribuição EGE aos dados, os estimadores dos parâmetros da distribuição foram obtidos através do método de máxima verossimilhança permitindo assim a estimação da precipitação pluvial total mensal para diferentes níveis de probabilidade.

Palavras-chave: Distribuição Exponencial Geométrica Estendida, precipitação pluvial, máxima verossimilhança, níveis de probabilidade.

ABSTRACT

In this paper we propose to use the Extended Geometric Exponential distribution (EGE) as an alternative model to the commonly used distributions such as Gamma, Weibull, Lognormal among others, for modeling rainfall data. The distribution EGE has been little explored in the literature although it can be applied in many research fields such as biology, demography, and reliability of electronic products and can also be applied to analyze meteorological phenomenon. The EGE distribution has been proposed by Adamidis and collaborators in 2005 and one of its peculiarities is that the hazard function can be increasing or decreasing. Another important characteristic is the easiness to obtain different probability levels which do not demand numerical approaches. Several distributions such as Gamma, Weibull and Lognormal were used to fit the rainfall data measured at Presidente Prudente city. The results showed EGE being the best fit for the data according to the Akaike information criterion, the Kolmogorov-Smirnov test and the Chi-square test. The estimators of the EGE distribution parameters were obtained by the maximum likelihood approach and thus allowing the estimation of monthly rainfall for different probability levels.

Keywords: Extended Geometric Exponential Distribution, rainfall, maximum likelihood, probability levels.

1. INTRODUÇÃO

Dados climatológicos podem ser analisados mediante modelos teóricos de distribuições de probabilidade ajustados a uma série de dados. Na literatura encontram-se algumas distribuições probabilísticas que podem ser úteis, principalmente no estudo das precipitações pluviais, como a distribuição Gama (Morais et al, 2001; Murta, et al, 2005), Weibull (Wilks, 1989) e Lognormal (Das, 1956).

Kitidamrongusk (2010) mostra que a distribuição Exponencial Geométrica Estendida (EGE) proposta por Adamidis et al. (2005) é uma alternativa às distribuições Gama e Weibull muito utilizadas na literatura.

A distribuição Exponencial Geométrica Estendida tem apresentado grande importância em vários campos da pesquisa como biologia, demografia, confiabilidade de produtos eletrônicos e pode ser aplicada na análise estatística de fenômenos meteorológicos, entre os quais a precipitação pluviométrica.

Este artigo tem como objetivo testar o ajustamento da distribuição EGE estimando seus parâmetros baseado na teoria de máxima verossimilhança. Dessa forma, será possível estimar a precipitação pluviométrica total mensal, testar o modelo para previsão de novos valores em cada mês e estimar a precipitação mensal provável para diferentes níveis de probabilidade.

Empregando-se dados de precipitação pluvial total mensal, coletados ao longo dos anos de 1943 a 2003, para a região de Presidente Prudente-SP, estudou-se o ajuste das distribuições EGE, Gama, Weibull e Lognormal aos dados, aplicando-se os testes de ajustamento Kolmogorov-Smirnov e qui-quadrado ao nível de 5% de significância e utilizando também o critério de informação de Akaike.

Analisando-se os resultados obtidos, concluiu-se que a distribuição EGE foi a que melhor se ajustou aos dados, fornecendo estimativas de precipitações mensais prováveis mais confiáveis para a região de Presidente Prudente. Baseado nestes resultados a precipitação pluvial mensal foi estimada para os níveis de 1, 2.5, 5, 10, 50, 90, 95, 97.5 e 99%.

2. MATERIAL E MÉTODOS

Inicialmente, Adamidis e Loukas (1998) propuseram a distribuição exponencial geométrica com dois parâmetros, onde a função de risco é decrescente. Posteriormente, Adamidis et al. (2005) exploraram uma extensão da distribuição exponencial geométrica, denominando-a distribuição exponencial geométrica estendida. Uma de suas particularidades é que sua função de risco pode ser crescente ou decrescente, dependendo dos valores de seus parâmetros.

Dimitrakopolou et al. (2012) propuseram também diferentes distribuições bivariadas obtidas de distribuições marginais EGE. Erisoglu e Erol (2010) utilizaram misturas de EGE para modelar dados de sobrevivência heterogêneos.

Uma variável aleatória (v.a.) tem uma distribuição de probabilidade Exponencial Geométrica Estendida (EGE) com parâmetros λ e γ se sua função de densidade de probabilidade (f.d.p.) for dada por:

para todo x > 0, γ > 0 e λ > 0.

A Figura 1 apresenta algumas formas da função densidade de probabilidade para diferentes valores de λ e γ.


A distribuição acumulada da EGE na Equação 1 é dada por:

A média e variância da EGE são dadas respectivamente por:

onde:

para z < 1, a, s > 0 é conhecida como função transcendental de Lerch (Erdelyi et. al., 1953).

Observe que quando γ = 1, E(X) = 1/λ e para γ ≠ 1 tem-se:

Um método simples para gerar valores de uma distribuição EGE(γ, λ) é baseado no Teorema Fundamental da Transformação de Probabilidades. Dado uma v.a U com distribuição Uniforme no intervalo (0,1), então:

Em Adamidis et al. (2005) e Kitidamrongsuk (2010) são apresentadas várias propriedades da EGE como, por exemplo, coeficiente de variação, k-ésimo momento, função geradora de momentos, entre outras.

Dentre os métodos estatísticos de inferência, o método de máxima verossimilhança é um dos mais importantes e utilizados.

Seja X1, ..., Xn uma amostra aleatória da distribuição EGE dada na Equação 1, então a função de verossimilhança para os parâmetros λ e γ é dada por:

para γ > 0 e λ > 0.

O estimador de máxima-verossimilhança é obtido a partir dos seguintes passos. Da Equação 5 a função log-verossimilhança é dada por:

Estabelecendo e iguais a zero e após algumas manipulações algébricas obtêm-se as seguintes equações de verossimilhança:

cujas soluções fornecem os estimadores de máxima verossimilhança dos parâmetros γ e λ da distribuição EGE.

Uma vez que as Equações 7 e 8 não podem ser resolvidas analiticamente para e , então métodos numéricos devem ser utilizados, por exemplo, Método de Newton-Raphson (Ruggiero e Lopes, 1988).

Kitidamrongsuk (2010) mostra em detalhes o cálculo da matriz de informação de Fisher esperada I(γ, λ) da distribuição EGE, a qual é dada por:

com

onde é a função polylogaritma (Erdelyi et. al., 1953) e

A estimação com intervalos de confiança para os parâmetros do modelo pode ser obtida pela aproximação normal assintótica dos estimadores de máxima verossimilhança, isto é,

Pode-se também utilizar o modelo EGE para estimar a precipitação pluvial total mensal provável xp para diferentes níveis de probabilidade p, utilizando a equação:

Uma vantagem da distribuição EGE comparada à distribuição Gama (Lawless, 1982) é que se X ~ Gama (a, β), para encontrar xp é necessário resolver uma equação que envolve integral, dada por:

onde

Obviamente métodos numéricos como Newton-Raphson são necessários para encontrar xp. O gasto computacional é alto e as estimativas podem sofrer de erros de arredondamento. Para o modelo EGE, xp possui forma fechada e de fácil implementação, possibilitando calcular com facilidade e de forma precisa a precipitação pluvial total mensal provável.

O teste de Kolmogorov-Smirnov é um importante método estatístico para avaliação do ajustamento dos dados observados a uma distribuição de probabilidade.

O teste é baseado na estatística

onde Dn é o supremo da distancia. é a função acumulada empírica, q(i) é o número de pontos menores que xi e Ft(x) é a função acumulada teórica.

A hipótese de que X segue a distribuição f(x) é rejeitada se a estatística, Dn é maior que um valor crítico obtido de uma tabela disponível em (Smirnov, 1948), ou se o p-valor é menor que o nível de significância.

Uma grande vantagem deste teste de ajustamento (aderência) é que este pode ser utilizado para amostras muito pequenas. Outra particularidade demonstrada por Lilliefors (1967, 1969) é que o teste é mais poderoso do que o teste do Chi-quadrado (veja Snedecor e Cochran, 1989) para amostras pequenas.

Akaike (1974) propõe outro método para testar a adequabilidade do modelo, baseado na medida de Informação de Kullback-Leibler. Seja k o número de parâmetros a serem estimados o estimador de máxima verossimilhança de θ, então o critério de informação de Akaike (AIC) é obtido como:

Dado um conjunto de modelos candidatos para x, ajustados os dados, o preferido será o que fornecer o menor AIC. Além de selecionar um ótimo ajuste, o critério penaliza a adição de parâmetros, desencorajando overfitting, ou seja, a seleção de um modelo extremamente complexo e com muitos parâmetros que tenham um pobre desempenho preditivo.

Os dados pluviométricos utilizados no presente estudo foram fornecidos pela Estação Meteorológica da Faculdade de Ciências e Tecnologia da Universidade Estadual Paulista, campus de Presidente Prudente (SP), compreendendo um período de 61 anos, de janeiro de 1943 a dezembro de 2003. Estas observações referem-se às precipitações pluviais totais expressas em intervalos de tempo mensais, obtendo desse modo, 61 observações completas para cada mês analisado.

3. RESULTADOS E DISCUSSÃO

Para Presidente Prudente e região, a Tabela 1 mostra os resultados obtidos utilizando o Critério de Informação de Akaike, sendo os modelos candidatos as distribuições: EGE, Gama, Weibull e Lognormal.

Observa-se que através do AIC a distribuição EGE obteve melhor desempenho (menor AIC) em 5 meses (Janeiro, Abril, Maio, Setembro e Dezembro), mesmo resultado obtido pela distribuição Gama (Fevereiro, Março, Junho, Julho e Agosto). A distribuição Weibull obteve desempenho superior em apenas 2 meses (Outubro e Dezembro). Utilizando-se apenas este critério pode-se selecionar a distribuição EGE ou Gama para descrever as precipitações totais mensais.

Baseando-se em outros testes, a Tabela 2 mostra que a distribuição EGE apresentou melhor ajuste aos dados observados, ao nível de 5% de significância, através dos testes de Kolmogorov-Smirnov e do Qui-quadrado.

Utilizando o teste de Kolmogorov-Smirnov, o p-valor obtido para a distribuição EGE mostra que há um bom ajuste em quase todos os meses do ano, com exceção do mês de agosto (p-valor menor 0.05). A distribuição EGE ainda fornece um desempenho superior em 6 meses se comparado com os outros modelos, enquanto a distribuição Gama mostra-se melhor em 5 situações. Se a comparação for feita entre a EGE e a Gama, a distribuição EGE se mostra melhor em 7 meses. É importante salientar que em 7 meses os ajustes possuem um p-valor maior do que 0.95, mostrando ótimo ajuste das chuvas mensais de Presidente Prudente e região .

O teste Qui-quadrado acentua os resultados obtidos a partir do teste de Kolmogorov-Smirnov, mostrando que a distribuição EGE possui ajustes superiores aos outros modelos utilizados.

A Tabela 3 apresenta os estimadores de máxima-verossimilhança para os parâmetros da distribuição EGE, seus respectivos desvios-padrão e a precipitação pluvial esperada, para cada mês.

Observa-se na Figura 2 que as precipitações mensais apresentam histogramas característicos das distribuições EGE ajustadas, mostrando um bom ajuste destas aos dados observados.


Um dos métodos gráficos mais utilizados na verificação do ajustamento de uma determinada distribuição aos dados observados é o Quantil-Quantil Plot ou Q-Q plot. O procedimento empregado consiste na comparação gráfica dos quantis teóricos da distribuição EGE com os quantis dos dados amostrais, mostrando a linearidade entre os dados ajustados e os empíricos de forma que, quanto mais próximos os pontos da linha de referência, maior é a certeza de que os dados ajustados se comportam em relação à determinada distribuição.

A Figura 3 representa um Q-Q plot para a distribuição EGE ajustada. O gráfico mostra que a maioria dos pontos do Q-Q plot estão dispostos sensivelmente ao longo de uma reta, o que implica que o ajustamento da distribuição EGE à série estudada seja perfeitamente recomendável. Os meses que mostraram um menor alinhamento dos valores ajustados correspondem aos meses menos chuvosos Junho, Julho e Agosto.


Utilizando-se a distribuição EGE com as estimativas dos parâmetros e obtidos pelo método da máxima verossimilhança, dadas na Tabela 3, pode-se estimar a precipitação pluvial total mensal provável, em cada mês, utilizando-se a Equação 12.

A Tabela 4 mostra os níveis de retorno da precipitação pluvial total mensal provável para Presidente Prudente e região, para os níveis de 50, 75, 80, 85, 90, 95, 97.5 e 99% estimados pela distribuição EGE.

Estes níveis referem-se à probabilidade específica de ocorrência de uma precipitação mensal provável. Por exemplo, em Presidente Prudente, para o mês de janeiro, existe a chance de 50% de a precipitação acumulada ser igual ou superior a 199.69 mm, ou seja, espera-se que a cada dois anos ocorra pelo menos 199.69 mm no mês de janeiro.

4. CONCLUSÕES

Os resultados mostram que houve um ótimo ajuste da distribuição EGE para os dados de precipitação total mensal para a região de Presidente Prudente, tornando-se um importante modelo para se ajustar aos dados climatológicos, particularmente aos dados de precipitação pluviométrica total mensal.

A facilidade na obtenção do nível de retorno e os ótimos ajustes obtidos são vantagens do uso da EGE em relação as distribuições Gama, Weibull e Lognormal, podendo ser aplicada com sucesso em análises de fenômenos meteorológicos.

É importante ressaltar que o conhecimento dos períodos secos e chuvosos é de grande importância econômica e estratégica para o desenvolvimento regional, de forma que este trabalho possa servir como um guia para o planejamento dos recursos hídricos da região de Presidente Prudente.

5. REFERÊNCIAS

Recebido Março de 2013

Aceito Junho de 2014

  • AKAIKE, H. A new look at the statistical model identiďŹcation. IEEE Transactions on Automatic Control Boston, v. 19, n. 6, p. 716-723, 1974.
  • ADAMIDIS, K.; LOUKAS, S. A Lifetime Distribution with Decreasing Failure Rate. Statistics and Probability Letters, v.39, p.35-42, 1998.
  • ADAMIDIS, K.; DIMITRAKOPOULOU, T.; LOUKAS, S. On an Extension of the Exponential Geometric Distribution. Statistics and Probability Letters, v.73, p.259-269, 2005.
  • DAS, S. C. The Fitting of a Truncated Log-Normal Curve to Daily Rainfall Data, Australian Journal of Physics, v. 9, p.151 - 155, 1956.
  • DIMITRAKOPOULOU, T.; ADAMIDIS, K.; LOUKAS, S. Bivariate extended exponential-geometric distributions. Communications in Statistics, Theory Methods, v.41, p.1129-1150, 2012.
  • ERISOGLU, U.; EROL, H. Modeling Heterogeneous Survival Data Using Mixture of Extended Exponential-Geometric Distributions. Communications in Statistics, Simulation and Computation, v.39, p.1939 - 1952, 2010.
  • ERDELYI, A.; MAGUNS, W.; OBERHETTINGER, F.; TRICOMI, F.G. Higher Transcendental Functions New York: McGraw-Hill Book, 1953.
  • KITIDAMRONGSUK, P. Discriminating Between the Extended Exponential Geometric Distribution and the Gamma Distribution 104 f. Doctor of Philosophy (Statistics). National Institute of Development Administration, 2010.
  • LAWLESS, J.F. Statistical models and methods for life time data. New York: Wiley & Sons, 1982.
  • LILLIEFORS, H.W. On the Kolmogorov-Smirnov Test for Normality with Mean and Variance Unknown. Journal of the American Statistical Association v. 62, p. 399-402, 1967.
  • LILLIEFORS, H.W. On the Kolmogorov-Smirnov Test for the Exponential Distribution with Mean Unknown. Journal of the American Statistical Association v. 64, p. 387-389, 1969.
  • MORAIS, A.R.; BOTELHO, V.A.; CARVALHO, L.G.; MUNIZ, J.A.; LAGE, G. Estimativa da precipitação provável em Lavras (MG) através da distribuição gama. Revista Brasileira de Agrometeorologia, Santa Maria, v. 9, n. 2, p. 305-310, 2001.
  • MURTA, R.M.; TEODORO, S.M.; BONOMO, P.; CHAVES, J.D. Precipitação pluvial mensal em níveis de probabilidade pela distribuição Gama para duas localidades do sudoeste da Bahia. Ciência e Agrotecnologia, Lavras, v. 29, n. 5, p. 988-994, 2005.
  • RUGGIERO, M.; LOPES, V. Cálculo numérico - Aspectos Teóricos e Computacionais São Paulo, Mcgraw-Hill, 295p, 1988.
  • SMIRNOV, N.V. Table for Estimating the Goodness-of-Fit of Empirical Distributions. Annals of Mathematical Statistics v. 19, p. 279-281, 1948.
  • SNEDECOR, W.; COCHRAN, W. G. Statistical Methods, Eighth Edition, Iowa State University Press, 1989.
  • WILKS, D. S. Rainfall intensity, the weibull distribution, and estimation of daily surface runoff, Journal of Applied Meteorology, v. 28, p. 52 - 58, 1989.
  • A aplicação da distribuição exponencial geométrica estendida para modelagem de dados pluviométricos

    The extended geometric exponential distribution applied for modeling rainfall data
  • Datas de Publicação

    • Publicação nesta coleção
      24 Nov 2014
    • Data do Fascículo
      Dez 2014

    Histórico

    • Recebido
      Mar 2013
    • Aceito
      Jun 2014
    Sociedade Brasileira de Meteorologia Rua. Do México - Centro - Rio de Janeiro - RJ - Brasil, +55(83)981340757 - São Paulo - SP - Brazil
    E-mail: sbmet@sbmet.org.br