Acessibilidade / Reportar erro

Distribuição bivariada gama beta II: soma, produto e proporção das variáveis componentes

Resumos

Os modelos bivariados tem sido utilizados com sucesso na análise de processos hidrológicos. Neste trabalho, são deduzidas as distribuições exatas das variáveis U = X + Y, P = XY e Q = X/ (X + Y) juntamente com seus respectivos momentos quando seguem o modelo bivariado gama beta II. Essas funções descrevem importantes variáveis hidrológicas. Os resultados obtidos são aplicados em dados de precipitações pluviométricas ocorridas na cidade de Passo Fundo-RS.

Distribuição gama beta II; combinação de variáveis aleatórias; precipitação pluviométrica


Bivariate gamma distributions have been used successfully on modeling hydrological processes. In this work, supposing that X: and Y: follow the gamma beta II bivariate gamma model, we deduce the exact distributions of the functions U = X + Y P = XY: and Q = X/ (X + Y),: as well as their respective moments. Those functions describe important hidrological variables. An application of the results is provided to rainfall data from Passo Fundo - RS.

Gamma beta II distribution; combination of random variables; rainfall


IUFSJ - Universidade Federal de São João del-Rei, Campus de Sete Lagoas, CSL, Cx. P. 56, 35701-970 Sete Lagoas, MG, Brasil. anapaula@ufsj.edu.br

IIDEPEN - Departamento de Ensino, IFBA - Instituto Federal de Educação, Ciência e Tecnologia da Bahia, 45823-431 Eunápolis, BA, Brasil. jailsondearaujo@yahoo.com.br

IIIDEX - Departamento de Ciências Exatas, UFLA - Universidade Federal de Lavras, Cx.P. 3037, 37200-000 Lavras, MG, Brasil. lucas@dex.ufla.br

IVDEX - Departamento de Ciências Exatas, UFLA - Universidade Federal de Lavras, Cx.P. 3037, 37200-000 Lavras, MG, Brasil. devaniljaques@dex.ufla.br

RESUMO

Os modelos bivariados tem sido utilizados com sucesso na análise de processos hidrológicos. Neste trabalho, são deduzidas as distribuições exatas das variáveis U = X + Y, P = XY e Q = X/ (X + Y) juntamente com seus respectivos momentos quando seguem o modelo bivariado gama beta II. Essas funções descrevem importantes variáveis hidrológicas. Os resultados obtidos são aplicados em dados de precipitações pluviométricas ocorridas na cidade de Passo Fundo-RS.

Palavras-chave: Distribuição gama beta II, combinação de variáveis aleatórias, precipitação pluviométrica.

ABSTRACT

Bivariate gamma distributions have been used successfully on modeling hydrological processes. In this work, supposing that X: and Y: follow the gamma beta II bivariate gamma model, we deduce the exact distributions of the functions U = X + Y P = XY: and Q = X/ (X + Y),: as well as their respective moments. Those functions describe important hidrological variables. An application of the results is provided to rainfall data from Passo Fundo - RS.

Keywords: Gamma beta II distribution, combination of random variables, rainfall.

1. Introdução

Motivados pelo crescente uso principalmente na análise de dados não normais, vários modelos bivariados podem ser encontrados na literatura [2]. Os trabalhos desenvolvidos por fl] impulsionaram o uso da distribuição gama bivariada na análise de processos hidrológicos, sendo atualmente um dos mais utilizados. Por exemplo, [15] estuda a aplicabilidade da distribuição gama bivariada de Smith na análise de freqüência das variáveis hidrológicas duração e volume; [16] apresentam uma revisão de vários modelos gama, com diferentes parâmetros de escala e forma, apontando as vantagens e desvantagens de cada modelo no estudo de precipitação; [9] estudam o comportamento de dados de seca do Estado de Nebraska considerando a distribuição gama bivariada de Cherian e [10] realizam o mesmo estudo com a distribuição exponencial bivariada de Friday e Patil; [7] aplica um modelo bivariado gama exponencial na modelagem de dados de seca.

Considerando que X e Y se distribuem segundo um modelo bivariado, funções dessas variáveis aleatórias, expressas por U = X + Y, P = XY e Q = X/(X + Y), têm um significado físico importante de modo que diferentes autores têm trabalhado no sentido de caracterizar essas distribuições e aplicá-las em diferentes áreas do no sentido de caracterizar essas distribuições e aplicá-las em diferentes áreas do conhecimento, em particular em hidrologia [6, 11, 4, 8, 14. . Por exemplo, se X representa o período de chuva e Y o período contíguo sem ocorrência de chuva, U = X + Y denota o período climático e Q = X/(X + Y) a proporção de chuva. Neste contexto, o trabalho têm por objetivo apresentar a distribuição bivariada Gama Beta tipo II e deduzir a distribuição exata das variáveis U = X + Y, P = XY e Q = X/(X + Y) sob a pressuposição de que X e Y seguem esse modelo. Como aplicação é realizado o ajuste dessas distribuições a dados de precipitação pluviométrica do município de Passo Fundo, RS.

1.1. Distribuições beta

Distribuição beta tipo I: Uma variável aleatória X temdistribuição beta tipo I com parâmetros α > 0 e β > 0 quando sua função densidade de probabilidade (fdp) é da forma:

em que 0 < x < 1 e B (α, β) representa a função beta,

Simbolicamente, quando X possui função densdidade de probabilidade dada por (1.1), denotamos por X ~ BI(α, β), ou apenas, X ~ B(α, β).

Distribuição beta tipo II: Uma variável aleatória X tem distribuição beta tipo II com parâmetros α > 0,β > 0 e λ > 0 quando sua função densidade de probabilidade (fdp) é da forma:

em que x > 0. Quando X possui função densidade de probabilidade dada por (1.3), denotamos por X ~ BII(α, β)

As duas distribuições beta estão relacionadas intrinsecamente por meio de uma transformação. Várias características referentes aos dois modelos podem ser encontradas em [3, 5].

Além da função beta, os cálculos envolvidos no trabalho incluem o uso de outras funções especiais como a função gama,

a função ψ(·),

a função hipergeomêtrica confluente,

com 0 < a < b e b ≠ 0, -1, -2, ... e a função cilíndrica parabólica,

As propriedades dessas funções especiais podem ser vistas em [3, 12]. Serão ainda utilizados os importantes Lemas 1.1 e 1.2.

Lema 1.1. (Equação 2.3.6.1, [13]). Se a > 0,

Lema 1.2. (Equação 2.3.15.1, [13]). Se α > 0 e β> 0,

2. O modelo

A distribuição bivariada gama beta tipo II tem função densidade de probabilidade (fdp) conjunta dada por:

com x > 0, y > 0, a > 0, c > 0,0 < β < α e K é aconstante de normalização definida por

Esse modelo pertence à família gama bivariada de Arnould (ver [2]) e com essa parametrização ainda não foi abordado na literatura.

2.1. Funções Densidade de Probabilidade

Considerando que X e Y têm distribuição conjunta dada pelo modelo (2.1), as fdps marginais de X e Y são respectiviamente:

Portanto, X ~ G (α - β, a) e Y - BII (β, α - β, ª/c).

Nos Teoremas 2.1, 2.2 e 2.3 são deduzidas as fdps das variáveis U = X + Y, P = XY e Q = X/(X + Y) quando X e Y seguem o modelo (2.1). Inicialmente apresentamos a fdp conjunta das variáveis U e Q (ver equação 2.5) e a fdp conjunta das variáveis X e P (ver equação 2.7), que são úteis nas demonstrações desses teoremas.

Considere (U, Q) = (X + Y, X/(X + Y)), onde X e Y são variáveis aleatórias com função densidade de probabilidade conjunta dada pela equação (2.1). Então, o Jacobiano da transformação é dado por:

Assim, a fdp conjunta de (U, Q) = (X + Y, X/(X + Y)) é dada por

Considere agora (X, P) = (X, XY), onde X e Y são variáveis aleatórias com função densidade de probabilidade conjunta dada pela equação (2.1). Então, o Jacobiano da transformação é dado por:

Assim, a fdp conjunta de (X, P) é dada por

Teorema 2.1. Sejam X e Y variáveis aleatórias com função densidade de probabilidade conjunta dada pela equação (2.1) e U variável aleatória dada por U = X + Y. Se α > 2 e β > 2 são inteiros, então:

para θ > 1, em que u > 0 e θ = (α - cu)/(2cu).

Demonstração. Considere U e P variáveis aleatórias com função densidade de probabilidade conjunta dada pela equação (2.5). Para 0 < θ < 1 então a fdp de U é dada por:

Fazendo y = (w - θ)2 temos:

Aplicando o Lema (1.1) à integral acima, obtém-se:

O resultado para θ > 1 é obtido similarmente. □

Teorema 2.2. Sejam X e Y variáveis aleatórias com função densidade de probabilidade conjunta dada pela equação (2.1) e Q a variável aleatória dada por Q = XI (X + Y). Se α > 2 e β > 2 são inteiros, então:

em que 0 < q < 1

Demonstração. De (2,5) tem-se que a distribuição de Q é dada por:

O resultado segue da aplicação do Lema (1.2) à integral.

Teorema 2.3. Sejam X e Y variáveis aleatórias com função densidade de probabilidade conjunta dada pela equação (2.1) e P a variável aleatória dada por P = XY. Se α > 2 e β > 2 são inteiros, então:

em que p > 0.

Demonstração. Considere X e P variáveis aleatórias com função densidade de probabilidade conjunta dada pela equação (2.7). A fdp de P é dada por

2.2. Momentos

Nesta seção são deduzidos os momentos das variáveis U = X + Y e P = XY quando X e Y seguem o modelo gama beta II (ver equação 2.1). Inicialmente aprensentamos o Lema 2.1 o qual é muito útil nas demonstrações dos Teoremas 2.4 e 2.5.

Lema 2.1. Sejam X e Y variáveis aleatórias com função densidade de probabilidade conjunta dada pela equação (2.1). Então:

para os inteiros n > 1 e 1 < m < n.

Demonstração. Sob o modelo (2.1), tem-se que:

Em particular, para n = m = 1 obtém-se:

Teorema 2.4. Sejam X e Y varíáveis aleatórias com função densidade de probabilidade conjunta dada pela equação (2.1). Então:

para todo inteiro n > 1.

Demonstração. Temos que:

O resultado segue da aplicação do Lema (2.1).

Teorema 2.5. Sejam X e Y variáveis aleatórias com função densidade de probabilidade conjunta dada pela equação (2.1). Então:

para todo inteiro n > 1

Demonstração. Temos que: E [Pn] = E [(XY)n] = E [XnYn]. O resultado segue da aplicação do Lema (2.1) para m = n.

2.3. Estimação

Seja (x1;y1), (x2, y2),..., (xn, yn) uma amostra aleatória da variável aleatória (X, Y) a, c, α, β de verossimilhança é:

Aplicando a função logarítmica a ambos os lados da equação (2.9) obtém-se:

Assim,

em que ψ(·) denota a função psi dada pela equação (1.5).

Os estimadores de máima verossimilhança dos parâmetros a, c, α, são os valores na qual a função de verossimilhança é máxima, ou seja, é a solução do sistema de equações:

A solução do sistema de equações de máxima verossimilhança pode ser obtida numericamente através do software de computação algêbrica MAPLE (versão 16.02).

Como não é possível obter as propriedades exatas do estimador de máxima verossimilhança, um estudo computacional é apresentado. Para os dados utilizados na seção 3 seguinte, as estimativas de máxima verossimilhança para os parâmetros do modelo são:

(, , , ) = (0.8654, 0.1899, 3.3920, 1.2842)

Fixando-se três dessas estimativas, é possível simular o gráfico do erro quadrático médio (EQM) do estimador de máxima verossimilhança da seguinte forma: Suponha fixados os valores de

= 0.1899, = 3.3920 e = 1.2842, e permita que a varie no intervalo [0, 64905, 1.752436]. Tomam-se valores ai (i = 1, 2,...I) nesse intervalo e, para cada um desses valores, considera-se que o vetor dos parâmetros reais é (ai, , , )= (ai, 0.1899, 3.3920,1.2842). Substituindo na densidade (2.1), uma amostra de tamanho 101 é obtida. A partir desta, a solução do sistema das equações de máxima verossimilhança é obtido e o erro quadrático determinado. Esse procedimento, repetido 1000 vezes, permite a obtenção de uma estimativa para o erro quadrático médio. Com isto, é possível traçar o gráfico do erro quadrático médio como função do parâmetro a. Repetindo-se o processo para os outros parâmetros obtém-se gráficos representados pelas Figuras 1, 2, 3 e 4.

Figura 1:
(a, 0.1899, 3.3920, 1.2842)
Figura 2:
(0.8654,c, 3.3920, 1.2842)
Figura 3:
(0.8654, 0.1899,α, 1.2842)
Figura 4:
(0.8654, 0.1899, 3.3920,β)

Supondo os parâmetros reais dados por (, , , ) = (0.8654, 0.1899, 3.3920,1.2842) foram simuladas 100.000 amostras de tamanho 101 e, para cada amostra, calculadas as estimativas de máxima verossimilhança dos parâmetros, (, , , ). Com isso foi possível obter:

1. As esperanças de cada componente dos estimadores:

2. O erro quadrático médio:

3. A Variância das estimativas:

4. O Viés:

Observe que, como tem que ser, EQM = Var + Vies.

3. Aplicação

Nesta seção é feita uma aplicação do modelo na análise de dados de precipitações pluviométricas ocorridas na cidade de Passo Fundo, Estado do Rio Grande do Sul.

Os dados explorados correspondem a medições diárias de precipitação pluviométrica (mm) no período de Julho de 2009 a Julho de 2011, totalizando 730 observações. Os dados foram coletados pelo Laboratório de Meteorologia Aplicada à Agricultura da Embrapa Trigo, Passo Fundo - RS, (latitude: 28°15'46" S; longitude: 52°24'24" W; altitude: 684m) e encontram-se disponíveis livremente para download no endereço eletrônico http://www.cnpt.embrapa.br/pesquisa/agromet.

Utilizando as medições do índice pluviométrico, obtém-se os dados sobre período de dias com ocorrência de preciptações (X) e período contiguo de dias sem ocorrência de preciptações (Y). O objetivo é modelar as variáveis X, Y e o período climático U. O período climático indica um ciclo climático, formado pela soma dos dias sem chuva com os dias contíguos com chuva, essa quantidade também indica o retorno do período de chuva.

O ajuste das distribuições foi feito via Método da Máxima Verossimilhança. Se (xi, y1) ,..., (xn, yn) é uma amostra aleatória de (2.1), as estimativas dos parâmetros do modelo são: = 0.8654, = 0.1899, = 3.3920 e = 1.2842.

As fdps ajustadas de X, Y e U e os respectivos gráficos de probabilidades observadas versus probabilidades esperadas, são apresentadas nas Figuras de 5 a 10.


Figura 5: fdp ajustada de X


Figura 6: p-pplot para a variável X


Figura 7: fdp ajustada de Y


Figura 8: p-pplot para a variável Y


Figura 9: fdp ajustada de Y


Figura 10: p-pplot para a variável Y

Os gráficos das distribuições ajustadas e de probabilidade, Fig 10, sugerem um bom ajuste para as variáveis período de chuva (X), período sem ocorrência de chuva (Y) e período climático (U) que o modelo bivariado gama beta II apresenta-se como uma alternativa na análise de dados de precipitação pluviomêtrica.

4. Conclusões

XY deduzir as distribuições exatas e os momentos das variáveis aleatórias U = X + Y, P = XY Q = X/(X + Y) utilizando funções especiais. A estimação dos parâmetros do modelo pelo Método da Máxima Verossimilhança e suas propriedades, podem computadas utilizando métodos numéricos.

A aplicação do modelo na análise de dados de precipitações ocorridas na cidade de Passo Fundo do Estado do Rio Grande do Sul apresentou resultados satisfatórios, levando-se em consideração que os critérios gráficos de qualidade de ajuste indicaram uma boa adequação do modelo aos dados observados.

Recebido em 17 Agosto 2012

Aceito em 26 Marco 2013

  • [1] T. Izawa, Two or multi-dimensional gamma-type distribution and its application to rainnfall data, Meteorological Research Institute, 15 (1965), 167-200.
  • [2] N. Balakrifhnan, C.D. Lai, "Continuous bivariate distributions", Springer Vergland, 2009.
  • [3] R. Beals, R. Wong, "Special functions", Cambridge University, New York, 2010.
  • [4] A, K. Gupta, S. Nadarajah, Sums, products and ratios for Mckay's bivariate gamma distribution, Mathematical and Computer Modelling, 43 (2006), 185-193.
  • [5] M.V. Jambunathan, Some properties of beta and gamma distributions, The Annals of Math. Stat, 25 (1954), 401-405.
  • [6] S. Nadarajah, Products and ratios for a bivariate gamma distribution, Journal of the American Statistical Association Applied Mathematics and Computing, 24, No. 1 (2005), 581-595.
  • [7] S. Nadarajah, Bivariate gamma exponential distribution with application to drought data, Journal Applied Mathematical and Computer Modelling, 24, No. 1 (2007), 221-130.
  • [8] S. Nadarajah, Bivariate pareto model for drought, Stochastic Environmental Research and Risk Assessment, 23, No. 6 (2008), 811-822.
  • [9] S. Nadarajah, A.K. Gupta, Cherian's bivariate gamma distributioins as a model for drought data, Agrociencia, 40, No. 4 (2006), 483-490.
  • [10] S. Nadarajah, A.K. Gupta, Friday and Patil's bivariate exponential distribution! with application to drought data, Water Resource Management, 20, No. 5 (2006), 749-759.
  • [11] S. Nadarajah, S. Kotz, Sums, products and ratios for downton's bivariate exponential distribution, Stochastic Environmental Research and Risk Assessment, 20, No. 3 (2006), 164-170.
  • [12] K. Oldham, J. Myland, J. Spanier, "An atlas of functions: with equator, the atlas function calculator", Springer Vergland, Canadá, 2009.
  • [13] A.P. Prudnikov, O.I. Marichev, "Integrals and series", Gordon and Breach, Amsterdam, 1998.
  • [14] A.P.C.M. Silva, J.A. Rodrigues, L.M. Chaves, D.J. Souza, Sums, Products and Ratios for Crovelli's Bivariate Gamma Distribution, Water Resources Management, 27, No. 5 (2013), 1363-1376.
  • [15] S. Yue, A bivariate gamma distribution for use in multivariate flood frequency-analysis, Journal of Hydrology, 15, No. 6 (2001), 1033-1045.
  • [16] S. Yue, T.B.M.J. Ouarda, B. Bobee, A review of bivariate gamma distributions for hydrological application, Journal of Hydrology, 246, No.1 (2001), 1-18.
  • Distribuição bivariada gama beta II: soma, produto e proporção das variáveis componentes

    A.P.M. SilvaI; J.A. RodriguesII; L.M. ChavesIII; D.J. SouzaIII
  • Datas de Publicação

    • Publicação nesta coleção
      28 Maio 2013
    • Data do Fascículo
      Abr 2013

    Histórico

    • Recebido
      17 Ago 2012
    • Aceito
      26 Mar 2013
    Sociedade Brasileira de Matemática Aplicada e Computacional Rua Maestro João Seppe, nº. 900, 16º. andar - Sala 163 , 13561-120 São Carlos - SP, Tel. / Fax: (55 16) 3412-9752 - São Carlos - SP - Brazil
    E-mail: sbmac@sbmac.org.br