Acessibilidade / Reportar erro

A distribuição Gama Weibull Poisson aplicada a dados de sobrevivência

Resumos

A família de distribuições univariadas gama-generalizada proposta por Zografos e Balakrishnan [3] foi discutida por Nadarajah et al. [7] que deram um amplo tratamento matemático a esta classe. Neste artigo, estudamos o modelo Gama Weibull Poisson, que tem como casos especiais, várias distribuições discutidas na literatura. Deduzimos uma expressão explícita para a entropia de Rényi, e mostramos que a densidade da distribuição Gama Weibull Poisson é uma mistura de densidades da distribuição Weibull Poisson. Estudamos algumas propriedades matemáticas importantes como momentos, função geratriz de momentos e função quantílica.

Gama Weibull Poisson; máxima verossimilhança; taxa de risco


In this paper, we study the gamma Weibull Poisson distribution that has many special cases of distributions discussed in the literature. We study some important mathematical properties such as moments, moment generating and quantile functions. We obtain an explicit expression for Rényi entropy. Further, we write the probability density function of the GWP distribution as a linear combination of WP density functions.

Gamma Weibull Poisson distribution; maximum likelihood; hazard rate


A distribuição Gama Weibull Poisson aplicada a dados de sobrevivência

A. PercontiniI, * * Autor correspondente: Ana Carla Percontini. ; F.S. Gomes-SilvaI; M.W.A. RamosI; R. VenancioI; G.M. CordeiroII

IPPGMC, Universidade Federal de Pernambuco, 50740-530 Recife, PE, Brasil. E-mails: anappaixao@gmail.com; franksinatrags@gmail.com; wallace.ifpb@gmail.com; ronaldovenanciorvs@gmail.com

IIDepartamento de Estatística, Universidade Federal de Pernambuco, 50740-530 Recife, PE, Brasil. E-mail: gausscordeiro@gmail.com

RESUMO

A família de distribuições univariadas gama-generalizada proposta por Zografos e Balakrishnan [3] foi discutida por Nadarajah et al. [7] que deram um amplo tratamento matemático a esta classe. Neste artigo, estudamos o modelo Gama Weibull Poisson, que tem como casos especiais, várias distribuições discutidas na literatura. Deduzimos uma expressão explícita para a entropia de Rényi, e mostramos que a densidade da distribuição Gama Weibull Poisson é uma mistura de densidades da distribuição Weibull Poisson. Estudamos algumas propriedades matemáticas importantes como momentos, função geratriz de momentos e função quantílica.

Palavras-chave: Gama Weibull Poisson, máxima verossimilhança, taxa de risco.

ABSTRACT

In this paper, we study the gamma Weibull Poisson distribution that has many special cases of distributions discussed in the literature. We study some important mathematical properties such as moments, moment generating and quantile functions. We obtain an explicit expression for Rényi entropy. Further, we write the probability density function of the GWP distribution as a linear combination of WP density functions.

Keywords: Gamma Weibull Poisson distribution, maximum likelihood, hazard rate.

1 INTRODUÇÃO

Inicialmente o estudo da distribuição Weibull [9] lidou com resistência dos materiais e foi publicado em um jornal escandinavo. Posteriormente, um artigo publicado por Weibull [10] modelando conjuntos de dados de áreas diferentes mostrou a versatilidade do modelo em termos de suas aplicações a diferentes áreas. Um relatório da distribuição Weibull [11] lista mais de 1000 referências para suas aplicações e outra pesquisa indica que este número tem aumentado ao longo dos anos. A distribuição Weibull tem sido amplamente usada para analisar dados de tempo de vida. Ao modelar taxa de risco monótona, a distribuição Weibull é uma opção de escolha pois as formas de sua densidade são positivamente e negativamente assimétricas. Entretanto, ela não apresenta um ajuste paramétrico que se adeque para modelar fenômenos que têm taxa de risco não-monótona tais como, as que têm forma de "banheira" e as taxas de risco unimodais, muito usadas em estudos biológicos. Nos últimos anos, inúmeros modelos deduzidos ou de alguma forma relacionados com a distribuição Weibull têm sido propostos. Uma característica dessas novas distribuições é apresentar função de taxa de risco em forma de U, as quais são muito úteis em análise de sobrevivência.

Neste artigo, estudamos uma nova distribuição denominada Gama Weibull Poisson (GWP) que é a composição da distribuição Gama com a distribuição Weibull Poisson (WP) introduzida por Lu e Shi [8]. Esta distribuição também foi estudada por Morais e Barrato-Souza [1], como um caso especial da classe de distribuições Weibull Power Series (WPS).

Este artigo é organizado como segue. Na Seção 2, definimos o novo modelo e discutimos alguns de seus casos especiais. Na Seção 3, deduzimos algumas propriedades da GWP, tais como, a taxa de risco, expansão da densidade GWP como uma mistura de densidades WP, função de sobrevivência, momentos, função geratriz de momentos (fgm), função quantílica e entropia de Rényi. A estimação de máxima verossimilhança de um modelo paramétrico é descrita naSeção 4. Na Seção 5, fazemos uma aplicação do modelo GWP a um conjunto de dados reais. Conclusões e observações são dadas na Seção 6.

Neste artigo os resultados numéricos apresentados foram obtidos utilizando o ambiente de programação e análise de dados R1 1 http://www.r-project.org/ em sua versão 2.15.1, bem como, o Maple 142 2 http://www.maplesoft.com para os cálculos do n-ésimo momento e das derivadas da log-verossimilhança.

2 A DISTRIBUIÇÃO GAMA WEIBULL POISSON

Zografos e Balakrishnan [3] e Ristic e Balakrishnan [4] propuseram diferentes famílias de distribuições univariadas geradas a partir da distribuição gama. A família de Zografos e Balakrishnan [3], chamada Gama-G, é definida da seguinte forma, se G(x) é uma função de distribuição acumulada (fda) de uma variável aleatória contínua, então, a fda da função geradora gama de distribuições é dada por

em que a > 0 é um parâmetro de forma. Dessa forma, derivando a equação (2.1), obtém-se asua função densidade de probabilidade (fdp) expressa como

em que as funções Γ(a) = ta-1exp(-t)dt e γ(a,z) = ta-1exp(-t)dt denotam a função gama e a função gama incompleta inferior, respectivamente, e g(x) = dG(x)/dx. O parâmetro de forma a flexibiliza a distribuição a ser modificada e o suporte de f(x) é definido por g(x). A distribuição GWP segue a família Gama-G em que G é a fda da distribuição WP.

Sejam variáveis aleatórias independentes e indenticamente distribuídas tendo umafunção de densidade Weibull definida por

π(w;α, β) = αβwα-1 exp(-βwα), w > 0,

onde α > 0 é o parâmetro de forma e β > 0 o parâmetro de escala. Supomos que Z tem uma distribuição Poisson truncada com parâmetro λ > 0 e função de probabilidade de massa dada por

p(z,λ) = e-λλz Γ-1(z+1)(1-e-λ)-1, z = 1,2, ...

Seja XZ = min{W1, W2, ..., WZ}, em que a variável aleatória Z e os W's são supostos independentes. A distribuição Weibull Poisson para XZ tem função de densidade dada por

sendo . A expressão (2.3) é a equação (1), encontrada em Lu e Shi [8]. A fda correspondente a esta expressão é

Deduzimos uma expressão para a fdp da distribuição GWP inserindo (2.3) e (2.4) em (2.2). Logo,

em que c = , a > 0 e θ = (a,α,β,λ).

Se G(x) é a fda da distribuição WP, então a equação (2.1) fornece a fda da distribuição proposta GWP dada por

em que Γ(a,x) = ta-1e-tdt é a função gama incompleta superior.

A função de sobrevivência é definida como S(t) = 1 - F(t), e especifica a probabilidade de um certo elemento sobreviver pelo menos até o tempo t. Dessa forma, a função de sobrevivência de uma variável aleatória com distribuição GWP é dada por

A variável aleatória X que tem função de densidade (2.5) é denotada por X ~ GWP (a,α,β,λ), em que a, α > 0 são parâmetros de forma, β > 0 é o parâmetro de escala e λ > 0. Gráficos da equação (2.5) para algumas escolhas dos parâmetros são apresentados na Figura 1. Além disso, podemos verificar que a distribuição GWP possui vários submodelos bem conhecidos como casos especiais, descritos a seguir:


  • Para α = 1 e α = 2, a Equação (2.5) se reduz a Gama Exponencial Poisson (GEP) e Gama Rayleigh Poisson (GRP), respectivamente;

  • Fazendo λ → 0, obtemos na Equação (2.5) a distribuição GW. Adicionalmente, quando α = 1 e α = 2 obtemos as distribuições Gama Exponencial (GE) e Gama Rayleigh (GR), respectivamente;

  • Se a = 1, a Equação (2.5) se reduz a distribuição WP. Adicionalmente, se α = 1 e α = 2, obtemos as distribuições Exponencial Poisson (EP) e Rayleigh Poisson (RP), nesta ordem;

  • Obtemos a distribuição half-normal (HN) fazendo a = 3 e α = 2 em adição a λ→ 0;

  • Fazendo α = 2 na Equação (2.5), a distribuição log-normal (LN) é um caso limite especial quando a → ∞ e λ→ 0 ;

  • Se a = 1 e λ → 0, a Equação (2.5) se reduz a distribuição Weibull (W). Adicionalmente, fazendo α = 1 e α = 2, obtemos as distribuições Exponencial (E) e Rayleigh (R), respectivamente;

  • Se λ→ 0, β = 1/2 e a = n/2 obtemos a distribuição com n graus de liberdade;

  • Fazendo λ → 0, a = ν - 1, β = ϕ-1 e α = 1, a Equação (2.5) se reduz a distribuição Maxwell (M);

  • Se λ → 0 e α = 1, em que a = 0,1,2,..., obtemos a distribuição Erlang.

Estamos motivados em estudar o modelo GWP por causa da ampla utilização da distribuição Weibull. Adicionado a este fato, a generalização estudada neste artigo estabelece uma extensão da Weibull a situações ainda mais complexas. Um outro ponto positivo é que a distribuição WP constitui um exemplar básico da família proposta.

3 PROPRIEDADES DA DISTRIBUIÇÃO GWP

Nesta seção, apresentamos propriedades matemáticas da distribuição GWP: funções de risco, momentos, função geratriz de momentos, função quantílica, entropia de Rényi. Além disso,provamos que a densidade da GWP é uma mistura de densidades WP.

3.1 Função taxa de risco

A taxa de risco da distribuição GWP é dada por

Na Figura 2 temos as possíveis formas da taxa de risco da distibuição GWP. A função de risco é mais informativa do que a função de sobrevivência. Funções de sobrevivência podem ter formas semelhantes, enquanto as respectivas funções de risco podem diferir de maneira drástica. A GWP apresenta função de risco crescente, decrescente e na forma de banheira invertida ou unimodal.


3.2 Expansão da densidade

As Equações (2.5) e (2.6) podem ser expressas em termos de distribuições exponencializadas. Considere G(x) uma função de distribuição de uma variável aleatória X e g(x) a fdp associada. Se X segue uma distribuição G-exponencializada com parâmetro a, isto é, X ~ exp-G(a), então sua fdp e fda são dadas, respectivamente, por

e

As expansões para a fdp f(x) e fda F(x) da Gama-G são apresentadas em Nadarajah et al. [7] como

e

respectivamente, em que

A constante pj,k pode ser calculada recursivamente por

para k = 1,2,... com pj,0 = 1 e ck = (-1)k+1(k+1)-1.

Substituindo as expressões (2.3), (2.4) e (3.1) em (3.3), obtemos a densidade da distribuição GWP como uma mistura de densidades WP, expressa por

em que λk,i = λ*(a + k - i) e bk,i =

Usando a Equação (3.4), após algumas manipulações algébricas, a fda da distribuição GWPpode ser expressa como

3.3 Momentos da Distribuição GWP

De agora em diante, seja X ~ GWP(a,α, β,λ). Usando a Equação (3.6), podemos obter o n-ésimo momento de X como

em que g(x;α,β,λk,i) é a fdp da distribuição WP dada em (2.3). Portanto,

3.4 Função Geratriz de Momentos

A função geratriz de momentos, fgm, de X é dada por

em que E(Xn) é obtido em (3.7). Dessa forma temos que

em que

3.5 Função Quantílica

Nadarajah et al. [7], demonstraram que a função quantílica da distribuição Gama-G é escrita como

em que Q-1(a,u) é a função inversa de Q(a,x) = 1 - γ(a,x)/Γ(a,x).

A partir da função quantílica da distribuição WP encontrada em Lu e Shi [8], juntamente com a Equação (3.9), obtemos a função quantílica da distribuição GWP, como

A função Q-1(a,u) admite uma expansão em série de potência dada por

em que m0 = 0, m1 = 1 e qualquer coeficiente mi+1 para i > 1, é determinado pela equação de recorrência

em que Δ(i) = 0 se i < 2 e Δ(i) = 1 se i > 2.

3.6 Entropia de Rényi

A entropia de Rényi é uma medida de variação de incerteza que tem sido usada em aplicações e caracterizações de muitas distribuições de probabilidade. Nessa seção, deduzimos uma expressão para esta medida. Para a função de densidade f(x), a entropia de Rényi é definida por

em que φ > 0 e φ ≠ 1.

De acordo com Nadarajah et al. [7], a entropia da distribuição Gama-G é dada pela função

em que

Aplicando (2.3) e (2.4) em (3.10) temos que a entropia de Rényi da distribuição GWP pode ser escrita como

em que

4 LOG-VEROSSIMILHANÇA

Nesta seção examinamos a estimativa de máxima verossimilhança (EMV) de θ para a distribuição GWP. Sejam X1,X2,..., Xn uma amostra aleatória de X com valores observados x1,x2,..., xn e seja θ = (a,α,β,λ)T o vetor dos parâmetros do modelo. A função de log-verossimilhança para θ reduz-se a

e, então,

O sistema de equações anterior não admite forma fechada sendo necessário métodos numéricos para resolvê-lo. As estimativas dos parâmetros são obtidas através da maximização numérica do logaritmo da função de verossimilhança por meio do algoritmo de otimização não linear quasi-Newton conhecido como BFGS.

O teste da razão de verossimilhanças (RV) pode ser usado para comparar o modelo GWP com seus submodelos. Podemos calcular os valores de máximo da log-verossimilhança restrita eirrestrita para construir a estatística da RV para testar submodelos da distribuição GWP. Por exemplo, o teste H0 : a = 1 versus H1 : H0não é verdade, é equivalente a comparar as distribuições GWP e WP. A estatística da RV é definida como

em que são as EMVs sob H1 e são as estimativas sob H0. Rejeita-se a hipótese nula quando w > (1), que é o quantil (1 - γ) da distribuição qui-quadrado com um grau de liberdade.

5 APLICAÇÃO

Ao longo desta seção vamos ajustar os modelos de distribuição GWP, WP e W a um conjunto de dados reais. Os dados de manutenção que seguem, representam 46 observações do tempo ativo de reparo, em horas, de um transceptor de comunicação aéreo encontrados em [12], [6], [8] e [2]: 0,2; 0,3; 0,5; 0,5; 0,5; 0,5; 0,6; 0,6; 0,7; 0,7; 0,7; 0,8; 0,8; 1,0; 1,0; 1,0; 1,0; 1,1; 1,3; 1,5; 1,5; 1,5; 1,5; 2,0; 2,0; 2,2; 2,5; 2,7; 3,0; 3,0; 3,3; 3,3; 4,0; 4,0; 4,5; 4,7; 5,0; 5,4; 5,4; 7,0; 7,5; 8,8; 9,0; 10,3; 22,0 e 24,5.

A Tabela 1 lista as estimativas de máxima verossimilhança e seus correspondentes erros-padrão dos modelos paramétricos. Os critérios da informação de Akaike (AIC), Bayesiano (BIC) e Akaike Corrigido (CAIC) são utilizados para a seleção dos modelos. Ajustamos a distribuição Beta Weibull Poisson (BWP), recentemente introduzida por Percontini et al. [2], para fazer uma comparação com o modelo GWP. A BWP é um modelo da família de distribuições beta-G [5], competitivo ao nosso, possuindo cinco parâmetros, cuja fdp é dada por

f(x) = c xα - 1u eλu(eλ - eλu)p(eλu - 1)q - 1(eλu - eλ)-1,

em que

são parâmetros de forma adicionais e B(p,q) = é a função beta. Os resultados indicam que o modelo GWP apresenta os menores valores das estatísticas AIC, BIC e CAIC, sugerindo que ele tem um melhor ajuste para este conjunto de dados dentre os modelos ajustados.

A estatística RV para testar a hípótese nula H0: WP contra a hipótese alternativa H1: GWP é 6,7954 (p-valor = 9,13×10-3). Portanto, para qualquer nível de significância usual, rejeitamos a hipótese nula em favor da distribuição GWP. Os gráficos das densidades dos modelos ajustados são dados na Figura 3.


6 CONCLUSÃO

A distribuição GWP é flexível na análise dos dados comparativamente a outros modelos de sobrevivência. A sua função densidade de probabilidade pode ser expressa como uma mistura de densidades Weibull Poisson. Apresentamos um tratamento matemático da distribuição obtendo expansões da função de densidade, função acumulada, função geratriz de momentos, função quantílica e entropia de Rényi. A estimação dos parâmetros do modelo é realizada por máxima verossimilhança. Uma aplicação a dados reais revela que a distribuição GWP pode fornecer um melhor modelo de sobrevivência que os modelos W, WP e BWP.

Recebido em 16 outubro, 2012

Aceito em 14 junho, 2014

  • [1] A. Morais & W. Barrato-Souza. A compound class of Weibull and power series distribution. Comput. Statist. Data Anal., 55 (2011), 1410-1425.
  • [2] A. Percontini, B. Blas & G. M. Cordeiro. The beta Weibull Poisson distribution. Chilean Journal of Statistics, 4 (2013), 3-26.
  • [3] K. Zografos & N. Balakrishnan. On families of beta and generalized gamma-generated distributions and associated inference. Statistical Methodology, 6 (2009), 344-362.
  • [4] M. Ristic & N. Balakrishnan. The gamma exponentiated exponential distribution. Journal of Statistical Computation an Simulation, 82 (2012), 1191-1206.
  • [5] N. Eugene, C. Lee & F. Famoye. Beta-normal distribution and its applications. Communication in Statistics - Theory and Methods, 31 (2002), 497-512.
  • [6] R.S. Chhikara & J.L. Folks. The inverse Gaussian distribution as a lifetime model. Technometrics, 19 (1977), 461-468.
  • [7] S. Nadarajah, G.M. Cordeiro & E.M. Ortega. The gamma-G family of distributions: Mathematical properties and applications. Submetido
  • [8] W. Lu & D. Shi. A new compounding life distribution: the Weibull-Poisson distribution. J. of Appl. Statist., 39 (2012), 21-38.
  • [9] W. Weibull. A statistical theory of the strenght of material. Ingeniors Vetenskapa Acadamiens Handligar, 151 (1939), 1-45.
  • [10] W. Weibull. A statistical distribution function of wide applicability. Journal of Applied Mechanics, 18 (1951), 293-296.
  • [11] W. Weibull. References on Weibull Distribution. Stockholm: FTL A Report, Forsvarets Teletekniska Laboratorium, (1977), 293-296.
  • [12] W. Alven. "Reliability Engineering by ARINC", Prentice-Hall, Inc., Englewood Cliffs, New Jersey, 1964.
  • *
    Autor correspondente: Ana Carla Percontini.
  • 1
  • 2
  • Datas de Publicação

    • Publicação nesta coleção
      10 Set 2014
    • Data do Fascículo
      Ago 2014

    Histórico

    • Recebido
      16 Out 2012
    • Aceito
      14 Jun 2014
    Sociedade Brasileira de Matemática Aplicada e Computacional Rua Maestro João Seppe, nº. 900, 16º. andar - Sala 163 , 13561-120 São Carlos - SP, Tel. / Fax: (55 16) 3412-9752 - São Carlos - SP - Brazil
    E-mail: sbmac@sbmac.org.br