Acessibilidade / Reportar erro

Avaliação bayesiana da eficácia da manutenção via processo de renovação generalizado

Resumos

O Processo de Renovação Generalizado (PRG) é uma classe de modelos probabilísticos que trata ações de reparo de acordo com a redução que proporcionam na idade real de um equipamento/sistema. O PRG é uma extensão do Processo de Renovação e do Processo Não Homogêneo de Poisson e será utilizado para avaliar ações de reparo quanto a seu grau de eficácia. Considerando que os tempos entre falhas seguem uma distribuição Weibull, tal avaliação será realizada através da estimação da distribuição dos parâmetros do PRG e da análise de incerteza sobre o número esperado de falhas a partir de simulação Monte Carlo. Devido à escassez de dados de falha, o procedimento de inferência probabilística será executado a partir do paradigma Bayesiano o qual permite que outras fontes de informação, além dos dados de falha, sejam utilizadas na avaliação da distribuição de probabilidade sobre algum parâmetro de interesse.

processo de renovação generalizado; eficácia da manutenção; inferência Bayesiana


The Generalized Renewal Process (GRP) is a class of probabilistic models that handles repair actions according to the reduction they provide on the real age of an equipment/system. GRP is an extension of the Renewal Process and Non Homogeneous Poisson Process and it will be used to evaluate repair actions regarding their efficacy degree. Considering that the times between failures follow a Weibull distribution, such an evaluation will be accomplished through the estimation of the GRP parameter distributions and uncertainty analysis on the expected number of failures through Monte Carlo simulation. Due to paucity of failure data, the probabilistic inference procedure will be executed through the Bayesian paradigm which allows for the use of other sources of information, besides the failure data, in the process of estimating the probability distribution on some parameter of interest.

generalized renewal process; maintenance efficacy; Bayesian inference


Avaliação bayesiana da eficácia da manutenção via processo de renovação generalizado

Márcio das Chagas MouraI,* * Corresponding author / autor para quem as correspondências devem ser encaminhadas ; Sérgio Parente Vieira da RochaI; Enrique López DroguettI; Carlos Magno JacintoII

IDepartamento de Engenharia de Produção Universidade Federal de Pernambuco (UFPE) Recife – PE marciocmoura@gmail.com sergio.parente@gmail.com ealopez@ufpe.br

IIPetrobras (CENPES) Rio de Janeiro – RJ cmcj@petrobras.com.br

RESUMO

O Processo de Renovação Generalizado (PRG) é uma classe de modelos probabilísticos que trata ações de reparo de acordo com a redução que proporcionam na idade real de um equipamento/sistema. O PRG é uma extensão do Processo de Renovação e do Processo Não Homogêneo de Poisson e será utilizado para avaliar ações de reparo quanto a seu grau de eficácia. Considerando que os tempos entre falhas seguem uma distribuição Weibull, tal avaliação será realizada através da estimação da distribuição dos parâmetros do PRG e da análise de incerteza sobre o número esperado de falhas a partir de simulação Monte Carlo. Devido à escassez de dados de falha, o procedimento de inferência probabilística será executado a partir do paradigma Bayesiano o qual permite que outras fontes de informação, além dos dados de falha, sejam utilizadas na avaliação da distribuição de probabilidade sobre algum parâmetro de interesse.

Palavras-chave: processo de renovação generalizado; eficácia da manutenção; inferência Bayesiana.

ABSTRACT

The Generalized Renewal Process (GRP) is a class of probabilistic models that handles repair actions according to the reduction they provide on the real age of an equipment/system. GRP is an extension of the Renewal Process and Non Homogeneous Poisson Process and it will be used to evaluate repair actions regarding their efficacy degree. Considering that the times between failures follow a Weibull distribution, such an evaluation will be accomplished through the estimation of the GRP parameter distributions and uncertainty analysis on the expected number of failures through Monte Carlo simulation. Due to paucity of failure data, the probabilistic inference procedure will be executed through the Bayesian paradigm which allows for the use of other sources of information, besides the failure data, in the process of estimating the probability distribution on some parameter of interest.

Keywords: generalized renewal process; maintenance efficacy; Bayesian inference.

1. Introdução

Uma ação de reparo ou manutenção tem o objetivo de retornar, tão logo quanto possível, um equipamento, componente ou sistema a um estado em que o mesmo tenha condições de desempenhar sua função satisfatoriamente. Uma grande parte dos modelos probabilísticos de tratamento de ações de reparo utiliza hipóteses simplificadoras as quais, conservadoras ou não, não conseguem representar de forma fidedigna sistemas passíveis de reparo.

Dentre estes modelos probabilísticos, o Processo de Renovação (PR) e o Processo Não Homogêneo de Poisson (PNHP) são os mais comumente utilizados. O PR é um processo estocástico de contagem no qual os tempos entre falhas são variáveis aleatórias independentes e identicamente distribuídas (i.i.d.) por uma distribuição arbitrária não necessariamente exponencial. O PR é utilizado para sistemas os quais, após uma ação de reparo, retornam à operação com o mesmo desempenho que tinham quando novos. Tal tipo de reparo é conhecido como reparo perfeito. Já o PNHP assume que o reparo recupera o sistema falho a uma condição de desempenho que o mesmo possuía imediatamente antes da falha, o que é conhecido como reparo mínimo. O objetivo do reparo mínimo é apenas retornar o equipamento à operação e não melhorar seu desempenho. Esta é uma hipótese que em alguns casos não acontece na prática já que uma ação de reparo tem o intuito de melhorar o desempenho do sistema em relação ao que o mesmo possuía antes de falhar. Ross (1997) apresenta em maiores detalhes o PR, o PNHP e suas aplicações.

Geralmente, uma ação de reparo melhora o desempenho de um sistema falho a uma condição intermediária entre o reparo perfeito e o reparo mínimo, o que é denominado reparo geral ou imperfeito. De certa forma, o reparo imperfeito pode ser entendido como um tipo de reparo geral que possui como extremos os reparos perfeito e mínimo. Existe uma vasta literatura sobre aplicações e métodos probabilísticos de tratamento de ações de reparo imperfeito. Dohi et al. (2000), por exemplo, apresentam um método gráfico para determinação de políticas de manutenção baseadas na relação custo e número de reparos imperfeitos. Zhang & Love (2000) e Love et al. (2000) apresentam modelos para determinação de políticas ótimas de manutenção de sistemas que sofrem reparos imperfeitos através da utilização de processos Markovianos e semi Markovianos, respectivamente. Biswas & Sarkar (2000) empregam a técnica de transformadas de Fourier para avaliar a disponibilidade de um sistema que sofre vários reparos imperfeitos antes da realização de um reparo perfeito. Chukova et al. (2004) aplicam uma metodologia de modelagem de reparo imperfeito na análise de tempos de garantia e além das definições de reparo perfeito, mínimo e imperfeito apresentam outras classificações para uma ação de reparo, como o reparo melhor o qual retorna o equipamento a um estado de desempenho melhor do que possuía quando foi posto a funcionar pela primeira vez e o reparo pior que por sua vez piora o desempenho do sistema sob reparo. Doyen & Gaudoin (2004) apresentam classes de modelos em reparo imperfeito baseados na redução que ações de reparo proporcionam na idade real ou na intensidade de falha de um dado sistema. Pham & Wang (1996) apresentam uma vasta revisão da literatura que reúne cerca de quarenta métodos de tratamento de reparo imperfeito.

Resumidamente, o estado de desempenho de um sistema após sofrer uma ação de reparo pode ser categorizado da seguinte maneira:

i. Reparo Melhor – "melhor do que novo";

ii. Reparo Perfeito – "tão bom quanto novo";

iii. Reparo Imperfeito – "pior do que novo, mas melhor do que velho";

iv. Reparo Mínimo – "tão ruim quanto velho";

v. Reparo Pior – "pior do que velho".

A eficácia de uma ação de reparo pode ser entendida como o quão esta é capaz de recuperar um sistema falho, i.e., para qual estado de desempenho o sistema é conduzido após o reparo. Portanto, os estados de desempenho anteriormente citados estão em ordem decrescente em relação à eficácia do reparo.

Sem perda de generalidade, pode-se considerar que o nível de eficácia ideal é aquele que após o reparo, o equipamento funciona exatamente como se fosse novo, o que constitui um reparo perfeito. Porém, devido a limitações técnicas e econômicas isto muitas vezes não é possível. Geralmente, o tipo de reparo executado é imperfeito no sentido que não retorna o equipamento a uma condição de "tão bom quanto novo", mas melhora seu desempenho.

Porém, a maioria dos modelos probabilísticos utilizados para estimar o número esperado de falhas de um equipamento/sistema considera apenas a possibilidade de reparo perfeito ou mínimo, mas não trata apropriadamente os outros tipos de reparo, inclusive o reparo imperfeito.

Kijima & Sumita (1986) propuseram um modelo probabilístico que trata todos os tipos de ação de reparo citados, o qual foi denominado Processo de Renovação Generalizado (PRG). O PRG é um modelo que pertence à classe dos modelos chamados de virtual age model ou modelos baseados em idade virtual. Tais métodos classificam o reparo de acordo com o grau de redução que proporcionam sob a idade real do equipamento.

Assim como o reparo imperfeito pode ser considerado uma generalização dos reparos mínimo e perfeito, o PRG é uma generalização de outros modelos probabilísticos, como o PR e o PNHP, que são utilizados para tratar ações de reparo perfeito e mínimo, respectivamente. Além disso, o PRG permite tratar situações que excedem o conjunto de soluções compreendidas entre o PR e o PNHP, possibilitando representar também o "reparo melhor" e o "reparo pior".

Assumindo que os tempos entre falhas seguem uma distribuição arbitrária como a Weibull, por exemplo, vários modelos de estimação dos parâmetros do PRG foram desenvolvidos, grande parte dos quais baseados em estimadores de máxima verossimilhança (EMVs). Tais modelos exigem uma quantidade considerável de dados de falha os quais são muito difíceis se não impossíveis de serem obtidos, principalmente em sistemas altamente confiáveis.

A análise Bayesiana da confiabilidade surge como uma alternativa quando é escassa a experiência de falha sobre o sistema. Tal metodologia de inferência permite que outras fontes de informação de dados de falha, como a opinião de especialistas e/ou dados parcialmente relevantes, sejam utilizadas com o objetivo de se avaliar a distribuição de probabilidade sobre algum parâmetro de interesse, veja Droguett & Mosleh (2006) para maiores detalhes. Além disso, permite que atualizações do nível de conhecimento do especialista sejam executadas à medida que novas informações surgem.

Dentro desse contexto, será proposto aqui um modelo Bayesiano que permite a utilização de dados censurados, além de outras fontes de informação de falha, para estimação da distribuição de probabilidade dos parâmetros do PRG. Tal modelo proposto será utilizado para avaliar o grau de eficácia de uma equipe de manutenção responsável por um equipamento utilizado no sistema de controle de vazão de uma distribuidora de gás natural.

O presente artigo está organizado da seguinte maneira: na próxima seção, a idéia do Processo de Renovação Generalizado é introduzida. Na seção 3, é apresentado o modelo proposto para estimação da distribuição de probabilidade dos parâmetros do PRG utilizando a metodologia Bayesiana. Na seção 4, o modelo de inferência proposto é exemplificado através de uma situação real. Na seção 5, são apresentadas algumas conclusões sobre o trabalho.

2. Processo de Renovação Generalizado

Inicialmente, é necessário definir o conceito de idade virtual para o completo entendimento do PRG. As idades virtuais yi e xi correspondem, respectivamente, à idade calculada do equipamento antes e após a i-ésima ação de reparo. Enquanto que a idade real ti corresponde ao tempo cronológico também conhecido como tempo de processo. A Figura 1 apresenta a relação existente entre a idade real e as idades virtuais yi e xi, de acordo com a quantidade q, a qual é denominada de parâmetro de rejuvenescimento e será utilizada aqui para avaliar o grau de eficácia de uma ação de reparo.


A idade virtual xi representa a redução na idade real do sistema promovida pela i-ésima ação de reparo e está diretamente relacionada com o parâmetro q. Os valores assumidos por este parâmetro possibilitam a representação dos tipos de reparos citados na seção anterior o que pode ser feito da seguinte maneira:

• q = 0: corresponde a um reparo perfeito, já que a idade virtual xi é sempre anulada após a i-ésima ação de reparo;

• 0 < q < 1: corresponde a um reparo imperfeito, já que xi é uma fração da idade real ti ;

• q = 1: corresponde a um reparo mínimo, já que xi é exatamente igual à idade real ti .

Outros valores para o parâmetro q são também possíveis, como q < 0 e q > 1 que correspondem ao "reparo melhor" e ao "reparo pior", respectivamente. Porém, valores realísticos para o parâmetro q estão no intervalo entre 0 e 1, inclusive, uma vez que para q < 0 seria necessário assumir que ocorrem mudanças no projeto ou substituição de componentes por outros melhores do que eram quando novos, por exemplo. Além disso, q > 1 significa assumir que a manutenção age de forma contrária ao objetivo de retornar o equipamento a uma condição melhor do que estava antes de ser reparado.

Kijima & Sumita (1986) propuseram dois tipos de modelos de idade virtual (para outros modelos veja Guo et al. (2001)). O primeiro deles (equação (1)) é comumente chamado de modelo Kijima tipo I e consiste fundamentalmente na idéia que o reparo atua apenas nas falhas que ocorrem no intervalo de exposição imediatamente anterior ao reparo. Deste modo, sendo t1, t2, ... tempos sucessivos entre falhas, a idade virtual do sistema sofre incrementos proporcionais com o tempo:

onde hi é o tempo entre a ocorrência da (i-1)-ésima e a i-ésima falha.

Já o modelo Kijima tipo II (equação (2)) assume que o reparo atua com o objetivo de recuperar o sistema das falhas decorrentes de todos os intervalos anteriores de exposição desde o início da operação do sistema. Neste modelo, a idade virtual sofre incrementos proporcionais durante todo o intervalo de exposição acumulado:

Desta forma, o modelo Kijima Tipo I supõe que o i-ésimo reparo não pode remover todos os danos ocorridos até a i-ésima falha, somente reduzindo a idade adicional hi. Já o modelo Kijima Tipo II supõe que no i-ésimo reparo, a idade virtual esteve acumulada em xi-1 + hi. Assim, o i-ésimo reparo removerá os danos acumulados devido às falhas ocorridas durante o último intervalo de exposição assim como nos intervalos precedentes.

Jacopino et al. (2004) e Mettas & Zhao (2005) afirmam que a escolha do modelo Kijima tipo I ou tipo II está diretamente relacionada à abrangência de atuação do reparo. Desta forma, fazem as seguintes recomendações:

1. Para componentes individuais o modelo mais apropriado é o Kijima tipo I e

2. Para sistemas complexos o mais apropriado é o Kijima tipo II.

Para ilustrar a diferença entre tais modelos, a Figura 2 apresenta a relação entre a idade real e a idade virtual xi para valores distintos do parâmetro q.


Nota-se na Figura 2(a) que a diferença entre os modelos Kijima Tipo I e Tipo II é pouco perceptível para um baixo valor de q, o que representa uma alta eficácia da ação de reparo. Em outras palavras, o reparo é tão eficaz em sua atuação que pouco representaria a diferença entre um reparo localizado em um equipamento ou no sistema como um todo. Os tempos de idades virtuais para os dois modelos tornam-se mais discrepantes quando se diminui a eficácia, Figura 2(b). As idades virtuais voltam a se aproximar, quando o reparo torna-se muito ineficaz em suas ações, Figura 2(c), aproximando-se de um reparo mínimo. Neste caso, a ação de reparo não reflete melhorias em um equipamento nem de forma mais abrangente no sistema.

Independente do modelo Kijima utilizado, é possível avaliar o i-ésimo tempo ti de falha através da função de distribuição acumulada condicionada na idade virtual xi-1, como segue:

onde F(·) é a função de distribuição acumulada do tempo até a primeira falha.

Assumindo, por exemplo, que os tempos entre falhas são distribuídos segundo uma distribuição Weibull, a equação (3) pode ser escrita como segue nas equações (4) e (5):

onde n é o número de dados de falha coletados.

Neste caso, o problema de estimação dos parâmetros do PRG consiste na estimação dos parâmetros de escala a e de forma b da distribuição Weibull e do parâmetro de rejuvenescimento q. Alguns métodos numéricos de estimação de tais parâmetros foram desenvolvidos, particularmente para o modelo Kijima Tipo I, assumindo que o sistema reparável possui apenas um modo de falha e que se tem certeza sobre o tempo exato de ocorrência da falha (inspeção perfeita).

Dentre tais métodos de estimação dos parâmetros do PRG, pode-se citar o trabalho de Jack (1998) o qual desenvolve um método de estimação do parâmetro q para avaliação da eficácia da manutenção corretiva e preventiva. Para isso, utiliza EMVs assumindo que os tempos entre falhas seguem uma distribuição Weibull. Além disso, Jack (1998) incorpora tais parâmetros para avaliação do intervalo ótimo de atuação da manutenção preventiva.

Kaminskiy & Krivtov (1998) apresentam um método numérico de estimação dos parâmetros do PRG baseado em simulação Monte Carlo. Esta abordagem foi originalmente desenvolvida para o caso da indústria automobilística a qual comumente possui uma grande quantidade de dados observados de falha. A aplicação de tal método, entretanto, é inviável em contextos que possuem uma quantidade limitada de dados os quais são necessários para avaliação da distribuição do tempo até a ocorrência da primeira falha. Além disso, métodos baseados em simulação Monte Carlo possuem um alto custo computacional.

Yañes et al. (2002), percebendo as limitações do método numérico de estimação de Kaminskiy & Krivtov (1998), desenvolveram uma solução baseada em EMVs para os parâmetros do PRG. Neste trabalho, é provado que tais estimadores têm como casos especiais os estimadores dos parâmetros do PR e do PNHP. Yañes et al. (2002) reconhecem a dificuldade de utilizar tal método de estimação quando a quantia de dados completos de falha é limitada.

Moura & Droguett (2006) utilizam o método baseado em EMVs desenvolvido por Yañes et al. (2002) para avaliar o grau de eficácia de equipes de manutenção que executam suas atividades em uma fábrica de produção de componentes automotivos. Cada equipe tem o objetivo de recuperar um equipamento quando falho de forma a melhorar seu desempenho em relação ao que possuía imediatamente antes de falhar. Neste caso, existia uma quantia considerável de dados completos de falha o que tornou possível a utilização do método desenvolvido por Yañes et al. (2002).

No caso onde a quantidade de dados é bastante limitada ou com elevado grau de censura, a utilização de métodos baseados em EMVs torna-se inviável e é necessário o desenvolvimento de modelos Bayesianos para avaliação dos parâmetros do PRG. Tal metodologia permite a utilização de outras fontes de dados de falha, como a opinião de especialistas, na formulação de uma função de distribuição de probabilidade. Yañes et al. (2002) sugerem um método Bayesiano de estimação das distribuições de probabilidade dos parâmetros do PRG, porém não desenvolvem a formulação numérica referente à esta metodologia.

Neste sentido, Groen (2002) desenvolveu uma abordagem Bayesiana para estimação das distribuições de probabilidade dos parâmetros do PRG utilizando a metodologia Markov Chain Monte Carlo (MCMC), mais especificamente o algoritmo Metropolis-Hastings (veja Chib & Greenberg (1995)). Tal metodologia foi aplicada a um sistema reparável que possuía apenas um modo de falha e inspeção perfeita.

Jacopino (2005) resolveu o mesmo problema de Groen (2002) utilizando o também método da classe MCMC conhecido como Slice Sampling (veja Neal (2003) para maiores detalhes). Além disso, Jacopino (2005) estendeu o trabalho de Groen (2002) para os casos onde há incerteza sobre o tempo exato de ocorrência da falha, como por exemplo, no caso onde a falha ocorre entre dois intervalos de inspeção fixos (inspeção imperfeita) o que é conhecido como dados agrupados ou intervalares, veja Modarres et al. (1999). Jacopino (2005) também trata o caso de modos de falha múltiplos dependentes, como na Figura 3, na qual o reparo devido à ocorrência de um modo de falha interfere na ocorrência de outro, seja para incrementar ou reduzir a idade virtual.


Entretanto, tanto Groen (2002) quanto Jacopino (2005) não tratam do caso em que os dados de falha são compostos, em grande parte, por dados censurados. Portanto, o modelo Bayesiano proposto aqui e apresentado na próxima seção estende o trabalho desenvolvido por Groen (2002) e Jacopino (2005) no que diz respeito ao tratamento de dados censurados e será utilizado para estimar a distribuição dos parâmetros do PRG, inclusive a do parâmetro de rejuvenescimento q, o qual será utilizado para avaliar o grau de eficácia da manutenção em um caso real.

3. Modelo proposto para estimação da distribuição de probabilidade dos parâmetros do PRG via abordagem Bayesiana

Devido a limitações de tempo ou de custo, em geral, não se pode aguardar que sejam observados todos os eventos, no caso específico tempos entre falhas, para que se possa analisar a confiabilidade de um sistema. Uma opção é observar o sistema por períodos fixos de tempo. Assim, quando se tem certeza dos tempos de sobrevivência que ocorrem dentro deste período tais eventos serão chamados de completos. Quando não se tem certeza, os eventos de falha são denominados de agrupados ou intervalares. Do mesmo modo, os eventos que não se manifestarem são chamados de censurados.

Por exemplo, alguns pacientes ainda podem estar vivos ou livres de uma doença ao término do período de análise de um tratamento específico. Os tempos de sobrevivência exatos destes pacientes são desconhecidos e chamados de observações censuradas ou tempos censurados. Quando não há observações censuradas, diz-se que o conjunto de tempos de sobrevivência está completo, para maiores detalhes veja Lee & Wang (2003).

No caso do modelo proposto, as observações correspondem a intervalos consecutivos entre manutenções preventivas, as quais podem ocorrer em intervalos de tempo pré-determinados ou de acordo com a condição de desgaste do sistema. Segundo Sim & Endrenyi (1988), o objetivo da manutenção preventiva é eliminar ou pelo menos reduzir os danos decorridos pela deterioração acumulada enquanto o equipamento está satisfatoriamente operando. Já a manutenção corretiva atua apenas quando a falha é confirmada e tem o objetivo de recuperar o equipamento a um estado não falho.

Desta forma, a manutenção preventiva atua de forma a evitar a ocorrência do evento indesejável (falha) e quando este não for observado diz-se então que houve censura. Quando há ocorrência de falha, aciona-se a manutenção corretiva e o tempo de falha é registrado. Porém, por limitações tecnológicas ou de custo, não há como saber com exatidão o tempo de ocorrência do evento. Sendo assim, para simular esta condição, utiliza-se um procedimento de amostragem de um tempo t' no intervalo de exposição condicionado ao tempo de idade virtual xi-1. Desta forma, é proposto o seguinte esquema da Figura 4.


A Figura 4 descreve a relação entre a idade real, eixo das abscissas, e a idade virtual, eixo das ordenadas. No momento em que a falha ocorre, a idade virtual do equipamento sofre uma pausa, ou seja, é assumido não haver deterioração ou melhoria que possa influenciar no tempo de idade virtual até que ocorra um reparo capaz de retornar o sistema à operação.

Em cada inspeção em ti é verificado se ocorreu ou não a falha. Independente disso, o sistema sofrerá algum tipo de reparo e é assumido que este retorna o sistema a uma condição intermediária aos reparos perfeito e mínimo. A ilustração da Figura 4 é para um único modo de falha, contudo não há qualquer restrição para a análise de vários modos de falha.

A análise Bayesiana da confiabilidade surge como uma alternativa quando é escassa a experiência de falha sobre o sistema, como acontece, por exemplo, no caso da Figura 4. Tal metodologia permite que outras fontes de informação de dados de falha sejam aglutinadas com o objetivo de se avaliar a distribuição de probabilidade sobre algum parâmetro de interesse. Além disso, permite que atualizações do nível de conhecimento do especialista sejam executadas à medida que novas informações surgem. O problema de inferência Bayesiana será descrito na próxima seção a fim de avaliar a distribuição de probabilidade dos parâmetros do PRG, quando é grande a quantidade de dados censurados.

3.1 Inferência Bayesiana

A utilização da metodologia Bayesiana em confiabilidade permite ao analista usar informação de fontes alternativas de dados de falha, tais como handbooks e opiniões de especialistas na formulação de uma função de probabilidade para algum parâmetro de interesse. Para tal parâmetro, os resultados podem ser sistematicamente atualizados quando novas informações tornam-se disponíveis através do uso do Teorema de Bayes, o qual para variáveis aleatórias contínuas segue como:

onde q representa algum parâmetro de interesse, tal como o parâmetro q de rejuvenescimento do PRG, o qual é assumido possuir um comportamento probabilístico, uma vez que não se pode inferir de forma determinística acerca do modo como são executados os procedimentos de manutenção na prática.

A função p0(q) é a distribuição a priori em q representando a informação disponível ao analista acerca do parâmetro de interesse antes de observar a nova evidência E a qual convencionalmente está na forma de dados empíricos, como dados de falha de campo. Entretanto, outras fontes de informação também podem ser usadas como, por exemplo, dados censurados e/ou dados parcialmente relevantes. A função L(E|q) é conhecida como a função de verossimilhança e modela os dados evidenciados em E. A função p(q|E) é a distribuição a posteriori e constitui o estado de conhecimento do analista após a observação da evidência E. Veja Bernardo & Smith (1994) para maiores detalhes sobre conceitos básicos sobre inferência Bayesiana.

3.2 Função de verossimilhança

Qualquer procedimento de inferência estatística, seja tradicional ou Bayesiano, envolve o desenvolvimento de uma função de verossimilhança. A flexibilidade de tal função determina a flexibilidade do procedimento de inferência estatística em termos de sua aplicabilidade à coleta de diferentes tipos de dados de falha.

Assumindo que os tempos entre falhas seguem uma distribuição Weibull (resultados semelhantes podem ser desenvolvidos para outras distribuições, como Gamma ou Lognormal), a função de verossimilhança desenvolvida aqui e dada na equação (6) tem o objetivo de estender os trabalhos de Groen (2002) e Jacopino (2005) no que diz respeito à possibilidade de tratamento de dados censurados:

onde a, b e q são os parâmetros do PRG, ti é o instante de ocorrência do i-ésimo evento (dado de falha completo ou censurado), t0 = 0 e n é o número de eventos coletados.

A função ¦ (ti |·) segue como:

onde Pw(·) representa a probabilidade de ocorrer ou não uma falha no intervalo de tempo observado e ¦w(·) corresponde à densidade de probabilidade da distribuição Weibull e são dadas pelas equações (8) e (9), respectivamente:

A função de distribuição acumulada F(·) será determinada de acordo com a idade virtual xi-1 a qual é dependente da escolha apropriada do modelo Kijima tipo I ou tipo II. Logo,

, para i = 1 e

, para i = 2,...,n.

A equação (6) corresponde à probabilidade de se observar a evidência E dado que os parâmetros q = (a, b, q) sejam os reais parâmetros do modelo. Neste caso, a evidência E é composta por realizações do tempo de exposição hi = ti – ti-1 e o número observado de falhas ki dentro do i-ésimo intervalo de exposição.

Ao contrário dos modelos propostos por Groen (2002) e Jacopino (2005), aqui é permitido que o número observado de falhas ki seja nulo, o que corresponde a uma realização de tempo de falha censurado. Um algoritmo de avaliação da função de verossimilhança, dada pela equação (6), é desenvolvido em Rocha (2006) através de uma abordagem Monte Carlo.

3.3 Distribuição a priori

A distribuição a priori modela o conhecimento do especialista antes que novas evidências tornem-se disponíveis. Neste caso, tais evidências correspondem a realizações de tempos entre falhas (censurados ou não) e são modeladas pela função de verossimilhança.

Assumindo independência entre os parâmetros a, b e q do PRG, a distribuição que modelará o conhecimento a priori do especialista segue como:

onde

onde I é uma função que assume valor unitário dentro do intervalo especificado e nulo caso contrário.

A equação (11) é a distribuição imprópria definida a partir de uma distribuição lognormal modificada e ue s são seus parâmetros que correspondem à média e desvio padrão do parâmetro b, respectivamente. Como, neste caso, a distribuição a priori é paramétrica, o problema de estimação é reduzido a estimar os parâmetros u e s tal que cada par (u,s) especifica uma única função p0(b).

Geralmente, o processo de determinação dos parâmetros da distribuição a priori consiste na elicitação de opiniões de especialistas em relação a medidas de tendência central acerca dos parâmetros de interesse (e.g. u e s). Cooke (1991) e Ayyub (2001) apresentam alguns métodos de elicitação da opinião de especialistas no contexto da Engenharia de confiabilidade.

Diferentemente do parâmetro b, o parâmetro a pode assumir valores dentro de um intervalo grande, a depender do sistema em análise e principalmente dos tempos médios de ocorrência de falhas. A variação do parâmetro a tem o mesmo efeito na distribuição que uma mudança de escala na abscissa. Por esta razão, foi adotada uma distribuição imprópria uniforme dentro do espaço [0, ¥), dada pela equação (12).

A priori do parâmetro q (equação (13)), também é considerada uma distribuição uniforme no intervalo 0< q < 1 , com uma probabilidade a priori p(q) = 1. Observa-se que o intervalo exclui a possibilidade de um "reparo melhor" ou "reparo pior".

3.4 Avaliação da distribuição a posteriori

De acordo com o teorema de Bayes para variáveis aleatórias contínuas, a distribuição a posteriori para os parâmetros do PRG segue das equações (6) e (10) as quais representam a função de verossimilhança e a distribuição a priori, respectivamente. Para os conjuntos definidos de cada parâmetro a ÎA b Î B , q Î Q , tem-se que:

onde E representa a evidência na forma de dados de falha, sejam estes completos ou censurados.

A avaliação analítica da distribuição a posteriori dada pela equação (14) é intratável, já que a função de verossimilhança e a distribuição a priori não formam um par conjugado. Devido a este motivo, torna-se imperativo o uso de um dos métodos da classe Markov Chain Monte Carlo (MCMC) para avaliação da distribuição a posteriori dos parâmetros do PRG.

Um dos métodos MCMC mais conhecido e utilizado é o Gibbs Sampler, veja Gilks et al. (1998). Entretanto, tal método exige a distribuição de probabilidade condicional para gerar amostras da distribuição meta. O método MCMC que será utilizado aqui para avaliar a distribuição a posteriori é o Metropolis-Hastings (M-H). A idéia do M-H é bastante intuitiva e pode ser representada em forma de pseudocódigo da seguinte maneira:

- Repita para j = 1, 2,...,N;

• Amostre y de k(·|x(j)) e

de U[0, 1];

• Se
< g(x(j), y)

Faça

x

(j+1)

=

y

;

• Senão

Faça

x

(j+1)

=

x

(j)

;

- Retorne os valores {x(1),x(2),...,x(N)};

onde N é o número de amostras;

x e

y são variáveis aleatórias constituídas por uma combinação de valores dos parâmetros [a, b e

q] do PRG;

é uma variável aleatória uniformemente distribuída no intervalo entre 0 e 1, inclusive; k(·|·) é a distribuição candidata a qual amostra prováveis valores para a variável x; tais valores são distribuídos de acordo com a distribuição meta p(·) com probabilidade g(X,Y) dada pela equação (15) que representa a probabilidade de deslocamento do estado corrente X para o estado candidato Y. Para maiores detalhes sobre o algoritmo M-H e outros métodos da classe MCMC, veja Gilks

et al. (1998).

A distribuição candidata k(·|·) utilizada neste modelo foi inicialmente proposta em Groen (2002) e é caracterizada como um passeio aleatório de uma cadeia gerada a partir de um espaço transformado de parâmetros S' = x . y . z. Tal procedimento é apresentado com um maior detalhamento em anexoanexo.

A distribuição a posteriori não normalizada utilizada no algoritmo M-H é o produto entre a verossimilhança (equação (6)) e a distribuição a priori conjunta (equação (10)) dos parâmetros e é dada como segue:

p(X) = p(a, b, q) = (E | a, b, q ) · p0 (a, b, q).

O método MCMC descrito aqui será utilizado para amostrar estimativas dos parâmetros a, b e q do PRG. Após a execução do algoritmo, será possível avaliar a distribuição a posteriori de tais parâmetros de forma a atualizar o conhecimento do analista sobre os mesmos. Na próxima seção, será apresentado um exemplo de aplicação do modelo proposto quando a experiência de dados de falha é bastante limitada e formada principalmente por dados censurados.

4. Exemplo de aplicação

O equipamento em questão é uma válvula do tipo PCV (Pressure Control Valve), como na Figura 5. Trata-se de um equipamento que tem a função de manter sobre controle a pressão a jusante da linha de transporte de gás natural de uma Estação Redutora de Pressão de gás (ERP). Quando a pressão a jusante é menor do que a pressão requerida, a PCV abre para permitir um aumento do fluxo de gás natural. Ao contrário, se a pressão a jusante é maior do que a requerida, a PCV irá fechar.


Como visto na seção 2, a escolha do modelo apropriado para o PRG baseia-se no nível de atuação do reparo efetuado. Portanto, como o foco desta aplicação é apenas analisar o equipamento PCV e não o sistema ERP, o modelo Kijima tipo I é o modelo mais adequado à análise em questão.

4.1 Coleta de dados

Os dados foram coletados de acordo com a metodologia de desenvolvimento de banco de dados de confiabilidade apresentada em Nonato & Droguet (2003) e em Sivini (2006). Esta metodologia permitiu que se obtivesse um conjunto de informações orientadas ao desenvolvimento de aplicações em confiabilidade, como Modo de Falha (MF) observado, componente falho, tempo de exposição até a ocorrência da inspeção, tempo em manutenção, grau de severidade, descrição da falha, entre outras.

A Tabela 1 apresenta uma versão dos dados apresentados em Sivini (2006) para uma PCV que opera em uma ERP de um consumidor de grande porte situado na Região Metropolitana de Recife. Os dados foram coletados durante um período total aproximado de observação equivalente a dois anos e meio. Estes dados contêm informações sobre os tempos de exposição até o evento de manutenção preventiva (k = 0) e de manutenção corretiva (k = 1) decorrentes do MF Fechar Parcialmente, sendo que apenas três falhas foram observadas para o MF em questão.

Os tempos de manutenção foram considerados desprezíveis em relação ao tempo que o equipamento permanece operacional. No caso específico, o tempo de missão é equivalente ao tempo entre manutenções preventivas, que são previamente programadas para serem executadas a cada seis meses ou podem ocorrer de acordo com a condição de desgaste do sistema. Caso ocorra alguma falha, a manutenção corretiva será acionada e o tempo de falha do equipamento será registrado.

4.2 Análise de resultados

A forma preliminar de utilização de métodos Bayesianos corresponde à determinação das distribuições a priori sobre os parâmetros de interesse. Como visto na seção 3.3, a distribuição a priori para o parâmetro b é dada na equação (11). Neste caso, medidas de tendência central acerca dos parâmetros de interesse (u e s) foram elicitadas utilizando o procedimento descrito em Firmino et al. (2006). Deste modo, a distribuição a priori do parâmetro b tem a forma dada na Figura 6. Já os parâmetros a e q, como foi visto na seção 3.3, são uniformemente distribuídos.


Usando o algoritmo Metropolis-Hastings descrito na seção 3.4, uma seqüência de 100.000 amostras foi gerada para cada parâmetro do PRG (a, b e q). Permita que qseq = {q1,...,q100.000}seja tal seqüência e qi é o conjunto de parâmetros do PRG da i-ésima amostra. Uma amostra a posteriori i.i.d. pode ser criada selecionando um período de comprimento M de burn-in (queima) e de comprimento L de emagrecimento da cadeia de forma que:

qAmostra = {qjÎqseq | j = M + iL, i = 1,2,3...}.

Desta forma, o comprimento da amostra a posteriori resultante qAmostra é menor ou igual a 9.000, sendo gerada a partir da seqüência Metropolis Hastings qseq, usando M = 10.000 e L= 10. Os valores de M e L foram selecionados de acordo com o trabalho de análise de convergência desenvolvido por Brooks (1998). Desta forma, a amostra qAmostra resultante pode ser utilizada para inferência a posteriori sobre os parâmetros do PRG.

Na Figura 7 (lado esquerdo), são apresentadas as distribuições de probabilidade a posteriori para os parâmetros do PRG resultantes da simulação MCMC. Na mesma figura (lado direito), são apresentados os resultados que ilustram a seqüência qAmostra simulada para cada parâmetro a posteriori estimado.


Na Tabela 2, os valores médios e percentis de estimação dos parâmetros a posteriori são apresentados.

A estimativa da média do parâmetro de forma (b>1) indica que a PCV está sob um processo de deterioração, i.e., a força de mortalidade do tempo de falha (equação (16)) entre dois eventos consecutivos é crescente e côncava.

Note ainda que a estimativa a posteriori da média do parâmetro de rejuvenescimento q apresenta um valor = 0,644, o que corresponde a um reparo imperfeito. Entretanto, mesmo a equipe de manutenção sendo capaz de recuperar o equipamento considerado a uma condição melhor do que a de "tão ruim quanto velho", o mesmo sofre desgaste quando em operação (b>1) até a próxima ocorrência de manutenção preventiva ou corretiva.

A Figura 8 apresenta o número esperado de falhas N(t) acumulado no tempo para o MF Fechar Parcialmente para a média e percentis 5%, 50% e 95%. Tais percentis correspondem às probabilidades de 5%, 50% e 95%, respectivamente, do número de falhas ser inferior ao valor estimado.


Apesar de haver um intervalo relativamente acentuado entre os percentis de 5% e 95% para um horizonte de previsão de aproximadamente dois anos (o que se deve provavelmente à quantidade limitada de dados de falha, a qual eleva a incerteza da análise), os dados da Figura 8 podem ser utilizados para realizar predições dos custos incorridos por eventos de falha.

5. Conclusões

Neste artigo, foi proposto um modelo para avaliação do grau de eficácia da manutenção. Tal modelo é baseado na idéia dos Processos de Renovação Generalizados utilizando a abordagem Bayesiana, com dados censurados e inspeção imperfeita. Foi utilizada a simulação MCMC através do algoritmo Metropolis-Hastings para a estimação das distribuições de incerteza a posteriori dos parâmetros do modelo proposto. A eficácia foi avaliada em particular através da estimação da distribuição do parâmetro de rejuvenescimento q o qual pode ser entendido como a porcentagem de redução na idade real de um equipamento/sistema por efeito de uma ação de reparo. O modelo proposto foi ilustrado através de um exemplo de aplicação consistindo da avaliação do grau de eficácia da manutenção de uma válvula de controle de pressão em uma ERP.

O Processo de Renovação Generalizado possibilitou inferir sobre a eficácia do serviço prestado pela equipe de manutenção em um sistema reparável e avaliar o seu impacto sobre o número esperado de falhas do sistema. Com isso, é possível obter melhores previsões do comportamento do equipamento em termos de confiabilidade e avaliar os procedimentos de manutenção que busquem minimizar a ocorrência e o grau de severidade da falha.

A abordagem Bayesiana mostrou-se viável quando há poucos dados evidenciados de falha. De fato, no exemplo de aplicação discutido foram observadas apenas três falhas decorrentes do Modo de Falha Fechar Parcialmente. Além disso, a análise Bayesiana permitiu incorporar o conhecimento do especialista e atualizá-lo resultando em novas estimativas dos parâmetros do PRG.

O prosseguimento deste trabalho é incluir as predições de parâmetros que seguem o PRG para analisar sistemas reparáveis complexos com vários modos de falha. Para isso, sugere-se a utilização da abordagem de processos Markovianos não-homogêneos para avaliar o comportamento dinâmico do sistema no tempo e mensurar a sua disponibilidade média. Assim é possível avaliar a eficácia na manutenção para tipos de reparo decorrentes de modos de falha distintos.

Recebido em 01/2007; aceito em 07/2007

Received January 2007; accepted July 2007

O modelo de geração de amostras candidatas utilizado no algoritmo Metropolis Hastings segue como:

x=In(a · b),

y=In(b),

z=In(-In(q)).

Os pontos candidatos são gerados a partir da adição de desvios normalmente distribuídos:

x'= x + dx · N(0,1),

y'= y+ dy · N(0,1),

z'= z + dz · N(0,1).

Onde os valores das derivadas são assumidos constantes e são dados em Groen (2002) como:dx= 0,07;dy= 0,03 e dz= 0,1. Vale frisar que tais valores podem ser ajustados de acordo com a base de dados utilizada.

Após isso, a relação inversa pode ser aplicada a fim de se obter os parâmetros candidatos de interesse:

a' = exp(x'–y'),

b' = exp(y'),

q' = exp(–exp(z')).

O quociente da distribuição proposta presente na equação (15) é dado por

,

onde J(·) é a matriz Jacobiana.

Assumindo que a distribuição proposta é simétrica, equação (17),

e resolvendo a matriz Jacobiana, a distribuição candidata k(X|Y) pode ser descrita da seguinte forma:

  • (1) Ayyub, B.M. (2001). Elicitation of expert opinions for uncertainty and risks CRC Press, Florida.
  • (2) Bernardo, J.M. & Smith, A.F.M. (1994). Bayesian Theory John Wiley & Sons LTD., London, UK.
  • (3) Biswas, A. & Sarkar, J. (2000). Availability of a system maintained through several imperfect repairs before a replacement or a perfect repair. Statistics & Probability Letters, 50, 105-114.
  • (4) Brooks, S.P. (1998). Quantitative convergence assessment for Markov Chain Monte Carlo via cusums. Statist. Comput., 8, 226-227.
  • (5) Chib, S. & Greenberg, E. (1995). Understanding the Metropolis-Hastings Algorithm. The American Statistician, 49(4), 327-335.
  • (6) Chukova, S.; Arnold, R. & Wang, D.Q. (2004). Warranty analysis: An approach to modeling imperfect repairs. International Journal of Production Economics, 89, 54-68.
  • (7) Cooke, R.M. (1991). Experts in Uncertainty Oxford University Press, New York.
  • (8) Dohi, T.; Kaio, N. & Osaki, S. (2000). A Graphical Method to Repair-Cost Limit Replacement Policies with Imperfect Repair. Mathematical and Computer Modelling, 31, 99-106.
  • (9) Doyen, L. & Gaudoin, O. (2004). Classes of imperfect repair models based on reduction of failure intensity or virtual age. Reliability Engineering and System Safety, 84, 45-56.
  • (10) Droguett, E.L. & Mosleh, A. (2006). Análise Bayesiana da Confiabilidade de produtos em desenvolvimento. Revista Gestão & Produção, 13(1), 57-69.
  • (11) Firmino, P.R.A.; Menezes, R.D.C.S.; Droguett, E.L. & Duarte, D.L. (2006). Eliciting Engineering Judgments in Human Reliability Assessment. Annual Reliability and Maintainability Symposium, California-US, 512-519.
  • (12) Gilks, W.R.; Richardson, S. & Spiegelhalter, D.J. (1998). Markov Chain Monte Carlo in Practice Chapman & Hall/CRC, Florida, US.
  • (13) Groen, F. (2002). Bayesian Framework for General Renewal Process Modeling Report. University of Maryland, Maryland.
  • (14) Guo, R.; Ascher, H. & Love, E. (2001). Toward Practical and Synthetical Modelling of Repairable Systems. Economic Quality Control, 16(2), 147-182.
  • (15) Jack, N. (1998). Age-reduction models for imperfect maintenance. IMA Journal of Mathematics Applied in Business & Industry, 9, 347-354.
  • (16) Jacopino, A.; Groen, F. & Mosleh, A. (2004). Behavioural Study of the General Renewal Process. Annual Reliability and Maintainability Symposium, 237-242.
  • (17) Jacopino, A.G. (2005). Generalization and Bayesian Solution of the general renewal process for modeling the reliability effects of imperfect inspection and maintenance based on imprecise data. Ph.D. Thesis, Department of Mechanical Engineering, University of Maryland, Maryland, US.
  • (18) Kaminskiy, M.P. & Krivtov, V.V. (1998). A Monte Carlo Approach to Repairable System Reliability Analysis. Probabilistic Safety Assessment and Management, 1063-1068.
  • (19) Kijima, M. & Sumita, N. (1986). A useful generalization of renewal theory: counting process governed by non-negative Markovian increments. Journal of Applied Probability, 23, 71-88.
  • (20) Lee, E. & Wang, J.W. (2003). Statistical Methods for Survival Data Analysis Wiley, Oklahoma, US.
  • (21) Love, C.E.; Zhang, Z.G.; Zitron, M.A. & Guo, R. (2000). A discrete semi-Markov decision model to determine the optimal repair/replacement policy under general repairs. European journal of operational research, 125, 398-409.
  • (22) Mettas, A. & Zhao, W. (2005). Modeling and Analysis of Reliability of Repairable Systems with General Repair. Annual Reliability and Maintainability Symposium, Alexandria, VA, US, 176-182.
  • (23) Modarres, M.; Kaminskiy, M. & Krivtsov, V. (1999). Reliability Engineering and Risk Analysis Marcel Dekker, New York.
  • (24) Moura, M.C. & Droguett, E.L. (2006). Determinação do grau de eficácia de equipes de manutenção via Processo de Renovação Generalizado. XXVI Encontro Nacional de Engenharia de Produção, Fortaleza, CE, Brasil.
  • (25) Neal, R.M. (2003). Slice Sampling. The annals of Statistics, 31(3), 705-767.
  • (26) Nonato, A. & Droguet, E.L. (2003). Taxonomia de Banco de Dados de Confiabilidade para a Distribuição de Gás Natural. Anais do XXIII Encontro Nacional de Engenharia de Produção, Ouro Preto, MG, Brasil.
  • (27) Pham, H. & Wang, H. (1996). Imperfect maintenance. European Journal of Operational Research, 94, 425-438.
  • (28) Rocha, S.P.V. (2006). Um modelo integrado de inferência Bayesiana e processos Markovianos para análise de sistemas reparáveis sujeitos a reparo imperfeito via processo de renovação generalizado. Dissertação de Mestrado, Programa de Pósgraduação em Engenharia de Produção, Univ. Federal de Pernambuco, Recife, PE, Dezembro.
  • (29) Ross, S.M. (1997). Introduction to Probability Models Academic Press, Berkeley, California.
  • (30) Sim, S.H. & Endrenyi, J. (1988). Optimal preventive maintenance with repair. IEEE Transactions on Reliability, 37(1), 92-96.
  • (31) Sivini, A.L. (2006). Desenvolvimento de banco de dados de confiabilidade: uma aplicação em estações redutoras de pressão de gás natural. Dissertação de Mestrado, Programa de Pós-graduação em Engenharia de Produção, Universidade Federal de Pernambuco, Recife, PE.
  • (32) Yañes, M.; Joglar, F. & Modarres, M. (2002). Generalized renewal process for analysis of repairable systems with limited failure experience. Reliability Engineering & System Safety, 77, 167-180.
  • (33) Zhang, Z.G. & Love, C.E. (2000). A simple recursive Markov chain model to determine the optimal replacement policies under general repairs. Computers & Operations Research, 27, 321-333.

anexo

  • *
    Corresponding author / autor para quem as correspondências devem ser encaminhadas
  • Datas de Publicação

    • Publicação nesta coleção
      05 Mar 2008
    • Data do Fascículo
      2007

    Histórico

    • Recebido
      Jan 2007
    • Aceito
      Jul 2007
    Sociedade Brasileira de Pesquisa Operacional Rua Mayrink Veiga, 32 - sala 601 - Centro, 20090-050 Rio de Janeiro RJ - Brasil, Tel.: +55 21 2263-0499, Fax: +55 21 2263-0501 - Rio de Janeiro - RJ - Brazil
    E-mail: sobrapo@sobrapo.org.br