Acessibilidade / Reportar erro

Gerenciamento de doenças utilizando séries temporais com o modelo ARIMA

Resumos

A avaliação do gerenciamento de doenças infecciosas e não infecciosas pode ser realizada por meio da análise de séries temporais. Com isso, espera-se que sejam medidos os resultados e previstos os efeitos da intervenção sobre a doença. Os estudos clínicos têm se beneficiado do uso dessas técnicas, visto a grande aplicabilidade do modelo ARIMA. Esse texto apresenta de maneira resumida o processo de uso do modelo ARIMA. O uso dessa ferramenta analítica oferece grande contribuição para os investigadores e gestores de saúde na avaliação das intervenções de saúde em dadas populações.

Estudos de séries temporais; Gerenciamento clínico; Administração de serviços de saúde; Estudos de intervenção


The evaluation of infectious and noninfectious disease management can be done through the use of a time series analysis. In this study, we expect to measure the results and prevent intervention effects on the disease. Clinical studies have benefited from the use of these techniques, particularly for the wide applicability of the ARIMA model. This study briefly presents the process of using the ARIMA model. This analytical tool offers a great contribution for researchers and healthcare managers in the evaluation of healthcare interventions in specific populations.

Time series studies; Disease management; Health services administration; Intervention studies


REVENDO CIÊNCIAS BÁSICAS

Gerenciamento de doenças utilizando séries temporais com o modelo ARIMA

Renato Cesar Sato

Universidade Federal de São Paulo, São José dos Campos, SP, Brasil

Autor correspondente Autor correspondente: Renato Cesar Sato Rua Talim, 330 – Vila Nair CEP: 12231-280 – São José dos Campos, SP, Brasil Tel.: (12) 3921-9598 E-mail: rcsato@ipen.br

RESUMO

A avaliação do gerenciamento de doenças infecciosas e não infecciosas pode ser realizada por meio da análise de séries temporais. Com isso, espera-se que sejam medidos os resultados e previstos os efeitos da intervenção sobre a doença. Os estudos clínicos têm se beneficiado do uso dessas técnicas, visto a grande aplicabilidade do modelo ARIMA. Esse texto apresenta de maneira resumida o processo de uso do modelo ARIMA. O uso dessa ferramenta analítica oferece grande contribuição para os investigadores e gestores de saúde na avaliação das intervenções de saúde em dadas populações.

Descritores: Estudos de séries temporais; Gerenciamento clínico/tendências; Administração de serviços de saúde; Estudos de intervenção

INTRODUÇÃO

O gerenciamento das doenças diz respeito à capacidade de demonstrar uma economia nos custos das doenças em detrimento de uma intervenção numa população específica. A inexistência de um grupo controle pode levar a uma série de enviesamentos e dificuldades práticas desse tipo de experimento(1). A abordagem por meio das séries temporais fornece uma alternativa na avaliação dos programas de gerenciamento de doenças. Nas análises de séries temporais, a variável observada depende de seu período anterior, apresentando, então, uma dependência serial. Essa característica contribui para o investigador identificar, explicar e prever efeitos dos programas de gerenciamento em execução ao longo do tempo. Dependendo do programa, a inclusão dos pacientes pode não ser imediata, variando a cada caso. Assim, um programa que inclua os participantes em torno de 3 a 6 meses pode perceber os primeiros resultados somente vários meses ou anos depois(2).

Diante da importância do fator "tempo" para os estudos de gerenciamento da doença, esta revisão apresenta uma análise do modelo autoregressive integrated moving average (ARIMA). Esse é o modelo mais utilizado nas pesquisas de séries temporais em saúde(3-6). O uso dos modelos de séries temporais possui maior capacidade de previsão e amplitude de uso do que as técnicas não temporais(7). A difusão do uso dos bancos de dados e a inclusão de dados, por exemplo, por meio de prontuários eletrônicos criam um ambiente propício para essa metodologia.

Alguns exemplos da utilização do modelo ARIMA incluem a previsão no número de leitos ocupados durante a crise da severe acute respiratory syndrome (SARS) em um hospital de Cingapura. As estimativas do modelo permitiram realizar previsões de 3 dias para o número de leitos necessários durante a epidemia. Tal estudo apresenta também comentários sobre a viabilidade do uso do modelo ARIMA no planejamento de leitos e outros recursos críticos durante epidemias de doenças infecciosas(8). Outro estudo sugere a adequação do modelo para previsão baseada em dados históricos nos casos de febre hemorrágica com síndrome renal na China. Atualmente, esse país conta com 90% dos casos reportados globalmente e o uso dos modelos ARIMA permite um melhor gerenciamento da doença e previsão de curto prazo(9). A utilização do modelo ARIMA também é utilizado como ferramenta eficiente na estimação do planejamento de recursos como leitos e equipe de pessoas no setor de emergência(10,11). Outra aplicabilidade encontrada nos modelos do tipo ARIMA são a previsão e os estudos de resistência antimicrobiana(12-14).

MODELOS ARIMA

O modelo ARIMA foi desenvolvido nos anos 1970 por George Box e Gwilym Jenkins na tentativa de descrever as mudanças na série temporal, utilizando uma abordagem matemática. Em certos casos, o nome ARIMA e Box-Jenkins são utilizados como sinônimos. O modelo se baseia no ajuste dos valores observados, visando reduzir para próximo de zero a diferença dos valores produzidos no modelo e os valores observados. Esse modelo possui a possibilidade de descrever o comportamento das séries estacionárias e não estacionárias, conferindo versatilidade para uma variedade de situações. Uma série é estacionária quando sua média e variância são constantes ao longo do tempo e quando o valor da covariância depende apenas da defasagem entre dois períodos de tempo. No caso das séries não estacionárias, ocorrem os choques aleatórios. Um tipo de série não estacionária é o modelo de passeio aleatório, em que com o deslocamento da média e a variância aumentam, violando a condição de estacionariedade da série. No caso da avaliação dos programas de saúde, os interesses são as séries estacionárias(2). Algumas importantes observações na criação de um modelo explicativo é a necessidade de, pelo menos, 50 observações. Para os programas de gerenciamento das doenças, são necessários pelos menos 4 anos de dados até o mês inicial da intervenção. Com isso o modelo é capaz de acomodar eventuais padrões que podem interferir no ajuste dos parâmetros(2).

A figura 1 mostra um diagrama esquemático do processo de estimação do modelo ARIMA.


Existe uma grande variedade de modelos ARIMA; sua forma mais geral do modelo não sazonal é o ARIMA (p,d,q), sendo AR: (p=grau da parte autoregressiva); I:(d=grau da primeira diferença envolvida) e MA: (q=grau da parte de média móvel).

O uso da metodologia Box-Jenkins (modelo ARIMA) pode ser realizado em três fases(15): Identificação, Estimação e Teste, Aplicação. A seguir, são descritos detalhes que devem ser observados em cada fase do processo.

Fase de identificação

A função de autocorrelação (autocorrelation function –ACF) é a ferramenta padrão utilizada durante a exploração da série temporal. Seu uso promove a identificação de sazonalidade, ciclos e demais padrões na série. O ACF permite também identificar o quanto a informação do período anterior está relacionada com a observação seguinte(15).

Uma série estacionária possui ruído branco quando os erros são uma sequência de variáveis aleatórias não correlacionadas. Entende-se por "ruído branco" nos erros a inexistência de padrões, sendo o equivalente a dizer que os erros não são correlacionados. A função de autocorrelação parcial (partial autocorrelation function – PACF) é utilizada para medir o grau de associação entre uma observação ( ) e, digamos, a observação feita dois períodos anteriores ( ) removendo o período intermediário ( )(15). A PACF permite avaliar o grau de correção da variável atual com seus valores anteriores enquanto mantêm-se os demais valores constantes.

Representação gráfica dos dados

Nessa primeira etapa, realiza-se a identificação de dados discrepantes ou pouco usuais na série. Pode ser necessária também a transformação dos dados para estabilizar a variância atingindo a estacionariedade.

Considere se os dados estão estacionários ao longo do tempo e o ACF e PACF. Se o diagrama temporal mostrar que os dados estão dispersos horizontalmente ao redor de uma média constante, os valores de ACF e PACF caem rapidamente para próximo de zero. Caso isso não seja observado, a não estacionariedade ainda existe.

A não estacionariedade pode ser resolvida pela diferenciação. Nesse ponto, deve ser avaliado se os dados são sazonais ou não. No caso dos dados sazonais, deve-se obter a primeira diferença nos dados. No caso dos dados sazonais, a diferença deve ser baseada na sazonalidade. Uma ou duas diferenças, no geral, são suficientes para transformar os dados em uma série estacionaria(15). É importante frisar que os dados na área de saúde possuem relativa variabilidade, dificultando a identificação desses padrões. Uma forma de superar essa limitação é avaliar a autocorrelação, que significa avaliar como uma observação está relacionada à observação anterior. Para tornar os dados estacionários, o investigador cria uma nova série de dados, baseado na diferença do período atual em relação ao anterior. Isso, no entanto, reduz em duas observações o tamanho da série. A série é considerada estacionária quando a autocorreção não exibe resultados estatisticamente significantes.

Uma vez atingida a estacionariedade, deve-se testar novamente a autocorrelação, para verificar a possibilidade de existência de algum padrão residual.

Fase de estimação e teste

Após a identificação do modelo, os parâmetros AR e MA, sazonais e não sazonais, devem ser determinados. Nessa etapa, o tradicional método dos mínimos quadrados pode ser utilizado. Uma forma utilizada, com frequência, para isso, é a máxima verossimilhança. É possível entendê-la como uma medida da viabilidade de checar a amostra de observações atual, dado um conjunto particular de valores dos parâmetros. O método da máxima verossimilhança permite encontrar os valores dos parâmetros maximizados.

Alguns parâmetros podem ser estatisticamente insignificativos (p>0.05); caso isso ocorra, esses parâmetros podem ser retirados visando melhorar o ajuste dos dados.

Pode, no entanto, existir mais de um modelo ARIMA para a série de dados. Um critério de seleção é o modelo que possui a menor soma de erros ao quadrado, apesar dessa abordagem ser limitada, pois a soma dos quadrados pode diminuir e a verossimilhança aumentar apenas com o acréscimo de mais dados.

A análise dos resíduos é realizada, e o modelo o ACF deve mostrar a não existência de uma autocorrelação ou autocorrelação parcial significativa entre eles. O teste Portmanteau pode ser aplicado como forma complementar de avaliar o ajuste. Nos casos em que esse teste for positivo, o modelo pode ser inadequado(15).

No caso de uma autocorrelação significativa, o processo de identificação deve ser realizado novamente para avaliar outros padrões ainda existentes.

É sugerido que o investigador de um programa de gerenciamento das doenças compare a adequação do modelo ARIMA. Essa comparação pode ser feita com outras técnicas de estimação e previsão, utilizando as medidas de erro médio, erro médio absoluto, erro médio ao quadrado ou a estatística de Theil-U.

Fase de aplicação

As previsões com uso de séries temporais não devem exceder os primeiros 12 meses do programa(2). Conforme mencionado, os primeiros períodos do programa podem não apresentar um impacto significativo para o paciente. Nos períodos posteriores, podem ser encontrados níveis de significativos de impacto. Identificados esses níveis de resultado, metas específicas podem ser atribuídas para cada um dos períodos. Nos estudos prolongados, atenção deve ser dada aos fatores externos ao modelo que podem criar picos no acompanhamento temporal. Alguns exemplos são outras inovações tecnológicas que reduzem o tempo da doença ou surtos de epidemias que aumentam o efeito desta.

No caso de epidemias, as séries podem ser do tipo não estacionária e não linear, passando de um estado para outro de maneira complexa. Além disso, as estruturas periódicas das epidemias de doenças infecciosas mudam com o tempo. É sugerido, nesse caso, utilizar curtos períodos de segmento de tempo para analisar os efeitos de cada segmento(16).

CONCLUSÕES

Há uma variedade de métodos e abordagens que podem ser utilizados dentro da área da saúde. As séries de temporais são uma ferramenta analítica para os estudos do gerenciamento de doenças e recursos nas instituições de saúde. A flexibilidade de acompanhar, reconhecer padrões nos dados e fornecer explicações é uma vantagem que não deve ser desprezada nos estudos das intervenções de saúde. Aqui, foi introduzido o modelo ARIMA, sem o uso de detalhes matemáticos ou demais extensões ao modelo. O investigador ou organização de saúde envolvida em programas de gerenciamento de doenças podem obter grandes vantagens ao fazer uso dessa metodologia analítica em várias áreas, com aplicabilidade para realizar previsões em muitos casos. Apesar da possibilidade analítica por meio estatísticos, essa abordagem não substitui o bom senso e a experiência dos investigadores nas intervenções sobre as doenças.

Data de submissão: 18/6/2012

Data de aceite: 7/2/2013

  • 1. Linden A, Adams JL, Roberts N. An assessment of the total population approach for evaluating disease management program effectiveness. Dis Manag. 2003;6(2):93-102.
  • 2. Linden A, Adams JL, Roberts N. Evaluating disease management program effectiveness: an introduction to time series analysis. Dis Manag. 2003;6(4): 243-55.
  • 3. Choi K, Thacker SB. An evaluation of influenza mortality surveillance, 1962-1979. I. Time series forecasts of expected pneumonia and influenza deaths. Am J Epidemiol. 1981;113(3):215-26.
  • 4. Haines L, Munoz W, Van Gelderen C. ARIMA modelling of birth data. J Appl Statistics. 1989;16(1):55-67.
  • 5. Vernaz N, Huttner B, Muscionico D, Salomon JL, Bonnabry P, López-Lozano JM, et al. Modelling the impact of antibiotic use on antibiotic-resistant Escherichia coli using population-based data from a large hospital and its surrounding community. J Antimicrob Chemother. 2011;66(4):928-35.
  • 6. Chen L, Omaye ST. Air pollution and health effects in northern Nevada. Rev Environ Health. 2011;16(2):133-49.
  • 7. Soyiri IN, Reidpath DD. Evolving forecasting classifications and applications in health forecasting. Int J Gen Med. 2012;5:381-9.
  • 8. Earnest A, Chen MI, Ng D, Sin LY. Using autoregressive integrated moving average (ARIMA) models to predict and monitor the number of beds occupied during a SARS outbreak in a tertiary hospital in Singapore. BMC Health Serv Res. 2005;5(1):36.
  • 9. Liu Q, Liu X, Jiang B, Yang W. Forecasting incidence of hemorrhagic fever with renal syndrome in China using ARIMA model. BMC Infect Dis. 2011;11(1):218.
  • 10. Sun Y, Heng B, Seow Y, Seow E. Forecasting daily attendances at an emergency department to aid resource planning. BMC Emerg Med. 2009;9:1
  • 11. Rathlev NK, Chessare J, Olshaker J, Obendorfer D, Mehta SD, Rothenhaus T, et al. Time series analysis of variables associated with daily mean emergency department length of stay. Ann Emerg Med. 2007;49(3):265-71.
  • 12. López-Lozano JM, Monnet DL, Yagüe A, Burgos A, Gonzalo N, Campillos P, et al. Modelling and forecasting antimicrobial resistance and its dynamic relationship to antimicrobial use: a time series analysis. Int J Antimicrob Agents. 2000;14(1):21-31.
  • 13. Hsueh PR, Chen WH, Luh KT. Relationships between antimicrobial use and antimicrobial resistance in Gram-negative bacteria causing nosocomial infections from 1991-2003 at a university hospital in Taiwan. Int J Antimicrob Agents. 2005;26(6):463-72.
  • 14. Aldeyab MA, Monnet DL, López-Lozano JM, Hughes CM, Scott MG, Kearney MP, et al. Modelling the impact of antibiotic use and infection control practices on the incidence of hospital-acquired methicillin-resistant Staphylococcus aureus: a time series analysis. J Antimicrob Chemother. 2008;62(3):593-600.
  • 15. Makridakis S, Wheelwright SC, Hyndman RJ. Forecasting methods and applications. 3rd ed. New York: Wiley; 1998.
  • 16. Sumi A, Kamo K, Ohtomo N, Mise K, Kobayashi N. Time series analysis of incidence data of influenza in Japan. J Epidemiol. 2011;21(1):21-9.
  • Autor correspondente:
    Renato Cesar Sato
    Rua Talim, 330 – Vila Nair
    CEP: 12231-280 – São José dos Campos, SP, Brasil
    Tel.: (12) 3921-9598
    E-mail:
  • Datas de Publicação

    • Publicação nesta coleção
      09 Abr 2013
    • Data do Fascículo
      Mar 2013

    Histórico

    • Recebido
      18 Jun 2012
    • Aceito
      07 Fev 2013
    Instituto Israelita de Ensino e Pesquisa Albert Einstein Avenida Albert Einstein, 627/701 , 05651-901 São Paulo - SP, Tel.: (55 11) 2151 0904 - São Paulo - SP - Brazil
    E-mail: revista@einstein.br