Acessibilidade / Reportar erro

Modelo Autorregressivo Integrado de Médias Móveis (ARIMA): aspectos conceituais e metodológicos e sua aplicabilidade na mortalidade infantil

Resumo

Este artigo, de cunho teórico-reflexivo, objetiva discutir os aspectos conceituais e metodológicos sobre as aplicações da modelagem de série temporal, em especial, o Modelo Autorregressivo Integrado de Médias Móveis e sua aplicabilidade na mortalidade infantil. Essa modelagem possibilita prever os valores futuros utilizando os dados passados, delineando e estimando os cenários possíveis do evento em saúde, evidenciando a sua magnitude. Devido à persistência da mortalidade infantil como um problema de saúde pública, a aplicabilidade desse método é útil no gerenciamento oportuno e sistemático dos indicadores da saúde infantil, além de ser um método que apresenta baixo custo operacional, que, em contextos de redução de gastos em saúde, se torna uma ferramenta de gestão em potencial. No entanto, ainda há lacunas na utilização de métodos estatísticos no processo decisório e formulador de políticas em saúde, a exemplo da modelagem em questão. São obstáculos de natureza metodológica (estatística robusta), institucional (sistemas de informações defasados) e cultural (desvalorização dos dados produzidos, principalmente em nível local).

Palavras-chave
Estudos de séries temporais; Mortalidade infantil; Políticas públicas de saúde

Abstract

This reflective theoretical article, aims to discuss conceptual and methodological aspects about the applications of time series modeling, in particular, the Integrated Auto-regressive Moving Average model and its applicability in infant mortality. This modeling makes it possible to predict future values using past data, outlining and estimating possible scenarios of the health event, highlighting its magnitude. Due to the persistence of infant mortality as a public health problem, the applicability of this method is useful in the timely and systematic management of child health indicators, in addition to being a method with low operating cost, which in contexts of cost reduction in public healthcare services, becomes a potential management tool. However, there are still gaps in the use of statistical methods in the decision-making and policy-making process in public healthcare, such as the modeling in question. These are methodological (robust statistics), institutional (outdated information systems) and cultural obstacles (devaluation of the data produced, mainly at the local level).

Key words
Time series studies; Infant mortality; Public health policy

Introdução

A análise da situação de saúde, o monitoramento de indicadores prioritários e a previsão de cenários são desafios em todos os países, em especial, naqueles que têm dificuldades para o alcance de ações internacionalmente pactuadas.11 Marchant T, Boerma T, Diaz T, Huicho L, Kyobutungi C, Mershon CH, Schellenberg J, Somers K, Waiswa P. Measurement and accountability for maternal, newborn and child health: fit for 2030?. BMJ Global Health. 2020; 5: e002697. A mortalidade infantil é particularmente estudada pela sua expressão como um problema de saúde pública e pela disponibilidade de tecnologia para o seu enfrentamento.11 Marchant T, Boerma T, Diaz T, Huicho L, Kyobutungi C, Mershon CH, Schellenberg J, Somers K, Waiswa P. Measurement and accountability for maternal, newborn and child health: fit for 2030?. BMJ Global Health. 2020; 5: e002697.,22 Szwarcwald CL, Leal MC, Almeida WS, Barreto ML, Frias PG, Theme Filha MM, Domingues RMSM, Franca EB, Gama SGN, Boccolini CS, Victora C. Child Health in Latin America. Glob Public Health. 2019; 1: 1-49. Para esse evento, a utilização da metodologia de séries temporais é favorável na construção de cenários futuros, monitoramento e análise da situação de saúde.33 Mishra AK, Sahanaa C, Manikandan M. Forecasting Indian infant mortality rate: An application of autoregressive integrated moving average model. J Family Community Med. 2019; 26 (2): 123-6.,44 Foreman KJ, Marquez N, Dolgert A, Fukutaki K, Fullman N, McGaughey M, Pletcher MA, Smith AE, Tang K, Yuan CW, Brown JC, Friedman J, He J, Heuton KR, Holmberg M, Patel DJ, Reidy P, Carter A, Cercy K, Chapin A, Douwes-Schultz D, Frank T, Goettsch F, Liu PY, Nandakumar V, Reitsma MB, Reuter V, Sadat N, Sorensen RJD, Srinivasan V, Updike RL, York H, Lopez AD, Lozano R, Lim SS, Mokdad AH, Vollset SE, Murray CJL. Forecasting life expectancy, years of life lost, and all causE and cause-specific mortality for 250 causes of death: reference and alternative scenarios for 2016–40 for 195 countries and territories. Lancet. 2018; 392: 2052-90. Essa modelagem permite diagnosticar e compreender os padrões de comportamento temporal de eventos que acometem uma determinada população e avaliar os impactos de intervenções em saúde.55 Nyoni SP, Nyoni T. Modeling and forecasting Infant deaths in Zimbabwe using ARIMA Models. JournalNX - A Multidisciplinary Peer Reviewed Journal. 2020; 6 (7): 142- 51.

Diversas técnicas de análise de séries temporais são capazes de prever valores futuros, utilizando os dados passados, por meio de conclusões estatísticas. A finalidade é modelar o evento, construindo uma função matemática que representa a correlação da variável com o tempo.66 Morettin PA, Toloi CM. Análise de Séries Temporais. 3 ed. São Paulo: Blucher; 2018.

Nenhum modelo proposto assume integralmente as previsões exatas devido a ocorrências de variações aleatórias às quais o processo de observação dos eventos está sujeito. Porém, constituem ferramentas valiosas para avaliar rapidamente a gravidade de uma situação e auxiliam as autoridades públicas de saúde na definição ou nos ajustes das estratégias de controle.77 Wang YW, Shen ZZ, Jiang Y. Comparison of ARIMA and GM (1,1) models for prediction of hepatitis B in China. PLoS One. 2018; 13(9): e0201987. Dentre os tipos de modelos, destacam-se: a análise de tendência (média móvel e suavização exponencial); os modelos de regressão, que lidam com diferentes padrões presentes na série, como os pontos de inflexão (joinpoint regression analysis); a rede neural artificial, que foi pensada para funcionar de forma matematicamente semelhante ao cérebro humano e poder realizar generalizações por meio de dados passados e não lineares e o Modelo Autorregressivo Integrado de Médias Móveis (ARIMA), ou Modelo Box-Jenkins, bastante utilizado na área econômica.99 Lima LMM, Vianna RPT, Moraes RM. Identificação das anomalias congênitas baseado em um modelo de decisão a partir de redes neurais artificiais. J Health Inform. 2019; 11 (1): 8-12.,1010 Ramalho AA, Andrade AM, Martins FA, Koifman RJ. Infant mortality trend in the city of Rio Branco, AC, 1999 to 2015. Rev Saúde Pública. 2018; 52: 33. Na área da saúde, na década de 1980, o Centro de Controle de Doenças (CDC) adotou essa modelagem como referência nas análises em saúde e, desde então, ele foi difundido em estudos na área.77 Wang YW, Shen ZZ, Jiang Y. Comparison of ARIMA and GM (1,1) models for prediction of hepatitis B in China. PLoS One. 2018; 13(9): e0201987.,88 Jaime AG. Introducción al tratamiento de series temporales: Aplicación a las Ciencias de la Salud. Madrid: Díaz de Santos, S.A; 1994.

Este artigo objetiva discutir os aspectos conceituais e metodológicos acerca da série temporal utilizando a modelagem ARIMA e a sua aplicabilidade na mortalidade infantil. A proposta de construir o manuscrito tem a finalidade de contribuir com a prática em saúde na redução das iniquidades persistentes na saúde infantil, utilizando uma modelagem estatística robusta. Ao propor antever cenários futuros, a incorporação sistemática do método abordado fortalecerá o planejamento de ações direcionadas nos diversos níveis do sistema de saúde.

O apoio referencial para estruturar conceitos e métodos foi proveniente de livros e artigos cientí- ficos publicados em periódicos indexados nas bases de dados da LILACS e US National Library of Medicine (PubMed), além da biblioteca virtual da SciELO. As explanações e ponderações foram organizadas nos seguintes tópicos: Séries temporais: aspectos teóricos e metodológicos e a modelagem ARIMA; Aplicações da análise de séries temporais na mortalidade infantil: possibilidades e limitações metodológicas. Foram utilizadas as taxas de mortalidade infantil no Brasil distribuídas em uma série temporal para exemplificar a aplicabilidade da modelagem ARIMA por meio de gráfico linear e os gráficos de autocorrelações. Os dados para o cálculo da taxa de mortalidade infantil foram extraídos dos Sistemas de Informação sobre Mortalidade (SIM) e do Sistema de Informação sobre Nascidos Vivos (Sinasc) e obtidos no site do DATASUS por meio do link de acesso aberto ao público: https://datasus.saude.gov.br/.

Séries temporais: aspectos teóricos e metodológicos e a modelagem ARIMA

As séries temporais são uma sequência de valores observados de determinado fenômeno e distribuídos sobre uma base de tempo. A expressão matemática que descreve uma série temporal é dada por {Y (t), t ∈ T}, em que Y representa a variável de interesse e T representa o conjunto de índices relacionados aos tempos de medição. A análise de série temporal objetiva construir modelos explicativos, ou determinísticos, para o fenômeno estudado e, com isso, realizar as respectivas previsões.66 Morettin PA, Toloi CM. Análise de Séries Temporais. 3 ed. São Paulo: Blucher; 2018.

A natureza dos valores observados caracteriza a série temporal em contínua ou discreta. Com base na função geral, uma série discreta T = t11 Marchant T, Boerma T, Diaz T, Huicho L, Kyobutungi C, Mershon CH, Schellenberg J, Somers K, Waiswa P. Measurement and accountability for maternal, newborn and child health: fit for 2030?. BMJ Global Health. 2020; 5: e002697., t22 Szwarcwald CL, Leal MC, Almeida WS, Barreto ML, Frias PG, Theme Filha MM, Domingues RMSM, Franca EB, Gama SGN, Boccolini CS, Victora C. Child Health in Latin America. Glob Public Health. 2019; 1: 1-49., ..., tn, as observações são feitas em intervalos de tempo fixos e enumeráveis, podendo ser equiespaçados ou não. Na série contínua, os dados referentes à determinada variável são evidenciados de forma sequencial em um intervalo de tempo T = t : t1 < t < t2, por exemplo, a mensuração contínua de determinado sinal biológico como a pressão arterial.88 Jaime AG. Introducción al tratamiento de series temporales: Aplicación a las Ciencias de la Salud. Madrid: Díaz de Santos, S.A; 1994.

Na análise da série, alguns aspectos básicos devem ser considerados para poder compreender melhor o comportamento da variável observada. O primeiro refere-se à periodicidade, a qual depende da natureza da variável em análise, se contínua ou discreta, e do objetivo de estudo proposto. No caso da taxa de mortalidade infantil, sua periodicidade está relacionada com a disponibilidade dos dados nos sistemas oficiais de informações e de investigadores em saúde que realizem as análises críticas constantes para mensurar a magnitude do evento em questão.88 Jaime AG. Introducción al tratamiento de series temporales: Aplicación a las Ciencias de la Salud. Madrid: Díaz de Santos, S.A; 1994. Outro aspecto importante refere-se à comparabilidade entre séries temporais de diferentes contextos, em que, nessa situação, é necessário respeitar determinadas circunstâncias que permitam contrastar as séries.88 Jaime AG. Introducción al tratamiento de series temporales: Aplicación a las Ciencias de la Salud. Madrid: Díaz de Santos, S.A; 1994.

A não estacionariedade é uma característica considerada importante no tratamento da série temporal e deve ser evitada, pois dificulta as predições. Uma série não estacional é resultante da frequência dos dados estudados e esta pode ser instável referente à sua média, variância e autocovariância. Referente à taxa de mortalidade infantil, valores muito altos ou baixos de óbitos dentro de um período causam grandes variações na série. Dessa maneira, o tratamento da série, quanto à sua estacionariedade, é uma condição necessária na modelagem de séries temporais. Uma série não estacionária pressupõe que o modelo é determinado pela aleatoriedade das observações, pelo acaso.55 Nyoni SP, Nyoni T. Modeling and forecasting Infant deaths in Zimbabwe using ARIMA Models. JournalNX - A Multidisciplinary Peer Reviewed Journal. 2020; 6 (7): 142- 51.

Para estimar o modelo, deve-se primeiramente certificar se não é uma sequência puramente aleatória, também chamada de variação aleatória, ruído branco ou resíduo aleatório. Caso não seja, a função do modelo pode ser constituída por componentes que representam padrões ou regularidades parciais da série estudada, sendo: tendência, sazo-nalidade e a estimação da variabilidade do resíduo aleatório para constituir os intervalos de confiança para as predições provenientes do modelo.66 Morettin PA, Toloi CM. Análise de Séries Temporais. 3 ed. São Paulo: Blucher; 2018.

O gráfico temporal, ou gráfico de linha, é fundamental para visualizar os componentes e identificar valores atípicos (outliers). A Figura 1 evidencia a série temporal da taxa de mortalidade infantil no Brasil durante o período de 2000 a 2018. O comportamento temporal da taxa por meio do gráfico evidencia a presença de tendência. A estacionariedade pode ser identificada por meio de testes estatísticos, como, por exemplo, o teste de Dickey- Fuller Aumentado, o qual testa a hipótese alternativa de estacionariedade.

O autocorrelograma permite visualizar e identificar a dependência das regularidades encontradas. A autocorrelação, como o nome remete, é a correlação entre uma série temporal e ela mesma. No autocorrelograma, os períodos em que houver correlação são representados pela nomenclatura lag. A autocorrelação temporal é identificada por meio dos gráficos de autocorrelação simples (ACF) e parcial (PACF), que são testes que apontam a significância estatística da autocorrelação, ou seja, quando os lags extrapolam (para cima ou para baixo) os limites do intervalo de confiança traçados no gráfico (Figura 2).66 Morettin PA, Toloi CM. Análise de Séries Temporais. 3 ed. São Paulo: Blucher; 2018.,1111 Zheng A, Fang Q, Zhu Y, Jiang C, Jin F, Wang X. An application of ARIMA model for predicting total health expenditure in China from 1978-2022. J Glob Health. 2020; 10 (1): 010803.

Na análise de modelos ARIMA, a presença da autocorrelação só pode ser útil se a série temporal em questão não apresentar tendência ou esta for removida, o que é classificado como padrão estacionário. Nesse padrão, os valores desenvolvem-se no tempo ao redor de uma média e variância constantes, tornando possível a técnica de predição.66 Morettin PA, Toloi CM. Análise de Séries Temporais. 3 ed. São Paulo: Blucher; 2018. O primeiro componente a ser identificado é a tendência por meio do gráfico temporal e de alguns métodos que suavizam as flutuações da série original, como as médias móveis ou transformações lineares. As médias móveis, ou filtros lineares, são utilizadas quando uma série se mostra marcadamente irregular, com muitas flutuações, dificultando a visualização da tendência. Quanto mais sinuosa a tendência, maior o suavizamento necessário para identificar a real tendência da série.88 Jaime AG. Introducción al tratamiento de series temporales: Aplicación a las Ciencias de la Salud. Madrid: Díaz de Santos, S.A; 1994.

Figura 1
Taxa de mortalidade infantil no Brasil, 2000-2018 (n= 228 observações).

* Teste de estacionariedade (Dickey-Fuller Aumentado): p-valor 0,38. Isso indica que a série não é estacionária.


A remoção da tendência é feita por técnica de diferenciação da própria série no intuito de torná-la estacionária (Figura 3). Uma diferença elimina uma tendência linear e duas diferenças eliminam uma tendência exponencial. A quantidade de diferenças está relacionada ao grau do polinômio estimado para a tendência.66 Morettin PA, Toloi CM. Análise de Séries Temporais. 3 ed. São Paulo: Blucher; 2018.

O componente sazonalidade é um fenômeno que ocorre regularmente no tempo.1212 Liu Q, Li Z, Ji Y, Zia UH, Javaid A, Lu W, Wang J. Forecasting the seasonality and trend of pulmonary tuberculosis in Jiangsu Province of China using advanced statistical time-series analyses. Infect Drug Resist. 2019; 26 (12): 2311-22. As relações das observações em séries que apresentam sazonalidade ocorrem com frequência em séries temporais anuais e mensais, podendo também ocorrer em séries mensuradas em outras dimensões temporais. Padrões sazonais são identificados no gráfico original (Figura 1) e no correlograma por meio de oscilações em mesma frequência (Figura 3). A análise é feita por meio dos coeficientes de autocorrelação nos períodos sazonais.66 Morettin PA, Toloi CM. Análise de Séries Temporais. 3 ed. São Paulo: Blucher; 2018.

O Modelo Autorregressivo Integrado de Médias Móveis (ARIMA), ou Modelo Box-Jenkins, é bastante utilizado para predição, ou forecasting. Essa técnica utiliza dados passados para estimar valores futuros e a instabilidade com suas flutuações é um empecilho para a aplicabilidade da técnica.1313 Singh RK, Rani M, Bhagavathula AS, Sah R, Rodriguez- Morales AJ, Kalita H, Nanda C, Sharma S, Sharma YD, Rabban AA, Rahmani J, Kumar P. Prediction of the COVID-19 Pandemic for the Top 15 Affected Countries: Advanced Autoregressive Integrated Moving Average (ARIMA) Model. JMIR Public Health Surveill. 2020; 6(2).,1414 Usman A, Sulaiman MA, Abubakar I. Trend of Neonatal Mortality in Nigeria from 1990 to 2017 using Time Series Analysis. J. Appl. Sci. Environ. Manage. 2019; 23 (5): 865- 9. A identificação da estabilidade serial, ou estacionariedade, é a primeira etapa da modelagem. Devido à possibilidade de existir períodos sazonais na série, a modelagem ARIMA apresenta uma extensão, a Modelagem Sazonal Autorregressiva Integrada de Médias Móveis (SARIMA) ou ARIMA sazonal.66 Morettin PA, Toloi CM. Análise de Séries Temporais. 3 ed. São Paulo: Blucher; 2018. Nas séries que não apresentam estacionariedade devido às flutuações (tendência, sazonalidade) inerentes das mesmas, o modelo ARIMA possibilita obter resultados satisfatórios.88 Jaime AG. Introducción al tratamiento de series temporales: Aplicación a las Ciencias de la Salud. Madrid: Díaz de Santos, S.A; 1994.

A indução à estacionariedade segue uma ordem que parte do pressuposto de conservação das flutuações da série original. Primeiro, avalia-se a não estacionariedade da variância, seguida das autocorrelações e, por último, da média. A depender do grau da tendência apresentada na série, ao corrigir a não estacionariedade da variância, consequentemente, estabilizam-se a média e as autocorrelações. Por isso, deve ser respeitada a ordem de ajuste da série citada anteriormente, fazendo com que não seja necessário induzir estacionariedade a respeito das autocorrelações e média.88 Jaime AG. Introducción al tratamiento de series temporales: Aplicación a las Ciencias de la Salud. Madrid: Díaz de Santos, S.A; 1994.

Em geral, a metodologia ARIMA, proposta por George Box e Gwilym Jenkins, consegue diagnosticar a série quanto à condição de estacionariedade e identificar o modelo adequado por meio de um ciclo iterativo, com os próprios dados da série, com as seguintes fases: identificação, especificação, estimação e diagnóstico.66 Morettin PA, Toloi CM. Análise de Séries Temporais. 3 ed. São Paulo: Blucher; 2018.

Ao desmembrar a sigla ARIMA na fase de identificação dos possíveis modelos, o AR, ou ordem p, representa o processo autorregressivo, ou seja, a influência do valor anterior da variável sobre o valor considerado; o I, ou ordem d, está relacionado ao número de diferenciações para induzir à estacionariedade, e o MA, ou ordem q, está relacionado à influência do ruído produzido no valor anterior.55 Nyoni SP, Nyoni T. Modeling and forecasting Infant deaths in Zimbabwe using ARIMA Models. JournalNX - A Multidisciplinary Peer Reviewed Journal. 2020; 6 (7): 142- 51.,1414 Usman A, Sulaiman MA, Abubakar I. Trend of Neonatal Mortality in Nigeria from 1990 to 2017 using Time Series Analysis. J. Appl. Sci. Environ. Manage. 2019; 23 (5): 865- 9.,1515 De P, Sahu D, Pandey A, Gulati BK, Chandhiok N, Shukla AK, Mohan P, Mitra RG. Post Millennium Development Goals Prospect on Child Mortality in India: An Analysis Using Autoregressive Integrated Moving Averages (ARIMA) Model. Health. 2016; 8 (15): 1845-72. As ordens dos modelos ARIMA e SARIMA são estimadas pelo gráfico da função de autocorrelação (ACF) e pelo correlograma de autocorrelação parcial (PACF), sendo o ACF sugestivo de ordem MA e o PACF da ordem AR. O número da ordem está relacionado à quantidade de lags que ultrapassem o intervalo de confiança do gráfico.1313 Singh RK, Rani M, Bhagavathula AS, Sah R, Rodriguez- Morales AJ, Kalita H, Nanda C, Sharma S, Sharma YD, Rabban AA, Rahmani J, Kumar P. Prediction of the COVID-19 Pandemic for the Top 15 Affected Countries: Advanced Autoregressive Integrated Moving Average (ARIMA) Model. JMIR Public Health Surveill. 2020; 6(2).,1414 Usman A, Sulaiman MA, Abubakar I. Trend of Neonatal Mortality in Nigeria from 1990 to 2017 using Time Series Analysis. J. Appl. Sci. Environ. Manage. 2019; 23 (5): 865- 9. Observar a ACF e PACF é útil para se ter uma ideia do modelo a ser testado, objetivando escolher aquele que apresente a menor quantidade de parâmetros (mais parcimonioso).

Figura 2
Função de autocorrelação (ACF) e função de autocorrelação parcial (PACF) da taxa mensal da mortalidade infantil no Brasil, 2000-2018.
Figura 3
Taxa mensal da mortalidade infantil e função de autocorrelação (ACF) e autocorrelação parcial (PACF) após o processo de diferenciação (d=11 Marchant T, Boerma T, Diaz T, Huicho L, Kyobutungi C, Mershon CH, Schellenberg J, Somers K, Waiswa P. Measurement and accountability for maternal, newborn and child health: fit for 2030?. BMJ Global Health. 2020; 5: e002697.), Brasil, 2000-2018.

* Teste de estacionariedade (Dickey-Fuller Aumentado): p-valor0,01. Isso indica que a hipótese nula de não estacionariedade foi rejeitada. Fonte: Sistema de Informação de Mortalidade e Sistema de Informação sobre Nascidos Vivos- DATASUS, Ministério da Saúde.


Os modelos SARIMA apresentam ordem não sazonal (p, d, q) e sazonal (P, D, Q) e, por isso, é também chamado de modelo multiplicativo. A estimação dos parâmetros (ou coeficientes) é realizada por meio dos seguintes métodos: mínimos quadrados, máxima verossimilhança ou método dos momentos.66 Morettin PA, Toloi CM. Análise de Séries Temporais. 3 ed. São Paulo: Blucher; 2018.

O processo de modelagem da série temporal pode ser sistematizado a partir do seguinte fluxograma (Figura 4).

Aplicações da análise de séries temporais na mortalidade infantil: possibilidades e limitações metodológicas

Atuar nos principais determinantes e condicionantes dos agravos em saúde requer estudos que apresentem modelagem robusta, como os de séries temporais, os quais permitem trazer evidências científicas que subsidiem a tomada de decisão em saúde.1616 GBD 2015 Mortality and Causes of Death Collaborators. Global, regional, and national life expectancy, all-cause mortality, and cause-specific mortality for 249 causes of death, 1980-2015: a systematic analysis for the Global Burden of Disease Study 2015. Lancet. 2016; 388: 1459- 1544.

Figura 4
Etapas da modelagem ARIMA (Box-Jenkins).

ACF = Função de Autocorrelação; PACF = Função de Autocorrelação Parcial; AIC = Critério de Informação de Akaike; BIC = Critério Bayesiano de Schwarz.


A incorporação de estudos de séries temporais na área da saúde surge da necessidade de planejar onde alocar os investimentos, objetivando impactar os principais indicadores epidemiológicos, como a mortalidade infantil e materna.44 Foreman KJ, Marquez N, Dolgert A, Fukutaki K, Fullman N, McGaughey M, Pletcher MA, Smith AE, Tang K, Yuan CW, Brown JC, Friedman J, He J, Heuton KR, Holmberg M, Patel DJ, Reidy P, Carter A, Cercy K, Chapin A, Douwes-Schultz D, Frank T, Goettsch F, Liu PY, Nandakumar V, Reitsma MB, Reuter V, Sadat N, Sorensen RJD, Srinivasan V, Updike RL, York H, Lopez AD, Lozano R, Lim SS, Mokdad AH, Vollset SE, Murray CJL. Forecasting life expectancy, years of life lost, and all causE and cause-specific mortality for 250 causes of death: reference and alternative scenarios for 2016–40 for 195 countries and territories. Lancet. 2018; 392: 2052-90. Além disso, trata-se de uma modelagem prática ao permitir utilizar dados demográficos, epidemiológicos, ambientais e socioeconômicos de fontes oficiais.1717 Slama A, Śliwczyński A, Woźnica J, Zdrolik M, Wiśnicki B, Kubajek J, Turżańska-Wieczorek O, Gozdowski D, Wierzba W, Franek E. Impact of air pollution on hospital admissions with a focus on respiratory diseases: a timeseries multi-city analysis. Environ Sci Pollut Res. 2019 26 (17) 16998–17009.

Por meio desse tipo de estudo, pode-se compreender o comportamento de variáveis durante um período, descobrir padrões atípicos na morbimortalidade e compreender a determinação das causas, além de ser útil para a avaliação do impacto produzido por intervenções em saúde.1818 Naderimagham S, Jamshidi H, Khajavi A, Pishgar F, Ardam A, Larijani B, Mahmoudi Z, Jeddian A, Bahrami-Taghanaki HR, Farzadfar F. Impact of rural family physician program on child mortality rates in Iran: a time-series study. Popul Health Metrics. 2017; 15: 21.

Prever cenários requer o uso de técnicas diversificadas, incluindo aquelas que avaliam as características do dado estudado. A modelagem ARIMA apresenta essa versatilidade frente às variáveis epidemiológicas, que são dinâmicas por natureza, por isso, é útil em séries estacionárias ou não.1212 Liu Q, Li Z, Ji Y, Zia UH, Javaid A, Lu W, Wang J. Forecasting the seasonality and trend of pulmonary tuberculosis in Jiangsu Province of China using advanced statistical time-series analyses. Infect Drug Resist. 2019; 26 (12): 2311-22.,1919 Li Y, Chen SF, Dong XJ, Zhao XJ. Prediction of causespecific disability-adjusted life years in China from 2018 through 2021: a systematic analysis. Public Health. 2020; 180: 90-9. Outra vantagem metodológica, em detrimento de outras técnicas de predição, é a de construir modelos parcimoniosos por conterem uma quantidade reduzida de parâmetros (fase da estimação do ciclo iterativo) e as previsões obtidas poderem ser bem precisas em diversos contextos.66 Morettin PA, Toloi CM. Análise de Séries Temporais. 3 ed. São Paulo: Blucher; 2018.

Apesar das potencialidades expostas, há algumas limitações, que podem surgir ao utilizar a modelagem de séries temporais. Uma delas, inerente a esse tipo de estudo, considera que exista relação linear entre os dados observados e dados passados, fato não visto com os dados reais, os quais apresentam relação complexa e não linear.77 Wang YW, Shen ZZ, Jiang Y. Comparison of ARIMA and GM (1,1) models for prediction of hepatitis B in China. PLoS One. 2018; 13(9): e0201987. A mortalidade infantil, por exemplo, possui determinação multifatorial resultante da interação de variáveis biológicas, sociais, econômicas e assistenciais.2020 Maia LTS, Souza WV, Mendes ACG. Determinantes individuais e contextuais associados à mortalidade infantil nas capitais brasileiras: uma abordagem multinível. Cad Saúde Pública. 2020; 36 (2): e00057519.

Outra limitação relaciona-se à qualidade dos dados disponíveis, pois esses interferem diretamente na modelagem.1515 De P, Sahu D, Pandey A, Gulati BK, Chandhiok N, Shukla AK, Mohan P, Mitra RG. Post Millennium Development Goals Prospect on Child Mortality in India: An Analysis Using Autoregressive Integrated Moving Averages (ARIMA) Model. Health. 2016; 8 (15): 1845-72. Dados disponíveis e confiáveis são fundamentais para fornecer informações necessárias para determinar políticas e delimitar os grupos vulneráveis. Por isso, é imprescindível a alimentação adequada dos sistemas de informação em saúde.2121 Frias PG, Szwarcwald CL, Morais Neto OL, Leal MC, Cortez-Escalante JJ, Souza Junior PRB, Almeida WS, Silva Junior JB. Utilização das informações vitais para a estimação de indicadores de mortalidade no Brasil: da busca ativa de eventos ao desenvolvimento de métodos. Cad Saúde Pública. 2017; 33 (3): e00206015.

Os estudos de série temporal, ainda que clássicos e imprescindíveis para a compreensão sobre a situação de um dado problema de saúde, por vezes, são considerados complexos e de difícil operacionalização, não sendo utilizados em toda sua potencialidade. Em especial à modelagem ARIMA, ainda existem dificuldades no manuseio e na aplicabilidade no campo da saúde devido à sua natureza matemática oriunda da área econômica. Trata-se de um modelo sofisticado, que requer uma aproximação com os aspectos teóricos e treinamentos em análise estatística para realizar todo o ciclo iterativo e a predição.66 Morettin PA, Toloi CM. Análise de Séries Temporais. 3 ed. São Paulo: Blucher; 2018.

A persistência como problema de saúde pública mundial torna as mortes infantis uma agenda consensual na saúde, sendo a modelagem ARIMA uma possibilidade metodológica para a gestão.44 Foreman KJ, Marquez N, Dolgert A, Fukutaki K, Fullman N, McGaughey M, Pletcher MA, Smith AE, Tang K, Yuan CW, Brown JC, Friedman J, He J, Heuton KR, Holmberg M, Patel DJ, Reidy P, Carter A, Cercy K, Chapin A, Douwes-Schultz D, Frank T, Goettsch F, Liu PY, Nandakumar V, Reitsma MB, Reuter V, Sadat N, Sorensen RJD, Srinivasan V, Updike RL, York H, Lopez AD, Lozano R, Lim SS, Mokdad AH, Vollset SE, Murray CJL. Forecasting life expectancy, years of life lost, and all causE and cause-specific mortality for 250 causes of death: reference and alternative scenarios for 2016–40 for 195 countries and territories. Lancet. 2018; 392: 2052-90.,2020 Maia LTS, Souza WV, Mendes ACG. Determinantes individuais e contextuais associados à mortalidade infantil nas capitais brasileiras: uma abordagem multinível. Cad Saúde Pública. 2020; 36 (2): e00057519.,2222 Rajia S, Sabiruzzaman M, Islam MK, Hossain MG, Lestrel PE. Trends and future of maternal and child health in Bangladesh. PLoS One. 2019; 14 (3): e0211875. Por meio dela, é possível delinear e analisar tendências em saúde mais prováveis, caracterizando-as como importantes dispositivos de planejamento de intervenções.44 Foreman KJ, Marquez N, Dolgert A, Fukutaki K, Fullman N, McGaughey M, Pletcher MA, Smith AE, Tang K, Yuan CW, Brown JC, Friedman J, He J, Heuton KR, Holmberg M, Patel DJ, Reidy P, Carter A, Cercy K, Chapin A, Douwes-Schultz D, Frank T, Goettsch F, Liu PY, Nandakumar V, Reitsma MB, Reuter V, Sadat N, Sorensen RJD, Srinivasan V, Updike RL, York H, Lopez AD, Lozano R, Lim SS, Mokdad AH, Vollset SE, Murray CJL. Forecasting life expectancy, years of life lost, and all causE and cause-specific mortality for 250 causes of death: reference and alternative scenarios for 2016–40 for 195 countries and territories. Lancet. 2018; 392: 2052-90.,2222 Rajia S, Sabiruzzaman M, Islam MK, Hossain MG, Lestrel PE. Trends and future of maternal and child health in Bangladesh. PLoS One. 2019; 14 (3): e0211875.

A utilização de modelos ARIMA na saúde infantil funcionaria como uma ferramenta que antecede e subsidia a prática assistencial. Sua incorporação no planejamento de ações estratégicas de impacto pode contribuir na redução de desfechos desfavoráveis no processo saúde-doença materno e infantil.44 Foreman KJ, Marquez N, Dolgert A, Fukutaki K, Fullman N, McGaughey M, Pletcher MA, Smith AE, Tang K, Yuan CW, Brown JC, Friedman J, He J, Heuton KR, Holmberg M, Patel DJ, Reidy P, Carter A, Cercy K, Chapin A, Douwes-Schultz D, Frank T, Goettsch F, Liu PY, Nandakumar V, Reitsma MB, Reuter V, Sadat N, Sorensen RJD, Srinivasan V, Updike RL, York H, Lopez AD, Lozano R, Lim SS, Mokdad AH, Vollset SE, Murray CJL. Forecasting life expectancy, years of life lost, and all causE and cause-specific mortality for 250 causes of death: reference and alternative scenarios for 2016–40 for 195 countries and territories. Lancet. 2018; 392: 2052-90. Recentemente, alguns estudos utilizaram a modelagem ARIMA para expressar diferentes dimensões sobre a questão. A Tabela 1 apresenta alguns exemplos.

Apesar disso, há uma lacuna significativa na utilização de métodos estatísticos no processo decisório e formulador de políticas em saúde.11 Marchant T, Boerma T, Diaz T, Huicho L, Kyobutungi C, Mershon CH, Schellenberg J, Somers K, Waiswa P. Measurement and accountability for maternal, newborn and child health: fit for 2030?. BMJ Global Health. 2020; 5: e002697.,2323 Oelke ND; Lima MADS; Acosta AM. Translação do conhecimento: traduzindo pesquisa para uso na prática e na formulação de políticas. Rev Gaúcha Enferm. 2015; 36 (3): 113-7. Um exemplo é a incorporação dos estudos de séries temporais como ferramenta para a prática de gestão em saúde.11 Marchant T, Boerma T, Diaz T, Huicho L, Kyobutungi C, Mershon CH, Schellenberg J, Somers K, Waiswa P. Measurement and accountability for maternal, newborn and child health: fit for 2030?. BMJ Global Health. 2020; 5: e002697.,2323 Oelke ND; Lima MADS; Acosta AM. Translação do conhecimento: traduzindo pesquisa para uso na prática e na formulação de políticas. Rev Gaúcha Enferm. 2015; 36 (3): 113-7. Realizar as predições exige a superação de uma limitação já mencionada: dados coletados sistematicamente (oportunos e de qualidade) e acesso aos dados epidemiológicos, não só pelos tomadores de decisão. Essa é uma realidade na maioria dos países mais pobres, principalmente aqueles com dificuldades em consolidar os sistemas de informações de qualidade e instituir uma cultura de utilização de dados.2121 Frias PG, Szwarcwald CL, Morais Neto OL, Leal MC, Cortez-Escalante JJ, Souza Junior PRB, Almeida WS, Silva Junior JB. Utilização das informações vitais para a estimação de indicadores de mortalidade no Brasil: da busca ativa de eventos ao desenvolvimento de métodos. Cad Saúde Pública. 2017; 33 (3): e00206015.

Construir e fortalecer os sistemas de informações em saúde robustos permanece como um desafio. Em 2015, como desdobramento das discussões sobre os objetivos e as metas da Agenda 2030, foram propostos princípios-chave (foco, relevância, inovação, equidade, liderança e propriedade do país) para se alcançar e transpor modelagens robustas de monitoramento mundial dos indicadores em saúde materna e infantil, incluindo a modelagem ARIMA, para as realidades nacionais e locais.11 Marchant T, Boerma T, Diaz T, Huicho L, Kyobutungi C, Mershon CH, Schellenberg J, Somers K, Waiswa P. Measurement and accountability for maternal, newborn and child health: fit for 2030?. BMJ Global Health. 2020; 5: e002697.

O foco refere-se à definição de indicadores de saúde materna e infantil padronizados globalmente para tornar possível medi-los, monitorá-los e estimá- los em todos os subníveis nacionais de saúde.2424 Allik M, Leyland A, Ichihara MYT, Dundas R. Creating small-area deprivation indices: a guide for stages and options. J Epidemiol Community Health. 2019; 74 (1): 20- 5. O propósito é valorizar a produção de dados nacionais e locais, corresponsabilizando os atores nesses espaços na tomada de decisão. Para tanto, é necessário muni-los de capacidade técnica e fomentar tecnologias para superar a complexidade no manejo dos dados. Adicionalmente, requerem-se incentivos subjetivos, como o estímulo e as motivações para o uso dos dados, ao identificarem a potencialidade que a modelagem representa. Somada a esses princípios, agrega-se a perspectiva da inovação.11 Marchant T, Boerma T, Diaz T, Huicho L, Kyobutungi C, Mershon CH, Schellenberg J, Somers K, Waiswa P. Measurement and accountability for maternal, newborn and child health: fit for 2030?. BMJ Global Health. 2020; 5: e002697. O modelo ARIMA, entre outros abordados, trata-se de uma ferramenta promissora na interpretação dos dados.

As predições que a modelagem ARIMA proporciona podem anteceder as ações estratégicas e atenuar a carga de morbimortalidade, fazendo das previsões um meio para aumentar as alternativas para a tomada de decisões. Mesmo diante das limitações inerentes e externas ao método discutido, suas potencialidades, aplicações e versatilidade sobressaem-se, configurando um método viável na prática em saúde.

Tabela 1
Estudos de séries temporais utilizando a modelagem ARIMA na aplicabilidade de estudos sobre a mortalidade infantil.

Referências

  • 1
    Marchant T, Boerma T, Diaz T, Huicho L, Kyobutungi C, Mershon CH, Schellenberg J, Somers K, Waiswa P. Measurement and accountability for maternal, newborn and child health: fit for 2030?. BMJ Global Health. 2020; 5: e002697.
  • 2
    Szwarcwald CL, Leal MC, Almeida WS, Barreto ML, Frias PG, Theme Filha MM, Domingues RMSM, Franca EB, Gama SGN, Boccolini CS, Victora C. Child Health in Latin America. Glob Public Health. 2019; 1: 1-49.
  • 3
    Mishra AK, Sahanaa C, Manikandan M. Forecasting Indian infant mortality rate: An application of autoregressive integrated moving average model. J Family Community Med. 2019; 26 (2): 123-6.
  • 4
    Foreman KJ, Marquez N, Dolgert A, Fukutaki K, Fullman N, McGaughey M, Pletcher MA, Smith AE, Tang K, Yuan CW, Brown JC, Friedman J, He J, Heuton KR, Holmberg M, Patel DJ, Reidy P, Carter A, Cercy K, Chapin A, Douwes-Schultz D, Frank T, Goettsch F, Liu PY, Nandakumar V, Reitsma MB, Reuter V, Sadat N, Sorensen RJD, Srinivasan V, Updike RL, York H, Lopez AD, Lozano R, Lim SS, Mokdad AH, Vollset SE, Murray CJL. Forecasting life expectancy, years of life lost, and all causE and cause-specific mortality for 250 causes of death: reference and alternative scenarios for 2016–40 for 195 countries and territories. Lancet. 2018; 392: 2052-90.
  • 5
    Nyoni SP, Nyoni T. Modeling and forecasting Infant deaths in Zimbabwe using ARIMA Models. JournalNX - A Multidisciplinary Peer Reviewed Journal. 2020; 6 (7): 142- 51.
  • 6
    Morettin PA, Toloi CM. Análise de Séries Temporais. 3 ed. São Paulo: Blucher; 2018.
  • 7
    Wang YW, Shen ZZ, Jiang Y. Comparison of ARIMA and GM (1,1) models for prediction of hepatitis B in China. PLoS One. 2018; 13(9): e0201987.
  • 8
    Jaime AG. Introducción al tratamiento de series temporales: Aplicación a las Ciencias de la Salud. Madrid: Díaz de Santos, S.A; 1994.
  • 9
    Lima LMM, Vianna RPT, Moraes RM. Identificação das anomalias congênitas baseado em um modelo de decisão a partir de redes neurais artificiais. J Health Inform. 2019; 11 (1): 8-12.
  • 10
    Ramalho AA, Andrade AM, Martins FA, Koifman RJ. Infant mortality trend in the city of Rio Branco, AC, 1999 to 2015. Rev Saúde Pública. 2018; 52: 33.
  • 11
    Zheng A, Fang Q, Zhu Y, Jiang C, Jin F, Wang X. An application of ARIMA model for predicting total health expenditure in China from 1978-2022. J Glob Health. 2020; 10 (1): 010803.
  • 12
    Liu Q, Li Z, Ji Y, Zia UH, Javaid A, Lu W, Wang J. Forecasting the seasonality and trend of pulmonary tuberculosis in Jiangsu Province of China using advanced statistical time-series analyses. Infect Drug Resist. 2019; 26 (12): 2311-22.
  • 13
    Singh RK, Rani M, Bhagavathula AS, Sah R, Rodriguez- Morales AJ, Kalita H, Nanda C, Sharma S, Sharma YD, Rabban AA, Rahmani J, Kumar P. Prediction of the COVID-19 Pandemic for the Top 15 Affected Countries: Advanced Autoregressive Integrated Moving Average (ARIMA) Model. JMIR Public Health Surveill. 2020; 6(2).
  • 14
    Usman A, Sulaiman MA, Abubakar I. Trend of Neonatal Mortality in Nigeria from 1990 to 2017 using Time Series Analysis. J. Appl. Sci. Environ. Manage. 2019; 23 (5): 865- 9.
  • 15
    De P, Sahu D, Pandey A, Gulati BK, Chandhiok N, Shukla AK, Mohan P, Mitra RG. Post Millennium Development Goals Prospect on Child Mortality in India: An Analysis Using Autoregressive Integrated Moving Averages (ARIMA) Model. Health. 2016; 8 (15): 1845-72.
  • 16
    GBD 2015 Mortality and Causes of Death Collaborators. Global, regional, and national life expectancy, all-cause mortality, and cause-specific mortality for 249 causes of death, 1980-2015: a systematic analysis for the Global Burden of Disease Study 2015. Lancet. 2016; 388: 1459- 1544.
  • 17
    Slama A, Śliwczyński A, Woźnica J, Zdrolik M, Wiśnicki B, Kubajek J, Turżańska-Wieczorek O, Gozdowski D, Wierzba W, Franek E. Impact of air pollution on hospital admissions with a focus on respiratory diseases: a timeseries multi-city analysis. Environ Sci Pollut Res. 2019 26 (17) 16998–17009.
  • 18
    Naderimagham S, Jamshidi H, Khajavi A, Pishgar F, Ardam A, Larijani B, Mahmoudi Z, Jeddian A, Bahrami-Taghanaki HR, Farzadfar F. Impact of rural family physician program on child mortality rates in Iran: a time-series study. Popul Health Metrics. 2017; 15: 21.
  • 19
    Li Y, Chen SF, Dong XJ, Zhao XJ. Prediction of causespecific disability-adjusted life years in China from 2018 through 2021: a systematic analysis. Public Health. 2020; 180: 90-9.
  • 20
    Maia LTS, Souza WV, Mendes ACG. Determinantes individuais e contextuais associados à mortalidade infantil nas capitais brasileiras: uma abordagem multinível. Cad Saúde Pública. 2020; 36 (2): e00057519.
  • 21
    Frias PG, Szwarcwald CL, Morais Neto OL, Leal MC, Cortez-Escalante JJ, Souza Junior PRB, Almeida WS, Silva Junior JB. Utilização das informações vitais para a estimação de indicadores de mortalidade no Brasil: da busca ativa de eventos ao desenvolvimento de métodos. Cad Saúde Pública. 2017; 33 (3): e00206015.
  • 22
    Rajia S, Sabiruzzaman M, Islam MK, Hossain MG, Lestrel PE. Trends and future of maternal and child health in Bangladesh. PLoS One. 2019; 14 (3): e0211875.
  • 23
    Oelke ND; Lima MADS; Acosta AM. Translação do conhecimento: traduzindo pesquisa para uso na prática e na formulação de políticas. Rev Gaúcha Enferm. 2015; 36 (3): 113-7.
  • 24
    Allik M, Leyland A, Ichihara MYT, Dundas R. Creating small-area deprivation indices: a guide for stages and options. J Epidemiol Community Health. 2019; 74 (1): 20- 5.
  • 25
    Oliveira C, Silva NT, Stanojevic S, Avitzur Y, Bayoumi AM, Ungar WJ, Hoch JS, Wales PW. Change of Outcomes in Pediatric Intestinal Failure: Use of Time-Series Analysis to assess the evolution of an Intestinal Rehabilitation Program. J Am Coll Surg. 2016; 222 (6): 1180-8.
  • 26
    Singh MP, Singh RD. Predicting infant mortality in India using time series models. Int J Statistics Appl Mathematics. 2018; 3(5): 33-42.
  • 27
    Chaib DC. A mortalidade infantil no estado de São Paulo: uma previsão da taxa por meio da modelagem SARIMA. Rev Econ UEG]. 2019; 15 (1): 43-52.

Datas de Publicação

  • Publicação nesta coleção
    10 Set 2021
  • Data do Fascículo
    Apr-Jun 2021

Histórico

  • Recebido
    1 Set 2020
  • Preprint postado em
    18 Jan 2021
  • Aceito
    24 Mar 2021
Instituto de Medicina Integral Prof. Fernando Figueira Rua dos Coelhos, 300. Boa Vista, 50070-550 Recife PE Brasil, Tel./Fax: +55 81 2122-4141 - Recife - PR - Brazil
E-mail: revista@imip.org.br