Acessibilidade / Reportar erro

Previsão da concentração de material particulado inalável, na Região da Grande Vitória, ES, Brasil, utilizando o modelo SARIMAX

Inhalable particulate matter concentration forecast, in the Greater Vitória Region, ES, Brazil, using the SARIMAX model

RESUMO

Este trabalho objetivou modelar e prever a concentração média diária de material particulado inalável (MP10), na Região da Grande Vitória (RGV), Espírito Santo, Brasil, utilizando o modelo SARIMAX para o período de 01/01/2012 a 30/04/2015. Os dados deste estudo foram do tipo séries temporais de concentrações de MP10 e de variáveis meteorológicas (velocidade do vento, umidade relativa, precipitação pluvial e temperatura), obtidas junto ao Instituto Estadual de Meio Ambiente e Recursos Hídricos (IEMA), sendo escolhida a estação da Enseada do Suá para fazer o estudo de predição e previsão. Baseando-se em indicadores de desempenho de modelagem, verificou-se que o modelo SARIMAX (1,0,2) (0,1,1)7 é o mais acurado entre os estudados, objetivando fazer predições e previsões da qualidade do ar na RGV. Em comparação com os modelos ARMA, o desempenho estatístico do modelo SARIMAX foi superior, no que diz respeito à predição de eventos de qualidade do ar regular. Dentre as variáveis meteorológicas avaliadas, a velocidade do vento e a precipitação pluvial foram significativas e melhoraram o ajuste do modelo. Em termos de previsão da qualidade do ar, os modelos de séries temporais mostraram resultados satisfatórios.

Palavras-chave:
poluição do ar; MP10; séries temporais; SARIMAX

ABSTRACT

This study aimed to model and forecast the average daily concentration of inhalable particulate matter (PM10), in the Greater Vitoria Region (GVR), Espírito Santo, Brazil, using the SARIMAX model, for the period from January 1st, 2012 to April 30th, 2015. Data set from the State Environmental Institute was used. The Enseada do Suá station was chosen for purposes of prediction and forecasting. Some meteorological parameters (wind speed, relative humidity, rainfall and temperature) measured at the GVR were taken as explanatory variables of PM10 concentrations. Based on modelling performance indicators, it was verified the SARIMAX model (1.0.2) (0.1.1)7 is the most accurate between the ones studied, purposing to predict and forecast the air quality in the GVR. The statistical performance of the SARIMAX model was better than the ARMA model, with regard to prediction of regular air quality events. Among the evaluated meteorological variables, wind speed and rainfall were significant and improved the model estimated. Regarding to air quality forecasting, the time series models showed satisfactory results.

Keywords:
air pollution; PM10; time series; SARIMAX

INTRODUÇÃO

A poluição atmosférica caracteriza-se basicamente pela presença de gases tóxicos e partículas sólidas no ar (SEINFELD & PANDIS, 2006SEINFELD, J.H.; PANDIS, S.N. (2006) Atmospheric Chemistry and Physics. 2. ed. Nova Jersey: John Wiley & Sons.). Suas fontes são classificadas em antropogênicas, como, por exemplo, emissões provenientes de indústrias e escapamentos de veículos; e naturais, como as decorrentes de erupções vulcânicas. Segundo Holgate et al. (1999HOLGATE, S.T.; SAMET, J.M.; KOREN, H.S.; MAYNARD, R.L. (1999) Air Pollution and Health. San Diego: Academic Press.), um nível elevado dos poluentes pode ocasionar desde irritação nos olhos, nariz e garganta, bronquite e pneumonia, até doenças respiratórias crônicas, câncer de pulmão, problemas cardíacos etc. Diversos estudos epidemiológicos têm demonstrado associações significativas entre a exposição às concentrações elevadas de poluentes atmosféricos e problemas de saúde (OSTRO et al., 1996OSTRO, B.; SANCHEZ, J.M.; ARANDA, C.; ESKELAND, G.S. (1996) Air pollution and mortality: results from a study of Santiago, Chile. Journal of Exposure Analysis and Environmental Epidemiology, v. 6, p. 97-114.; MARTINS et al., 2002MARTINS, L.C.; LATORRE, M.R.D.O.; CARDOSO, M.R.A.; GONÇALVES, F.L.T.; SALDIVA, P.H.N.; BRAGA, A.L.F. (2002) Poluição atmosférica e atendimentos por pneumonia e gripe em São Paulo, Brasil. Revista de Saúde Pública, v. 36, n. 1, p. 88-94. http://dx.doi.org/10.1590/S0034-89102002000100014
http://dx.doi.org/10.1590/S0034-89102002...
; GOUVEIA et al., 2003GOUVEIA, N.; MENDONÇA, G.A.S.; LEON, A.P.; CORREIA, J.E.M.; JUNGER, W.L.; FREITAS, C.U.; DAUMAS, R.P.; MARTINS, L.C.; GIUSSEPE, L.; CONCEIÇÃO, G.M.S.; MANERICH, A.; CUNHA-CRUZ, J. (2003) Poluição do ar e efeitos na saúde nas populações de duas grandes metrópoles brasileiras. Epidemiologia e Serviços de Saúde, v. 12, p. 29-40. http://dx.doi.org/10.5123/S1679-49742003000100004
http://dx.doi.org/10.5123/S1679-49742003...
; ALMEIDA, 2006ALMEIDA, M.A.I. (2006) Modelo Aditivo Generalizado (MAG) no estudo da relação entre o número de atendimentos hospitalares por causas respiratórias e a qualidade do ar. Dissertação (Mestrado em Engenharia Ambiental) - Programa de Pós-Graduação em Engenharia Ambiental, Centro Tecnológico, Universidade Federal do Espírito Santo, Vitória.; NASCIMENTO et al., 2006NASCIMENTO, L.F.C.; PEREIRA, L.A.A.; BRAGA, A.L.F.; MÓDOLO, M.C.C.; CARVALHO JR., J.A.C. (2006) Efeitos da poluição atmosférica na saúde infantil em São José dos Campos, SP. Revista de Saúde Pública, v. 40, p. 77-82. http://dx.doi.org/10.1590/S0034-89102006000100013
http://dx.doi.org/10.1590/S0034-89102006...
; CURTIS et al., 2006CURTIS, L.; REA, W.; SMITH-WILLIS, P.; FENYVES, E.; PAN, Y. (2006) Adverse health effects of outdoor air pollutants. Environment International, v. 32, n. 6, p. 815-830. https://doi.org/10.1016/j.envint.2006.03.012
https://doi.org/10.1016/j.envint.2006.03...
; BRAGA et al., 2007BRAGA, A.L.F.; PEREIRA, L.A.A.; PROCÓPIO, M.; ANDRÉ, P.A.D.; SALDIVA, P.H.D.N. (2007) Associação entre poluição atmosférica e doenças respiratórias e cardiovasculares na cidade de Itabira, Minas Gerais, Brasil. Cadernos de Saúde Pública, v. 23, supl. 4, p. S570-S578. http://dx.doi.org/10.1590/S0102-311X2007001600017
http://dx.doi.org/10.1590/S0102-311X2007...
; SOUZA et al., 2014SOUZA, J.B.; REISEN, V.A.; SANTOS, J.M.; FRANCO, G.C. (2014). Componentes principais e modelagem linear generalizada na associação entre atendimento hospitalar e poluição do ar. Revista de Saúde Pública, v. 48, n. 3, p. 451-458. DOI: 10.1590/S0034-8910.2014048005078
https://doi.org/10.1590/S0034-8910.20140...
).

A previsão da qualidade do ar pode ser utilizada como ferramenta de alerta sobre a concentração de poluentes na atmosfera e permitir a tomada de decisão quanto à adaptação de comportamento da população de grupos de risco, como crianças, idosos e pessoas com doenças respiratórias. Além disso, também pode servir para as autoridades competentes como informação para a preparação de planos para redução de emissões e gerenciamento da qualidade do ar (GOMES, 2009GOMES, K.S. (2009) Modelagem INAR(p) para a previsão de índices de qualidade do ar. 71 f. Dissertação (Mestrado em Engenharia Ambiental) - Programa de Pós-Graduação em Engenharia Ambiental, Centro Tecnológico, Universidade Federal do Espírito Santo, Vitória.).

Na literatura, existem vários trabalhos que utilizaram modelos estatísticos para modelar e fazer previsão da qualidade do ar. Agirre-Basurko, Ibarra-Berastegui e Madariaga (2006AGIRRE-BASURKO, E.; IBARRA-BERASTEGUI, G.; MADARIAGA, I. (2006) Regression and multilayer perceptron-based models to forecast hourly O3 and NO2 leves in the Bilbao area. Environmental Modelling and Software, v. 21, p. 430-446. http://dx.doi.org/10.1016/j.envsoft.2004.07
http://dx.doi.org/10.1016/j.envsoft.2004...
) utilizaram três modelos, um de regressão linear múltipla e dois de rede neural para modelar e prever a qualidade do ar da cidade de Bilbao, Espanha. O fluxo de veículos e as variáveis meteorológicas foram usados como modelos de dados de entrada - temperatura, umidade relativa, pressão, radiação, gradiente de temperatura, direção do vento e velocidade do vento - no período de 1993 a 1994. Como saída prevista para modelos, ­adotou-se as concentrações de O3 e NO2, com horizonte de previsão de oito horas à frente. Os resultados mostraram que os modelos de rede neural obtiveram resultados melhores para a previsão das concentrações de O3 e NO2 quando comparados ao modelo de regressão linear múltipla. Quanto ao desempenho dos modelos de rede neural, o que mais se destacou foi o modelo que considerou a sazonalidade da série das concentrações de O3 e NO2.

Goyal, Chan e Jaiswal (2006GOYAL, P.; CHAN, A.T.; JAISWAL, N. (2006) Statistical models for the prediction of respirable suspended particulate matter in urban cities. Atmospheric Environment, v. 40, n. 11, p. 2068-2077. https://doi.org/10.1016/j.atmosenv.2005.11.041
https://doi.org/10.1016/j.atmosenv.2005....
) realizaram um estudo com três modelos estatísticos aplicados à média diária de concentração de MP10, medido nas cidades de Delhi e Hong Kong. O trabalho objetivou desenvolver um modelo estatístico de previsão das concentrações de MP10 e promover um estudo comparativo através do desempenho dos modelos, a saber:

  1. modelo de regressão linear múltipla (modelo 1);

  2. modelo de séries temporais ARIMA (modelo 2);

  3. combinação entre os modelos 1 e 2 (modelo 3).

Além do MP10, alguns parâmetros meteorológicos foram adotados, como a velocidade do vento, a temperatura, a radiação solar e a umidade relativa do ar, medidos no período de junho de 2000 a junho de 2001. Na comparação entre os modelos, as medidas de erro mostraram que o modelo 3 foi o que obteve o melhor desempenho. O estudo de previsão ocorreu apenas para a cidade de Delhi, e compreendeu o período de junho de 2001 a junho de 2002. O modelo 3 foi utilizado, e os resultados da previsão foram satisfatórios.

Gomes (2009GOMES, K.S. (2009) Modelagem INAR(p) para a previsão de índices de qualidade do ar. 71 f. Dissertação (Mestrado em Engenharia Ambiental) - Programa de Pós-Graduação em Engenharia Ambiental, Centro Tecnológico, Universidade Federal do Espírito Santo, Vitória.) realizou um estudo de previsão de índices de qualidade do ar da Região da Grande Vitória (RGV), Espírito Santo, Brasil, utilizando o modelo autorregressivo de valores inteiros INAR(p). O período de análise foi de 01/01/07 a 19/03/07, sendo as previsões datadas de 20/03/07 a 25/03/07. Os poluentes investigados foram: monóxido de carbono (CO), dióxido de nitrogênio (NOx), dióxido de enxofre (SO2) e ozônio (O3). Para a escolha do modelo mais adequado, o autor utilizou o critério de seleção automática para modelos INAR(p), o AICCINAR, que seleciona a melhor ordem p para cada modelo. Os resultados mostraram que todas as previsões para os índices de qualidade do ar foram classificadas como boa, conforme a Resolução do Conselho Nacional do Meio Ambiente (CONAMA, 1990CONAMA - Conselho Nacional de Meio Ambiente. (1990) Resolução nº 03, de 28 de junho de 1990. Dispõe sobre padrões de qualidade do ar, previstos no PRONAR. Diário Oficial da República Federativa do Brasil, Brasília, Seção 1, p. 15937-15939.) nº 03. Porém, baseados nas diretrizes da World Health Organization (WHO, 2005WORLD HEALTH ORGANIZATION (WHO). (2005) Air quality guidelines global update 2005. Report on a working group meeting, Bonn/Alemanha: WHO. Disponível em: <Disponível em: http://www.euro.who.int/__data/assets/pdf_file/0008/147851/E87950.pdf >. Acesso em: 20 jan. 2016.
http://www.euro.who.int/__data/assets/pd...
), a previsão do poluente SO2 no dia 20/03/07, estação do Centro de Vila Velha, excedeu o valor de 20 µg.m-3 para média de 24 horas, ou seja, mesmo estando dentro o limite do padrão nacional essa concentração é prejudicial para a saúde humana.

Gripa et al. (2012GRIPA, W.R.; REISEN, V.A.; FAJARDO, F.A.; REIS JUNIOR, N.C. (2012) Análise de predição e previsão das concentrações de material particulado inalável (PM10) na cidade de Carapina, ES. Revista Brasileira de Estatística, v. 73, n. 237, p. 37-57.) compararam dois modelos: um de séries temporais e um de regressão linear múltipla, para modelagem e previsão das concentrações médias de MP10, monitorados na RGV, com a incorporação de fatores meteorológicos. Ambos os modelos evidenciaram resultados semelhantes. No entanto, o modelo de regressão apresentou medidas de previsão das concentrações médias de MP10 um pouco melhores do que o modelo de séries temporais. Reisen et al. (2014REISEN, V.A.; SARNAGLIA, A.J.Q.; REIS JUNIOR, N.C.; LÉVY-LEDUC, C.; SANTOS, J.M. (2014) Modeling and forecasting daily average PM10 concentrations by a seasonal long-memory model with volatility. Environmental Modelling & Software, v. 51, p. 286-295. https://doi.org/10.1016/j.envsoft.2013.09.027
https://doi.org/10.1016/j.envsoft.2013.0...
) modelaram a média diária de concentração de MP10, na cidade de Cariacica, Espírito Santo, Brasil, utilizando um processo integrado fracionado sazonal, com volatilidade. Os autores concluíram que o modelo, ajustado com erros heterocedásticos, captou bem a dinâmica da série e foi capaz de prever os períodos de maior volatilidade.

Monte, Albuquerque e Reisen (2015MONTE, E.Z.; ALBUQUERQUE, T.T.A.; REISEN, V.A. (2015) Previsão da concentração de ozônio na Região da Grande Vitória, Espírito Santo, Brasil, utilizando o modelo ARMAX-GARCH. Revista Brasileira de Meteorologia, v. 30, n. 3, p. 285-294. http://dx.doi.org/10.1590/0102-/10.1590/0102-778620140060
http://dx.doi.org/10.1590/0102-/10.1590/...
) realizaram um estudo para estimar e prever a concentração horária de ozônio na RGV, utilizando um modelo ARMAX-GARCH no período de 01/01/2011 a 31/12/2011. O estudo utilizou dados cedidos pelo Instituto Estadual de Meio Ambiente e Recursos Hídricos (IEMA). De acordo com os resultados apresentados, as previsões horárias para o dia 31/12/2011 foram muito próximas dos valores observados. Observou-se também que as estimativas seguiram a trajetória diária da concentração de ozônio. Os autores concluíram que o modelo ARMAX-GARCH é mais eficaz na predição de episódios de poluição de ozônio, em comparação aos modelos autorregressivos e de médias móveis (ARMA) e autorregressivos e de médias móveis com variáveis explicativas (ARMAX).

Vale ressaltar que uma série temporal é composta, em geral, por três componentes não observáveis, a saber: tendência, sazonalidade e aleatoriedade. A sazonalidade é uma componente difícil de ser modelada, pois é necessário compatibilizar a questão física do problema em estudo com a questão estatística. Define-se um fenômeno sazonal como aquele que ocorre regularmente em períodos fixos de tempo (LATORRE & CARDOSO, 2001LATORRE, M.R.D.O.; CARDOSO, M.R.A. (2001) Análise de séries temporais em epidemiologia: uma introdução sobre os aspectos metodológicos. Revista Brasileira de Epidemiologia, v. 4, n. 3, p. 145-152. http://dx.doi.org/10.1590/S1415-790X2001000300002
http://dx.doi.org/10.1590/S1415-790X2001...
). Na análise de séries temporais, os modelos ARMA podem ser empregados quando a série em estudo está livre de tendência e de sazonalidade, os modelos ARIMA são utilizados quando há tendência e, para incorporar o componente de sazonalidade, utilizam-se os modelos autorregressivos integrados e de médias móveis sazonal multiplicativo (SARIMA) (LATORRE & CARDOSO, 2001LATORRE, M.R.D.O.; CARDOSO, M.R.A. (2001) Análise de séries temporais em epidemiologia: uma introdução sobre os aspectos metodológicos. Revista Brasileira de Epidemiologia, v. 4, n. 3, p. 145-152. http://dx.doi.org/10.1590/S1415-790X2001000300002
http://dx.doi.org/10.1590/S1415-790X2001...
; MORETTIN & TOLOI, 2006MORETTIN, P.A.; TOLOI, C.M.C. (2006) Análise de séries temporais. 2. ed. São Paulo: Blucher.). Conforme Reisen et al. (2014REISEN, V.A.; SARNAGLIA, A.J.Q.; REIS JUNIOR, N.C.; LÉVY-LEDUC, C.; SANTOS, J.M. (2014) Modeling and forecasting daily average PM10 concentrations by a seasonal long-memory model with volatility. Environmental Modelling & Software, v. 51, p. 286-295. https://doi.org/10.1016/j.envsoft.2013.09.027
https://doi.org/10.1016/j.envsoft.2013.0...
), os modelos que descrevem de forma adequada o comportamento físico do dados são essenciais para a previsão precisa em qualquer área de aplicação, pois a sazonalidade é um fenômeno característico do poluente MP10.

Nesse contexto, este trabalho objetivou modelar e prever a concentração média diária de MP10, na RGV, utilizando o modelo SARIMAX, no período 01/01/2012 a 30/04/2015. Mesmo tendo ultrapassado apenas 3 vezes os padrões primário e secundário (150 µg.m-3), média de 24 horas, estabelecidos pela Resolução CONAMA nº 03, de 28/06/1990 (CONAMA, 1990CONAMA - Conselho Nacional de Meio Ambiente. (1990) Resolução nº 03, de 28 de junho de 1990. Dispõe sobre padrões de qualidade do ar, previstos no PRONAR. Diário Oficial da República Federativa do Brasil, Brasília, Seção 1, p. 15937-15939.), no período de estudo, em 144 dias, de um total de 1.216, as concentrações monitoradas na estação da Enseada do Suá excederam o valor de 50 µg.m-3, o que vai de encontro com as diretrizes estabelecidas pela WHO (2005WORLD HEALTH ORGANIZATION (WHO). (2005) Air quality guidelines global update 2005. Report on a working group meeting, Bonn/Alemanha: WHO. Disponível em: <Disponível em: http://www.euro.who.int/__data/assets/pdf_file/0008/147851/E87950.pdf >. Acesso em: 20 jan. 2016.
http://www.euro.who.int/__data/assets/pd...
) para esse poluente. O IEMA estabelece uma qualidade do ar boa, para concentrações de MP10 entre 0 e 45 µg.m-3; regular para aquelas entre 46 e 120 µg.m-3; inadequada, entre 121 e 250 µg.m-3 (IEMA, 2013IEMA - Instituto Estadual de Meio Ambiente e Recursos Hídricos do Estado do Espírito Santo. (2013) Relatório da qualidade do ar da Região da Grande Vitória. Vitória: IEMA. Disponível em: <Disponível em: https://iema.es.gov.br/Media/iema/Downloads/RAMQAR/Relat%C3%B3rio_Anual_de_Qualidade_do_Ar_2013.pdf >. Acesso em: 10 jun. 2016.
https://iema.es.gov.br/Media/iema/Downlo...
). No período de estudo, em 450 ocasiões a qualidade do ar foi classificada como regular; e em 6, como inadequadas. Logo, a importância desta pesquisa é justificada, principalmente no que diz respeito à formulação de medidas preventivas por parte das autoridades competentes, uma vez que a concentração de MP10 vem atingindo níveis que são prejudiciais à saúde na região de estudo.

MATERIAL E MÉTODOS

Área de estudo e variáveis analisadas

Para a realização desse estudo, utilizou-se séries temporais de concentrações de poluentes atmosféricos e de variáveis meteorológicas monitorados na RGV, que é constituída pelos municípios de Vitória, Vila Velha, Cariacica, Serra e Viana. Segundo o Instituto Brasileiro de Geografia e Estatística (IBGE, 2010IBGE - Instituto Brasileiro de Geografia e Estatística. (2010) Censo 2010. Disponível em: <Disponível em: http://www.ibge.gov.br/home/estatistica/populacao/censo2010/resultados_dou/ES2010.pdf >. Acesso em: 01 dez. 2015.
http://www.ibge.gov.br/home/estatistica/...
), a RGV abrange uma área de 1.461 km2, com aproximadamente 1.475.332 habitantes, sendo um dos principais polos de desenvolvimento urbano e industrial do estado. A região sofre com diversos tipos de problemas ambientais, entre os quais está a deterioração da qualidade do ar, devido às emissões atmosféricas por indústrias, pela frota veicular e ressuspensão do solo causada pelo vento e tráfego veicular.

Vale ressaltar que a RGV possui uma Rede Automática de Monitoramento da Qualidade do Ar (RAMQAR), inaugurada em julho de 2000, de propriedade do IEMA. Essa rede é distribuída em oito estações, a saber:

  • o município Serra; com duas estações localizadas nas regiões de Laranjeiras e Carapina;

  • o município Vitória, com três estações localizadas nas regiões de Jardim Camburi, Enseada do Suá e Centro de Vitória;

  • o município de Vila Velha apresenta duas estações localizadas nas regiões do Ibes e Centro de Vila Velha;

  • o município de Cariacica, com uma estação em Cariacica.

A localização espacial das estações de monitoramento da RAMQAR está ilustrada na Figura 1.

Figura 1:
Localização espacial das estações de monitoramento da qualidade do ar da RGV.

A RAMQAR monitora os seguintes poluentes: partículas totais em suspensão (PTS); MP10; O3; NOx; CO e hidrocarbonetos (HC). E realiza, ainda, o monitoramento dos seguintes parâmetros meteorológicos: direção dos ventos (DV); velocidade dos ventos (VV); precipitação pluviométrica (PP); umidade relativa do ar (UR); precipitação pluviométrica (PP); temperatura (T); pressão atmosférica (P); e radiação solar (I). Os poluentes e parâmetros meteorológicos monitorados em cada estação RAMQAR encontram-se no Quadro 1. Na análise deste trabalho, as variáveis MP10, VV, UR, PP e T foram utilizadas conforme descrição do Quadro 2.

Quadro 1:
Parâmetros meteorológicos e poluentes monitorados em cada estação da Rede Automática de Monitoramento da Qualidade do Ar.

Quadro 2:
Descrição das variáveis material particulado inalável, velocidade do vento, umidade, precipitação e temperatura.

Modelo SARIMAX

Uma série temporal é um conjunto de observações de qualquer fenômeno aleatório, ordenadas no tempo. A análise de séries temporais consiste em procurar alguma relação de dependência existente temporalmente nos dados, identificando o mecanismo gerador da série com objetivo de extrair periodicidades relevantes nas observações, descrever o seu comportamento e fazer previsões (MORETTIN & TOLOI, 2006MORETTIN, P.A.; TOLOI, C.M.C. (2006) Análise de séries temporais. 2. ed. São Paulo: Blucher.; BAYER & SOUZA, 2010BAYER, F.M.; SOUZA, A.M. (2010) Wavelets e modelos tradicionais de previsão: um estudo comparativo. Revista Brasileira de Biometria, v. 28, n. 2, p. 40-61.).

Seja Yt (t = 1, 2, 3, ...) um processo linear com representação dada pela Equação 1:

( 1 - B ) d ( 1 - B S ) d Φ ( B S ) Φ ( B ) Y t = Θ ( B S ) θ ( B ) ε t (1)

Em que

s é chamado período sazonal do processo e,

εt, é ruído branco (RB), definido como uma sequência de variáveis aleatórias não correlacionadas com média zero e variância constante ao longo do tempo (WEI, 2006WEI, W. (2006) Time Series Analysis: Univariate and Multivariate Methods. Nova York: Addison Wesley.), ou seja, εt~RB(0, σ2 ε).

Em (1 - B)d(1 - BS)D, d e D são números inteiros não negativos e representam o número de diferenças simples e sazonais, respectivamente, aplicadas sobre o processo Yt.

Tem-se que, B é o operador de defasagem definido como BkYt = Yt-k, k ∈ℕ, ϕ(z) = 1 - Σp k=1 ϕkzk, Φ(zS) = 1 - Σp k=1 Φkzsk, θ(z) = 1 - Σq k=1 θkzk e Θ(zS) = 1 - ΣQ k=1 Θkzsk são polinômios de ordem P, p, Q, q ∈ℕ respectivamente, com z ∈ℂ, em que ℂ representa o conjunto dos números complexos e {ϕk}, {θk}, {Φk}, {Θk} são sequências de números reais. O processo Yt. com representação dada na Equação 1 é denominado modelo autorregressivo integrado e de médias móveis sazonal multiplicativo (SARIMA), de ordem (p, d, q) × (P, D, Q)S. O processo Yt é estacionário e invertível se d = D = 0 e as raízes de ϕ(z), Φ(zS), θ(z) e Θ(zS) são não comuns e encontram-se fora do círculo unitário (WEI, 2006WEI, W. (2006) Time Series Analysis: Univariate and Multivariate Methods. Nova York: Addison Wesley.). As ordens p, d, q, P, D, Q e s devem ser identificadas seguindo a metodologia de Box e Jenkins (1970BOX, G.; JENKINS, G. (1970) Time Series Analysis: Forecasting and Control. São Francisco: Holden-Day.).

Nesse estudo, foi considerado o modelo SARIMAX (modelo autorregressivo integrado e de médias móveis sazonal multiplicativo com variáveis explicativas), que é uma extensão do modelo SARIMA, utilizando outras séries temporais como variáveis explicativas. O modelo SARIMAX explica a variável dependente por meio de: variáveis explicativas; defasagens das variáveis explicativas; e defasagens da variável dependente (MOURA; MONTINI; CASTRO, 2011MOURA, F.A.; MONTINI, A.A.; CASTRO, J.B.B. (2011) Modelagem do Consumo de Energia Elétrica Residencial no Brasil Através de Modelos ARMAX. In: SEMINÁRIO DE ADMINISTRAÇÃO, 14., 2011. Anais...).

Metodologia de modelagem

A comprovação da sazonalidade foi verificada pela análise espectral e pelo teste G de Fisher. As hipóteses testadas foram as seguintes:

1. H0: não existe sazonalidade;

2. H1: existe sazonalidade.

A estatística do teste é dada pela Equação 2:

G = m a x [ I p f i ] i = 1 ( N 2 ) I p ( f i ) (2)

Em que:

Ip = periodograma no período p; e

N = número de observações da série.

Segundo Barbosa et al. (2015BARBOSA, E.C.; SÁFADI, T.; NASCIMENTO, M.; NASCIMENTO, A.C.C.; SILVA, C.H.O.; MANULI, R.C. (2015) Metodologia Box & Jenkins para previsão de temperatura média mensal da cidade de Bauru (SP). Revista Brasileira de Biometria, v. 33, n. 1, p. 104-117.), o periodograma consiste na decomposição da série temporal em uma série de Fourier. No eixo das ordenadas ficam localizadas as frequências da série (fi) e no eixo das abscissas as respectivas intensidades de cada frequência Ip(fi), definidas pela Equação 3:

I p f i = 2 ( N 2 ) { t = 1 n t c o s [ 2 π i N 2 t 2 ] + t = 1 n t s i n [ 2 π i N 2 t 2 ] } (3)

Em que

t representa o componente estocástico da série temporal associado ao tempo t e N é o número de observações da série. A distribuição exata de G é dada por Zα = 1-(αc)1c-1 - sendo c =(N2) e α o nível de significância adotado. Se G>Z, a hipótese H0 é rejeitada e a série apresenta periodicidade no período i. Para determinar o período sazonal (s) verifica-se a qual frequência está associado o maior valor Ip(fi) e, então, divide 1 por esse valor de frequência, isto é, s =(1fi). Para detalhes, consultar Morettin e Toloi (2006MORETTIN, P.A.; TOLOI, C.M.C. (2006) Análise de séries temporais. 2. ed. São Paulo: Blucher.).

A metodologia de Box e Jenkins aplicada neste trabalho está dividida nas seguintes etapas:

  1. identificação;

  2. estimação;

  3. diagnóstico;

  4. previsão.

A identificação do modelo a ser ajustado aos dados é uma das fases mais complicadas. Para isso, foram utilizados os critérios de seleção de modelos.

O Akaike Information Criterion (AIC) (AKAIKE, 1973AKAIKE, H. (1973) Information theory and an extension of the maximum likelihood principle. In: PETROV, B.N.; CSAKI, F. (Eds.). Proceedings of the Second International Symposium on Information Theory. Budapeste: Akademiai Kiado. p. 267-281.) é um critério de seleção comumente utilizado. Utilizando os estimadores de máxima verossimilhança para os parâmetros do modelo, em que (ξˆ) é a função de log-verossimilhança maximizada e k é o número de parâmetros do modelo, o AIC é dado por: AIC = -2l(ξˆ) + 2k. Em uma perspectiva bayesiana, Schwarz (1978SCHWARZ, G. (1978) Estimating the dimensional of a model. The Annals of Statistics, Hayward, v. 6, n. 2, p. 461-464.) e Akaike (1978AKAIKE, H. (1978) A Bayesian analysis of the minimum AIC procedure. Annals of the Institute of Statistical Mathematics, v. 30, n. 1, p. 9-14.) introduziram o Bayesian Information Criterion (BIC), dado por: BIC = -2l(ξˆ) + k log(n), em que n é o número de observações da amostra. Com base nesses critérios de informação, pode-se ajustar diversos modelos e escolher aquele que obtiver o menor valor para o critério de informação.

Além dos critérios de seleção de modelos, outras duas medidas de qualidade de ajuste foram utilizadas para auxiliar na seleção do modelo que melhor se ajusta à série temporal em estudo e, principalmente, na avaliação da qualidade do ajuste. As medidas utilizadas neste trabalho foram a raiz do erro quadrático médio (REQM) e erro absoluto médio (EAM), definidas pelas Equações 4 e 5:

R E Q M = 1 N i = 1 N ( Y i - Y ^ i ) 2 (4)

E A M = 1 N i = 1 N | Y i - Y ^ i | (5)

Em que

Yi e Y i são, respectivamente, os valores observados e previstos no instante i. Um dos principais objetivos deste trabalho foi a comparação entre os modelos quanto ao seu desempenho no processo de ajustamento aos dados em estudo e uma das formas de verificar essa qualidade é o estudo de previsão.

RESULTADOS E DISCUSSÕES

Análise dos dados e ajuste dos modelos

Para um entendimento preliminar das variáveis em estudo são apresentadas algumas medidas descritivas (Tabela 1). A análise corresponde às variáveis apresentadas no Quadro 2, para o período de 01/01/2012 a 30/04/2015, perfazendo um total de 1.216 observações. Todas as análises foram feitas utilizando o software livre R (R CORE TEAM, 2016R CORE TEAM (2016). R: A language and environment for statistical computing. Viena: R Foundation for Statistical Computing. Disponível em: <http://www.R-project.org/>.
http://www.R-project.org/...
). A presença de dados faltantes nas séries motivam o uso da metodologia de imputação via algoritmo expectation-maximisation (EM), proposta por Junger e Leon (2015JUNGER, W.L.; LEON, A.P. (2015) Imputation of missing data in time series for air pollutants. Atmospheric Environment, v. 102, p. 96-104. https://doi.org/10.1016/j.atmosenv.2014.11.049
https://doi.org/10.1016/j.atmosenv.2014....
) e implementada na biblioteca R multivariante time-series data imputation (MTSDI).

Tabela 1:
Medidas descritivas das variáveis sob estudo.

A concentração média de MP10 foi de, aproximadamente, 43,0 µg.m-3 com desvio padrão de 15,3 µg.m-3. Nota-se que, em média, as concentrações não ultrapassaram o valor de 50,0 µg.m-3, porém, o desvio padrão e o coeficiente de variação alto indicam uma média pouco representativa. Além disso, os resultados mostram que o valor máximo foi mais do que o triplo do valor médio, demonstrando a grande variabilidade das concentrações de MP10 na RGV. O valor mínimo foi observado em março de 2013, na estação chuvosa da região, que se inicia a partir do mês de outubro e vai até meados de abril (IEMA, 2013IEMA - Instituto Estadual de Meio Ambiente e Recursos Hídricos do Estado do Espírito Santo. (2013) Relatório da qualidade do ar da Região da Grande Vitória. Vitória: IEMA. Disponível em: <Disponível em: https://iema.es.gov.br/Media/iema/Downloads/RAMQAR/Relat%C3%B3rio_Anual_de_Qualidade_do_Ar_2013.pdf >. Acesso em: 10 jun. 2016.
https://iema.es.gov.br/Media/iema/Downlo...
). Nessa época do ano, a atuação dos sistemas frontais e de zonas de convergência de umidade favorecem o aumento de precipitação. Nesse período, as concentrações de MP10 são menores, principalmente pela intensificação da eficiência dos processos de remoção por deposição úmida. Em relação às variáveis meteorológicas, nota-se que as mesmas mostraram grande variabilidade em termos estatísticos.

A Tabela 2 mostra as correlações calculadas entre as concentrações de médias diárias de MP10, de VV, da UR, de PP e T. Observa-se que as variáveis meteorológicas apresentam relação linear com as concentrações de MP10, na estação de Enseada do Suá. Conforme esperado, os índices de MP10 estão associados às mudanças dessas variáveis, ou seja, infere-se dos resultados (Tabela 2) que o aumento da VV e da T na RGV acarreta aumento nas concentrações de MP10 e que o aumento da PP e UR acarreta diminuição das concentrações de MP10.

Tabela 2:
Matriz de correlação entre as variáveis sob estudo.

A Figura 2 apresenta a série de MP10 e sua decomposição em componentes de tendência, sazonalidade e aleatoriedade. Nota-se a presença da propriedade de sazonalidade e a inexistência de tendência nos dados, uma vez que o gráfico da componente tendência não apresenta um comportamento de crescimento ou decrescimento ao longo do tempo. Segundo Wei (2006WEI, W. (2006) Time Series Analysis: Univariate and Multivariate Methods. Nova York: Addison Wesley.), o primeiro passo na análise de séries temporais é verificar se as mesmas apresentam média, variância e covariância constantes ao longo do tempo, ou seja, se são estacionárias. Caso elas não forem estacionárias, aplica-se a primeira diferença na mesma para tentar estacionarizá-las. O resultado para o teste de Dickey-Fuller Aumentado (ADF) (DICKEY & FULLER, 1981DICKEY, D.A.; FULLER, W.A. (1981) Likelihood ratio statistics for autoregressive time series with a unit root. Econometrica, v. 49, n. 4, p. 1057-1072. DOI: 10.2307/1912517
https://doi.org/10.2307/1912517...
) revela que as séries em estudo são estacionárias na média, o que confirma que a série não apresenta tendência.

Figura 2:
Decomposição da série temporal em componentes de sazonalidade, de tendência e de aleatoriedade.

Como mencionado anteriormente, há indícios de sazonalidade nos dados. Portanto, para confirmar tal hipótese e verificar a necessidade de aplicação de diferenças sazonais, foi realizada a decomposição espectral da série MP10, conforme mostra a Figura 3.

Figura 3:
Periodograma da série de material particulado inalável.

O periodograma demonstra que o maior pico está associado à frequência 0,14333; o que implica em s = = 6,97, ou seja, uma componente sazonal com periodicidade de sete dias. De acordo com o teste de Fisher, foram obtidos os valores das estatísticas G=0,1167 e Z=0,0156. Como o valor de G é superior ao de Z, rejeita-se a hipótese H0, confirmando a existência da componente sazonalidade para períodos de 7 dias ao nível nominal de significância de 5%. A sazonalidade em séries de MP10 é esperada, visto que segundo o IEMA (2013), a principal fonte emissora de partículas na RGV são veículos automotores, representando mais de 60% das emissões de partículas que estão ligados à ressuspensão de partículas em vias. Dessa forma, existe variação entre as concentrações medidas nos dias úteis e finais de semana, uma vez que o fluxo de veículos é maior durante os dias da semana. Logo, uma diferença sazonal de ordem s=10,14333=6,97 foi aplicada para eliminar a sazonalidade presente na série. A Figura 4 mostra a função de autocorrelação (FAC) (a) da série e a FAC (b) da série diferenciada de ordem 7.

Figura 4:
Função de autocorrelação da série (A); e função de autocorrelação da série (B) após aplicação da diferença sazonal.

A identificação preliminar das ordens, p e q e P e Q, do modelo SARIMAX a ser estimado ocorreu pela análise do comportamento da FAC e da função de autocorrelação parcial (FACP), para detalhes ver Wei (2006WEI, W. (2006) Time Series Analysis: Univariate and Multivariate Methods. Nova York: Addison Wesley.). Dessa forma, com os valores de p e q variando de 1 a 3, e P e Q de 0 a 3, intervalos escolhidos pela indicações do correlograma, testaram-se alguns modelos com essas combinações. Como a série é estacionária, não houve a necessidade de aplicar diferenças de ordem 1, então, tem-se que d=0. Da mesma forma, como uma diferença sazonal foi aplicada, tem-se D=1. Feito isso, a identificação das ordens autorregressivas e de médias móveis, do melhor modelo para representar os dados, baseou-se nos critérios de informação AIC, BIC e nos valores da REQM e EAM. Dentre todos o modelos estimados, o modelo com melhor ajuste foi o SARIMAX(1,0,2)(0,1,1)7, por ter apresentado os menores valores calculados para os critérios de informação e medidas de qualidade. Sendo assim, esse torna-se o modelo de interesse.

Para verificar a adequação do modelo, a teoria estatística estabelece suposições das propriedades do mesmo, tais como não autocorrelação e normalidade dos resíduos (WEI, 2006WEI, W. (2006) Time Series Analysis: Univariate and Multivariate Methods. Nova York: Addison Wesley.). Na Tabela 3 são apresentadas as estatísticas para os testes Shapiro e Wilk (1965SHAPIRO, S.S.; WILK, M.B. (1965) An analysis of variance test for normality (complete samples). Biometrika, v. 52, n. 3-4, p. 591-611. DOI: 10.2307/2333709
https://doi.org/10.2307/2333709...
), Bera e Jarque (1981BERA, A.K.; JARQUE, C.M. (1981) Efficient tests for normality, homoscedasticity and serial independence of regression residuals: Monte Carlo evidence. Economics Letters, v. 7, n. 4, p. 313-318. https://doi.org/10.1016/0165-1765(81)90035-5
https://doi.org/10.1016/0165-1765(81)900...
), Ljung e Box (1978LJUNG, G.M.; BOX, G.E.P. (1978) On a measure of lack of fit in time series models. Biometrika, v. 65, n. 2, p. 297-303.) e Box e Pierce (1970BOX, G.; PIERCE, D.A. (1970) Distribution of residual autocorrelations in autorregressive integrated moving average time series models. Journal of the American Statistical Association, v. 65, n. 332, p. 1509-1526. DOI: 10.2307/2284333
https://doi.org/10.2307/2284333...
). Observa-se que os resíduos não são normalmente distribuídos, resultado que já era esperado por se tratar de uma variável ambiental. Porém, assumiu-se, pela teoria assintótica sobre a média das distribuições de probabilidade, a suposição de que os resíduos são normalmente distribuídos. O valor p dos testes de correlação são superiores ao nível de significância de 5%, indicando que não se rejeita a hipótese nula de erros não autocorrelacionados. Nenhuma autocorrelação apresentou-se significativamente diferente de zero no correlograma residual apresentado na Figura 5, o que vai ao encontro dos resultados apresentados na Tabela 3 e com a hipótese de homogeneidade dos resíduos.

Tabela 3:
Testes estatísticos de normalidade* e correlação** dos resíduos do modelo escolhido.

Figura 5:
Funções amostrais de autocorrelação (A) e autocorrelação parcial (B) dos resíduos do modelo SARIMAX(1,0,2)(0,1,1)7.

A Tabela 4 contém as estimativas dos parâmetros do modelo ajustado, considerando como variáveis explicativas a VV e a PP. Observa-se que todos os coeficientes são estatisticamente significativos de acordo com o teste z. Uma vez que as variáveis umidade e temperatura não foram estatisticamente significativas, as mesmas não foram incorporadas no ajuste do modelo final. Chaloulakou, Grivas, Spyrellis (2003CHALOULAKOU, A.; GRIVAS, G.; SPYRELLIS, N. (2003) Neural network and multiple regression models for PM10 prediction in Athens: A comparative assessment. Journal of the Air & Waste Management Association, v. 53, n. 10, p. 1183-1190. https://doi.org/10.1080/10473289.2003.10466276
https://doi.org/10.1080/10473289.2003.10...
) estimaram a média diária de MP10 em Atenas por meio da análise de regressão. Os autores observaram que a variável VV influencia na concentração de MP10. Esses resultados vão ao encontro dos apresentados no presente trabalho. Lyra, Oda-Souza e Viola (2011LYRA, G.B.; ODA-SOUZA, M.; VIOLA, D.N. (2011) Modelos lineares aplicados à estimativa da concentração do material particulado (PM10) na cidade do Rio de Janeiro, RJ. Revista Brasileira de Meteorologia, v. 26, n. 3, p. 392-400. DOI: 10.1590/s0102-77862011000300006
https://doi.org/10.1590/s0102-7786201100...
) observaram que as variáveis UR e a PP foram os elementos meteorológicos significativos para explicar a variabilidade do MP10, na cidade do Rio de Janeiro. Os resultados para umidade encontrados pelos autores contrariam as estimativas deste trabalho, uma vez que a umidade não foi um elemento significativo para explicar as concentrações de MP10 na RGV. Entretanto, no trabalho de Lyra, Oda-Souza e Viola (2011LYRA, G.B.; ODA-SOUZA, M.; VIOLA, D.N. (2011) Modelos lineares aplicados à estimativa da concentração do material particulado (PM10) na cidade do Rio de Janeiro, RJ. Revista Brasileira de Meteorologia, v. 26, n. 3, p. 392-400. DOI: 10.1590/s0102-77862011000300006
https://doi.org/10.1590/s0102-7786201100...
) a precipitação foi estatisticamente significativa, similar ao observado para o modelo SARIMAX ajustado.

Tabela 4:
Estimativa dos parâmetros do modelo ajustado SARIMAX(1,0,2)(0,1,1)7.

O sinal positivo do coeficiente estimado da variável VV indica a existência de uma relação direta entre a concentração de MP10 e essa variável, demostrando que o aumento da VV eleva a concentração de MP10. Segundo o Relatório da Qualidade do Ar da Grande Vitória (IEMA, 2013), 69,3% das emissões de MP10 para a atmosfera da RGV estão ligadas à ressuspensão causada pelo vento e tráfego veicular, corroborando o resultado encontrado, uma vez que o aumento da VV tende a elevar a ressuspensão do solo. Já a PP apresentou relação negativa com a concentração de MP10. O coeficiente negativo no modelo se deve ao processo de deposição úmida e atenuação da ressuspensão do solo (LYRA; ODA-SOUZA; VIOLA, 2011LYRA, G.B.; ODA-SOUZA, M.; VIOLA, D.N. (2011) Modelos lineares aplicados à estimativa da concentração do material particulado (PM10) na cidade do Rio de Janeiro, RJ. Revista Brasileira de Meteorologia, v. 26, n. 3, p. 392-400. DOI: 10.1590/s0102-77862011000300006
https://doi.org/10.1590/s0102-7786201100...
). Durante eventos de precipitação ocorre diminuição do MP10, pois o solo úmido dificulta a ressuspensão do particulado no solo (VARDOULAKIS & KASSOMENOS, 2008VARDOULAKIS, S.; KASSOMENOS, P. (2008) Sources and factors affecting PM10 levels in two European cities: implications for local air quality management. Atmospheric Environment, v. 42, n. 17, p. 3949-3963. https://doi.org/10.1016/j.atmosenv.2006.12.021
https://doi.org/10.1016/j.atmosenv.2006....
).

Estudo de previsões

Para corroborar a utilização do modelo SARIMAX e para fins de comparação entre modelos, realizou-se estimativas para os modelos ARMA, SARMA, ARMAX e SARMAX e verificou-se qual é o melhor método para fazer previsões das concentrações de MP10. Para isso, o conjunto de dados sob estudo foi dividido em dois subconjuntos; adotou-se o período de 01/01/2012 a 14/04/2015 para fazer as estimações e reservou-se os dados compreendidos entre 15/04/2015 a 30/04/2015 para se fazer as previsões, ou seja, para que o cálculo das estatísticas de avaliação das previsões dê um passo à frente.

Na Tabela 5 são apresentados os resultados estimados para REQM e EAM para os modelos ajustados. Observa-se que o modelo SARIMAX apresentou um aumento na precisão das previsões nos horizontes (h) calculados. Os resultados da comparação das medidas de qualidade mostram que para h=0 e h=1 o modelo SARIMAX foi o que obteve melhor resultado, sendo o mais adequado para realizar as previsões.

Tabela 5:
Medidas de avaliação da qualidade de previsão obtidas a partir dos modelos ajustados.

Avaliação do modelo SARIMAX para estimativa da qualidade do ar

Conforme apresentado na introdução, o IEMA classifica a qualidade do ar da RGV como boa, para concentrações de MP10 entre 0 e 45 µg.m-3, regular entre 46 e 120 µg.m-3, e inadequada entre 121 e 250 µg.m-3 (IEMA, 2013IEMA - Instituto Estadual de Meio Ambiente e Recursos Hídricos do Estado do Espírito Santo. (2013) Relatório da qualidade do ar da Região da Grande Vitória. Vitória: IEMA. Disponível em: <Disponível em: https://iema.es.gov.br/Media/iema/Downloads/RAMQAR/Relat%C3%B3rio_Anual_de_Qualidade_do_Ar_2013.pdf >. Acesso em: 10 jun. 2016.
https://iema.es.gov.br/Media/iema/Downlo...
). A qualidade do ar pode, ainda, ser classificada como má, péssima ou crítica. Como no período de estudo a qualidade do ar, monitorada na estação da Enseada do Suá, foi classificada como regular em 450 ocasiões, avaliou-se apenas a eficiência do modelo em predizer eventos classificados como regular. Para isso, baseando-se na metodologia de Ryan (1995RYAN, W.F. (1995) Forecasting severe ozone episodes in the Baltimore metropolitan area. Atmospheric Environment, v. 29, n. 17, p. 2387-2398. https://doi.org/10.1016/1352-2310(94)00302-2
https://doi.org/10.1016/1352-2310(94)003...
) e Liu e Johnson (2003LIU, P.W.G.; JOHNSON, R. (2003) Forecasting peak daily ozone levels: part 2. A regression with time series errors model having a principal component trigger to forecast 1999 and 2002 ozone levels. Journal of the Air & Waste Management Association, v. 53, n. 12, p. 1472-1489. https://doi.org/10.1080/10473289.2003.10466321
https://doi.org/10.1080/10473289.2003.10...
), calculou-se as seguintes estatísticas de avaliação: a probabilidade de detecção (POD), que mensura a probabilidade do modelo predizer corretamente as concentrações maiores ou iguais a 46 µg.m-3 (qualidade do ar regular), quando realmente esse valor ocorreu; a razão de alarme falso (FAR), que mede a tendência da predição superestimar o valor observado da concentração de MP10; o escore de ameaças (EA), que representa a relação entre as predições corretas de eventos pelo total de eventos regular observado; e a taxa de perda (MISS), que mensura a taxa a qual os eventos de concentrações maiores ou iguais a 46 µg.m-3 observados não são preditos.

Para fins de comparação entre o pior modelo (ARMA) e o melhor modelo (SARIMAX) para fazer a predição de eventos regulares de qualidade do ar, a Tabela 6 contém a descrição e os resultados das estatísticas de avaliação. Observa-se que, das vezes que foram observados eventos de qualidade regular, o modelo SARIMAX estimou corretamente 64,39% desses eventos. Além disso, apresentou uma FAR de 0,3792, o que significa que em torno de 37,00% das predições do modelo os eventos de qualidade do ar foram classificados como regular, quando o observado foi boa; enquanto no modelo ARMA esse resultado foi em torno de 38,00%. O maior valor de EA mostra que o modelo SARIMAX foi superior ao modelo ARMA na predição correta de eventos de qualidade do ar regular. Além disso, a taxa (MISS) referente à ocorrência de eventos que não foram detectados foi menor para o modelo SARIMAX, corroborando, novamente, que o desempenho estatístico do modelo SARIMAX foi superior ao modelo ARMA, no que diz respeito à predição de eventos de qualidades do ar regular.

Tabela 6:
Descrição e resultados das estatísticas de avaliação da eficiência do modelo em predizer eventos classificados como regular.

De maneira geral, os resultados obtidos com a modelagem dos dados de concentrações de MP10 com o modelo SARIMAX, tanto no ajuste quanto na previsão e predição de eventos de qualidade do ar, podem ser considerados bons, uma vez que tais resultados foram satisfatórios em termos estatísticos.

CONCLUSÕES

Este trabalho objetivou modelar e prever a concentração média diária de MP10 na RGV, Espírito Santo, Brasil, utilizando o modelo SARIMAX, no período de 01/01/2012 a 30/04/2015. Baseando-se em indicadores de desempenho de modelagem, verificou-se que o modelo SARIMAX (1,0,2) (0,1,1)7 é o mais acurado, entre os estudados, para fazer predições e previsões da qualidade ar da RGV. Em comparação com os modelos ARMA, o desempenho estatístico do modelo SARIMAX foi superior, no que diz respeito à predição de eventos de qualidade do ar regular.

Entre as variáveis meteorológicas avaliadas, a VV e a PP foram significativas e melhoraram o ajuste do modelo. A UR e a T não foram estatisticamente significativas para explicar a variação das concentrações de MP10. Em termos de previsão da qualidade do ar, os modelos de séries temporais mostraram resultados satisfatórios.

Como parte de um estudo posterior, sugere-se a utilização de um modelo de heterocedasticidade condicional autorregressivo generalizado (GARCH) juntamente aos modelos da classe SARIMAX.

REFERÊNCIAS

  • AGIRRE-BASURKO, E.; IBARRA-BERASTEGUI, G.; MADARIAGA, I. (2006) Regression and multilayer perceptron-based models to forecast hourly O3 and NO2 leves in the Bilbao area. Environmental Modelling and Software, v. 21, p. 430-446. http://dx.doi.org/10.1016/j.envsoft.2004.07
    » http://dx.doi.org/10.1016/j.envsoft.2004.07
  • AKAIKE, H. (1973) Information theory and an extension of the maximum likelihood principle. In: PETROV, B.N.; CSAKI, F. (Eds.). Proceedings of the Second International Symposium on Information Theory. Budapeste: Akademiai Kiado. p. 267-281.
  • AKAIKE, H. (1978) A Bayesian analysis of the minimum AIC procedure. Annals of the Institute of Statistical Mathematics, v. 30, n. 1, p. 9-14.
  • ALMEIDA, M.A.I. (2006) Modelo Aditivo Generalizado (MAG) no estudo da relação entre o número de atendimentos hospitalares por causas respiratórias e a qualidade do ar. Dissertação (Mestrado em Engenharia Ambiental) - Programa de Pós-Graduação em Engenharia Ambiental, Centro Tecnológico, Universidade Federal do Espírito Santo, Vitória.
  • BARBOSA, E.C.; SÁFADI, T.; NASCIMENTO, M.; NASCIMENTO, A.C.C.; SILVA, C.H.O.; MANULI, R.C. (2015) Metodologia Box & Jenkins para previsão de temperatura média mensal da cidade de Bauru (SP). Revista Brasileira de Biometria, v. 33, n. 1, p. 104-117.
  • BAYER, F.M.; SOUZA, A.M. (2010) Wavelets e modelos tradicionais de previsão: um estudo comparativo. Revista Brasileira de Biometria, v. 28, n. 2, p. 40-61.
  • BERA, A.K.; JARQUE, C.M. (1981) Efficient tests for normality, homoscedasticity and serial independence of regression residuals: Monte Carlo evidence. Economics Letters, v. 7, n. 4, p. 313-318. https://doi.org/10.1016/0165-1765(81)90035-5
    » https://doi.org/10.1016/0165-1765(81)90035-5
  • BOX, G.; JENKINS, G. (1970) Time Series Analysis: Forecasting and Control. São Francisco: Holden-Day.
  • BOX, G.; PIERCE, D.A. (1970) Distribution of residual autocorrelations in autorregressive integrated moving average time series models. Journal of the American Statistical Association, v. 65, n. 332, p. 1509-1526. DOI: 10.2307/2284333
    » https://doi.org/10.2307/2284333
  • BRAGA, A.L.F.; PEREIRA, L.A.A.; PROCÓPIO, M.; ANDRÉ, P.A.D.; SALDIVA, P.H.D.N. (2007) Associação entre poluição atmosférica e doenças respiratórias e cardiovasculares na cidade de Itabira, Minas Gerais, Brasil. Cadernos de Saúde Pública, v. 23, supl. 4, p. S570-S578. http://dx.doi.org/10.1590/S0102-311X2007001600017
    » http://dx.doi.org/10.1590/S0102-311X2007001600017
  • CHALOULAKOU, A.; GRIVAS, G.; SPYRELLIS, N. (2003) Neural network and multiple regression models for PM10 prediction in Athens: A comparative assessment. Journal of the Air & Waste Management Association, v. 53, n. 10, p. 1183-1190. https://doi.org/10.1080/10473289.2003.10466276
    » https://doi.org/10.1080/10473289.2003.10466276
  • CONAMA - Conselho Nacional de Meio Ambiente. (1990) Resolução nº 03, de 28 de junho de 1990. Dispõe sobre padrões de qualidade do ar, previstos no PRONAR. Diário Oficial da República Federativa do Brasil, Brasília, Seção 1, p. 15937-15939.
  • CURTIS, L.; REA, W.; SMITH-WILLIS, P.; FENYVES, E.; PAN, Y. (2006) Adverse health effects of outdoor air pollutants. Environment International, v. 32, n. 6, p. 815-830. https://doi.org/10.1016/j.envint.2006.03.012
    » https://doi.org/10.1016/j.envint.2006.03.012
  • DICKEY, D.A.; FULLER, W.A. (1981) Likelihood ratio statistics for autoregressive time series with a unit root. Econometrica, v. 49, n. 4, p. 1057-1072. DOI: 10.2307/1912517
    » https://doi.org/10.2307/1912517
  • GOMES, K.S. (2009) Modelagem INAR(p) para a previsão de índices de qualidade do ar. 71 f. Dissertação (Mestrado em Engenharia Ambiental) - Programa de Pós-Graduação em Engenharia Ambiental, Centro Tecnológico, Universidade Federal do Espírito Santo, Vitória.
  • GOOGLE EARTH. (2014) Informações geográficas. Disponível em: <Disponível em: http://www.google.com.br/intl/pt-PT/earth/ >. Acesso em: 10 jun. 2016.
    » http://www.google.com.br/intl/pt-PT/earth/
  • GOUVEIA, N.; MENDONÇA, G.A.S.; LEON, A.P.; CORREIA, J.E.M.; JUNGER, W.L.; FREITAS, C.U.; DAUMAS, R.P.; MARTINS, L.C.; GIUSSEPE, L.; CONCEIÇÃO, G.M.S.; MANERICH, A.; CUNHA-CRUZ, J. (2003) Poluição do ar e efeitos na saúde nas populações de duas grandes metrópoles brasileiras. Epidemiologia e Serviços de Saúde, v. 12, p. 29-40. http://dx.doi.org/10.5123/S1679-49742003000100004
    » http://dx.doi.org/10.5123/S1679-49742003000100004
  • GOYAL, P.; CHAN, A.T.; JAISWAL, N. (2006) Statistical models for the prediction of respirable suspended particulate matter in urban cities. Atmospheric Environment, v. 40, n. 11, p. 2068-2077. https://doi.org/10.1016/j.atmosenv.2005.11.041
    » https://doi.org/10.1016/j.atmosenv.2005.11.041
  • GRIPA, W.R.; REISEN, V.A.; FAJARDO, F.A.; REIS JUNIOR, N.C. (2012) Análise de predição e previsão das concentrações de material particulado inalável (PM10) na cidade de Carapina, ES. Revista Brasileira de Estatística, v. 73, n. 237, p. 37-57.
  • HOLGATE, S.T.; SAMET, J.M.; KOREN, H.S.; MAYNARD, R.L. (1999) Air Pollution and Health. San Diego: Academic Press.
  • IBGE - Instituto Brasileiro de Geografia e Estatística. (2010) Censo 2010. Disponível em: <Disponível em: http://www.ibge.gov.br/home/estatistica/populacao/censo2010/resultados_dou/ES2010.pdf >. Acesso em: 01 dez. 2015.
    » http://www.ibge.gov.br/home/estatistica/populacao/censo2010/resultados_dou/ES2010.pdf
  • IEMA - Instituto Estadual de Meio Ambiente e Recursos Hídricos do Estado do Espírito Santo. (2013) Relatório da qualidade do ar da Região da Grande Vitória. Vitória: IEMA. Disponível em: <Disponível em: https://iema.es.gov.br/Media/iema/Downloads/RAMQAR/Relat%C3%B3rio_Anual_de_Qualidade_do_Ar_2013.pdf >. Acesso em: 10 jun. 2016.
    » https://iema.es.gov.br/Media/iema/Downloads/RAMQAR/Relat%C3%B3rio_Anual_de_Qualidade_do_Ar_2013.pdf
  • JUNGER, W.L.; LEON, A.P. (2015) Imputation of missing data in time series for air pollutants. Atmospheric Environment, v. 102, p. 96-104. https://doi.org/10.1016/j.atmosenv.2014.11.049
    » https://doi.org/10.1016/j.atmosenv.2014.11.049
  • LATORRE, M.R.D.O.; CARDOSO, M.R.A. (2001) Análise de séries temporais em epidemiologia: uma introdução sobre os aspectos metodológicos. Revista Brasileira de Epidemiologia, v. 4, n. 3, p. 145-152. http://dx.doi.org/10.1590/S1415-790X2001000300002
    » http://dx.doi.org/10.1590/S1415-790X2001000300002
  • LIU, P.W.G.; JOHNSON, R. (2003) Forecasting peak daily ozone levels: part 2. A regression with time series errors model having a principal component trigger to forecast 1999 and 2002 ozone levels. Journal of the Air & Waste Management Association, v. 53, n. 12, p. 1472-1489. https://doi.org/10.1080/10473289.2003.10466321
    » https://doi.org/10.1080/10473289.2003.10466321
  • LJUNG, G.M.; BOX, G.E.P. (1978) On a measure of lack of fit in time series models. Biometrika, v. 65, n. 2, p. 297-303.
  • LYRA, G.B.; ODA-SOUZA, M.; VIOLA, D.N. (2011) Modelos lineares aplicados à estimativa da concentração do material particulado (PM10) na cidade do Rio de Janeiro, RJ. Revista Brasileira de Meteorologia, v. 26, n. 3, p. 392-400. DOI: 10.1590/s0102-77862011000300006
    » https://doi.org/10.1590/s0102-77862011000300006
  • MARTINS, L.C.; LATORRE, M.R.D.O.; CARDOSO, M.R.A.; GONÇALVES, F.L.T.; SALDIVA, P.H.N.; BRAGA, A.L.F. (2002) Poluição atmosférica e atendimentos por pneumonia e gripe em São Paulo, Brasil. Revista de Saúde Pública, v. 36, n. 1, p. 88-94. http://dx.doi.org/10.1590/S0034-89102002000100014
    » http://dx.doi.org/10.1590/S0034-89102002000100014
  • MONTE, E.Z.; ALBUQUERQUE, T.T.A.; REISEN, V.A. (2015) Previsão da concentração de ozônio na Região da Grande Vitória, Espírito Santo, Brasil, utilizando o modelo ARMAX-GARCH. Revista Brasileira de Meteorologia, v. 30, n. 3, p. 285-294. http://dx.doi.org/10.1590/0102-/10.1590/0102-778620140060
    » http://dx.doi.org/10.1590/0102-/10.1590/0102-778620140060
  • MORETTIN, P.A.; TOLOI, C.M.C. (2006) Análise de séries temporais. 2. ed. São Paulo: Blucher.
  • MOURA, F.A.; MONTINI, A.A.; CASTRO, J.B.B. (2011) Modelagem do Consumo de Energia Elétrica Residencial no Brasil Através de Modelos ARMAX. In: SEMINÁRIO DE ADMINISTRAÇÃO, 14., 2011. Anais...
  • NASCIMENTO, L.F.C.; PEREIRA, L.A.A.; BRAGA, A.L.F.; MÓDOLO, M.C.C.; CARVALHO JR., J.A.C. (2006) Efeitos da poluição atmosférica na saúde infantil em São José dos Campos, SP. Revista de Saúde Pública, v. 40, p. 77-82. http://dx.doi.org/10.1590/S0034-89102006000100013
    » http://dx.doi.org/10.1590/S0034-89102006000100013
  • OSTRO, B.; SANCHEZ, J.M.; ARANDA, C.; ESKELAND, G.S. (1996) Air pollution and mortality: results from a study of Santiago, Chile. Journal of Exposure Analysis and Environmental Epidemiology, v. 6, p. 97-114.
  • R CORE TEAM (2016). R: A language and environment for statistical computing. Viena: R Foundation for Statistical Computing. Disponível em: <http://www.R-project.org/>.
    » http://www.R-project.org/
  • REISEN, V.A.; SARNAGLIA, A.J.Q.; REIS JUNIOR, N.C.; LÉVY-LEDUC, C.; SANTOS, J.M. (2014) Modeling and forecasting daily average PM10 concentrations by a seasonal long-memory model with volatility. Environmental Modelling & Software, v. 51, p. 286-295. https://doi.org/10.1016/j.envsoft.2013.09.027
    » https://doi.org/10.1016/j.envsoft.2013.09.027
  • RYAN, W.F. (1995) Forecasting severe ozone episodes in the Baltimore metropolitan area. Atmospheric Environment, v. 29, n. 17, p. 2387-2398. https://doi.org/10.1016/1352-2310(94)00302-2
    » https://doi.org/10.1016/1352-2310(94)00302-2
  • SCHWARZ, G. (1978) Estimating the dimensional of a model. The Annals of Statistics, Hayward, v. 6, n. 2, p. 461-464.
  • SEINFELD, J.H.; PANDIS, S.N. (2006) Atmospheric Chemistry and Physics. 2. ed. Nova Jersey: John Wiley & Sons.
  • SHAPIRO, S.S.; WILK, M.B. (1965) An analysis of variance test for normality (complete samples). Biometrika, v. 52, n. 3-4, p. 591-611. DOI: 10.2307/2333709
    » https://doi.org/10.2307/2333709
  • SOUZA, J.B.; REISEN, V.A.; SANTOS, J.M.; FRANCO, G.C. (2014). Componentes principais e modelagem linear generalizada na associação entre atendimento hospitalar e poluição do ar. Revista de Saúde Pública, v. 48, n. 3, p. 451-458. DOI: 10.1590/S0034-8910.2014048005078
    » https://doi.org/10.1590/S0034-8910.2014048005078
  • VARDOULAKIS, S.; KASSOMENOS, P. (2008) Sources and factors affecting PM10 levels in two European cities: implications for local air quality management. Atmospheric Environment, v. 42, n. 17, p. 3949-3963. https://doi.org/10.1016/j.atmosenv.2006.12.021
    » https://doi.org/10.1016/j.atmosenv.2006.12.021
  • WEI, W. (2006) Time Series Analysis: Univariate and Multivariate Methods. Nova York: Addison Wesley.
  • WORLD HEALTH ORGANIZATION (WHO). (2005) Air quality guidelines global update 2005. Report on a working group meeting, Bonn/Alemanha: WHO. Disponível em: <Disponível em: http://www.euro.who.int/__data/assets/pdf_file/0008/147851/E87950.pdf >. Acesso em: 20 jan. 2016.
    » http://www.euro.who.int/__data/assets/pdf_file/0008/147851/E87950.pdf

Datas de Publicação

  • Publicação nesta coleção
    Mar-Apr 2018

Histórico

  • Recebido
    02 Set 2016
  • Aceito
    23 Fev 2017
Associação Brasileira de Engenharia Sanitária e Ambiental - ABES Av. Beira Mar, 216 - 13º Andar - Castelo, 20021-060 Rio de Janeiro - RJ - Brasil - Rio de Janeiro - RJ - Brazil
E-mail: esa@abes-dn.org.br