Acessibilidade / Reportar erro

Modelos decomposição temporal e de regressão harmônica: uma comparação para a série mensal da temperatura mínima e máxima média de presidente prudente (sp)

Temporal decomposition and harmonic regression models: a comparison to the series of monthly average minimum and maximum temperature at presidente prudente (sp)

RESUMO

Nesse trabalho são apresentados dois modelos de regressão construídos para estimar as séries mensais de temperatura mínima e máxima média (Tmin e Tmax) do município de Presidente Prudente (SP). Os modelos de decomposição temporal com tendência linear e sazonalidade, e modelo harmônico com tendência linear e componentes harmônicas, foram construídos para os períodos de 50 anos (1961-2010) e 30 anos (1981-2010). Os modelos foram comparados através de medidas de acurácia nas séries de 50 e 30 anos. As medidas de precisão, exatidão e desempenho foram avaliadas no conjunto de validação (2011-2014). Foi proposto o uso do coeficiente de correlação de Spearman no lugar do coeficiente de Pearson, no caso de falta de normalidade das observações originais e estimativas dos modelos, para avaliar a precisão e o desempenho dos modelos através do índice CS. Observou-se que o modelo harmônico apresentou melhores resultados que o modelo de decomposição temporal, principalmente quando foi construído com a série mais longa (50 anos) para Tmax e mais curta (30 anos) para Tmin.

Palavras-chave:
temperatura máxima; temperatura mínima; modelos de regressão; modelo de decomposição temporal; modelo harmônico.

ABSTRACT

In this work two regression models, constructed to estimate the monthly minimum and maximum average temperature (Tmin and Tmax) series at Presidente Prudente (SP) city are presented. The temporal decomposition model with linear trend and seasonality and the harmonic model with linear trend and harmonic components were built for periods of 50 years (1961-2010) and of 30 years (1981-2010). The models were compared by accuracy measures on the 50 and 30 years series. The precision and performance measurements were evaluated for the validation data set (2011-2014). It was proposed the Spearman correlation coefficient instead of the Pearson coefficient in the case of non-normality of the original observations and model estimates, and to assess the accuracy and the performance of the models through the CS index. It was observed that the harmonic model showed better results than the temporal decomposition model, especially when it was built using the longer Tmax (50 years) and shorter Tmin series (30 years).

Keywords :
maximum temperature; minimum temperature; regression model; temporal decomposition model; harmonic model.

1. INTRODUÇÃO

Segundo dados divulgados pelo IBGE Países@ (2015), a partir de dados fornecidos pela United Nations Statistical Divisions (UNSD, 2015), a população mundial em agosto de 2014 era constituída de 7.199.722.769 habitantes. O último censo demográfico realizado pelo IBGE no Brasil, publicado na Sinopse do Censo Demográfico 2010 do IBGE (IBGE CENSO, 2013), indicou que a população residente em 2010 era de 190.755.799 milhões de pessoas, e desse total, 160.925.792 habitavam áreas urbanas, o que representa 84,36% da população como sendo urbana. Considerando somente a Região Sudeste, esse percentual sobe para 92,95%.

No município de Presidente Prudente (SP), recorte espacial desse trabalho, segundo o IBGE Cidades@ (2013), a população total residente em 2010 era de 207.610, e a população estritamente urbana era de 203.375 habitantes, ou seja, 97,96%. Essa informação mostra a relevância de estudos realizados em áreas urbanas devido ao grande contingente populacional vivendo em cidades, o qual é afetado por diversos fatores, entre eles, os fatores relacionados ao clima. Uma importante variável nesse contexto é a temperatura, a qual influencia o organismo humano, e suas atividades tanto comerciais, assim como industriais ou agrícolas. Nesse trabalho, são abordadas as séries de temperatura mínima e máxima média mensal (Tmin e Tmax) para o município de Presidente Prudente (SP), do período 1961 a 2010.

Segundo Morettin e Toloi (2004MORETTIN, P. A.; TOLOI, C. M. C. Análise de séries temporais. São Paulo: Edgard Blucher. 2004. 535 p.), "uma série temporal é qualquer conjunto de observações ordenadas no tempo". Para a análise das séries temporais podem ser empregadas duas classes de modelos: os modelos paramétricos, que contém um número finito de parâmetros; e os não paramétricos, que envolvem um número infinito de parâmetros. Os modelos paramétricos englobam os modelos de erros (ou de regressão), tais como os modelos de decomposição temporal e modelo de regressão harmônico, os quais serão empregados nesse trabalho.

Para o Estado de São Paulo, Pinto et al. (1972PINTO, H. S.; ORTOLANI, A. A.; ALFONSI, R. R. Estimativa das temperaturas médias mensais do estado de São Paulo, em função de altitude e latitude. Caderno de Ciências da Terra. v.23, 20p. 1972. ) apresentam modelos de regressão linear múltiplo para estimar as temperaturas médias mensais para o Estado de São Paulo. O modelo proposto depende apenas da altitude (m) e latitude (minutos), e é construída uma equação para cada mês do ano. Entretanto, os autores não trabalham as medidas Tmin e Tmax para que se possa comparar.

Pedro Júnior et al. (1991PEDRO JÚNIOR, M. J. et al. Estimativa das temperaturas médias mensais das máximas e das mínimas no estado de São Paulo. Campinas: Instituto Agronômico de Campinas. 1991. 11p. Boletim Técnico, 142. ) também apresentam modelos mensais de regressão envolvendo Tmin e Tmax, para o Estado de São Paulo, com exceção das regiões litorâneas e do Vale do Ribeira, e constataram que há grande influência da altitude nas equações mensais.

Nota-se que nos trabalhos citados acima, Pinto et al. (1972PINTO, H. S.; ORTOLANI, A. A.; ALFONSI, R. R. Estimativa das temperaturas médias mensais do estado de São Paulo, em função de altitude e latitude. Caderno de Ciências da Terra. v.23, 20p. 1972. ) e Pedro Júnior et al. (1991PEDRO JÚNIOR, M. J. et al. Estimativa das temperaturas médias mensais das máximas e das mínimas no estado de São Paulo. Campinas: Instituto Agronômico de Campinas. 1991. 11p. Boletim Técnico, 142. ), são desenvolvidos modelos de regressão múltipla mensais envolvendo as variáveis altitude e latitude.

Com relação ao modelo harmônico, Cargnelutti Filho et al. (2010) o utilizaram para modelar a temperatura do ar média mensal em 37 locais do Estado do Rio Grande do Sul, para o período de 1931 a 2000.

Antonini et al. (2009ANTONINI, J. C. A. et al. Modelo matemático para estimativa da temperatura média diária do ar no Estado de Goiás. Pesquisa Agropecuária Brasileira, Brasília, v.44, n.4, p.331-338, abr. 2009. Disponível em: <Disponível em: http://seer.sct.embrapa.br/index.php/pab/article/view/1703/5684 >. Acesso em: 19 Jul. 2013.
http://seer.sct.embrapa.br/index.php/pab...
) construíram um modelo para a temperatura média diária do Estado de Goiás utilizando o modelo harmônico e as coordenadas geográficas (latitude, longitude e altitude) de 21 estações meteorológicas em Goiás, os períodos variaram conforme a estação, pois as mesmas não continham séries com períodos idênticos e nem muito longas. O modelo foi testado com os dados de três estações de altitudes diferentes: elevada (1.100 m), média (554 m) e baixa (431 m). O desempenho do modelo foi considerado mediano para altitudes baixas e elevadas e muito bom para altitudes médias.

Fante e Sant'Anna Neto (2012FANTE, K. P.; SANT'ANNA NETO, J. L. Variabilidade da temperatura do ar em cidades interioranas do Estado de São Paulo (1961-2009). Revista Geonorte, Ed. Especial 2, v.2, n.5, p.675-687, 2012.) apresentam estatísticas para sete estações do estado de São Paulo (Avaré, Catanduva, Franca, Presidente Prudente, Votuporanga, Piracicaba e São Simão) compreendendo o período de 1961 a 2009. Os resultados obtidos apontaram para um aumento de Tmin e Tmax nos dois últimos decênios (1991-2000 e 2001-2009), quando comparadas às médias de todo o período (1961-2009) para a maioria das estações analisadas, com exceção de Catanduva (maior aumento para Tmax no período 1961-1970). Para Presidente Prudente esse aumento foi de 0,6oC e 1oC para Tmin e de 0,2oC e 0,6oC para Tmax, para cada decênio, respectivamente. Entretanto, esses autores não desenvolvem nenhum modelo para ajustar temperatura.

Nesse trabalho pretende-se desenvolver dois modelos de regressão: o modelo de decomposição com tendência e sazonalidade determinística e o modelo com tendência linear e harmônicas periódicas para as séries Tmin e Tmax, específicos para a estação de Presidente Prudente (SP).

2. MATERIAL E MÉTODOS

Os dados foram obtidos junto ao Instituto Nacional de Meteorologia (INMET, 2013) e AGRITEMPO (2015), referentes à Estação Meteorológica de Presidente Prudente - SP, a qual está situada nas coordenadas de 22º 12' de latitude sul, 51o 38' de longitude oeste e a uma altitude de 435,55 metros acima do nível médio do mar; e tem o código 83716 como seu número de localização. Dos dados disponíveis no INMET para a estação convencional utilizou-se a série de janeiro de 1961 a maio de 2012, e devido à inexistência de dados posteriores, os meses subsequentes de junho de 2012 a dezembro de 2014 foram obtidos junto ao site do AGRITEMPO (2015), para a mesma estação meteorológica.

Os dados foram organizados em planilhas no software Microsoft Excel(r), e posteriormente foi realizada a elaboração dos modelos de regressão utilizando-se os softwares estatísticos Minitab(r) e R, esse último de acesso livre.

Primeiramente, foram construídos gráficos de linhas das séries mensais de Tmin e Tmax com o objetivo de verificar a existência de sazonalidade, e gráficos de autocorrelações das observações, utilizados para orientar o pesquisador na escolha do modelo mais adequado à série temporal, considerando-se as duas opções possíveis: determinístico ou estocástico. Com a análise de ambos os gráficos, detectou-se a presença de sazonalidade nas séries Tmin e Tmax, indicando que poderiam ser construídos modelos de regressão determinísticos que incorporassem a sazonalidade identificada. Os modelos estatísticos determinísticos adotados foram: modelo de regressão de decomposição temporal e o modelo de regressão harmônico. E para a construção dos modelos foram considerados dois períodos: de janeiro de 1961 a dezembro de 2010 (séries de 50 anos) e de janeiro de 1981 a dezembro de 2010 (série de 30 anos). Após, foram construídas medidas para validação dos modelos em dados não utilizados na construção dos mesmos, referentes a um único período de janeiro de 2011 a dezembro de 2014.

Nas próximas seções serão definidos os modelos de regressão empregados, e as medidas para avaliar a acurácia, precisão, exatidão e desempenho dos mesmos.

2.1 Modelo de Regressão de Decomposição Temporal

Para o ajuste de um modelo que representasse adequadamente os dados de Tmin e Tmax, foi aplicada a técnica estatística de análise de regressão, porém de forma a contemplar a sazonalidade mensal observada. Maiores detalhes sobre a técnica podem ser encontrados em Morettin e Toloi (2004MORETTIN, P. A.; TOLOI, C. M. C. Análise de séries temporais. São Paulo: Edgard Blucher. 2004. 535 p.) e Draper e Smith (1981DRAPER, N. R.; SMITH, H. Applied regression analysis. 2nd. ed. New York: John Wiley & Sons. 1981. 709 p.). Foi construído um modelo matricial, definido na Equação 1:

, (1)

no qual Y representa o vetor de observações da variável de interesse, constituído de N=50x12=600 observações para uma série mensal de 50 anos; é uma matriz composta por:

e , para ;

é o vetor de parâmetros do modelo e é o vetor de erros. O vetor de parâmetros γ é constituído de duas partes, a primeira parte representando a tendência linear , sendo que é a constante e a coeficiente angular; e a segunda parte a sazonalidade mensal da série dada por . O modelo para cada observação t será definido como:

, (2)

para .

O vetor de observações estimado é obtido através do vetor de estimativas de mínimos quadrados dos parâmetros, o qual é dado por: .

A significância estatística do modelo é verificada através do teste de hipóteses: Ho: β1=α1=...=α11=0 versus H1: pelo menos um parâmetro é diferente de zero. Para realizar o teste de hipóteses, calcula-se a estatística do teste F, a qual apresenta, sob Ho, uma distribuição F de Fisher-Snedecor, ou seja, F~F(gl1=p-1, gl2=n-p, 1-α). Rejeita-se Ho ao nível de significância α se F observado for igual ou superior a F(gl1, gl2, 1-α) tabelado; ou se o P-valor for suficientemente pequeno, nesse caso, menor ou igual ao nível de significância α=0,05 definido para esse trabalho.

2.2 Modelo de Regressão Harmônico

Considere o modelo de regressão matricial, como definido anteriormente na Equação 1, no qual Y representa o vetor de observações da variável de interesse. Suponha agora uma matriz de delineamento , tal que:

, ,

, e , e

Considere como sendo o vetor de parâmetros do modelo, contendo p=14 parâmetros; e o vetor de erros. Portanto o modelo de regressão com harmônicas é definido como:

. (3)

Considerando as N=600 observações para a série de 50 anos, obtém-se o vetor de estimativas de mínimos quadrados dos parâmetros, dado por: , e o vetor de observações estimado, . Foi avaliada a significância estatística do modelo através do teste de hipóteses: versus H1: pelo menos um parâmetro é diferente de zero. Como visto na Seção 2.1, para realizar o teste de hipóteses, calcula-se a estatística do teste F, a qual apresenta sob Ho a distribuição F de Fisher-Snedecor, ou seja, F~F(gl1=p-1, gl2=n-p,1-α). A regra de decisão para a rejeição ou não da hipótese Ho será a mesma adotada para o modelo descrito na seção 2.1.

2.3 Medidas utilizadas para avaliar a acurácia do modelo

Para a avaliação da acurácia dos modelos foram utilizadas as medidas do Erro Médio Absoluto (MAE), Erro Quadrático Médio (MSE), e raiz quadrada do MSE (RMSE), essas medidas podem ser encontradas em Wilks (2006WILKS, D. S. Statistical methods in the atmospheric sciences. 2nd. ed. Amsterdan: Academic Press, 2006. 627p., p. 278). As medidas MAE e MSE utilizam a estimativa obtida com a construção do modelo e a verdadeira observação Yk . Quanto mais próxima de zero está a medida MAE melhor é a previsão. A medida MSE é bem parecida à medida MAE, exceto pelo emprego da função quadrática do erro, ao invés da função do erro absoluto. Essa medida é mais sensível aos erros maiores que a função MAE, e também, mais sensível aos outliers. O valor da medida MSE será sempre positivo, devido à função quadrática, e quanto menor seu valor mais acurado é o modelo que gerou os erros. A medida RMSE é a raiz quadrada de MSE, e a vantagem em sua utilização é que esta medida tem a mesma dimensão física das observações, no caso da variável temperatura, em oC, por isso sua mais interpretação é mais fácil. As expressões matemáticas das medidas MAE, MSE e RMSE serão apresentadas posteriormente na Tabela 1 da seção 3.3.

2.4 Medidas para avaliar a precisão, exatidão e desempenho dos modelos

Os modelos descritos nas seções 2.1 e 2.2 serão avaliados com relação a sua qualidade preditiva através da precisão, exatidão e desempenho. Para avaliar a precisão, os autores Cargnelutti Filho, et al. (2010) e Antonini et al. (2009ANTONINI, J. C. A. et al. Modelo matemático para estimativa da temperatura média diária do ar no Estado de Goiás. Pesquisa Agropecuária Brasileira, Brasília, v.44, n.4, p.331-338, abr. 2009. Disponível em: <Disponível em: http://seer.sct.embrapa.br/index.php/pab/article/view/1703/5684 >. Acesso em: 19 Jul. 2013.
http://seer.sct.embrapa.br/index.php/pab...
) empregam o coeficiente de correlação de Pearson, definido na Equação 4, a seguir:

. (4)

Porém, para avaliar se a correlação é realmente significativa, podem ser realizados testes estatísticos como o teste paramétrico de Correlação de Pearson e o não paramétrico de Correlação de Spearman (Conover, 1999CONOVER, W. J. Practical nonparametric statistics. 3rd. ed. New York: John Wiley and Sons, 1999, 584 p.). O Teste de Correlação de Pearson utiliza a estatística (4) e é indicado quando as duas variáveis que estão sendo correlacionadas apresentam distribuição normal bivariada. Em caso contrário, o Teste de Correlação de Spearman é preferível por não necessitar da normalidade das variáveis envolvidas, sua estatística é definida na Equação 5 e envolve os postos das observações no lugar das observações originais, tal que R(.) significa a ordem ou posto do valor entre parênteses para todos os valores da variável:

. (5)

A proposta que se apresenta nesse artigo é a de que se deva avaliar qual dos dois testes entre Pearson e Spearman é o mais indicado para o conjunto de dados em questão, de acordo com a confirmação ou não da suposição de normalidade das observações. Para tanto, pode ser aplicada uma generalização do Teste de Normalidade de Shapiro-Wilk (Gonzalez-Estrada e Villasenor-Alva, 2013) para normalidade multivariada. O software R apresenta um programa para realizar esse teste (Gonzalez-Estrada e Villasenor-Alva, 2013). Após a realização do teste de Shapiro-Wilk multivariado, caso a normalidade bivariada seja confirmada (pvalor>0,05) pode-se aplicar o Teste de Correlação de Pearson, para avaliar se a correlação encontrada é estatisticamente significativa (pvalor<=0,05), e utilizar o seu coeficiente de correlação, definido na Equação 4, como uma medida para avaliar a capacidade preditiva do modelo quanto à precisão. Na falta de normalidade, deverá ser aplicado o teste de Correlação de Spearman, conforme a Equação 5.

A exatidão será avaliada pelo índice de concordância (d) de Willmott (1982WILLMOTT, C.J. Some comments on the evaluation of model performance. Bulletin of the American Meteorological Society, v.63, p.1309-1313, 1982. apud ANTONINI, J. C. A. et al. Modelo de estimativa da temperatura média diária do ar no estado de Goiás., Planaltina, DF: Embrapa Cerrados 2010, 27p.) dado na Equação 6:

. (6)

Finalmente, o desempenho do modelo será obtido através do índice de consistência CS de Camargo e Sentelhas (Cargnelutti Filho et al., 2010), definido por:

, (7)

onde r é o coeficiente de correlação calculado na precisão. A proposta do presente artigo é utilizar em r o coeficiente de Pearson, definido na Equação 4, para o caso de ocorrer normalidade multivariada, ou o coeficiente de Spearman, dado na Equação 5, na falta dela. O índice d é o índice de concordância já definido na Equação 6.

3. RESULTADOS E DISCUSSÕES

Uma análise inicial dos dados de Tmin e Tmax para os períodos de 50 anos (1961-2010) e 30 anos (1981-2010) apresentam sazonalidade mensal, conforme pode ser observado no gráfico de linhas das séries mensais apresentado na Figura 1, no qual nota-se que as medidas de Tmax dos meses de maio, junho e julho são reduzidas quando comparadas às que ocorrem para os demais meses do ano. A partir de agosto a temperatura máxima apresenta elevação com pico em fevereiro, e após é observada uma tendência de decrescimento entre março e abril. Para Tmin o comportamento é similar. Observa-se que praticamente não há diferença entre os dois períodos com relação à Tmax, porém, para Tmin o período mais recente (1981-2010) apresenta temperaturas médias do ar mais elevadas do que o período completo (1961-2010).

Figura 1:
Gráfico de linhas para Tmax e Tmin de Presidente Prudente (SP)

Nas próximas seções 3.1 e 3.2 serão apresentados os modelos construídos para o ajuste das séries Tmax, e na seção 3.3 as previsões para os 48 meses seguintes, a partir de janeiro de 2011 até dezembro de 2014. As seções 3.4, 3.5 e 3.6 serão referentes às séries Tmin.

3.1 Modelo de Regressão de Decomposição Temporal para série Tmax

Foi construído o Modelo de Decomposição Temporal, denominado Modelo 1, conforme definições na Seção 2.1 para a série Tmax referente ao período 1961-2010. Após a análise de variância inicial, retirou-se os parâmetros não significativos e o modelo final estimado é apresentado na Equação 8.

Para avaliar a qualidade do modelo ajustado, geralmente utiliza-se o coeficiente de determinação múltiplo R2. Nesse modelo obteve-se R2=0,6463, isso significa que o modelo ajustado explica cerca de 64,63% da variação total da Tmax. O coeficiente R2 ajustado resultou em 63,97%. A normalidade dos resíduos foi comprovada através da aplicação do teste de Shapiro-Wilk (Estatística W=0,9953 e p-valor=0,06785).

O Modelo 1 para a série Tmax referente ao período 1981-2010, a análise de significância dos componentes, também indicou a retirada de d9t . A equação do modelo final é apresentada na Equação 9.

O coeficiente de determinação múltiplo R2=68,51% e o coeficiente R2ajust=67,51%, isso significa que o modelo ajustado explica cerca de 67,51% da variação total de Tmax. A normalidade dos resíduos foi comprovada através da aplicação do teste de Shapiro-Wilk (Estatística W=0,9954 e p-valor=0,3716).

3.2 Modelo de Regressão Harmônico para a série Tmax

O modelo harmônico, denominado Modelo 2, para a série 1961-2010 após a retirada dos componentes harmônicos não significativos é apresentado na Equação 10. Os parâmetros significativos foram: , , , , , , e .

O modelo ajustado apresentou R2=64,22% e o R2ajust=63,79%. O teste de normalidade de Shapiro-Wilk indicou normalidade dos resíduos (W=0,9951 e pvalor=0,05626).

Para a série Tmax referente ao período de 1981-2010 o Modelo 2 ajustado é apresentado na Equação 11:

O Modelo 2 apresentou R2=67,68% e o R2ajust=67,04%. O teste de Shapiro-Wilk indicou normalidade dos resíduos (W=0,9945 e pvalor=0,2283).

3.3 Previsões futuras e avaliação dos modelos para Tmax

Foram realizadas previsões para os próximos 48 meses, a partir de janeiro de 2011 a dezembro de 2014, para os modelos construídos nas Seções 3.1 e 3.2 para as séries Tmax.

A seguir, é apresentada a Figura 2, com um gráfico de linhas das três séries (dados reais, previsão pelo Modelo 1 e previsão pelo Modelo 2) para uma comparação visual.

Figura 2:
Série Tmax original e previsão dos Modelos 1 e 2 para 2011-2014, geradas a partir da série de 50 anos

A acurácia dos dois modelos gerados foi avaliada pelas estatísticas apresentadas na Seção 2.3. Os valores estimados para as medidas de acurácia, construídos com os dados observados de Tmax para o período de validação do modelo, ou seja, de janeiro de 2011 a dezembro de 2014, estão apresentados na Tabela 1.

Tabela 1:
Estatísticas para avaliar a acurácia das previsões para séries Tmax de 50 e 30 anos

Analisando as medidas para a série de 50 anos (1961-2010), apresentadas na Tabela 1 para ambos os modelos, nota-se que o Modelo Harmônico (Modelo 2) apresentou menores valores para todas as medidas quando comparado ao Modelo de Decomposição Temporal (Modelo 1). Dessa forma, o Modelo 2 pode ser considerado o melhor modelo entre os dois.

Já para a série de 30 anos (1981-2010), o Modelo 2 apresentou a melhor (menor) medida de MAE, mas para a medida RMSE, o Modelo 1 apresentou um erro de aproximadamente 0,99oC enquanto o Modelo 2 obteve um erro de 1,05oC. Portanto o Modelo 1 é o mais adequado para esse período.

Finalizando ao comparar-se as duas séries e modelos construídos, conclui-se que a série de 50 anos, representada pelo Modelo 2, apresenta melhores resultados quanto à previsão de novas observações de Tmax.

De acordo com a última coluna da Tabela 2, todos os testes de Shapiro-Wilk Bivariado realizados indicaram que a suposição de normalidade bivariada dos pares de observações foram rejeitadas. Assim, para o cálculo de correlação, será utilizado o Teste de Correlação não-paramétrico de Spearman, indicado para situações onde não há normalidade bivariada.

Tabela 2:
Testes de Shapiro-Wilk bivariados para as séries Tmax e previsões de Tmax utilizando o Modelo de Decomposição Temporal (Modelo 1) e o Modelo Harmônico (Modelo 2) para série de 50 e 30 anos

Também foram calculadas as medidas r de Correlação de Spearman, os índices d de Willmott e CS de Camargo e Sentelhas, para os valores estimados pelos modelos ajustados e os valores reais observados, para as n=48 observações. A Tabela 3 apresenta os resultados obtidos para os índices calculados.

Tabela 3:
Correlação (precisão), Índices d de Willmott (exatidão) e Índice CS de Camargo e Sentelhas (desempenho) avaliados sobre os dados reais e os valores previstos para série Tmax, para os Modelos 1 e 2 para o período 2011-2014

Analisando os índices apresentados na Tabela 3 pode-se concluir que para a série 1961-2010, o Modelo 2 tem maior exatidão (d) e de acordo com o Índice CS pode ser considerado de bom desempenho, segundo a tabela de classificação para esse Índice CS, apresentada em Antonini et al. (2010ANTONINI, J. C. A. et al. Modelo de estimativa da temperatura média diária do ar no estado de Goiás. Planaltina, DF: Embrapa Cerrados, 2010, 27p.). Já para o período de 30 anos (1981-2010), o Modelo 1 é mais indicado e também apresenta bom desempenho segundo o Índice CS.

Comparando ambos os modelos e períodos conclui-se que o melhor modelo para Tmax é o Modelo 2 para a série de 50 anos (1961-2010).

Uma observação quanto ao emprego do coeficiente de correlação de Pearson é que se o mesmo é incorretamente empregado, ou seja, na falta de normalidade, a precisão dos modelos é superestimada, já que o índice de Correlação de Pearson apresenta valores maiores que o de Spearman para os mesmos dados e, portanto, o índice de desempenho CS também superestima o desempenho do modelo ao realizar previsões futuras.

3.4 Modelo de Regressão de Decomposição Temporal para série Tmin

Foi construído o Modelo de Decomposição Temporal, conforme definições na Seção 2.1 para a série Tmin referente ao período 1961-2010. Após a análise de variância inicial do modelo completo não houve normalidade dos resíduos, foi realizada a retirada dos parâmetros não significativos, mas não foi encontrado nenhum modelo que produzisse resíduos com distribuição normal. Portanto, para a série Tmin com período de 50 anos não foi possível apresentar um Modelo de Decomposição Temporal adequado.

Para o período de 30 anos (1981-2010) foi possível ajustar um Modelo 1 adequado, conforme a Equação 12.

O modelo ajustado apresentou R2= 84,76% e o R2ajust=84,23%. O teste de normalidade de Shapiro-Wilk indicou normalidade dos resíduos (W=0,994 e pvalor=0,1692).

3.5 Modelo de Regressão Harmônico para a série Tmin

Foi construído o Modelo de Regressão Harmônico, conforme definições na Seção 2.1 para a série Tmin referente ao período 1961-2010. Nenhum modelo de regressão harmônico foi adequado para essa série, pois os resíduos produzidos não apresentaram distribuição normal.

Para o período de 30 anos (1981-2010) foi possível ajustar um Modelo 2 adequado, conforme a Equação 13.

O modelo ajustado apresentou R2= 84,40% e o R2ajust=84,14%. O teste de normalidade de Shapiro-Wilk indicou normalidade dos resíduos (W=0,9941 e pvalor=0,1763).

3.6 Previsões futuras e avaliação dos modelos para Tmin

Foram realizadas previsões para os próximos 48 meses, a partir de janeiro de 2011 a dezembro de 2014, para os modelos construídos nas Seções 3.1 e 3.2 para as séries Tmin.

A seguir, é apresentada a Figura 3, com um gráfico de linhas das três séries (dados reais, previsão pelo Modelo 1 e previsão pelo Modelo 2) para uma comparação visual.

Figura 3:
Série Tmin original e previsão dos Modelos 1 e 2 para 2011-2014, geradas a partir da série de 30 anos (1981-2010)

A acurácia dos dois modelos gerados foi avaliada pelas estatísticas apresentadas na Seção 2.3. Os valores estimados para as medidas de acurácia, construídos com os dados observados de Tmin para o período de validação do modelo, ou seja, de janeiro de 2011 a dezembro de 2014, estão apresentados na Tabela 4

Tabela 4:
Estatísticas para avaliar a acurácia das previsões para séries Tmin para 30 anos

Tabela 5 apresenta os resultados dos testes de Shapiro-Wilk para avaliar normalidade bivariada. Nota-se que em ambos os modelos a suposição de normalidade é rejeitada.

Tabela 5:
Testes de Shapiro-Wilk bivariados para as séries Tmin de Dados reais observados, Previsão de Tmin utilizando o Modelo de Decomposição Temporal (Modelo 1) e o Modelo Harmônico (Modelo 2) para série de 30 anos

Também foram calculados os índices r de Correlação de Spearman, d de Willmott e CS de Camargo e Sentelhas, para os valores estimados pelos modelos ajustados e os valores reais observados, para as n=48 observações. A Tabela 6 apresenta os resultados obtidos para os índices calculados.

Tabela 6:
Correlação (precisão), Índices d de Willmott (exatidão) e Índice CS de Camargo e Sentelhas (desempenho) avaliados sobre os dados reais e os valores previstos para série Tmin para os Modelos 1 e 2 para o período 2011-2014

Analisando as medidas apresentadas na Tabela 6, nota-se que os modelos 1 e 2 apresentaram comportamento bem próximos, porém, o melhor modelo entre os dois avaliados foi o Modelo Harmônico (Modelo 2).

Não foi possível realizar comparação dos resultados obtidos nesse trabalho com outras referências, pelo fato de não ter sido encontrada nenhuma referência que ajustasse os modelos de regressão de decomposição temporal e o modelo harmônico propostos nesse artigo, para dados de Presidente Prudente e para as variáveis Tmin e Tmax abordadas.

4. CONCLUSÕES

A partir da técnica de análise de regressão foram construídos dois modelos de previsão para as séries de temperatura mínima e máxima média mensal do município de Presidente Prudente, referentes aos períodos de 50 anos (1961-2010) e 30 anos (1981-2010). O primeiro um modelo de decomposição com tendência linear e sazonalidade determinística e o segundo um modelo harmônico com tendência linear. Analisando separadamente o primeiro modelo, observa-se que a tendência linear foi significativa para ambas as séries Tmin e Tmax. Esse modelo também detectou a sazonalidade mensal determinística, o que já era esperado, pois há um comportamento sazonal da temperatura em geral. No segundo modelo empregou-se harmônicas juntamente com um termo linear, e nesse modelo a tendência linear também foi significativa para ambas as séries. Quanto ao desempenho dos modelos construídos, conclui-se para Tmax, que o melhor modelo foi o modelo harmônico e utilizando a série mais longa (1961-2010), tendo obtido um desempenho classificado como "bom" segundo o índice CS. Para Tmin somente para a série mais curta de 30 anos (1981-2010) houve um ajuste adequado dos modelos apresentando desempenhos "ótimo" e bem próximos, porém, o modelo harmônico apresentou resultados levemente superiores. A proposta de incluir uma análise da existência de normalidade bivariada para decidir qual coeficiente de correlação, entre Pearson ou Spearman, deve ser utilizado, foi satisfatória, pois a utilização do coeficiente de Pearson, quando a suposição de normalidade não é satisfeita superestima o índice CS que avalia a capacidade dos modelos.

5. REFERÊNCIAS BIBLIOGRÁFICAS

  • AGRITEMPO. Sistema de monitoramento agrometeorológico. Disponível em: <http://www.agritempo.gov.br >. Acesso em: 9 mar. 2015.
    » http://www.agritempo.gov.br
  • ANTONINI, J. C. A. et al. Modelo matemático para estimativa da temperatura média diária do ar no Estado de Goiás. Pesquisa Agropecuária Brasileira, Brasília, v.44, n.4, p.331-338, abr. 2009. Disponível em: <Disponível em: http://seer.sct.embrapa.br/index.php/pab/article/view/1703/5684 >. Acesso em: 19 Jul. 2013.
    » http://seer.sct.embrapa.br/index.php/pab/article/view/1703/5684
  • ANTONINI, J. C. A. et al. Modelo de estimativa da temperatura média diária do ar no estado de Goiás. Planaltina, DF: Embrapa Cerrados, 2010, 27p.
  • CARGNELUTTI FILHO, A. et al. Modelo harmônico para a estimativa da temperatura do ar média mensal em diferentes locais do Estado do Rio Grande do Sul. Ciencia Rural, Santa Maria, v. 40, n. 9, Set. 2010. Disponível em: <Disponível em: http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0103-84782010000900006&lng=en&nrm=iso >. Acesso em: 19 Jul. 2013.
    » http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0103-84782010000900006&lng=en&nrm=iso
  • CONOVER, W. J. Practical nonparametric statistics. 3rd. ed. New York: John Wiley and Sons, 1999, 584 p.
  • DRAPER, N. R.; SMITH, H. Applied regression analysis. 2nd. ed. New York: John Wiley & Sons. 1981. 709 p.
  • FANTE, K. P.; SANT'ANNA NETO, J. L. Variabilidade da temperatura do ar em cidades interioranas do Estado de São Paulo (1961-2009). Revista Geonorte, Ed. Especial 2, v.2, n.5, p.675-687, 2012.
  • GONZALEZ-ESTRADA E., VILLASENOR-ALVA J. A. Generalized Shapiro-Wilk test for multivariate normality. <http://cran.r-project.org/web/packages/mvShapiroTest/mvShapiroTest.pdf>, 2013. Acesso em: 26 ago. 2013.
    » http://cran.r-project.org/web/packages/mvShapiroTest/mvShapiroTest.pdf
  • IBGE Censo: Sinopse do Censo Demográfico 2010. Disponível em: <http://www.ibge.gov.br/home/estatistica/populacao/censo2010/tabelas_pdf/Brasil_tab_1_15.pdf>. Acesso em 18 jul. 2013.
    » http://www.ibge.gov.br/home/estatistica/populacao/censo2010/tabelas_pdf/Brasil_tab_1_15.pdf
  • IBGE Cidades@. Disponível em: <Disponível em: http://www.ibge.gov.br/cidadesat/xtras/temas.php?codmun=354140&idtema=1&search=sao-paulo|presidente-prudente|censo-demografico-2010:-sinopse- >. Acesso em: 18 jul. 2013.
    » http://www.ibge.gov.br/cidadesat/xtras/temas.php?codmun=354140&idtema=1&search=sao-paulo|presidente-prudente|censo-demografico-2010:-sinopse-
  • IBGE Países@. Disponível em: <Disponível em: http://www.ibge.gov.br/paisesat/main_frameset.php >. Acesso em: 18 fev. 2015.
    » http://www.ibge.gov.br/paisesat/main_frameset.php
  • INMET. Instituto Nacional de Meteorologia. Disponível em: <Disponível em: http://www.inmet.gov.br >. Acesso em: Acesso em 9 fev. 2013.
    » http://www.inmet.gov.br
  • MORETTIN, P. A.; TOLOI, C. M. C. Análise de séries temporais. São Paulo: Edgard Blucher. 2004. 535 p.
  • PEDRO JÚNIOR, M. J. et al. Estimativa das temperaturas médias mensais das máximas e das mínimas no estado de São Paulo. Campinas: Instituto Agronômico de Campinas. 1991. 11p. Boletim Técnico, 142.
  • PINTO, H. S.; ORTOLANI, A. A.; ALFONSI, R. R. Estimativa das temperaturas médias mensais do estado de São Paulo, em função de altitude e latitude. Caderno de Ciências da Terra. v.23, 20p. 1972.
  • UNSD. United Nations Statistical Divisions - Social and Demographic and Social Statistics. Disponível em: <Disponível em: http://unstats.un.org/unsd/demographic/products/socind/default.htm >. Acesso em: 18 fev. 2015.
    » http://unstats.un.org/unsd/demographic/products/socind/default.htm
  • WILKS, D. S. Statistical methods in the atmospheric sciences. 2nd. ed. Amsterdan: Academic Press, 2006. 627p.
  • WILLMOTT, C.J. Some comments on the evaluation of model performance. Bulletin of the American Meteorological Society, v.63, p.1309-1313, 1982. apud ANTONINI, J. C. A. et al. Modelo de estimativa da temperatura média diária do ar no estado de Goiás., Planaltina, DF: Embrapa Cerrados 2010, 27p.

Datas de Publicação

  • Publicação nesta coleção
    Oct-Dec 2015

Histórico

  • Recebido
    02 Set 2013
  • Aceito
    12 Abr 2015
Sociedade Brasileira de Meteorologia Rua. Do México - Centro - Rio de Janeiro - RJ - Brasil, +55(83)981340757 - São Paulo - SP - Brazil
E-mail: sbmet@sbmet.org.br