Acessibilidade / Reportar erro

Análise do erro de previsão de vazões mensais com diferentes horizontes de previsão

Analysis of forecast error of monthly streamflow with different forecast horizons

Resumos

Este trabalho aborda o problema de previsão para séries de vazões médias mensais, no qual denomina-se de horizonte de previsão (h), o intervalo de tempo que separa a última observação usada no ajuste do modelo de previsão e o valor futuro a ser previsto. A análise do erro de previsão é feita em função deste horizonte de previsão. Estas séries possuem um comportamento periódico na média, na variância e na função de autocorrelação. Portanto, considera-se a abordagem amplamente usada para a modelagem destas séries que consiste inicialmente em remover a periodicidade na média e na variância das séries de vazões e em seguida calcular uma série padronizada para a qual são ajustados modelos estocásticos. Neste estudo considera-se para a série padronizada os modelos autorregressivos periódicos PAR (p m). As ordens p m dos modelos ajustados para cada mês são determinadas usando os seguintes critérios: a análise clássica da função de autocorrelação parcial periódica (FACPPe); usando-se o Bayesian Information Criterion (BIC) proposto em (MecLeod, 1994); e com a análise da FACPPe proposta em (Stedinger, 2001). Os erros de previsão são calculados, na escala original da série de vazão, em função dos parâmetros dos modelos ajustados e avaliados para horizontes de previsão h variando de 1 a 12 meses. Estes erros são comparados com as estimativas das variâncias das vazões para o mês que está sendo previsto. Como resultado tem-se uma avaliação da capacidade de previsão, em meses, dos modelos ajustados para cada mês.

Modelo PAR; previsão de vazão; erro de previsão; sistemas hidrelétricos


This paper addresses the problem of forecasting for monthly mean streamflow series, in which we call the forecast horizon (h), the interval of time between the last observation used in fitting the model prediction and the future value being predicted. The analysis of the forecast error is made on the basis of the forecast horizon. These series have a periodic behavior on average, ariance and autocorrelation function. Therefore, we consider the widely used approach to modeling these series that initially consists of removing the periodicity in mean and variance of the streamflow series and then calculating a standardized series for which stochastic models are adjusted. In this study we consider the series to the standard periodic autoregressive models PAR (p m). Orders p m of the adjusted models for each month are determined from the analysis of periodic partial autocorrelation function (PePACF), using the Bayesian Information Criterion (BIC) applied to PAR models, proposed in (MecLeod, 1994) and analysis of PePACF proposed in (Stedinger, 2001). The forecast errors are calculated on the basis of parameters adjusted and evaluated for forecasting horizons h, ranging from 1 to 12 months on the original scale of the flow series. These errors are compared with estimates of the variances of the flows for the month being predicted. As a result we have an evaluation of the predictive performance in months of the adjusted models for each month.

PAR model; streamflow forecasting; forecast error; hydroelectric systems


SISTEMAS ELÉTRICOS DE POTÊNCIA

Análise do erro de previsão de vazões mensais com diferentes horizontes de previsão

Analysis of forecast error of monthly streamflow with different forecast horizons

Marinho G. AndradeI; Ricardo Luis dos ReisI; Secundino SoaresII; Donato da Silva FilhoIII

IDepartamento de Matemática Aplicada e Estatística, ICMC - USP, São Carlos, SP. marinho@icmc.usp.br, rreis18@gmail.com

IIDepartamento de Engenharia de Sistemas- FEEC - UNICAMP, Campinas, SP. dino@cose.fee.unicamp.br

IIIEnergias do Brasil - EDP - São Paulo, SP. donato.filho@edpbr.com.br

RESUMO

Este trabalho aborda o problema de previsão para séries de vazões médias mensais, no qual denomina-se de horizonte de previsão (h), o intervalo de tempo que separa a última observação usada no ajuste do modelo de previsão e o valor futuro a ser previsto. A análise do erro de previsão é feita em função deste horizonte de previsão. Estas séries possuem um comportamento periódico na média, na variância e na função de autocorrelação. Portanto, considera-se a abordagem amplamente usada para a modelagem destas séries que consiste inicialmente em remover a periodicidade na média e na variância das séries de vazões e em seguida calcular uma série padronizada para a qual são ajustados modelos estocásticos. Neste estudo considera-se para a série padronizada os modelos autorregressivos periódicos PAR (pm). As ordens pm dos modelos ajustados para cada mês são determinadas usando os seguintes critérios: a análise clássica da função de autocorrelação parcial periódica (FACPPe); usando-se o Bayesian Information Criterion (BIC) proposto em (MecLeod, 1994); e com a análise da FACPPe proposta em (Stedinger, 2001). Os erros de previsão são calculados, na escala original da série de vazão, em função dos parâmetros dos modelos ajustados e avaliados para horizontes de previsão h variando de 1 a 12 meses. Estes erros são comparados com as estimativas das variâncias das vazões para o mês que está sendo previsto. Como resultado tem-se uma avaliação da capacidade de previsão, em meses, dos modelos ajustados para cada mês.

Palavras-chave: Modelo PAR, previsão de vazão, erro de previsão, sistemas hidrelétricos.

ABSTRACT

This paper addresses the problem of forecasting for monthly mean streamflow series, in which we call the forecast horizon (h), the interval of time between the last observation used in fitting the model prediction and the future value being predicted. The analysis of the forecast error is made on the basis of the forecast horizon. These series have a periodic behavior on average, ariance and autocorrelation function. Therefore, we consider the widely used approach to modeling these series that initially consists of removing the periodicity in mean and variance of the streamflow series and then calculating a standardized series for which stochastic models are adjusted. In this study we consider the series to the standard periodic autoregressive models PAR (pm). Orders pm of the adjusted models for each month are determined from the analysis of periodic partial autocorrelation function (PePACF), using the Bayesian Information Criterion (BIC) applied to PAR models, proposed in (MecLeod, 1994) and analysis of PePACF proposed in (Stedinger, 2001). The forecast errors are calculated on the basis of parameters adjusted and evaluated for forecasting horizons h, ranging from 1 to 12 months on the original scale of the flow series. These errors are compared with estimates of the variances of the flows for the month being predicted. As a result we have an evaluation of the predictive performance in months of the adjusted models for each month.

Keywords: PAR model, streamflow forecasting, forecast error, hydroelectric systems

1 INTRODUÇÃO

Nos modelos de planejamento da operação de sistemas hidrotérmicos uma das variáveis importante é a vazão afluente aos aproveitamentos hidrelétricos. As vazões nos rios dependem, entre outros fatores, das condições climáticas, o que leva a atribuir às vazões um modelo estocástico. Alguns modelos de planejamento da operação de sistemas hidrotérmicos consideram explicitamente o modelo estocástico para as vazões (ver (Stedinger et al., 1984),(Maceira et al., 2002)). Isto torna o planejamento da operação um problema de otimização de grande porte, não linear e, consequentemente, estocástico. Outras abordagens consideram de forma implícita o modelo estocástico para as vazões como é feito em (Martinez and Soares, 2002). Nestas abordagens, os modelos para as vazões são utilizados para obter previsões. Neste contexto, a previsão de vazão é uma importante etapa do planejamento da operação de sistemas hidrotérmicos. No entanto, esta previsão está sempre sujeita a erros. Erros de previsões podem levar a tomada de decisões incorretas, causando grandes prejuízos ao sistema. Por isso, torna-se importante ter uma boa avaliação do erro de previsão associado ao modelo usado para previsão.

O uso de modelos estocásticos para previsão de valores de uma série temporal tem como um dos objetivos fazer a previsão com o menor erro possível. As séries de vazões mensais possuem um comportamento periódico na média, na variância e na função de autocorrelação. Por isso, considera-se a abordagem amplamente usada na modelagem destas séries (Hippel and McLeod, 1994), que consiste inicialmente em remover a periodicidade na média e na variância e em seguida calcular uma série padronizada para a qual são ajustados modelos do tipo autorregressivo periódico PAR(pm). Este trabalho faz uma análise do erro de previsão para séries de vazões médias mensais em função dos parâmetros do modelo adotado para a previsão.

Neste trabalho adota-se o erro médio quadrático da previsão, MSE (Mean Squared Error) como critério para comparar as previsões feitas com diferentes modelos. A vantagem deste critério é que ele pode ser comparado com a variância incondicional da série. A variância incondicional de uma série reflete a máxima incerteza ou variabilidade que se pode esperar da série, quando ignora-se toda e qualquer informação que pode ser extraída dos valores passado e presente da série para prever um valor futuro. Portanto a variância incondicional representa o maior erro que se pode cometer ao fazer uma previsão. Sendo assim, esta variância serve como referência para avaliar o MSE calculado com qualquer modelo que faz usos de algum tipo de ferramenta estatística para melhorar a previsão.

Denomina-se de horizonte de previsão (h), o intervalo de tempo que separa a última observação usada no ajuste do modelo de previsão e o valor futuro a ser previsto. Um comportamento que se deve esperar intuitivamente do erro de previsão é que este erro deve crescer com o horizonte de previsão, ou seja, quanto mais a frente se quer prever valores futuros, maior é o erro de previsão ao qual se estar sujeito. Isto se deve a limitada capacidade que o passado e o presente tem para prever o crescente efeito das variáveis aleatórias imprevisíveis, que podem influenciar os valores futuros da série quando distancia-se do presente em direção ao futuro. Assim, é natural a expectativa de que, a medida que o horizonte de previsão aumenta, o erro de previsão tenda para a variância incondicional da série. Neste trabalho, os erros de previsão são avaliados na escala original das séries de vazões e usa-se como referência a variância incondicional sazonal da série, permitindo avaliar a rapidez com que estes erros de previsão tendem para a variância incondicional da série, quando diferentes modelos são considerados para fazer previsões.

Os modelos PAR(pm), considerados neste trabalho, são ajustados considerando-se a equação de Yule-Walker (Mondal and Wasimib, 2006; Box et al., 2008). Um ponto crítico no ajuste destes modelos é a escolha da ordem pm do modelo de cada mês. As ordens pm dos modelos ajustados para as vazões de cada mês podem ser determinadas fazendo-se uma análise da função de autocorrelação parcial periódica (FACPPe) ou usando-se Bayesian information criterion (BIC) proposto por (MecLeod, 1994). Estes critério podem apresentar resultados que não se sustentam com uma análise dos fenômenos naturais. Ou seja, ao ser determinado um valor para a ordem pm, pode ocorrer que alguns parâmetros do modelo PAR(pm), para defasagens intermediárias k < pm, sejam não significativos. Portanto, torna-se difícil explicar, com base nos fenômenos naturais, como a vazão de um mês m depende da vazão de um mês com defasagem pm e não depende das vazões de meses com defasagens k < pm. Para contornar esta dificuldade, foi usada a análise da FACPPe proposto por (Stedinger, 2001), a qual considera para cada mês m, a maior ordem pm tal que todas as estimativas da FACPPe de defasagem menor que pm sejam significativas.

Este critério não admite valores intermediários não significativos.

2 O MODELOS PAR(PM)

Denotando-se por qt(r,m), t(r, m) = s(r - 1) + m, uma série temporal de vazões mensais em que m = 1,..., s (s = 12) representa os meses e r = 1,..., n é índice dos anos (m = 1 refere-se ao mês de janeiro e m = 12 refere-se ao mês de dezembro). Define-se a série padronizada por:

em que μm = E(qt(r,m)) e = Var(qt(r,m)) são as médias e as variâncias mensais, respectivamente. Portanto, a série padronizada zt(rm) tem E(zt(rm)) =0 e Var(zt(rm)) = 1. A média μm, e variância de cada mês podem ser estimadas respectivamente por:

Uma característica das séries de vazões mensais é que a função de autocorrelação também é periódica. Assim, modelos autorregressivos periódicos (PAR) são frequentemente adotados para representar esta característica (Vechia, 1985). O modelo PAR(pm) para a série padronizada zt(r,m) > 0, r = 1,...n, m = 1,... ,s é escrito como:

Nos modelos PAR(pm) o processo zt(r,m) possui estacionariedade periódica, ou seja, as raízes de cada polinômio Φm(B) = 1-(pm,1B—...— ΦmPmBm = 0 estão situadas no plano complexo, fora do círculo de raio unitário. E os ruídos at(r,m) são não-correlacionados, E(at(r,m)at(r,m)+k) = 0, para todo k = 0, com variância . Nestes modelos os parâmetros Φm,- e a ordem do modelo pm variam com m (neste estudo assumi-se que pm < s para todo m). Além disto, tem-se que para qualquer k inteiro Φm,j = Φm+ks,j e como consequência se tem que para qualquer τ = t(r,m):

3 IDENTIFICAÇÃO E ESTIMAÇÃO DO MODELO PAR(PM)

A identificação de um modelo PAR(pm) consiste em determinar as ordens pm, mais apropriadas dos operadores autorregressivos para cada mês m = 1,..., s. Neste trabalho adota-se, para a escolha da ordem do modelo de cada mês, três procedimentos. Dois destes são baseados na análise da função de autocorrelação parcial periódica (FACPPe) do modelo PAR(pm), o terceiro é o procedimento adotado em (MecLeod, 1994), que considera o critério BIC proposto por (Schwarz, 1978).

A função de autocorrelação periódica (FACPe), entreZt(r,m) e zt(r,m)-k, é dada por = E(zt(r,m)zt(r,m)-k).

Considerando-se o modelo PAR(pm), tem-se que:

Fixando-se o mês m e variando k de 1 até pm em (8) encontra-se, para cada mês m, um conjunto de equações lineares, comumente denominadas de equações de Yule-Walker. Para um mês m qualquer, as equações de Yule-Walker são dadas por:

em que R é a matriz definida por:

Denota-se por o j-ésimo parâmetro autorregressivo de um processo PAR de ordem k, em que é o último parâmetro deste processo. As equações de Yule-Walker para cada mês m podem ser reescritas da seguinte forma:

em que R(k, k) é a matriz de dimensão k x k formada pelas primeiras k-ésima linhas e k-ésima colunas da matriz R, dada em (10).

Os valores dos parâmetros {φkk,k = 1, 2,...} correspondem à função autocorrelação parcial periódica do processo PAR no período m. Esta função representa também a estrutura de dependência do processo estocástico ao longo do tempo. Em um processo periódico autorregressivo de ordem pm, a FACPPe é o valor do último parâmetro dado em (11). Uma propriedade dos modelos PAR(pm) é que é diferente de zero, para k menor ou igual a pm, e zero para k maior que pm. Portanto, um procedimento de identificação de um modelo PAR(pm) consiste em determinar as ordens pm dos modelos autorregressivos de cada mês m = 1,...,s tal que todos os termos da FACPPe sejam nulos (ou não-significativos) para todas as defasagens (lags) k maiores que pm. Isto pode ser feito obtendo-se estimativas de , k = 1, 2,... que são calculadas substituindo-se na equação (11) as autocorrelações , para i = 1,...,pm e j = 0,..., pm - 1, pelos respectivos valores amostrais e resolvendo-se esse sistema de equações para obter .

Para testar a hipótese nula H0kk = 0 para todos os valores de k = 1, 2, utiliza-se o resultado assintótico, o qual afirma que, se a ordem do modelo autorregressivo de um mês m qualquer é pm, então o estimador e , para k > pm tem distribuição aproximadamente normal de média zero e variância 1/n. Portanto não se rejeita H0 com nível de significância α < 5% se o zero está contido no intervalo . Neste caso se diz que a estimativa é não significativa. Portanto o procedimento de identificação da ordem pm, consiste em procurar, para cada mês m, a maior ordem pm, tal que todas as estimativas para k > pm não sejam mais significativas. Este procedimento será referido neste trabalho como o procedimento clássico de identificação.

Este procedimento clássico de identificação da ordem dos modelos PAR(pm) pode levar a aceitação de processos como sendo ruídos brancos, quando, na verdade, trata-se de modelos que possuem baixos valores de . Valores intermediários baixos de para k < pm também podem ser considerados não-significativos e isto leva a identificação de modelos com parâmetros intermediários nulos, Φm,j = 0, para alguns j < pm. Estas situações corroboram a ideia de que a forma clássica de identificação das ordens pm pode não ser a mais adequada.

Por outro lado, (Stedinger, 2001) afirma que uma modelagem que considera individualmente cada mês não pode produzir o conjunto de modelos mais adequados. Sem maiores detalhes matemáticos e somente considerando a natureza dos fenômenos naturais envolvidos, ele argumenta que não faz sentido considerar que a vazão de determinado mês m, devido a parâmetros intermediários nulos, dependa da vazão do mês m - 2 e não do mês m - 1. Para compreender melhor, suponha um modelo PAR(pm) de ordem elevada (pm = 6) que tenha somente estimativas estatisticamente significativas para os coeficientes φm,1 e φm,6.. Portanto, o modelo tem quatro parâmetros φm,2, φm,3, φm,4 e φm,5 não-significativos. Neste caso, a proposta de (Stedinger, 2001) leva a supor que a correlação parcial seja espúria e um modelo de ordem pm = 1 deve ser considerado adequado. Portanto, (Stedinger, 2001) propõe como critério para a seleção das ordens pm, que para cada mês m, encontre-se a maior ordem pm tal que todas as estimativas para k < pm sejam significativas. Este critério, ao contrário da forma clássica de seleção, não admite valores intermediários de não-significativos. Uma abordagem de identificação da ordem dos modelos PAR(pm) usando técnicas de bootstrap foi proposta por (Oliveira et al., 2010) a qual avalia melhor os intervalos de confiança da FACP-Pe e corrobora com os valores de ordens pm encontradas em (Stedinger, 2001).

Além dos dois procedimentos apresentados, um terceiro procedimento, utilizado em (MecLeod, 1994), considera o critério BIC proposto por (Schwarz, 1978) para selecionar as ordens pm dos modelos autorregressivos de cada mês m. Neste caso o critério considera o cálculo de BICm, dado por

este critério pondera entre a qualidade do ajuste, representada pela estimativa da variância do resíduo e a complexidade do modelo, dado pela ordem pm. Portanto escolhe-se as ordens pm, tal que o critério BIC = BICm seja mínimo.

4 MSE DA PREVISÃO PARA SÉRIES DE VAZÕES SAZONAIS

Seja zt(j,m), r = 1,..., n, m = 1,... ,s uma série temporal padronizada observada até o mês m0 do ano n. Denota-se por T = t(n,m0) = s(n — 1) + m0 o instante da última observação e por a previsão estimada para zT+h com um passo de previsão h, considerando somente as observações conhecidas até o instante T. Então, o MSE desta previsão é dado por:

Mostra-se facilmente que o previsor de mínimo erro médio quadrático é o valor esperado condicional, dado por:

Para avaliar o MSE na escala original das vazões, supõe-se que são conhecidas as vazões históricas até um determinado mês m0 do ano n e se quer prever a vazão qt(n+1,m), no mês m do ano (n+1). Considerando a relação (1), então a vazão qt(n+1,m) é escrita como:

Sendo t(n + 1, m) = sn + m e t(n, m0) = s(n — 1) + m0 e considerando o passo da previsão h = t(n+1, m)—t(n, m0), (considera-se sempre que 1 < h < s). Pode ser escrito então que t(n + 1, m) = t(n, m0) + h, assim, a equação (15) pode ser escrita como:

em (16) m0 representa o mês de origem, do qual se faz a previsão e m = m0+ h - s é o mês no futuro, para o qual a vazão será prevista e h é o passo da previsão.

A previsão de mínimo erro médio quadrático para qt(n+1>m), feita do mês m0, é dada por:

o conhecimento de {qt(n,mo), qt(n,mo)-1,..} implica no conhecimento de {z(n,m0), z(n,mo)-1,...}, então usando as equações (16) e (17) tem-se que:

O MSE associado a previsão , é dado por:

Portanto, o MSE para a previsão da série sazonal tem um padrão sazonal com período s. Usa-se a notação MSEm(), referindo-se ao MSE da previsão de passo h, da vazão qt(n,mo)+h. O MSE, dado na equação (19), pode ser escrito como:

Portanto, o MSE de uma previsão da série original qt((n,mo)+h é proporcional ao mse da previsão da série padronizada e a constante de proporcionalidade é a variância mensal .

4.1 MSE com um processo independente

Considerando que o processo qt(r,m),r = 1,...,n, m = 1 , ..., s é uma seqüência de variáveis aleatórias independentes, então, o processo padronizado zt(r,m), r = 1, ..., n, m = 0, 1, . . . , s dado pela equação (1) também é uma sequência de variáveis aleatórias independentes.

Para calcular o MSE da previsão considera-se a equação (19). Com a hipótese de independência do processo zt(r,m), r = 1, . . . , n, m = 1, ..., s, tem-se que:

então a previsão é dada por:

portanto,

Se o processo zt(r,m), r = 1,..., n, m = 1,..., s é um processo estacionário no sentido fraco, então tem-se que Var(zt(r,m)) = Var(zt(r,m)+h) = para qualquer t(r, m). Portanto, com a suposição de independência, o MSE da previsão é dado por:

Nota: Teoricamente a relação (1) assegura que Var(zt(r,m)) = 1, na prática se constata que ≈ 1, portanto, do ponto de vista prático a suposição de independência leva a um MSEm . A suposição de independência feita para qt(r,m) implica em desprezar toda e qualquer informação vinda das observações {qt(n,m0),qt(n,m0)-1,...}. Se o único efeito das observações é diminuir o MSE da previsão, então o MSE dado em (21) pode ser considerado como o maior erro médio quadrático da previsão que se pode cometer, ou seja, (a variância mensal incondicional) pode ser considerada como um limitante superior para o erro médio quadrático da previsão para qualquer mês de origem m0 e qualquer passo de previsão h.

4.2 MSE com um processo PAR(pm)

O modelo PAR(pm), dado pela equação (4) pode ser escrito como uma soma infinita dos ruídos aleatórios periódicos como se segue.

neste modelo tem-se que, para qualquer k inteiro, ψm,j= ψm+k,s,j, e portanto o valor da série zt(n,m0)+h, calculada h passos à frente, pode ser escrito usando-se um modelo PAR(pm), como:

Na equação (23) tem-se que t(n, m0) + h = t(n + 1, m), e por isso os coeficientes ψm,j, que multiplicam os ruídosat(n,m0)+h-j, tem o índice m que se refere ao mês para o qual se considera a série zt(n+1,m).

Denota-se por a previsão para zt{n,m0)+h calculada com h passos de antecedência usando-se um modelo PAR(pm). Então deve ser escrita em função dos valores passados zt(n,mo), zt(n,mo)-1,... Consequentemente, usando a equação (23), é escrita como uma função dos ruídos passados at(n,m0),at(n,m0)-1,... Além disto, suponha que é uma função linear. Então, denotando-se a melhor previsão por:

Pode-se determinar os pesos que minimizem o erro médio quadrático (MSE) da previsão. Usando-se as equações (23) e (24), o erro de previsão, et(n,m0)+h= zt(n,m0)+h —, do modelo PAR(pm), com passo de previsão h, é escrito em função dos ruídos aleatórios, como:

a equação (25) que pode ser reescrita como:

Considerando o MSE escrito em função do erro de previsão et(n,mo)+h, dado por:

então, tem-se da equação (27), que o mínimo MSE ocorre quando ψm,h+j = ψm,h+j, para j =0,1,...Sendo os ruídos aleatórios at(n,mo)+h-j,j = 0,..., h — 1 não correlacionados e periodicamente estacionários, tem-se que Var(at(n,mo)+h_j) = Var(am0+h-j) = +h-j, para j =0,...,h — 1. A estacionariedade periódica permite escrever que +h-j = para i = 1,..., s. Os índices i são associados com cada um dos valores m0+ h — j por:

em que v = mod(m0 + h — j, s) representa a parte inteira da divisão entre m0 + h — j e s. Então, o MSE do modelo PAR(pm) pode ser avaliado, em função dos parâmetros do modelo e das variâncias dos resíduos, como:

em que , para i = 1,..., s.

4.2.1 Cálculo dos parâmetros ψm,j

Para calcular os parâmetros ψm,j, j = 1,...,h — 1 da equação (29), é necessário escrever o modelo PAR(p) na forma da equação (22). Para isto, adota-se um procedimento recursivo e, para facilitar os cálculos, supõe-se, sem perda de generalidade, que os modelos PAR(pm) têm a mesma ordem p = max{pm}, para todos os meses m = 1,... ,s. Esta suposição pode ser feita adotando-se < m,k = 0 para pm < k < p, em todos os modelos com pm < p.

Para iniciar o procedimento recursivo de construção da equação (22), primeiro considera-se o modelo PAR(pm) escrito como um modelo PAR(p), dado por:

Em seguida escreve-se o modelo PAR(p) para zt(jm)-1 como segue:

Substituindo (31) em (30) obtêm-se:

e repetindo o procedimento para zt(r m)-2, tem-se:

Das equações (32) e (33) conclui-se que:

e por indução chega-se a fórmula geral dos coeficientes ψm,j, dada por:

A equação (34) é válida para qualquer mês m, assim escreve-se, de forma geral, a equação para ψm,j, como:

Após serem ajustados os modelos PAR(pm), avalia-se o MSE , dado em (29), calculando-se recursivamente os coeficientes com a equação (35). Usando-se a equação (20), avalia-se o MSEm na escala original da série de vazões, como se segue:

Portanto, o cálculo do MSEm, envolve não só a estimativa dos coeficientes ψm,j, j = 1,...,h - 1 como também as estimativas das variâncias dos ruídos , para i = 1,..., s.

No limite, quando h → ∞, tem-se que:

com ψm,0, de forma que:

Portanto, da equação (22), pode ser mostrado que a série da equação (37) corresponde a variância incondicional da série padronizada zt(r,m). A qual, como pode ser vista em (1), é igual a 1. Desta forma, pode-se afirmar que, no caso dos modelos PAR(pm), a variância incondicional é um limitante superior para o MSE da previsão para cada mês.

5 ESTUDO DE CASO

Neste estudo, considera-se os modelos ajustados às séries históricas de vazões mensais nos postos de Furnas, Emborcação e Sobradinho. Foram ajustados modelos autorregressivos periódicos PAR(pm), cujas ordens pm foram selecionadas com a análise da função de autocorrelação parcial, considerando o procedimento clássico (Hippel and McLeod, 1994), no qual a identificação da ordem pm, consiste em procurar para cada mês m a maior ordem p, tal que todas as estimativas da FACPPe , para k > p, não sejam mais significativas. Para comparação foram considerados também o método proposto em (Stedinger, 2001) e o método proposto por (MecLeod, 1994), baseado no critério BIC.

As comparações entre os modelos de previsão são avaliadas considerando-se a variação da raiz quadrada do Erro Médio Quadrático (RMSE) da previsão, feita com cada modelo ajustado, em função do passo de previsão. São usados como referência os desvios-padrões mensais da série original.

Outra análise realizada refere-se a capacidade de previsão dos modelos PAR(pm) ajustados. Nesta análise considera-se o coeficiente de variação (cvm) de cada mês, o qual consiste na razão entre o desvio-padrão e a Média de Longo Termo (MLT) de cada mês (e.g. cvm = σm/μm) . Os meses com alto cvm apresentam maiores erros de previsão e os modelos ajustados para estes meses apresentam baixa capacidade preditiva, ou seja, para estes meses observa-se que os erros de previsão tendem rapidamente para o limitante superior dos erros, definido pelo desvio-padrão mensal.

Na Tabela 1 são apresentadas, como ilustração, as ordens dos modelos PAR(pm) selecionadas com os três métodos considerados, para as vazões de Furnas. Na Tabela 2 encontram-se os modelos mensais ajustados para as vazões de Furnas quando a ordem de cada modelo foi selecionada pelo método clássico de análise da FACPPe. Portanto, estes modelos apresentam alguns coeficientes intermediários nulos.

O método de escolha da ordem de cada modelo, utilizado pelo método clássico, resulta em ordens mais elevadas do que as ordens escolhidas pelo método proposto por (Stedinger, 2001) ou pelo método proposto por (MecLeod, 1994) que faz uso do critério BIC. Os procedimentos propostos por (Stedinger, 2001) e (MecLeod, 1994) geralmente coincidem na escolha das ordens dos modelos, diferenciando-se em poucos meses e em apenas uma unidade na ordem selecionada (ver Tabela 1). Apesar do método clássico selecionar modelos de ordem mais elevadas, vários termos intermediários são nulos, como pode ser visto nos modelos ajustados para as vazões de Furnas, apresentados na Tabela 2.

Para análise dos erros de previsão usa-se como referência o coeficiente de variação (cvm) de cada mês. Na Tabela 3 apresenta-se os coeficientes de variação cvm e a razão entre o RMSE (calculado com o passo de previsão h = 1) e a MLT de cada mês para as vazões de Furnas. Nota-se um alto coeficiente de variação no mês de setembro, devido as vazões ocorridas neste mês, nos anos de 1976 e 1983, que foram muito acima dos valores normalmente observados para as vazões de setembro.

Nota-se na Tabela 3 que os meses de janeiro, fevereiro e março apresentam maior erro relativo de previsão RMSE/MLT (em %) quando comparados com os demais meses. Meses com alto coeficiente de variação são mais difíceis de serem previstos, consequentemente apresentam maiores erros de previsão, como pode ser visto na Tabela 3.

Portanto, o aumento na ordem dos modelos, para os meses com alto coeficiente de variação, não resulta em diminuição significativa dos erros das previsões das vazões destes meses, como pode ser visto na Tabela 3, para os meses de janeiro, fevereiro e março, com o passo de previsão de um mês a frente (h = 1).

A Figura 1, ilustra os erros de previsão para as vazões afluentes em Furnas, no mês de janeiro, onde observa-se que os erros da previsão, cometidos com as três propostas de identificação consideradas neste trabalho, são praticamente iguais e crescem rapidamente, chegando a mais de 90% do limite superior nos três primeiros meses.


No entanto, para os meses com baixo coeficiente de variação, como o mês de agosto, ao se considerar modelos de ordem mais elevada obtêm-se uma diminuição nos erros de previsão a longo prazo. Os gráficos apresentados na Figura 2 ilustram este fato para a previsão da vazão afluente à Furnas no mês de agosto. Independente do critério adotado na identificação da ordem dos modelos PAR, as ordens dos modelos ajustados para os três meses que precedem o mês de agosto são iguais. Este fato é refletido no erro de previsão para este mês, notando-se que somente para passos de previsão h > 4 surgem as diferenças nos erros de previsões que é provocada pela diferença nas ordens dos modelos ajustados.


Uma análise semelhante foi feita para as vazões afluentes à usina de Emborcação. Na Tabela 4 são apresentadas as ordens dos modelos selecionadas com as três propostas consideradas neste trabalho. Nota-se para estes dados, que o método clássico seleciona ordens mais elevadas que os outros dois métodos. Observando-se os modelos ajustados, apresentados na Tabela 5, nota-se que vários destes modelos apresentam estimativas dos parâmetros intermediários Φm,j, com 1 < j < pm nulos, ressaltando a incoerência deste método de identificação da ordem dos modelos com os fenômenos naturais.

A Tabela 6 apresenta, para cada mês do ano, o coeficiente de variação e a razão RMSE/MLT (%) para cada método de identificação da ordem do modelo PAR(pm), para a usina de Emborcação. O mês de fevereiro apresenta o maior coeficiente de variação e consequentemente os maiores erros de previsão com h = 1. A Figura 3 mostra como estes erros de previsão tendem rapidamente para o limite superior, definido pelo desvio-padrão das vazões deste mês, quando o passo de previsão cresce. Resultados semelhantes são encontrados para os meses de janeiro, março, novembro e dezembro (ver (Projeto estratgico de P & D da ANEEL: ODIN - Otimizao do Despacho Interligado Nacional, 2010)).


Para os meses com baixo coeficiente de variação observa-se a diminuição do erro de previsão para os modelos de ordem maiores, isso é ilustrado na Figura 4, a qual apresenta os erros das previsões para as vazões de Emborcação no mês de julho.


Na Tabela 7 são apresentadas as ordens dos modelos selecionadas, com os três critérios considerados neste trabalho, para as vazões de Sobradinho. Nota-se que todos os métodos resultam na mesma escolha da ordem dos modelos em quase todos os meses, exceto para os meses de fevereiro e dezembro, nos quais o critério clássico selecionou modelos de ordem mais elevada e nos meses de junho e julho, no qual o critério BIC selecionou modelos de ordem mais elevada.

A Tabela 8 apresenta as estimativas dos parâmetros dos modelos ajustados para a vazão de Sobradinho, em cada mês, quando foi adotado o critério clássico de seleção das ordens dos modelos. Nota-se nesta tabela, que os modelos de ordem elevada, apresentam estimativas nulas para vários parâmetros intermediários, ressaltando-se a incoerência entre o método utilizado e o fenômeno natural.

A Tabela 9 apresenta, para cada mês do ano, o coeficiente de variação e a razão RMSE/MLT (%) para cada método de identificação da ordem do modelo PAR(pm), na usina de Sobradinho. As vazões afluentes ao reservatório de Sobradinho apresentam o maior coeficiente de variação no mês de março e o menor se verifica no mês de setembro. A variação do erro de previsão em função do passo de previsão para estes meses são apresentados nos gráficos das Figura 5 e 6.



Observa-se na Figura 5, que o erro de previsão para o mês de março tende rapidamente para o limite superior definido pelo desvio-padrão das vazões deste mês. Nota-se, nestes gráficos, que estes erros praticamente coincidem para os modelos selecionados com os três critérios adotados. Na Figura 6, observa-se que a evolução do erro corre de forma mais lenta, destacando-se a capacidade preditiva dos modelos para horizontes maiores.

Quando se utiliza o critério BIC não considera-se testes de hipóteses para os parâmetros dos modelos, portanto, com este critério, não se admite valores intermediários nulos. Pode-se observar que nos três estudos de caso considerados, em algumas situações o critério BIC selecionou ordem superior ao método proposto em (Stedinger, 2001) e eventualmente ao método clássico, como é visto na Tabela 1 para Furnas, nos meses de fevereiro e maio, na Tabela 4 para Emborcação, no mês de fevereiro e na Tabela 7 para Sobradinho, nos meses de junho e julho. Embora tais parâmetros possam ser considerados nulos, segundo algum teste de hipótese, uma diminuição na razão RMSE/MLT (h = 1) é verificada nestes casos, como se pode notar na Tabela 3, para os meses de fevereiro e maio; Tabela 6, para o mês de fevereiro e Tabela 9, para os meses de junho e julho. Estes resultados indicam que tais testes de hipóteses, os quais são fundamentados em propriedades assintóticas, válidas somente para grandes amostras, podem ser imprecisos para o ajuste dos modelos PAR(pm), uma vez que, nestes ajustes o tamanho da amostra corresponde ao número de anos disponíveis no histórico de vazões, portanto, tem-se amostras de tamanho pequeno do ponto de vista da teoria assintótica. Recomenda-se que os critérios propostos por (Stedinger, 2001) ou o BIC sejam utilizados quando opta-se pelo critério da parcimônia. O uso do critério clássico, seleciona sempre ordens mais elevadas que produzem uma pequena diminuição na razão RMSE/MLT (h = 1). No entanto, esta pequena redução no erro de previsão não justifica a complexidade proveniente do uso de modelos de ordens elevadas.

6 CONCLUSÃO

Neste trabalho foram calculados os erros médios quadráticos das previsões de vazões em função do passo de previsão, para modelos PAR(pm). Foram considerados três métodos de identificação da ordem dos modelos. Observa-se que o uso do método clássico de análise da FACPPe leva a escolha de ordens elevadas para alguns meses. No entanto, os modelos para estes meses apresentam estimativas nulas para alguns parâmetros intermediários. Considerar parâmetros nulos entre o primeiro e o último parâmetro de um modelo PAR(pm), ressalta uma incoerência entre o modelo e o fenômeno natural. Portanto, o método clássico de análise da FACPPe não é adequado para identificar a ordem dos modelos PAR(pm). Os outros dois métodos considerados, identificam as ordens de forma coerente.

A variação dos erros de previsão em função do passo de previsão são apresentadas na forma de gráficos. Nota-se, ao analisar estes gráficos, para os meses cujos coeficientes de variação são mais elevados, que o erro de previsão tende rapidamente para o limite superior. Este fato indica que os modelos ajustados para estes meses apresentam uma capacidade preditiva limitada a um horizonte de previsão máximo de três meses (h = 3). Para os meses com coeficiente de variação menores, a capacidade preditiva dos modelos pode chegar até h = 6 meses. Para horizontes de previsão superiores a seis meses, os erros de previsão dos modelos tornam-se aproximadamente iguais ao desvio-padrão incondicional da série. Ou seja, para h > 6, os modelos perdem quase toda capacidade preditiva e comportam-se como se as vazões não apresentassem correlação temporal.

Apesar do reduzido erro de previsão para o passo de previsão de um mês (h = 1) quando o valor absoluto deste erro é comparado com a MLT do mês para a qual a vazão está sendo prevista, nota-se que a redução no erro de previsão só ocorre de forma mais acentuada nos meses considerados secos, ou seja entre junho e setembro. Nos meses úmidos, novembro a abril, em geral as relações entre o RMSE e a MLT do mês são muito próximas.

Os resultados apresentados neste trabalho dão uma indicação de que é possível que os modelos de planejamento da operação de sistemas hidrelétricos, que utilizam os modelos estocásticos das vazões de forma explícita, não consigam se beneficiar destes modelos devido a baixa capacidade preditiva dos mesmos, quando comparados ao horizonte de planejamento (geralmente maior que um ano). Desta forma, é possível que os modelos de planejamento da operação que se utilizam das previsões, ou mesmo consideram as vazões de forma determinísticas, possam apresentar resultados muito próximos aos modelos estocásticos, uma vez que para horizontes superiores a seis meses (h > 6), os erros de previsão tornam-se grandes e consequentemente a MLT fica muito próxima das vazões previstas.

AGRADECIMENTOS

Este trabalho foi financiado pelo projeto estratégico de P&D da ANEEL denominado ODIN - Otimização do Despacho Interligado Nacional - com apoio de 18 concessionárias lideradas pela Bandeirante Energia S.A. do grupo EDP, e pelas agências de financiamento à pesquisa CNPq e FAPESP.

Artigo submetido em 03/05/2011 (Id.: 1332)

Revisado em 11/06/2011,05/07/2011, 19/08/2011

Aceito sob recomendação do Editor Associado Prof. Jés de Jesus Fiais Cerqueira

  • Box, G. E. P., Jenkins, G. M. and Reinsel, G. C. (2008). Time series analysis: forecasting and control, 4th. edition edn, Holden-Day.
  • Hippel, K. W. and McLeod, A. I. (1994). Time series modelling of water resources and environmental systems, Elsevier Science B.V., Amsterdan, Netherlands.
  • Maceira, M. E. P., Terry, L., Costa, F. S. Damzio, J. M. and Melo, A. C. G. (2002). Chain of optimization models for setting the energy dispatch and spot price in the brazilian system, 14th Power Systems Computation Conference, Sevilla, Spanish.
  • Martinez, L. and Soares, S. (2002). Comparison between closed-loop and partial open-loop feedback control policies in long term hydrothermal scheduling, IEEE Trans. on Power Syst. 17(2): 330-336.
  • MecLeod, A. I. (1994). Diagnostic checking of periodic autoregression models with application, J. of Time Series Analysis 15(2): 221-233.
  • Mondal, M. S. and Wasimib, S. A. (2006). Generating and forecasting monthly flows of the ganges river with par model, Journal of Hydrology 323: 41-56.
  • Oliveira, F. L. C., Miranda, C. V. C., Ferreira, P. G. C., Souza, R. C. and Calili, R. F. (2010). Critrios de identificao da ordem do modelo autorregressivo peridico -par(p), in SBPO (ed.), XLII Simpsio Brasileiro de Pesquisa operacional, Vol. XLII SBPO, Bento Gonalves, RS., pp. 753-763.
  • Projeto estratgico de P & D da ANEEL: ODIN - Otimizao do Despacho Interligado Nacional (2010). Anlise do erro de previso em funo do horizonte de previso para sries de vazes mdias mensais: Parte ii, Rel. Tc.: ANEEL PE-0391-0108/2009 008/2010, Faculdade de Engenharia Eltrica e Computao - Unicamp, Campinas / SP.
  • Schwarz, G. (1978). Estimating the dimension of a model, The Annals of Statistics 6(12): 461464.
  • Stedinger, J. R. (2001). Report on the evaluation of cepel's par models, Techical report, School of Civil and Environmental Engineering - Cornell University, Ithaca, New York.
  • Stedinger, J. R., Sule, B. F. and Loucks, D. P. (1984). Stochastic dynamic programming models for reservoir operation optimization, Water Resources Research 20(11): 1499-1505.
  • Vechia, A. V. (1985). Periodic autoregressive moving avarege (parma) modeling with application to waterresources, Water Resopurces Bull. 21: 721-730.

Datas de Publicação

  • Publicação nesta coleção
    21 Jun 2012
  • Data do Fascículo
    Jun 2012

Histórico

  • Recebido
    03 Maio 2011
  • Revisado
    19 Ago 2011
Sociedade Brasileira de Automática Secretaria da SBA, FEEC - Unicamp, BLOCO B - LE51, Av. Albert Einstein, 400, Cidade Universitária Zeferino Vaz, Distrito de Barão Geraldo, 13083-852 - Campinas - SP - Brasil, Tel.: (55 19) 3521 3824, Fax: (55 19) 3521 3866 - Campinas - SP - Brazil
E-mail: revista_sba@fee.unicamp.br