Acessibilidade / Reportar erro

Podemos prever a taxa de cambio brasileira? Evidência empírica utilizando inteligência computacional e modelos econométricos

Can we forecast Brazilian exchange rates? Empirical evidences using computational intelligence and econometric models

Resumos

As abordagens de inteligência computacional, tais como sistemas nebulosos e redes neurais artificiais, têm-se gradualmente estabelecido como ferramentas robustas para a tarefa de aproximação de sistemas não-lineares complexos e previsão de séries temporais. Em aplicações envolvendo a área de Finanças, evidências empíricas anteriores indicam que modelos de inteligência computacional são mais precisos, dada sua maior capacidade em capturar não-linearidades e outros fatos estilizados presentes em séries financeiras. Nesse sentido, este artigo investiga a hipótese de que os modelos matemáticos de redes neurais perceptron multicamadas, redes neurais função de base radial e o sistema nebuloso Takagi-Sugeno (TAKAGI; SUGENO, 1985) são capazes de fornecer uma previsão fora-da-amostra mais acurada que os modelos auto-regressivos de médias móveis (ARMA) e auto-regressivo de médias móveis supondo heterocedasticidade condicional auto-regressiva (ARMA-GARCH). O desempenho de previsão um-passo-à-frente dos modelos foi comparado utilizando-se séries de retorno da taxa de câmbio real/dólar (R$/US$) com freqüências de 15 minutos, 60 minutos, 120 minutos, diária e semanal. Resultados indicam que o desempenho dos modelos está diretamente relacionado à freqüência observada das séries. Além disso, os modelos de redes neurais obtiveram um desempenho superior em relação aos demais modelos considerados. A avaliação da estratégia de negociação estabelecida com base nas previsões geradas pelos modelos indicou que estratégias baseadas em modelos de redes neurais forneceram retornos superiores em relação àquelas baseadas em modelos ARMA e ARMA-GARCH e também em relação à estratégia buy-and-hold.

Previsão; Inteligência computacional; Modelos não-lineares; Modelos lineares; Séries temporais; Redes neurais; Sistemas nebulosos


Computational intelligence approaches, such as artificial neural networks and fuzzy systems, have become popular tools in approximating complicated nonlinear systems and time series forecasting. In Finance applications, there is evidence that these computational intelligence models are able to provide a more accurate forecast given their capacity for capturing nonlinearities and other stylized facts of financial time series. Thus, this paper investigates the hypothesis that the mathematical models of multilayer perception, radial basis function neural networks (NN), and the Takagi-Sugeno (TS) fuzzy systems are able to provide a more accurate out-of-sample forecast than the traditional AutoRegressive Moving Average (ARMA) and ARMA Generalized AutoRegressive Conditional Heteroskedasticity (ARMA-GARCH) models. Using a series of Brazilian exchange rate (R$/US$) returns with 15 minutes, 60 minutes, 120 minutes, daily and weekly basis, the one-step-ahead forecast performance is compared. The results indicate that forecast performance is strongly related to the series' frequency, possibly due to nonlinearities effects. Besides, the forecasting evaluation shows that NN models perform better than the ARMA and ARMA-GARCH ones. In the trade strategy based on forecasts, NN models achieved higher returns when compared to a buy-and-hold strategy and to the other models considered in this study.

Forecasting; Nonlinear models; Linear models; Time series; Neural networks; Fuzzy systems


Podemos prever a taxa de cambio brasileira? Evidência empírica utilizando inteligência computacional e modelos econométricos

Can we forecast Brazilian exchange rates? Empirical evidences using computational intelligence and econometric models

Leandro dos Santos CoelhoI; André Alves Portela SantosII; Newton Carneiro Affonso da Costa Jr.III

ILaboratório de Automação e Sistemas, PPGEPS, CCET, Pontifícia Universidade Católica do Paraná - PUCPR, Rua Imaculada Conceição, 1155, CEP 80215-901, Curitiba, PR, Brasil, e-mail: leandro.coelho@pucpr.br

IIUniversidad Carlos III de Madrid, C/ Madrid, 126 - 28903, Getafe (Madrid), Espanha, e-mail: andre.alves@uc3m.es

IIIUniversidade Federal de Santa Catarina - UFSC, CP 476, CEP 88040-900, Florianópolis, SC, Brasil, e-mail: newton@cse.ufsc.br

RESUMO

As abordagens de inteligência computacional, tais como sistemas nebulosos e redes neurais artificiais, têm-se gradualmente estabelecido como ferramentas robustas para a tarefa de aproximação de sistemas não-lineares complexos e previsão de séries temporais. Em aplicações envolvendo a área de Finanças, evidências empíricas anteriores indicam que modelos de inteligência computacional são mais precisos, dada sua maior capacidade em capturar não-linearidades e outros fatos estilizados presentes em séries financeiras. Nesse sentido, este artigo investiga a hipótese de que os modelos matemáticos de redes neurais perceptron multicamadas, redes neurais função de base radial e o sistema nebuloso Takagi-Sugeno (TAKAGI; SUGENO, 1985) são capazes de fornecer uma previsão fora-da-amostra mais acurada que os modelos auto-regressivos de médias móveis (ARMA) e auto-regressivo de médias móveis supondo heterocedasticidade condicional auto-regressiva (ARMA-GARCH). O desempenho de previsão um-passo-à-frente dos modelos foi comparado utilizando-se séries de retorno da taxa de câmbio real/dólar (R$/US$) com freqüências de 15 minutos, 60 minutos, 120 minutos, diária e semanal. Resultados indicam que o desempenho dos modelos está diretamente relacionado à freqüência observada das séries. Além disso, os modelos de redes neurais obtiveram um desempenho superior em relação aos demais modelos considerados. A avaliação da estratégia de negociação estabelecida com base nas previsões geradas pelos modelos indicou que estratégias baseadas em modelos de redes neurais forneceram retornos superiores em relação àquelas baseadas em modelos ARMA e ARMA-GARCH e também em relação à estratégia buy-and-hold.

Palavras-chave: Previsão. Inteligência computacional. Modelos não-lineares. Modelos lineares. Séries temporais. Redes neurais. Sistemas nebulosos.

ABSTRACT

Computational intelligence approaches, such as artificial neural networks and fuzzy systems, have become popular tools in approximating complicated nonlinear systems and time series forecasting. In Finance applications, there is evidence that these computational intelligence models are able to provide a more accurate forecast given their capacity for capturing nonlinearities and other stylized facts of financial time series. Thus, this paper investigates the hypothesis that the mathematical models of multilayer perception, radial basis function neural networks (NN), and the Takagi-Sugeno (TS) fuzzy systems are able to provide a more accurate out-of-sample forecast than the traditional AutoRegressive Moving Average (ARMA) and ARMA Generalized AutoRegressive Conditional Heteroskedasticity (ARMA-GARCH) models. Using a series of Brazilian exchange rate (R$/US$) returns with 15 minutes, 60 minutes, 120 minutes, daily and weekly basis, the one-step-ahead forecast performance is compared. The results indicate that forecast performance is strongly related to the series' frequency, possibly due to nonlinearities effects. Besides, the forecasting evaluation shows that NN models perform better than the ARMA and ARMA-GARCH ones. In the trade strategy based on forecasts, NN models achieved higher returns when compared to a buy-and-hold strategy and to the other models considered in this study.

Keywords: Forecasting. Nonlinear models. Linear models. Time series. Neural networks. Fuzzy systems.

1 Introdução

A literatura relacionada à previsão de séries temporais financeiras tem registrado, desde a década de 90, importantes avanços relacionados à incorporação de novas metodologias que tentam determinar padrões de relacionamentos presentes nos dados do mercado financeiro. Essas metodologias, em sua maioria, computacionalmente intensivas, caracterizam-se pela capacidade de identificação e previsão de sistemas dinâmicos não-lineares, ou seja, sistemas em que as variáveis do ambiente possuem um complexo padrão de inter-relacionamento que se altera ao longo do tempo.

A crescente constatação, reportada em uma série de trabalhos científicos, acerca da presença de um comportamento não-linear em séries financeiras tem gerado críticas quanto ao uso de modelos lineares na explicação (e previsão) da dinâmica dos preços (PÉREZ-RODRÍGUEZ et al., 2005; ABHYANKAR et al., 1995). Pode-se argumentar que a metodologia econométrica tradicional, baseada em modelos com especificações simples e parâmetros constantes, como, por exemplo, os modelos ARMA, é incapaz de replicar a dinâmica inerente às séries econômicas e financeiras. Esse aspecto tem estimulado pesquisadores de diversas formações acadêmicas a aplicarem técnicas de inteligência computacional em uma série de problemas em Finanças, como, por exemplo, apreçamento de ativos (MORELLI et al., 2004), seleção de investimentos (EAKINS; STANSELL, 2003), teoria dos jogos (BARR; SARACENO, 2005) e previsão de séries temporais financeiras (MALHOTRA; MALHOTRA, 2002; TSAIH et al., 1998; KAASHOEK; VAN DJIK, 2002; OCAL, 2000; PÉREZ-RODRIGUEZ et al., 2005). Essas abordagens são adequadas para lidar com características intrínsecas às séries temporais financeiras, como, por exemplo, presença de múltiplos regimes no processo gerador de dados e não-linearidades. Entretanto, deve-se destacar que o debate acerca dos ganhos advindos do uso de modelos não-lineares ainda não atingiu um consenso (CLEMENTS et al., 2004), estimulando a continuidade da pesquisa nas áreas de seleção, estimação e avaliação de modelos não-lineares.

Duas abordagens relevantes, entre tantas outras, utilizadas para previsão de séries temporais são os sistemas nebulosos Takagi-Sugeno (TS) e as redes neurais perceptron multicamadas (MLP) e redes neurais função de base radial (RBF). O sistema nebuloso TS possui simultaneamente um alto grau de não-linearidade e estrutura simples (TAKAGI; SUGENO, 1985). O problema da identificação na modelagem envolvendo o sistema nebuloso TS consiste, basicamente, em duas partes: identificação da estrutura e identificação dos parâmetros. A identificação da estrutura está relacionada à determinação das partes antecedente e conseqüente das regras de ação, ou seja, consiste na partição do espaço de dados, extração de um número de regras e determinação da estrutura dos elementos de saída (equações), respectivamente. Finalmente, a tarefa de ajuste (ou aprendizado) dos parâmetros do sistema é realizada de modo a minimizar um determinado critério de desempenho baseado nos erros de saída do sistema. As redes neurais artificiais, originalmente inspiradas na funcionalidade das redes de neurônios biológicos, são, por sua vez, capazes de aprender relações funcionais complexas a partir de um conjunto limitado de dados de treinamento. Elas podem atuar como modelos "caixa-preta" para identificação de sistemas não-lineares multivariados e univariados e são passíveis de treinamento, utilizando dados de entrada e saída obtidos no sistema. A rede neural usual consiste em múltiplos elementos simples de processamento, chamados neurônios, interconexões entre eles e pesos atribuídos a essas interconexões. A informação relevante permanece armazenada nos pesos.

Nos últimos anos, pesquisadores (TSENG; TZENG, 2002; SHAPIRO, 2002; LEÓN et al., 2002) têm proposto um variado espectro de metodologias de identificação e previsão não-linear baseadas em sistemas nebulosos para lidarem com sistemas não-lineares que apresentam incertezas. As redes neurais, por sua vez, têm recebido considerável atenção nos últimos anos em função de suas habilidades em realizar aprendizagem, sendo aplicadas em um grande número de problemas na área de Finanças.

Este artigo investiga a hipótese de que os modelos de redes neurais MLP, redes neurais RBF e os sistemas nebulosos TS são capazes de fornecer uma previsão fora-da-amostra mais acurada que os modelos auto-regressivos de médias móveis (ARMA) e os modelos ARMA supondo heterocedasticidade condicional auto-regressiva (ARMA-GARCH). O artigo está organizado da seguinte forma: a seção 2 descreve os modelos de previsão de séries temporais utilizados nesse estudo; nas seções 3 e 4 são apresentados a metodologia do estudo e os resultados, respectivamente; e, finalmente, na seção 5, são discutidos os resultados e apresentadas sugestões para trabalhos futuros.

2 Modelos de previsão de séries temporais

2.1 Modelos ARMA e ARMA-GARCH

Dentro da literatura de econometria financeira, duas classes de modelos amplamente estabelecidos na área de previsão de séries econômicas e financeiras são os modelos ARMA e ARMA-GARCH. De acordo com a metodologia proposta por Box e Jenkins (1976), um processo auto-regressivo de médias móveis ARMA (p, q) pode ser representado pela Equação 1.

Sendo {εt} um ruído branco com média zero e variância σ2. Os termos Φ0, Φ1, ..., Φp e θ1, ..., θq são parâmetros que devem ser estimados. Este modelo é classificado linear na média.

Considerando o fato estilizado de ocorrência variância residual não-constante, foi também utilizado o modelo ARMA com um processo de heterocedasticidade condicional auto-regressiva - modelo ARMA (p,q) - GARCH (p,q) (MEADE, 2002). Este modelo é linear na média e não-linear na variância. A partir da Equação 1, é considerado o processo gerador de {εt} como dado pelas Equações 2 e 3.

Em que h2t é a variância condicional no período t. A condição para a existência do momento de quarta ordem e, portanto, de estacionaridade no modelo é αi + βi < 1. O modelo para a variância condicional descrito na Equação 3 é simétrico no que se refere aos impactos dos choques de volatilidade. Entretanto, séries temporais financeiras geralmente possuem respostas assimétricas aos choques de volatilidade. Nesse sentindo, Zakoian (2002) propôs um modelo ARCH assimétrico (TARCH - Threshold ARCH) dado pela Equação 4.

Em que It-1 = 1 se εt-1 < 0. Desta forma, "boas" e "más" noticias têm impactos diferentes na variância condicional h2t. De modo similar, Nelson (1991) propôs o modelo assimétrico EGARCH (Exponential GARCH) dado pela Equação 5.

A estimação dos parâmetros dos modelos ARMA pode ser obtida por meio de várias maneiras, como, por exemplo, mínimos quadrados ordinários ou pelas equações de Yule-Walker. No caso dos modelos ARMA-GARCH simétricos e assimétricos, a estimação dos parâmetros é usualmente obtida por meio da maximização da função de verossimilhança associada a cada modelo por meio de algoritmos de otimização numérica. Neste artigo, utilizou-se o software E-VIEWS© e MATLAB© para a estimação de parâmetros e previsão por meio de modelos ARMA e ARMA-GARCH. Um detalhamento das metodologias de estimação de parâmetros para essas classes de modelos é apresentado em Tsay (2002) e Hamilton (1994).

2.2 Modelos de redes neurais

2.2.1 Redes neurais perceptron multicamadas

As redes neurais fornecem, usualmente, conhecimento quantitativo não-paramétrico. São adequadas para identificação e aprendizado de sistemas que apresentam um comportamento complexo.

O perceptron multicamadas pode ser visto como a generalização do perceptron de uma camada. A rede neural perceptron multicamadas (MLP) contém três tipos de camadas: a camada de entrada, a(s) camada(s) escondida(s) ou intermediária(s) e a camada de saída. Qualquer neurônio de uma camada é capaz de estabelecer uma conexão com um neurônio da camada seguinte. Os neurônios da camada de entrada recebem sinais do ambiente externo e os transmitem para os neurônios da próxima camada. Os neurônios da camada de saída, por sua vez, enviam a informação recebida dos neurônios da(s) camada(s) intermediária(s) para o ambiente externo, conforme apresentado na Figura 1.


A saída de uma rede neural MLP com uma camada intermediária e n1 neurônios intermediários (e um componente linear) pode ser descrita pela Equação 6.

Em que g(x) = 1/(1 + ex) e Zt = (1, yt, yt-1, ..., yt-n-1).

O processo de treinamento de uma rede neural MLP é supervisionado e usualmente realizado por meio do algoritmo de retropropagação do erro ou backpropagation (BP). O algoritmo BP está baseado em uma regra de correção do erro, e pode ser visto como uma generalização do algoritmo de filtro adaptativo ou um caso especial do algoritmo de mínimos quadrados.

O algoritmo BP é um método iterativo baseado no gradiente que busca minimizar o erro quadrático entre a saída observada e a saída desejada. Para minimizar a função-objetivo, o algoritmo BP utiliza uma técnica de busca baseada no gradiente, a regra delta generalizada. Entretanto, o algoritmo BP apresenta algumas limitações, como, por exemplo, baixa velocidade de aprendizado. Alternativas viáveis para o aumento da velocidade de treinamento são, por exemplo, o uso de procedimento heurístico para a modificação adaptativa dos parâmetros, prescrição de uma seleção específica de valores iniciais para os pesos e a utilização da segunda derivada no processo de treinamento. O algoritmo BP utiliza apenas a primeira derivada (curvatura) da superfície do erro, e seu desempenho é sensível à configuração do coeficiente de aprendizado. Com a utilização da segunda derivada (taxa de mudança da curvatura), o tempo de treinamento pode ser significativamente reduzido.

Neste trabalho, utilizou-se o algoritmo de treinamento Levenberg-Marquardt (LM) (LEVENBERG, 1944; MARQUARDT, 1963) o qual consiste em uma modificação do método de Newton e representa, freqüentemente, uma alternativa eficiente ao algoritmo de retropropagação do erro tradicional. A estratégia do algoritmo consiste na expansão da função f(x,w) = t em uma série de Taylor. O objetivo do algoritmo é minimizar a função-custo, J(w), com relação ao peso w. O algoritmo LM apresenta alto custo computacional e requer um grande número de operações.

2.2.2 Redes neurais função de base radial

A aproximação não-linear realizada por uma rede neural função de base radial (RBF) com m neurônios com uma camada intermediária pode ser descrita na Equação 7.

Sendo φ(.) a função de base radial e ci o centro da i-ésima função de base radial. φ(.) é usualmente definida como uma função Gaussiana do tipo φ(x) = exp(-x2 / 2σ2) em que σ define a largura de cada função. A solução de mínimos quadrados para os pesos wi satisfaz a relação (AT A)w = ATb em que A é a matriz com elementos Aij representando o elemento de saída do j-ésimo neurônio para a i-ésima entrada. O método de clusterização utilizado no experimento envolvendo as redes neurais RBF foi o método clássico k-médias. A estrutura geral de uma rede neural RBF pode ser vista na Figura 2.


2.3 Sistema nebuloso Takagi-Sugeno

A identificação de um modelo nebuloso Takagi Sugeno (TS) envolve duas tarefas principais: ajuste dos parâmetros e otimização da estrutura. O procedimento de ajuste dos parâmetros busca a estimação de um conjunto factível de parâmetros para uma dada estrutura. O procedimento de otimização da estrutura busca: a) identificar uma estrutura ótima para modelos de ajuste local; b) identificar quais são as variáveis relevantes da parte antecedente das regras de ação; e c) determinar uma partição adequada do espaço de dados (MARINKE et al., 2005). O modelo TS consiste em um conjunto de regras lingüísticas SE-ENTÃO que podem ser representadas pela Equação 8:

Em que as sentenças SE definem a parte antecedente (premissa) enquanto as funções da regra ENTÃO constituem-se na parte conseqüente do sistema nebuloso; z = [z1, ..., zm]T é o vetor de entradas da parte premissa; e Aji são labels dos conjuntos nebulosos; u = [uj1, ..., ujqj]T representa o vetor de entradas para a parte conseqüente de R(j) que é constituída de qj termos; gj = gj(uj) denota a j-ésima regra de saída que é um polinômio linear dos termos de entrada do conseqüente uji; e wj = [wj0, wj1, ..., wjqj]T são os coeficientes polinomiais que formam o conjunto de parâmetros dos conseqüentes. A cada label lingüístico Aji é associada com a função de pertinência; enquanto (zi) é descrita pela Equação 9:

Em que mij e σij e são o valor médio e o desvio-padrão da função de pertinência do tipo Gaussiana, respectivamente.

A união de todos estes parâmetros define o conjunto de parâmetros da premissa. O poder da regra R(j) representa seu grau de excitação e é regido pela Equação 10.

Os conjuntos nebulosos que dizem respeito a uma regra formam uma região nebulosa (cluster) dentro do espaço da premissa, Aj1 x Aj2x ... x Ajm, com uma distribuição de pertinência descrita pela Equação 10. Dado os vetores de entrada z e uj, j = 1, ..., M, a saída final do sistema nebuloso é inferida pela média ponderada das saídas locais gj(uj)(Equação 11).

Em que M denota o número de regras e vj(z) é a intensidade do poder normalizado de R(j) que é definida pela Equação 12:

Neste artigo, a identificação da estrutura do modelo nebuloso TS foi baseada no algoritmo de agrupamento ( clustering) nebuloso Gustafson-Kessel (GK) ( GUSTAFSON; KESSEL, 1979) para a parte antecedente das regras e no algoritmo de mínimos quadrados para a parte conseqüente das regras. Um diagrama ilustrando a estrutura de um sistema nebuloso TS é mostrado na Figura 3.


2.4 Principais diferenças entre os modelos utilizados

Os modelos de redes neurais e sistemas nebulosos utilizam funções não-lineares para descrever e prever o comportamento do sistema, como pode ser visto nas Equações 6, 7 e 9. Dessa forma, esses modelos são considerados não-lineares na média. Os modelos ARMA, por sua vez, descrevem o comportamento do sistema utilizando uma função linear. Portanto, essa classe de modelos é considerada linear na média. Finalmente, os modelos ARMA-GARCH utilizam uma função linear para descrever o comportamento do primeiro momento (média) e uma função não-linear para descrever o comportamento do segundo momento (variância). Dessa forma, esses modelos são classificados como não-linear na variância (CAMPBELL et al., 1997). Do ponto de vista da estimação, os modelos de redes neurais e sistemas nebulosos utilizados classificam-se como não-paramétricos, enquanto que os modelos ARMA e ARMA-GARCH classificam-se como paramétricos.

3 Metodologia e estatística descritiva das séries temporais

Neste artigo, foram utilizadas séries da primeira diferença dos logaritmos (log-retornos) da taxa de câmbio real/dólar (R$/US$) com freqüências de 15 minutos, 60 minutos e 120 minutos de 01/01/2002 a 01/01/2003 e séries com freqüência diária e semanal de 01/01/2000 a 01/01/2004. As Figuras 4 a 8 mostram o comportamento da taxa de câmbio durante o período observado. Foram utilizados os primeiros 80% dos dados para estimação dos modelos e os últimos 20% para validação e previsão um-passo-à-frente fora-da-amostra. A Tabela 1 traz o número de observações utilizadas na fase de estimação e validação (previsão) para cada série.


A Tabela 2 traz a estatística descritiva das séries analisadas. O resultado do teste Jarque-Bera mostra que a hipótese de normalidade na distribuição dos retornos foi rejeitada em todas as séries em função da presença de elevada curtose e assimetria positiva (com exceção da série diária). A rejeição da hipótese nula do teste Jarque-Bera indica uma distribuição com uma incidência possivelmente maior de valores extremos, o que dificulta a previsão dessas séries temporais por parte dos modelos considerados neste estudo. O teste Dickey-Fuller Aumentado, por sua vez, mostrou que a hipótese nula de presença de raízes unitárias foi rejeitada em todas as séries, indicando que todas são estacionárias. O teste para presença de heterocedasticidade condicional auto-regressiva (ARCH), baseado no multiplicador de Lagrange, indicou a presença de ARCH em todas as séries.

O teste Brock-Dechert-Scheinkman (BDS) (BROCK et al., 1996) foi também realizado para verificar uma possível dependência não-linear nas séries temporais analisadas. A rejeição da hipótese nula de independência pode ser interpretada como uma evidência favorável ao uso de modelos não-lineares para o ajuste da série. O teste foi aplicado às séries de resíduos obtidas a partir da estimação de um modelo AR(1)-GARCH(1,1). Os resultados indicaram a presença de não-linearidade em todas as séries. Além disso, foi constatado que quanto maior é a freqüência da série, maior é a rejeição da hipótese nula de linearidade (com exceção da série diária).

Considerando a possibilidade de que o modelo AR(1)-GARCH(1,1) pode não estar bem ajustado às séries temporais utilizadas, aplicou-se o teste BDS também aos resíduos obtidos a partir de um modelo GARCH assimétrico (EGARCH). Entretanto, os resultados em termos de rejeição da hipótese nula de independência foram semelhantes aos obtidos quando utilizado um modelo AR(1)-GARCH(1,1). Além disso, foi observado o mesmo padrão em relação ao fato de que quanto maior é a freqüência da série, maior é a rejeição da hipótese nula de linearidade.

Para este trabalho, utilizou-se o software MATLAB® para a implementação das rotinas computacionais para os modelos de redes neurais e sistemas nebulosos. Durante a implementação computacional, foram consideradas as representações matemáticas dinâmicas não-lineares NARX (Non-linear Auto-Regressive with eXogenous inputs) e NARMAX (Non-linear Auto-Regressive Moving Average with eXogenous inputs) (CHEN; BILLINGS, 1989), que podem ser descritas pelas Equações 13 a 16.

Em que y(t), u(t) e e(t) são, respectivamente, as saídas do sistemas, as entradas e o componente média móvel; ny, nu e ne são as defasagens máximas das saídas, das entradas e do componente média móvel; {et} é assumido ser ruído branco. A função f é uma função não-linear que descreve o comportamento do sistema.

O critério de informação de Akaike (AIC) foi utilizado para a escolha do número de termos e defasagens dos modelos ARMA e ARMA-GARCH simétricos e assimétricos. Especificamente, foi construída uma rotina computacional que estima para até 3 defasagens todas as possíveis diferentes especificações que os modelos ARMA e ARMA-GARCH podem assumir. Na seção de resultados, apenas a estrutura que conseguiu melhor ajuste será mostrada. No caso dos modelos de redes neurais e sistemas nebulosos, o número de neurônios na camada intermediária, o número de funções de pertinência e o número de termos e defasagens foram obtidos por meio da minimização do erro quadrático médio entre a saída desejada e estimada dentro-da-amostra. Assim como no caso anterior, na seção de resultados, apenas a estrutura que conseguiu melhor ajuste será mostrada.

A avaliação do desempenho de previsão fora-da-amostra dos modelos foi realizada de acordo com os seguintes critérios:

Root mean squared error (RMSE):

Em que e é o erro de previsão calculado para a observação t + j e m é o número de observações.

Índice de Desigualdade de Theil (U-Theil):

Em que

t é o valor previsto (estimado) para o período t, yté o valor observado e m é o número de observações. O índice U-Theil procura avaliar o ajustamento da série prevista à série original. Quanto mais próximo a 1, significa que a série estimada pelo modelo tem pouco ajustamento à série original.

Percentual de sinais corretamente previstos (SCP): quanto maior for o número de SCP, melhor será o modelo. Em outras palavras, quanto maior for o número de vezes em que o modelo consegue prever a direção do movimento, ou seja, quando o retorno do ativo será positivo ou negativo, melhor será seu desempenho.

Estatística de falha de previsão Pesaran- Timmermann: A estatística Pesaran-Timmermann (PT) é particularmente interessante quando a distribuição de probabilidade (intervalos de confiança) das previsões é de difícil derivação por métodos analíticos, como no caso de um grande número de modelos dinâmicos não-lineares (Pesaran e Timmernann, 1992). A estatística PT é dada pela Equação 19:

Em que é o percentual de vezes em que o sinal de mudança da variável foi previsto corretamente, * é o valor esperado de , dado por * = P-P+ + (1 - P-)(1 - P+) em que P- é o percentual calculado de sinais negativos e P+ é o percentual calculado de sinais positivos. () e (*) são dados pelas Equações 20 e 21.

4 Resultados

As Tabelas de 3 a 7 mostram os resultados da avaliação de previsão das séries temporais financeiras utilizadas neste estudo. O resultado mais importante consiste no fato de que os modelos de redes neurais e sistemas nebulosos utilizados no estudo tiveram um desempenho de previsão superior aos modelos ARMA e ARMA-GARCH em todas as séries analisadas. Para a série com freqüência de 15 minutos, a melhor performance, dentre os modelos ARMA e ARMA-GARCH, consistiu em um índice U-Theil de 0,867 e uma previsão correta da direção dos movimentos dos retornos de 44%, sem significância estatística. O melhor modelo dentre as redes neurais e sistemas nebulosos, por sua vez, obteve um índice U-Theil de 0,786 e previu corretamente 54% dos movimentos dos retornos, com uma significância estatística de 99% calculada pela estatística PT.

Os resultados indicam ainda que quanto menor é a freqüência da série, maior é a capacidade dos modelos em realizar boas previsões. A análise das Tabelas de 3 a 7 revela que à medida que a freqüência observada das séries vai caindo, a qualidade das previsões aumenta. Uma possível explicação para essa constatação reside no fato de que as séries de alta freqüência apresentam um nível de não-linearidade maior (Tabela 2), o que torna a previsão uma tarefa mais difícil. Além disso, séries de alta freqüência estão mais contaminadas com ruídos advindos da microestrutura do mercado, o que também dificulta sua previsão. Nesse sentido, as piores previsões foram obtidas para as séries de retorno com freqüência de 15 minutos (Tabela 3) enquanto que as melhores previsões foram obtidas para a série de retornos com freqüência semanal (Tabela 7). Nesse último caso, o modelo de redes neurais MLP-NARMAX obteve um índice U-Theil de 0,469 e previu corretamente 82% da direção do movimento com uma significância estatística de 99%, enquanto que, dentre os modelos ARMA e ARMA-GARCH, o melhor desempenho consistiu em um índice U-Theil de 0,654 e uma previsão correta da direção dos movimentos dos retornos de 67%, com 95% de significância estatística.

Deve ser destacado que o tamanho do erro de previsão (RMSE) mostrou-se um critério pouco útil para escolher qual é o modelo de melhor desempenho. No caso, por exemplo, das séries com freqüência de 15 minutos e semanal, o RMSE dos modelos ARMA e ARMA-GARCH foi maior que o RMSE dos modelos de redes neurais e sistemas nebulosos. Esse resultado corrobora o estudo de Leitch e Tanner (1991), os quais concluíram que, além do tamanho erro de previsão, outros critérios devem ser levados em conta na escolha de qual é o melhor modelo de previsão.

A Tabela 8 traz um resumo dos resultados da avaliação de previsão para o modelo de melhor desempenho em cada série. O modelo de redes neurais MLP com representação matemática NARMAX foi o que obteve os melhores resultados de previsão nas séries temporais analisadas.

A Tabela 9 traz os resultados da estratégia de negociação estabelecida com base nas previsões geradas pelos modelos. São comparados o retorno acumulado, retorno médio, desvio-padrão, índice de Sharpe e índice de Sharpe ajustado da estratégia de negociação baseada no modelo de melhor ajuste para cada série e também na estratégia ingênua do tipo buy-and-hold. O índice de Sharpe ajustado, proposto por Cerny (2004), consiste em uma correção do índice de Sharpe tradicional para distribuições de retorno que não cumprem com os supostos de normalidade. Seu cálculo toma como base um(a) investidor(a) com função de utilidade quadrática. Para cada série de retornos X gerada pela estratégia de negociação, o índice de Sharpe ajustado será diferente to índice de Sharpe tradicional sempre que as condições da Equação 22 forem violadas (bliss point conditions):

Em que E(X) e E(X2) indicam a média da série de retornos e a média das observações ao quadrado, respectivamente. Finalmente, é assumido que os custos de transação da estratégia estejam embutidos no spread entre a compra e a venda e bem como a possibilidade de se fazer venda a descoberto.

A estratégia de negociação está baseada nas seguintes regras:

Regra 1: Se o valor previsto para o próximo período for positivo, computa-se uma compra;

Regra 2: Se o valor previsto para o próximo período for negativo, computa-se uma venda.

Os resultados da estratégia de negociação indicam que as estratégias baseadas em modelos de redes neurais obtiveram retornos (acumulados e médios) superiores àqueles obtidos em estratégias baseadas em modelos ARMA e ARMA-GARCH para todas as séries temporais analisadas. Além disso, as duas medidas de performance ajustadas ao risco utilizadas indicaram que as estratégias de negociação baseadas em modelos de redes neurais obtiveram uma melhor relação risco-retorno em todos os casos.

5 Conclusões e sugestões para trabalhos futuros

Este trabalho teve como objetivo a comparação do desempenho de previsão dos modelos de redes neurais MLP, redes neurais RBF e os sistemas nebulosos TS em relação aos modelos ARMA e ARMA-GARCH, os quais estão amplamente estabelecidos na literatura relacionada à econometria financeira. Foram utilizadas séries de retorno da taxa de câmbio real/dólar com freqüências de 15 minutos, 60 minutos, 120 minutos, diária e semanal.

Os resultados indicam que os modelos de redes neurais obtiveram um desempenho de previsão superior aos demais modelos considerados, corroborando evidências empíricas anteriores que atestam a robustez dessa abordagem quando aplicada à aproximação e previsão de séries financeiras. Além disso, verificou-se que a consistência das previsões está diretamente relacionada à freqüência com que a série é observada, possivelmente devido à presença de não-linearidades e de ruídos advindos da microestrutura do mercado, como, por exemplo, o spread entre compra e venda e o fluxo de ordens de compra e venda, que afetam a dinâmica das séries de alta freqüência. Com relação à estratégia de negociação estabelecida com base nas previsões geradas pelos modelos, constatou-se que as estratégias baseadas em modelos de redes neurais obtiveram retornos superiores às demais estratégias. Entretanto, quando o risco da estratégia é levado em conta, o resultado torna-se misto.

Deve-se destacar que a otimização da estrutura, precisão, complexidade computacional e ordens dos vetores de entrada dos modelos baseados em inteligência computacional devem ser analisadas em maior profundidade em trabalhos futuros. Na área de avaliação do desempenho de previsão, alguns estudos têm sugerido que a avaliação baseada em previsões pontuais não é capaz de discriminar corretamente os ganhos advindos do uso de modelos mais sofisticados (CLEMENTS et al., 2004). Neste sentido, a utilização de critérios de avaliação de desempenho mais robustos, como, por exemplo, previsão de densidades, tem recebido grande destaque na literatura especializada recente.

Recebido em 27/5/2006

Aceito em 12/9/2008

Agradecimentos: Os autores agradecem aos revisores anônimos quanto a sugestões no texto.

  • ABHYANKAR, A.; COPELAND, L.; WONG, W. Nonlinear dynamics in real-time equity markets indices: evidence from United Kingdom. The Economic Journal, v. 105, n. 431, p. 864-880, 1995.
  • BARR, J.; SARACENO, F. Cournot competition, organisation and learning. Journal of Economic Dynamics and Control, v. 29, n. 1-2, p. 277-295, 2005.
  • BOLLERSLEV, T.; CHOU, R.; KRONER, K. ARCH modeling in finance: a review of the theory and empirical work. Journal of Econometrics, v. 52, n.1-2, p. 5-59, 1992.
  • BOX, G.; JENKINS, G. Time series analysis: forecasting and control. San Francisco: Holden Day, 1976.
  • BROCK, W.; DECHERT, D.; LEBARON, B.; SCHEINKMAN, J. A test for independence based on a correlation dimension. Econometric Review, v. 15, n. 3, p. 197-235, 1996.
  • CAMPBELL, J.; LO, A.; MACKINLAY, A. The econometrics of financial markets 1 ed. Princeton: Princeton university press, 1997.
  • CERNY, A. Mathematical techniques in finance: tools for incomplete markets. Princeton: University Press, 2004.
  • CHEN, S.; BILLINGS, S. Representation of nonlinear systems: the NARMAX model. International Journal of Control, v. 49, p. 1012-1032, 1989.
  • CLEMENTS, M.; FRANSES, P.; SWANSON, N. Forecasting economic and financial time-series with non-linear models. International Journal of Forecasting, v. 20, p. 169-183, 2004.
  • EAKINS, S.; STANSELL, S. Can value-based stock selection criteria yield superior risk-adjusted returns: an application of neural networks. International Review of Financial Analysis, v. 12, n. 1, p. 83-97, 2003.
  • GUSTAFSON, D. E.; KESSEL, W. C. Fuzzy Clustering with a Fuzzy Covariance Matrix. In: IEEE CONFERENCE ON CONTROL AND DECISION, 1979. Proceedings..., San Diego, CA, USA, p. 761-766, 1979.
  • KAASHOEK, J.; VAN DIJK, H. Neural network pruning applied to real exchange rate analysis. Journal of Forecasting, v. 21, p. 559-577, 2002.
  • LEITCH, G.; TANNER, E. Economic forecast evaluation: profits versus the conventional error measures. American Economic Review, v. 81, n. 3, p. 580-590, 1991.
  • LEÓN, T.; LIERN, V.; VERCHER, E. Viability of infeasible portfolio selection problems: a fuzzy approach. European Journal of Operational Research, v. 139, n. 1, p. 178-189, 2002.
  • LEVENBERG, K. A method for the solution of certain non-linear problems in least squares. Quart. Applied Mathematics, v. 2, n. 2, p. 164-168, 1944.
  • MALHOTRA, R.; MALHOTRA, D. Differentiating between good credits and bad credits using neuro-fuzzy systems. European Journal of Operational Research, v. 136, n. 1, p. 190-211, 2002.
  • MARINKE, R.; ARAUJO, E.; COELHO, L. S.; MATIKO, I. Particle swarm optimization (PSO) applied to fuzzy modeling in a thermal-vacuum system. In: INTERNATIONAL CONFERENCE ON HYBRID INTELLIGENT SYSTEMS (HIS), 5, 2005, Brazil. Proceedings..., Brazil, p. 67-72, 2005.
  • MARQUARDT, D. W. An algorithm for least-squares estimation of nonlinear parameters. SIAM J. of Applied Mathematics, v. 11, n. 2, p. 431-441, 1963.
  • MEADE, N. A comparison of the accuracy of short term foreign exchange forecasting methods. International Journal of forecasting, n. 18, p. 67-83, 2002.
  • MORELLI, M.; MONTAGNA, G.; NICROSINI, O.; TRECCANI, M.; FARINA, M.; AMATO, P. Pricing financial derivatives with neural networks. Physica A, v. 388, n.1-2, p. 160-165, 2004.
  • NELSON, D. Conditional Heteroskedasticity in Asset Returns: A New Approach. Econometrica, v. 59, n. 2, p. 347-370, 1991.
  • OCAL, N. Nonlinear models for UK macroeconomic time series. Studies in nonlinear dynamics and econometrics, v. 4, n. 3, p. 123-135, 2000.
  • PÉREZ-RODRÍGUEZ, J.; TORRA, S.; ANDRADA-FÉLIX, J. STAR and ANN models: forecasting performance on the Spanish 'Ibex-35' stock index. Journal of Empirical Finance, n. 12, p. 490-509, 2005.
  • PESARAN, M., TIMMERMANN, A. A simple nonparametric test of predictive performance. Journal of Business & Economic Statistics, v. 10, n. 4, p. 561-565, 1992.
  • SHAPIRO, A. F. The merging of neural networks, fuzzy logic, and genetic algorithms. Insurance: Mathematics and Economics, v. 31, n. 1, p. 1151-31, 2002.
  • TAKAGI, T.; SUGENO, M. Fuzzy identification of systems and its application to modeling and control. IEEE Transactions on Systems, Man, and Cybernetics, v. 15, n. 1, p. 116-132, 1985.
  • TSAIH, R.; HSU, Y.; LAI, C. Forecasting S&P 500 stock index futures with a hybrid AI System. Decision Support Systems, v. 23, n. 2, p. 161-174, 1998.
  • TSENG, F. M.; TZENG, G. H. A fuzzy seasonal ARIMA model for forecasting. Fuzzy Sets and Systems, v. 126, n. 3, p. 367-376, 2002.
  • ZAKOIAN, J. M. Threshold heteroskedastic models. Journal of Economic Dynamics and Control, v. 18, n. 5, p. 931-955, 2002.
  • Datas de Publicação

    • Publicação nesta coleção
      23 Jan 2009
    • Data do Fascículo
      Dez 2008

    Histórico

    • Recebido
      27 Maio 2006
    • Aceito
      12 Set 2008
    Universidade Federal de São Carlos Departamento de Engenharia de Produção , Caixa Postal 676 , 13.565-905 São Carlos SP Brazil, Tel.: +55 16 3351 8471 - São Carlos - SP - Brazil
    E-mail: gp@dep.ufscar.br