Acessibilidade / Reportar erro

Previsão não-linear de retornos na BOVESPA: volume negociado em um modelo auto-regressivo de transição suave

Non-linear forecast of returns at BOVESPA: trading volume in a smooth transition auto regressive model

Resumos

Neste artigo, avalia-se a capacidade preditiva de um modelo auto-regressivo de transição logística suave (lstar) na geração de retornos estatisticamente significativos, quando se utiliza como variável de transição o volume negociado e o próprio retorno defasado, para o índice Ibovespa da Bolsa de Valores de São Paulo, analisado em termos diários entre os anos de 1996 e 2006. A justificativa para a inclusão do volume encontra-se em características do mercado e em algumas evidências de finanças comportamentais, que indicam que existe uma relação negativa entre volume e retornos futuros. O modelo possui, em geral, bom ajuste aos dados, embora não tenha a capacidade de gerar lucros reais adicionais, se os custos de transação são de 0.5% por operação. Para custos menores existe certa capacidade de previsão, embora inferior à de um modelo ar(1) e da estratégia de comprar e manter. considerando o risco, para custos de 0.035% por operação, o modelo auto-regressivo possibilita a obtenção de um índice de sharpe 20% maior do que com a estratégia de comprar e manter.

previsão de retornos; modelos não lineares; Ibovespa; volume negociado


In this study, the predictive power of a logistic smooth transition auto regression model (LSTAR) in generating statistically significant returns is evaluated when the transition variable is trading volume and the lagged return itself, for the São Paulo Stock Exchange's Ibovespa Index, with the analysis based on daily data between 1996 and 2006. The reason for the inclusion of trading volume is found in some market characteristics and behavioral finance results, which indicate the existence of a negative relationship between trading volume and future returns. The model shows a good adjustment to the data, although it does not have the ability to generate additional profits if the transaction costs are of 0.5% per trade. For lower costs there is some predictive power, though lower than an AR(1) model and a buy and hold strategy. Considering the risk, for transaction costs of 0.035% per trade, the autoregressive model permitted a Sharpe index 20% larger than the buy and hold strategy.

return forecast; non-linear models; Ibovespa index; trading volume


ARTIGOS

Previsão não-linear de retornos na BOVESPA: volume negociado em um modelo auto-regressivo de transição suave

Non-linear forecast of returns at BOVESPA: trading volume in a smooth transition auto regressive model

Robert Aldo IquiapazaI, * * Endereço: Robert Aldo Iquiapaza Av. Antônio Carlos, 6627, sala 4120, FACE, Pampulha, Belo Horizonte/MG, 31270-901. E-mail: raic@face.ufmg.br ; Aureliano Angel BressanII; Hudson Fernandes AmaralIII

IDoutorando em Administração na UFMG, Belo Horizonte/MG, Brasil

IIDoutor pela UFV. Professor da UFMG, Belo Horizonte/MG, Brasil

IIIDoutor pela Université Pierre Mendés France Grenoble II, França.Professor da UFMG, Belo Horizonte/MG, Brasil

RESUMO

Neste artigo, avalia-se a capacidade preditiva de um modelo auto-regressivo de transição logística suave (lstar) na geração de retornos estatisticamente significativos, quando se utiliza como variável de transição o volume negociado e o próprio retorno defasado, para o índice Ibovespa da Bolsa de Valores de São Paulo, analisado em termos diários entre os anos de 1996 e 2006. A justificativa para a inclusão do volume encontra-se em características do mercado e em algumas evidências de finanças comportamentais, que indicam que existe uma relação negativa entre volume e retornos futuros. O modelo possui, em geral, bom ajuste aos dados, embora não tenha a capacidade de gerar lucros reais adicionais, se os custos de transação são de 0.5% por operação. Para custos menores existe certa capacidade de previsão, embora inferior à de um modelo ar(1) e da estratégia de comprar e manter. considerando o risco, para custos de 0.035% por operação, o modelo auto-regressivo possibilita a obtenção de um índice de sharpe 20% maior do que com a estratégia de comprar e manter.

Palavras-chave: previsão de retornos; modelos não lineares; Ibovespa; volume negociado.

ABSTRACT

In this study, the predictive power of a logistic smooth transition auto regression model (LSTAR) in generating statistically significant returns is evaluated when the transition variable is trading volume and the lagged return itself, for the São Paulo Stock Exchange's Ibovespa Index, with the analysis based on daily data between 1996 and 2006. The reason for the inclusion of trading volume is found in some market characteristics and behavioral finance results, which indicate the existence of a negative relationship between trading volume and future returns. The model shows a good adjustment to the data, although it does not have the ability to generate additional profits if the transaction costs are of 0.5% per trade. For lower costs there is some predictive power, though lower than an AR(1) model and a buy and hold strategy. Considering the risk, for transaction costs of 0.035% per trade, the autoregressive model permitted a Sharpe index 20% larger than the buy and hold strategy.

Key words: return forecast; non-linear models; Ibovespa index; trading volume.

INTRODUÇÃO

A possibilidade da previsão dos retornos dos ativos negociados nas bolsas de valores tem sido tema recorrente de pesquisas em finanças, com importantes conseqüências para a eficiência desses mercados. Os primeiros estudos estiveram focados na previsão do prêmio pelo risco (equity premium), utilizando principalmente modelos lineares, e em geral demonstraram baixa capacidade de previsão, fora da amostra utilizada, na geração de ganhos adicionais, especialmente quando se consideram os custos de transação. Recentemente, para a previsão de retornos, os pesquisadores têm preferido a utilização de técnicas de modelagem dinâmica não-linear, constituindo-se uma área crescente de pesquisa empírica em finanças. Como exemplo, tem-se os trabalhos de McPherson e Palardy (2007), McMillan (2005, 2007), Avramov e Chordia (2006) e as referências indicadas por tais autores.

Na modelagem não-linear dos retornos, os diferentes autores utilizam como informações preditoras os valores passados do próprio ativo, o que se justifica quando se comprova a presença de correlação serial, além de diversas informações relacionadas com o ambiente de negócios, outras variáveis financeiras e variáveis macroeconômicas.

Contudo, uma variável relevante e que nem sempre é considerada nas pesquisas é o volume negociado do ativo. Importantes exceções são os estudos de Lee e Swaminathan (2000), Wang e Chin (2004) e McMillan (2007) que analisaram o efeito do volume no caso dos Estados Unidos, China e um conjunto de quatro países desenvolvidos, respectivamente. No Brasil, não foi possível identificar um número significativo de publicações com tal característica, salvo a sugestão apresentada no estudo de Martin, Kayo, Kimura e Nakamura (2004).

O presente estudo focaliza este tema de pesquisa, examinando se o volume tem algum poder preditivo da dinâmica não-linear dos retornos futuros no mercado de ações no Brasil. Como o retorno e o volume são determinados conjuntamente pelo comportamento dos agentes no mercado, a idéia do artigo é a de utilizar a informação do volume como variável limiar em um modelo de transição logística suave e compará-la com modelos de previsão mais simples.

Resultados da literatura - Lee e Swaminathan (2000), Wang e Chin (2004) e McMillan (2007), indicam que existem evidências de uma relação negativa entre volume e retornos futuros. Isto significa que uma queda no volume poderia favorecer a tomada de decisões de compra ou a manutenção de um ativo, ou portfólio de ativos, quando se está analisando um índice. Como as informações se atualizam diariamente, pode-se estabelecer um mecanismo dinâmico para atualização do portfólio com freqüência diária ou maior. No final podem-se avaliar os retornos gerados e compará-los a outros benchmarks e, desta forma, saber se foi possível a geração de um retorno superior.

O objetivo geral do estudo consiste então em determinar se a variável volume negociado, utilizada em modelagem logística não-linear de ajuste suave, permite obter retornos anormais significativos. Especificamente, pretende-se ainda comparar o desempenho preditivo do modelo não-linear com e sem a incorporação do volume com modelos lineares tradicionais.

REVISÃO DE LITERATURA

Considerações sobre previsão e evidência empírica de não-linearidade

De acordo com Avramov e Chordia (2006), a previsibilidade dos retornos dos ativos continua sendo um objeto de pesquisa controverso pelos seguintes motivos: a) questionamentos relacionados à mineração de dados (data mining); b) preocupações de que os métodos estatísticos implementados para explorar a previsibilidade indiquem resultados espúrios; c) preocupação sobre a ampla margem entre a evidência de previsibilidade dentro da amostra e o desempenho em tempo real na gestão ativa de investimentos; e d) preocupações com o baixo desempenho fora da amostra, nos modelos de regressão para previsão.

Adicionalmente, Campbell, Lo e MacKinlay (1999) destacam a limitada aplicabilidade de modelos de previsão que possuem como implicação prática a avaliação direta ou indireta da hipótese de eficiência de mercado. Isto porque abordagens que envolvem a avaliação do grau de eficiência devem assumir, explícita ou implicitamente, um modelo de precificação, sob pena de incorrer em avaliações espúrias acerca de eventuais ineficiências de mercado, as quais podem ser na verdade resultantes de flutuações temporárias decorrentes do custo de obtenção e processamento de informações, conforme descrição de Grossman e Stiglitz (1980), ou da avaliação de um modelo de precificação inadequado.

Para superar estas limitações, diversas alternativas têm sido propostas. Uma primeira linha de pesquisa corresponde à incorporação de fatores de correção nos modelos de precificação, como a proposta de Fama e French (1992), e a recente inovação de Liu (2006), que incorpora o fator risco de liquidez.

Outra linha de pesquisa é a utilização de modelos que incorporam a dinâmica não-linear e informações secundárias na previsão dos retornos. A esse respeito, McMillan (2005) reconhece que a não-linearidade pode estar originada na diferença de comportamento entre os investidores comuns e os arbitradores, onde os vieses cognitivos e as limitações à arbitragem condicionam uma dinâmica que exige um desvio forte do equilíbrio, para que os arbitradores entrem no mercado, e assim retornos pequenos e grandes podem exibir dinâmicas diferentes ao redor do equilíbrio. Já Venetis e Peel (2005) analisam a previsão dos retornos incorporando a não-linearidade na equação da média e da variância condicional, utilizando modelos do tipo AR-GARCH-(M), para capturar a relação inversa entre volatilidade e autocorrelação. Avramov e Chordia (2006) destacam a utilização de modelos não-lineares com outras informações do contexto macroeconômico e financeiro, como a taxa e a estrutura a termo de juros, o indicador de retorno de dividendos, e o risco de default; isto é, modelos que incorporem ou não a mudança de estilo de investimento, em função do ciclo de negócios. Seguindo o argumento de Wang e Chin (2004), McMillan (2007) reconhece a importância do volume na capacidade de previsão de retornos, utilizando modelos de transição tipo STAR (auto-regressivos de transição suave).

Desta forma, modelos condicionalmente gaussianos e de transição com incorporação de outras informações secundárias podem representar melhor o comportamento de séries financeiras, já que são suficientemente flexíveis para captar os fatos estilizados e freqüentemente nelas encontrados.

No Brasil, alguns estudos recentes sobre previsão de retornos, como o de Minardi (2004), encontraram evidências de alguma previsibilidade em dados de preços passados. No período entre setembro de 1994 e agosto de 2000, teria sido possível obter ganhos significativamente superiores ao equilíbrio de mercado medido pelo IBX e por um índice de mercado sem ponderação, utilizando estratégias de compra e venda das ações com base em seu desempenho passado, mesmo considerando o impacto do custo da corretagem. Contudo, tal significância não foi confirmada no caso do Ibovespa, quando se consideram os custos de corretagem. A autora destaca ainda a quase impossibilidade prática de se identificar o índice que representa a carteira teórica de mercado, na qual está baseado o modelo CAPM. Assim poderiam existir outros índices de mercado nos quais esta anomalia não seja comprovada. Este é um aspecto importante no contexto do presente estudo, o qual não pretende assumir explicitamente um modelo de apreçamento com vistas à verificação da hipótese de eficiência de mercado, mas testar a influência do volume negociado sobre o comportamento dos retornos, em um modelo de transição suave.

Torres, Bonomo e Fernandes (2002) testaram duas versões do modelo de passeio aleatório para os preços de carteiras de ações no mercado brasileiro, encontrando evidências contrárias a tal modelo nos horizontes diários e semanais, caracterizadas pela persistência. As evidências foram mais fracas em períodos mais recentes. Também encontraram sazonalidades diárias, incluindo o efeito segunda-feira, e efeitos para alguns meses. Além disso, descreveram evidências de não-linearidades nos retornos observadas em diversos horizontes de tempo.

Já os estudos que consideram a não-linearidade nos retornos destacam o efeito dia-da-semana, a presença de autocorrelação, a presença de clusters de volatilidade e mudanças de regime nos retornos.

Correa e Valls Pereira (1998) concluem que os exercícios realizados para um período de baixa volatilidade (abril de 1991 a novembro de 1993) nos retornos do Ibovespa revelaram uma aparente dominância fora da amostra de um modelo de dummies com inovações GARCH (1,1) sobre um TAR modificado para incluir efeitos dia da semana. Estes autores concluem que as séries financeiras apresentam instabilidades no tempo e peculiaridades institucionais que fazem com que modelos de coeficientes fixos lineares e gaussianos de memória curta sejam inadequados para aproximar tais séries; já os modelos não-lineares, graças à sua estrutura mais flexível, conseguem reduzir esse problema.

Bone e Ribeiro (2002), estudando as ações do índice Ibovespa no período de 1996 a 1999, verificaram a importância de termos auto-regressivos lineares e não-lineares e dos chamados efeito dia-da-semana e efeito feriado na previsão dos retornos das ações do índice. Especificamente, de acordo com os resultados de Bone e Ribeiro (2002), a quinta-feira aparece como um dia de baixas em relação à quarta-feira (e segunda), embora em poucas ações. O maior destaque entre os dias da semana é visto na terça-feira, onde metade das ações teve retornos maiores que a segunda-feira, na média. De acordo com os autores este fato pode ter uma "interpretação política ..., poder-se-ia associar este retorno positivo diferenciado na terça-feira como um efeito Brasília, pois é o dia associado com efetiva participação parlamentar no Congresso Nacional" (p. 32). Logo, os resultados sugerem que na maioria das ações algum dos efeitos é verificado, com particular importância da terça-feira.

Martin et al. (2004), utilizando o modelo de regimes de conversão markoviano não-linear, analisam a existência de bolhas especulativas racionais na Bolsa de Valores de São Paulo [BOVESPA] no período pós-Plano Real. Indicam que a existência de tais bolhas especulativas implica uma mudança de regime. Esta mudança pode ocorrer em função dos fundamentos macroeconômicos, por exemplo excesso de liquidez. Entretanto, no período do estudo, a BOVESPA enfrentou uma série de crises externas e internas. Além disso, o país passou por uma série de reformas, incluindo a liberalização econômica e mudanças de marcos regulatórios, especialmente no período de 1994 a 1998. Martin et al. (2004) indicam que a dinâmica do processo de geração dos retornos pode ser descrito como função de dois regimes: bull markets e bear markets. Estes ciclos, porém, podem ser decompostos em outros ciclos, fases iniciais e finais do ciclo de crescimento (bull) e de queda (bear). Esta decomposição mostrou-se mais coerente com o conceito de bolha especulativa, no qual há uma relação não-linear entre o preço das ações e os seus fundamentos. Ainda, os autores sugerem que pesquisas futuras considerem o que ocorreu com os dividendos, e utilizem regimes de conversão mais complexos, considerando, por exemplo, a relação entre retornos e volume negociado.

No presente estudo se amplia esta linha de pesquisa: primeiro, pelo reconhecimento da não-linearidade e a importância da informação contida no volume negociado para a previsão dos retornos e, segundo, pesquisando se esta capacidade se revela superior em comparação a outras estratégias simples.

Cabe ressaltar que esta abordagem não contempla diretamente testes a respeito da hipótese de mercados eficientes, uma vez que tais procedimentos seriam mais bem avaliados em uma perspectiva de eficiência relativa, na comparação dos graus de eficiência entre mercados distintos, conforme Campbell et al. (1999), além de necessitar da utilização subjacente de um modelo de precificação de ativos. Nesse sentido, o presente estudo pode ser mais bem caracterizado como análise da previsibilidade de ativos financeiros, em abordagem não-linear que incorpora o volume negociado como variável relevante - em uma perspectiva semelhante àquela apresentada por Campbell et al. (1999), relacionada à consideração de valores passados dos retornos e volume em um modelo de previsão, isto é, uma abordagem mais aderente à hipótese de passeio aleatório do que à avaliação da eficiência de mercado.

A Relação entre o Volume e os Retornos

Diferentes autores têm reportado evidências de uma relação negativa entre volume negociado e retorno dos ativos. Wang e Chin (2004) discutiram que ações de baixo volume são tipificadas como comportamento de momento (momentum behavior), enquanto as de volume alto exibem comportamento de reversão (reverting behavior) nos retornos. A razão dessa relação negativa pode ser explicada de duas formas. Primeiro, explicações de estrutura de mercado, como as de Campbell, Grossman e Wang (1993), onde os investidores e traders informados agem como market makers, usando o (alto) volume como sinal de que os investidores ou traders de liquidez (ou menos informados) estão ativos por razões não fundamentais; assim, os market makers ajustam os preços atuais de acordo com a pressão compradora para assegurar adequada compensação pelo risco; quer dizer, se os traders de liquidez estiverem vendendo, os market makers ajustarão os preços atuais à baixa, para ter retornos futuros mais altos. No segundo modelo de estrutura de mercado, Blume, Easley e O'Hara (1994) argumentam que a análise dos dados de volume pode fornecer informação da qualidade ou precisão da informação contida nos movimentos de preços passados; assim, o investidor pode aprender alguma informação útil sobre o curso dos preços, isto, por sua vez, pode conduzir a que o volume defasado tenha uma relação significante com os retornos atuais.

O segundo grupo de explicações para a relação entre volume e retorno tem sua fundamentação na literatura de finanças comportamentais. Barberis, Shleifer e Vishny (1998) e Hong e Stein (1999) discutem se o comportamento de momento ou impulsivo é consistente com baixo volume; o momento surge da baixa reação do mercado devido à atualização insuficiente das informações públicas recentemente disponíveis (Barberis, Shleifer, & Vishny, 1998), ou difusão insuficiente de informação pela 'agências de informações' (Hong & Stein, 1999), e onde o baixo volume é uma proxy para tal defasagem informacional. Baker e Stein (2002) argumentam que aquele volume é um indicador do sentimento do 'outro lado' de investidores irracionais no contexto de restrição de vendas a descoberto. Mais especificamente, um volume grande para ações vencedoras seria consistente com um comportamento de seguir a tendência, adotado pelos investidores irracionais, de tal forma que o preço do ativo subirá acima de seu valor fundamental antes da subseqüente reversão. Porém é improvável que um volume alto para uma ação perdedora origine comportamentos de seguir a tendência devido a restrições às vendas a descoberto.

Então, reconhecida a importância da não-linearidade e dada a relação negativa entre volume e retornos futuros, o volume negociado aparece como variável de transição natural para ser incluída em um modelo não-linear. Isto é, quando o volume aumenta, ou sobe acima de certo nível (limiar) (volume alto), se poderiam esperar retornos negativos; e quando volume está caindo, ou abaixo do nível de limiar (baixo volume), esperar-se-iam retornos positivos. Esta é precisamente a idéia seguida para o estabelecimento da estratégia a ser explorada no presente artigo.

METODOLOGIA

Amostra

A amostra está constituída pelo índice Ibovespa calculado para as ações negociadas na Bolsa de Valores de São Paulo [BOVESPA], no período dezembro de 1996 até novembro de 2006. Trabalhou-se com dados diários obtidos na base de dados Economática Ltda.

Variáveis Utilizadas

No estudo foram utilizadas como variáveis os indicadores da negociação diária das ações na BOVESPA, o volume financeiro e o número de negócios realizados, e o índice da evolução dos preços das ações. O retorno diário foi calculado utilizando a fórmula logarítmica com valores de fechamento. Algumas características das variáveis são assinaladas na Tabela 1.

O índice Ibovespa é o mais importante indicador do desempenho médio das cotações do mercado de ações brasileiro. O índice expressa o valor atual, em moeda corrente, de uma carteira teórica de ações constituída em 02/01/1968 (valor-base: 100 pontos), a partir de uma aplicação hipotética. O índice reflete não apenas as variações dos preços das ações, mas também o impacto da distribuição dos proventos, sendo considerado um indicador que avalia o retorno total de suas ações componentes (BOVESPA, 2006). A carteira teórica tem vigência de quatro meses, sendo que a ponderação depende do número de negócios e do volume financeiro negociado no período de doze meses anteriores à elaboração.

Modelos Logísticos de Transição Suave

Segundo Brooks (2002) muitas séries financeiras podem passar por episódios onde o comportamento da série muda em relação ao comportamento anterior. Esta mudança pode ser em termos da média, da volatilidade, ou o padrão de autocorrelação. As causas podem ser múltiplas, desde mudanças macroeconômicas e políticas, até mudanças com intervalos regulares ou de maior freqüência.

Resultados da literatura relacionada apontam ainda que o retorno pode apresentar um comportamento distinto, dependendo da evolução do volume negociado. Especificamente, a natureza da relação entre o retorno dos ativos e o volume parece favorecer a escolha de um modelo limiar (threshold), onde a dinâmica dos retornos tem comportamento diferente para altos e baixos volumes negociados.

Tal processo de ajuste é bem descrito pelos modelos LSTAR ou ESTAR. Nos modelos auto-regressivos de transição suave, ou STAR pelos termos em inglês (smooth transition autoregressive), propostos por Granger e Teräsvirta (1993), o ajuste acontece em cada período, mas a velocidade de ajuste varia com a extensão da divergência do objetivo ou equilíbrio. Variantes deste modelo são o LSTAR ou STAR logístico e o ESTAR ou STAR exponencial.

McMillan (2007) utilizou o modelo LSTAR na previsão de retornos de índices de mercado de ações, mostrando sua superioridade em relação aos modelos mais simples e outros modelos alternativos.

Em geral, os modelos logísticos auto-regressivos de transição suave (LSTAR) têm a seguinte especificação:

Onde:

rt é o retorno e F(xt-d) é a função de transição logística, xt-d é a variável de transição defasada em d períodos. Se

γ1 e γ2 são parâmetros de suavização e transição respectivamente.

Esta função permite que os parâmetros mudem monotonicamente com Xt-d. Quando γ1→ ∞ F(xt-d) se converte na função Heaviside F(xt-d) = 0, xt-d < γ2, F(xt-d ) = 1, xt-d > γ2, e o modelo se reduz ao modelo limiar (TAR). Quando γ1→ 0, a equação A se converte no modelo linear de ordem p (McMillan, 2007).

Assim, a utilização do modelo não-linear logístico auto-regressivo de transição suave que inclui o volume como variável de transição (LSTARv) permite examinar sua capacidade de previsão em relação com outras especificações não-lineares, como o próprio modelo LSTAR, que utiliza o retorno como variável de transição (LSTARr), o modelo auto-regressivo linear simples (AR) e um modelo de passeio aleatório linear.

Os Testes Utilizados

Além do teste básico de estacionariedade nas séries (Dickey & Fuller, 1979), foi utilizado o teste BDS (Brock, Dechert, Scheinkman, & LeBaron, 1996) para investigar desvios da hipótese nula de independência e distribuição idêntica, tais como não estacionariedade, não-linearidade e caos determinístico na série de retornos e no resíduo do modelo. A estatística do teste BDS tem distribuição assintótica normal padrão, desde que T/m > 200, onde T é o tamanho da série e m é de dimensão ou número de dados sucessivos considerados no teste. Além disso, deve ser definida a distância a ser usada para testar a proximidade dos dados. Uma recomendação prática é utilizar uma distância entre meia e duas vezes o desvio-padrão da série, e o parâmetro dimensional entre 2 e 10.

A possibilidade de efeito dia-da-semana foi explorada com a utilização de variáveis dummy e a presença de autocorrelação, e cluster de volatilidade com modelos tipo AR-GARCH, considerando os resultados de Correa e Valls Pereira (1998), Bone e Ribeiro (2002) e Torres, Bonomo e Fernandes (2002). Neste caso, deve-se testar a possibilidade de que o termo aleatório µt na equação A, após a inclusão das dummies, apresente não normalidade, autocorrelação, padrão ARCH, utilizando os testes de Jarque-Bera, LM, White, RESET e ARCH, como recomendado por Brooks (2002), Maddala (1996) e outros.

Bone e Ribeiro (2002) indicam que os três últimos testes são observacionalmente similares em um modelo como o da equação (A) sem a componente de transição, podendo, na prática, levar à rejeição da hipótese nula em todos os casos, quando apenas uma delas é efetivamente falsa. Isto porque a não-linearidade pode gerar heteroscedasticidade em um modelo de regressão linear (Maddala, 1996) em que a única variável explicativa é o retorno defasado ou componente auto-regressivo. Em tais casos considerou-se a informação do teste BDS.

Procedimento de Estimação e Avaliação de Estratégias de Investimento

Considera-se como avaliação de estratégias de investimento a geração de sinais para entrada e saída de determinada posição que exige previsões de preços absolutos. É diferente da formação de portfólio que se refere à seleção de ativos de um conjunto que exija previsões das relações entre os preços futuros dos ativos em questão. A evidência existente é que o primeiro problema aparenta ser extremamente mais complexo do que o segundo.

A utilidade prática de previsões pontuais de retornos é condicionada pelo grau de previsibilidade que determinado modelo proporciona. No contexto de estratégias de investimento, onde o que se deseja da modelagem são sinais para entrada e saída de determinada posição, custos de transação e aspectos tributários têm de ser levados em conta. Um modelo de séries de tempo só pode ser bem sucedido nesse sentido, se antecipar valores extremos nos retornos ou então mudanças de tendência duradouras, uma vez que não pode gerar muitos sinais; caso contrário, os custos de transação inviabilizariam qualquer possibilidade de lucro. A literatura científica sobre o assunto admite a extrema dificuldade de estratégias desse tipo gerarem resultados positivos.

Neste sentido, a avaliação de uma estratégia não pode depender somente de medidas de ajuste ou erro como a raiz do erro quadrático médio [REQM] e outras similares. Segundo McMillan (2007), enquanto uma magnitude do erro de previsão total pode ser importante, na prática talvez seja mais relevante a correta previsão do sinal da mudança dos preços. Isto porque a previsão correta do sinal tende a ser mais importante para manter ou mudar uma determinada estratégia. Assim, no estudo se considerou uma regra simples de compra/venda baseada no resultado da estimação empírica dos modelos, comparada com uma estratégia simples de comprar e manter e outra consistente com o pressuposto de passeio aleatório.

Desta forma, optou-se por um procedimento de estimação recursiva, onde todos os parâmetros da equação (A) são reestimados em cada etapa, considerando as propostas de Avramov e Chordia (2006) e McMillan (2007). Considerou-se um período inicial ou sub-amostra de estimação que corresponde a 75% da amostra total, e o quartil restante para avaliar a capacidade de previsão. Esta forma de estimação permite que a informação disponível aos traders seja atualizada constantemente nas equações, no presente contexto com uma freqüência diária. Assim, estimaram-se as equações até o dia t, onde o valor limiar da equação (A) é recalculado utilizando somente informações até o momento t. Logo estes parâmetros são utilizados para a previsão de retornos para o período t+1. Quando as informações para o período t+1 estão disponíveis, todos os parâmetros e o valor limiar são reestimados até este ponto e se obtém a previsão para t+2. Este procedimento se repete até se alcançar o final da amostra.

Em cada instante t decide-se investir ou não no portfólio do índice, em função da previsão dos retornos. Para o modelo LSTARv, quando o volume está abaixo do valor limiar, assumiu-se (seguindo os resultados da estimação e os resultados de Wang & Chin, 2004 e McMillan, 2007) que os retornos apresentam continuidade e tomou-se a decisão de comprar no período seguinte, se a previsão dos retornos foi positiva no período corrente; e não manter (vender), quando a previsão for negativa. Mas quando o volume está acima do valor limiar, assumiu-se que os retornos seguem um padrão de reversão à média e decidiu-se não manter (vender) no período seguinte, se o retorno previsto foi positivo; e comprar, se o retorno previsto foi negativo. Para o caso do volume explora-se a possibilidade de previsão com um modelo auto-regressivo LSTARv+1, ajustando a estratégia anterior para comportamento de momento ou de reversão, dependendo de que o valor previsto do volume esteja acima ou abaixo do valor limiar. Para o modelo LSTARr, se a previsão do retorno é positiva, se compra o índice e, em outros casos não (quando se permitem vendas a descoberto vende-se o índice se o retorno previsto é negativo). Para o modelo AR(1)-(E)GARCH, a estratégia é igual ao modelo anterior. Para o modelo aleatório, definiu-se uma seqüência de números aleatórios (-1,0,1) e se decide vender, manter e comprar respectivamente. A estratégia de manter consiste em comprar no início do período de previsão e vender ao final.

Como comprar e vender tem custos, seguindo o procedimento de Minardi (2004), estabeleceram-se os custos de transação, dependendo do nível da corretagem cobrada, podendo ser de 0.035%, 0.2% e 0.5%.

A avaliação da capacidade preditiva na sub-amostra de avaliação (25%), foi realizada utilizando duas abordagens. Uma primeira, financeira, considera o ponto de vista do retorno médio para o investidor. Os retornos gerados foram comparados utilizando o teste t com variâncias diferentes. Também foi avaliado o excesso de retorno e do risco em relação à taxa SELIC por meio do índice de Sharpe (1994). Os resultados de cada estratégia foram avaliados em termos reais, considerando a inflação (IGP-DI) e os custos de transação.

Também se utilizou uma abordagem estatística para avaliação dos modelos. Os retornos gerados por cada modelo ou estratégia de investimento, utilizando as previsões dos modelos estimados, foram avaliados primeiramente usando os critérios tradicionais: erro médio [EM], raiz do erro quadrático médio [REQM], erro absoluto médio [EAM], erro percentual médio [EPM] e erro percentual absoluto médio [EPAM] e U de Theil (UT). Se r, f, são retornos observado e esperado respectivamente, e o erro de previsão é definido como et = ft - rt. Maiores informações e fórmulas podem ser encontradas em Tsay (2005) e Brooks (2002).

A seguir foi avaliada a capacidade preditiva de sinais de cada estratégia de investimento. Utilizou-se o teste de acurácia direcional e o teste de Pesaran e Timmermann (1992). A estatística de acurácia direcional [AD] (ver Tsay, 2005, p. 193) para cada estratégia, permite verificar se a capacidade de previsões corretas de mudanças de rumo, altas e baixas, é diferente de uma escolha aleatória (50%).

O teste não-paramétrico de Pesaran e Timmermann (1992) (doravante PT) avalia se a taxa de sucesso TS, fração de previsões corretas na amostra de avaliação, difere significativamente da taxa de sucesso sob independência [TSI] entre a previsão e a variável observada, ou seja, quando não é possível usar uma para predizer a outra. A TSI não é necessariamente 50%, porque ambas, a previsão e a variável observada, podem não ter mediana zero. Isto é importante, porque uma explicação plausível para a acurácia direcional maior a 50% pode ser uma tendência altista, um prêmio de risco etc., porque, nesses casos, mesmo com uma alocação aleatória, o retorno seria positivo, mas não existe acurácia direcional. O teste PT considera esta possibilidade.

Seja p = probabilidade que a variável observada seja positiva, e p' = probabilidade de que a previsão seja positiva. A taxa de sucesso sob independência é TSI = p p' + (1-p)(1-p'). A variância de TSI é dada por: var(TSI) = (1/T)[(2p'-1)2 p(1-p)+(2p-1)2 p'(1-p')+(4/T)pp'(1-p)(1-p')]. A variância da taxa simples de sucesso é dada por: var(TS) = (1/T) TSI(1-TSI). O teste Pesaran-Timmermann é calculado como:

Sob a hipótese nula de independência entre a previsão e a variável predita, PT tem distribuição normal N(0,1).

Em relação à comparação de modelos, existe uma vasta literatura. Diebold e Mariano (1995) propõem um método de comparação por pares; este foi modificado por outros autores para melhorar suas propriedades. Giacomini e White (2006) o generalizam ainda mais, para permitir a utilização de informação condicional. Em ambos os casos testa-se uma simples hipótese nula, a igualdade da habilidade preditiva. White (2000) e Hansen (2005) estudam métodos para comparar mais de dois modelos na sua acurácia de previsão, objetivando o controle de problemas de utilização dos dados. Trata-se de testar a habilidade preditiva superior, isto é, consideram uma hipótese composta.

No presente estudo utilizou-se o teste de Diebold e Mariano modificado [MDm] por Harvey, Leybourne e Newbold (1997). Seja rt o retorno observado (estratégia manter) na sub-amostra de avaliação e f1t e f2t as previsões de dois modelos concorrentes, a função perda, L(fit), é definida por L(fit) = (rt - fit)2 para o Erro Quadrático e por L(fit) = |rt - fit| para o Erro Absoluto, sendo i= 1, 2. Testar se o desempenho de previsão dos dois modelos é equivalente, significa testar se a média populacional da diferença da função de perda dt = d1-2,t = L(f1t) - L(f2t) é zero. Ou seja, sob a hipótese nula H0: IMAGEMAQUI = 0, os modelos têm igual acurácia preditiva; já na hipótese alternativa H1: IMAGEMAQUI ≠ 0, os modelos têm diferente acurácia preditiva. Onde . A estatística do teste Diebold-Mariano dada por: , tem distribuição normal ~ N(0,1). IMAGEMAQUI é um estimador consistente da variância assintótica de IMAGEMAQUI. Como as propriedades do teste DM são prejudicadas, especialmente, nos casos de não normalidade, Harvey, Leybourne e Newbold (1997) adaptaram-no para a distribuição t de Student:

onde k é o número de passos à frente utilizados na previsão.

Enquanto os testes anteriores equivalem a responder à pergunta, em média qual foi a previsão mais precisa, o teste de Giacomini e White (2006) responde à questão de saber se é possível prever qual será a projeção mais exata em uma data futura. O objeto da avaliação é o método de previsão. Ele inclui o modelo previsão, o procedimento de estimativa e, possivelmente, a escolha da janela para a estimativa. Para um horizonte k e uma janela de estimação fixa, o teste é uma estatística do tipo Wald da forma:

onde é a diferença da função de perda em t + k, utilizando o erro quadrático, ht é um vetor de funções de teste, e IMAGEMAQUI é a matriz estimada de covariâncias de . As vantagens do teste têm seu contrapeso no custo de especificar a função de teste que ajude a prever a perda da previsão. Na prática, a função de teste é escolhida pelo pesquisador para incorporar elementos do conjunto de informações que se acredita possam ter algum poder explicativo potencial para a diferença futura na habilidade preditiva. De modo similar a Giacomini e White (2006), na presente pesquisa, utilizou-se a perda defasada para definir a função de teste. Assim, a função de teste foi ht = (1,dt), correspondente à diferença dos erros quadráticos no último período. Um nível α rejeita a hipótese nula de igualdade na habilidade preditiva entre dois modelos concorrentes, quando onde q é o tamanho de ht e é a estatística da distribuição .

Os procedimentos anteriores podem ser utilizados para comparar a acurácia preditiva de diferentes modelos, entre eles ou com algum que serve como benchmark. Mas, quando se utilizam muitas comparações, os resultados podem ser influenciados pelo acaso. Isso acontece especialmente em finanças, onde, na prática, poucas séries de dados financeiros estão disponíveis para análise empírica. O problema, conhecido como data snooping, aparece quando se utiliza o mesmo conjunto de dados para testar a significância de diferentes modelos (estratégias de investimento) individualmente. Como as estatísticas individuais são resultado do mesmo conjunto de dados, porém relacionados uns com outros, é difícil construir um teste conjunto que seja apropriado, especialmente quando o número de modelos ou estratégias é amplo (Elliott & Timmermann, 2008).

Assim, comparando muitos métodos, é válido questionar: qual a probabilidade de um modelo obter boa estatística só pelo acaso? White (2000) propôs um procedimento de verificação da realidade (reality check), para testar a significância da melhor estatística de acurácia obtida pelos diferentes modelos, em relação a um benchmark. Hansen (2005) assinala que, normalmente, ao testar um conjunto de hipóteses, se utiliza a configuração menos favorável, como no teste de White (2000). No entanto, isso faz com que o teste seja sensível para a inclusão de regras de trading ou modelos de previsão pobres e irrelevantes, porque esses se afastam da configuração menos favorável. Outra desvantagem do teste reality check é que ele não utiliza estatísticas padronizadas, reduzindo seu poder de diferenciar a hipótese nula. Para superar essas limitações, Hansen (2005) propôs um teste com maior poder para a habilidade preditiva superior [HPS]. A hipótese nula dada por é a de que o benchmark (b) não é inferior a nenhum dos outros modelos concorrentes i=1, ..., m. E ao mesmo tempo, no teste de HPS estamos interessados em saber se cada modelo de previsão particular é superior ao benchmark, em termos da função de perda admitida. Especificamente, o teste studentizado proposto por Hansen é:

Onde é algum estimador consistente de . Como a distribuição é desconhecida, mas converge para uma normal, para operacionalizar o teste utiliza-se o procedimento de bootstrapping, o que permite obter os valores-p. No presente estudo utilizou-se o erro quadrático como função de perda, no programa disponibilizado por Hansen, Kim e Lunde (2003). O parâmetro de dependência foi ajustado para 0,5 e o número de re-amostragens a 10000. Um valor-p baixo para o teste indica que o modelo benchmark é inferior a um ou mais dos modelos concorrentes. Um valor-p alto mostra que o modelo sendo testado como benchmark não é superado por nenhum dos modelos concorrentes.

RESULTADOS

Evolução dos Indicadores no Período de Estudo

Na Tabela 2 apresentam-se as estatísticas descritivas dos retornos do índice e do volume negociado com e sem tendência e sazonalidade, tanto para o período completo como para a sub-amostra de estimação de parâmetros. Nas séries de retornos observaram-se características típicas das séries financeiras, como desvio-padrão maior do que o valor médio, comportamento assimétrico e afastamento da distribuição normal confirmada pelo teste Jarque-Bera. Tais resultados são relacionados ao fato de que a análise abrange um período onde a Bolsa de São Paulo apresentou uma tendência crescente, acumulando um retorno de 193.5% no período completo e 114.5% no período de previsão. O teste BDS (resultado disponível sob solicitação) rejeita a hipótese de independência em todas as séries consideradas na Tabela 2, o que pode ser um indício de não-linearidade.

No caso do volume, verificaram-se variáveis sazonais diárias, pré e pós-feriado, além da componente temporal quadrática. O resíduo dessa regressão (disponível sob solicitação) correspondeu à variável sem sazonalidade (LTURN DET).

Estimativas dos Modelos Não-lineares para a Previsão de Retornos

No caso do retorno do índice Ibovespa, o modelo logístico auto-regressivo de transição suave, utilizando o volume defasado em um período, como variável de transição (LSTARv) foi estimado com um componente AR(1). Na Tabela 3 apresenta-se a estimativa do modelo para a amostra completa e para o período de estimação de parâmetros. Em ambos os casos, percebe-se o efeito significativo na mudança dos parâmetros da média e do coeficiente AR indicado pela função de transição. O valor limiar não teve alteração significativa, permanecendo em 0.34. Isto significa que, quando o indicador de volume está acima ou abaixo do valor limiar, o comportamento do mercado, em termos de retorno, seria muito diferente.

Na Tabela 4 apresenta-se a estimativa do modelo para a amostra completa e para o período de estimação de parâmetros do modelo logístico de transição suave, utilizando o retorno defasado em um período como variável de transição (LSTARr), estimado com um componente AR(1). Pode-se observar que as estimativas do valor dos parâmetros do intercepto e do coeficiente AR(1) e as estimativas correspondentes aos parâmetros de transição têm valor absoluto similar, mas de sinal trocado, o qual significa que para valores baixos da função de transição (retornos muito baixos no dia anterior), a autocorrelação do retorno é máxima, e para valores altos da função de transição (retornos muito altos no dia anterior), a autocorrelação do retorno é mínima. De acordo com os critérios de informação, o modelo com a utilização do retorno defasado, como variável de transição, tem melhor ajuste do que o modelo com o volume defasado. Para prever o volume a ser utilizado no modelo LSTARv+1 utilizou-se um modelo AR(1) simples na variável volume negociado sem sazonalidade.

O modelo AR(1) para o retorno do Ibovespa foi estimado de forma a incluir a autocorrelação e uma variável dummy para a segunda feira (DSEG), cujo coeficiente resultou negativo, sendo também positiva e significativa a variável dummy para os dias pré-feriados (DPREF), conforme resultados de pesquisas anteriores, mas não se confirmavam efeitos para outros dias da semana nem para pós-feriados. A volatilidade foi modelada utilizando um modelo EGARCH(2,1)-TAR(1), como se pode observar na Tabela 5. O comportamento da família GARCH para a volatilidade dos retornos também foi assinalado por Correa e Valls Pereira (1998) e Venetis e Peel (2005).

Para avaliar a capacidade de previsão de retornos e geração de estratégias de negociação os modelos anteriores foram estimados recursivamente no período de previsão, após os valores estimados dos parâmetros na primeira parte da amostra.

Avaliação da Capacidade de Previsão de Retornos

Retorno ao Investidor

Na avaliação do retorno real obtido por cada modelo, em nível de 5% de significância estatística (Tabela 6), observou-se que os modelos logísticos auto-regressivos de transição suave, utilizando como variável limiar o volume defasado (LSTARv) ou o próprio retorno defasado (LSTARr) e o modelo auto-regressivo, permitiram obter retornos estatisticamente superiores a zero somente quando os custos de transação são 0,035% por operação. Para outros níveis de custo todos os modelos (incluído o caso aleatório) tiveram retornos reais estatisticamente não superiores a zero. Já a estratégia de comprar e manter teve um retorno estatisticamente superior a zero para os três níveis de custo estabelecidos.

Assim, o modelo logístico auto-regressivo de transição suave, utilizando como variável limiar o volume defasado (LSTARv) ou o volume projetado (LSTARv+1), não apresentou uma capacidade de geração de retornos superiores aos outros modelos considerados, ainda mais quando se consideram a inflação e os custos de transação. Como se pode verificar na Tabela 6, considerando somente o retorno real, a melhor estratégia a seguir no período (31/05/04 - 30/11/06) teria sido a de comprar no início do período e manter, dado que nesse período o índice da Bolsa de São Paulo apresentou uma tendência crescente.

De acordo com estes resultados, a utilização da informação do volume negociado no modelo logístico auto-regressivo de transição suave não permitiu confirmar a idéia de Mcmillan (2007) e outros autores em todos os casos; será necessário realizar outras pesquisas em condições diferentes, particularmente em condições de baixa do mercado.

Já o modelo auto-regressivo, como destacado por Bone e Ribeiro (2002), foi capaz de gerar importantes retornos, favorecido talvez pela tendência crescente dos preços, mas somente quando os custos de transação são baixos (0.035%). Com custos de transação de 0.50% por operação todos os modelos tiveram perdas de até 22.5% ao ano, com exceção do modelo auto-regressivo que teve um ganho real de 2.1% ao ano.

Considerando como benchmark o 80% da taxa Selic (o desconto pode ser justificado na existência de custos de transação, com custos menores o resultado não se altera), nenhuma das alternativas avaliadas na Tabela 6 teve um excesso de retorno estatisticamente significativo.

Poderia pensar-se nos modelos anteriores como estratégias distintas e avaliar o desempenho de cada um, em função da combinação de risco e retorno. Dado que cada modelo ou estratégia representa um risco ou volatilidade diferente, a comparação baseada somente no retorno ou no risco isoladamente, pode levar a conclusões parciais, já que neste contexto específico o maior risco não necessariamente significaria maior retorno esperado.

Uma forma simples de considerar as duas dimensões é por meio da utilização do índice de Sharpe generalizado [IS] (Sharpe, 1994) para cada modelo, dentro do período de avaliação, tendo como benchmark a taxa Selic. Dependendo dos custos de transação considerados, a utilização de modelo auto-regressivo pode gerar melhor desempenho (IS anual = 0.60), quando os custos são de 0.035%, mas com custos maiores de 0.20% e 0.50% o IS cai para 0.23 e -0.44 respectivamente (Tabela 6).

A estratégia de comprar e manter domina as outras, em termos de índice de Sharpe (0.50; 0.49 e 0.48). O modelo LSTARr, que tem como variável limiar o próprio retorno, teve desempenho de 0,38 com custo de 0.035%, que caiu para 0.01 e -0,66 com custos de 0.20% e 0.50%. O modelo logístico auto-regressivo de transição suave, utilizando como variável limiar o volume defasado (LSTARv), somente teve IS positivo de 0,11, quando os custos são 0.035% e negativo para custos de 0.2% ou maiores. O modelo com volume projetado (LSTARv+1) teve índice de desempenho negativo para os três valores de custo -0.03 a -1.70, superando somente a estratégia totalmente aleatória, que teve o pior desempenho com IS de -0.91 até -2.77.

Avaliação Estatística

Na Tabela 7, são apresentadas várias medidas de acurácia para os retornos diários gerados pelas diferentes estratégias de negociação, definidas em função dos modelos LSTAR, AR e aleatório. Cada estratégia considera o efeito de três níveis de custos de transação por operação. De acordo com o erro médio [EM], a estratégia manter teve um resultado superior às demais, exceto ao retorno do modelo AR_1-EGARCH (0,035%); ou seja, nos outros casos não foi possível superar o índice. De acordo com as medidas de acurácia, para os três níveis de custo, o modelo logístico auto-regressivo de transição suave, utilizando como variável limiar o próprio retorno defasado (LSTARr) e o modelo auto-regressivo apresentaram um melhor desempenho. Isto é confirmado pela elevada taxa de sucesso [TS], acima de 88%, na predição dos sinais do índice.

Na Tabela 8, colunas AD e PT, apresentam-se as estatísticas dos testes de acurácia direcional e de Pesaran-Timmermann, respectivamente. Os valores críticos em nível de 5% para teste AD é IMAGEMAQUI =3,84 e para o teste PT é Z=1,96. Ambos os testes confirmam que todas as estratégias utilizadas conseguem prever corretamente os sinais dos retornos do índice (taxa de sucesso), sendo diferente do que seria esperado de 50% no teste AD, ou a taxa de sucesso sob independência no teste PT. De acordo com a última coluna da Tabela 7, a taxa de sucesso esteve acima de 66%, mesmo na estratégia de alocação aleatória. Poderia questionar-se como uma estratégia aleatória teve sucesso maior que 50%, mas a resposta está associada ao fato de que esta estratégia foi influenciada pela opção manter o índice, a qual teve mais de 54% de resultados positivos no período e ainda porque esta estratégia inclui os casos de retorno nulo.

Os testes Diebold-Mariano modificado [DMm] e Giacomini-White [GW] permitem comparar a acurácia preditiva entre dois modelos. Na parte superior da matriz correspondente ao teste DMm apresenta-se a razão da raiz do erro quadrático médio [REQM] dos modelos. Por exemplo, a REQM do modelo LSTARv é 0,9 vezes a correspondente ao modelo aleatório e 1,7 a 1,8, dependendo do custo, vezes a correspondente ao modelo AR_1-EGARCH. No caso do teste DMm utilizavam-se as duas funções de perda definidas na metodologia; quando se considerou a diferença dos erros quadráticos, o teste não rejeita a hipótese nula de igualdade de acurácia; mas, utilizando a diferença dos erros absolutos, os resultados são opostos (os valores-p são apresentados na parte inferior da matriz correspondente ao teste, e são similares aos testes de Giacomini & White (2006) e Hansen (2005) como explicado a seguir).

Os resultados do teste GW, utilizando a função de perda quadrática, confirmam, quase na sua totalidade, os resultados do teste DMm com função de perda absoluta. Não se pode rejeitar a hipótese nula de igualdade de acurácia, em nível de 5%, somente na comparação entre os modelos LSTARv com LSTARv+1, e entre LSTARr e AR_1-EGARCH. Mas, quando se considera uma função de perda absoluta, o teste rejeita a hipótese nula em todas as comparações. Assim, a acurácia preditiva dos modelos LSTAR e AR_1 confirmou-se como superior em todos os casos, e sob os diferentes custos, em relação ao caso de alocação aleatória.

Nas duas últimas colunas da Tabela 8, apresenta-se o resultado do teste de habilidade preditiva superior [HPS] de Hansen (2005), estatística t e valor-p, para a comparação entre os modelos concorrentes LSTAR e AR_1 em relação ao caso Aleatório definido como benchmark. Trata-se de teste mais eficiente para comparar e testar a eficiência de superioridade dos modelos. O teste HPS selecionou o modelo AR_1-EGARCH, sob diferentes custos, como o mais significativo e melhor modelo, destacado em negrito, em relação ao benchmark. Deve-se notar que Hansen (2005) indica que estatística t-stat não corresponde a uma distribuição t, e o valor-p reportado ao lado dela é um número calculado como valor de p, utilizando o procedimento de bootstrapping.

No final da coluna valor-p apresenta-se o resultado do teste HPS para a hipótese nula de que o modelo aleatório (benchmark) é não inferior aos outros modelos, a qual foi amplamente rejeitada, considerando que o valor crítico para o valor-p é maior do que 2,14 (parte inferior da coluna t-stat). O valor-p do HPS toma em conta o espaço de modelos, estando disponível para seu nível inferior, consistente e superior. O valor-p consistente do HPS define se existem provas contra a hipótese nula. Assim, percebe-se que, embora os resultados obtidos com os modelos LSTAR tenham acurácia superior a uma alocação aleatória, não são tão significativos quanto os resultados de uma estratégia baseada no modelo auto-regressivo (AR_1), mesmo depois de considerar os custos de transação. Quando se utilizou o modelo AR_1-EGARCH como benchmark, o valor-p consistente do HPS variou ao redor de 0,54, sendo superior ao valor crítico em nível de 5%, o que confirma que tal modelo tem habilidade preditiva superior em relação aos concorrentes, levantando, ao mesmo tempo, dúvidas sobre o resultado dos testes DMm e GW de não significância para a comparação com o modelo LSTARr.

Consideraram-se alguns procedimentos de robustez para os resultados obtidos. A escolha da função de perda somente teve influência nos testes DMm e GW, mas não no teste HPS. Contudo a função de perda quadrática é de longe a mais usada para modelos de previsão (Elliott & Timmermann, 2008); mas pune com igual ponderação os bons e maus resultados. Pesquisas futuras poderiam avaliar a incorporação de uma função de perda assimétrica. Não se pode rejeitar a hipótese de ausência de quebra estrutural para o retorno entre os subperíodos de estimativas e avaliação. Também se analisou se o tamanho das sub-amostras teve influência nos resultados; para tal propósito procedeu-se à análise do comportamento dos modelos com 50% das observações para as estimativas iniciais e a restante para avaliação. Os resultados dessa nova análise foram similares aos resultados apresentados nas seções anteriores. O desempenho do modelo AR_1-EGARCH foi superior, em termos de rentabilidade-risco e dos indicadores estatísticos; já o modelo LSTARv foi o pior, quando comparado com os outros, segundo os testes GW e HPS.

CONCLUSÃO

Varias pesquisas recentes, que reconhecem a não-linearidade nos retornos, indicam que a informação do volume negociado poderia gerar estratégias que permitam obter retornos estatisticamente superiores. A idéia por trás dessa indicação está no comportamento diferenciado dos investidores, dependendo de que o volume negociado esteja acima ou abaixo de determinado valor. No presente estudo, considerando o período analisado para o retorno do Ibovespa, o modelo que utiliza o volume defasado como variável limiar ou de transição (LSTARv), mesmo quando se utiliza a previsão do volume como variável limiar (LSTARv+1), não apresentou retorno real superior à estratégia de comprar e manter, nem ao modelo auto-regressivo AR(1), ou ao modelo que utiliza o próprio retorno como variável limiar (LSTARr). Entretanto os resultados foram superiores ao caso aleatório. Essa ordem não se modifica substancialmente, quando se considera a diferença de risco implícita nos modelos, em termos de índice de Sharpe.

Embora seja possível obter alguns retornos reais positivos e estatisticamente significativos em um intervalo de 29 meses, os custos de corretagem elevados eliminam rapidamente esta capacidade preditiva. Mas, no caso de custos baixos (0.035%), o desempenho obtido pelo modelo auto-regressivo, quando se utiliza como medida o índice de Sharpe, foi 20% maior em relação à estratégia de comprar e manter. Essa diferença poderia ser considerada economicamente significativa, já que a implementação do modelo tem custos marginais de manutenção mínimos ou quase nulos.

Logo, não se pode descartar a idéia de que os modelos não-lineares com informações passadas na média possibilitam alguma previsibilidade de retornos (Correa & Valls Pereira, 1998; Minardi, 2004). Conforme os resultados obtidos neste estudo, em alguns casos os modelos não-lineares e as informações passadas forneceram previsões suficientemente melhores, a ponto de permitirem a geração de estratégias de investimento com desempenho superior. Mas deve-se assinalar que tal capacidade está limitada pela consideração dos custos de transação na implementação dessas estratégias. Isso confirma a dificuldade de previsão de retornos de mercado e sua utilização como discutido por Timmermann (2008).

Com custos de 0.20% por operação, o modelo auto-regressivo ainda apresenta algum ganho em relação ao caso aleatório; já com 0.50%, não é possível gerar resultados positivos. A estratégia de comprar e manter teve resultado superior, porque a tendência do mercado foi positiva. Esta tendência pode ter reforçado o efeito AR e estaria explicando por que este modelo teve retorno superior.

As conclusões da avaliação do retorno financeiro para o investidor foram confirmadas pela avaliação estatística das estratégias de negociação, utilizando uma bateria de testes, desde os mais simples, como a raiz do erro quadrático médio [REQM], ou erro absoluto médio [EAM], até testes mais elaborados de superioridade preditiva condicional (Giacomini & White, 2006) e de habilidade preditiva superior (Hansen, 2005); este último permite controlar a possibilidade de problemas de data snooping. O modelo AR_1 mostrou-se superior e melhor modelo em relação ao caso aleatório com REQM de 0,5 vezes. A estratégia com o modelo que utiliza o volume defasado como variável de transição (LSTARv), mesmo quando se utiliza a previsão do volume como variável limiar (LSTARv+1), só apresentou capacidade preditiva superior em relação à estratégia de alocação aleatória. Sugere-se que estudos futuros abordem o comportamento destas estratégias e modelos em condições de baixa do mercado, e também utilizando ações individuais e carteiras de ações, com caracterizações para tamanho, growth stocks e níveis de governança, por exemplo. Na parte de análise de acurácia, destaca-se a escolha de testes apropriados, e a necessidade de testes robustos à escolha da função de perda, ou incorporar na análise funções de perda assimétrica. Uma alternativa poderia ser utilizar a comparação de funções de densidade, como discutido por Giacomini, Gottschling, Haefke e White (2008).

Artigo recebido em 05.10.2007.

Aprovado em 08.10.2008.

  • Avramov, D., & Chordia, T. (2006). Predicting stock returns. Journal of Financial Economics, 82(2), 387-415.
  • Baker, M., & Stein, J. C. (2002). Market liquidity as a sentiment indicator. [Working Paper Nş 8816]. National Bureau of Economic Research, Cambridge, MA.
  • Barberis, N., Shleifer, A., & Vishny, R. (1998). A model of investor sentiment. Journal of Financial Economics, 49(3), 307"343.
  • Blume, L., Easley, D., & O'Hara, M. (1994). Market statistics and technical analysis: the role of volume. The Journal of Finance, 49(1), 153"181.
  • Bolsa de Valores de São Paulo. (2006). Índices da Bolsa de Valores de São Paulo Recuperado em 23 outubro, 2006, de http://www.bovespa.com.br/Mercado/RendaVariavel/Indices/FormConsulta ApresentacaoP.asp?Indice=Ibovespa
  • Bone, R. B., & Ribeiro, E. P. (2002). Eficiência fraca, efeito dia-da-semana e efeito feriado no mercado acionário brasileiro: uma análise empírica sistemática e robusta. Revista de Administração Contemporânea, 6(1), 19-37.
  • Brock, W., Dechert, D., Sheinkman, J., & Lebaron, B. (1996). A test for independence based on the correlation dimension. Econometric Reviews, 15(3), 197-235.
  • Brooks, C. (2002). Introductory econometrics for finance. Cambridge: Cambridge U. Press.
  • Campbell, J. Y., Grossman, S., & Wang, J. (1993). Trading volume and serial correlation in stock returns. Quarterly Journal of Economics, 108(4), 905-939.
  • Campbell, J. Y., Lo, A. W., & MacKinlay, C. (1999). The econometrics of financial markets (pp. 20-33). Princeton, New Jersey: Princeton University Press.
  • Correa, M. M. R. L. da, & Valls Pereira, P. L. (1998). Modelos não lineares em finanças: previsibilidade em mercados financeiros e aplicações a gestão de risco. Anais do Encontro Brasileiro de Econometria, Vitória, Espírito Santo, Brasil, 20.
  • Dickey, D. A., & Fuller, W. A. (1979). Distribution of the estimators for time series regressions with a unit root. Journal of the American Statistical Association, 74(366), 427-431.
  • Diebold, F. X., & Mariano, R. S. (1995). Comparing predictive accuracy. Journal of Business and Economic Statistics, 13(3), 253-263.
  • Elliott, G., & Timmermann, A. (2008). Economic forecasting. Journal of Economic Literature, 46(1), 3-56.
  • Fama, E. F., & French, K. R. (1992). The cross-section of expected stock returns. The Journal of Finance, 47(2), 427-465.
  • Giacomini, R., Gottschling, A., Haefke, C., & White, H. (2008). Mixtures of t-distributions for finance and forecasting. Journal of Econometrics, 144(1), 175-192.
  • Giacomini, R., & White, H. (2006). Tests of conditional predictive ability. Econometrica, 74(6), 1545-1578.
  • Granger, C. W., & Teräsvirta, T. (1993). Modeling nonlinear economics relationships New York: Oxford University Press.
  • Grossman, S., & Stiglitz, J. (1980). On the impossibility of informationally efficient markets. American Economic Review, 70(3), 393-408.
  • Hansen, P. R. (2005). A test for superior predictive ability. Journal of Business & Economic Statistics, 23(4), 365-380.
  • Hansen, P. R., Kim, J., & Lunde, A. (2003). Testing for superior predictive ability using Ox, a manual for SPA for Ox Recuperado em 26 junho, 2008, de http://testing-for-superior-predictive-ability.googlegroups.com/web /Latest+version+of+SPA+for+OX.+SPA2_02-Ox4.02.zip
  • Harvey, D., Leybourne, S., & Newbold, P. (1997). Testing the equality of prediction mean squared errors. International Journal of Forecasting, 13(2), 281-291.
  • Hong, H., & Stein, J. C. (1999). A unified theory of underreaction, momentum trading, and overreaction in asset markets. The Journal of Finance, 54(6), 2143-2184.
  • Lee, C., & Swaminathan, B. (2000). Price momentum and trading volume. The Journal of Finance, 55(5), 2017-2070.
  • Liu, W. (2006). A liquidity-augmented capital asset pricing model. Journal of Financial Economics, 82(3), 631-671.
  • Maddala, G. S. (1996). Introducción a la econometría (2a ed.). Mexico: McGraw-Hill.
  • Martin, D. M. L., Kayo, E. K., Kimura, H., & Nakamura, W. T. (2004). Identificando bolhas especulativas racionais no IBOVESPA (pós-plano Real), a partir de Regimes Markovianos de conversão. Economia Selecta, 5(3), 219-252.
  • McMillan, D. G. (2005). Non-linear dynamics in international stock market returns. Review of Financial Economics, 14(1), 81-91.
  • McMillan, D. G. (2007). Non-linear forecasting of stock returns: does volume help? International Journal of Forecasting, 23(1), 115-126.
  • McPherson, M. Q., & Palardy, J. (2007). Are international stock returns predictable? An examination of linear and non-linear predictability using generalized spectral tests. Journal of International Financial Markets, Institutions and Money, 17(5), 452-464.
  • Minardi, A. M. A. F. (2004). Retornos passados prevêem retornos futuros? RAE-eletrônica, 3(2), 1-18. Recuperado em 10 março, 2007, de http://www.scielo.br/pdf/raeel/v3n2/v3n2a03.pdf
  • Pesaran, M. H., & Timmermann, A. (1992). A simple non-parametric test of predictive performance. Journal of Business & Economic Statistics, 10(4), 461-465.
  • Sharpe, W. F. (1994). The sharpe ratio. Journal of Portfolio Management, 21(1), 49-58.
  • Timmermann, A. (2008). Elusive return predictability. International Journal of Forecasting, 24(1), 1-18.
  • Torres, R., Bonomo, M., & Fernandes, C. (2002). A aleatoriedade do passeio na Bovespa: testando a eficiência do mercado acionário brasileiro. Revista Brasileira de Economia, 56(2), 199-247.
  • Tsay, R. (2005). Analysis of financial time series (2a ed.). New York: Wiley.
  • Venetis, I. A., & Peel, D. (2005). Non-linearity in stock index returns: the volatility and serial correlation relationship. Economic Modeling, 22(1), 1-19.
  • Wang, C., & Chin, S. (2004). Profitability of return and volume-based investment strategies in China's stock market. Pacific-Basin Finance Journal, 12(5), 541-564.
  • White, H. (2000). A reality check for data snooping. Econometrica, 68(5), 1097-1126.
  • *
    Endereço: Robert Aldo Iquiapaza
    Av. Antônio Carlos, 6627, sala 4120, FACE, Pampulha, Belo Horizonte/MG, 31270-901. E-mail:
  • Datas de Publicação

    • Publicação nesta coleção
      27 Jan 2010
    • Data do Fascículo
      Fev 2010

    Histórico

    • Recebido
      05 Out 2007
    • Aceito
      08 Out 2008
    Associação Nacional de Pós-Graduação e Pesquisa em Administração Av. Pedro Taques, 294,, 87030-008, Maringá/PR, Brasil, Tel. (55 44) 98826-2467 - Curitiba - PR - Brazil
    E-mail: rac@anpad.org.br