Acessibilidade / Reportar erro

Volatilidade e Previsão de Retorno com Modelos de Alta Frequência e GARCH: Evidências para o Mercado Brasileiro* * Os autores são gratos ao Prof. Dr. Claudio Henrique da Silveira Barbedo do IBMEC-Rio e Banco Central do Brasil por seus comentários valiosos.

Resumos

Com base em estudos desenvolvidos em anos recentes sobre o uso de dados de alta frequência para a estimação da volatilidade, este artigo implementa o modelo Autorregressivo Heterogêneo (HAR)desenvolvido por Andersen, Bollerslev, e Diebold (2007) e Corsi (2009), e o modelo Componente (2-Comp) desenvolvido por Maheu e McCurdy (2007) e os compara com a família de modelos Autorregressivos com Heteroscedasticidade Generalizados (GARCH)para estimar a volatilidade e os retornos. Durante o período analisado, os modelos que usam dados intraday obtiveram melhores previsões de retornos dos ativos avaliados, tanto dentro como fora da amostra, confirmando assim que esses modelos possuem informações importantes para uma série de agentes econômicos.

Volatilidade realizada; Estimativa de volatilidade; Retorno intraday; HAR


Based on studies developed over recent years about the use of high-frequency data for estimating volatility, this article implements the Heterogeneous Autoregressive (HAR) model developed by Andersen, Bollerslev, and Diebold (2007) and Corsi (2009), and the Component (2-Comp)model developed by Maheu and McCurdy (2007) and compare them with the Generalized Autoregressive Conditional Heteroskedasticity (GARCH) family models in order to estimate volatility and returns. During the period analyzed, the models using intraday data obtained better returns forecasts of the assets assessed, both in and out-of-sample, thus confirming these models possess important information for a variety of economic agents.

Realized volatility; Volatility estimation; Intraday return; HAR


1 INTRODUÇÃO

Dados de alta frequência resultam de observações disponibilizadas ao longo de curtos períodos de tempo. Para séries históricas financeiras, isso pode ser descrito como observações disponibilizadas com frequência diária ou com intervalos ainda menores, quando existem vários bancos de dados fornecendo informações a cada negociação de ativos financeiros.

A disponibilidade de bancos de dados de negociadores e os avanços nos cálculos cada vez mais têm disponibilizado esses dados aos pesquisadores e negociadores e gerou um enorme crescimento nas pesquisas empíricas na área de finanças.

Este desenvolvimento abriu o caminho para uma ampla gama de aplicações empíricas, particularmente em mercados financeiros líquidos, com grandes volumes e alta frequência de negócios e baixos custos de transação. Entre essas aplicações, pesquisas aplicadas à estimativa, previsão e comparação da volatilidade dos retornos sobre ativos financeiros com diferentes frequências se destacam.

Além disso, dados de alta frequência também estão sendo amplamente utilizados para estudar questões relacionadas à microestrutura do mercado, tais como: o comportamento dos participantes em um mercado específico, a dinâmica de preços e como afetam as transações e ofertas de compra e venda de um ativo em particular, concorrência entre mercados relacionados e modelagem em tempo real da dinâmica do mercado.

Este artigo contribui à literatura de estudos da eficácia das estimativas de retorno produzidas por modelos de volatilidade de dados de alta frequência. Foram propostos dois modelos de retornos bivariados e volatilidade realizada, e sua contribuição à melhoria das previsões de retorno. Deve-se observar que as evidências empíricas sugerem que as previsões de variação quadrática, baseadas em dados de alta frequência, são melhores que os modelos padrão de estimativa de volatilidade. Portanto, os resultados apresentados no presente estudo oferecem uma contribuição importante para melhores estimativas de volatilidade e precificação de ativos financeiros. Em termos práticos, podem-se usar os modelos implementados para validar e refinar os modelos de preço e retorno intraday. Portanto, podem ser úteis em estratégias de investimento intraday, em estratégias com posições longas-curtas e na gestão de risco, por exemplo, para calcular diferentes volatilidades condicionais no intuito de comparar e melhorar as metodologias de Valor em Risco.

O artigo foi organizado da seguinte maneira. A próxima seção apresenta um resumo da literatura relevante. Na seção 3, são descritos os dados que foram usados para construir retornos diários da estimativa da volatilidade realizada (VR) diária. Nessa estimativa, os ajustes de VR se destacam para remover os efeitos da microestrutura do mercado. A seção 4 descreve a metodologia e estima o retorno e os modelos de VR com base em dados intraday, e os modelos de referência com base nos retornos diários. Na seção 5, os resultados empíricos são apresentados e validados mediante o uso da variância condicional intraday para estimar o Modelo de Precificação de Ativos Capitais. E, finalmente, a seção 6 destaca as conclusões deste estudo.

2 RESUMO DA LITERATURA RELEVANTE

A análise de dados de alta frequência impõe novos desafios aos pesquisadores, já que esses dados têm características únicas, não presentes em bancos de dados com frequências inferiores.

Desde a apresentação por Hsieh (1991)Hsieh, D.A. (1991). Chaos and nonlinear dynamics: application to financial markets., Journal of Finance 46(5),1839-1877. de uma das primeiras estimativas de variância nos retornos diários baseados nos retornos intraday do índice de ações S&P500, alcançaram-se progressos em várias áreas diferentes. Entre outros artigos seminais que discutem as propriedades e características únicas das distribuições dos dados intraday, podem-se mencionar: Zhou (1996)Zhou, B. (1996). High-frequency data and volatility in foreign exchange rates. Journal of Business and Economic Statistics, 14(1), 45-52., que usou dados de frequência hiper-alta relevantes aos mercados de câmbio para explicar a autocorrelação negativa da primeira ordem de retornos e para estimar a volatilidade para dados de alta-frequência; Goodhart e O'Hara (1997)Goodhart, C.A.E., & O'Hara, M. (1997). High frequency data in financial markets: issues and applications. Journal of Empirical Finance, 4(2),73-114.que destacam os efeitos da estrutura de mercado na interpretação e análise dos dados, os efeitos sazonais intraday e os efeitos da volatilidade temporal; e Andersen e Bollerslev (1997Andersen, T.G., & Bollerslev, T. (1997). Heterogeneous information arrivals and return volatility dynamics: uncovering the long-run in high frequency returns. Journal of Finance, 52(3),975-1005., 1998a)Andersen, T.G., & Bollerslev, T. (1998a). Deutsche mark-dollar volatility: intraday activity patterns, macroeconomic announcements, and longer run dependencies., Journal of Finance 53(1),219-265. que analisaram o comportamento da volatilidade intraday, os choques de volatilidade devido a pronunciamentos macroeconômicos e a persistência de longo prazo na série temporal da volatilidade realizada, também no mercado de câmbio.

Outros trabalhos importantes, tais como os de Andersen e Bollerslev (1998b)Andersen, T.G., & Bollerslev, T. (1998b). Answering the skeptics: yes, standard volatility models do provide accurate forecasts. International Economic Review, 39(4),885-905., Andersen, Bollerslev, Diebold, e Ebens (2001a)Andersen, T.G., Bollerslev, T., Diebold, F.X., & Ebens, H. (2001a). The distribution of realized stock return volatility. Journal of Financial Economics, 61(1),43-76., Andersen, Bollerslev, Diebold, e Labys (2001b)Andersen, T.G., Bollerslev, T., Diebold, F.X., & Labys, P. (2001b). The distribution of exchange rate volatility. Journal of the American Statistical Association, 96(453),42-55., Barndorff-Nielsen e Shephard (2002)Barndorff-Nielsen, O. E. , & Shephard, N. (2002). Econometric analysis of realized volatility and its use in estimating stochastic volatility models.Journal of the Royal Statistical Society, Series B, 64(2),253-280. e Meddahi (2002)Meddahi, N. (2002). A theoretical comparison between integrated and realized volatility. Journal of Applied Econometrics, 17(5),479-508.,estabeleceram as propriedades teóricas e empíricas da estimativa da variação quadrática para uma ampla classe de processos estocásticos na área de finanças, permitindo assim as pesquisas empíricas com uma nova classe de estimadores, incluindo a volatilidade realizada.

Andersen e Benzoni (2008)Andersen, T. G., & Benzoni, L. (2008). Realized volatility. Federal Reserve Bank of Chicago, Working Paper 2008-14. relatam as aplicações empíricas derivadas das medidas construídas com base em dados de alta frequência, destacando pelo menos quatro grandes áreas de pesquisa: (i) previsão de volatilidade, com ênfase em pesquisas com foco na melhoria do desempenho dessa previsão, na literatura relevante relacionada à detecção de saltos e na investigação de problemas relacionados à microestrutura no desempenho da previsão; (ii) implicações na distribuição de retornos sob condições de não-arbitragem; (iii) medidas multivariadas da variação quadrática; e (iv) volatilidade realizada, modelos de especificação e estimativa.

Dentro dessas subáreas de pesquisa, este artigo enfoca a melhoria do desempenho da previsão de volatilidade, com atenção especial às propriedades das séries temporais e à melhoria dos procedimentos de estimativa, a saber, mediante o uso da volatilidade realizada.

A seguir apresentamos alguns dos artigos principais nesta subárea de pesquisa.

Andersen et al. (2001a)Andersen, T.G., Bollerslev, T., Diebold, F.X., & Ebens, H. (2001a). The distribution of realized stock return volatility. Journal of Financial Economics, 61(1),43-76. estimam a volatilidade diária realizada de uma série de ações listadas no índice Dow Jones Industrial Average (DJIA). Os autores alcançam resultados que afirmam que a distribuição incondicional da variância e covariância realizadas é altamente assimétrica para direita, enquanto o desvio padrão logarítmico realizado e as correlações são aproximadamente Gaussianas. O mesmo vale para a distribuição dos retornos escalados pelos desvios padrão realizados.

Andersen, Bollerslev, Diebold, e Labys (2003)Andersen, T.G., Bollerslev, T., Diebold, F.X., & Labys, P. (2003). Modeling and forecasting realized volatility. Econometrica, 71(2), 529-626. oferecem uma estrutura geral para o uso de dados intraday de alta frequência para medir, modelar e prever as distribuições das volatilidades e retornos com frequência diária ou em períodos inferiores.

Ghysels, Santa-Clara, e Valkanov (2005)Ghysels, E., Santa-Clara, P., & Valkanov, R. (2005). There is a risk-return tradeoff after all. Journal of Financial Economics, 76(3),509-548. introduzem um novo estimador que prevê a variância mensal, utilizando os retornos quadrados diários passados e o denominam amostragem de dados mistos(MIDAS).

Andersen et al. (2007)Andersen, T.G., Bollerslev, T., & Diebold, F.X. (2007). Roughing it up: including jump components in the measurement, modeling and forecasting of return volatility. Review of Economics and Statistics,89(4),701-720. afirmam que mais e mais fontes na literatura confirmam os ganhos na previsão da volatilidade dos ativos financeiros, utilizando-se medidas baseadas em dados de alta frequência. Implementam uma nova medida de volatilidade (medida de variação bipower) e testes não paramétricos correspondentes para saltos. A análise empírica das taxas de câmbio, índice de retornos de ações e taxas de títulos sugere que o componente de volatilidade devido a saltos seja muito importante e menos persistente que o componente contínuo, e que a separação entre movimentos de salto e movimentos suaves (contínuos) resulte em uma melhoria significativa na previsão de volatilidade fora da amostra. Além disso, muitos saltos significativos são associados com novos anúncios de eventos macroeconômicos.

Maheu e McCurdy (2007)Maheu, J.M., & McCurdy, T.H. (2007). Components of market risk and return., Journal of Financial Econometrics 5(4),560-590. propõem um modelo flexível e parcimonioso da dinâmica combinada entre o retorno e o risco do mercado para prever o prêmio de capital de mercado variável no tempo. Esse modelo de volatilidade permite diferentes taxas de decaimento para seus componentes, gerando previsões de retornos médios e permitindo metas de variância.

Corsi (2009)Corsi, F. (2009). A simple approximate long memory model of realized volatility. Journal of Financial Econometrics,7(2), 174-196. propõe um modelo aditivo de volatilidade de componentes definidos em diferentes horizontes de tempo. Esse modelo possui componentes autorregressivos na volatilidade realizada e é denominado o Modelo Autorregressivo Heterogêneo de Volatilidade Realizada - HAR-LOG (VR). Fácil de ser implementado, os resultados simulados mostram que este modelo consegue reproduzir as principais características dos retornos sobre ativos financeiros (memória longa, caudas gordas e autossimilaridade). Além disso, os resultados empíricos mostram excelente desempenho de previsão.

Poucos artigos estudaram os benefícios da incorporação da VR na distribuição dos retornos. Esses incluem Andersen et al. (2003)Andersen, T.G., Bollerslev, T., Diebold, F.X., & Labys, P. (2003). Modeling and forecasting realized volatility. Econometrica, 71(2), 529-626. e Giote Laurent (2004)Giot, P., & Laurent, S. (2004). Modelling daily value-at-risk using realized volatility and ARCH type models. Journal of Empirical Finance, 11(3), 379-398., que consideram o valor da VR para estimativas e para calcular o Valor em Risco, comparando o desempenho de um modelo ARCH, que usa os retornos diários, com o desempenho de um modelo baseado na volatilidade realizada diária - que usa retornos intraday - em carteiras do índice de ações e taxas de câmbio. Essas abordagens separam a dinâmica dos retornos e volatilidades e assumem que a VR seja uma medida suficiente para representar a variância condicional dos retornos. Ghysels et al. (2005)Ghysels, E., Santa-Clara, P., & Valkanov, R. (2005). There is a risk-return tradeoff after all. Journal of Financial Economics, 76(3),509-548. observam que as medidas de volatilidade de alta frequência identificam o tradeoff entre risco e retorno com frequências menores.

Entre os estudos aplicados ao mercado brasileiro, Moreira e Lemgruber (2004)Moreira, J.M.S., & Lemgruber, E.F. (2004). O uso de dados de alta freqüência na estimação da volatilidade e do valor em risco para o IBOVESPA. Rev. Bras. Econ., Rio de Janeiro, 58(1),99-120. avaliam o uso de dados de alta frequência na previsão de volatilidade e no VaR, utilizando os modelos GARCH com horizontes diários e intraday. Entre os resultados, destacaram que os dados intradaypodem melhorar significativamente o VaR de um dia. O artigo mais notável no mercado brasileiro foi desenvolvido por Wink Junior e Valls Pereira (2012) que, de forma pioneira, escolhem o intervalo de tempo intraday ótimo, tratam da questão do ruído gerado por uma microestrutura de mercado e implementam dois modelos recentes, que usam dados de alta frequência para estimar e prever a volatilidade de cinco ações representativas do Índice Bovespa.

3 DADOS E ESTIMATIVA DA VOLATILIDADE REALIZADA

Neste estudo, foram utilizados os preços negociados para as ações PETR4 e VALE5, as duas ações com maior liquidez no mercado brasileiro de ações. Os preços das negociações dessas ações foram obtidos diretamente da BM&FBovespa.

Os dados na amostra se referem ao período entre 1o de dezembro de 2009 e 23 de março de 2012 para ambas as ações.

Após remover os erros dos dados das negociações, foi construída uma grade de cinco minutos dentro do período das negociações do leilão eletrônico, encontrando-se o preço negociado igual a ou depois mais próximo de cada intervalo na grade. Dessa grade, foram construídos retornos continuamente compostos de cinco minutos (retornos log). Esses retornos foram multiplicados por 100 e anotados como rt,i = 1,..., I , em que I é a quantidade de retornos intraday no dia t. Para essa grade de cinco minutos, a média é de I=83 para cada dia de negociação. Essa rotina gerou, respectivamente, 47.334 e 47.322 retornos de cinco minutos para as ações PETR4 e VALE5 ao longo dos 573 dias em que as ações foram negociadas.

O aumento na variação quadrática é uma medida natural da variância ex-post dentro de um período específico. A variância realizada, também conhecida como volatilidade realizada, é um dos mais populares estimadores da variância quadrática, calculada como a soma dos retornos quadrados ao longo de um período de tempo específico.

Assim, diante dos retornos intraday rt,i = 1,..., I, um estimador diário não ajustado da VR é

Porém, na presença da dinâmica da microestrutura do mercado, a VR pode ser distorcida e é um estimador inconsistente da variação quadrática (Bandi & Russell, 2004Bandi, F.M., & Russell, J.R. (2004). Microstructure noise, realized volatility, and optimal sampling. Manuscript, University of Chicago.). Portanto, a volatilidade realizada diária foi ajustada com o método da média móvel, usado por Andersen et al. (2001a)Andersen, T.G., Bollerslev, T., Diebold, F.X., & Ebens, H. (2001a). The distribution of realized stock return volatility. Journal of Financial Economics, 61(1),43-76. e posteriormente generalizado por Hansen, Large, e Lunde (2008)Hansen, P. R. , Large, J.H., & Lunde, A. (2008). Moving average-based estimators of integrated variance. Econometric Reviews, 27(1-3),79-111. e também implementado no mercado brasileiro de ações por Wink Junior e Valls Pereira (2012)Wink Junior, M.V., & Valls Pereira, P.L. (2012). Modelagem e previsão de volatilidade realizada: evidências para o Brasil. Texto para Discussão 313, 3, FGV-EESP, CEQEF..

Assim, se o retorno intraday de um ativo seguir um processo de média móvel na ordem de (MA(q)), dado por rt,m = εt-θ1 εt-1,m -... - θqεt-q,m, Hansen et al. (2008)Hansen, P. R. , Large, J.H., & Lunde, A. (2008). Moving average-based estimators of integrated variance. Econometric Reviews, 27(1-3),79-111. mostram que, diante de algumas hipóteses, o estimador que corrige o viés não ajustado na VR, baseado no processo MA(q), é dado por:

Assim, para evitar uma lacuna entre as medidas de volatilidade interday e intraday, os retornos diários rt usados nos modelos da família GARCH foram calculados pela diferença logarítmica entre o último preço do dia e o último preço do dia anterior, ambos capturados na grade de cinco minutos. Esses retornos também foram multiplicados por 100.

A Figura 1 mostra que as volatilidades realizadas das ações analisadas têm autocorrelação serial significativa.

Figura 1
Autocorrelação das Volatilidades Realizadas para PETR4 e VALE5

A Tabela 1 mostra as estatísticas descritivas para os retornos diários e para a VR diária estimada, utilizando-se a grade de cinco minutos. Há um certo viés na VR não ajustada. Após a análise dos correlogramas da VR diária e o critério adotado por Maheu e McCurdy (2011) para remover esse viés, um processo MA com q=8 parece necessário para os retornos da PETR4, enquanto q=11 é apropriado para os retornos da VALE5. A partir daqui, RVt = RVt,MAq será usado com q=8 e q=11 para as estimativas, respectivamente, da PETR4 e VALE5.

Tabela 1
Estatísticas resumidas: retornos diários e volatilidades realizadas

4 METODOLOGIA

Neste artigo, modelos bivariados foram propostos com base em duas formas alternativas de relação entre a VR e a variância condicional dos retornos e os modelos da família GARCH servem como arcabouço para a análise de desempenho dos modelos intraday.

De acordo com Maheu e McCurdy (2011)Maheu, J.M., & McCurdy, T.H. (2011). Do high-frequency measures of volatility improve forecasts of returns distributions? Journal of Econometrics, 160(1), 69-76., propuseram-se duas formas funcionais para os modelos bivariados dos retornos e da VR. O primeiro modelo usa a função autorregressiva heterogênea (HAR) do logaritmo defasado (VR) (Corsi, 2009Corsi, F. (2009). A simple approximate long memory model of realized volatility. Journal of Financial Econometrics,7(2), 174-196.; Andersen, Bollerslev, & Diebold, 2007Andersen, T.G., Bollerslev, T., & Diebold, F.X. (2007). Roughing it up: including jump components in the measurement, modeling and forecasting of return volatility. Review of Economics and Statistics,89(4),701-720.). O segundo modelo permite que os componentes do logaritmo (VR) tenham diferentes taxas de decaimento (Maheu e McCurdy, 2007Maheu, J.M., & McCurdy, T.H. (2007). Components of market risk and return., Journal of Financial Econometrics 5(4),560-590.).

Uma maneira de se vincular a VR à variância nos retornos também foi considerada, impondo a restrição de que a variância condicional nos retornos diários seja igual à expectativa condicional da VR diária.

Da mesma forma que com os modelos EGARCH e TGARCH, modelos bivariados permitem o assimchamado efeito de alavancagem, ou assimetrias, das inovações negativas contra as inovações positivas nos retornos.

Uma maneira de se confirmar que a informação intraday contribui à melhoria nas estimativas das distribuições dos retornos é comparar as estimativas dos modelos bivariados do retorno e logaritmo (VR) especificado nas estimativas dos modelos da família GARCH:

O principal método de comparação implementado usa a raiz quadrada do erro quadrático médio e o teste Modificado de Diebold e Mariano (1995)Diebold, F.X., & Mariano, R.S. (1995). Comparing predictive accuracy. Journal of Business & Economic Statistics, 13(3), 252-263., baseado na obra de Harvey, Leybourne, e Newbold (1997)Harvey, D., Leybourne S., & Newbold, P. (1997). Testing the equality of prediction mean squared errors. International Journal of Forecasting, 13(2),281-291.. Intuitivamente, modelos mais bem estimados terão menos erros de previsão e, em comparação com os outros modelos de desempenho inferior, apresentarão diferenças estatísticas nos seus erros. Portanto, para avaliar os modelos implementados neste artigo, enfocamos a acurácia relativa desses modelos na estimativa dos retornos dentro e fora da amostra.

Um aspecto importante da abordagem utilizada é a possibilidade de comparar diretamente as especificações de volatilidade tradicionais, tais como os modelos da família GARCH, com os modelos dos retornos bivariados e VR, porque os modelos implementados têm um critério em comum - a previsão dos retornos. A média e o teste estatístico desses erros de previsão nos permitem investigar a contribuição relativa da VR nas previsões.

4.1 Modelos de Retornos Bivariados e Variância Realizada.

Nesta subseção, duas especificações combinadas do retorno diário e da VR foram implementadas. Esses modelos bivariados se distinguem pelas suas condições alternativas para a dinâmica da VR. Em cada caso, as restrições entre as equações vinculam a variância dos retornos à especificação da VR.

O primeiro corolário de Andersen et al. (2003) mostra que, sob condições empíricas realistas, a expectativa condicional da variação quadrática (VQt ) é igual à variância condicional dos retornos, i.e. Et-1 (VQt) = Vart-1 (rt) σt 2. Se a VR for um estimador não enviesado da variação quadrática, segue que a variância condicional dos retornos pode ser vinculada a VR como o σt2 = Et-1 (VRt), em que a combinação das informações se define como øt-1 {rt-1, VRt-1, rt-2, VRt-2, ... ,r1, VR1}. Supondo-se que a VR tenha distribuição log-normal, a restrição assume a seguinte forma:

4.1.1 Especificação autorregressiva heterogênea: Modelo HAR.

O primeiro modelo implementado possui uma especificação bivariada dos retornos diários e da VR em que os retornos condicionais são dirigidos por inovações normais e a dinâmica do log(VRt) é capturada em uma função autorregressiva heterogênea (HAR) do log(VRt) defasado. Corsi (2009)Corsi, F. (2009). A simple approximate long memory model of realized volatility. Journal of Financial Econometrics,7(2), 174-196. e Andersen et al. (2007)Andersen, T.G., Bollerslev, T., & Diebold, F.X. (2007). Roughing it up: including jump components in the measurement, modeling and forecasting of return volatility. Review of Economics and Statistics,89(4),701-720. usam as funções HAR para captar a dependência da memória de longoprazo com parcimônia. Motivados por esses estudos, definimos:

Por exemplo, log(VRt-22,22) é estimado mediante o cálculo da média do log(VRt ) para os últimos 22 dias, i.e. de t-22 até t-1, log(VRt-5,5) considera a média dos últimos cinco dias.

Isso toma a especificação dos retornos diários e da VR com a dinâmica do log(VRt) sendo modelada como uma função HAR assimétrica do log(VR)

passado1 1 A série temporal RV para os ativos usados aqui é estacionária de acordo com o teste de raízes unitárias, que rejeita a hipótese nula de não estacionariedade. . Este sistema bivariado é resumido da seguinte forma:

Essa especificação bivariada dos retornos diários e da VR impõe a equação de restrição que relaciona a variância condicional nos retornos diários com a expectativa condicional da VR diária, conforme mostrado em (4.5).

Como o banco de dados analisado neste artigo refere-se a retornos de ações, é importante permitir efeitos assimétricos na volatilidade. Para facilitar as comparações com o modelo de referência EGARCH, a parametrização na equação (4.8) inclui o termo assimétrico γet-1 , associado com as inovações nos retornos et-1 . O coeficiente de impacto para as inovações negativas nos retornos será γ. Tipicamente, < 0, o que significa que as inovações negativas nos retornos implicam maior variância condicional para o período seguinte.

4.1.2 Especificação Component-Log(RV): Modelo 2-Comp.

Essa especificação bivariada dos retornos diários e VR possui retornos condicionais direcionados por inovações normais, mas a dinâmica do log(VR) é capturada por dois componentes (2-Comp) com taxas de decaimento diferentes, conforme demonstrada em Maheu e McCurdy (2007Maheu, J.M., & McCurdy, T.H. (2007). Components of market risk and return., Journal of Financial Econometrics 5(4),560-590.). Particularmente, esse sistema bivariado pode ser representado na seguinte equação:

Novamente uma restrição foi imposta pela equação (4.5), que relacionou a variância condicional dos retornos diários com a expectativa condicional da VR diária. Para essa especificação, a dinâmica do log(VR) diário foi parametrizada pelas equações (4.10) e (4.11), substituindo a função HAR na equação (4.8).

A média da série temporal de retornos foi estimada por modelos ARMA (p, q), utilizando a função do software R auto.arima. Para todas as outras estimativas foi utilizado o software eviews 7.1. No intuito de combinar a parcimônia e solidez dessas estimativas, estabelecemos a defasagem máxima (p+q) de4e seleção automática da defasagem com o Critério de Informação de Schwarz (BIC). Assim, para a média da série temos um AR (1) modelando as séries diárias e semanais das ações VALE5 e PETR4 e um ARMA (2.2) para as séries semanais e mensais de ambos os ativos.

Os sistemas bivariados foram estimados em dois passos. Inicialmente, as equações das médias foram estimadas e, depois, as inovações nos retornos foram modeladas com o uso de diferentes modelos de volatilidade. As previsões da volatilidade foram feitas com uma sequência de previsões um passo à frente, utilizando os valores atuais para a variável dependente defasada e as previsões de retorno, considerando ri,t = fi,t + ei,t , ei,t = σi,t ut , ut ~ NID(0,1) em que fi,t é a equação estimada para o processo médio do ativo i no tempo t, ei,t é a inovação do retorno para o ativo i no tempo t e αi,t é o desvio padrão condicional estimado para o ativo i no tempo t.

Para fins de um exercício prático da aplicabilidade dos modelos apresentados aqui, usamos a variância condicional estimada com o modelo mensal 2-Comp,que retornou as previsões de erro mais baixas entre os modelos analisados, na estimativa com o modelo Capital Asset Pricing Model (CAPM). OCAPM, desenvolvido por Sharpe(1964)Sharpe, W.F. (1964). Capital asset prices: a theory of market equilibrium under conditions of risk. Journal of Finance, 19(3),425-442., Treynor(1961)Treynor, J.L. (1961). Market value, time, and risk. Unpublished manuscript., Lintner(1965)Lintner, J. (1965). The valuation of risk assets and the selection of risky investments in stock portfolios and capital budgets., Review of Economics and Statistics 47(1),13-37. e Black, Jensen, e Scholes (1972)Black, F., Jensen M.C., & Scholes M. (1972). The capital asset pricing model: some empirical tests. In M. Jensen (Ed.). Studies in the theory of capital markets. (pp. 79-121). New York: Praeger Publishers., tem se tornado nas últimas décadas o modelo mais amplamente divulgado para a determinação dos preços de ativos(Barros, Famá, & Silveira, 2002Barros, L.A., Famá, R., & Silveira, B. P. (2002). Conceito de taxa livre de risco e sua aplicação no Capital Asset Pricing Model. Um estudo explorativo para o mercado brasileiro. Anais do Encontro Brasileiro de Finanças da Sociedade Brasileira de Finanças, Rio de Janeiro, RJ, Brasil, 2.). Esse modelo determina que os ativos são precificados de forma compatível com um trade-off entre o risco não-diversificável e as expectativas de retorno.

O CAPM pode ser apresentado formalmente como E(ri )=rf + βi (E(rm ) - rf ), em que E(ri ) é o retorno esperado do ativo i ao longo de um único período, rf é o risco da taxa de juros livre de risco ao longo do período, E(rm ) o retorno esperado no mercado ao longo do período, e

identifica a exposição do ativo i ao mercado.

Para estimar β, usamos: (i) a covariância estatística Cov(rm , ri ) da PETR4 e VALE5 na BOVA11 em uma janela móvel de 22 dias e (ii) a variância condicional σ 2(rm ) estimada pelo modelo 2-Comp na mesma janela temporal. O Certificado Interbancário de Depósitos (CDI) foi selecionado para representar o risco da taxa de juros livre de risco, de acordo com Barros, Famá, e Silveira (2002)Barros, L.A., Famá, R., & Silveira, B. P. (2002). Conceito de taxa livre de risco e sua aplicação no Capital Asset Pricing Model. Um estudo explorativo para o mercado brasileiro. Anais do Encontro Brasileiro de Finanças da Sociedade Brasileira de Finanças, Rio de Janeiro, RJ, Brasil, 2..

Para representar o portfólio do mercado, escolhemos o fundo de índice BOVA11, considerando que seu retorno esperado para o período subsequente é uma função do retorno do período anterior. As qualidades do BOVA11 incluem: (i) é negociado efetivamente em um mercado ativo, permitindo a extração da volatilidade realizada e seu uso nos modelos de volatilidade intraday, (ii) possui uma correlação média de mais de 99% com o Ibovespa2 2 O Índice Bovespa (Ibovespa) é o indicador mais importante dos preços médios das ações negociadas na Bolsa de Valores de São Paulo e inclui as ações com os maiores volumes de negócios nos meses recentes. no período analisado, (iii) é um ativo com liquidez crescente, com giro diário médio de R$44.1mi em 2011, e de longe o fundo de índice mais negociado no mercado brasileiro.

5 RESULTADOS EMPÍRICOS

Nesta seção, apresentaremos os resultados estimados dos modelos para as janelas de 1, 5 e 22 dias.

A Tabela 2 apresenta as estimativas dos modelos da família GARCH. O Critério de Informação de Schwarz (BIC) indica que modelos assimétricos são tão bem ajustados aos dados quanto o modelo GARCH estimado, confirmado em quase todas as previsões dentro da amostra desses modelos. Com base nos modelos EGARCH e TGARCH ajustados, exceto a estimativa mensal da PETR4, todos os coeficientes do efeito de alavancagem são significativos no nível de 10%, confirmando o impacto assimétrico entre os retornos positivos e negativos dos ativos.

Tabela 2
Estimativas com os modelos GARCH, EGARCH e TGARCH

Ambos os modelos assimétricos oferecem efeitos de alavancagem semelhantes para os horizontes temporais estimados. Considerando um choque estandardizado de dois desvios padrão, o efeito de alavancagem para EGARCH(1,1,1) pode ser estimado (Tsay, 2010Tsay, R.S. (2010). Analysis of financial time series. (3rd ed.). New Jersey: Wiley.) como

, e para TGARCH(1,1,1) como
.

A seguinte Tabela 3 compara esses modelos assimétricos, assumindo que et-1 = ±t-1 de tal forma que ut-1 = ±2. O impacto de um choque negativo de dois desvios padrão é mais potente para os retornos diários. Assim, o efeito de alavancagem se reduz com o aumento dos horizontes temporais.

Tabela 3
Efeito de Alavancagem (considerando 2 desvios padrão)

Por exemplo, para a VALE5 com horizonte de um dia, o impacto de um choque negativo de dois desvios padrão é aproximadamente 121% e 108% superior, respectivamente, para os modelos EGARCH e TGARCH, quando comparado ao impacto de um choque positivo da mesma magnitude. Para um horizonte de 22 dias, esses impactos são reduzidos para 31% e 20%.

As Tabelas 4 e 5, a seguir, mostram as estimativas dos modelos HAR-Log(RV) r 2-Comp, respectivamente, para os horizontes temporais de 1, 5 e 22 dias, respectivamente.

Os resultados mostrados na Tabela 4 estão de acordo com Andersen et al. (2007)Andersen, T.G., Bollerslev, T., & Diebold, F.X. (2007). Roughing it up: including jump components in the measurement, modeling and forecasting of return volatility. Review of Economics and Statistics,89(4),701-720. e Wink Junior e Valls Pereira (2012)Wink Junior, M.V., & Valls Pereira, P.L. (2012). Modelagem e previsão de volatilidade realizada: evidências para o Brasil. Texto para Discussão 313, 3, FGV-EESP, CEQEF.. As estimativas estatisticamente significativas dos coeficientes dos componentes de volatilidade diária (ø1), semanal (ø2) e mensal (ø3) confirmam a presença de alta persistência na volatilidade3 3 Somente três dos 18 coeficientes de volatilidade não são significantes ao nível de 10%. Essas exceções se referem aos componentes de volatilidade estimados em equações com horizontes de um e cinco dias. . O peso relativo do componente de volatilidade diária diminui das regressões diárias para o componente semanal e mensal, enquanto o componente mensal tende a ter relativamente maior importância nas regressões ao longo de períodos maiores4 4 Conforme observado por Andersen et al. (2007), apesar de a estrutura do modelo HAR não conter formalmente uma memória, a combinação entre poucos componentes de volatilidade consegue reproduzir uma queda suave notável na autocorrelação dessa volatilidade, sendo quase indistinguível da decaimento hiperbólico (memória longa). .

Tabela 4
Estimativas com o modelo HAR-log(RV)
Tabela 5
Estimativas com o modelo 2-Comp

Além disso, quando se compara o R2ajustado do HAR, que inclui o componente γ assimétrico com a mesma estatística HAR padrão (última coluna da Tabela 3), observa-se pouca melhoria na estimativa dos modelos, indicando que os coeficientes do HAR já estavam capturando alguma dinâmica assimétrica dos retornos sobre os ativos.

Porém, os resultados apresentados na Tabela 5 mostram que o modelo 2-Comp estimado conseguiu captar eficazmente as diferentes dinâmicas da volatilizada, distinguindo claramente entre os coeficientes persistentes α1 e α2 de acordo com cada horizonte temporal (veja a Figura 2). Além disso, o coeficiente α inferior em cada equação mostra um efeito menos persistente, sendo mais influenciado pelas observações de VR mais recentes.

Figura 2
Fatores de decaimento e log(RV) realizado e estimado para VALE5

Assim, da mesma forma que no modelo HAR utilizado, os componentes γ assimétricos do modelo 2-Comp são negativos, mas também relativamente muito pequenos, indicando que esses modelos sem γ também conseguem captar parcialmente o equilíbrio assimétrico dos retornos.

A Figura 2 mostra os gráficos da série histórica s1,t e s2,t, eLog(VR) realizado e estimado (gráfico 2.2) paraVALE5 gerados pela diminuição nos fatores α1 e α2 (gráfico 2.1) no horizonte temporal de um dia.

Para avaliar a acurácia dos modelos usados, foram avaliados para a previsão dos horizontes subsequentes de 1, 5 e 22 dias, dentro e fora da amostra, utilizando a medida da raiz quadrada do erro quadrático médio (RMSQ). O teste Modificado de Diebold Mariano foi utilizado5 5 Este teste estatístico envolve testar a hipótese nula de igualdade entre o erro médio quadrático de duas previsões, utilizando-se os valores críticos de uma distribuição de Student-t com (n-1) graus de liberdade. para estimar as diferenças estatísticas entre os modelos.

Para o período dentro da amostra, os dados coletados entre 07/01/2010 e 29/7/2011 foram considerados (388 observações) e, para o período fora da amostra, os dados entre 01/08/2011 e 21/03/2012 (160 observações).

A Tabela 6 apresenta a RMSQ das previsões nos três horizontes temporais definidos. O modelo 2-Comp proporcionou melhores previsões para todos os horizontes temporais, e HAR a segunda melhor previsão para os horizontes de 5 e 22 dias. Mas a qualidade estatística desses resultados é melhor que os modelos da família GARCH? Na Tabela 7, tentou-se responder essa e outras perguntas.

Tabela 6
Raiz quadrada do erro quadrático médio
Tabela 7
Teste Modificado Diebold Mariano (valor de P)

A Tabela 7 mostra os valores de p do teste estatístico Modificado de Diebold Mariano.

Com relação às previsões de retorno tanto nos períodos dentro como fora da amostra, os valores de p mostram que: (i) o modelo 2-Comp proporciona as melhores previsões nos três horizontes temporais; (ii) o modelo HAR tem a segunda melhor previsão para os horizontes de 5 e 22 dias.

Diante das previsões de retorno no período da amostra: (i) não há diferença significativa entre os modelos GARCH, EGARCH e HAR no horizonte de um dia; (ii) não há diferença significativa entre os modelosda família GARCH nos horizontes de 5 e 22 dias.

Além disso, as previsões de retorno somente no período fora da amostra mostram: (i) no horizonte de um dia: TGARCH não manteve o desempenho do EGARCH vis a vis o similar nas previsões amostrais de ambos os modelos; GARCH e EGARCH produzem melhores previsões que o modelo HAR para VALE5; não há diferenças significativas de previsão dos modelos HAR, GARCH e EGARCH para PETR4; (ii) no horizonte de cinco dias, o modelo EGARCH gera melhores previsões que o TGARCH; (iii) no horizonte de 22 dias, o modelo EGARCH gera melhores previsões que os modelos GARCH e TGARCH.

A Figura 3 representa os gráficos das duas melhores previsões fora da amostra para as ações PETR4 e VALE5 nos trêshorizontes. Pode-se observar que os modelos de alta frequência implementados apresentam previsões com grandes semelhanças mútuas. Além disso, essas previsões parecem aderir fortemente aos retornos realizados em todos os horizontes temporais analisados.

Figura 3
Retornos realizados e previsão fora da amostra pelos modelos HAR-Log(RV) e 2-Comp

Considerando os resultados do CAPM, a Figura 4 mostra o comportamento da série de retornos esperados estimados e as séries de retornos da PETR4 e VALE5 para o horizonte de 22 dias. Há alto nível de adesão dos retornos estimados aos retornos realizados, com correlação de 65% e 90%, respectivamente, para PETR4 e VALE5.

Figura 4
Retornos mensais esperados e observados para PETR4 e VALE5

A seguinte tabela resume as estatísticas descritivas para os retornos mensais esperados e observados da PETR4 e VALE5. Entre os resultados, podemos mencionar que: (i) a distribuição dos retornos esperados de ambas as ações é assimétrica para a esquerda e mostra mais caudas gordas (mais leptocúrticas) que os retornos realizados e (iii) as distribuições dos retornos realizados e estimados não são normais no nível de significância de 5%.

Tabela 8
Estatística descritiva para retornos mensais esperados e observados

6 CONCLUSÕES

Neste artigo foram propostos modelos alternativos que usaram os retornos diários e a VR, relacionando a VR com a variância dos retornos. Além disso, buscou explorar os possíveis benefícios de se usar dados intraday para alcançar melhores estimativas de volatilidade e previsões de retornos.

As aplicações empíricas implementadas nos retornos da PETR4 e VALE5 desvelam a importância das informações nos retornos intraday e o uso do log(VR). Os resultados encontrados confirmam que: (i) modelos bivariados que usam dados de alta frequência proporcionam melhorias significativas nas previsões em comparação com os modelos padrão, baseados em dados diários, confirmando os resultados encontrados por Maheu e McCurdy (2011)Maheu, J.M., & McCurdy, T.H. (2011). Do high-frequency measures of volatility improve forecasts of returns distributions? Journal of Econometrics, 160(1), 69-76. na bolsa norte-americana; (ii) os dois modelos bivariados de alta frequência, de forma parcimoniosa e singular, tiveram êxito na modelagem da volatilidade, conforme apresentado por Wink Junior e Valls Pereira (2012)Wink Junior, M.V., & Valls Pereira, P.L. (2012). Modelagem e previsão de volatilidade realizada: evidências para o Brasil. Texto para Discussão 313, 3, FGV-EESP, CEQEF., demonstrando desempenho excelente na previsão dos retornos e confirmando os resultados em Corsi (2009)Corsi, F. (2009). A simple approximate long memory model of realized volatility. Journal of Financial Econometrics,7(2), 174-196..

Esses resultados podem ser úteis em estratégias de investimentos intraday, em estratégias com posições longas-curtas e na gestão de riscos. As volatilidades condicionais HAR e 2-Comp podem ser usadas, por exemplo, para comparar e refinar o desempenho de diferentes metodologias de Valor em Risco.

Ao final deste artigo, também buscamos responder a pergunta: os modelos de preço de alta frequência oferecem melhores previsões de retorno que os modelos aceitos com o uso dos preços de fechamento?

Pode-se confirmar que sim. Os modelos com o uso de dados de alta frequência implementados na presente pesquisa parecem contribuir para melhores previsões de volatilidade e retorno. Esses resultados foram alcançados nos períodos dentro e fora da amostra, mediante o uso da raiz quadrada do erro quadrático médio e o teste Modificado de Diebold Mariano das previsões nos horizontes de 1, 5 e 22 dias. Apesar disso, a estimativa desses modelos para outros ativos financeiros e séries históricas maiores poderia confirmar e validar os resultados alcançados no presente estudo.

  • *
    Os autores são gratos ao Prof. Dr. Claudio Henrique da Silveira Barbedo do IBMEC-Rio e Banco Central do Brasil por seus comentários valiosos.
  • 1
    A série temporal RV para os ativos usados aqui é estacionária de acordo com o teste de raízes unitárias, que rejeita a hipótese nula de não estacionariedade.
  • 2
    O Índice Bovespa (Ibovespa) é o indicador mais importante dos preços médios das ações negociadas na Bolsa de Valores de São Paulo e inclui as ações com os maiores volumes de negócios nos meses recentes.
  • 3
    Somente três dos 18 coeficientes de volatilidade não são significantes ao nível de 10%. Essas exceções se referem aos componentes de volatilidade estimados em equações com horizontes de um e cinco dias.
  • 4
    Conforme observado por Andersen et al. (2007), apesar de a estrutura do modelo HAR não conter formalmente uma memória, a combinação entre poucos componentes de volatilidade consegue reproduzir uma queda suave notável na autocorrelação dessa volatilidade, sendo quase indistinguível da decaimento hiperbólico (memória longa).
  • 5
    Este teste estatístico envolve testar a hipótese nula de igualdade entre o erro médio quadrático de duas previsões, utilizando-se os valores críticos de uma distribuição de Student-t com (n-1) graus de liberdade.

Referências

  • Andersen, T. G., & Benzoni, L. (2008). Realized volatility Federal Reserve Bank of Chicago, Working Paper 2008-14.
  • Andersen, T.G., & Bollerslev, T. (1997). Heterogeneous information arrivals and return volatility dynamics: uncovering the long-run in high frequency returns. Journal of Finance, 52(3),975-1005.
  • Andersen, T.G., & Bollerslev, T. (1998a). Deutsche mark-dollar volatility: intraday activity patterns, macroeconomic announcements, and longer run dependencies., Journal of Finance 53(1),219-265.
  • Andersen, T.G., & Bollerslev, T. (1998b). Answering the skeptics: yes, standard volatility models do provide accurate forecasts. International Economic Review, 39(4),885-905.
  • Andersen, T.G., Bollerslev, T., & Diebold, F.X. (2007). Roughing it up: including jump components in the measurement, modeling and forecasting of return volatility. Review of Economics and Statistics,89(4),701-720.
  • Andersen, T.G., Bollerslev, T., Diebold, F.X., & Ebens, H. (2001a). The distribution of realized stock return volatility. Journal of Financial Economics, 61(1),43-76.
  • Andersen, T.G., Bollerslev, T., Diebold, F.X., & Labys, P. (2001b). The distribution of exchange rate volatility. Journal of the American Statistical Association, 96(453),42-55.
  • Andersen, T.G., Bollerslev, T., Diebold, F.X., & Labys, P. (2003). Modeling and forecasting realized volatility. Econometrica, 71(2), 529-626.
  • Bandi, F.M., & Russell, J.R. (2004). Microstructure noise, realized volatility, and optimal sampling Manuscript, University of Chicago.
  • Barndorff-Nielsen, O., Hansen, P., Lunde, A., & Shephard, N. (2008). Designing realized kernels to measure the ex-post variation of equity prices in the presence of noise., Econometrica 76(6),1481-1536.
  • Barndorff-Nielsen, O. E. , & Shephard, N. (2002). Econometric analysis of realized volatility and its use in estimating stochastic volatility models.Journal of the Royal Statistical Society, Series B, 64(2),253-280.
  • Barros, L.A., Famá, R., & Silveira, B. P. (2002). Conceito de taxa livre de risco e sua aplicação no Capital Asset Pricing Model. Um estudo explorativo para o mercado brasileiro. Anais do Encontro Brasileiro de Finanças da Sociedade Brasileira de Finanças, Rio de Janeiro, RJ, Brasil, 2.
  • Black, F., Jensen M.C., & Scholes M. (1972). The capital asset pricing model: some empirical tests. In M. Jensen (Ed.). Studies in the theory of capital markets (pp. 79-121). New York: Praeger Publishers.
  • Corsi, F. (2009). A simple approximate long memory model of realized volatility. Journal of Financial Econometrics,7(2), 174-196.
  • Diebold, F.X., & Mariano, R.S. (1995). Comparing predictive accuracy. Journal of Business & Economic Statistics, 13(3), 252-263.
  • Ghysels, E., Santa-Clara, P., & Valkanov, R. (2005). There is a risk-return tradeoff after all. Journal of Financial Economics, 76(3),509-548.
  • Giot, P., & Laurent, S. (2004). Modelling daily value-at-risk using realized volatility and ARCH type models. Journal of Empirical Finance, 11(3), 379-398.
  • Goodhart, C.A.E., & O'Hara, M. (1997). High frequency data in financial markets: issues and applications. Journal of Empirical Finance, 4(2),73-114.
  • Hansen, P. R. , Large, J.H., & Lunde, A. (2008). Moving average-based estimators of integrated variance. Econometric Reviews, 27(1-3),79-111.
  • Harvey, D., Leybourne S., & Newbold, P. (1997). Testing the equality of prediction mean squared errors. International Journal of Forecasting, 13(2),281-291.
  • Hsieh, D.A. (1991). Chaos and nonlinear dynamics: application to financial markets., Journal of Finance 46(5),1839-1877.
  • Lintner, J. (1965). The valuation of risk assets and the selection of risky investments in stock portfolios and capital budgets., Review of Economics and Statistics 47(1),13-37.
  • Maheu, J.M., & McCurdy, T.H. (2007). Components of market risk and return., Journal of Financial Econometrics 5(4),560-590.
  • Maheu, J.M., & McCurdy, T.H. (2011). Do high-frequency measures of volatility improve forecasts of returns distributions? Journal of Econometrics, 160(1), 69-76.
  • Meddahi, N. (2002). A theoretical comparison between integrated and realized volatility. Journal of Applied Econometrics, 17(5),479-508.
  • Moreira, J.M.S., & Lemgruber, E.F. (2004). O uso de dados de alta freqüência na estimação da volatilidade e do valor em risco para o IBOVESPA. Rev. Bras. Econ., Rio de Janeiro, 58(1),99-120.
  • Sharpe, W.F. (1964). Capital asset prices: a theory of market equilibrium under conditions of risk. Journal of Finance, 19(3),425-442.
  • Treynor, J.L. (1961). Market value, time, and risk Unpublished manuscript.
  • Tsay, R.S. (2010). Analysis of financial time series (3rd ed.). New Jersey: Wiley.
  • Wink Junior, M.V., & Valls Pereira, P.L. (2012). Modelagem e previsão de volatilidade realizada: evidências para o Brasil Texto para Discussão 313, 3, FGV-EESP, CEQEF.
  • Zhou, B. (1996). High-frequency data and volatility in foreign exchange rates. Journal of Business and Economic Statistics, 14(1), 45-52.

Datas de Publicação

  • Publicação nesta coleção
    May-Aug 2014

Histórico

  • Recebido
    21 Abr 2013
  • Revisado
    29 Abr 2013
  • Aceito
    07 Mar 2014
Universidade de São Paulo, Faculdade de Economia, Administração e Contabilidade, Departamento de Contabilidade e Atuária Av. Prof. Luciano Gualberto, 908 - prédio 3 - sala 118, 05508 - 010 São Paulo - SP - Brasil, Tel.: (55 11) 2648-6320, Tel.: (55 11) 2648-6321, Fax: (55 11) 3813-0120 - São Paulo - SP - Brazil
E-mail: recont@usp.br