Acessibilidade / Reportar erro

Análise do Valor-p Determinado pela Estatística τ na Aplicação do Teste de Dickey-Fuller Aumentado

RESUMO

O presente artigo avaliou a interferência da quantidade de defasagens utilizadas no resultado do valor-p associado à estatística utilizada no teste de Dickey-Fuller aumentado (ADF), bem como identificou algumas propriedades das séries estudadas que interferem em seu resultado. Foram realizados três experimentos com séries de diferentes amplitudes, considerando estrutura do modelo em relação à presença ou não de constante e/ou tendência, e quantidade de defasagens como fatores. Modelos autorregressivos do tipo AR(1) foram considerados para a geração de dados pelo método de Monte Carlo, que poderiam apresentar diferentes intensidades para o coeficiente associado à primeira defasagem. Depois da aplicação do teste ADF, foram determinadas as proporções de rejeição da hipótese nula em cada condição experimental, sendo utilizada uma análise de variância com a estatística qui-quadrado para verificar a influência da quantidade de defasagens no valor-p. Os resultados mostram que se houver raiz unitária, o teste apresenta bons resultados, independentemente da quantidade de defasagens considerada. Entretanto, o mesmo não foi observado nos casos em que a série temporal não apresenta raiz unitária.

Palavras-chave:
estacionariedade; raiz unitária; séries temporais; teste ADF

ABSTRACT

In this paper we evaluate how much influence the number of selected lags has in the p-value obtained from the statistic considered in an augmented Dickey-Fuller test (ADF). Three experiments with different series sizes were carried out considering the presence (or not) of a constant and/or trend, and also different number of lags. Autoregressive models (AR1) are used in the data generating process through the Monte Carlo method, considering different values for the coefficient associated with the first lag. After the application of the ADF test, we calculate the proportion of times when the null hypothesis was rejected in each scenario, and perform an analysis of variance (considering chi-square statistic) to verify the influence of the number of selected lags in the p-value. Results show that if a unit root is verified, then the test presents a good performance, regardless of the number of lags. However, the same was not observed in cases where the time series does not present a unit root.

Keywords:
stationarity; unit root; time series; ADF test

1 INTRODUÇÃO

Nas últimas décadas, vários métodos têm sido utilizados para modelar séries temporais, que se caracterizam como uma sequência de observações ordenadas no tempo. Estes métodos podem estar fundamentados em conceitos estatísticos, matemáticos ou computacionais, sendo alguns deles resultado da integração entre conceitos destas áreas. Na modelagem da demanda, resultados satisfatórios têm sido encontrados por meio de métodos estatísticos, entre os quais aqueles propostos por Box-Jenkins 44 G.E.P. Box, G.M. Jenkins & G.C. Reinsel. “Time Series Analysis: Forecasting and Control”. Wiley (2015).: os modelos autorregressivos de médias móveis (ARMA) e suas variações. Estes modelos, assim como a maioria dos modelos estatísticos, supõe que as séries temporais são estacionárias 1717 P.A. Morettin & C.M.C. Toloi. “Análise de Séries Temporais”. Blucher (2018)..

Na presença de estacionariedade, a função amostral que descreve o processo gerador dos dados tem a mesma forma em todos os instantes, facilitando a identificação de estimativas dos parâmetros desconhecidos dos modelos especificados. O trabalho de Nelson e Plosser 1818 C.R. Nelson & C.R. Plosser. Trends and random walks in macroeconomic time series: some evidence and implications. Journal of Monetary Economics, 10(2) (1982), 139-162., considerado por alguns estudiosos como ponto de partida para estudos nesta área, mostrou que as flutuações econômicas são melhor explicadas por mudanças na componente tendência do que nos componentes cíclicos, evidenciando a necessidade da avaliação da estacionariedade como uma importante propriedade do processo gerador dos dados de uma série temporal.

Alguns procedimentos gráficos relativamente simples, como gráficos em linhas e gráficos da função de autocorrelação e da função de autocorrelação parcial, podem ser utilizados por pessoas experientes para o reconhecimento da existência desta propriedade. Entretanto, técnicas analíticas mais formais apresentam melhor desempenho, além de não dependerem da experiência do analista 22 M. Arltová & D. Fedorová. Selection of unit root test on the basis of length of time series and value of AR(1) parameter. Statistika: Statistics and Economy Journal, 96(3) (2016), 47-64..

Nas últimas décadas vários procedimentos formais para identificar a presença de raiz unitária em uma série temporal foram apresentados, entre os quais o teste de Dickey-Fuller aumentado (ADF) e suas extensões, que consideram a sua presença (ausência de estacionariedade) como hipótese nula 88 D.A. Dickey & W.A. Fuller. Distribution of the estimators for autoregressive time series with unit root. Journal of the American Statistical Association, 74(366) (1979), 427-431.. Ao não rejeitar esta hipótese nula, não é encontrada evidência de estacionariedade, razão pela qual é mais plausível considerar a sua ausência. Neste caso, uma prática frequentemente adotada consiste na diferenciação sucessiva da série até atingi-la, sendo a última diferenciação determinante de sua ordem de integração.

Entretanto, possivelmente existem alguns problemas sérios na interpretação destes testes como salientado em 55 M. Caner & L. Kilian. Size distortions of tests of the null hypothesis of stationarity: evidence and implications for the PPP debate. Journal of International Money and Finance, 20(5) (2001), 639-657.. Embora o teste ADF seja, talvez, o mais popular entre os testes de raiz unitária, apresenta baixo poder, ou seja, tende a não rejeitar a hipótese nula com mais frequência que o desejado 33 E. Aylar, S. Smeekes & J. Westerlund. Lag truncation and the local asymptotic distribution of the ADF test for a unit root. Statistical Papers, 60 (2019), 2109-2118.. Ainda com base em 33 E. Aylar, S. Smeekes & J. Westerlund. Lag truncation and the local asymptotic distribution of the ADF test for a unit root. Statistical Papers, 60 (2019), 2109-2118., o resultado destes testes está associado à quantidade de defasagens considerada, enquanto que 22 M. Arltová & D. Fedorová. Selection of unit root test on the basis of length of time series and value of AR(1) parameter. Statistika: Statistics and Economy Journal, 96(3) (2016), 47-64. evidenciam a relação de seus resultados com a amplitude da série estudada e a intensidade do parâmetro autorregressivo, principalmente, se este último estiver próximo da unidade 55 M. Caner & L. Kilian. Size distortions of tests of the null hypothesis of stationarity: evidence and implications for the PPP debate. Journal of International Money and Finance, 20(5) (2001), 639-657.. Finalmente, o desempenho destes testes também estão associados à presença de tendência determinística, porém alguns dos problemas apresentados podem ser contornados se a série analisada sofre uma transformação via mínimos quadrados generalizados (GLS) antes da aplicação do teste ADF, identificado como ADF-GLS, na avaliação da estacionariedade da parte não sazonal da série 22 M. Arltová & D. Fedorová. Selection of unit root test on the basis of length of time series and value of AR(1) parameter. Statistika: Statistics and Economy Journal, 96(3) (2016), 47-64..

O presente estudo foi realizado para avaliar a interferência da quantidade de defasagens utilizadas no cálculo do valor-p, determinado a partir da estatística τ no teste ADF, identificando algumas propriedades da série estudada que interferem em seu resultado.

2 FUNDAMENTAÇÃO TEÓRICA

2.1 Estacionariedade e ergodicidade

Um processo estocástico que gerou uma série temporal {y t } é dito estacionário quando for invariante no tempo, sendo denominado de processo fracamente estacionário se satisfizer as seguintes condições: (i) Eyt=Eyt+k=μ,t,k; (ii) Eyt-μ2=σt2=σ2, sendo σ < ∞, ∀t; e (iii) yk=Covyt,yt+k=Covyt+m,tt+m+k,m,t,k. Ademais, uma série temporal é dita ergódica se [y t+1 , y t+2 , . . . , y t+k ] e [y t+m+1 , y t+m+2 , . . . , y t+m+k ] forem independentes, com m suficientemente grande.

Como consequência, se uma série temporal {y t }, em que E(y t ) = µ, for estacionária e ergódica, a média amostral de qualquer amostra de tamanho T , y¯, converge assintoticamente para média populacional µ.

2.2 Processo estocástico com raiz unitária

Considere um processo estocástico que possui um modelo autorregressivo de ordem um - AR(1) -, isto é,

y t = ϕ y t - 1 + u t , (2.1)

como mecanismo gerador dos dados, em que ϕ é um parâmetro a ser estimado e u t é um processo de ruído branco, que se caracteriza como uma sequência de variáveis aleatórias independentes e normalmente distribuídas (iid), com média zero e variância constante, ou seja, u tRB(0, σ 2).

O comportamento deste processo estocástico apresenta diferentes propriedades , para diferentes valores de ϕ. Se ϕ = ±1, a equação (2.1) se reduz a y t = y t−1 + u t , ou ainda yt=y0+t=1Tut, no qual o processo estocástico é dito não estacionário (passeio aleatório). Se |ϕ < 1|, então é possível considerar yt=t=1ϕiut-i, no qual o processo estocástico é dito estacionário. Esta representação pode ser usada para evidenciar as diferenças entre os dois processos estocásticos 77 I. Choi. “Almost all about unit roots: Foundations, Developments, and Applications”. Cambridge University Press (2015).),(1010 R.F. Engle & C.W.J. Granger. Co-integration and error correction: representation, estimation, and testing. Econometrica, 55(2) (1987), 251-276. conforme Quadro 1 (observe que as mesmas propriedades são válidas para um processo autorregressivo de médias móveis - ARMA - estacionário e invertível).

Finalmente, observe que o modelo da equação (2.1) não apresenta elementos referentes a constante e tendência, o que raramente acontece em séries estacionárias 77 I. Choi. “Almost all about unit roots: Foundations, Developments, and Applications”. Cambridge University Press (2015)..

Quadro 1:
Propriedades de processos estocásticos, conforme valor de ϕ.

2.3 Teste DF e teste ADF

O teste de Dickey-Fuller (DF) 88 D.A. Dickey & W.A. Fuller. Distribution of the estimators for autoregressive time series with unit root. Journal of the American Statistical Association, 74(366) (1979), 427-431., além de poder ser utilizado no modelo da equação (2.1), ainda pode identificar a presença de raiz unitária em dois outros modelos que utilizam o AR(1) como mecanismo de geração dos dados, a saber

y t = μ + ϕ y t - 1 + u t , (2.2)

e

y t = μ + β t + ϕ y t - 1 + u t , (2.3)

em que µ é uma constante, β é um efeito de tendência.

Nos três modelos, descritos nas equações (2.1), (2.2) e (2.3), testa-se a hipótese nula H 0: ϕ = 1 (há presença de raiz unitária), contra a alternativa H 1: |ϕ| < 1 (não há presença de raiz unitária), podendo o processo ser considerado estacionário. Chama-se a atenção para o fato de que ao não rejeitar a hipótese nula, não se encontram evidências de que não há presença de raiz unitária, sendo mais plausível considerar a sua presença, o que conduz a um processo estocástico não estacionário.

Na equação (2.2) há a presença de uma constante, então inicialmente testam-se as hipóteses de que o processo estacionário possui média (µ) igual ou diferente zero, para, posteriormente, avaliar a estacionariedade da série como um todo. Na equação (2.3) além da constante, há ainda o parâmetro relacionado à tendência β, então testa-se, inicialmente, se este parâmetro é ou não nulo. Em seguida, se a hipótese nula (β = 0) for rejeitada, avalia-se a estacionariedade que poderá identificar um processo estocástico com tendência estacionária. Neste último caso, a presença de constante também deve ser avaliada.

Na modelagem do processo representado em (2.1), assumindo que y 0 = 0 e que u tN(0, σ 2), a significância da estimativa de ϕ obtida pelo método dos mínimos quadrados ordinários poderia ser testada comparando-a à estatística t=ϕ^-μϕ^/EPϕ^, proveniente de uma distribuição t de Student 1717 P.A. Morettin & C.M.C. Toloi. “Análise de Séries Temporais”. Blucher (2018).. Entretanto,a na análise de raízes unitárias, a distribuição normal não se aplica e, logo, a distribuição t de Student não pode ser utilizada para a realização do teste. Neste caso, pode-se utilizar a estatística τ na avaliação 77 I. Choi. “Almost all about unit roots: Foundations, Developments, and Applications”. Cambridge University Press (2015).), (99 D.A. Dickey & W.A. Fuller. Likelihood ratio statistics for autoregressive time series with a unit root. Econometrica, 49(4) (1981), 1057-1072.), (1616 P.A. Morettin. “Econometria Financeira: um Curso em Séries temporais Financeiras”. Blucher (2011)., cuja distribuição assintótica é representada por

Q ϕ ^ - 1 = 0 1 W r d W r 0 1 W 2 r d r = τ ^ ,

independentemente da distribuição de {u t }, em que {W(r), 0 ≤ r ≤ 1} é definido como um processo contínuo (um movimento Browniano padrão), tal que: i) W(0) = 0; ii) as variáveis aleatórias W(r k ) − W(r k−1 ) são independentes e {W(s) − W(r)} ∼ N(0; sr); iii) W(s) − W(t) e W(s + r) −W(t + r) tem a mesma distribuição para s, t e r assumindo valores no intervalo [0; 1]; iv) W(r) ∼ N(0; r), ∀ 0 ≤ r ≤ 1; e v) as trajetórias de W(r) são contínuas com probabilidade igual a um.

Ainda, na realização do teste ADF 99 D.A. Dickey & W.A. Fuller. Likelihood ratio statistics for autoregressive time series with a unit root. Econometrica, 49(4) (1981), 1057-1072., é usual trabalhar com o operador diferença ∆, isto é, podemos reescrever a equação (2.1) como

y t - y t - 1 = ϕ y t - 1 + u t , Δ y t = ϕ - 1 y t - 1 + u t , Δ y t = δ y t - 1 + u t .

Neste caso, δ = ϕ − 1 e as hipóteses testadas se transformam em H 0: δ = 0 e H 1: δ ≠ 0. Se δ = 0, então ϕ = 1, o que indica a presença de raiz unitária.A estatística do teste é dada por τ^=δ^/EPδ^, sendo o erro padrão e o estimador da variância do erro determinados por

E P δ ^ = s t = 1 T y t - 1 2 e s 2 = t = 2 T Δ y t - δ ^ y t - 1 2 T - 2 ,

respectivamente, sendo s, o desvio padrão.

Alguns valores críticos desta estatística de teste associados a determinadas probabilidades de ocorrência, que representam possíveis níveis de significância, foram determinados por simulações de Monte Carlo. As estatísticas t e τ diferem em probabilidade no infinito 77 I. Choi. “Almost all about unit roots: Foundations, Developments, and Applications”. Cambridge University Press (2015)., ao passo que a estatística τ torna o teste mais poderoso, embora seu poder diminua a medida que forem acrescentados mais termos ao polinômio que descreve o processo estocástico 77 I. Choi. “Almost all about unit roots: Foundations, Developments, and Applications”. Cambridge University Press (2015).),(88 D.A. Dickey & W.A. Fuller. Distribution of the estimators for autoregressive time series with unit root. Journal of the American Statistical Association, 74(366) (1979), 427-431.. O procedimento supracitado pode ser usado para modelos AR(1) com constante, assim como também para modelos com constante e tendência.

O teste ADF (observe o fluxograma na Figura 1), entretanto, é sensível à quantidade de defasagens considerada (k), sendo este valor inversamente proporcional ao seu poder 33 E. Aylar, S. Smeekes & J. Westerlund. Lag truncation and the local asymptotic distribution of the ADF test for a unit root. Statistical Papers, 60 (2019), 2109-2118.. Na prática, utiliza-se um processo iterativo, partindo de uma defasagem máxima (k máx) até encontrar uma ótima (k ótimo) 1919 S. Ng & P. Perron. Unit root tests in ARMA models with data-dependent methods for the selection of the truncation lag. Journal of the American Statistical Association, 90(429) (1995), 268-281.. Isto é, inicialmente, indica-se uma defasagem máxima, que deve ser previamente indicada, como, por exemplo, kmáx=int12T1001/4 2424 G.W. Schwert. Tests for unit roots: a Monte Carlo investigation. Journal of Business & Economic Statistics, 7(2) (1989), 147-159. ou kmáx=int4T1002/9 1313 R.J. Hyndman & G. Athanasopoulos. Forecasting: principles and practice (2020). URL http://otexts.com/fpp2/.
http://otexts.com/fpp2/...
. Em etapa posterior, ocorre o ajuste de sucessivos modelos, até que se obtenha uma defasagem ótima 1313 R.J. Hyndman & G. Athanasopoulos. Forecasting: principles and practice (2020). URL http://otexts.com/fpp2/.
http://otexts.com/fpp2/...
), (2424 G.W. Schwert. Tests for unit roots: a Monte Carlo investigation. Journal of Business & Economic Statistics, 7(2) (1989), 147-159.. Tal defasagem pode ser selecionada, por exemplo, por meio de critérios de qualidade de ajuste, tais como o critério de informação de Akaike (AIC) 11 H. Akaike. A new look at the statistical model identification. IEEE Transactions on Automatic Control, 19(6) (1974), 716-723., o critério de informação bayesiano (BIC) 2323 G. Schwarz. Estimating the Dimension of a Model. Annals of Statistics, 6(2) (1978), 461-464. ou o critério de informação de Hannan-Quinn (HQIC) 1212 E.J. Hannan & B.G. Quinn. The determination of the order of an autoregression. Journal of the Royal Statistical Society: Series B (Methodological), 41(2) (1979), 190-195.. Entretanto, não existe um real consenso sobre a utilização de tais critérios, uma vez que, por exemplo, eles tendem a identificar um valor muito pequeno de defasagens se a série apresentar valor inicial muito grande e/ou presença de quebra estrutural na tendência 1111 H. Ferrer-Pérez, M.I. Ayuda & A. Aznar. The sensitivity of unit root tests to the initial condition and to the lag length selection: A Monte Carlo Simulation Study. Communications in Statistics Simulation and Computation, (2019). doi:10.1080/03610918.2019.1577967.
https://doi.org/10.1080/03610918.2019.15...
. Todavia, a quantidade selecionada de defasagens por meio de tais critérios apresentam melhor desempenho quando comparados ao teste t66 G. Cavaliere, P.C.B. Phillips, S. Smeekes & A.M.R. Taylor. Lag Length Selection for Unit Root Tests in the Presence of Nonstationary Volatility. Econometric Reviews, 34(4) (2015), 512-536..

Figura 1:
Dinâmica de aplicação do teste de raiz unitária ADF. Nota: 1. o número máximo de defasagens deve ser determinado por algum critério; 2. o número ótimo de defasagens pode ser determinado pelo teste t ou pelos critérios de informação; 3. ao rejeitar a hipótese nula, assumese estacionariedade.

3 METODOLOGIA

O presente estudo foi realizado seguindo a metodologia de simulações de Monte Carlo, sendo seus resultados analisados pela metodologia de análise de experimentos. Na simulação os dados foram gerados de acordo com os modelos AR(1), descritos pelas equações (2.1), (2.2) e (2.3), considerando u tN(0, 1), t = 1, . . . , T , β 0 = 10 e β 1 = 1, 0. Foram geradas 1.000 séries de amplitudes 30, 50 e 100 para cada um dos três modelos, sendo testada a H 0: ϕ = 1 (equivalente à H 0: δ = 0), ao nível de 5% de significância, a partir da estatística de teste τ, para todos os valores de defasagem pertencentes ao intervalo [0, k máx + 2], em que kmáx=int12T1001/4 2424 G.W. Schwert. Tests for unit roots: a Monte Carlo investigation. Journal of Business & Economic Statistics, 7(2) (1989), 147-159.. Os valores obtidos para a defagem máxima foram 8, 10 e 12, para as séries de amplitudes 30, 50 e 100, respectivamente.

No primeiro cenário foi considerado ϕ = 1, representando a presença de raiz unitária. Logo, nas testagens espera-se que o teste rejeite a hipótese de nulidade em, no máximo, 5% dos casos. Foram considerados três experimentos de acordo com a amplitude das séries com um fator, componentes do modelo, ensaiado em três diferentes níveis: modelo com constante e tendência (CT), modelo só com constante (C), modelo sem constante nem tendência (N). As defasagens foram consideradas como blocos, sendo computada, para cada condição experimental, a proporção de casos p^ em que a hipótese nula foi rejeitada.

Vale ressaltar que proporções entre zero e um podem se afastar muito de uma distribuição normal, o que não seria desejável, principalmente se os valores pertencerem aos intervalos [0; 0, 3] ou [0; 7; 1] 2626 J.H. Zar. “Biostatistical Analysis”. Pearson (1999).. Se a p^ for transformada em arc sen p^, a variância se estabiliza e os resultados tendem a apresentar uma distribuição bastante próxima da normal, razão pela qual foi utilizada esta transformação matemática. Para analisar o efeito de cada fator nas proporções transformadas foi realizada uma análise de variância, que faz uso da estatística F, determinada a partir da estimativa da variância do erro. Não obstante, a transformação matemática utilizada estabiliza a variância do erro em 1/(4N), sendo N a quantidade de simulações. Logo, uma vez adotado N = 1.000, é possível considerar a variância do erro conhecida é igual a 0, 00025 e, sendo conhecida, a significância do resultado pode ser avaliada por meio da estatística de teste χ2=SQfonte de variaçãoσerro2, que apresenta distribuição qui-quadrado com glfonte de variação graus de liberdade.

Posteriormente, outros cenários são considerados para diferentes valores de ϕ < 1, gerando séries com ausência de raiz unitária, sendo esta característica considerada como um outro fator ensaiado em três níveis (0,95; 0,75; 0,55).

Os procedimentos descritos foram todos realizados com o auxílio do software R 2222 R Core Team. R: a language and environment for statistical computing (2020). URL http://Rproject.org/.
http://Rproject.org/...
, utilizando, principalmente, os pacotes forecast 1414 R.J. Hyndman & Y. Khandakar. Automatic time series forecasting: the forecast package for R. Journal of Statistical Software, 26(3) (2008), 1-22., urca 2121 B. Pfaff. “Analysis of Integrated and Cointegrated Time Series with R”. Springer (2008)., lmtest 2727 A. Zeileis & T. Hothorn. Diagnostic Checking in Regression Relationships. R News, 2(3) (2002), 7-10. e agricolae 1515 F. Mendiburu & M. Yaseen. “agricolae: Statistical Procedures for Agricultural Research” (2020). R package version 1.4.0..

4 RESULTADOS E DISCUSSÕES

4.1 Cenário 1: ϕ = 1

Neste contexto espera-se que a proporção de rejeições da hipótese nula seja baixa. Como o nível de significância considerado foi 0,05, esta proporção deve ser de, no máximo, 5%, o que parece acontecer para a maioria dos casos. As medidas resumo obtidas a partir das séries geradas são apresentadas na Tabela 1, onde é possível constatar que, como esperado, para cada estrutura considerada o valor-p tende a diminuir com o aumento da amplitude da série. Comportamento um pouco diferenciado foi apresentado pelas séries com T = 100, sem constante e sem tendência, estrutura que, na prática, dificilmente acontece.

Tabela 1:
Média (e desvio padrão) da proporção de casos em que a hipótese nula é rejeitada, no primeiro cenário com simulações considerando ∅ = 1.

A Figura 2 apresenta a distribuição dos resultados das proporções de casos em que H 0 é rejeitada obtidas a partir de séries com diferentes amplitudes e com diferentes estruturas. Os gráficos sugerem que a proporção parece diminuir à medida que a amplitude da série aumenta, existindo uma aparente estabilidade de sua tendência central em relação ao número de defasagens. O mesmo acontece em relação à sua estrutura, evidenciando a superioridade dos resultados obtidos em estruturas com menos componentes (sem constante e sem tendência), principalmente para T = 100.

Figura 2:
Gráficos de caixa de acordo com a quantidade de defasagens e componentes do modelo no primeiro cenário com simulações considerando ϕ = 1.

A Tabela 2 apresenta os resultados obtidos a partir da análise de variância. Considerando nível de significância de 0,05, não foram encontradas evidências de que a quantidade de defasagens interfere na proporção de casos em que H 0 é rejeitada em séries menos amplas T = 30 e T = 50, o mesmo não acontecendo quando esta amplitude foi aumentada T = 100, embora o valorp tenha ficado muito próximo do nível de significância adotado. Também foram encontradas evidências de que a estrutura do modelo interfere na proporção de casos em que a hipótese nula é rejeitada, sendo aqueles que não tem constante nem tendência os que mais ultrapassaram 5%. Ainda, modelos sem constante e sem tendência são os que mais se afastam deste limite, sendo este fato mais evidente em séries mais longas.

Tabela 2:
Resultados da análise de variância no primeiro cenário com simulações considerando ϕ = 1.

4.2 Cenário 2: ϕ < 1

Neste contexto, diferentemente do anterior, espera-se que a proporção de rejeições da hipótese nula seja elevada, pois as séries geradas não apresentam raiz unitária, caracterizando-se como estacionárias. As medidas resumo das proporções encontradas para as séries geradas são apresentadas na Tabela 3, onde é possível constatar que, para cada estrutura considerada, a proporção de rejeições da H 0 tende a aumentar com o aumento da amplitude da série, com a diminuição do coeficiente e com a simplificação da estrutura utilizada em sua geração.

Tabela 3:
Média (e desvio padrão) da proporção de casos em que a hipótese nula é rejeitada, no segundo cenário com simulações considerando ϕ < 1.

Os gráficos da Figura 3 apresentam a distribuição dos resultados referentes às proporções obtidas no que tange a rejeição da hipótese nula em séries de diferentes amplitudes, para diferentes defasagens, diferentes estruturas e diferentes intensidades de ϕ . Nestes gráficos, observa-se que esta proporção diminui à medida que aumenta o número de defasagens, o que ocorre mais rapidamente em séries de menor amplitude. Esta proporção tende a ser maior em séries de estrutura mais simples, sendo esta diferença mais evidente em séries de menor amplitude, e menor em séries geradas com ϕ próximos da unidade. Esta diferença se acentua em séries de maior amplitude.

Figura 3:
Gráficos de caixa de acordo com a quantidade de defasagens e componentes do modelo no segundo cenário com simulações considerando ϕ < 1.

A Tabela 4 apresenta os resultados obtidos na análise de variância, mostrando que para as três amplitudes foram encontradas evidências de que a quantidade de defasagens, a estrutura do modelo e a intensidade do coeficiente interferem na proporção de casos em que a hipótese nula é rejeitada, concordando com a análise gráfica. Ademais, existem evidências de interação entre quantidade de componentes e defasagens e entre intensidade do coeficiente φ e defasagens, representadas na Figura 4.

Tabela 4:
Resultados da análise de variância no primeiro cenário com simulações considerando ϕ = 1.

Figura 4:
Representação da proporção de casos em que a hipótese nula é rejeitada e as interações entre as defasagens e: (a), (b), (c) número de componentes (com constante; ambos - com constante e tendência; nenhum - sem constante, nem tendência); (d), (e), (f) intensidade de ϕ.

No que se refere à interação entre o número de componentes e de defasagens, os dados representados nos gráficos das Figuras 4 (a)-(c) mostram que valores mais elevados da proporção de rejeições da hipótese nula são encontrados para modelos sem constante e nem tendência. Estes valores são bastante próximos para os dois outros tipos de estrutura do modelo, tornando-se iguais a partir da sétima e oitava defasagem em séries de amplitude 30 e 50, respectivamente, e a partir da terceira defasagem em séries de amplitude 100.

Ainda, no que se refere à interação entre o número de defasagens e a magnitude do parâmetro ϕ, os dados representados nos gráficos das Figuras 4 (d)-(f) mostram que valores mais elevados da proporção de rejeições de H 0 são encontrados para coeficientes de menor intensidade, sendo esta diferença maior para menores defasagens. Entretanto, como a diminuição destes valores é mais acentuada para menores valores deste coeficiente, estas proporções se igualam a partir da oitava defasagem em séries de amplitude 30, valor da defasagem máxima (k máx), obtido pelo critério de Schwert 2424 G.W. Schwert. Tests for unit roots: a Monte Carlo investigation. Journal of Business & Economic Statistics, 7(2) (1989), 147-159., e a partir da 12a defasagem em séries de amplitude 50, duas unidades acima do k máx. Nas séries de amplitude 100, estes valores se aproximariam para resultados acima de k máx + 2.

Não obstante, os resultados obtidos ao relação ao parâmetro ϕ, estão de acordo com os encontrados em 22 M. Arltová & D. Fedorová. Selection of unit root test on the basis of length of time series and value of AR(1) parameter. Statistika: Statistics and Economy Journal, 96(3) (2016), 47-64., em que, para séries com 50 observações, o poder do teste é muito baixo para ϕ > 0,5 , enquanto que para séries de 100 observações o poder do teste decresce rapidamente quando ϕ > 0,8. Além disso, como pode-se observar, para pequenas amostras, o poder do teste decresce com o aumento do número de defasagens selecionado, corroborando assim com 33 E. Aylar, S. Smeekes & J. Westerlund. Lag truncation and the local asymptotic distribution of the ADF test for a unit root. Statistical Papers, 60 (2019), 2109-2118.), (2020 E. Paparoditis & D.N. Politis. The asymptotic size and power of the augmented Dickey-Fuller test for a unit root. Econometric Reviews, 37(9) (2018), 955-973..

Em relação aos termos determinísticos, em 2525 A.M.R. Taylor. The Finite Sample Effects of Deterministic Variables on Conventional Methods of Lag-selection in Unit Root Tests. Oxford Bulletin of Economics and Statistics, 62(2) (2000), 293-304., para o caso do teste em que há a inclusão de tendência linear os resultados indicam que há um aumento na probabilidade de rejeitar a hipótese nula quando esta é verdadeira, associando isso ao fato de que a inclusão da tendência leva a subestimar o número de defasagens a serem incluídas na regressão do teste ADF. Estes achados não estão de acordo com o que foi encontrado neste trabalho, uma vez que aqui os indícios mostram que a inclusão de termos determinísticos reduz ligeiramente a proporção de rejeição da hipótese nula na presença da raiz unitária. Entretanto, cabe salientar que os dados estudados em 2525 A.M.R. Taylor. The Finite Sample Effects of Deterministic Variables on Conventional Methods of Lag-selection in Unit Root Tests. Oxford Bulletin of Economics and Statistics, 62(2) (2000), 293-304. seguiam um processo ARIMA, diferentemente dos dados deste trabalho.

5 CONSIDERAÇÕES FINAIS

Este estudo apresenta os resultados de algumas simulações realizadas com o objetivo de avaliar a relação entre o valor-p, determinado a partir da estatística τ encontrada na aplicação do teste de Dickey-Fuller aumentado (ADF), e a quantidade de defasagens utilizada no respectivo cálculo, considerando modelos com diferentes estruturas no que se refere a componentes e intensidade do coeficiente ϕ, fundamentando-se na proporção de rejeições da hipótese de nulidade, utilizando-se um nível de 5% de significância.

Os resultados obtidos mostraram que, se a série temporal possui raiz unitária, a quantidade de defasagens pouco interfere no resultado, independentemente da estrutura do modelo. Entretanto, se a série temporal não possui raiz unitária, a quantidade de defasagens interfere no resultado desta proporção, e consequentemente no valor-p, diminuindo com o aumento do número de defasagens, o que indica uma diminuição do poder do teste. Menores proporções são encontradas em modelos com constante e tendência, assim como também em modelos com coeficiente ϕ próximo de 1,0.

Para trabalhos futuros, outras simulações podem ser realizadas com o objetivo de avaliar o desempenho das técnicas utilizadas na determinação da defasagem máxima e da defasagem ótima a serem utilizadas no teste ADF, empregado na identificação de raiz unitária em uma série temporal.

REFERÊNCIAS

  • 1
    H. Akaike. A new look at the statistical model identification. IEEE Transactions on Automatic Control, 19(6) (1974), 716-723.
  • 2
    M. Arltová & D. Fedorová. Selection of unit root test on the basis of length of time series and value of AR(1) parameter. Statistika: Statistics and Economy Journal, 96(3) (2016), 47-64.
  • 3
    E. Aylar, S. Smeekes & J. Westerlund. Lag truncation and the local asymptotic distribution of the ADF test for a unit root. Statistical Papers, 60 (2019), 2109-2118.
  • 4
    G.E.P. Box, G.M. Jenkins & G.C. Reinsel. “Time Series Analysis: Forecasting and Control”. Wiley (2015).
  • 5
    M. Caner & L. Kilian. Size distortions of tests of the null hypothesis of stationarity: evidence and implications for the PPP debate. Journal of International Money and Finance, 20(5) (2001), 639-657.
  • 6
    G. Cavaliere, P.C.B. Phillips, S. Smeekes & A.M.R. Taylor. Lag Length Selection for Unit Root Tests in the Presence of Nonstationary Volatility. Econometric Reviews, 34(4) (2015), 512-536.
  • 7
    I. Choi. “Almost all about unit roots: Foundations, Developments, and Applications”. Cambridge University Press (2015).
  • 8
    D.A. Dickey & W.A. Fuller. Distribution of the estimators for autoregressive time series with unit root. Journal of the American Statistical Association, 74(366) (1979), 427-431.
  • 9
    D.A. Dickey & W.A. Fuller. Likelihood ratio statistics for autoregressive time series with a unit root. Econometrica, 49(4) (1981), 1057-1072.
  • 10
    R.F. Engle & C.W.J. Granger. Co-integration and error correction: representation, estimation, and testing. Econometrica, 55(2) (1987), 251-276.
  • 11
    H. Ferrer-Pérez, M.I. Ayuda & A. Aznar. The sensitivity of unit root tests to the initial condition and to the lag length selection: A Monte Carlo Simulation Study. Communications in Statistics Simulation and Computation, (2019). doi:10.1080/03610918.2019.1577967.
    » https://doi.org/10.1080/03610918.2019.1577967
  • 12
    E.J. Hannan & B.G. Quinn. The determination of the order of an autoregression. Journal of the Royal Statistical Society: Series B (Methodological), 41(2) (1979), 190-195.
  • 13
    R.J. Hyndman & G. Athanasopoulos. Forecasting: principles and practice (2020). URL http://otexts.com/fpp2/
    » http://otexts.com/fpp2/
  • 14
    R.J. Hyndman & Y. Khandakar. Automatic time series forecasting: the forecast package for R. Journal of Statistical Software, 26(3) (2008), 1-22.
  • 15
    F. Mendiburu & M. Yaseen. “agricolae: Statistical Procedures for Agricultural Research” (2020). R package version 1.4.0.
  • 16
    P.A. Morettin. “Econometria Financeira: um Curso em Séries temporais Financeiras”. Blucher (2011).
  • 17
    P.A. Morettin & C.M.C. Toloi. “Análise de Séries Temporais”. Blucher (2018).
  • 18
    C.R. Nelson & C.R. Plosser. Trends and random walks in macroeconomic time series: some evidence and implications. Journal of Monetary Economics, 10(2) (1982), 139-162.
  • 19
    S. Ng & P. Perron. Unit root tests in ARMA models with data-dependent methods for the selection of the truncation lag. Journal of the American Statistical Association, 90(429) (1995), 268-281.
  • 20
    E. Paparoditis & D.N. Politis. The asymptotic size and power of the augmented Dickey-Fuller test for a unit root. Econometric Reviews, 37(9) (2018), 955-973.
  • 21
    B. Pfaff. “Analysis of Integrated and Cointegrated Time Series with R”. Springer (2008).
  • 22
    R Core Team. R: a language and environment for statistical computing (2020). URL http://Rproject.org/
    » http://Rproject.org/
  • 23
    G. Schwarz. Estimating the Dimension of a Model. Annals of Statistics, 6(2) (1978), 461-464.
  • 24
    G.W. Schwert. Tests for unit roots: a Monte Carlo investigation. Journal of Business & Economic Statistics, 7(2) (1989), 147-159.
  • 25
    A.M.R. Taylor. The Finite Sample Effects of Deterministic Variables on Conventional Methods of Lag-selection in Unit Root Tests. Oxford Bulletin of Economics and Statistics, 62(2) (2000), 293-304.
  • 26
    J.H. Zar. “Biostatistical Analysis”. Pearson (1999).
  • 27
    A. Zeileis & T. Hothorn. Diagnostic Checking in Regression Relationships. R News, 2(3) (2002), 7-10.

Datas de Publicação

  • Publicação nesta coleção
    27 Jun 2022
  • Data do Fascículo
    May-Aug 2022

Histórico

  • Recebido
    28 Jun 2021
  • Aceito
    18 Out 2021
Sociedade Brasileira de Matemática Aplicada e Computacional - SBMAC Rua Maestro João Seppe, nº. 900, 16º. andar - Sala 163, Cep: 13561-120 - SP / São Carlos - Brasil, +55 (16) 3412-9752 - São Carlos - SP - Brazil
E-mail: sbmac@sbmac.org.br