Acessibilidade / Reportar erro

Uma comparação entre análise de variância e análise de regressão aplicadas ao mercado de ações

COMENTÁRIOS

Uma comparação entre análise de variância e análise de regressão aplicadas ao mercado de ações

Denisard C. de Oliveira Alves

Professor do Departamento de Economia e do Instituto de Pesquisas Econômicas da USP

1. INTRODUÇÃO

O objetivo deste trabalho é a comparação de duas técnicas econométricas para estudar sua utilidade na análise do mercado de ações. Com o desenvolvimento do mercado de ações surgiu a necessidade de elaboração de indicadores técnicos de análise e previsão do comportamento do mercado a fim de orientar os investidores na formação de seus portfolios. No final de 1970, as principais bolsas do país passaram a divulgar uma série de índices, com base em dados colhidos dos balanços das empresas e dos pregões diários.

Com o objetivo de testar a validade desses índices, Figueiredo,1 1 Figueiredo, Orlando. Da relevância da análise técnica de ações. Revista de Administração de Empresas, Rio de Janeiro, jan./fev. 1974. realizou uma análise estatística de dois períodos distintos, de 12 meses, caracterizados como um período de alta no mercado (agosto de 1970 a julho de 1971) e um período de baixa (junho de 1971 a maio de 1972). Figueiredo usou a técnica estatística de análise de variância. Neste trabalho nós iremos refazer o trabalho de Figueiredo com base nos mesmos dados por ele utilizados,2 2 Os dados utilizados por Figueiredo referem-se à bolsa de São Paulo e foram extraídos da Revista da Bolsa de Valores de São Paulo. mas usando análise de regressão ao invés de análise de variância. Na primeira parte deste trabalho o modelo de análise adotado por Figueiredo é sucintamente explicado. Na segunda parte é feita uma comparação entre a técnica utilizada por Figueiredo e a técnica de análise de regressão. Finalmente, na última parte, os resultados das duas técnicas são analisados e as conclusões do trabalho são apresentadas.

2. O MODELO DE ANALISE ADOTADO POR FIGUEIREDO

2.1 Procedimento

Para cada um dos períodos analisados ele adotou o seguinte procedimento:

2.1.1 Sete grupos, de 10 ações cada um, foram selecionados no início de cada período de análise.

Estes grupos foram separados da seguinte forma:

a) seis grupos utilizando seis diferentes índices técnicos, conforme será explicado a seguir;

b) Um grupo de escolha inteiramente aleatória.

2.1.2 Ao fim de cada período, foi computada a lucratividade (período de alta) ou perda (período de baixa) para cada um dos sete grupos selecionados. A lucratividade ou perda foi medida como uma percentagem do preço de aquisição da ação no início de cada período.

2.1.3 Com base nos dados apresentados, foi realizada uma análise de variância para verificar se as médias de lucratividade ou de perda, de cada um dos grupos selecionados, apresentavam diferenças significativas ou não.

2.2 índices utilizados (período de alta)

Para o período de alta (agosto de 1970 a julho de 1971), foram utilizados os seguintes índices técnicos (as amostras correspondentes são apresentadas no anexo 1 do trabalho de Figueiredo).

Grupo A: Ações de empresas com maior valor patrimonial por ação

O valor patrimonial é obtido dividindo-se a soma do capital e das reservas livres pelo número de ações da empresa.

Grupo B: Ações de maior índice preço/lucro (P/L)

O índice preço/lucro representa a divisão do preço da ação na época da análise (agosto de 1970) pelo lucro por ação do último exercício.

Grupo C: Ações de menor índice preço/lucro

Grupo D: Ações de maior negociabilidade nos últimos 12 meses

A negociabilidade é medida pela freqüência com que a ação é transacionada nos pregões da bolsa.

Grupo E: Ações que apresentavam maior quociente:

Este índice composto é obtido da seguinte forma:

VP = , onde A é patrimônio da empresa e N é o número de ações.

P/L = , onde P é o preço da ação, L o lucro por ação e N o número de ações.

Como se deve observar, quanto maior o patrimônio e o lucro da empresa e quanto menor o número de ações e o preço, tanto melhor seria a ação, do ponto de vista deste índice.

Grupo F: Ações que apresentaram maior quociente:

Este é o outro índice de composto obtido acrescentando-se ao anterior (grupo E) o índice de negociabilidade. Se chamamos C ao índice de negociabilidade, teremos a seguinte expressão para o índice:

Grupo G: Ações selecionadas aleatoriamente

Essas 10 ações foram selecionadas inteiramente ao acaso, utilizando-se uma tabela de números aleatórios.

Em resumo, os resultados obtidos para cada uma das sete amostras são os seguintes:

2.3 índices utilizados (período de baixa)

Para o período de baixa (junho de 1971-maio de 1972), foram utilizados os mesmos índices do período de alta, com exceção do índice relativo ao Grupo F, que deu lugar a um novo índice, apresentado regularmente na Revista da Bolsa de Valores de São Paulo, com o nome de índice de giro. Este índice mostra a participação percentual de um determinado tipo de ação relativamente ao total de ações do mesmo tipo, de uma empresa.

Assim:

Giro =

A decisão de trocar o índice F no segundo período decorreu das seguintes observações:

a) o índice

é, num certo sentido, redundante, pois se acha representado nos demais índices;

b) o índice de giro só surgiu em 1971 e foi considerada convenientemente sua utilização, pois se tratava de uma nova variável de análise;

c) a manutenção de sete grupos de índices era conveniente do ponto de vista de computação, pois o mesmo programa poderia ser utilizado nos dois casos.

As seguintes perdas médias foram observadas no período de baixa, em cada uma das amostras de 10 ações (as ações componentes de cada uma das amostras são apresentadas no anexo 2).

2.4 Análise de variância

Através do modelo de análise de variância Figueiredo testou a seguinte hipótese nula:

H0 : α1 = α2 = ... = αG = 0

onde αg (g = 1, 2,..., G) é o desvio da média de lucratividade do g-ésimo grupo relativamente à média global de lucratividade, µ.

H1 : H0 não é verdadeira, ou seja, essa hipótese implica que pelo menos duas das médias, em cada período de análise, não são iguais.3 3 A formulação das hipóteses H 0 e H 1 é, em termos de notação, diferente da de Figueiredo, ou seja, a sua hipótese nula tem a seguinte formulação: H0 = µ1 = µ2 = µ3 = ... = µG ( g = 1, 2, ..., G), e µg é a média de lucratividade do g-ésimo grupo de ações. A nossa hipótese nula é a mesma de Figueiredo, a diferença é apenas decorrente de diferenças na formulação do modelo de análise de variância. A nossa formulação do modelo é tal que permite uma comparação mais direta com o modelo de análise de regressão. Isso ficará claro no item 3 deste trabalho.

3. COMPARAÇÃO ENTRE ANÁLISE DE VARIÂNCIA E ANÁLISE DE REGRESSÃO

Modelos de análise de variância podem ser formulados em termos de análise de regressão pela utilização do método de variáveis auxiliares ou dummies. Os dois enfoques são equivalentes, ou seja, eles descrevem o mesmo fenômeno e levam aos mesmos resultados em termos de teste de hipóteses. Isto pode ser comprovado formalmente. Seja uma variável aleatória Y normalmente distribuída, cuja média dependa de um grupo de características que se reflete em uma classificação de Y em 6 grupos. A variância de Y em cada grupo é suposta constante, e as observações são supostas independentes. No modelo de análise de variância nós dividimos todos os valores observados de Y em 6 grupos, de acordo com características dadas, e formulamos o modelo como:

a) Ygt = µ + αg + αgt, (t = 1, ... , ng; g = 1, 2, ..., G),

onde Ygt é a t-ésima observação de Y no g-ésimo grupo, µ é a média global de Y, g é o desvio da média do g-ésimo grupo relativamente a µ, e gt é o termo aleatório.

b) αg = 0

Vamos agora comparar o modelo de análise de variância com o modelo de análise de regressão correspondente:

c) Ygt = β1 + β2 X2t + β3X3t + ... + BGXGt + gt

onde Xgt é uma variável dummy que assume o valor 1 se a observação de Y pertence ao g-ésimo grupo; e assume o valor zero caso contrário; (g = 2,3, ... , G).

O modelo (c) é o modelo de análise de regressão com variáveis explicativas qualitativas. β1 é a E (Y/X2t = 0, X3t = 0,..., XGt = 0) ou seja, β1 é a média populacional do grupo 1 e X1t é a variável que está na base.4 4 Essa formulação permite contornar o problema de indeterminação do sistema de equações normais de mínimos quadrados no cálculo dos valores estimados dos β's.

Para demonstrar a equivalência dos dois modelos representados pelas equações (a) e (c) vamos especificar os coeficientes de (c) em termos dos parâmetros de (a) e vice-versa. Na tabela 3 formulamos os dois modelos para cada grupo separadamente.

Ou seja,

Somando-se essas G equações temos:

A hipótese a ser testada pelo modelo de análise de variância é que não existe diferença entre as médias de Y nos G grupos; isto é,

H0 : α1 = α2 = ... = αG = 0

H1 : H0 não é verdadeira

É fácil verificar, a partir das equações (g) a (j), que essa hipótese nula é exatamente equivalente à hipótese de que as declividades do modelo de regressão (a) são conjuntamente iguais a zero, ou seja,

H0 : β2 = β3 = ... = βG = 0

H1 : H0 não é verdadeira

Como é sabido, para testar H0 no modelo de análise de regressão utiliza-se o teste de F5 5 Veja Johnston, J. Econometric methods. McGraw-Hill. 1972. p. 142. . Esse teste é exatamente equivalente ao teste de F do modelo de análise de variância dos livros-textos de estatística.6 6 Veja Freund. J. E. Mathematical statistics. Prentice-Hall, 1962. p. 335 fórmula (14.2.5). Por outro lado, no modelo de regressão é possível testar a hipótese de que qualquer um dos β's seja individualmente nulo através do teste de t, enquanto que no modelo de análise de variância isso não é possível. Evidentemente, seria possível comparar as médias duas a duas, através do teste t.

4. RESULTADOS E CONCLUSÕES

4.1 Resultados da análise de regressão para o período de alta

Como foi discutido no item 3 as variáveis independentes são variáveis dummies representando cada um dos seis grupos de índices técnicos; o grupo que está na base é o grupo de firmas com maior VP, ou seja, o valor estimado da lucratividade de média das ações com maior VP é 280,210, que é a estimativa do coeficiente β1 na equação (c) com G = 7. Vejamos agora o significado dos demais coeficientes estimados da equação (c) apresentados na tabela 4. Nós sabemos que:

E (Y2t/X1 = 0; X2 = 1; X3 = 0; X4 = 0; X5 = 0; X6= 0; X7= 0) = β1 + β2,

ou seja,

1
2 , é a estimativa da média populacional da lucratividade de ações do grupo 2. Portanto:

E (Y2t) = 280,210 + 74,610 = 384,820, que é exatamente igual à média da lucratividade do grupo. A interpretação dos demais coeficientes estimados é exatamente equivalente, ou seja, as estimativas dos coeficientes das variáveis apresentadas na tabela 4 são os desvios das médias da variável dependente em cada grupo em relação ao grupo que está na base.

Pelos testes de t ao nível de significância de 1%, nós aceitamos todas as hipóteses nulas, dos seguintes tipos:

H0: βg = 0, (g = 2, ... , 7), ou seja, em nenhum grupo existe um desvio significante da média da variável dependente com relação à média do grupo que está na base. Por outro lado o teste de F testa a seguinte hipótese conjunta:

H0: β2 = β3 = β4 = β5 = β6 = β7= 0; G = 7

H1 : H0 não é verdadeira

Esse teste, como foi visto no item 3, é exatamente equivalente ao teste de F na análise de variância, e deveria apresentar os mesmos resultados de análise feita por Figueiredo, ou seja, a menos de aproximação em casas decimais, o teste de F da análise de variância realizada por Figueiredo deveria ser igual ao valor de F calculado pela análise de regressão apresentado na tabela 4. O F calculado na tabela 4 é 0,591736, ou seja, é menor do que F(6,63), com nível de significância de 1%, que é de 3,118; levando à aceitação de H0, ou seja, não existe diferenças significativas entre as lucratividades médias dos 7 grupos de ações. Tal conclusão é perfeitamente consistente com aquela de Figueiredo, embora ele tenha utilizado outro método para chegar a ela. Mas, um fato curioso ocorre; o F calculado por Figueiredo, a partir da análise de variância, apresenta o valor 1,45, e esse valor é bem diferente do valor por nós encontrado na análise de regressão. Talvez essa discrepância possa ser uma decorrência de erros de cálculo ou de aproximações, embora nos pareça um tanto exagerada.

4.2 Resultados da análise de regressão para o período de baixa

É interessante verificar que os resultados da tabela 5 são completamente diferentes daqueles obtidos por Figueiredo e levam a conclusões diametralmente opostas. Nesse caso, não é possível apelar para erros de aproximação como forma de explicação dos resultados divergentes. Figueiredo reporta um teste de F cujo valor é 6,84, o que o leva a reajeitar H0 e concluir que: em períodos de baixa, aparentemente, a análise técnica permite reduzir a perda com a utilização adequada dos índices técnicos.7 7 Figueiredo, O. op. cit. p. 116.

Pelo teste de F da análise de regressão apresentado na tabela 5, nós aceitamos H0 e concluímos que também em períodos de baixa, a análise técnica não permite reduzir as perdas pela utilização adequada dos indicadores analisados por Figueiredo.

Em resumo, existe uma divergência de resultados que não pode ser explicada apenas por erros de aproximação. Por outro lado, dada a divergência de resultados entre a análise de variância de Figueiredo e da análise de regressão por nós realizada ainda pode pairar uma dúvida com relação à equivalência dos dois enfoques apresentados no item 3. Para sanar essa dúvida e para clarificar os problemas surgidos nós decidimos refazer as análises de variância reportadas por Figueiredo, com base nos dados por ele apresentados.

Na tabela 6 e 7 são apresentadas as análises de variância correspondentes aos casos: a) período de alta; e b) período de baixa.

Como é fácil perceber os resultados das análises de variância das tabelas 6 e 7 são agora, respectivamente, equivalentes às análises de regressão apresentadas nas tabelas 4 e 5. Senão vejamos: o F calculado da regressão, apresentado na tabela 4, é 0,591736, enquanto o F calculado para a análise de variância correspondente, apresentado na tabela 6, é de 0,5917, ou seja, são praticamente iguais. O mesmo acontece com a soma de quadrados dos resíduos, e, portanto, com a variação total (veja tabelas 4 e 6).

Esses resultados também ocorrem para a análise de variância e regressão para o período de baixa da bolsa, os F's das tabelas 5 e 7 são iguais, o mesmo acontecendo com a soma de quadrados dos resíduos e, conseqüentemente, com a variação total. Esses resultados são esperados e normais, como foi demonstrado no item 3 deste trabalho. Desta forma, tanto a análise de regressão como a análise de variância conduzem aos mesmos resultados em termos de testes de hipóteses, o que nos leva a concluir que nenhum dos indicadores técnicos analisados por Figueiredo levam a uma seleção de portfolio com maiores lucros nos períodos de alta e nem a uma diminuição de prejuízos, nos períodos de baixa.

Em suma, o objetivo deste trabalho foi demonstrar a equivalência dos modelos de análise de variância e de regressão. A equivalência teórica foi demonstrada e a aplicação prática dos dois modelos levou a resultados equivalentes em termos de testes de hipóteses. Ao mesmo tempo e, curiosamente, ficou demonstrado que existem erros de cálculo nas duas análises de variância apresentadas por Figueiredo, levando-o a conclusões erradas com relação à eficácia dos indicadores técnicos de bolsa nos períodos de baixa das cotações.

Nota do Prof. Orlando Figueiredo

Por desatenção do operador houve erro na alimentação dos dados no computador. Após publicado o artigo e constatado o erro, foi consultada a redação da revista sobre a publicação de uma errata. Em função das modificações necessárias, a redação da RAE aconselhou-me a reescrever o artigo para posterior publicação, programada para 0 número de maio/junho de 1976.

Como o presente artigo representa uma forma elegante de apresentar uma errata, torna-se desnecessário que o artigo original seja republicado com as devidas correções. De qualquer maneira quero congratular-me com o autor pela forma como o assunto foi tratado em seu artigo.

  • 1 Figueiredo, Orlando. Da relevância da análise técnica de ações. Revista de Administração de Empresas, Rio de Janeiro, jan./fev. 1974.
  • 5 Veja Johnston, J. Econometric methods. McGraw-Hill. 1972. p. 142.
  • 6 Veja Freund. J. E. Mathematical statistics. Prentice-Hall, 1962. p. 335 fórmula (14.2.5).
  • 1
    Figueiredo, Orlando. Da relevância da análise técnica de ações.
    Revista de Administração de Empresas, Rio de Janeiro, jan./fev. 1974.
  • 2
    Os dados utilizados por Figueiredo referem-se à bolsa de São Paulo e foram extraídos da
    Revista da Bolsa de Valores de São Paulo.
  • 3
    A formulação das hipóteses
    H
    0 e
    H
    1 é, em termos de notação, diferente da de Figueiredo, ou seja, a sua hipótese nula tem a seguinte formulação:
    H0 =
    µ1 =
    µ2 =
    µ3 = ... =
    µG (
    g = 1, 2, ...,
    G), e
    µg é a média de lucratividade do
    g-ésimo grupo de ações. A nossa hipótese nula é a mesma de Figueiredo, a diferença é apenas decorrente de diferenças na formulação do modelo de análise de variância. A nossa formulação do modelo é tal que permite uma comparação mais direta com o modelo de análise de regressão. Isso ficará claro no item 3 deste trabalho.
  • 4
    Essa formulação permite contornar o problema de indeterminação do sistema de equações normais de mínimos quadrados no cálculo dos valores estimados dos β's.
  • 5
    Veja Johnston, J.
    Econometric methods. McGraw-Hill. 1972. p. 142.
  • 6
    Veja Freund. J. E.
    Mathematical statistics. Prentice-Hall, 1962. p. 335 fórmula (14.2.5).
  • 7
    Figueiredo, O. op. cit. p. 116.
  • Datas de Publicação

    • Publicação nesta coleção
      09 Ago 2013
    • Data do Fascículo
      Abr 1976
    Fundação Getulio Vargas, Escola de Administração de Empresas de S.Paulo Av 9 de Julho, 2029, 01313-902 S. Paulo - SP Brasil, Tel.: (55 11) 3799-7999, Fax: (55 11) 3799-7871 - São Paulo - SP - Brazil
    E-mail: rae@fgv.br