Aplicação de redes neurais artificiais na previsão da produção de álcool

Oliveira, Anderson Castro Soares de; Souza, Ademária Aparecida de; Lacerda, Wilian Soares; Gonçalves, Luciene Resende

doi:10.1590/S1413-70542010000200002

Resumos

Este trabalho descreve a aplicação de Redes Neurais Artificiais na tarefa de previsão da produção de álcool no Brasil no ano de 2006, a partir de dados de produção anteriores. É também apresentada uma comparação entre os resultados obtidos por meio da Rede Neural com os obtidos utilizando técnicas de séries temporais, sendo que a Rede Neural obteve melhores resultados.

Álcool; Redes Neurais; Séries Temporais

This work describes the application of Artificial Neural Networks in the forecasting of alcohol production in Brazil in the year of 2006 using past data. Results obtained through Neural Networks were compared to those obtained using time series techniques, and Neural Networks have shown better results.

Alcohol; Neural Networks; Time Series

CIÊNCIAS AGRÁRIAS

Aplicação de redes neurais artificiais na previsão da produção de álcool

Application of artificial neural networks in the forecast of alcohol production

Anderson Castro Soares de Oliveira^I; Ademária Aparecida de Souza^I; Wilian Soares Lacerda^II; Luciene Resende Gonçalves^I

^IUniversidade Federal de Lavras/UFLA - Departamento de Ciências Exatas/DEX - Lavras, MG

^IIUniversidade Federal de Lavras/UFLA - Departamento de Ciência da Computação/DCC - Cx. P. 3037 - 37200-000 - Lavras, MG - lacerda@ufla.br

RESUMO

Este trabalho descreve a aplicação de Redes Neurais Artificiais na tarefa de previsão da produção de álcool no Brasil no ano de 2006, a partir de dados de produção anteriores. É também apresentada uma comparação entre os resultados obtidos por meio da Rede Neural com os obtidos utilizando técnicas de séries temporais, sendo que a Rede Neural obteve melhores resultados.

Termos para indexação: Álcool, Redes Neurais, Séries Temporais.

ABSTRACT

This work describes the application of Artificial Neural Networks in the forecasting of alcohol production in Brazil in the year of 2006 using past data. Results obtained through Neural Networks were compared to those obtained using time series techniques, and Neural Networks have shown better results.

Index terms: Alcohol, Neural Networks, Time Series.

INTRODUÇÃO

A energia utilizada pela humanidade tem sido extraída, principalmente, de combustíveis fósseis como o gás natural, o petróleo e o carvão. Essa utilização intensa dos materiais energéticos fósseis aliados à agricultura extensiva e outros fatores que alteram a biosfera, tem resultado num acréscimo mensurável da concentração de gás carbônico na atmosfera. Tornando, cada vez mais crescente, a necessidade da utilização de fontes alternativas de energia.

Dentre as diversas formas renováveis de energia pode-se citar o álcool o qual tem tido seu reconhecimento na comunidade internacional como uma das fontes mais viáveis atualmente, destacando-se como um dos melhores candidatos a serem apoiados com políticas de financiamento, segundo estabelecido no Protocolo de Kyoto (Leite, 1997).

A previsão de produção de álcool favorece uma tomada de decisões no sentido de planejar o volume de estoque para o consumo ao longo dos períodos subsequentes, principalmente agora, momento de transição da era fóssil para a era alternativa (Gonçalves, 2007).

Recentemente, Gonçalves (2007) fez um estudo das principais fontes de energia que compõem o setor energético brasileiro constituído por fontes renováveis e não renováveis. Para tal, foram utilizadas técnicas de modelagem de séries temporais como os modelos de Box & Jenkins (1976), sendo considerados para previsão modelos com e sem intervenção. Para a produção de álcool, o modelo com intervenção obteve melhores previsões.

Box & Jenkins (1976) propuseram modelos matemáticos que visam a captar o comportamento da correlação serial ou autocorrelação entre os valores da série temporal. Estes ficaram conhecidos como modelos ARIMA (Auto Regressive Integrated Moving Averages). Essa metodologia leva em conta que se os erros são sucessivamente dependentes, as observações também o serão. Desta forma, constrói-se modelos que descrevem com precisão, e de forma parcimoniosa, o processo gerador da série temporal, proporcionando assim previsões acuradas de valores futuros.

Os modelos ARIMA exploram a autocorrelação entre os valores da série em instantes sucessivos. Entretanto, em algumas séries temporais observa-se a existência de uma componente periódica sazonal que se repete a cada s (s > 1) observações, implicando em correlação alta em períodos múltiplos de s. Dessa forma, é necessário considerar uma componente sazonal estocástica dentro do modelo que se ajuste à serie original. A classe de modelos que contempla séries que apresentam autocorrelação sazonal são conhecidas como SARIMA.

Por outro lado, Redes Neurais Artificiais (RNAs) vêm sendo empregadas com sucesso na previsão de séries temporais, por sua capacidade de aproximar funções não-lineares (Fernandes et al., 1996; Calôba et al., 2002; Torres et al., 2005). Assim, o objetivo principal deste trabalho é propor um modelo de previsão da produção de álcool utilizando Redes Neurais Artificiais e comparar com os resultados obtidos por Gonçalves (2007).

Uma Rede Neural Artificial Multicamadas (Haykin, 1999) é tipicamente composta de camadas alinhadas de neurônios, conforme é mostrado na Figura 1. Nesse tipo de rede, as entradas são apresentadas na primeira camada, que é chamada camada de entrada. Essa camada distribui as informações para a(s) camada(s) escondida(s) da rede. A última camada é a camada de saída, onde a solução do problema é obtida. A camada de entrada e a camada de saída podem ser separadas por uma ou mais camadas intermediárias (ou camadas escondidas). Além disso, os neurônios de uma camada estão conectados apenas aos neurônios da camada imediatamente posterior, não havendo realimentação (comunicação unidirecional) nem conexões entre neurônios da mesma camada.

Basicamente, o treinamento de uma RNA consiste em um problema de minimização não linear sem restrições, em que os pesos sinápticos da rede são iterativamente modificados para minimizar o erro quadrático médio entre a resposta desejada a partir dos dados de entrada e a saída obtida no neurônio de saída. Do ponto de vista estatístico, treinamento significa estimar os parâmetros do modelo considerando-se um conjunto de dados.

Em qualquer problema a ser resolvido por meio do uso de RNAs, é necessário o uso de pares de entrada-saída já conhecidos. Muitas vezes, a quantidade de pares disponíveis não é muito grande, mesmo assim deve-se separar esses dados em pelo menos dois conjuntos bem definidos: o conjunto de treinamento e o conjunto de teste.

MATERIAL E MÉTODOS

Os dados propostos para o estudo referem-se à série histórica da produção mensal de álcool de cana-de-açúcar nível 80 - índice (média 2002=100), coletada no período de janeiro de 1991 a setembro de 2006, num total de 186 observações. Esses dados foram obtidos junto ao banco de dados do Instituto de Pesquisas Econômicas Aplicadas (Instituto de Pesquisa Econômica Aplicada-IPEA, 2007).

Para implementar a RNA utilizou-se a seguinte estrutura após exaustivas tentativas: 12 neurônios na camada de entrada, uma camada escondida com 48 neurônios, e um neurônio na camada de saída. Todos neurônios com função de ativação sigmoidal. O algoritmo utilizado para o treinamento foi o algoritmo de retropropagação (backpropagation) com momentum, com uma taxa de aprendizagem de 0.01 , e taxa de momentum de 0.01. Definiu-se o conjunto de treinamento composto pelas observações da produção de álcool durante o período de janeiro de 1991 a dezembro de 1999. Os dados do período de janeiro de 2000 a dezembro de 2005 foram destinados ao conjunto de teste. As observações do período de janeiro de 2006 a setembro do mesmo ano foram reservadas para serem comparadas com as previsões (conjunto de validação).

Para determinar a qualidade dos resultados obtidos pela RNA comparados aos obtidos por Gonçalves (2007), foram levados em consideração o grau de precisão das previsões consideradas, por dois critérios distintos:

1 - Erro percentual médio absoluto (MAPE), dado pela seguinte expressão:

2 - Erro quadrático médio de previsão (EQMP), expresso por:

em que:

y_i é o valor real do período i;
y_pi é a previsão para o período i;
h é o número de previsões.

RESULTADOS E DISCUSSÃO

Na Figura 2, é apresentado o gráfico original da série de produção de álcool (a) e sua função de autocorrelação (b). A estrutura da função de autocorrelação sugere que a série apresenta componente sazonal determinístico de período 12. Para confirmar a existência do efeito sazonal, nesse período, aplicou-se o teste de Fisher, em que obteve-se g = 0,90 e z_0,05 = 0,08. Como g > z, a série apresenta sazonalidade de 12 meses, ao nível de 5% de significância. Em outras palavras, a série apresenta uma dependência de 12 meses.

Dessa forma, no modelo da RNA foram utilizados dados de entrada atrasados de 12 meses, ou seja, para cada valor de saída da rede foram apresentados doze valores de entrada antigos. Na Figura 3, são apresentados os resultados obtidos pela RNA no conjunto de treinamento, teste e validação. O conjunto de treinamento foi utilizado para treinar a rede, o conjunto de teste para testar a generalização da rede durante o treinamento, e o conjunto de validação após o treinamento para verificar o seu desempenho final. Pode-se ver que as curvas geradas pela RNA têm, aproximadamente, a mesma forma que as curvas reais, demonstrando que a RNA modela de forma satisfatória o processo gerador dos dados.

Na Figura 4, é apresentado o comportamento do erro médio quadrático (EMQ) de treinamento e de teste durante o treinamento da RNA. Pode-se observar que, a partir da época 10.000, o erro no conjunto de teste apresenta um comportamento aproximadamente constante, enquanto que o erro no conjunto de treinamento decresce. A partir desse momento, a capacidade de generalização da RNA não melhora significativamente, apesar de melhorar os acertos dos dados de treinamento.

Na Tabela 1, são apresentadas as previsões para os meses de janeiro a setembro de 2006 obtidos por Gonçalves (2007), por meio do modelo SARIMA (1,0,0)(0,1,1)₁₂ com intervenção e pela RNA (12, 48, 1). Pode-se observar que a RNA apresentou previsões mais próximas dos valores reais, com exceção dos meses de janeiro e fevereiro.

Thumbnail

Na Tabela 2, á apresentado o MAPE e o EQMP para as previsões obtidas por Gonçalves (2007), por meio do modelo SARIMA (1,0,0) (0,1,1)₁₂ com intervenção e pela RNA (12 ,48 ,1), para a produção álcool no período de janeiro de 2006 a setembro de 2006. Pode-se observar que as previsões obtidas por meio da RNA produziram não só o menor MAPE, como também o menor EQMP, conduzindo dessa maneira, a resultados mais precisos.

Thumbnail

CONCLUSÕES

A RNA implementada obteve uma previsão melhor para a produção de álcool do que aquela obtida por técnica de tratamento da série no domínio do tempo (séries temporais). Assim, foi possível verificar a eficiência da RNA ao tratamento de padrões não lineares e a sua aplicação na tarefa de previsão. Para a obtenção de melhores resultados, modificações na topologia e treinamento da RNA podem ser aplicadas tais como: variação da quantidade de neurônios, aumento do tempo de treinamento, teste com outros parâmetros de treinamento.

AGRADECIMENTOS

Os autores agradecem o apoio financeiro da FAPEMIG para a publicação deste artigo.

Recebido em 13 de janeiro de 2009

Aprovado em 15 de julho de 2009

BOX, G.E.P.; JENKINS, G.M. Time series analysis: forecasting and control. San Francisco: Holden-Day, 1970. 842p.
CALÔBA, G.M.; CALÔBA, L.P.; SALIBY, E. Cooperação entre redes neurais artificiais e técnicas clássicas para previsão de demanda de uma série de vendas de cerveja na Austrália. Pesquisa Operacional, v.22, n.3, p.345-358, 2002.
FERNANDES, L.G.L.; NAVAUX, P.O.A.; PORTUGAL, M.S. Previsão de séries de tempo: redes neurais e modelos estruturais. Pesquisa e Planejamento Econômico, v.26, n.2, p.253-276, 1996.
GONÇALVES, L.R. Modelagem de séries representativas do setor energético brasileiro. 2007. 106p. Dissertação (Mestrado em Estatística e Experimentação Agropecuária)-Universidade Federal de Lavras, Lavras, 2007.
HAYKIN, S. Neural networks, a comprehensive foundation New Jersey: Englewood Cliffs, 1999. 842p.
INSTITUTO DE PESQUISA ECONÔMICA APLICADA. Disponível em: <www.ipeadata.gov.br>. Acesso em: 21 jun. 2007.
» link
LEITE, A.D. A energia do Brasil Rio de Janeiro: Nova Fronteira, 1997. 598p.
TORRES, R.; MACHADO, M.A.S.; SOUZA, R.C. Previsão de séries temporais de falhas em manutenção industrial usando redes neurais. Engevista, v.7, p.23, 2005.

Datas de Publicação

Publicação nesta coleção
26 Abr 2010
Data do Fascículo
Abr 2010

Histórico

Aceito
15 Jul 2009
Recebido
13 Jan 2009

This work is licensed under a Creative Commons Attribution 4.0 International License.

[1] BOX, G.E.P.; JENKINS, G.M. Time series analysis: forecasting and control. San Francisco: Holden-Day, 1970. 842p.

[2] CALÔBA, G.M.; CALÔBA, L.P.; SALIBY, E. Cooperação entre redes neurais artificiais e técnicas clássicas para previsão de demanda de uma série de vendas de cerveja na Austrália. Pesquisa Operacional, v.22, n.3, p.345-358, 2002.

[3] FERNANDES, L.G.L.; NAVAUX, P.O.A.; PORTUGAL, M.S. Previsão de séries de tempo: redes neurais e modelos estruturais. Pesquisa e Planejamento Econômico, v.26, n.2, p.253-276, 1996.

[4] GONÇALVES, L.R. Modelagem de séries representativas do setor energético brasileiro. 2007. 106p. Dissertação (Mestrado em Estatística e Experimentação Agropecuária)-Universidade Federal de Lavras, Lavras, 2007.

[5] HAYKIN, S. Neural networks, a comprehensive foundation New Jersey: Englewood Cliffs, 1999. 842p.

[6] INSTITUTO DE PESQUISA ECONÔMICA APLICADA. Disponível em: <www.ipeadata.gov.br>. Acesso em: 21 jun. 2007.
» link

[7] LEITE, A.D. A energia do Brasil Rio de Janeiro: Nova Fronteira, 1997. 598p.

[8] TORRES, R.; MACHADO, M.A.S.; SOUZA, R.C. Previsão de séries temporais de falhas em manutenção industrial usando redes neurais. Engevista, v.7, p.23, 2005.