Acessibilidade / Reportar erro

Estimação do volume de árvores utilizando redes neurais artificiais

Estimate of tree volume using artificial neural nets

Resumos

Rede neural artificial consiste em um conjunto de unidades que contêm funções matemáticas, unidas por pesos. As redes são capazes de aprender, mediante modificação dos pesos sinápticos, e generalizar o aprendizado para outros arquivos desconhecidos. O projeto de redes neurais é composto por três etapas: pré-processamento, processamento e, por fim, pós-processamento dos dados. Um dos problemas clássicos que podem ser abordados por redes é a aproximação de funções. Nesse grupo, pode-se incluir a estimação do volume de árvores. Foram utilizados quatro arquiteturas diferentes, cinco pré-processamentos e duas funções de ativação. As redes que se apresentaram estatisticamente iguais aos dados observados também foram analisadas quanto ao resíduo e à distribuição dos volumes e comparadas com a estimação de volume pelo modelo de Schumacher e Hall. As redes neurais formadas por neurônios, cuja função de ativação era exponencial, apresentaram estimativas estatisticamente iguais aos dados observados. As redes treinadas com os dados normalizados pelo método da interpolação linear e equalizados tiveram melhor desempenho na estimação.

Inteligência artificial; cubagem; árvores individuais


The artificial neural network consists of a set of units containing mathematical functions connected by weights. Such nets are capable of learning by means of synaptic weight modification, generalizing learning for other unknown archives. The neural network project comprises three stages: pre-processing, processing and post-processing of data. One of the classical problems approached by networks is function approximation. Tree volume estimate can be included in this group. Four different architectures, five pre-processings and two activation functions were used. The nets which were statistically similar to the observed data were also analyzed in relation to residue and volume and compared to the volume estimate provided by the Schumacher and Hall equation. The neural nets formed by neurons whose activation function was exponential presented estimates statistically similar to the observed data. The nets trained with the data normalized by the linear interpolation method and equalized presented better estimate performance.

Artificial intelligence; scaling; tree volume


Estimação do volume de árvores utilizando redes neurais artificiais1 1 Recebido em 13.11.2007 e aceito para publicação em 23.06.2009.

Estimate of tree volume using artificial neural nets

Eric Bastos GorgensI; Helio Garcia LeiteII; Heleno do Nascimento SantosIII; José Marinaldo GlerianiII

ICompanhia do Vale do Araguaia, E-mail: e.gorgens@gmail.com IIDepartamento de Engenharia Florestal da UFV, E-mail: hgleite@gmail.com e gleriani@ufv.br IIIDepartamento de Informática da Universidade Federal de Viçosa da UFV, E-mail: coord.si@fdvmg.edu.br

RESUMO

Rede neural artificial consiste em um conjunto de unidades que contêm funções matemáticas, unidas por pesos. As redes são capazes de aprender, mediante modificação dos pesos sinápticos, e generalizar o aprendizado para outros arquivos desconhecidos. O projeto de redes neurais é composto por três etapas: pré-processamento, processamento e, por fim, pós-processamento dos dados. Um dos problemas clássicos que podem ser abordados por redes é a aproximação de funções. Nesse grupo, pode-se incluir a estimação do volume de árvores. Foram utilizados quatro arquiteturas diferentes, cinco pré-processamentos e duas funções de ativação. As redes que se apresentaram estatisticamente iguais aos dados observados também foram analisadas quanto ao resíduo e à distribuição dos volumes e comparadas com a estimação de volume pelo modelo de Schumacher e Hall. As redes neurais formadas por neurônios, cuja função de ativação era exponencial, apresentaram estimativas estatisticamente iguais aos dados observados. As redes treinadas com os dados normalizados pelo método da interpolação linear e equalizados tiveram melhor desempenho na estimação.

Palavras-chave: Inteligência artificial, cubagem e árvores individuais.

ABSTRACT

The artificial neural network consists of a set of units containing mathematical functions connected by weights. Such nets are capable of learning by means of synaptic weight modification, generalizing learning for other unknown archives. The neural network project comprises three stages: pre-processing, processing and post-processing of data. One of the classical problems approached by networks is function approximation. Tree volume estimate can be included in this group. Four different architectures, five pre-processings and two activation functions were used. The nets which were statistically similar to the observed data were also analyzed in relation to residue and volume and compared to the volume estimate provided by the Schumacher and Hall equation. The neural nets formed by neurons whose activation function was exponential presented estimates statistically similar to the observed data. The nets trained with the data normalized by the linear interpolation method and equalized presented better estimate performance.

Keywords: Artificial intelligence, scaling and tree volume.

1. INTRODUÇÃO

Redes neurais artificiais (RNAs) são sistemas massivos e paralelos, compostos por unidades de processamento simples que computam determinadas funções matemáticas (Braga et al., 1998). Utilizando um conjunto de exemplos apresentado, as RNAs são capazes de generalizar o conhecimento assimilado para um conjunto de dados desconhecidos. Elas têm, ainda, a capacidade de extrair características não explícitas de um conjunto de informações que lhes são fornecidas como exemplos (KOVÁCS, 1996).

Um projeto de redes neurais consiste em pré-processamento, processamento e, por fim, um pós-processamento dos dados.

Os problemas tratáveis por meio de redes neurais podem ser divididos em três tipos principais: aproximação de função, classificador de padrões e agrupamento de dados (Haykin, 2001). Em Ciência Florestal, diversos tópicos podem ser potencialmente tratados por RNAs, entre eles a modelagem do volume de árvores.

Um fato importante ao conduzir inventários florestais é a definição de equações volumétricas apropriadas para cada estrato, sendo este geralmente determinado pelo material genético, pelo espaçamento inicial, pelo regime de corte e pela idade, e, então, geradas equações específicas, atualizadas anualmente. Com isso, empresas de grande porte gastam quantias consideráveis de recursos humanos e financeiros com a derrubada de árvores ao longo do tempo (LEITE e ANDRADE, 2002).

Apesar da contínua atualização de equações volumétricas, em muitas ocasiões não é possível gerar equações para determinados compartimentos. Por exemplo, no caso de plantios clonais e de pesquisa (testes clonais), sempre há estratos onde não é possível derrubar árvores para ajuste de modelos volumétricos, sendo aplicadas equações de outros estratos semelhantes (CAMPOS e LEITE, 2006).

O fato é que, ao longo dos anos, as empresas acumulam grande quantidade de dados de cubagem, incluindo árvores com diferentes características e variações de forma (LEITE et al., 1995). Esses dados podem ser utilizados para implementar um projeto de redes neurais cujo objetivo final é a estimativa do volume de árvores sem o uso de equações volumétricas e de dados específicos de cubagem.

O objetivo deste estudo foi construir uma rede neural que estime com eficiência o volume de árvores.

2. MATERIAL E MÉTODOS

Foram coletados dados de cubagem de eucalipto (Eucalyptus spp.) em quatro empresas diferentes, sendo uma no Estado da Bahia, outras duas no Estado de Minas Gerais e a quarta no Estado de São Paulo. Dados de cubagem em teca (Tectona grandis L.f.) no Estado do Mato Grosso também foram utilizados (Tabela 1).

Foi definido como procedimento-padrão o ajuste do modelo de Schumacher e Hall (1933) para cada um desses locais, resultando em cinco equações diferentes.

Foram utilizadas redes anteroalimentadas (feedforward), treinadas por meio do algoritmo da retropropagação do erro (backpropagation). Os dados de entrada para a rede foram: diâmetro a 1,30 m de altura (dap), altura total (ht), os cinco locais (representados por variáveis binárias) e as duas espécies (também representados pelas variáveis binárias) (Figura 1). Como exemplo, um padrão de entrada para uma árvore de eucalipto com dap normalizado de 0,2781 e altura normalizada de 0,3124 no local 5 seria representado pelo vetor (0,2781, 0,3124, 0, 0, 0, 0, 1, 1, 0) = (dap, ht, L1, L2, L3, L4, L5, E1, E2), em que L1 a L5 representam cada um dos cinco locais e E1 e E2, a espécie. Neurônios de entrada explícitos foram utilizados para garantir representatividade dos cinco locais e das duas espécies.


No pré-processamento, devem ser avaliados a necessidade de aplicar a normalização, a equalização ou, até mesmo, os dois procedimentos aos dados. A normalização é uma técnica de manipulação de banco de dados que visa homogeneizar a grandeza das variáveis envolvidas na análise. A equalização busca ajustar a distribuição dos dados dentro de determinada amplitude (HAYKIN, 2001). As técnicas de normalização e equalização não devem alterar a forma da distribuição dos dados, preservando, assim, as informações implícitas da variável.

No banco de dados utilizados, a existência de variáveis binárias e variáveis contínuas proporciona uma diferença de magnitude entre as variáveis, o que é uma indicação da necessidade de aplicar a normalização.

A solução de RNA proposta neste trabalho utiliza funções de ativação com limites entre 0 e 1. Equalizar os dados nesse intervalo permite que a rede seja mais sensível à variação desse dados, captando melhor o seu comportamento.

A etapa de pré-processamento foi realizada utilizando diferentes procedimentos encontrados na literatura (GOLDSCHMIDT e PASSOS, 2005).

1) Valor observado da variável (x) dividido pelo valor máximo da variável (xmáximo).

Esse é um método de normalização em que o valor máximo pode ser obtido por experiência do usuário, por análise do banco de dados ou série histórica.

2) Valor observado da variável (x) dividido por um múltiplo de 10, de forma a alterar as casas decimais dos números, para que se incluam no intervalo de 0 a 1.

Esse também é apenas um método de normalização, não se preocupando com a equalização dos dados.

3) Interpolação linear inversa entre 0 e 1, em que x é o valor observado da variável.

A interpolação linear realiza tanto a normalização quanto a equalização. Os processamentos 4 e 5 são variações da forma padrão da interpolação linear.

4) Interpolação linear inversa entre 0 e 0,8, em que x é o valor observado da variável.

5) Interpolação linear entre 0,1 e 0,8, em que x é o valor observado da variável.

Três etapas são necessárias para obter uma rede pronta para ser usada: construção da rede, treinamento e validação. Neste estudo foram avaliadas quatro arquiteturas diferentes.

O algoritmo de aprendizado usado para o treinamento das redes foi o da retropropagação do erro (backpropagation), e os parâmetros de treinamento foram taxa de aprendizagem (m) de 0,2 e termo momentum (h) de 0,9. O software utilizado neste trabalho foi o JavaSNNS (ZELL et al., 1998) (disponível em: http://www-ra.informatik.uni-tuebingen.de/SNNS), e o treinamento da rede se encerrou quando o gráfico do erro tendia à estabilização. Tabela 2

No pós-processamento foi utilizada uma transformação inversa ao pré-processamento, acompanhada de uma regra lógica: "se X < 0, então X = 0; caso contrário X = X". Tal regra foi importante para assegurar que não ocorressem valores inferiores a zero (realismo biológico).

Os resultados das redes foram comparados com os valores observados e com os estimados pela equação de Schumacher e Hall, por meio do teste t, de gráficos de dispersão XY e de distribuição dos dados.

Aquelas redes que se apresentaram estatisticamente iguais foram analisadas graficamente, sendo as demais descartadas das análises subsequentes.

3. RESULTADOS E DISCUSSÃO

Foi utilizada uma equação de Schumacher e Hall (1933) para cada local. Essas equações foram utilizadas para estimar o volume de árvores individuais para os respectivos locais. O conjunto dessas estimativas foi submetido à mesma análise da modelagem por redes neurais.

Diferentemente da tradicional, a modelagem por redes neurais permitiu que todos os locais e espécies fossem modelados por apenas uma rede. As diferentes redes ajustadas foram identificadas de forma numérica, de acordo com a sequência de trabalho, não significando classificação ou preferência (Tabela 3).

As redes 13, 15, 18, 20 e 26 foram estatisticamente iguais aos dados observados diante do teste t a 5% de probabilidade. Nas redes 13 e 15 foi aplicado o pré-processamento 3 e nas redes 18, 20 e 26, o pré-processamento 4. Ambos os pré-processamentos realizam tanto a normalização quanto a equalização dos dados.

Todas as redes que apresentaram resultados estatisticamente iguais aos dados observados foram construídas com duas camadas intermediárias. As redes 13 e 26 exibiram camadas intermediárias com cinco neurônios cada e função de ativação logística. As redes 15 e 18 foram formadas por camadas com cinco neurônios e função de ativação exponencial. A rede 20 possuía camadas intermediárias com 10 e 8 neurônios, respectivamente, e função de ativação exponencial.

Nas redes que apresentaram estimativas semelhantes aos dados observados perante o teste t, uma análise mais profunda foi conduzida para avaliar o comportamento dos dados estimados. Utilizaram-se para tanto gráfico de dispersão observado versus estimado (Figura 2) e gráfico de distribuição dos volumes estimados diante da distribuição real dos dados (Figura 3).



As redes 13 e 18 apresentaram subestimação dos volumes para classes pequenas. A rede 20 mostrou tendência de subestimação geral. A dispersão da rede 26 teve superestimação das classes baixas e subestimação das classes altas.

A avaliação da distribuição é importante para que o processo de estimação mantenha a mesma distribuição dos dados observados, evitando-se, assim, distorções e alterações no comportamento da variável original.

As redes 13 e 26 apresentaram distribuição de diâmetros bastante alterada quando comparada com a dos dados originais. Tal comportamento indica que a estimação do volume pela rede causou distorções dos dados, cuja variável sofreu variação, embora não tenham apresentado diferenças estatísticas pelo teste t.

4. CONCLUSÕES

Diante do exposto, conclui-se que:

- A interpolação linear como método de normalização fornece melhores resultados, e a equalização dos dados melhora a capacidade de predição da rede neural.

- As redes que apresentaram os melhores resultados possuíam duas camadas intermediárias, tendo a função exponencial como "função de ativação". O número de neurônios na camada oculta não resultou em melhorias.

- As redes que apresentaram os melhores resultados receberam como entrada os dados normalizados e equalizados, através de variações do método da interpolação linear.

- A modelagem em rede proporcionou considerável redução na quantidade de equações a serem manipuladas, pois permitiu a abordagem de diversos locais e espécies por uma única rede.

- A modelagem por redes neurais foi perfeitamente viável. Sua capacidade de generalização e conectividade permitiu que se utilizasse apenas uma rede para realizar a predição de volume de árvores dos cinco locais e das duas espécies diferentes.

5. REFERÊNCIAS

  • BRAGA, A. P.; CARVALHO, A. P. L. F.; LUDEMIR, T. B. Fundamentos de redes neurais artificiais Rio de Janeiro: DCC/I, COPPE/Sistemas, NCE/UFRJ, 1998. 246p.
  • CAMPOS, J. C. C.; LEITE, H. G. Mensuração florestal: perguntas e respostas. 2.ed. Viçosa, MG: Universidade Federal de Viçosa, 2006. 470p.
  • GOLDSCHMIDT, R.; PASSOS, E. Data mining: um guia prático. Rio de Janeiro: Elsevier, 2005. 261p.
  • HAYKIN, S. Redes neurais: princípios e prática. 2.ed. Porto Alegre: Bookman, 2001. 900p.
  • KOVACS, Z. L. Redes neurais artificiais: fundamentos e aplicações. 2.ed. São Paulo: Colledium Cognitio, 1996. 174p.
  • LEITE, H. G.; ANDRADE, V. C. L. Um método para condução de inventários florestais sem o uso de equações volumétricas. Revista Árvore, v.26, n.3, p.321-328, 2002.
  • LEITE, H. G.; GUIMARÃES, D. P.; CAMPOS, J. C. C. Descrição e emprego de um modelo para estimar múltiplos volumes de árvores. Revista Árvore, v.19, n.1, p.1-21, 1995.
  • SCHUMACHER, F. X.; HALL, F. S. Logarithmic expression of timber-tree volume. Journal of Agricultural Research, v.47, n.9, p.719-734, 1933.
  • ZELL, A. et al. SNNS Stuttgart Neural Network Simulator v.4.2, user manual. Stuttgart: University of Stuttgart/University of Tübingen, 1998. 338p.
  • 1
    Recebido em 13.11.2007 e aceito para publicação em 23.06.2009.
  • Datas de Publicação

    • Publicação nesta coleção
      09 Mar 2010
    • Data do Fascículo
      Dez 2009

    Histórico

    • Aceito
      23 Jun 2009
    • Recebido
      13 Nov 2007
    Sociedade de Investigações Florestais Universidade Federal de Viçosa, CEP: 36570-900 - Viçosa - Minas Gerais - Brazil, Tel: (55 31) 3612-3959 - Viçosa - MG - Brazil
    E-mail: rarvore@sif.org.br