Acessibilidade / Reportar erro

Classificação da capacidade produtiva com alturas de árvores dominantes estimadas por RNA

Productive capacity classification with heights of dominant trees estimated by ANN

Resumo

A construção de curvas de sítio a partir da modelagem da altura de árvores dominantes medidas em parcelas permanentes em diferentes idades, considerando uma idade de referência, se constitui no método mais prático e difundido no meio florestal para classificar a capacidade produtiva local. Dentro de um processo de Planejamento Florestal, o grau de assertividade das curvas geradas tem consequências quantitativas e qualitativas na alocação de recursos, de forma que a melhoria contínua dos métodos de classificação é de suma importância. Este estudo teve como objetivo propor o uso de modelos de Redes Neurais Artificiais (RNA) para estimar a altura de árvores dominantes de eucalipto, e aplicá-los na geração de curvas de sítio utilizando o método da curva guia, como uma alternativa aos modelos tradicionais de regressão não-linear, avaliando a precisão das estimativas e a estabilidade da classificação da capacidade produtiva local gerada por essas abordagens. Os dados utilizados foram provenientes das medições de 8.819 parcelas permanentes instaladas em povoamentos clonais de Eucalyptus urophylla × Eucalyptus grandis. Foram ajustados cinco modelos não lineares clássicos e as RNA foram treinadas com dois algoritmos: Feed Forward Back Propagation Network (FFBP) e Cascade Forward Back Propagation Network (CFBP). Os resultados mostraram que, de maneira geral, quando utilizada somente a idade das parcelas para estimativa da altura dominante, não houve diferença nos resultados entre as RNA treinadas com os dois algoritmos e os modelos não lineares. Contudo, com adição de novas variáveis do povoamento durante o treinamento das RNA, houve uma melhora nas estimativas das alturas dominantes e gerou uma classificação da capacidade produtiva 13% mais estável se comparada aos modelos de regressão não linear.

Palavras-chave:
Inteligência artificial; Sítios florestais; Feed Forward Back Propagation Network; Cascade Forward Back Propagation Network

Abstract

The generation of site curves built from modeling the height of dominant trees measured in permanent plots at different ages considering a reference age constitutes the most practical and widespread method to classify the local productive capacity. Within a Forest Planning process, the assertiveness of the generated curves has quantitative and qualitative consequences in the allocation of resources, so that the continuous improvement of classification methods is of paramount importance. This study aimed to propose models of Artificial Neural Networks (ANN) to estimate the height of dominant eucalyptus trees, and apply them in the generation of site curves using the guide curve method, as an alternative to non-linear and assess the accuracy of estimates and stability of the classification of local productive capacity generated by these approaches. The data used are from measurements of 8,819 permanent plots installed in clonal stands of Eucalyptus urophylla × Eucalyptus grandis. Five classical non-linear models were fitted and the ANN were trained with two algorithms: Feed Forward Back Propagation Network (FFBP) and Cascade Forward Back Propagation Network (CFBP). In general, when only the age of the plots was used to estimate the dominant height, there was no difference in the results between the ANN trained with the two algorithms and the non-linear models. However, with the addition of new stand variables during ANN training, there was an improvement in estimates of dominant heights and generated a 13% more stable productive capacity classification compared to non-linear regression models.

Keywords:
Artificial intelligence; Forest sites; Feed Forward Back Propagation Network; Cascade Forward Back Propagation Network

1 INTRODUÇÃO

As pesquisas acerca da previsão da produtividade de um determinado local são cada vez mais importantes dentro do contexto dos processos de Planejamento Florestal, pois contribuem para melhorar a estimativa da colheita anual, para a obtenção da idade de rotação e para as decisões que envolvem o regime de manejo a ser adotado após a colheita, nos casos em que há a opção de condução das brotações. Tais resultados são fundamentais quando se deseja a racionalização e a otimização da utilização dos recursos florestais (SILVA et al., 2013SILVA, F. DA. et al. Classificação de sítio para Pinus caribaea var. hondurensis na região do Triângulo Mineiro. Revista Acadêmica: Ciências Agrárias e Ambientais, Curitiba, v. 11, Supl. 1, p. S105-S112, 2013. DOI: 10.7213/academica.10.S01.AO12
https://doi.org/10.7213/academica.10.S01...
) e têm como primeira etapa a Classificação da Capacidade Produtiva, que pode ser feita utilizando-se equações que descrevem alguma variável dendrométrica que represente esse potencial local em função da idade do povoamento. A classificação da capacidade produtiva local é crucial para a tomada de decisões no manejo florestal, orientando sobre os locais onde serão realizados investimentos e implantados os povoamentos (SCHUCHOVSKI et al., 2019SCHUCHOVSKI, M. S. et al. Altura dominante e índice de sítio para Pinus taeda em dois polos de desenvolvimento florestal no sul do Brasil. Scientia Forestalis , Piracicaba, v. 47, n. 121, p. 92-104, mar. 2019. DOI: 10.18671/scifor.v47n121.09
https://doi.org/10.18671/scifor.v47n121....
).

A altura média das árvores dominantes é a principal variável dendrométrica empregada para indicar a capacidade produtiva de florestas, pois possui boa correlação com a produção volumétrica, indica a qualidade do sítio para todas as idades presentes e é menos dependente da densidade do povoamento. Todavia, sabe-se que vários outros fatores influenciam no desenvolvimento de uma floresta, e que, portanto, se utilizados para a sua modelagem, poderão trazer benefícios na aplicação da técnica.

As curvas de índice de local constituem-se atualmente no método mais prático e difundido para classificar a produtividade florestal. Essa produtividade é expressa por meio de um índice de sítio, que se refere a uma altura dominante ou a uma classe de produção relativa em uma idade de referência do povoamento (SANTOS et al., 2018SANTOS, C. J. Regressão não linear quantílica para classificação de sítio em povoamentos de Eucalyptus sp. Scientia Forestalis , Piracicaba, v. 46, n. 120, p. 551-561, dez. 2018. DOI: 10.18671/scifor.v46n120.04
https://doi.org/10.18671/scifor.v46n120....
).

Na geração de tais curvas, são normalmente utilizados dados de altura dominante obtidos em parcelas permanentes de inventários contínuos, medidas em diferentes idades nos diferentes talhões que compõem um povoamento florestal. A relação altura-idade é ajustada a modelos matemáticos e posteriormente em função da idade de referência, diferentes classes de altura são definidas e curvas de sítio são geradas para representar os limites inferiores e superiores das classes nas diferentes idades.

Para a classificação da capacidade produtiva, nas diferentes idades, é avaliado em função da média das alturas dominantes, qual a classe de sítio que cada parcela pertence. Nesta etapa, verifica-se em algumas unidades amostrais, um problema sério da metodologia, que se trata daquelas parcelas que mudam de sítio nas diferentes idades, devido a erros de medição ou de estimativa ou por serem parcelas que apresentam alturas muito próximas ao limite de uma determinada classe de sítio. Por isso, no final da classificação, o modelo mais adequado deve ser aquele que gera uma classificação mais estável, ou seja, a família de curvas que caracterizará a capacidade produtiva dos talhões de um povoamento, deve ser aquela obtida pelo modelo que, em uma avaliação feita em parcela por parcela, nas diferentes idades de medição, não mudaram ou mudaram poucas vezes de sítio.

Técnicas de Inteligência Artificial estão sendo testadas nas ciências florestais para estimar variáveis dendrométricas e características de povoamentos florestais. As Redes Neurais Artificiais (RNA) se destacam devido as suas características de processamento semelhantes à informação do cérebro humano, tais como: não-linearidade, alto paralelismo, robustez, tolerância a falhas e ruídos, capacidade de lidar com informações imprecisas e distorcidas, além da sua capacidade de generalizar (LEITE et al., 2011LEITE, H. G. et al. Estimation of inside-bark diameter and heartwood diameter for Tectona grandis Linn. trees using artificial neural networks. European Journal of Forest Research, v.130, n.2, p.263-269, mar. 2011. DOI: 10.1007/s10342-010-0427-7
https://doi.org/10.1007/s10342-010-0427-...
).

As RNA têm sido utilizadas com sucesso em diferentes situações, apresentando resultados equivalentes ou superiores aos modelos usuais de regressão quando aplicadas para aproximação de funções em modelagem florestal. Alguns estudos já foram realizados para estimativa de altura de árvores (DIAMANTOPOULOU, 2012DIAMANTOPOULOU, M. J. Assessing a reliable modeling approach of features of trees through neural network models for sustainable forests. Sustainable Computing: Informatics and Systems, v. 2, p. 190-197, dez. 2012. DOI: 10.1016/j.suscom.2012.10.002
https://doi.org/10.1016/j.suscom.2012.10...
; BINOTI et al., 2013BINOTI, M. L. M. S. et al. Aplicação de redes neurais artificiais para estimação da altura de povoamentos equiâneos de eucalipto. Revista Árvore, Viçosa, v. 37, n. 4, p. 639-645, ago. 2013. DOI: 10.1590/S0100-67622013000400007
https://doi.org/10.1590/S0100-6762201300...
; ÖZÇELIK et al., 2013ÖZÇELIK, R. et al. Estimating Crimean juniper tree height using nonlinear regression and artificial neural network models. Forest Ecology and Management, v. 306, p. 52-60, out. 2013. DOI: 10.1016/j.foreco.2013.06.009
https://doi.org/10.1016/j.foreco.2013.06...
; SOARES et al., 2021SOARES, G. M. et al. Redes neurais artificias (RNA) para estimativa de altura em um plantio misto de Eucalyptus globulus LABILL e Acacia mearnsii de WILD. Revista Árvore , Viçosa, v. 45:e4512, p. 1-9, ago. 2021. DOI: 10.1590/1806-908820210000012
https://doi.org/10.1590/1806-90882021000...
) e classificação da capacidade produtiva. Cosenza et al. (2015COSENZA, D. N. et al. Classificação da capacidade produtiva de sítios florestais utilizando máquina de vetor de suporte e rede neural artificial. Scientia Forestalis, Piracicaba, v. 43, n. 108, p. 955-963, dez. 2015. DOI: 10.18671/scifor.v43n108.19
https://doi.org/10.18671/scifor.v43n108....
) utilizaram RNA e Máquina de Vetor de Suporte (MVS) para definir classes de sítios florestais a partir de uma classificação pré-estabelecida por métodos tradicionais empregados. Nesse estudo, eram apresentadas as RNA e MVS, variáveis dendrométricas como entrada e a classe de sítio correspondente como saída. Porém, a estimativa de altura de árvores dominantes e posterior aplicação para classificação de sítios florestais utilizando essas abordagens ainda não foi encontrada na literatura científica atual.

Souza et al. (2021SOUZA, P. D. et al. Performance da modelagem para classificação de sítios florestais em bases de dados com outliers. Nativa, Sinop, v. 9, n. 1, p. 54-61, 2021. DOI: 10.31413/nativa.v9i1.11202
https://doi.org/10.31413/nativa.v9i1.112...
) avaliaram a performance da modelagem para classificação de sítios florestais em bases de dados com outliers e verificaram, ao comparar modelos de regressão linear com redes neurais de múltiplas camadas e de função de base radial na estimativa de alturas dominantes, que as redes de múltiplas camadas são indicadas para classificação de sítios florestais quando há presença de outliers na base de dados.

Nesse contexto, este trabalho teve como objetivo propor um modelo de Rede Neural Artificial (RNA) para estimar a altura dominante de árvores de eucalipto, em diferentes idades, aplicá-lo na classificação de sítios florestais utilizando o método da curva guia e avaliar a estabilidade da classificação de sítios obtida como uma alternativa aos modelos de regressão não linear. A hipótese central que norteou esta pesquisa era que como as RNA melhoram as estimativas e especificamente no caso de estimativas de alturas dominantes, que é uma variável majoritariamente medida de forma indireta (utilizando hipsômetros) onde estamos sujeitos a imprecisões, as RNA poderiam gerar maior precisão e estabilidade para a classificação, sobretudo quando outras variáveis são fornecidas no treinamento das redes, e diminuir o empirismo na fase final da definição de classes de produtividade para as unidades de manejo.

2 MATERIAL E MÉTODOS

Os dados utilizados neste estudo são provenientes de plantios comerciais de híbridos de Eucalyptus urophylla x Eucalyptus grandis, implantados com espaçamento variando entre 9 e 12 m² por planta. Tais plantios estão localizados no extremo sul do estado da Bahia, abrangendo uma área de aproximadamente 96.000 ha, em primeira rotação, com idades de medição variando de 0,80 até 12,70 anos.

O clima da região é, segundo a classificação de Köppen, Tropical Equatorial (Af) e Tropical de Monção (Am). A região apresenta temperatura média anual de 24ºC.

Os dados dendrométricos totalizaram 28.150 registros provenientes de 8.819 parcelas permanentes. As parcelas possuem, predominantemente, 260 m² de área, havendo uma minoria de parcelas com áreas que variam entre 200 e 400 m². Em cada parcela mediu-se a circunferência à altura do peito, tomado a 1,30 m do solo (CAP) de todas as árvores, a altura total das cinco primeiras árvores e a altura total das árvores dominantes, segundo o conceito de Assmann.

Para a construção das curvas de índices de local, foi empregado o método da curva guia, considerando-se as alturas dominantes estimadas pelo método tradicional (modelos de regressão não linear) e pelas RNA.

Foi assumida uma idade-índice de sete anos, o que corresponde à idade de rotação da espécie em estudo. A amplitude adotada entre as classes de sítio foi de cinco metros, exceto para a classe de sítio mais produtiva, que teve uma amplitude de seis metros, de maneira que a curva abrangesse todos os dados observados. Foram testados cinco modelos não lineares para estimativa da altura de árvores dominantes (Equações 1-5).

H d = β 0 1 - e - β 1 t β 2 + ε Chapman e Richards (MOD 1)(1)

H d = β 0 e - β 1 e - β 2 t + ε Gompertz (MOD 2)(2)

H d = β 0 1 + β 1 e β 2 t + ε Logístico (MOD 3)(3)

H d = β 0 1 - e - β 1 t β 2 + ε Weibull (MOD 4)(4)

H d = β 0 1 - β 1 e - β 1 t + ε Monomolecular (MOD 5)(5)

Em que: Hd = Média das alturas das árvores dominantes; β’ S = parâmetros a serem estimados; e = número de Euler; ε =erro de estimativa; t = idade em anos.

Os parâmetros dos modelos foram estimados pelo método de Levenberg-Marquardt com o auxílio do software R Statistical Computing (versão 3.2.1).

Foram utilizadas redes neurais de múltiplas camadas (MLP), treinadas com dois algoritmos: Feed Forward Back Propagation Network (FFBP) e Cascade Forward Back Propagation Network (CFBP).

O FFBP treina uma rede MLP em que as camadas são interligadas por sinapses completas, ou seja, cada neurônio da camada i é ligado a todos os neurônios da camada seguinte (i+1), sendo as sinapses orientadas somente para frente (tipo feed forward). Sendo assim, durante o treinamento com esse algoritmo, os cálculos são realizados a partir da camada de entrada da rede em direção a camada de saída e os valores de erro são então propagados para camadas anteriores.

Já as redes treinadas com o CFBP são semelhantes às redes FFBP, mas incluem uma ligação dos pesos a partir da entrada para cada camada e a partir de cada camada para as camadas sucessivas. Enquanto a alimentação de duas camadas de redes para a frente pode potencialmente aprender virtualmente qualquer relação de entrada e saída, as redes Feed Forward com mais camadas podem aprender relacionamentos complexos mais rapidamente.

Inicialmente, as RNA foram treinadas considerando-se somente a idade como variável de entrada, como ocorre nos modelos de regressão não linear. Isso foi necessário para permitir a justa comparação de desempenho das duas técnicas.

Posteriormente, e considerando que vários fatores afetam diretamente a produtividade local, avaliou-se a utilização de variáveis edafoclimáticas (tipo de solo e precipitação média) e do povoamento (área basal e diâmetro médio quadrático) na camada de entrada das RNA juntamente com a variável idade. Foram consideradas 19 classes de precipitação (variando entre 850 e 1550 mm) e 15 tipos de solo. Assim, 13 diferentes RNA foram treinadas, cada uma correspondendo à uma configuração em termos de quantidade e de tipo de variáveis de entrada (Tabela 1).

Todas as RNA treinadas possuíam uma única camada oculta e uma quantidade de neurônios em tal camada igual a quatro para cada variável de entrada. A altura dominante foi considerada como variável de saída. Utilizou-se a função de transferência sigmoide para a camada oculta e linear para a camada de saída, e os dados foram normalizados.

Tabela 1
Arquitetura e variáveis de entrada das RNA treinadas para estimar altura dominante (Hd)

A base de dados foi dividida aleatoriamente em dois conjuntos: 70% para treinamento e 30% para generalização (20% para teste e 10% para validação cruzada). Como critério de parada dos algoritmos de treinamento, utilizou-se o número total de ciclos igual a 1.000 ou o erro quadrático médio inferior a 1% (LEITE et al., 2016LEITE, H. G. et al. Redes neurais artificiais para a estimação da densidade básica da madeira. Scientia Forestalis , Piracicaba, v. 44, n. 109, p. 149-154, mar. 2016. DOI: 10.18671/scifor.v43n109.14
https://doi.org/10.18671/scifor.v43n109....
). Os modelos de RNA foram construídos usando a caixa de ferramentas do Neural Network Toolbox do software MatLab (versão 7.10).

As estimativas foram avaliadas considerando-se o coeficiente de correlação (r) entre alturas dominantes observadas e estimadas, a raiz quadrada do erro médio em metros (RMSE) e a raiz quadrada do erro médio em porcentagem (RMSE%), conforme as Equações (6) e (7) (BINOTI et al., 2013BINOTI, M. L. M. S. et al. Aplicação de redes neurais artificiais para estimação da altura de povoamentos equiâneos de eucalipto. Revista Árvore, Viçosa, v. 37, n. 4, p. 639-645, ago. 2013. DOI: 10.1590/S0100-67622013000400007
https://doi.org/10.1590/S0100-6762201300...
). Ainda, foram gerados gráficos de dispersão dos erros percentuais (Equação 8).

R M S E = i = 1 n H d - H d ^ 2 n (6)

R M S E % = R M S E H d _ * 100 (7)

E r r o % = H d - H d ^ H d _ * 100 (8)

Em que: Hd = Altura dominante observada; <mml:math><mml:mover accent="true"><mml:mrow><mml:mi>H</mml:mi><mml:mi>d</mml:mi></mml:mrow><mml:mo>^</mml:mo></mml:mover></mml:math>= Altura média das árvores dominantes estimada; Hd é a média das alturas dominantes observadas em todas as parcelas; n = número total de observações.

O procedimento para a avaliação da estabilidade consistiu-se em interpretar a manutenção da classificação dos sítios para os modelos testados. Assim, um modelo que apresenta uma classificação mais estável pode ser definido como aquele capaz de manter uma parcela classificada numa mesma classe de sítio do primeiro ao último ano observado na maior parte das parcelas.

Para testar a estabilidade da classificação da capacidade produtiva ao longo das remedições, o índice de sítio foi estimado e então foi contabilizado o número de vezes que as parcelas mudavam de classe em cada abordagem avaliada. A abordagem considerada mais estável foi aquela que apresentou um maior número de parcelas que não mudaram de classe nas suas observações.

Comparou-se os resultados de estabilidade a partir do teste de Qui-Quadrado (χ2), em tabelas de contingência. Na aplicação do teste, foram considerados três experimentos, testando todas as combinações, duas a duas para as opções avaliadas conforme segue:

  • a) Experimento 1: Comparou-se os resultados de estabilidade para a classificação gerada pelos modelos de regressão não lineares, com o intuito de selecionar o modelo que gerou a melhor classificação de acordo com a estabilidade para ser comparado com a classificação gerada por RNA;

  • b) Experimento 2: O modelo selecionado no primeiro experimento foi comparado aos modelos de RNA gerados pelos dois algoritmos (FFBP e CFBP), considerando apenas a idade como variável de entrada;

  • c) Experimento 3: O melhor modelo selecionado no experimento 1 e os modelos de RNA geradas, considerando apenas a idade como variável de entrada, foram comparados com os melhores modelos de RNA gerados pelos dois algoritmos ((FFBP e CFBP), considerando como entrada além da idade, as variáveis edafoclimáticas e do povoamento.

Ainda, para avaliar a precisão, comparou-se o melhor modelo de regressão não linear, as RNA apenas com a variável idade como entrada e as melhores RNA com entrada da idade, variáveis edafoclimáticas e do povoamento, com as alturas dominantes observadas, aplicando-se o teste F de Graybill.

Todas as análises foram realizadas considerando um nível de significância α=0,05.

3 RESULTADOS E DISCUSSÃO

A elaboração das curvas de índice de sítio depende de uma curva que descreva o comportamento médio dos dados, especialmente para o caso de curvas anamórficas. Para os dados considerados, todos os modelos apresentaram resultados satisfatórios para estimativa de altura das árvores dominantes do povoamento em estudo (Tabela 2).

Tabela 2
Estatísticas de exatidão para estimativa da altura dominante (Hd) e estabilidade da classificação de sítios para cada modelo avaliado

Verificou-se um coeficiente de correlação variando de 0,9160 a 0,9203 e raiz do erro médio quadrático (RMSE%) entre 9,683 e 9,441% para os modelos 3 e 5 (destacado em negrito), respectivamente. Todos os modelos, ao analisar a dispersão residual, não apresentaram tendenciosidades e em relação as estatísticas de precisão, performance similar. Fiorentin et al. (2017FIORENTIN, L. D. et al. Modelos não lineares aplicados para classificação de sítios florestais de Pinus elliottii e Pinus taeda. Revista Brasileira de Biometria, Lavras, v. 35, n. 3, p. 474-496, set. 2017. Disponível em: https://biometria.ufla.br/index.php/BBJ/article/view/70/115. Acesso em: 09 ago. 2021.
https://biometria.ufla.br/index.php/BBJ/...
), quando avaliaram a aplicação de modelos não lineares para a classificação de sítios florestais em Pinus elliotti e Pinus taeda na região de Caçador-SC, também verificaram performance similar para a maioria dos modelos avaliados, exceto para o modelo de Clutter e Jones, onde os autores verificaram resultados ligeiramente inferiores. O desempenho dos modelos está intimamente relacionado a consistência dos dados e como as relações entre as variáveis são estabelecidas, portanto é comum em certos casos, alguns modelos não retornarem bons resultados. Contudo, verifica-se que o modelo 5 foi o que apresentou a melhor dispersão de resíduos. Tal resultado, em relação a esse modelo, é semelhante ao encontrado por Téo et al. (2011TÉO, S. J.; BRESSAN, D. R.; COSTA, R. H. da. Uso de modelos estatísticos para classificação de sítios em povoamentos de Pinus taeda na região de Caçador - SC. Revista Floresta, Curitiba, PR, v. 41, n. 1, p. 179-188, jan./mar. 2011. DOI: 10.5380/rf.v41i1.21201
https://doi.org/10.5380/rf.v41i1.21201...
).

Os modelos testados apresentaram resultados semelhantes para a estabilidade (Tabela 2). A porcentagem de parcelas estáveis variou entre 40,72% a 45,54% para os modelos 3 e 5 (destacado em negrito), respectivamente. Tal avaliação revela que o comportamento das parcelas ao longo das remedições segue o mesmo padrão do desempenho de precisão estatística dos modelos.

Os dois tipos de RNA treinadas com as mesmas variáveis utilizadas nos modelos de regressão não linear apresentaram resultados de precisão estatística e de estabilidade bastante próximos aos modelos de regressão testados (Tabela 3). As redes neurais treinadas com o CFBP (destacado em negrito) apresentaram resultados um pouco superiores aos apresentados pelas redes com o FFBP, resultados bem próximos aos encontrados para o modelo 5.

Tabela 3
Estatísticas de precisão e estabilidade para as diferentes RNA treinadas com variáveis semelhantes aos modelos de regressão não linear para estimativa da altura de árvores dominantes (Hd)

Os dois tipos de RNA apresentaram visualmente uma dispersão dos resíduos sem tendenciosidades, semelhantes e com o mesmo comportamento ao encontrado pelos modelos de regressão não linear, com maiores erros nas menores idades.

Já para o teste de estabilidade, as RNA apresentaram 46,71 % e 46,76 % de parcelas que permaneceram estáveis na classificação, com os algoritmos FFBP e CFBP, respectivamente. Esses valores em porcentagem representam um total de 4.119 e 4.124 parcelas estáveis, ao passo que o modelo de regressão não linear (modelo 5) alcançou uma estabilidade de 45,54 %, ou seja, um total de 4.019 parcelas estáveis. As RNA conseguiram, portanto, classificar os sítios florestais de forma satisfatória.

As RNA treinadas com adição de variáveis edafoclimáticas e do povoamento tendem a apresentar resultados superiores aos modelos de regressão não linear e das RNA treinadas para estimar altura dominante em função da idade (Tabela 4). A adição de mais variáveis de entrada resulta em um aumento da precisão nas estimativas, podendo gerar benefícios para a técnica da classificação da capacidade produtiva em florestas.

Todas as RNA propostas foram capazes de estimar a altura dominante sem tendenciosidade de resíduos.

De modo geral, as redes neurais treinadas com o CFBP apresentaram uma leve superioridade em relação às redes com o FFBP. Tal resultado é semelhante ao encontrado em trabalhos realizados em outras áreas da ciência, tais como em Diamantopoulou (2012DIAMANTOPOULOU, M. J. Assessing a reliable modeling approach of features of trees through neural network models for sustainable forests. Sustainable Computing: Informatics and Systems, v. 2, p. 190-197, dez. 2012. DOI: 10.1016/j.suscom.2012.10.002
https://doi.org/10.1016/j.suscom.2012.10...
), Tengeleng e Armand (2014TENGELENG, S.; ARMAND, N. Performance of using cascade forward back propagation neural networks for estimating rain parameters with rain drop size distribution. Atmosphere, v. 5, p. 454-472, jun. 2014. DOI: 10.3390/atmos5020454
https://doi.org/10.3390/atmos5020454...
) e Jarndal et al. (2021JARNDAL, A.; HUSAIN, S.; HASHMI, M. Genetic algorithm initialized artificial neural network based temperature dependent small-signal modeling technique for GaN high electron mobility transistors. International Journal RF and Microwave Computer-Aided Engineering, v. 31, n. 3, p. 1-18, mar. 2021. DOI: 10.1002/mmce.22542
https://doi.org/10.1002/mmce.22542...
).

Isso pode ter ocorrido devido as redes CFBP possuírem um efeito em cascata durante o seu treinamento: as suas camadas são ligadas a todas as camadas posteriores, transmitindo os valores de pesos calculados a partir dos dados de entrada, fazendo com que o seu aprendizado seja superior às redes treinadas com o FFBP, que tem apenas a ligação de uma camada com a sua posterior.

A adição de variáveis que descrevem o comportamento do povoamento (área basal e o diâmetro médio quadrático) melhoraram mais a precisão das redes do que a adição de variáveis categóricas (solo e precipitação), posto que os valores de correlação foram superiores a 0,95 e o RMSE% variou entre 6,40 e 7,16%. As RNA 2, 3 e 4, que tiveram como entrada a adição de somente variáveis categóricas, apresentaram valores de coeficiente de correlação e RMSE% próximos aos alcançados pelo modelo de regressão não linear e pelas redes que foram treinadas com apenas a idade como variável de entrada. Özçelik et al. (2013ÖZÇELIK, R. et al. Estimating Crimean juniper tree height using nonlinear regression and artificial neural network models. Forest Ecology and Management, v. 306, p. 52-60, out. 2013. DOI: 10.1016/j.foreco.2013.06.009
https://doi.org/10.1016/j.foreco.2013.06...
) também observaram uma redução nos valores de RMSE para as estimativas geradas por RNA em relação aos modelos de regressão não linear.

Cosenza et al. (2015COSENZA, D. N. et al. Classificação da capacidade produtiva de sítios florestais utilizando máquina de vetor de suporte e rede neural artificial. Scientia Forestalis, Piracicaba, v. 43, n. 108, p. 955-963, dez. 2015. DOI: 10.18671/scifor.v43n108.19
https://doi.org/10.18671/scifor.v43n108....
) mencionam que a inclusão de muitas variáveis pouco significativas pode prejudicar ou ser indiferente no desempenho de redes neurais artificiais. De acordo com autores, para que a classificação ocorra de forma satisfatória, o uso conjunto das variáveis de tipo de solo, espaçamento do plantio, idade e altura dominante foram suficientes para classificar os sítios. A inclusão da idade, nesse caso, foi fundamental, por dar sentido ao valor da altura dominante, de forma que um talhão com idade avançada e baixa altura dominante indicaria baixo potencial produtivo e vice-versa.

As RNA com variáveis edafoclimáticas (tipo de solo e precipitação média) apresentaram um percentual de parcelas estáveis entre 46,14% e 48,24% (Tabela 4). Tais resultados representam um ganho em quantidade de parcelas estáveis obtidas na classificação a partir da RNA 2 do tipo CFBP igual a 200 parcelas em relação aos modelos que estimavam altura dominante somente com a variável idade.

Tabela 4
Estatísticas de precisão e estabilidade para as diferentes RNA treinadas com as demais variáveis para estimativa da altura de árvores dominantes (Hd)

Já para as redes que tiveram a adição de variáveis dendrométricas durante o seu treinamento, a estabilidade de parcelas foi sempre superior a 55%, o que significa um aumento de 6,36% no número de parcelas estáveis, quando comparada a estabilidade do modelo não linear de Chapman e Richards (MOD 1). Na melhor configuração para as redes, na RNA 10, verificou-se uma estabilidade de 58,61% e 58,68%, respectivamente, para as redes treinadas com o FFBP e CFBP (destacados em negrito), o que significa um aumento de 13,06% e 13,14% em estabilidade. Esse ganho em percentual de parcelas que não mudaram de sítio pode parecer pequeno a princípio, contudo ao se considerar o total de parcelas envolvidas neste estudo, verificamos que 1.152 e 1.159 parcelas, respectivamente, passaram a não mudar de sítio com o uso da rede neural para estimar a altura de dominantes.

Assim como nos resultados das estatísticas, foi possível também perceber uma superioridade das redes com o CFBP em relação ao FFBP também no teste de estabilidade: as redes treinadas com o primeiro algoritmo, na maioria das vezes, apresentaram um maior número de parcelas estáveis ao longo do tempo e, consequentemente, um menor número de parcelas que mudaram de sítio nos anos de remedições.

A Tabela 5 mostra o resultado do teste de Qui-quadrado dos três experimentos propostos para comparação da estabilidade da classificação para as abordagens estudadas.

Tabela 5
Teste de Qui-Quadrado para os experimentos de comparação da estabilidade da classificação de sítios (Exp 1, 2 e 3)

Analisando os resultados para o Experimento 1, verifica-se que o único modelo de regressão linear que se diferenciou dos demais modelos avaliados foi o MOD 3 (Logístico). O MOD 5 (Monomolecular) foi o que melhor se ajustou (maior correlação e menor RMSE%) e o que apresentou melhor estabilidade, sendo este então comparado com os resultados de estabilidade obtidos com as RNA treinadas apenas com a variável de entrada idade (Experimento 2).

Os resultados do Experimento 2 indicam não haver diferenças entre o MOD 5 e a RNA 1, treinada com os algoritmos FFBP e CFBP. Esse resultado sugere que embora se observe uma ligeira melhora nas estatísticas de precisão e também na estabilidade da classificação com as alturas estimadas pela rede, a estabilidade foi a mesma obtida com o modelo de regressão não linear. Portanto, modelos de redes neurais com apenas a variável de entrada idade e compatíveis aos modelos clássicos de regressão não linear para estimativa de altura dominante não geram uma classificação da capacidade produtiva mais estável.

Contudo, quando se comparou no Experimento 3, o MOD 5, a RNA 1 (treinada com ambos algoritmos) e a RNA 10 (treinada com FFBP e CFBP) com a introdução de variáveis do povoamento e edafoclimáticas somadas à idade das parcelas no modelo de rede neural, verificou-se que a RNA 10 diferiu estatisticamente das demais abordagens. Esse resultado sugere que a introdução de tais variáveis e a idade para estimar a altura de dominantes geram uma classificação mais estável.

A Figura 1 mostra, para as melhores abordagens, a dispersão entre valores observados e estimados e o valor da estatística F(H0) para o teste F de Graybill.

Figura 1
Dispersão entre valores observados e estimados e estatística F(H0) para o teste F de Graybill de (a) modelo Monomolecular, (b) RNA1 FFBP, (c) RNA1 CFBP, (d) RNA10 FFBP (e) RNA10 CFBP

Na Figura 1, observa-se que para todas as abordagens apontadas como melhores em análises anteriores, a estatística F(H0) foi não significativa, portanto, aceita-se a hipótese Ho, isto é, estatisticamente β0=0 e β1=1, pelo teste F Graybill, a 5% de significância. Pode-se afirmar que as estimativas de altura dominante obtidas pelo modelo Monomolecular (MOD5), RNA1 FFBP, RNA1 CFBP, RNA10 FFBP e RNA10 CFBP são estatisticamente iguais às alturas dominantes observadas. Contudo, observa-se que a dispersão é claramente mais uniforme (com menores erros) para as estimativas com as RNA10 FFBP e RNA10 CFBP, que consideram como entrada além da idade, as variáveis edafoclimáticas e do povoamento. A introdução de tais variáveis na RNA melhorou as estimativas de altura dominante.

Neste estudo, assim como no estudo realizado por Cosenza et al. (2017COSENZA, D. N. Site classification for eucalypt stands using artificial neural network based on environmental and management features. Cerne, Lavras, v. 23, n. 3, p. 310-320, jul./set. 2017. DOI: 10.1590/01047760201723032352
https://doi.org/10.1590/0104776020172303...
), nenhuma distinção entre genótipos e parcelas foi feita durante o processo de ajuste, de forma que a curva para a altura dominante foi ajustada usando o conjunto de dados completo. Os autores supracitados indicam que técnicas de regressão avançadas, como modelos mistos, podem ser aplicadas para melhorar a estimativa do índice do local, uma vez que podem incorporar esses fatores e podem corrigir a autocorrelação serial residual causada pelo uso de dados longitudinais de gráficos permanentes e consequentemente gerar classificações mais estáveis. Os resultados encontrados pelos autores supracitados e neste trabalho reforçam o potencial das redes neurais artificiais para serem aplicadas à modelagem florestal. A classificação de sítios com base em variáveis ​​ambientais e dendrométricas mostrou-se uma boa técnica de mapeamento de sítios e, portanto, pode ser utilizada como ferramenta de apoio aos gestores florestais.

Com isso, recomenda-se a classificação da capacidade produtiva de povoamentos não desbastados, a partir da estimativa da altura de dominantes com modelos tendo como entrada a idade das parcelas, combinadas com área basal e diâmetro médio quadrático, e variáveis edafoclimáticas de solo e precipitação. Especificamente, pela facilidade de introdução de variáveis e flexibilidade da modelagem, recomenda-se ainda que tais modelos, a exemplo deste estudo, sejam obtidos a partir do treinamento de redes neurais de múltiplas camadas (MLP), com os algoritmos Feed Forward Back Propagation Network (FFBP) e Cascade Forward Back Propagation Network (CFBP).

4 CONCLUSÃO

Nas condições em que este estudo foi conduzido, os resultados permitiram as seguintes conclusões:

  • Não há diferença na precisão das estimativas e estabilidade da classificação de sítios entre as redes neurais artificiais treinadas com os algoritmos FFBP e CFBP e o melhor modelo de regressão não linear, quando é usada apenas a idade como variável de entrada da RNA;

  • As redes neurais treinadas com o algoritmo CFBP apresentam resultados ligeiramente superiores às redes treinadas com o FFBP;

  • A introdução de variáveis do povoamento como área basal, diâmetro médio quadrático, combinado com a idade das parcelas e variáveis categóricas de solo e precipitação no treinamento das redes como variáveis de entrada, melhora a precisão das estimativas das alturas dominantes e gera uma classificação da capacidade produtiva mais estável que os modelos de regressão não linear.

Referências

  • BINOTI, M. L. M. S. et al. Aplicação de redes neurais artificiais para estimação da altura de povoamentos equiâneos de eucalipto. Revista Árvore, Viçosa, v. 37, n. 4, p. 639-645, ago. 2013. DOI: 10.1590/S0100-67622013000400007
    » https://doi.org/10.1590/S0100-67622013000400007
  • COSENZA, D. N. Site classification for eucalypt stands using artificial neural network based on environmental and management features. Cerne, Lavras, v. 23, n. 3, p. 310-320, jul./set. 2017. DOI: 10.1590/01047760201723032352
    » https://doi.org/10.1590/01047760201723032352
  • COSENZA, D. N. et al. Classificação da capacidade produtiva de sítios florestais utilizando máquina de vetor de suporte e rede neural artificial. Scientia Forestalis, Piracicaba, v. 43, n. 108, p. 955-963, dez. 2015. DOI: 10.18671/scifor.v43n108.19
    » https://doi.org/10.18671/scifor.v43n108.19
  • DIAMANTOPOULOU, M. J. Assessing a reliable modeling approach of features of trees through neural network models for sustainable forests. Sustainable Computing: Informatics and Systems, v. 2, p. 190-197, dez. 2012. DOI: 10.1016/j.suscom.2012.10.002
    » https://doi.org/10.1016/j.suscom.2012.10.002
  • FIORENTIN, L. D. et al. Modelos não lineares aplicados para classificação de sítios florestais de Pinus elliottii e Pinus taeda. Revista Brasileira de Biometria, Lavras, v. 35, n. 3, p. 474-496, set. 2017. Disponível em: https://biometria.ufla.br/index.php/BBJ/article/view/70/115 Acesso em: 09 ago. 2021.
    » https://biometria.ufla.br/index.php/BBJ/article/view/70/115
  • JARNDAL, A.; HUSAIN, S.; HASHMI, M. Genetic algorithm initialized artificial neural network based temperature dependent small-signal modeling technique for GaN high electron mobility transistors. International Journal RF and Microwave Computer-Aided Engineering, v. 31, n. 3, p. 1-18, mar. 2021. DOI: 10.1002/mmce.22542
    » https://doi.org/10.1002/mmce.22542
  • LEITE, H. G. et al. Redes neurais artificiais para a estimação da densidade básica da madeira. Scientia Forestalis , Piracicaba, v. 44, n. 109, p. 149-154, mar. 2016. DOI: 10.18671/scifor.v43n109.14
    » https://doi.org/10.18671/scifor.v43n109.14
  • LEITE, H. G. et al. Estimation of inside-bark diameter and heartwood diameter for Tectona grandis Linn. trees using artificial neural networks. European Journal of Forest Research, v.130, n.2, p.263-269, mar. 2011. DOI: 10.1007/s10342-010-0427-7
    » https://doi.org/10.1007/s10342-010-0427-7
  • ÖZÇELIK, R. et al. Estimating Crimean juniper tree height using nonlinear regression and artificial neural network models. Forest Ecology and Management, v. 306, p. 52-60, out. 2013. DOI: 10.1016/j.foreco.2013.06.009
    » https://doi.org/10.1016/j.foreco.2013.06.009
  • SANTOS, C. J. Regressão não linear quantílica para classificação de sítio em povoamentos de Eucalyptus sp. Scientia Forestalis , Piracicaba, v. 46, n. 120, p. 551-561, dez. 2018. DOI: 10.18671/scifor.v46n120.04
    » https://doi.org/10.18671/scifor.v46n120.04
  • SCHUCHOVSKI, M. S. et al. Altura dominante e índice de sítio para Pinus taeda em dois polos de desenvolvimento florestal no sul do Brasil. Scientia Forestalis , Piracicaba, v. 47, n. 121, p. 92-104, mar. 2019. DOI: 10.18671/scifor.v47n121.09
    » https://doi.org/10.18671/scifor.v47n121.09
  • SILVA, F. DA. et al. Classificação de sítio para Pinus caribaea var. hondurensis na região do Triângulo Mineiro. Revista Acadêmica: Ciências Agrárias e Ambientais, Curitiba, v. 11, Supl. 1, p. S105-S112, 2013. DOI: 10.7213/academica.10.S01.AO12
    » https://doi.org/10.7213/academica.10.S01.AO12
  • SOARES, G. M. et al. Redes neurais artificias (RNA) para estimativa de altura em um plantio misto de Eucalyptus globulus LABILL e Acacia mearnsii de WILD. Revista Árvore , Viçosa, v. 45:e4512, p. 1-9, ago. 2021. DOI: 10.1590/1806-908820210000012
    » https://doi.org/10.1590/1806-908820210000012
  • SOUZA, P. D. et al. Performance da modelagem para classificação de sítios florestais em bases de dados com outliers. Nativa, Sinop, v. 9, n. 1, p. 54-61, 2021. DOI: 10.31413/nativa.v9i1.11202
    » https://doi.org/10.31413/nativa.v9i1.11202
  • TENGELENG, S.; ARMAND, N. Performance of using cascade forward back propagation neural networks for estimating rain parameters with rain drop size distribution. Atmosphere, v. 5, p. 454-472, jun. 2014. DOI: 10.3390/atmos5020454
    » https://doi.org/10.3390/atmos5020454
  • TÉO, S. J.; BRESSAN, D. R.; COSTA, R. H. da. Uso de modelos estatísticos para classificação de sítios em povoamentos de Pinus taeda na região de Caçador - SC. Revista Floresta, Curitiba, PR, v. 41, n. 1, p. 179-188, jan./mar. 2011. DOI: 10.5380/rf.v41i1.21201
    » https://doi.org/10.5380/rf.v41i1.21201
  • Agradecimentos

    À Fundação de Amparo à Pesquisa do Estado de Minas Gerais - FAPEMIG, pelo financiamento deste estudo.

Datas de Publicação

  • Publicação nesta coleção
    28 Nov 2022
  • Data do Fascículo
    Jul-Sep 2022

Histórico

  • Recebido
    09 Ago 2021
  • Aceito
    04 Abr 2022
  • Publicado
    22 Set 2022
Universidade Federal de Santa Maria Av. Roraima, 1.000, 97105-900 Santa Maria RS Brasil, Tel. : (55 55)3220-8444 r.37, Fax: (55 55)3220-8444 r.22 - Santa Maria - RS - Brazil
E-mail: cienciaflorestal@ufsm.br