Accessibility / Report Error

Ajuste de modelos estocásticos lineares e não-lineares para a descrição do perfil longitudinal de árvores

Fitting linear and nonlinear stochastic models to describe longitudinal tree profile

Resumos

Os modelos polinomiais são mais difundidos no meio florestal brasileiro na descrição do perfil de árvores devido à sua facilidade de ajuste e precisão. O mesmo não ocorre com os modelos não-lineares, os quais possuem maior dificuldade de ajuste. Dentre os modelos não-lineares clássicos, na descrição do perfil, podem-se citar o de Gompertz, o Logístico e o de Weibull. Portanto, este estudo visou comparar os modelos lineares e não lineares para a descrição do perfil de árvores. As medidas de comparação foram o coeficiente de determinação (R²), o erro-padrão residual (s yx), o coeficiente de determinação corrigido (R²ajustado), o gráfico dos resíduos e a facilidade de ajuste. Os resultados ressaltaram que, dentre os modelos não-lineares, o que obteve melhor desempenho, de forma geral, foi o modelo Logístico, apesar de o modelo de Gompertz ser melhor em termos de erro-padrão residual. Nos modelos lineares, o polinômio proposto por Pires & Calegario foi superior aos demais. Ao comparar os modelos não-lineares com os lineares, o modelo Logístico foi melhor em razão, principalmente, do fato de o comportamento dos dados ser não-linear, à baixa correlação entre os parâmetros e à fácil interpretação deles, facilitando a convergência e o ajuste.

Modelos estocáticos; função de afilamento; taper


Polynomial models are most commonly used in Brazilian forestry for taper modeling due to its straightforwardly fitting and precision. The use of nonlinear regression classic models, like Gompertz, Logistic and Weibull, is not very common in Brazil. Therefore, this study aimed to verify the best nonlinear and linear models, and among these the best model to describe the longitudinal tree profile. The comparison measures were: R², syx, R²adjusted, residual graphics and fitting convergence. The results pointed out that among the non-linear models the best behavior, in general, was given by the Logistic model, although the Gompertz model was superior compared with the Weibull model in terms of residual standard error (syx). Among the linear models, the polynomial by Pires and Calegario proved to be better than the others. When comparing non-linear models with linear models, the Logistic model was better mainly because of the behavior of the data, the low correlation between the parameters and in meaning, facilitating convergence and adjustment.

Stochastics models; taper; Eucalyptus spp


Ajuste de modelos estocásticos lineares e não-lineares para a descrição do perfil longitudinal de árvores

Fitting linear and nonlinear stochastic models to describe longitudinal tree profile

Leonardo Machado PiresI; Natalino CalegarioII

IAvenida Governador Valadares, 705, Centro, 38160-000 Nova Ponte-MG

IIUniversidade Federal de Lavras, Campus, 37200-000 Lavras-MG. E-mail: <calegari@ufla.br>

RESUMO

Os modelos polinomiais são mais difundidos no meio florestal brasileiro na descrição do perfil de árvores devido à sua facilidade de ajuste e precisão. O mesmo não ocorre com os modelos não-lineares, os quais possuem maior dificuldade de ajuste. Dentre os modelos não-lineares clássicos, na descrição do perfil, podem-se citar o de Gompertz, o Logístico e o de Weibull. Portanto, este estudo visou comparar os modelos lineares e não lineares para a descrição do perfil de árvores. As medidas de comparação foram o coeficiente de determinação (R2), o erro-padrão residual (syx), o coeficiente de determinação corrigido (R2ajustado), o gráfico dos resíduos e a facilidade de ajuste. Os resultados ressaltaram que, dentre os modelos não-lineares, o que obteve melhor desempenho, de forma geral, foi o modelo Logístico, apesar de o modelo de Gompertz ser melhor em termos de erro-padrão residual. Nos modelos lineares, o polinômio proposto por Pires & Calegario foi superior aos demais. Ao comparar os modelos não-lineares com os lineares, o modelo Logístico foi melhor em razão, principalmente, do fato de o comportamento dos dados ser não-linear, à baixa correlação entre os parâmetros e à fácil interpretação deles, facilitando a convergência e o ajuste.

Palavras-chave: Modelos estocáticos, função de afilamento e taper.

ABSTRACT

Polynomial models are most commonly used in Brazilian forestry for taper modeling due to its straightforwardly fitting and precision. The use of nonlinear regression classic models, like Gompertz, Logistic and Weibull, is not very common in Brazil. Therefore, this study aimed to verify the best nonlinear and linear models, and among these the best model to describe the longitudinal tree profile. The comparison measures were: R2, syx, R2adjusted, residual graphics and fitting convergence. The results pointed out that among the non-linear models the best behavior, in general, was given by the Logistic model, although the Gompertz model was superior compared with the Weibull model in terms of residual standard error (syx). Among the linear models, the polynomial by Pires and Calegario proved to be better than the others. When comparing non-linear models with linear models, the Logistic model was better mainly because of the behavior of the data, the low correlation between the parameters and in meaning, facilitating convergence and adjustment.

Keywords: Stochastics models, taper and Eucalyptus spp.

1. INTRODUÇÃO

A forma dos fustes arbóreos pode variar entre espécies e, mesmo, dentro de uma mesma espécie, em função de tratamentos silviculturais, localização geográfica e outros fatores que afetam a interação genótipo ambiente. Vários autores, como Chapman e Meyer (1949), Loetsch et al. (1973) e Husch et al. (1982), concluíram que a forma do tronco é basicamente descrita como um neilóide na base, um parabolóide no meio e um cone no topo, não sendo possível a determinação exata da transição de um sólido para o outro ao longo do tronco.

Os estudos sobre a modelagem da forma da árvore vêm sendo desenvolvidos intensamente desde o século XIX. A primeira tentativa de expressar a forma média do tronco através de uma equação matemática e estatística ocorreu em 1903, com Höjer.

A partir de então, vários autores como Jonson (1911), Wright (1923), Behre (1923, 1927) e Matte (1949), dentre outros, estudaram, de maneira pormenorizada, a possibilidade de a forma da árvore ser representada por expressões matemáticas e, ou, estatísticas.

Dentre os vários modelos, Lima (1986) caracterizou os seguintes modelos:

- Polinomiais: em que o ajuste é baseado nos mínimos quadrados e normalmente a variável dependente é dada pela razão entre os diâmetros superiores e o diâmetro medido a 1,30 m do solo (d/D) ou, algumas vezes, a variável dependente é expressa pelo quadrado da razão desses diâmetros (d/D)2. As variáveis independentes são expressas por razões de alturas comerciais e total (h/H), principalmente.

- Sigmoidais: funções que permitem pontos de inflexão, bem como apresentam característica de grande flexibilidade no ajuste dos dados observados de diferentes relações biológicas. Essas equações normalmente são derivadas da função de Chapman-Richards e são apresentadas por Garay (1979) e Biging (1984).

- Compatíveis: assim chamados em razão da compatibilidade nas estimativas entre equações de taper e equações de volume. A compatibilidade é verificada integrando-se as áreas seccionais ao longo do tronco, produzindo estimativas semelhantes àquelas obtidas pela equação de volume, do qual a equação de taper foi derivada. Um procedimento compatível com equações de volume foi desenvolvido por Demaerschalk (1971, 1972).

Além desses modelos, Guimarães e Leite (1992) mencionaram aqueles definidos por análise multivariada, que se baseiam na análise de componentes principais para investigar as variações na estrutura dos dados e, então, definir o modelo de regressão a ser utilizado para descrever o perfil das árvores, citando Fries e Matern (1966) como precursores dessa técnica. Esses autores mencionaram também os modelos segmentados para estimar diâmetros e descrever o perfil arbóreo, os quais se constituem no uso de três submodelos justapostos, cada um representando uma porção do tronco, cuja união se dá por meio da imposição de restrições ao modelo geral, ajustados para seções inferiores, média e superior do tronco, mencionado, como exemplo, por Max e Burkhart (1976) e Cao et al. (1980). Entretanto, admitem-se certas dificuldades na predição de volumes parciais e na forma do tronco, quando aplicados os modelos de taper.

No Brasil, estudos sobre a modelagem da forma de árvores, em sua grande maioria, estão relacionados a florestas eqüiâneas puras, com espécies como Pinus spp. e Eucalyptus spp. (CAMPO e RIBEIRO, 1982; GUIMARÃES e LEITE, 1992; SCHNEIDER et al., 1996), utilizando principalmente modelos polinomiais.

A utilização de modelos lineares, principalmente os polinomiais, é muito difundida no meio florestal brasileiro, podendo ser citados, nesse caso, os trabalhos de Rios (1997), Assis (1998) e Thiersch (1999). Todavia, modelos não-lineares como Gompertz, Logístico e Weibull raramente são utilizados para o ajuste de funções de afilamento. Como exceção, pode-se citar o trabalho de Calegario (2002). Uma das justificativas da não-utilização desses modelos é quanto à dificuldade de ajuste e convergência. Porém, com a evolução tecnológica atual de softwares e hardwares esses ajustes são menos problemáticos para serem obtidos.

O coeficiente de determinação ajustado (R2ajustado) e o erro-padrão residual (syx) são as principais ferramentas estatísticas para a seleção de um modelo estatístico de descrição do perfil da árvore. Além desses, o gráfico de resíduo proporciona uma análise complementar de grande valia para verificar tendências e possíveis problemas com as equações ajustadas.

Portanto, este estudo consistiu em comparar os modelos lineares (polinomiais) com os não-lineares, para a descrição longitudinal do perfil da árvore.

2. MATERIAL E MÉTODOS

Os dados são provenientes da empresa Aracruz Celulose S.A., localizada nos Estados do Espírito Santo e da Bahia, na Região Sudeste do Brasil. Foram cubadas rigorosamente 160 árvores de Eucalyptus com diferentes idades, em diversos sítios e por classes diamétricas. Os diâmetros foram agrupados em oito classes, variando de 5 a 25 cm, com 20 árvores por classe. Para a cubagem rigorosa, foi utilizada a fórmula de Smalian e medidas nas posições de DAP e 0; 1,4; 2,8; 4,2; 5,6 m, e assim por diante, a cada 1,4 m, conforme o seu comprimento, até um limite de 5 cm de diâmetro.

O ajuste dos modelos lineares e não-lineares foi feito agrupando-se as classes diamétricas com base na relação diâmetro-altura do perfil do tronco da árvore, conforme Figura 1. A classe 2 representa árvores com DAP entre 6 e 8 cm crescendo em intervalos de 2 cm nas demais classes. As classes 2, 3 e 4 foram discriminadas como grupo 1, as classes 5 e 6 como grupo 2 e as classes 7 e 8 como grupo 3, segundo as semelhanças na assíntota horizontal superior e no ponto de inflexão.


A seguir são apresentados os modelos lineares (polinômios) utilizados para comparação com os não-lineares.

Dentre os modelos lineares que se destacam, o Polinômio de 5º grau é dado por:

em que: hij = variável dependente, altura estimada nas várias seções diamétricas; dij= diâmetro medido nas várias alturas hi; eij= erro da estimativa; b0, b1, b2, b3, b4 e b5= parâmetros estimados; dapj = diâmetro a 1,30 m; e htj = altura total da árvore.

Outro polinômio, conhecido por Potências Fracionárias e Inteiras, ou de Hradetzky (1976), é dado por:

onde: hij, dij , dapj, htj, bij e eij já foram definidos; e p = expoentes testados.

Os expoentes testados para construir esse modelo variaram de 0,00001 a 95.

Finalmente, o último modelo linear testado foi o polinômio proposto por Pires e Calegario, (2004) o qual possui a seguinte estrutura:

em que:hij, dij , dapj, htj, bi, eij e pi já foram definidos, sendo basej = e Conij = . Os expoentes testados foram 0,5; 1; 2; 3; 4; e 5.

Dentre os modelos não-lineares, estão:

em que: hij= altura observada nas várias seções diamétricas; dij = diâmetro medido nas várias alturas hij; e = exponencial; f1, f 2 e f 3 = parâmetros estimados pelo modelo; e eij = erro da estimativa.

Ao comparar os modelos não-lineares com os lineares, as medidas de acurácia utilizadas foram o erro-padrão residual (syx), o coeficiente de determinação (R2) e o gráfico de resíduo. O melhor modelo linear foi comparado com o melhor modelo não-linear pelo gráfico de perfil longitudinal da árvore média.

3. RESULTADOS E DISCUSSÃO

Os modelos lineares e não-lineares foram ajustados, e suas medidas de acurácia estão representadas na Tabela 1.

Os modelos não-lineares foram comparados pelo R2 e syx, enquanto os modelos lineares, pelo R2aj.. A comparação entre lineares e não lineares foi feita pelo syx.

O modelo Logístico foi melhor que os demais modelos não-lineares no grupo de classe 2, juntamente com o modelo de Gompertz no grupo 3. No grupo 1, o melhor foi o modelo de Weibull, apresentando maior valor de (R2). Ainda, dentre os modelos não-lineares, o melhor, em termos de syx (erro-padrão residual), foi o modelo de Gompertz, em todas as classes avaliadas. Porém, todos obtiveram valores muito próximos entre si, com pequenas diferenças.

Para os modelos lineares, o melhor em todas as classes avaliadas, baseado no R2aj. e syx, foi o modelo de Pires e Calegario, que obteve maior valor de (R2aj.) em todas as classes e menor valor de syx.

Ao comparar os modelos não-lineares com os lineares, utilizando o erro-padrão residual (syx), o melhor de todos os modelos foi o linear Pires e Calegario, em todas as classes avaliadas.

Vale comentar que, apesar da melhor "performance" dos modelos lineares em termos de syx, os modelos não-lineares possuem as seguintes características desejáveis: parcimônia (evita excesso de parâmetros), interpretação (os parâmetros são interpretáveis) e extrapolação (maior segurança ao se utilizar o modelo em outro conjunto de dados).

Nas Figuras 2 e 3 são apresentados os gráficos dos resíduos padronizados versus a altura estimada nos modelos (linear e não-linear) que apresentaram as melhores medidas de precisão.



Pode-se notar nos gráficos de resíduo padronizado das Figuras 2 e 3 que o comportamento do resíduo no modelo Logístico e o de Pires e Calegario foram semelhantes na forma de distribuição. Porém, este último obteve uma concentração maior dos resíduos. No grupo 1, o resíduo, em todos os modelos, apresentou formato de um quadrado. No polinômio, esse formato foi menos característico, o que demonstra que, nesse agrupamento de classe, houve algum problema na união das classes 2, 3 e 4, ou em seus dados amostrais. O polinômio proposto por Pires e Calegario apresentou as melhores distribuições gráficas do resíduo que os demais modelos, em todas as classes diamétricas testadas na forma de agrupamento.

Modificação do Modelo Logístico

Devido às diferenças na matriz de co-variância entre os modelos lineares e os não-lineares, o modelo Logístico foi modificado para ser comparado com o modelo linear selecionado, passando a possuir a seguinte forma:

Pode-se notar nos gráficos de resíduo padronizado das Figuras 2 e 3 que o comportamento do resíduo no modelo Logístico e o de Pires e Calegario foram semelhantes na forma de distribuição. Porém, este último obteve uma concentração maior dos resíduos. No grupo 1, o resíduo, em todos os modelos, apresentou formato de um quadrado. No polinômio, esse formato foi menos característico, o que demonstra que, nesse agrupamento de classe, houve algum problema na união das classes 2, 3 e 4, ou em seus dados amostrais. O polinômio proposto por Pires e Calegario apresentou as melhores distribuições gráficas do resíduo que os demais modelos, em todas as classes diamétricas testadas na forma de agrupamento.

Modificação do Modelo Logístico

Devido às diferenças na matriz de co-variância entre os modelos lineares e os não-lineares, o modelo Logístico foi modificado para ser comparado com o modelo linear selecionado, passando a possuir a seguinte forma:

em que: htj, dapj, dij, hij, e, f 1, f 2, f3 e eij já foram definidos anteriormente.

Os parâmetros ajustados e as respectivas medidas de precisão estão descritos na Tabela 2.

Como pôde ser observado, o ajuste gerou diferentes parâmetros, e suas medidas de precisão foram melhores em todos os grupos, em comparação com aquelas obtidas no modelo Logístico sem modificação. Isso se deve a uma melhor representação da variabilidade dos dados ao se adicionarem novas variáveis relacionadas com a variável dependente, como é o caso da altura total e o diâmetro à altura do peito (dap). Ao comparar esse ajuste com o melhor modelo linear, observou-se que, ainda assim, o modelo linear é superior ao modelo Logístico, em todas as medidas de acuracidade e em todos os grupos. O mesmo pôde ser observado na distribuição do resíduo apresentada na Figura 3.

Comparando os gráficos de resíduo padronizado do primeiro e do segundo ajuste do modelo Logístico, pode se verificar que o novo ajuste melhorou a distribuição do resíduo em todos os grupos.

Comparação dos Perfis Longitudinais das Árvores

A comparação dos perfis longitudinais das árvores é uma forma de verificar a precisão do modelo utilizado e comparar os respectivos valores estimados com o valor real médio em cada posição seccional da árvore. Dessa forma, pode-se antever em qual posição o modelo é mais preciso e em qual é menos.

Na Figura 4 são apresentados os gráficos dos perfis médios real e estimado pelo modelo Logístico, bem como o polinômio proposto por Pires e Calegario (2004), nos grupos 1, 2 e 3.


Verifica-se, na Figura 5, que o polinômio proposto por Pires e Calegario se adequou melhor que o modelo logístico, principalmente no grupo 1. Nos demais grupos, este continuou superior, porém com menor diferença em relação ao modelo Logístico. Também nessa figura, pode-se observar que a altura estimada pelo modelo Logístico foi satisfatória no grupo 1, com uma pequena tendência no início do tronco. Obteve um resultado bom nos grupos 2 e 3.


Algumas considerações devem ser feitas ao comparar o modelo Logístico com o polinômio proposto por Pires e Calegario. Primeiramente, o polinômio proposto por Pires e Calegario possui maior correlação entre os parâmetros, podendo ocasionar tendências na estimativa, devido à alta multicolinearidade. Outra observação a ser feita é quanto às "novas" variáveis adicionadas no polinômio (cone e base) que proporcionaram melhor ajuste do modelo aos dados, pois oferecem a medida de forma da árvore. Porém, essas variáveis são de difícil obtenção ou pouco operacionais em nível de campo, com implicação direta no custo da operação.

4. CONCLUSÃO

- O polinômio proposto por Pires e Calegario foi o melhor dentre os polinômios nas medidas do R2ajustado, syx, na distribuição gráfica dos resíduos padronizados e na correlação entre os parâmetros.

- O modelo Logístico é o melhor modelo não-linear devido à sua melhor interpretação dos parâmetros, facilitando o processo de convergência e à melhor distribuição dos resíduos padronizados.

- O modelo de Gompertz pode ser utilizado com segurança, sendo superior ao modelo de Weibull.

- A modificação no modelo Logístico proporcionou melhores resultados de acurácia.

- Ao comparar os modelos lineares com os não-lineares, o melhor foi o Logístico, por apresentar características desejáveis, como interpretação dos parâmetros, parcimônia e extrapolação dos dados.

5. REFERÊNCIAS

Recebido em 19.09.2006 e aceito para publicação em 29.03.2007.

  • ASSIS, A. L. Acuracidade na estimativa de volumes comerciais de Eucalyptus grandis e Eucalyptus urophylla Lavras: Universidade Federal de Lavras, 1998. 183p. Monografia.
  • BEHRE, C. E. Preliminary notes on studies of tree form. Journal Forest, v.21, p.507-511. 1923.
  • BEHRE, C. E. Form-class taper curves and volume tables and their application. Journal. Agricultural Research, v.35, n.8, p.673-743, 1927.
  • BIGING, G. S. Taper equations for second mixed-conifers of Nothern California. Forest Science, v.30, n.4, p.1103-1117, 1984.
  • CALEGARIO, N. Modeling Eucalyptus stand growth based on linear and nonlinear mixed-effects models 2002. 129f. Tese(Doutorado em Ciência Florestal)-University of Georgia, Athens, 2002 .
  • CAMPOS, J. C. C.; RIBEIRO, J. C. Avaliação de dois modelos de taper em árvores de Pinus patula Revista Árvore, v.6, n.2, p.140-149, 1982.
  • CAO, Q. V.; BURKHART, H. E.; MAX, T. A. Evaluation of two methods for cubic volume equations. Forest Science, v.26, p.71-120, 1980.
  • CHAPMAN, H. H.; MEYER, W. H. Forest Mensuration New York: McGraw-Hill, 1949. 522p.
  • DEMAERSCHALK, J. P.. Converting volume equations to compatible taper equations. Forest Science, v.18, n.3, p.241-245,1972.
  • DEMAERSCHALK, J. P. Taper equations can be converted volume equations and point sampling factors. The Forestry Chronicle, v.47, n.6, p.352-354, 1971.
  • GARAY, L. Tropical forest utilization system. VIII. A taper model for entire stemprofile including buttressing. Coll. Forest. Resour., Inst. Forest Prod. Univ. Wash. 1979. 64p. (contrib. 36).
  • GUIMARÃES, D. P.; LEITE, H. G. Um novo modelo para descrever o perfil do tronco. Revista Árvore, v.16, n.2, p.170-180, 1992.
  • HRADETZKY, J. Analyse und interpretation statistisher Abhängigkeiten (Biometrische Beiträge zu aktuellen Forschungsprojekten). Baden: Württemberg Mitteilungen der FVA, 1976. 146p. (Abt. Biometric und Informatik, 21).
  • HUSCH, B.; MILLER, C. L.; BEERS, T. E. Forest mensuration. 3.ed. New York: J. Wiley & Sons, 1982. 397p.
  • JONSON, T. Taxatoriska undersokningar om skogstradens form. II. Tallens Stamform. Skogsvardsforen Tidskr, v.10, p.285-328, 1911.
  • LIMA, F. S. Análise de funções de Taper destinadas à avaliação de multiprodutos de árvores de Pinus elliottii: 1986. 79f. Dissertação( Mestrado em Engenharia Florestal). Universidade Federal de Viçosa, Viçosa, MG, 1986.
  • LOETSCH, F.; ZOHRER, F.; HALLER, K. E. Forest inventory Bern, Verlagsgesellschaft München, 1973. v.2. 469p.
  • MATTE, L. The taper of coniferous species with special reference to loblolly pine. Forest Chronique, v.25,p.21-31,1949.
  • MAX, T. A.; BURKHART, H. E. Segmented polynomial regression applied to taper equations. Forest Science, v.22, p.283-289, 1976.
  • PIRES, L.M.; CALEGARIO N. Modelos estocásticos lineares para a descrição do perfil longitudinal de árvores 49şRBRAS. Uberlândia, 2004. p.1-5.
  • RIOS, M. S. A eficiência das funções polinomiais, da função Spline cúbica, e razões de volume para representar o perfil da árvore e estimar os sortimentos de Pinus elliottii.Lavras, 1997.116p. Dissertação (Mestrado em Engenharia Florestal) Universidade de Lavras, Lavras, 1997.
  • SCHNEIDER, P. R. et al.Forma de tronco e sortimentos de madeira de Eucalyptus grandis Maiden para o estado do Rio Grande do Sul. Ciência Florestal, v.6, n.1, p.79-88, 1996.
  • THIERSCH, C. R..Acuracidade dos modelos polinomiais para representar os perfis dos fustes de clones de Eucalyptus grandis Lavras: Universidade Federal de Lavras, 1999. 35p. (Monografia).

Datas de Publicação

  • Publicação nesta coleção
    10 Dez 2007
  • Data do Fascículo
    Out 2007

Histórico

  • Recebido
    19 Set 2006
  • Aceito
    29 Mar 2007
Sociedade de Investigações Florestais Universidade Federal de Viçosa, Departamento de Engenharia Florestal, Avenida Purdue, s/nº - Campus Universitário UFV, CEP: 36570-900, Tel.: (+55 31) 3612-3959 - Viçosa - MG - Brazil
E-mail: rarvore@sif.org.br