Acessibilidade / Reportar erro

Sistema Computacional para Ajuste de Funções Densidade de Probabilidade

Computer System for Adjusting the Probability Density Functions

RESUMO

Este trabalho teve por objetivo iniciar, implementar e validar um projeto de construção de um sistema computadorizado para ajuste de funções densidade de probabilidade. O FitFD foi desenvolvido utilizando-se a linguagem de programação Java. Como ambiente de desenvolvimento foram utilizadas a IDE (Integrated Development Environment) Netbeans 7.1 e a JDK 7.3 (Java Development Kit). Os testes do sistema foram realizados em ambiente Windows. Foram implementadas no sistema as seguintes funções densidade de probabilidade: Weibull (2P, 3P, 2P com dap mínimo como locação, 3P truncada), hiperbólica (2P, 3P, 2P com dap mínimo como locação, 3P truncada), log-logística (2P, 3P, 2P com dap mínimo como locação), logística generalizada, Fatigue life (2P e 3P) e Frechet (2P e 3P). O sistema desenvolvido auxilia os usuários na definição e escolha da fdp que melhor atenda suas necessidades, contudo melhorias são necessárias. O projeto iniciado mostrou-se eficiente para ajustes de funções de densidade probabilidade.

Palavras-chave:
FitFD; modelos de distribuição diamétrica; multiprodutos

ABSTRACT

This study aimed to initiate, implement and validate a project to build a computerized system to adjust probability density functions. The FitFD was developed using the Java programming language. IDE (Integrated Development Environment) NetBeans 7.1 and JDK 7.3 (Java Development Kit) were used as the development environment. The system was tested in Windows. The following probability density functions were implemented in the system: Weibull (2P, 3P, 2P with minimum dbh, truncated 3P), hyperbolic (2P, 3P, 2P with minimum dbh, truncated 3P), Log- logistic (2P, 3P, 2P with minimum dbh), Logistics Generalized, Fatigue Life (2P and 3P) and Frechet (2P and 3P) . The system developed assists users in defining and choosing fdp that best meet their needs, however improvements are needed. The project proved efficient for adjustments of probability density functions.

Keywords:
FitFD; models of diameter distribution; multiproduct

1 INTRODUÇÃO

O conhecimento da distribuição diamétrica de povoamentos florestais é essencial para se inferir sobre a dinâmica de crescimento e relações entre as árvores. Isso auxilia a tomada de decisão sobre intervenções a serem realizadas no povoamento, como desbaste, desrama e colheita (Campos & Leite, 2009Campos JCC, Leite HG. Mensuração florestal: perguntas e respostas. 3. ed. Viçosa: Editora UFV; 2009. 548 p.), bem como permite uma análise econômica mais precisa, visto que quase a totalidade dos coeficientes operacionais das operações de colheita e transporte são influenciados pelas dimensões das árvores (Clutter et al., 1983Clutter JL, Fortson JC, Pienaar LV, Brister GH, Bailey RL. Timber management: a quantitative approach. New York: Wiley; 1983.).

A descrição das estimativas de frequência por classe diamétrica é feita pelo emprego de funções densidade de probabilidade (fdp), como: Weibull, normal, log-normal, gama, Johnson’s SB, beta, log-logística, Cauchy, Frechet, Erlang, Rayleigh, e hiperbólica (Binoti, 2008Binoti DHB. Funções densidade de probabilidade para a descrição da distribuição diamétrica de povoamentos desbastados de Tectona grandis [monografia]. Viçosa: Departamento de Engenharia Florestal, Universidade Federal de Viçosa; 2008.; Leite et al., 2010Leite HG, Binoti DHB, Guimarães DP, Silva MLM, Garcia SLR. Avaliação do ajuste das funções Weibull e hiperbólica a dados de povoamentos de eucalipto submetidos a desbaste. Revista Árvore 2010; 34(2): 305-311. http://dx.doi.org/10.1590/S0100-67622010000200013.
http://dx.doi.org/10.1590/S0100-67622010...
; Binoti et al., 2012Binoti DHB, Binoti MLMS, Leite HG, Fardin LP, Oliveira JC. Probability density functions for description of diameter distribution in thinned stands of Tectona grandis.Cerne 2012; 18(2): 185-196. http://dx.doi.org/10.1590/S0104-77602012000200002.
http://dx.doi.org/10.1590/S0104-77602012...
). A escolha de uma dessas fdp é determinante para a qualidade das estimativas da distribuição diamétrica futura (Binoti, 2008Binoti DHB. Funções densidade de probabilidade para a descrição da distribuição diamétrica de povoamentos desbastados de Tectona grandis [monografia]. Viçosa: Departamento de Engenharia Florestal, Universidade Federal de Viçosa; 2008.).

A recuperação da distribuição de diâmetros futura se dá pela estimação dos parâmetros da fdp em função de características do povoamento como idade, densidade, índice de local, diâmetro mínimo e diâmetro máximo, dentre outras. Um das etapas mais trabalhosas para a construção de um modelo de distribuição de diâmetros consiste no ajuste das fdp a cada parcela e medição. Como ferramentas gratuitas que permitem o ajuste de diferentes fdp bem como a análise gráfica dos ajustes são escassas na área florestal, idealizou-se esse trabalho, o qual.teve por objetivo iniciar, desenvolver, implementar e validar um projeto de construção de um sistema computadorizado para ajuste de funções de densidade probabilidade.

2 MATERIAL E MÉTODOS

2.1 Desenvolvimento do projeto

O FitFD foi desenvolvido utilizando-se a linguagem de programação Java. Como ambiente de desenvolvimento foram utilizadas a IDE (Integrated Development Environment) Netbeans 7.1 e a JDK 7.3 (Java Development Kit). Os testes do sistema foram realizados em ambiente Windows. O sistema utiliza a biblioteca Michael Thomas Flanagan's Java Scientific Library para a obtenção dos parâmetros.

2.2 Funções de densidade probabilidade

Para o sistema desenvolvido optou-se pela implementação das funções de densidade probabilidade descritas abaixo.

2.2.1 Função Weibull

A fdp da função Weibull de três parâmetros (3P) (Equação 1) pode ser descrita como:

f ( x ) = { γ β ( x α β ) ( γ 1 ) ( exp ( ( x α β ) γ ) ) (1)

em que α é o parâmetro de locação, β, o parâmetro de escala (β > 0), γ, o parâmetro de forma (γ > 0) e x é o centro de classe de diâmetro (x > 0). A supressão do parâmetro de locação da função caracteriza a função Weibull de dois parâmetros (2P) (Equação 2):

f ( x ) = { γ β ( x β ) ( γ 1 ) ( exp ( ( x β ) γ ) ) (2)

O parâmetro de locação pode ser substituído pelo diâmetro mínimo do povoamento (α = dmin) (Equação 3), ajustada da seguinte forma:

f ( x ) = { γ β ( x d min β ) ( γ 1 ) ( exp ( ( x d min β ) γ ) ) (3)

A função Weibull pode ser truncada à direita em função do diâmetro máximo do povoamento (Equação 4):

f ( x ) = { γ β ( x α β ) ( γ 1 ) ( exp ( ( x α β ) γ ) ) exp ( ( T α β ) γ ) (4)

em que T é o diâmetro máximo da parcela.

2.2.2 Função hiperbólica

A fdp da função hiperbólica de três parâmetros (3P) (Equação 5) pode ser descrita:

f ( x ) = { γ β ( x α β ) ( γ 1 ) ( 1 tanh ( ( x α β ) γ ) 2 ) (5)

em que, α é o parâmetro de locação, β, o parâmetro de escala (β > 0), γ, o parâmetro de forma (γ > 0), e x, o centro de classe de diâmetro (x > 0). A supressão do parâmetro de locação da função caracteriza a função hiperbólica de dois parâmetros (2P) (Equação 6):

f ( x ) = { γ β ( x β ) ( γ 1 ) ( 1 tanh ( ( x β ) γ ) 2 ) (6)

O parâmetro de locação pode ser substituído pelo diâmetro mínimo do povoamento (α = dmin) (Equação 7), sendo ajustada da seguinte forma:

f ( x ) = { γ β ( x d min β ) ( γ 1 ) ( 1 tanh ( ( x d min β ) γ ) 2 ) (7)

A função hiperbólica pode ser truncada a direita em função do diâmetro máximo do povoamento (Equação 8) e ser descrita da seguinte forma:

f ( x ) = { γ β ( x α β ) ( γ 1 ) ( 1 tanh ( ( x α β ) γ ) 2 ) tanh ( ( T α β ) γ ) (8)

em que T é o diâmetro máximo da parcela.

2.2.3 Função log-logística

A função densidade de probabilidade log-logística em sua forma completa (3P) (Equação 9) pode ser escrita da seguinte forma:

f ( x ) = { γ β ( x α β ) ( γ 1 ) ( 1 + ( x α β ) γ ) 2 (9)

em que α é o parâmetro de forma (α > 0), β, o parâmetro de escala (β > 0), e γ, o parâmetro de locação, sendo que a supressão do parâmetro de locação resulta na função log-logística de dois parâmetros (2P) (Equação 10), que pode ser expressa da seguinte forma:

f ( x ) = { γ β ( x β ) ( γ 1 ) ( 1 + ( x β ) γ ) 2 (10)

O parâmetro de locação pode também ser substituído pelo diâmetro mínimo da parcela (dapmin), resultando na função log-logística com γ = dapmin (Equação 11), como expresso a seguir:

f ( x ) = { γ β ( x d a p min β ) ( γ 1 ) ( 1 + ( x d a p min β ) γ ) 2 (11)

2.2.4 Função logística generalizada

A função logística generalizada (Nadarajah & Kotz, 2005Nadarajah S, Kotz S. A Generalized logistic distribution. International Journal of Mathematics and Mathematical Sciences 2005; 19(19): 3169-3174. http://dx.doi.org/10.1155/IJMMS.2005.3169.
http://dx.doi.org/10.1155/IJMMS.2005.316...
) (Equação 12) pode ser descrita da seguinte forma:

f ( x ) = { ( 1 + α ( x γ β ) ) 1 1 α β ( 1 + ( 1 + α ( x γ β ) ) 1 α ) 2 (12)

em que β é o parâmetro de escala (β > 0), α, o parâmetro de forma (α > 0) e γ, o parâmetro de locação (γ > 0).

2.2.5 Função Fatigue life

A função Birnbaum-Saunders, também conhecida como Fatigue life, foi proposta por Birnbaum & Saunders (1969aBirnbaum ZW, Saunders SC. A new family of life distributions. Journal of Applied Probability 1969a; 6(02): 319-327. http://dx.doi.org/10.1017/S0021900200032848.
http://dx.doi.org/10.1017/S0021900200032...
, bBirnbaum ZW, Saunders SC. Estimation for a family of life distributions with applications to fatigue. Journal of Applied Probability 1969b; 6(02): 328-347. http://dx.doi.org/10.1017/S002190020003285X.
http://dx.doi.org/10.1017/S0021900200032...
) para a descrição da fadiga causada por ações realizadas ciclicamente. A função Birnbaum–Saunders pode ser ajustada pelo método da máxima verossimilhança (Birnbaum & Saunders, 1969bBirnbaum ZW, Saunders SC. Estimation for a family of life distributions with applications to fatigue. Journal of Applied Probability 1969b; 6(02): 328-347. http://dx.doi.org/10.1017/S002190020003285X.
http://dx.doi.org/10.1017/S0021900200032...
), por métodos bayesianos (Achar, 1993Achar JA. Inference for Birnbaum-Saunders fatigue life model using Bayesian method. Computational Statistics & Data Analysis 1993; 15(4): 367-380. http://dx.doi.org/10.1016/0167-9473(93)90170-X.
http://dx.doi.org/10.1016/0167-9473(93)9...
) ou pelo método de momentos (Ng et al., 2003Ng HKT, Kundu D, Balakrishnan N. Modified moment estimation for the two-parameter Birnbaum–Saunders distribution. Computational Statistics & Data Analysis 2003; 43(3): 283-298. http://dx.doi.org/10.1016/S0167-9473(02)00254-2.
http://dx.doi.org/10.1016/S0167-9473(02)...
; Wang et al., 2006Wang ZH, Desmond AF, Lu XW. Modified censored moment estimation for the two-parameter Birnbaum–Saunders distribution. Computational Statistics & Data Analysis 2006; 4(4): 1033-1051. http://dx.doi.org/10.1016/j.csda.2004.10.014.
http://dx.doi.org/10.1016/j.csda.2004.10...
).

A função densidade de probabilidade Birnbaum–Saunders, em sua forma completa (3P) (Equação 13), pode ser escrita da seguinte forma:

f ( x ) = { ( x γ ) / β + β / ( x γ ) 2 α ( x γ ) ϕ ( 1 α ( x γ β β x γ ) ) (13)

em que α é o parâmetro de forma (α > 0), β, o parâmetro de escala (β > 0), γ, o parâmetro de locação e ϕ, a função normal padrão (Equação 14), que pode ser escrita:

ϕ = e x 2 2 2 π (14)

sendo que a supressão do parâmetro de locação resulta na função Birnbaum-Saunders de 2P (Equação 15), expressa da seguinte forma:

f ( x ) = { x / β + β / x 2 α x ϕ ( 1 α ( x β β x ) ) (15)

2.2.6 Função Frechet

A função densidade de probabilidade Frechet, em sua forma completa (3P) (Equação 16), pode ser escrita da seguinte forma:

f ( x ) = { α β ( β x γ ) ( α + 1 ) ( exp ( ( β x γ ) α ) ) (16)

em que α é o parâmetro de forma (α > 0), β, o parâmetro de escala (β > 0) e γ, o parâmetro de locação, sendo que a supressão do parâmetro de locação resulta na função Frechet de 2P (Equação 17), expressa da seguinte forma:

f ( x ) = { α β ( β x ) ( α + 1 ) ( exp ( ( β x ) α ) ) (17)

3 RESULTADOS E DISCUSSÃO

O sistema computacional denominado FitFD – Sistema para Ajuste de Funções de Densidade Probabilidade foi desenvolvido visando ser o mais amigável possível para o usuário, admitindo certa flexibilidade na escolha das fdp cadastradas e amplitude de classes, bem como oferecendo uma visualização dinâmica dos resultados. A principal característica do sistema é poder ser utilizado livremente por gestores florestais, acadêmicos e extensionistas no ajuste de funções de densidade probabilidade e construção de modelos de distribuição de diâmetros.

A linguagem Java foi escolhida por ser uma linguagem simples, orientada a objetos, e por ser robusta, segura, neutra em relação à arquitetura, portável, facilmente interpretável, de alto desempenho, de múltiplos threads e dinâmica, dentre outras características (Horstmann & Cornell, 2010Horstmann CS, Cornell G. Core Java. 8. ed. São Paulo: Pearson Pretince Hall, 2010. 383 p. vol. 1 – Fundamentos.). Dentre as principais características destaca-se o fato de que ser simples permite a continuidade do projeto por outros estudantes de graduação, pós-graduação, professores ou profissionais da área. O fato de ser orientada a objetos permite que futuras alterações possam ser facilmente implementadas e adicionadas ao projeto, sem inferência nas funções já disponíveis.

A estrutura do sistema é relativamente simples, baseia-se na importação das informações de diâmetro observadas em campo, processamento e ajuste das fdp, análise gráfica e exportação dos parâmetros das fdp, bem como das estimativas por classe de diâmetro. As principais características e interfaces do sistema são apresentadas a seguir. A tela inicial do FitFD é apresentada na Figura 1.

Figura 1
Tela inicial do FitFD.
Figure 1
Initial screen of FitFD.

As informações básicas relacionadas às classes de diâmetro são inseridas na aba Dados (Figura 2). As informações necessárias para o ajuste das fdp são fornecidas em função de uma chave primária, que pode ser em função da parcela, do talhão ou de qualquer outra unidade administrativa.

Figura 2
Tela de manipulação dos dados no FitFD.
Figure 2
Screen of data manipulation in FitFD.

Após a importação dos dados deve-se escolher sobre quais funções deseja-se ajustar (Figura 3). As funções disponíveis são Weibull 2 Parâmetros, Weibull 3 Parâmetros, Weibull 2 Parâmetros-locação = DapMin, Weibull 3 Parâmetros Truncada à direita, Hiperbólica 2 Parâmetros, Hiperbólica 3 Parâmetros, Hiperbólica 2 Parâmetros-locação = DapMin, Hiperbólica 3 Parâmetros Truncada, Log-Logística 2 Parâmetros, Log-Logística 3 Parâmetros, Log-Logística 2 Parâmetros-locação = DapMin, Logística Generalizada, Fatigue Life 2 Parâmetros, Fatigue Life 3 Parâmetros, Frechet 2 Parâmetros, Frechet 3 Parâmetros. O sistema permite o agrupamento dos dados em classes definidas pelo usuário.

Figura 3
Tela de definição dos modelos de taper.
Figure 3
Screen definition of models of taper.

Após o ajuste das funções pode-se verificar os valores estimados para classe de diâmetro na aba Análise (Figura 4). A análise gráfica entre valores observados e estimados pode ser realizada para todas as funções e parcelas (Figura 5) – esse fato permite a escolha e análise detalhadas das fdp disponíveis.

Figura 4
Tela de análise entre valores observados e estimados.
Figure 4
Screen analysis between observed and estimated values.
Figura 5
Tela de análise gráfica entre valores observados e estimados.
Figure 5
Screen analysis graphical between observed and estimated values.

Na aba Resultados pode-se observar os parâmetros de cada função ajustada pelo sistema (Figura 6). Os parâmetros estimados, bem como as estimativas por classe de diâmetro, podem ser exportados no menu Resultados.

Figura 6
Resultados obtidos para cada parcela e função cadastrada.
Figure 6
Results obtained for each plot and registered function.

O sistema desenvolvido neste trabalho auxilia os usuários na definição e escolha das fdp que melhor atendam suas necessidades, contudo melhorias são necessárias. Como propostas para o desenvolvimento de novos recursos para o FitFD destacam-se:

  • Permitir uma maior eficiência na manipulação dos dados observados, facilitando estratificações e junções de estratos dentro do sistema;

  • Integração do sistema com ferramentas de cadastro e inventário florestal, tornando o sistema mais versátil e dinâmico;

  • Geração de relatórios em formato padronizado de uma maneira fácil para o usuário;

  • Integração com SGBD (Sistemas de Gerenciamento de Bancos de Dados), como o MySQL, Firebird, PostgreSQL, dentre outros, permitindo a exportação e publicação de informações em bancos de dados corporativos;

  • Melhorar a ferramenta de análise gráfica, permitindo a visualização de várias funções em um mesmo gráfico.

4 CONCLUSÃO

O projeto iniciado mostrou-se eficiente para ajustes de funções de densidade probabilidade. O sistema desenvolvido está disponível na página do projeto NeuroForest.

REFERÊNCIAS

  • Achar JA. Inference for Birnbaum-Saunders fatigue life model using Bayesian method. Computational Statistics & Data Analysis 1993; 15(4): 367-380. http://dx.doi.org/10.1016/0167-9473(93)90170-X
    » http://dx.doi.org/10.1016/0167-9473(93)90170-X
  • Binoti DHB, Binoti MLMS, Leite HG, Fardin LP, Oliveira JC. Probability density functions for description of diameter distribution in thinned stands of Tectona grandis.Cerne 2012; 18(2): 185-196. http://dx.doi.org/10.1590/S0104-77602012000200002
    » http://dx.doi.org/10.1590/S0104-77602012000200002
  • Binoti DHB. Funções densidade de probabilidade para a descrição da distribuição diamétrica de povoamentos desbastados de Tectona grandis [monografia]. Viçosa: Departamento de Engenharia Florestal, Universidade Federal de Viçosa; 2008.
  • Birnbaum ZW, Saunders SC. A new family of life distributions. Journal of Applied Probability 1969a; 6(02): 319-327. http://dx.doi.org/10.1017/S0021900200032848
    » http://dx.doi.org/10.1017/S0021900200032848
  • Birnbaum ZW, Saunders SC. Estimation for a family of life distributions with applications to fatigue. Journal of Applied Probability 1969b; 6(02): 328-347. http://dx.doi.org/10.1017/S002190020003285X
    » http://dx.doi.org/10.1017/S002190020003285X
  • Campos JCC, Leite HG. Mensuração florestal: perguntas e respostas. 3. ed. Viçosa: Editora UFV; 2009. 548 p.
  • Clutter JL, Fortson JC, Pienaar LV, Brister GH, Bailey RL. Timber management: a quantitative approach. New York: Wiley; 1983.
  • Horstmann CS, Cornell G. Core Java. 8. ed. São Paulo: Pearson Pretince Hall, 2010. 383 p. vol. 1 – Fundamentos.
  • Leite HG, Binoti DHB, Guimarães DP, Silva MLM, Garcia SLR. Avaliação do ajuste das funções Weibull e hiperbólica a dados de povoamentos de eucalipto submetidos a desbaste. Revista Árvore 2010; 34(2): 305-311. http://dx.doi.org/10.1590/S0100-67622010000200013
    » http://dx.doi.org/10.1590/S0100-67622010000200013
  • Nadarajah S, Kotz S. A Generalized logistic distribution. International Journal of Mathematics and Mathematical Sciences 2005; 19(19): 3169-3174. http://dx.doi.org/10.1155/IJMMS.2005.3169
    » http://dx.doi.org/10.1155/IJMMS.2005.3169
  • Ng HKT, Kundu D, Balakrishnan N. Modified moment estimation for the two-parameter Birnbaum–Saunders distribution. Computational Statistics & Data Analysis 2003; 43(3): 283-298. http://dx.doi.org/10.1016/S0167-9473(02)00254-2
    » http://dx.doi.org/10.1016/S0167-9473(02)00254-2
  • Wang ZH, Desmond AF, Lu XW. Modified censored moment estimation for the two-parameter Birnbaum–Saunders distribution. Computational Statistics & Data Analysis 2006; 4(4): 1033-1051. http://dx.doi.org/10.1016/j.csda.2004.10.014
    » http://dx.doi.org/10.1016/j.csda.2004.10.014

Datas de Publicação

  • Publicação nesta coleção
    2017

Histórico

  • Recebido
    11 Mar 2014
  • Aceito
    25 Mar 2016
Instituto de Florestas da Universidade Federal Rural do Rio de Janeiro Rodovia BR 465 Km 7, CEP 23897-000, Tel.: (21) 2682 0558 | (21) 3787-4033 - Seropédica - RJ - Brazil
E-mail: floram@ufrrj.br