Resumos
O principal objetivo deste estudo foi comparar modelos de regressão não linear aptos a descreverem o acúmulo de massa seca de diferentes partes da planta do alho ao longo do tempo (60, 90, 120 e 150 dias após plantio). Objetivou-se também identificar acessos semelhantes em relação às características avaliadas por meio de análises de agrupamento. Foram utilizados 20 acessos de alho pertencentes ao Banco de Germoplasma de Hortaliças da Universidade Federal de Viçosa (BGH/UFV). O teor de massa seca da folha, do pseudocaule, do bulbo e da raiz foram definidos como variáveis na análise de agrupamento (algoritmo de Ward utilizando como medida de dissimilaridade a distância quadrada generalizada de Mahalanobis), que resultou na indicação de um número ótimo (critério de Mojena) de três grupos de acessos, cujas médias de massa seca do bulbo, da raiz e total da planta em cada tempo de interesse foram utilizadas para o ajuste de cinco modelos de regressão não linear (Mitscherlich, Gompertz, Logístico, Brody e von Bertalanffy). A identificação do modelo que melhor se ajustou às três características de cada grupo foi realizada mediante coeficiente de determinação (R2), o quadrado médio do resíduo (QMR) e o desvio médio absoluto dos resíduos (DMA). Comparando os valores desses avaliadores observou-se que, para as três caraterísticas dos três grupos, o modelo que melhor se ajustou foi o Logístico.
Allium sativum; análise de agrupamento; comparação de modelos
The main objective of this study was to compare nonlinear regression models able to describe the dry matter accumulation in different parts of the garlic plant over time (60, 90, 120 and 150 days after planting). This study also aimed to identify similar accessions with respect to the characteristics evaluated through cluster analysis. We used 20 garlic accessions belonging to the Vegetable Germplasm Bank of Universidade Federal de Viçosa. The dry matter content of leaves, pseudostems, bulbs and roots were defined as variables in the cluster analysis (Ward algorithm using as dissimilarity measure the squared generalized Mahalanobis distance), which resulted in the appointment of an optimal number (Mojena criteria) of three groups of accessions, whose means of dry matter of bulbs, of roots and of the whole plant were used for fitting five nonlinear regression models (Mitscherlich, Gompertz, Logistic, von Bertalanffy and Brody). The identification of the model that best fitted the three characteristics of each group was carried out by coefficient of determination (R²), the error mean square and the average deviation absolut error. Comparing the values of these evaluators, we found that, for the three characteristics of the three groups, the best fitted model was the Logistic.
Allium sativum; clustering analysis; comparison of models
O alho (Allium sativum) é uma hortaliça que se destaca na culinária mundial e, particularmente, na brasileira, por possuir características acentuadas de aroma e sabor que lhe atribuem propriedades condimentares e também por suas propriedades medicinais (Menezes Sobrinho et al., 1999MENEZES SOBRINHO JA; CHARCHAR JM; ARAGÃO FAS. 1999. Caracterização morfológica de germoplasma de alho por análises multivariada, componentes principais e variáveis canônicas. Horticultura Brasileira 17: 96-101.). Apresenta ainda importância econômica e possui grande influência no sistema de agricultura familiar, por empregar mão-de-obra desde o plantio até a colheita (Trani, 2009TRANI PE. 2009. Cultura do alho (Allium sativum): Diagnóstico e recomendações para seu cultivo no Estado de São Paulo. Artigo em Hypertexto. Disponível em: http://www.infobibos.com/Artigos/2009_2/alho/index.htm Acessado em: 29 de junho de 2012.
http://www.infobibos.com/Artigos/2009_2/...
). Em relação à sua diversidade genética existe grande variabilidade genética que apresenta a necessidade de serem conduzidas pesquisas com o objetivo de estudar esta divergência genética.
Na literatura são apresentadas várias técnicas para estudo de divergência genética (Menezes Sobrinho et al., 1999; Faria et al., 2012FARIA PN; CECON PR; SILVA AR; FINGER FL; SILVA FF; CRUZ CD; SÁVIO FL. 2012. Métodos de agrupamento em estudo de divergência genética de pimentas. Horticultura Brasileira 30: 428-432.), dentre os quais se destaca a análise de agrupamentos, que utiliza os valores das variáveis para esquematizar formas de agrupar os objetos em classes, de modo que objetos similares estejam na mesma classe, ou ainda, que tem por finalidade reunir os indivíduos em um determinado número de grupos, de modo que exista grande homogeneidade dentro de cada grupo e heterogeneidade entre eles (Johnson & Wichern, 2007JOHNSON RA; WICHERN DW. 2007. Applied multivariate statistical analysis. New Jersey, USA: Pearson Prentice Hall. 773p.).
Para que se faça um manejo adequado por meio de informações relevantes e também para que se detectem possíveis problemas no desenvolvimento da cultura do alho recomenda-se estudar a trajetória de crescimento e o acúmulo de massa seca de suas diferentes partes. Para tanto, modelos de regressão não linear são geralmente recomendados. Tais modelos já foram utilizados com sucesso em outros estudos envolvendo bananeiras (Maia et al., 2009MAIA E; SIQUEIRA DL; SILVA FF; PETERNELLI LA; SALOMÃO LCC. 2009. Método de comparação de modelos de regressão não-lineares em bananeiras. Ciência Rural 39: 1380-1386.), arroz (Agostinetto et al., 2004AGOSTINETTO D; FLECK NG; RIZZARDI MA; BIANCHI MA; SILVA PRF. 2004. Comparação de modelos matemáticos na estimativa das perdas de produtividade de grãos em arroz irrigado. Pesquisa Agropecuária Brasileira 39: 847-856.), milho doce (Araújo et al., 2001ARAÚJO EF; CORRÊA PC; SILVA RF. 2001. Comparação de modelos matemáticos para descrição das curvas de dessorção de sementes de milho-doce. Pesquisa Agropecuária Brasileira 36: 991-995.) e batata (Silva et al., 2007SILVA MCC; FONTES PCR; MIRANDA GV. 2007. Modelos estatísticos para descrever a produtividade de batata em função da adubação nitrogenada. Horticultura Brasileira 25: 360-364.), entre outros. A vantagem desses modelos é que apresentam parâmetros com interpretações biológicas como o valor máximo da característica em questão e a velocidade do crescimento. Porém, diante da possibilidade de diferentes modelos, torna-se relevante a comparação da qualidade do ajuste dos mesmos.
Diante dos aspectos considerados e da ausência desse tipo de estudo na literatura para a cultura do alho, este trabalho teve por objetivo comparar modelos de regressão não linear aptos a descreverem o acúmulo de massa seca de diferentes partes da planta do alho ao longo do tempo, como a massa seca do bulbo, massa seca da raiz e massa seca total da planta em diferentes acessos. E, com o intuito de se trabalhar apenas com grupos de acessos semelhantes, avaliou-se a diversidade genética de 20 acessos de alho registrados no Banco de Germoplasma de Hortaliças (BGH/UFV).
MATERIAL E MÉTODOS
Os dados foram provenientes de um experimento realizado no período de março a novembro de 2010, em área experimental pertencente ao setor de olericultura do Departamento de Fitotecnia da Universidade Federal de Viçosa (UFV), Viçosa-MG (20º45'S, 42º51'O, altitude de 650 m).
O delineamento experimental foi de blocos completos casualizados com quatro repetições. Foram avaliados 20 acessos de alho registrados no Banco de Germoplasma de Hortaliças (BGH/UFV), sendo um originário de Capim Branco-MG (cv. Alho Roxão), três de Florestal-MG (cv. Barbado do Rio Grande, Montes Claros e Sacaia de Guanhães), um de Rio Pantojas-ES (cv. Sapé), um de Sta Maria, Sta Leopoldina-ES [cv. não identificado (1)], um de Vargem Alegre-MG [cv. não identificado (2)], um de Brasília-DF (cv. Cultura de Tecidos), seis de Viçosa-MG [cv. Amarante, Centenário, Cateto Roxo Seleção, Cajuru, Chinês (1) e Chinês (2)], um de Nova Venécia-ES (cv. Cateto Roxo, dt arredondado), um de Presidente Médice-RO (cv. Presidente Médice), dois do Espírito Santo [cv. Amarante EPAMIG (1) e Amarante EPAMIG (2)] e dois de origem não identificada (cv. Peruano e Amarante Novo Cruzeiro). A avaliação de massa seca das partes das plantas desses acessos foi realizada em quatro períodos, 60, 90, 120 e 150 dias após plantio.
O teor de massa seca foi quantificado para as seguintes partes da planta: folha (MSF), pseudocaule (MSP), bulbo (MSB), raiz (MSR) e total da planta (MSTP). O procedimento de obtenção destes dados envolveu secagem em estufa, com ventilação forçada a 650C, até massa constante, expressa em gramas por planta. A MSTP foi obtida pelo somatório da MSF, MSP, MSB e MSR.
Em uma primeira etapa realizou-se a análise de agrupamento para obter grupos envolvendo acessos de alho similares, na qual as massas secas da folha, do pseudocaule, do bulbo e da raiz foram definidas como as variáveis para o agrupamento. Foi utilizado o método proposto por Ward, que é também conhecido como "Método da Variância Mínima", pois considera como função objetivo minimizar a soma de quadrados dentro dos grupos. Essa análise foi realizada no software R versão 2.15.1 (R Development Core Team, 2012) com a função hclust do pacote stats, em que a matriz de distâncias foi a de distâncias generalizadas de Mahalanobis.
Para a determinação do número de grupos, utilizou-se o procedimento sugerido por Mojena (1977), que se baseia no tamanho relativo dos níveis de fusões (distâncias) no dendrograma para determinar o ponto de corte dos dendrogramas gerados pelos métodos hierárquicos e, assim, definir o número de grupos. Propõe selecionar o número de grupos no passo j que, primeiramente, satisfizer a inequação αj+1 > Øk, em que αj+1 é o valor de distância do nível de fusão correspondente ao passo j + 1 e Øk é o valor referencial de corte, dado por
, em que e são, respectivamente, a média e o desvio padrão dos valores de α; k é uma constante cujo valor a ser adotado é de k = 1,25 como regra de parada na definição do número de grupos. Assim, tem-se que
e em que g é o número de acessos a serem agrupados. Esses cálculos foram implementados no software R versão 2.15.1 (R Development Core Team, 2012) tendo por base os resultados obtidos da função hclust. Os grupos foram delimitados com o auxílio da função cutree, informando o valor de dissimilaridade obtido com o método de Mojena para definir a altura do "corte" no dendrograma.
Uma vez obtidos os grupos de acessos obteve-se as médias das variáveis em cada tempo. Para descrever a trajetória longitudinal do acúmulo de massa seca do bulbo, da raiz e total da planta foram utilizados os seguintes modelos: Mitscherlich (M),
Gompertz (G),
Logístico (L),
Brody (B),
von Bertalanffy (vB),
em que ß1 é o parâmetro que representa o peso assintótico; ß2 é um parâmetro de locação, sem interpretação biológica; ß3 é o parâmetro que representa a taxa de maturidade, ou velocidade do crescimento; Yi representa a observação na variável dependente (ou variável resposta); Xi representa a variável independente (ou variável preditora); Ɛi representa o erro aleatório, pressupondo
. Esses modelos são bastante utilizados na literatura para descrever curvas de crescimento de plantas e também acúmulo de massa seca, como em bananeira (Maia et al., 2009) utilizando os modelos G, L, B e vB; em cebola (Pôrto et al., 2006) utilizando o modelo L; em leucena (Brito et al., 2007) utilizando os modelos M e vB.Para o ajuste dos modelos utilizou-se a função nls, do pacote stats do software livre R versão 2.15.1 (R Development Core Team, 2012), que tem por base o método dos mínimos quadrados ordinários. O método iterativo utilizado foi o de Gauss-Newton.
A fim de comparar os modelos propostos, utilizou-se os seguintes avaliadores da qualidade do ajuste: coeficiente de determinação (R2),
quadrado médio do resíduo (QMR),
e proposto por Sarmento et al. (2006), o desvio médio absoluto dos resíduos (DMA),
em que SQR é a soma dos quadrados residuais e SQT é a soma de quadrados total corrigida pela média, n é o número de observações, p é o número de parâmetros, Yié o valor observado da massa seca da característica em questão e
é o valor estimado de massa seca da característica em questão pelo modelo analisado.RESULTADOS E DISCUSSÃO
Utilizando o método de Mojena (1977), com k = 1,25, determinou-se um ponto de corte no dendrograma obtido com o algoritmo de Ward na distância 16,63 (valor do critério Øk do método de Mojena), que corresponde a 40,06% da distância máxima observada nos níveis de fusão (Figura 1). Assim foram definidos três grupos de acessos. As médias de cada grupo para a massa seca do bulbo (MSB), da raiz (MSR) e total da planta (MSTP) em cada período avaliado estão apresentadas na Tabela 1.
Dendrograma obtido com o algoritmo de Ward com base na distância generalizada de Mahalanobis (D²) para agrupamento de 20 acessos de alho pertencentes ao BGH/UFV (dendrogram obtained with Ward’s algorithm based on the Mahalanobis distance (D²) for cluster analysis of the 20 garlic accessions belonging to BGH/UFV]. Viçosa, UFV, 2012.
Média e desvio padrão (em parênteses) da massa seca do bulbo (MSB), da raiz (MSR) e total da planta (MSTP) (g/planta), dos respectivos grupos e dias após plantio [mean and standard deviation (in parentheses) of the dry matter of the bulb (MSB), of the root (MSR) and the whole plant (MSTP) (g/plant), of the respective groups and days after planting). Viçosa, UFV, 2012.
Verifica-se na Tabela 1 que, para a massa seca do bulbo, apesar do grupo I (cvs. Alho Roxão, Montes Claros e Sacaia de Guanhães) ter apresentado as menores médias nos três primeiros períodos avaliados, aos 150 dias após plantio a média dessa característica apresentou-se maior que as médias dos demais grupos. Já para as outras características, as massas secas do grupo I se apresentaram maiores em todos os períodos avaliados durante o crescimento da planta, indicando que os acessos do grupo I, no geral, possuem maiores valores de massa seca das três características (bulbo, raiz e planta toda).
Os dados contidos na Tabela 1 então foram submetidos ao ajuste dos cinco modelos propostos. Para todos os grupos houve convergência de pelo menos dois modelos. Na Tabela 2 são apresentadas as estimativas dos parâmetros e os avaliadores da qualidade do ajuste, de acordo com os modelos ajustados, para as médias de massa seca do bulbo (MSB), da raiz (MSR) e total da planta (MSTP) de cada grupo de acesso.
Pode-se observar na Tabela 2 que os modelos que convergiram para todas as características em todos os grupos foram o modelo de Gompertz (G) e Logístico (L). O modelo de von Bertalanffy (vB) só não convergiu para massa seca do bulbo no grupo I, enquanto o modelo de Brody (B) somente convergiu para massa seca da raiz e massa seca total da planta no grupo III [cvs. Barbado do Rio Grande, não identificado (2), Amarante EPAMIG (1), não identificado (1), Cultura de Tecidos, Centenário, Sapé e Amarante Novo Cruzeiro] e o de Mitscherlich (M) teve convergência somente para massa seca total da planta também no grupo III.
Estimativas dos parâmetros β1, β2 e β3, coeficiente de determinação (R²) , quadrado médio do resíduo (QMR) e desvio médio absoluto dos resíduos (DMA), de acordo com os modelos estudados para as médias de massa seca do bulbo (MSB), da raiz (MSR) e massa seca total da planta (MSTP) de cada grupo de acesso [parameter estimates of the β1, β2 and β3coefficient of determination (R²), the error mean square (QMR) and the average deviation absolut error (DMA), according to the models studied for the mean of dry matter of the bulb (MSB), of the root (MSR) and the whole plant (MSTP), of each group of accession]. Viçosa, UFV, 2012.
Nota-se ainda que os valores para o coeficiente de determinação R 2 foram bem próximos de 1, indicando que os modelos foram bem ajustados aos dados dos três grupos para as três massas secas. Para a massa seca do bulbo, no grupo I e no grupo II [cvs. Chinês (2), Amarante EPAMIG (2), Cateto Roxo Seleção, Peruano, Cateto Roxo, Amarante, Cajuru, Chinês (1) e Presidente Médice], o valor de R2 foi o mesmo para os modelos ajustados nesses grupos, já no grupo III o R2 mostrou-se menor para o modelo de von Bertalanffy do que para os modelos de Gompertz e Logístico, que tiveram os mesmos valores. Já para a massa seca da raiz e para a massa seca total da planta o modelo que obteve os melhores coeficientes de determinação nos três grupos foi o Logístico.
Observa-se também que para as três características, massa seca do bulbo, da raiz e total da planta, o modelo que apresentou os menores valores de quadrado médio do resíduo (QMR) e de desvio médio absoluto dos resíduos (DMA) foi também o Logístico nos três grupos, sendo assim o modelo que melhor descreve as três características nos três grupos.
A Figura 2 apresenta as curvas do modelo Logístico (modelo escolhido como o de melhor ajuste) para cada grupo de acessos em relação às massas secas do bulbo, da raiz e total da planta. Pode-se verificar na Figura 2(a) que a curva que representa o melhor modelo ajustado para a massa seca do bulbo (MSB) no grupo I, o Logístico, estava abaixo das curvas do modelo Logístico dos outros dois grupos, ultrapassando-as por volta dos 140 dias após plantio. Essa ocorrência pode indicar, se houver pretensão de colheita antes de 140 dias após o plantio, uma recomendação de que se utilize acessos semelhantes aos acessos que formam o grupo III, que se mostrou superior até esse período. Após esse período, a sugestão é para que se utilize acessos semelhantes aos pertencentes ao grupo I.
Curvas de acúmulo de massa seca do bulbo (a), da raiz (b) e total da planta (c) ajustadas segundo o modelo Logístico de cada grupo, em que o grupo I é formado pelas cvs. Alho Roxão, Montes Claros e Sacaia de Guanhães; grupo II pelas cvs. Chinês (2), Amarante EPAMIG (2), Cateto Roxo Seleção, Peruano, Cateto Roxo, Amarante, Cajuru, Chinês (1) e Presidente Médice; e grupo III pelas cvs. Barbado do Rio Grande, não identificado (2), Amarante EPAMIG (1), não identificado (1), Cultura de Tecidos, Centenário, Sapé e Amarante Novo Cruzeiro [curves of dry matter accumulation of the bulb (a), of the root (b) and the whole plant (c) fitted according to Logistic model of each group, in which the group I is formed by accessions Alho Roxão, Montes Claros and Sacaia de Guanhães; group II is formed by accessions Chinês (2), Amarante EPAMIG (2), Cateto Roxo Seleção, Peruano, Cateto Roxo, Amarante, Cajuru, Chinês (1) and Presidente Médice; group III is formed by accessions Barbado do Rio Grande, não identificado (2), Amarante EPAMIG (1), não identificado (1), Cultura de Tecidos, Centenário, Sapé and Amarante Novo Cruzeiro]. Viçosa, UFV, 2012.
Nota-se também que os modelos Logísticos representantes dos grupos II e III apresentaram um formato sigmoidal bem mais definido do que o grupo I. Formato esse que se pode observar em trabalhos envolvendo acúmulo de massa seca de cebola e curvas de crescimento de bananeira (Pôrto et al., 2006; Maia et al., 2009).
As informações obtidas na Figura 2b condizem com os valores observados na Tabela 1. Essa tabela mostra que as maiores médias de massa seca da raiz foram apresentadas pelo grupo I e isto é verificado na Figura 2b quando se observa que a curva contínua, referente ao grupo I, está sempre acima das demais curvas, representantes dos outros dois grupos de acessos, lembrando que o modelo Logístico foi o melhor ajustado também para essa característica. Verifica-se que o grupo II já atingiu seu peso assintótico por volta dos 130 dias após plantio, enquanto os grupos I e III não atingiram o peso assintótico dentro do intervalo de 150 dias após plantio.
Observa-se na Figura 2c que as curvas de modelo Logístico representantes dos grupos II e III para a massa seca total da planta foram bem semelhantes. Já o grupo I, que teve médias maiores em relação aos outros dois grupos, como foi verificado na Tabela 1, apresentou também a curva do modelo Logístico acima das demais curvas. Além disso, verifica-se que as curvas dos grupos II e III atingiram seu peso assintótico por volta dos 130 dias após plantio, enquanto a curva o grupo I não atinge o peso assintótico durante o intervalo de 150 dias após plantio.
No trabalho de Maia et al. (2009) verificou-se também que o modelo Logístico foi o melhor ajustado para descrever curvas de crescimento em bananeira, Pôrto et al. (2006), utilizaram este mesmo modelo para descrever acúmulos de massa seca da parte aérea, do bulbo e da planta inteira da cultura de cebola, tendo como resultados ótimos ajustes.
Assim, conclui-se que o modelo Logístico apresentou os melhores ajustes para descrever o acúmulo de massa seca do bulbo, da raiz e total da planta de três grupos de acessos de alho pertencentes ao Banco de Germoplasma de Hortaliças da UFV, grupos estes divergentes principalmente em relação ao acúmulo de massa seca no estádio fenológico final.
AGRADECIMENTOS
Os autores agradecem à Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) e ao Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq) pelas concessões de bolsas de pós-graduação e de produtividade em pesquisa e à Fundação de Amparo a Pesquisa do Estado de Minas Gerais (FAPEMIG) pelo financiamento do projeto de pesquisa ao qual este trabalho está vinculado.
- AGOSTINETTO D; FLECK NG; RIZZARDI MA; BIANCHI MA; SILVA PRF. 2004. Comparação de modelos matemáticos na estimativa das perdas de produtividade de grãos em arroz irrigado. Pesquisa Agropecuária Brasileira 39: 847-856.
- ARAÚJO EF; CORRÊA PC; SILVA RF. 2001. Comparação de modelos matemáticos para descrição das curvas de dessorção de sementes de milho-doce. Pesquisa Agropecuária Brasileira 36: 991-995.
- BRITO CCR; SILVA JAA; FERREIRA RLC; SANTOS ES; FERRAZ I. 2007. Modelos de crescimento resultantes da combinação e variações dos modelos de Chapman-Richards e Silva-Bailey aplicados em Leucaena leucocephala. Ciência Florestal 17: 175-185.
- FARIA PN; CECON PR; SILVA AR; FINGER FL; SILVA FF; CRUZ CD; SÁVIO FL. 2012. Métodos de agrupamento em estudo de divergência genética de pimentas. Horticultura Brasileira 30: 428-432.
- JOHNSON RA; WICHERN DW. 2007. Applied multivariate statistical analysis. New Jersey, USA: Pearson Prentice Hall. 773p.
- MAIA E; SIQUEIRA DL; SILVA FF; PETERNELLI LA; SALOMÃO LCC. 2009. Método de comparação de modelos de regressão não-lineares em bananeiras. Ciência Rural 39: 1380-1386.
- MENEZES SOBRINHO JA; CHARCHAR JM; ARAGÃO FAS. 1999. Caracterização morfológica de germoplasma de alho por análises multivariada, componentes principais e variáveis canônicas. Horticultura Brasileira 17: 96-101.
- MOJENA R. 1977. Hierarquical grouping method and stopping rules: an evaluation. Computer Journal 20: 359-363.
- PÔRTO DRQ; CECÍLIO FILHO AB; MAY A; BARBOSA JC. 2006. Acúmulo de macronutrientes pela cebola 'Optima' estabelecida por semeadura direta. Horticultura Brasileira 24: 470-475.
- R DEVELOPMENT CORE TEAM. 2012. R: A language and environment for statistical computing: R Foundation for Statistical Computing version 2.15.1 (software). Austria.
- SARMENTO JLR; REGAZZI AJ; SOUZA WH; TORRES RA; BREDA FC; MENEZES GRO. 2006. Estudo da curva de crescimento de ovinos Santa Inês. Revista Brasileira de Zootecnia 35: 435-442.
- SILVA MCC; FONTES PCR; MIRANDA GV. 2007. Modelos estatísticos para descrever a produtividade de batata em função da adubação nitrogenada. Horticultura Brasileira 25: 360-364.
- TRANI PE. 2009. Cultura do alho (Allium sativum): Diagnóstico e recomendações para seu cultivo no Estado de São Paulo. Artigo em Hypertexto. Disponível em: http://www.infobibos.com/Artigos/2009_2/alho/index.htm Acessado em: 29 de junho de 2012.
» http://www.infobibos.com/Artigos/2009_2/alho/index.htm
Datas de Publicação
-
Publicação nesta coleção
Apr-Jun 2014
Histórico
-
Recebido
19 Nov 2013 -
Aceito
16 Abr 2014