Acessibilidade / Reportar erro

Fenotipagem de alta eficiência para vitamina A em banana utilizando redes neurais artificiais e dados colorimétricos

RESUMO

A banana é uma das frutas mais consumidas no Brasil, sendo importante fonte de minerais, vitaminas e carboidratos na dieta humana. A caracterização de genótipos superiores de banana permite identificar aqueles com qualidade nutricional para cultivo e para integrar programas de melhoramento genético. Porém, a identificação e quantificação dos carotenoides provitamínicos são dificultadas pelo custo instrumental e dos reagentes químicos para as análises, podendo se tornar inviável caso o número de amostras a serem analisadas seja elevado. Assim, objetivou-se verificar o potencial da fenotipagem indireta do teor de vitamina A em banana por redes neurais artificiais (RNAs) utilizando-se dados colorimétricos. Foram avaliadas 15 cultivares de bananeira com quatro repetições, totalizando 60 amostras. Para cada amostra, foram obtidos dados colorimétricos, estimando-se o teor de vitamina A na polpa dos frutos maduros. Para a predição do teor de vitamina A por dados colorimétricos, utilizaram-se RNAs do tipo perceptron multicamadas. Foram testadas dez arquiteturas de rede com uma única camada intermediária. A rede selecionada pelo melhor ajuste (menor erro quadrático médio) teve quatro neurônios na camada intermediária, possibilitando alta eficiência na predição de vitamina A (r2 = 0,98). Os parâmetros colorimétricos a* e ângulo Hue foram os mais importantes neste estudo. A fenotipagem indireta em alta escala da vitamina A por meio de RNAs na polpa de banana é possível e viável.

Palavras-chave
Musa spp.; parâmetros colorimétricos; inteligência computacional; perceptron multicamadas; fenômica

ABSTRACT

Banana is one of the most consumed fruits in Brazil and an important source of minerals, vitamins and carbohydrates for human diet. The characterization of banana superior genotypes allows identifying those with nutritional quality for cultivation and to integrate genetic improvement programs. However, identification and quantification of the provitamin carotenoids are hampered by the instruments and reagents cost for chemical analyzes, and it may become unworkable if the number of samples to be analyzed is high. Thus, the objective was to verify the potential of indirect phenotyping of the vitamin A content in banana through artificial neural networks (ANNs) using colorimetric data. Fifteen banana cultivars with four replications were evaluated, totaling 60 samples.

For each sample, colorimetric data were obtained and the vitamin A content was estimated in the ripe banana pulp. For the prediction of the vitamin A content by colorimetric data, multilayer perceptron ANNs were used. Ten network architectures were tested with a single hidden layer. The network selected by the best fit (least mean square error) had four neurons in the hidden layer, enabling high efficiency in prediction of vitamin A (r2 = 0.98). The colorimetric parameters a* and Hue angle were the most important in this study. High-scale indirect phenotyping of vitamin A by ANNs on banana pulp is possible and feasible.

Key words
Musa spp.; colorimetric parameters; computational intelligence; multilayer perceptro; phenomic

INTRODUÇÃO

A bananeira (Musa spp.) é uma das fruteiras mais cultivadas nos países de clima tropical e subtropical. No Brasil, a produção de bananas e plátanos em 2013 foi de 6,89 milhões de toneladas em 485 mil hectares de área colhida (FAO 2015Food and Agriculture Organization of the United Nations (2015). [accessed 2015 Aug 12]. http://faostat.fao.org/site/339;defaut.aspx
http://faostat.fao.org/site/339;defaut.a...
). Devido às suas boas características organolépticas e ao baixo custo, a banana é consumida por pessoas de todas as classes sociais, representando uma boa fonte de minerais, vitaminas e carboidratos, além do alto potencial como alimento funcional e nutracêutico (Amorim et al. 2011Amorim, E. P., Cohen, K. O., Amorim, V. B. O., Paes, N. S., Sousa H. N., Santos-Serejo J. A. and Silva, S. O. (2011). Caracterização de acessos de bananeira com base na concentração de compostos funcionais. Ciência Rural, 41, 592-598. http://dx.doi.org/10.1590/S0103-84782011005000042.
http://dx.doi.org/10.1590/S0103-84782011...
; Aquino et al. 2014Aquino, C. F., Salomão, L. C. C., Siqueira, D. L., Cecon, P. R. and Ribeiro, S. M. R. (2014). Teores de minerais em polpas e cascas de frutos de cultivares de bananeira. Pesquisa Agropecuária Brasileira, 49, 546-553. http://dx.doi.org/10.1590/S0100-204X2014000700007.
http://dx.doi.org/10.1590/S0100-204X2014...
). Dentre suas propriedades funcionais e nutracêuticas, destacam-se os teores de carotenoides, como luteína, β-caroteno e α-caroteno, com funções importantes no organismo humano. Além disso, esses dois últimos são convertidos em vitamina A no organismo humano (Davey et al. 2009Davey, M. W., Bergh, V. D., Markham, R., Swnnen, R. and Keulemans, J. (2009). Genetic variability in Musa fruit provitamin A carotenoids, lutein and mineral micronutrient contents. Food Chemistry, 115, 806-813. http://dx.doi.org/10.1016/j.foodchem.2008.12.088.
http://dx.doi.org/10.1016/j.foodchem.200...
).

A deficiência de vitamina A é considerada uma doença nutricional grave, sendo a causa mais frequente de cegueira evitável no mundo (Santos et al. 2010Santos, E. M., Velarde, L. G. C. and Ferreira, V. A. (2010). Associação entre deficiência de vitamina A e variáveis socioeconômicas, nutricionais e obstétricas de gestantes. Ciência & Saúde Coletiva, 15, 1021-1030. http://dx.doi.org/10.1590/S1413-81232010000700008.
http://dx.doi.org/10.1590/S1413-81232010...
). Uma das formas sustentáveis de mitigar o problema da deficiência de vitamina A é incentivar o consumo de alimentos naturalmente ricos em carotenoides provitamínicos, como frutas e hortaliças (Ekesa et al. 2012Ekesa, B., Poulaert, M., Davey, M.W., Kimiywe, J. Van Den Bergh, I., Blomm, G. and Dhuique-Mayer, C. (2012). Bioaccessibility of provitamin A carotenoids in bananas (Musa spp.) and derived dishes in African countries. Food Chemistry, 133, 1471-1477. http://dx.doi.org/10.1016/j.foodchem.2012.02.036.
http://dx.doi.org/10.1016/j.foodchem.201...
). Dessa forma, a prospecção de acessos de bananeira em coleções é importante, a fim de identificar genótipos com potencial de uso no melhoramento genético, focalizando o desenvolvimento de cultivares com melhores propriedades nutracêuticas (Amorim et al. 2011Amorim, E. P., Cohen, K. O., Amorim, V. B. O., Paes, N. S., Sousa H. N., Santos-Serejo J. A. and Silva, S. O. (2011). Caracterização de acessos de bananeira com base na concentração de compostos funcionais. Ciência Rural, 41, 592-598. http://dx.doi.org/10.1590/S0103-84782011005000042.
http://dx.doi.org/10.1590/S0103-84782011...
). Porém, a quantificação do teor de vitamina A apresenta custo elevado e pode se tornar inviável para o melhoramento genético caso o número de amostras a serem analisadas seja elevado.

A estimativa indireta dos teores de carotenoides e, consequentemente, dos provitamínicos, é possível utilizando-se dados colorimétricos, os quais são facilmente mensurados na polpa ou casca dos frutos por meio do colorímetro. Essa abordagem analítica vem sendo explorada em tomate (Carvalho et al. 2005Carvalho, W., Fonseca, M. E. N., Silva, H. R., Boiteux, L. S. and Giordano, L. B. (2005). Estimativa indireta de teores de licopeno em frutos de genótipos de tomateiro via análise colorimétrica. Horticultura Brasileira, 23, 819-825. http://dx.doi.org/10.1590/S0102-05362005000300026.
http://dx.doi.org/10.1590/S0102-05362005...
; Fernández-Ruiz et al. 2010Fernández-Ruiz, A. V., Torrecilla, J. S., Cámara, M., Mata, M. C. and Shoemaker, C. (2010). Radial basis network analysis of color parameters to estimate lycopene content on tomato fruits. Talanta, 83, 9-13. http://dx.doi.org/10.1016/j.talanta.2010.08.020.
http://dx.doi.org/10.1016/j.talanta.2010...
), abóbora (Seroczyńska et al. 2006Seroczyńska, A., Korzeniewska, A., Sztangret-Wiśniewska, J., Niemirowicz-Szczytt, K. and Gajewski, M. (2006). Relationship between carotenoids content and flower or fruit flesh colour of winter squash (Cucurbita máxima). Folia Horticulturae, 18, 51-61.; Itle e Kabelka 2009Itle, R. A. and Kabelka, E. A. (2009). Correlation between L. a. b. color space values and carotenoid content in pumpkins and squash (Cucurbita spp.). HortScience, 44, 633-637.; Dóka et al. 2013Dóka, O., Ficzek, G., Luterotti, S., Bicanic, D., Spruijt, R., Buijnsters, J. G., Szalay, L. and Végvári, G. (2013). Simple and rapid quantification of total carotenoids in lyophilized apricots (Prunus armeniaca L.) by means of reflectance colorimetry and photoacoustic spectroscopy. Food Technology and Biotechnology, 51, 453-459.) e batata (Lu et al. 2001Lu, W., Haynes, K., Wiley, E. and Clevidence, B. (2001). Carotenoid content and color in diploid potatoes. Journal of the American Society for Horticultural Science, 126, 722-726.). A estimativa indireta do teor de carotenoides pode reduzir o tempo, a mão de obra e os recursos financeiros nas etapas de avaliação.

Devido à eficiência das redes neurais artificiais (RNAs) em modelar problemas complexos (Barbosa et al. 2011Barbosa, C. D., Viana, A. P., Quintal, S. S. R. and Pereira, M. G. (2011). Artificial neural network analysis of genetic diversity in Carica papaya L. Crop Breeding and Applied Biotechnology, 11, 224-231. http://dx.doi.org/10.1590/S1984-70332011000300004.
http://dx.doi.org/10.1590/S1984-70332011...
; Nascimento et al. 2013Nascimento, M., Peternelli, L. A., Cruz, C. D., Nascimento, A. C. C., Ferreira, R. P., Bhering, L. P. and Salgado, C. C. (2013). Artificial neural networks for adaptability and stability evaluation in alfalfa genotypes. Crop Breeding and Applied Biotechnology, 13, 152-156.; Azevedo et al. 2015Azevedo, A. M., Andrade Júnior, V. C., Pedrosa, C. E., Oliveira, C. M., Dornas, M. F. S., Cruz, C. D. and Valadares, N. R. (2015). Application of artificial neural networks in indirect selection: a case study on the breeding of lettuce. Bragantia, 74, 1-7. http://dx.doi.org/10.1590/1678-4499.0088.
http://dx.doi.org/10.1590/1678-4499.0088...
; Brasileiro et al. 2015Brasileiro, B. P., Marinho, C. D., Costa, P. M. A., Cruz, C. D., Peternelli, L. A. and Barbosa, M. H. P. (2015). Selection in sugarcane families with artificial neural networks. Crop Breeding and Applied Biotechnology, 15, 72-78. http://dx.doi.org/10.1590/1984-70332015v15n2a14.
http://dx.doi.org/10.1590/1984-70332015v...
), seu uso pode ser eficiente na fenotipagem indireta do teor de vitamina A utilizando-se dados colorimétricos. As RNAs são modelos computacionais do cérebro humano que reconhecem padrões e regularidades dos dados e representam uma alternativa como aproximador universal de funções complexas (Gianola et al. 2011Gianola, D., Okut, H., Weigel, K. A. and Rosa, G. J. (2011). Predicting complex quantitative traits with Bayesian neural networks: a case study with Jersey cows and wheat. BMC Genetics, 12, 87-101. http://dx.doi.org/10.1186/1471-2156-12-87.
http://dx.doi.org/10.1186/1471-2156-12-8...
). Consequentemente, podem ter desempenho superior ao dos modelos estatísticos convencionais, com a vantagem de serem não paramétricas, não necessitarem de informações detalhadas sobre os processos físicos do sistema a ser modelado e tolerarem perda de dados (Azevedo et al. 2015Azevedo, A. M., Andrade Júnior, V. C., Pedrosa, C. E., Oliveira, C. M., Dornas, M. F. S., Cruz, C. D. and Valadares, N. R. (2015). Application of artificial neural networks in indirect selection: a case study on the breeding of lettuce. Bragantia, 74, 1-7. http://dx.doi.org/10.1590/1678-4499.0088.
http://dx.doi.org/10.1590/1678-4499.0088...
).

Dessa forma, objetivou-se verificar o potencial da fenotipagem do teor de vitamina A em banana, utilizando-se RNAs e dados colorimétricos.

MATERIAL E MÉTODOS

Foram colhidos cachos das bananeiras Ouro (AA), Nanica (AAA), Nanicão (AAA), Caru-Verde (AAA), Caru-Roxa (AAA), Caipira (AAA), Prata (AAB), Prata-Anã (AAB), Maçã (AAB), Mysore (AAB), Pacovan (AAB), Marmelo (ABB), Prata-Graúda (AAAB), Caju (grupo genômico não identificado) e do plátano Terrinha (AAB), em pomar experimental com sete anos de idade, na Universidade Federal de Viçosa, Viçosa, MG.

Os cachos foram colhidos quando observados os primeiros sinais de aparecimento da cor amarela nos frutos de cada cultivar. De cada cacho, foram retiradas a segunda, a terceira e a quarta pencas, eliminando-se os danificados, doentes e malformados. Posteriormente, foram imersos em solução de ethephon (1,2 g∙L–1) por 8 min para uniformizar o amadurecimento. Após secarem ao ar por 15 min, foram mergulhados em solução fungicida de Procloraz (0,49 g∙L–1) por 5 min. Em seguida, os frutos permaneceram em temperatura ambiente até o completo amadurecimento.

Adotou-se o delineamento inteiramente casualizado com 15 tratamentos (cultivares) e quatro repetições (cachos), sendo seis frutos por unidade amostral. Para a obtenção dos dados colorimétricos, após a retirada da casca, a polpa foi cortada longitudinalmente para se fazer a leitura na parte interna do fruto.

Utilizou-se o colorímetro Konica-Minolta, modelo CR 10, para fornecimento dos valores de L*, a*, b*, C* e ângulo Hue (°hue). O coeficiente L* (luminosidade) varia de 0 (preto) a 100 (branco); a* varia do verde (−60) ao amarelo (+60); b* varia do azul (−60) ao amarelo (+60); C* representa croma/saturação ou intensidade da cor. O °hue varia de 0° a 360°, sendo 0° (vermelho), 90° (amarelo), 180° (verde) e 270° (azul) (McGuire 1992McGuire, R. G. (1992). Reporting of objective color measurements. HortScience, 27, 1254-1260.).

Os carotenoides foram extraídos de acordo com o método proposto por Rodríguez-Amaya (2001)Rodríguez-Amaya, D. B. (2001). A guide to carotenoid analysis in foods. Washington: International Life Sciences Institute Press., com modificações. Foram pesados 5 g do material vegetal e adicionados 60 mL de acetona 100%, a qual foi resfriada. Em seguida, o material foi processado em homogeneizador Ultra-Turrax (modelo T18 Basic) por 6 min. Posteriormente, o extrato foi filtrado a vácuo em funil de Büchner, utilizando-se papel-filtro, sendo o extrato transferido para um funil de separação contendo 20 mL de éter de petróleo PA resfriado, sendo lavado com água destilada para completa remoção da acetona. Acrescentou-se sulfato de sódio anidro PA para retirar o resíduo de água contido no extrato.

As análises dos carotenoides foram realizadas por cromatografia líquida de alta eficiência (HPLC-DAD), sendo utilizadas as condições cromatográficas ajustadas por Pinheiro-Sant’ana et al. (1998)Pinheiro-Sant’ana, H. M., Stringheta, P. C., Brandão, S. C. C. and Azeredo, R. M. C. (1998). Carotenoid retention and vitamin A value in carrot (Daucus carota L.) prepared by food service. Food Chemistry, 61, 145-151. http://dx.doi.org/10.1016/j.asoc.2011.01.040.
http://dx.doi.org/10.1016/j.asoc.2011.01...
. Utilizou-se um cromatógrafo Shimadzu, equipado com uma bomba de alta pressão, modelo LC-10ATVP, com injetor automático modelo SIL-10AF e detector de arranjos de diodos UV-visível, modelo SPD-M10A, controlado pelo software Multi System, Class VP 6.12. Empregou-se uma coluna cromatográfica RP-18 Phenomenex Gemini, 250 × 4,6 mm, com partícula interna de 5 μm, munida de coluna guarda Phenomenex ODS (C18), 4 × 3 mm, sendo a detecção feita em 450 nm. Utilizou-se fase móvel constituída de metanol:acetato de etila:acetonitrila (80:10:10, v/v/v), grau HPLC, com fluxo de 2,0 mL∙min–1 e tempo de corrida de 13 min.

A identificação dos picos de interesse foi feita por comparação dos tempos de retenção do padrão e das amostras e, principalmente, através do espectro de absorção. A quantificação foi realizada por meio de curvas padrão com concentrações versus áreas dos picos dos padrões, sendo os resultados expressos em μg por 100 g de cada material vegetal na base úmida. O teor de vitamina A foi obtido segundo as recomendações do Institute of Medicine (2001)Institute of Medicine (2001). Dietary Reference Intakes (DRIs): vitamin A, vitamin K, arsenic, boron, chromium, copper, iodine, iron, manganese, molybdenum, nickel, silicon, vanadium and zinc. Washington: National Academy Press.. Todas as etapas do processo de quantificação dos carotenoides (β-caroteno e α-caroteno) foram feitas ao abrigo da luz direta, a fim de evitar a degradação do material.

Dessa forma, foram obtidos dados colorimétricos (L., a., b., C. e °hue) e teores de vitamina A para 60 amostras (quatro repetições de 15 cultivares). Esses dados foram submetidos a análise no software R (R Development Core Team 2012R Development Core Team (2012). The R Project for Statistical Computing; [accessed 2016 May 17]. http://www.R-project.org/
http://www.R-project.org/...
) por RNAs. Para a melhor eficiência no treinamento das redes, tanto os dados de entrada (dados colorimétricos) quanto os de saída (teor de vitamina A) foram normatizados para o intervalo entre 0 e 1 pela função “normalize Data” do pacote RSNNS (Bergmeir e Benítez 2012Bergmeir, C. and Benítez, M. J. (2012). Neural networks in R using the Stuttgart Neural Network Simulator: RSNNS. Journal of Statistical Software, 46, 1-26.).

Na análise por RNAs, 70% dos dados (informação de 42 amostras) foram utilizados para o treinamento da rede e 30%, para a validação (informação de 18 amostras). As amostras que constituíram as frações de treinamento e validação foram selecionadas aleatoriamente. Foram utilizadas redes do tipo perceptron multicamadas (MLP, do inglês multilayer perceptron). Para o desenvolvimento das redes MLP, foi utilizada a função “mlp” do pacote RSNNS com algoritmo “back propagation” e taxa de aprendizado de 0,1. O número máximo de épocas de treinamento foi arbitrado como 1.000, a função de ativação para a camada intermediária foi a logística e da camada de saída foi a linear. Para obter uma rede treinada com bom ajuste, foram testadas dez arquiteturas de rede, com 1, 2, 3, …, 9 e 10 neurônios na camada intermediária. Tendo em vista que, no início do treinamento, os parâmetros livres são gerados aleatoriamente e que esses valores iniciais podem influenciar o resultado final do treinamento (Soares et al. 2014Soares, F. C., Robaina, A. D., Peiter, M. X., Russi, J. L. and Vivan, G. A. (2014). Redes neurais artificiais na estimativa da retenção de água do solo. Ciência Rural, 44, 293-300. http://dx.doi.org/10.1590/S0103-4782014000200016.
http://dx.doi.org/10.1590/S0103-47820140...
), cada arquitetura de RNA foi treinada 1.000 vezes. A seleção da rede que proporcionou o melhor ajuste foi feita considerando-se o erro quadrático médio (EQM) para a amostra de validação.

Para a melhor rede selecionada, foi obtido o diagrama com a topologia da rede utilizando-se a função “plotnet” (pacote Neural Net Tools). Além disso, foi obtida a importância relativa das características de entrada, utilizando-se o método de Garson (1991)Garson, G. D. (1991). Interpreting neural-network connection weights. Journal AI Expert, 6, 47-51. pela função “garson” (pacote Neural Net Tools). Para visualizar a eficiência do treinamento das redes, foi feita a análise de regressão dos teores de vitamina A preditos com os observados para as amostras de treinamento e validação. Para comparar as melhores arquiteturas de redes, utilizou-se o teste de comparação múltipla por bootstrap (Ramos e Ferreira 2009Ramos, S. P. and Ferreira, D. F. (2009). Agrupamento de médias via bootstrap de populações normais e não-normais. Revista Ceres, 56, 140-149.). Para a obtenção de intervalos de confiança de 95%, utilizou-se o teste bootstrap BCa. Para comparar as estimativas observadas e preditas pelas RNAs do teor de vitamina A, utilizou-se o teste pareado de bootstrap. Em todas as análises utilizando a técnica de bootstrap, foram consideradas 10.000 simulações.

RESULTADOS E DISCUSSÃO

Verificou-se grande variabilidade para o teor de vitamina A nas amostras estudadas, com estimativas variando de 1,330 a 141,968 µg por 100 g de polpa e coeficiente de variação de 149,144% (Tabela 1). Essa alta variabilidade é indispensável para que as redes treinadas sejam suficientemente generalistas (Azevedo et al. 2015Azevedo, A. M., Andrade Júnior, V. C., Pedrosa, C. E., Oliveira, C. M., Dornas, M. F. S., Cruz, C. D. and Valadares, N. R. (2015). Application of artificial neural networks in indirect selection: a case study on the breeding of lettuce. Bragantia, 74, 1-7. http://dx.doi.org/10.1590/1678-4499.0088.
http://dx.doi.org/10.1590/1678-4499.0088...
). Entre os dados colorimétricos, o parâmetro a* foi o que apresentou maior variabilidade, com maior coeficiente de variação de 103,527%. O eixo a* (vermelho para verde) considera os valores positivos como vermelho e os negativos como verde, sendo o 0 neutro (Trevisan et al. 2008Trevisan, R., Gonçalves. E. D., Gonçalves, R. S., Antunes, L. E. A. C. and Herter, F. G. (2008). Influência do plástico branco, poda verde e amino quelant®-K na qualidade de pêssegos ‘Santa Áurea’. Bragantia, 67, 243-247. http://dx.doi.org/10.1590/S0006-87052008000100029.
http://dx.doi.org/10.1590/S0006-87052008...
). Já o parâmetro L* foi o que apresentou menor variabilidade, com coeficiente de variação de 6,191%. Esse parâmetro relaciona-se à luminosidade, variando do 0 (preto perfeito) ao 100 (branco perfeito).

Tabela 1
Análise descritiva e correlação de Pearson entre parâmetros colorimétricos e teor de vitamina A em polpas de bananas maduras.

Para as dez arquiteturas de rede testadas, verificaram-se menores EQMs para números inferiores de neurônios na camada intermediária (Figura 1a). Menores estimativas para o EQM indicam a maior proximidade entre os valores reais e os preditos pelas RNAs, ou seja, indicam a maior eficiência das redes. Pelo teste de comparações múltiplas por bootstrap (Ramos e Ferreira 2009Ramos, S. P. and Ferreira, D. F. (2009). Agrupamento de médias via bootstrap de populações normais e não-normais. Revista Ceres, 56, 140-149.), verificou-se que, quando se utilizou apenas um neurônio na camada intermediária, houve em média melhor eficiência da rede. Conclusão similar foi obtida quando se analisou o coeficiente de determinação (r2) na Figura 1b, em que números menores de neurônios na camada intermediária possibilitaram melhores resultados. O uso de testes não paramétricos como o bootstrap para a comparação múltipla (Ramos e Ferreira 2009Ramos, S. P. and Ferreira, D. F. (2009). Agrupamento de médias via bootstrap de populações normais e não-normais. Revista Ceres, 56, 140-149.) é viável em estudos similares a este, pois o EQM e o r2 geralmente não seguem distribuição normal.

Figura 1
Erro quadrático médio (a) e coeficiente de determinação (b) para diferentes números de neurônios na camada intermediária.

Comumente, o aumento do número de neurônios por camada não garante o melhor desempenho da rede. Resultados similares foram encontrados por Soares et al. (2014)Soares, F. C., Robaina, A. D., Peiter, M. X., Russi, J. L. and Vivan, G. A. (2014). Redes neurais artificiais na estimativa da retenção de água do solo. Ciência Rural, 44, 293-300. http://dx.doi.org/10.1590/S0103-4782014000200016.
http://dx.doi.org/10.1590/S0103-47820140...
e Azevedo et al. (2015)Azevedo, A. M., Andrade Júnior, V. C., Pedrosa, C. E., Oliveira, C. M., Dornas, M. F. S., Cruz, C. D. and Valadares, N. R. (2015). Application of artificial neural networks in indirect selection: a case study on the breeding of lettuce. Bragantia, 74, 1-7. http://dx.doi.org/10.1590/1678-4499.0088.
http://dx.doi.org/10.1590/1678-4499.0088...
. Uma justificativa para isso é que o aumento do número de neurônios na rede pode provocar o overfitting, que ocorre quando, no processo de treinamento, a rede memoriza os dados da amostra de treinamento e não identifica as associações existentes entre os dados apresentados na camada de entrada e de saída (Silva et al. 2010Silva, I. N., Spatti, D. H. and Flauzino, R. A. (2010). Redes neurais artificiais: para engenharia e ciências aplicadas. São Paulo: Artliber.). Nesse caso, é encontrado bom ajuste para a amostra de treinamento, porém, para a amostra de validação, é encontrado um péssimo ajuste. Assim, a eficiência da rede deve ser sempre verificada com uma amostra cujos dados não foram utilizados no processo de treinamento, que é a amostra de validação. No estudo da importância relativa das variáveis explicativas pelo método de Garson (1991)Garson, G. D. (1991). Interpreting neural-network connection weights. Journal AI Expert, 6, 47-51., verificou-se que os parâmetros a* e °hue apresentaram maior importância (Figura 2), com contribuição relativa de 28,87 e 20,08%, respectivamente. Essa informação é importante, principalmente quando se torna vantajosa a exclusão de características para a redução do esforço computacional (Paliwal e Kumar 2011Paliwal, M. and Kumar, U. A. (2011). Assessing the contribution of variables in feed forward neural network. Applied Soft Computing, 11, 3690-3696.). A maior contribuição dessas características é esperada, devido às maiores estimativas de correlação com a vitamina A (Tabela 1), de 0,821 para a* e −0,765 para °hue.

Figura 2
Contribuição relativa, obtida pelo método de Garson (1991)Garson, G. D. (1991). Interpreting neural-network connection weights. Journal AI Expert, 6, 47-51., dos parâmetros colorimétricos apresentada na camada de entrada para a predição do teor de vitamina A por redes neurais artificiais. Os desvios referem-se aos intervalos de confiança de 95%, obtidos por bootstrap BCa com 10.000 simulações.

Devido ao grande número de treinamentos efetuados (1.000) para cada arquitetura de rede, houve melhor ajuste para uma rede com quatro neurônios na camada intermediária (Figura 3), mesmo havendo em média melhor ajuste com apenas um neurônio na camada intermediária (Figura 1a,b). O uso de um grande número de treinamentos para cada arquitetura de rede é indicado, pois, no início do treinamento, os pesos sinápticos são gerados aleatoriamente (Soares et al. 2014Soares, F. C., Robaina, A. D., Peiter, M. X., Russi, J. L. and Vivan, G. A. (2014). Redes neurais artificiais na estimativa da retenção de água do solo. Ciência Rural, 44, 293-300. http://dx.doi.org/10.1590/S0103-4782014000200016.
http://dx.doi.org/10.1590/S0103-47820140...
) e, consequentemente, a cada treinamento para uma mesma arquitetura, são encontrados resultados diferentes.

Figura 3
Topologia da rede treinada de melhor ajuste para a predição de vitamina A, a partir de dados colorimétricos da polpa madura de banana.

Para a melhor rede ajustada, foram encontrados ótimos ajustes, com r2 de 95,11% para a amostra de treinamento (Figura 4a) e de 98,50% para a amostra de validação (Figura 4b). Alta estimativa do r2 para a amostra de validação indica que a rede treinada é eficiente e tem poder de generalização. A eficiência de predição encontrada neste trabalho é superior à observada por Carvalho et al. (2005)Carvalho, W., Fonseca, M. E. N., Silva, H. R., Boiteux, L. S. and Giordano, L. B. (2005). Estimativa indireta de teores de licopeno em frutos de genótipos de tomateiro via análise colorimétrica. Horticultura Brasileira, 23, 819-825. http://dx.doi.org/10.1590/S0102-05362005000300026.
http://dx.doi.org/10.1590/S0102-05362005...
, que encontraram r2 de 0,90 na predição de licopeno utilizando dados colorimétricos em tomate. Já Seroczyńska et al. (2006)Seroczyńska, A., Korzeniewska, A., Sztangret-Wiśniewska, J., Niemirowicz-Szczytt, K. and Gajewski, M. (2006). Relationship between carotenoids content and flower or fruit flesh colour of winter squash (Cucurbita máxima). Folia Horticulturae, 18, 51-61. e Dóka et al. (2013)Dóka, O., Ficzek, G., Luterotti, S., Bicanic, D., Spruijt, R., Buijnsters, J. G., Szalay, L. and Végvári, G. (2013). Simple and rapid quantification of total carotenoids in lyophilized apricots (Prunus armeniaca L.) by means of reflectance colorimetry and photoacoustic spectroscopy. Food Technology and Biotechnology, 51, 453-459. encontraram r2 de 0,92 e 0,96%, respectivamente, na predição do teor de β-caroteno a partir de dados colorimétricos em abóbora. Os bons resultados encontrados neste trabalho podem ser explicados pelo bom ajuste das redes neurais para sistemas não lineares (Gianola et al. 2011Gianola, D., Okut, H., Weigel, K. A. and Rosa, G. J. (2011). Predicting complex quantitative traits with Bayesian neural networks: a case study with Jersey cows and wheat. BMC Genetics, 12, 87-101. http://dx.doi.org/10.1186/1471-2156-12-87.
http://dx.doi.org/10.1186/1471-2156-12-8...
). Além disso, essa técnica possibilita considerar muitas variáveis explicativas simultaneamente, o que pode se tornar inviável para a regressão linear múltipla. Fernández-Ruiz et al. (2010)Fernández-Ruiz, A. V., Torrecilla, J. S., Cámara, M., Mata, M. C. and Shoemaker, C. (2010). Radial basis network analysis of color parameters to estimate lycopene content on tomato fruits. Talanta, 83, 9-13. http://dx.doi.org/10.1016/j.talanta.2010.08.020.
http://dx.doi.org/10.1016/j.talanta.2010...
também encontraram altas estimativas de r2 (0,99%) ao predizerem o teor de licopeno em tomate por RNAs, utilizando dados colorimétricos.

Figura 4
Regressão entre as estimativas do teor de vitamina A (µg por 100 g de polpa) predita e observada para a amostra de treinamento (a) e validação (b) por redes neurais artificiais.

Para comparar os teores de vitamina A reais e preditos, foi utilizado o teste pareado não paramétrico de bootstrap para a amostra de treinamento e validação, obtendo-se estimativas do valor de p de 44 e 48%, respectivamente. Isso significa que, considerando o nível de 5% de significância, não há evidências suficientes para rejeitar a hipótese nula. Nesse caso, considera-se como hipótese nula que a média das diferenças de cada observação entre os dados reais e preditos é igual a zero. Isso reforça a conclusão da eficiência de predição encontrada neste trabalho. Assim, o teor de vitamina A pode ser facilmente estimado utilizando-se apenas dados colorimétricos. Tal estratégia permite a redução do tempo para avaliação, da mão de obra e de gastos financeiros (Fernández-Ruiz et al. 2010Fernández-Ruiz, A. V., Torrecilla, J. S., Cámara, M., Mata, M. C. and Shoemaker, C. (2010). Radial basis network analysis of color parameters to estimate lycopene content on tomato fruits. Talanta, 83, 9-13. http://dx.doi.org/10.1016/j.talanta.2010.08.020.
http://dx.doi.org/10.1016/j.talanta.2010...
).

CONCLUSÃO

Os parâmetros colorimétricos a* e °hue foram os mais importantes na predição do teor de vitamina A na polpa madura da banana. A fenotipagem em alta escala da vitamina A em polpas de banana por meio de dados colorimétricos e RNAs é viável, permitindo a redução do tempo para avaliação, da mão de obra e de custos financeiros.

AGRADECIMENTOS

Ao Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq), à Fundação de Amparo à Pesquisa do Estado de Minas Gerais (FAPEMIG) e à Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES), pela concessão de bolsas de estudos e recursos financeiros para o desenvolvimento do projeto.

REFERENCES

  • Amorim, E. P., Cohen, K. O., Amorim, V. B. O., Paes, N. S., Sousa H. N., Santos-Serejo J. A. and Silva, S. O. (2011). Caracterização de acessos de bananeira com base na concentração de compostos funcionais. Ciência Rural, 41, 592-598. http://dx.doi.org/10.1590/S0103-84782011005000042
    » http://dx.doi.org/10.1590/S0103-84782011005000042
  • Aquino, C. F., Salomão, L. C. C., Siqueira, D. L., Cecon, P. R. and Ribeiro, S. M. R. (2014). Teores de minerais em polpas e cascas de frutos de cultivares de bananeira. Pesquisa Agropecuária Brasileira, 49, 546-553. http://dx.doi.org/10.1590/S0100-204X2014000700007
    » http://dx.doi.org/10.1590/S0100-204X2014000700007
  • Azevedo, A. M., Andrade Júnior, V. C., Pedrosa, C. E., Oliveira, C. M., Dornas, M. F. S., Cruz, C. D. and Valadares, N. R. (2015). Application of artificial neural networks in indirect selection: a case study on the breeding of lettuce. Bragantia, 74, 1-7. http://dx.doi.org/10.1590/1678-4499.0088
    » http://dx.doi.org/10.1590/1678-4499.0088
  • Barbosa, C. D., Viana, A. P., Quintal, S. S. R. and Pereira, M. G. (2011). Artificial neural network analysis of genetic diversity in Carica papaya L. Crop Breeding and Applied Biotechnology, 11, 224-231. http://dx.doi.org/10.1590/S1984-70332011000300004
    » http://dx.doi.org/10.1590/S1984-70332011000300004
  • Bergmeir, C. and Benítez, M. J. (2012). Neural networks in R using the Stuttgart Neural Network Simulator: RSNNS. Journal of Statistical Software, 46, 1-26.
  • Brasileiro, B. P., Marinho, C. D., Costa, P. M. A., Cruz, C. D., Peternelli, L. A. and Barbosa, M. H. P. (2015). Selection in sugarcane families with artificial neural networks. Crop Breeding and Applied Biotechnology, 15, 72-78. http://dx.doi.org/10.1590/1984-70332015v15n2a14
    » http://dx.doi.org/10.1590/1984-70332015v15n2a14
  • Carvalho, W., Fonseca, M. E. N., Silva, H. R., Boiteux, L. S. and Giordano, L. B. (2005). Estimativa indireta de teores de licopeno em frutos de genótipos de tomateiro via análise colorimétrica. Horticultura Brasileira, 23, 819-825. http://dx.doi.org/10.1590/S0102-05362005000300026
    » http://dx.doi.org/10.1590/S0102-05362005000300026
  • Davey, M. W., Bergh, V. D., Markham, R., Swnnen, R. and Keulemans, J. (2009). Genetic variability in Musa fruit provitamin A carotenoids, lutein and mineral micronutrient contents. Food Chemistry, 115, 806-813. http://dx.doi.org/10.1016/j.foodchem.2008.12.088
    » http://dx.doi.org/10.1016/j.foodchem.2008.12.088
  • Dóka, O., Ficzek, G., Luterotti, S., Bicanic, D., Spruijt, R., Buijnsters, J. G., Szalay, L. and Végvári, G. (2013). Simple and rapid quantification of total carotenoids in lyophilized apricots (Prunus armeniaca L.) by means of reflectance colorimetry and photoacoustic spectroscopy. Food Technology and Biotechnology, 51, 453-459.
  • Ekesa, B., Poulaert, M., Davey, M.W., Kimiywe, J. Van Den Bergh, I., Blomm, G. and Dhuique-Mayer, C. (2012). Bioaccessibility of provitamin A carotenoids in bananas (Musa spp.) and derived dishes in African countries. Food Chemistry, 133, 1471-1477. http://dx.doi.org/10.1016/j.foodchem.2012.02.036
    » http://dx.doi.org/10.1016/j.foodchem.2012.02.036
  • Fernández-Ruiz, A. V., Torrecilla, J. S., Cámara, M., Mata, M. C. and Shoemaker, C. (2010). Radial basis network analysis of color parameters to estimate lycopene content on tomato fruits. Talanta, 83, 9-13. http://dx.doi.org/10.1016/j.talanta.2010.08.020
    » http://dx.doi.org/10.1016/j.talanta.2010.08.020
  • Food and Agriculture Organization of the United Nations (2015). [accessed 2015 Aug 12]. http://faostat.fao.org/site/339;defaut.aspx
  • Garson, G. D. (1991). Interpreting neural-network connection weights. Journal AI Expert, 6, 47-51.
  • Gianola, D., Okut, H., Weigel, K. A. and Rosa, G. J. (2011). Predicting complex quantitative traits with Bayesian neural networks: a case study with Jersey cows and wheat. BMC Genetics, 12, 87-101. http://dx.doi.org/10.1186/1471-2156-12-87
    » http://dx.doi.org/10.1186/1471-2156-12-87
  • Institute of Medicine (2001). Dietary Reference Intakes (DRIs): vitamin A, vitamin K, arsenic, boron, chromium, copper, iodine, iron, manganese, molybdenum, nickel, silicon, vanadium and zinc. Washington: National Academy Press.
  • Itle, R. A. and Kabelka, E. A. (2009). Correlation between L. a. b. color space values and carotenoid content in pumpkins and squash (Cucurbita spp.). HortScience, 44, 633-637.
  • Lu, W., Haynes, K., Wiley, E. and Clevidence, B. (2001). Carotenoid content and color in diploid potatoes. Journal of the American Society for Horticultural Science, 126, 722-726.
  • McGuire, R. G. (1992). Reporting of objective color measurements. HortScience, 27, 1254-1260.
  • Nascimento, M., Peternelli, L. A., Cruz, C. D., Nascimento, A. C. C., Ferreira, R. P., Bhering, L. P. and Salgado, C. C. (2013). Artificial neural networks for adaptability and stability evaluation in alfalfa genotypes. Crop Breeding and Applied Biotechnology, 13, 152-156.
  • Paliwal, M. and Kumar, U. A. (2011). Assessing the contribution of variables in feed forward neural network. Applied Soft Computing, 11, 3690-3696.
  • Pinheiro-Sant’ana, H. M., Stringheta, P. C., Brandão, S. C. C. and Azeredo, R. M. C. (1998). Carotenoid retention and vitamin A value in carrot (Daucus carota L.) prepared by food service. Food Chemistry, 61, 145-151. http://dx.doi.org/10.1016/j.asoc.2011.01.040
    » http://dx.doi.org/10.1016/j.asoc.2011.01.040
  • R Development Core Team (2012). The R Project for Statistical Computing; [accessed 2016 May 17]. http://www.R-project.org/
    » http://www.R-project.org/
  • Ramos, S. P. and Ferreira, D. F. (2009). Agrupamento de médias via bootstrap de populações normais e não-normais. Revista Ceres, 56, 140-149.
  • Rodríguez-Amaya, D. B. (2001). A guide to carotenoid analysis in foods. Washington: International Life Sciences Institute Press.
  • Santos, E. M., Velarde, L. G. C. and Ferreira, V. A. (2010). Associação entre deficiência de vitamina A e variáveis socioeconômicas, nutricionais e obstétricas de gestantes. Ciência & Saúde Coletiva, 15, 1021-1030. http://dx.doi.org/10.1590/S1413-81232010000700008
    » http://dx.doi.org/10.1590/S1413-81232010000700008
  • Seroczyńska, A., Korzeniewska, A., Sztangret-Wiśniewska, J., Niemirowicz-Szczytt, K. and Gajewski, M. (2006). Relationship between carotenoids content and flower or fruit flesh colour of winter squash (Cucurbita máxima). Folia Horticulturae, 18, 51-61.
  • Silva, I. N., Spatti, D. H. and Flauzino, R. A. (2010). Redes neurais artificiais: para engenharia e ciências aplicadas. São Paulo: Artliber.
  • Soares, F. C., Robaina, A. D., Peiter, M. X., Russi, J. L. and Vivan, G. A. (2014). Redes neurais artificiais na estimativa da retenção de água do solo. Ciência Rural, 44, 293-300. http://dx.doi.org/10.1590/S0103-4782014000200016
    » http://dx.doi.org/10.1590/S0103-4782014000200016
  • Trevisan, R., Gonçalves. E. D., Gonçalves, R. S., Antunes, L. E. A. C. and Herter, F. G. (2008). Influência do plástico branco, poda verde e amino quelant®-K na qualidade de pêssegos ‘Santa Áurea’. Bragantia, 67, 243-247. http://dx.doi.org/10.1590/S0006-87052008000100029
    » http://dx.doi.org/10.1590/S0006-87052008000100029

Datas de Publicação

  • Publicação nesta coleção
    16 Jun 2016
  • Data do Fascículo
    Jul-Sep 2016

Histórico

  • Recebido
    02 Out 2015
  • Aceito
    17 Dez 2015
Instituto Agronômico de Campinas Avenida Barão de Itapura, 1481, 13020-902, Tel.: +55 19 2137-0653, Fax: +55 19 2137-0666 - Campinas - SP - Brazil
E-mail: bragantia@iac.sp.gov.br