Acessibilidade / Reportar erro

Determinação de umidade em café cru usando espectroscopia NIR e regressão multivariada

Determination of moisture in raw coffee by near infra-red reflectance spectroscopy and multivariate regression

Resumos

A espectroscopia na região do infravermelho próximo (NIR) foi usada para determinar o teor de umidade em amostras de café cru. Foram construídos modelos de regressão usando o método dos mínimos quadrados parciais (PLS) com diferentes pré-tratamentos de dados e 157 espectros NIR coletados de amostras de café usando um acessório de reflectância difusa, na região entre 4500 e 10000 cm-1. Os espectros originais passaram por diferentes transformações e pré-tratamentos matemáticos, como a transformação Kubelka-Munk; a correção multiplicativa de sinal (MSC); o alisamento com SPLINE e a média móvel, e os dados foram escalados pela variância. O modelo de regressão permitiu determinar o teor de umidade nas amostras de café cru com erro quadrático médio de calibração (SEC) de 0,569 g.100 g -1; erro quadrático médio de validação de 0,298 g.100 g -1; coeficiente de correlação (r) 0,712 e 0,818 para calibração e validação, respectivamente; e erro relativo médio de 4,1% para amostras de validação.

umidade; café; espectroscopia no infravermelho; regressão multivariada


Near infra-red reflectance (NIR) spectroscopy was used to measure the moisture content in raw coffee. Different models using partial least squares (PLS) with data pre-processing were used. Regression models were built with 157 spectra of the samples of raw coffee collected using a near infrared spectrometer with an accessory of diffuse reflectance, between 4500 and 10000 cm-1. The original NIR spectra went through different transformations and mathematical pre treatments, such as the Kubelka-Munk transformation; multiplicative signal correction (MSC); spline smoothing and movable average, and the data were scaled by variance. The regression model permitted the determination of the moisture content of the raw coffee samples with a standard error of calibration (SEC) = 0.569 g.100 g -1; standard error of validation = 0.298 g.100 g -1; correlation coefficient (r) 0.712 and 0.818 for calibration and validation, respectively, and average relative error of 4.1% for validation samples.

moisture determination; coffee; infrared spectroscopy; multivariate regression


Determinação de umidade em café cru usando espectroscopia NIR e regressão multivariada

Determination of moisture in raw coffee by near infra-red reflectance spectroscopy and multivariate regression

Marcelo Antonio MorganoI ,V, * * A quem a correspondência deve ser enviada ; Cristiano Gomes FariaII, VI; Marco Flores FerrãoIII; Neura BragagnoloIV; Márcia Miguel de Castro FerreiraV

ICentro de Química de Alimentos e Nutrição Aplicada, Instituto de Tecnologia de Alimento – ITAL, CP 139, CEP 13070-178, Campinas - SP, Brasil, E-mail: morgano@ital.sp.gov.br

IIEmpresa Brasileira de Pesquisa Agropecuária – EMBRAPA, Centro Nacional de Pesquisa Gado de Leite, CEP 36038-330, Juiz de Fora - MG, Brasil, E-mail: cgomes@cnpgl.embrapa.br

IIIDepartamento de Química e Física, Universidade de Santa Cruz do Sul – UNISC, CEP 96815-000, Santa Cruz do Sul - RS, Brasil, E-mail: ferrao@unisc.br

IVDepartamento de Ciência de Alimentos, Faculdade de Engenharia de Alimentos – FEA, Universidade Estadual de Campinas – UNICAMP, CP 6121, CEP 13083-970, Campinas - SP, Brasil, E-mail: neura@fea.unicamp.br

VUniversidade Estadual de Campinas – UNICAMP, Instituto de Química – IQ, CP 6154, CEP 13081-970, Campinas - SP, Brasil, E-mail: marcia@iqm.unicamp.br

RESUMO

A espectroscopia na região do infravermelho próximo (NIR) foi usada para determinar o teor de umidade em amostras de café cru. Foram construídos modelos de regressão usando o método dos mínimos quadrados parciais (PLS) com diferentes pré-tratamentos de dados e 157 espectros NIR coletados de amostras de café usando um acessório de reflectância difusa, na região entre 4500 e 10000 cm–1. Os espectros originais passaram por diferentes transformações e pré-tratamentos matemáticos, como a transformação Kubelka-Munk; a correção multiplicativa de sinal (MSC); o alisamento com SPLINE e a média móvel, e os dados foram escalados pela variância. O modelo de regressão permitiu determinar o teor de umidade nas amostras de café cru com erro quadrático médio de calibração (SEC) de 0,569 g.100 g –1; erro quadrático médio de validação de 0,298 g.100 g –1; coeficiente de correlação (r) 0,712 e 0,818 para calibração e validação, respectivamente; e erro relativo médio de 4,1% para amostras de validação.

Palavras-chave: umidade; café; espectroscopia no infravermelho; regressão multivariada.

ABSTRACT

Near infra-red reflectance (NIR) spectroscopy was used to measure the moisture content in raw coffee. Different models using partial least squares (PLS) with data pre-processing were used. Regression models were built with 157 spectra of the samples of raw coffee collected using a near infrared spectrometer with an accessory of diffuse reflectance, between 4500 and 10000 cm–1. The original NIR spectra went through different transformations and mathematical pre treatments, such as the Kubelka-Munk transformation; multiplicative signal correction (MSC); spline smoothing and movable average, and the data were scaled by variance. The regression model permitted the determination of the moisture content of the raw coffee samples with a standard error of calibration (SEC) = 0.569 g.100 g –1; standard error of validation = 0.298 g.100 g –1; correlation coefficient (r) 0.712 and 0.818 for calibration and validation, respectively, and average relative error of 4.1% for validation samples.

Keywords: moisture determination; coffee; infrared spectroscopy; multivariate regression.

1 Introdução

A água está presente em praticamente todos os alimentos e tem importância em um grande número de reações. A determinação do teor de água é uma das mais freqüentes análises realizadas nos alimentos. A água ocorre em alimentos em diferentes formas de ligação química, sendo as ligações de hidrogênio ou pontes de hidrogênio as mais importantes. Pelo menos dois tipos de água são encontrados nos alimentos: um tipo denominado água livre que está fracamente ligada ao substrato e que funciona como solvente, permitindo o crescimento de microrganismos, de reações químicas e que é eliminada com facilidade; e outro denominado água combinada que está fortemente ligada ao substrato, é mais difícil de ser eliminada e que não é usada como solvente, não permitindo o crescimento de microrganismos (ISENGARD, 2001). Existem muitos métodos para se determinar o teor de água em alimentos (ISENGARD, 1995). Eles podem ser classificados em dois grupos: os métodos diretos, que permitem a determinação quantitativa da água usando técnicas físicas pela perda de massa ou quantidade de água obtida, e os métodos químicos baseados numa reação específica da água presente nas amostras. Estes métodos também podem ser usados de forma combinada. Os métodos indiretos utilizam alguma medida de uma propriedade macroscópica da amostra.

Entre os métodos diretos baseados na separação física da água temos o de dessecação (ISENGARD, 2001), o de destilação (ISO, 1980), o de secagem em estufa (RÜCKOLD et al., 2000) e secagem por infravermelho (ISENGARD; FÄRBER, 1999) ou microondas. Os principais métodos que envolvem reação química são o que usam o carbeto de cálcio ou hidreto de cálcio (ISENGARD, 2001) e a titulação Karl Fischer (FISCHER, 1935).

Como exemplos de métodos indiretos baseados numa propriedade macroscópica da amostra, temos as medidas de densidade, de polarimetria, de refratometria e atividade da água (ISENGARD, 2001). Entre os métodos baseados na medida da resposta das moléculas de água por uma influência física temos os métodos de espectroscopia de ressonância magnética nuclear de baixa resolução (BARKER; KOCH, 1990), de espectroscopia no microondas (KENT; MEYER, 1982; KRASZEWSKI, 1980) e de espectroscopia no infravermelho próximo (NIR) (OSBORNE; FEARN, 1988).

O teor de umidade em café é um importante índice de qualidade, pois este pode afetar as características da amostra, a preservação do produto e principalmente o aroma. Um alto teor de umidade pode permitir a atividade de microrganismos e enzimas e alterar as características sensoriais do produto. O método mais usual para a determinação de umidade em café ainda é o gravimétrico, porém é um método muito lento. Um método alternativo e muito eficiente que vem sendo muito utilizado para a determinação do teor de umidade em diferentes produtos da agricultura é o que emprega a espectroscopia NIR (GOLD, 1964; OSBORNE; FEARN, 1986; WILLIANS; NORRIS, 1990). A grande vantagem deste método é que as medidas são realizadas em poucos segundos e estas requerem mínima ou quase nenhuma preparação da amostra. O objetivo deste estudo foi avaliar o potencial da espectroscopia NIR associada a métodos multivariados de análise para determinar o teor de umidade em amostras de café cru.

2 Material e métodos

2.1 Amostras

Para a construção dos modelos de regressão foram usadas 52 amostras de café cru, da variedade arábica, procedentes de quatro diferentes regiões produtoras de café do Brasil, São Paulo, Minas Gerais, Bahia e Paraná. Todas as amostras foram inicialmente homogeneizadas em moinho de facas até a obtenção de partículas de tamanho reduzido, e passaram por peneira de 0,84 mm de abertura de poro.

2.2 Método de referência

O método de referência utilizado para a determinação do teor de umidade foi o da AOAC (2000), nº 968.11(AOAC, 2000), sendo que as determinações foram realizadas em duplicata. Foram pesados em balança analítica 5 g da amostra homogeneizada em cápsula de alumínio tarada. Em seguida, as cápsulas foram colocadas em estufa a vácuo por 5 ½ horas, a 98-100 °C e pressão <25 mmHg. As cápsulas foram colocadas em dessecador, esfriadas e pesadas. O teor de umidade foi expresso como a razão entre o peso da amostra dessecada e o peso da amostra pesada multiplicado por 100.

Os resultados dos teores de umidade, para as amostras de café utilizadas neste trabalho, estão compreendidos entre 7,447 e 12,714 g.100 g –1.

2.3 Espectroscopia no infravermelho próximo

Os espectros de reflectância na região do infravermelho próximo foram coletados em um espectrômetro BOMEM DA-08, sendo realizadas 3 réplicas para cada amostra, com resolução de 4 cm–1, 16 varreduras para cada espectro e a região espectral foi de 4500 a 10000 cm–1. O instrumento foi equipado com um acessório de reflectância difusa (JASCO), sendo os sinais expressos em log (1/R).

2.4 Análise dos dados

O método de regressão multivariada utilizado para o tratamento de dados deste estudo foi o método de regressão por mínimos quadrados parciais (PLS), usando o pacote PLS Toolbox 2.0 (WISE; GALLAGHER, 1998) e o programa MATLAB 5.1 (MATLAB, 1997). No modelo PLS, as informações espectrais (matriz x) e as informações das concentrações (matriz y) são usadas ao mesmo tempo, correlacionando-se as mesmas a fim de se obter uma relação linear na fase de calibração (MARTENS; NAES, 1996).

A regressão dos mínimos quadrados parciais, para construção do modelo, retira informações do conjunto de dados da matriz espectral (matriz x) para correlacioná-las com as informações retiradas do conjunto de dados de referência (matriz y). Por meio de combinações lineares dos dados espectroscópicos (da matriz x) e dos dados de referências (matriz y), se obtém o número de variáveis latentes necessárias para correlacionar os espectros e as concentrações. É usado para construção do modelo de calibração um número de variáveis latentes que proporcione o menor erro possível de previsão, ou seja, que as diferenças entre os valores de referência e os valores previstos sejam as menores. Na modelagem por mínimos quadrados parciais, tanto a matriz das variáveis independentes (x), como o vetor das variáveis dependentes (y) são representados pelos escores e pesos conforme a Equação 1:

As informações são incorporadas de modo que cada componente principal (CP) do modelo seja modificado para que a covariância de T seja maximizada. Nesta etapa, a CP recebe o nome de variável latente (VL). Quando a matriz X é decomposta, T contém os escores, P contém os pesos, E é a matriz de erros da decomposição de X (MARTENS; NAES, 1996).

A decomposição pode ser feita utilizando o algoritmo NIPALS. Os valores de escores são relacionados com os loadings para cada componente de cada vez, pela Equação 2:

O vetor de regressão é calculado pela Equação 3:

em que W é a matriz de pesos do método PLS (MARTENS; NAES, 1996).

2.5 Parâmetros de validação dos modelos

O conjunto total de espectros foi dividido em dois subconjuntos: um de calibração e outro de validação externa. Para se determinar o número de variáveis latentes utilizadas no modelo é feita uma validação cruzada (validação interna) no conjunto de calibração: uma amostra do conjunto de calibração é excluída, o modelo é construído e então estimado o seu teor de umidade. O processo é repetido até que todas as amostras sejam previstas para 1, 2, ou mais variáveis latentes. A habilidade do modelo de calibração para estimar (ou prever) o teor de umidade baseado nos dados dos espectros NIR gerados foi avaliada usando os erros de previsão e os coeficientes de correlação entre os valores dos teores de umidade estimados pelo modelo utilizando espectros NIR e os valores do método de referência das amostras do conjunto de calibração. Os parâmetros de erro empregados foram:

1. Soma dos quadrados dos erros de previsão (PRESS):

em que n representa o número de amostras do conjunto de calibração, yi é o valor de referência e é o valor previsto pelo modelo para a iésima amostra.

2. Erro quadrático médio (MSE) ou a raiz quadrada do mesmo (RMSE) denominado também de erro padrão de previsão (SEP):

Como estes erros podem ser medidos tanto para o conjunto de calibração quanto para o de validação externa é comum adicionar no final da sigla destes erros a letra C indicando serem estes relativos à calibração C (MSEC ou RMSEC) ou P quando forem relativos à previsão do conjunto de validação externa (MSEP ou RMSEP).

3. Variância relativa (REV):

A estimativa da variância total dos dados (s2) para n amostras, utilizada na expressão acima, é determinada segundo a expressão:

4. Erro relativo percentual (ERRO (%)) entre o método de referência e o método desenvolvido (NIR-PLS):

5. Coeficiente de correlação entre os valores estimados e os valores experimentais do método de referência:

3 Resultados e discussão

O modelo PLS para a quantificação do teor de umidade foi construído utilizando 85 espectros no conjunto de calibração e validado por validação externa utilizando um conjunto de 72 espectros.

Como as determinações quantitativas a partir de espectros obtidos no infravermelho apresentam problemas de deformação da linha de base, variações no caminho óptico, ruídos, entre outros, foi necessário aplicar as seguintes transformações matemáticas aos dados obtidos dos espectros: transformação Kubelka-Munk e correção multiplicativa de sinal (MSC) para corrigir o efeito do espalhamento de luz presente nos espectros obtidos por reflexão. Como os espectros eram muito ruidosos, os mesmos foram alisados, utilizando SPLINE com funções cúbicas e aplicação de média móvel com uma janela de tamanho 15.

Dos modelos testados, os que apresentaram melhor desempenho de predição foram os modelos construídos usando 7 variáveis latentes e tamanho de janela 15. Com estes parâmetros foi conseguido o menor valor de PRESS (Figura 1).


A seleção de variáveis foi obtida através das informações dadas pelo correlograma. O correlograma foi gerado calculando-se o coeficiente de correlação linear (r) entre as variáveis independentes, ou seja, os resultados das absorvâncias (bloco-Y) e cada uma das variáveis dependentes, ou seja, os resultados do teor de umidade obtidos pelo método de referência (bloco-X), de modo que no final do processo tem-se para cada variável independente um valor associado de r, que ao serem todos dispostos em um gráfico geram o correlograma. O coeficiente de correlação linear (ri) entre estes dois blocos foi utilizado para compor o correlograma em um gráfico no qual as ordenadas são os coeficientes de correlação linear e as abscissas os comprimentos de onda lidos (os números representativos de cada variável) (Figura 2).


Usando as informações do correlograma, apresentado na Figura 2, foi possível reduzir o número de variáveis do modelo para 15 (número de variáveis selecionadas no correlograma) e o número de VL também reduziu de 7 para 3. Estas reduções no número de variáveis geraram um modelo com um menor valor de MSE para o conjunto de validação externa, ou seja, uma pequena melhora de habilidade de predição, como mostram os parâmetros de erro e ajustes presentes na Tabela 1, porém o coeficiente de correlação teve uma leve redução.

A utilização de 3 variáveis latentes no modelo II é suficiente para capturar praticamente toda estrutura do bloco X (variáveis espectrais transformadas) e do bloco Y (teor de umidade obtido pelo método de referência) utilizados na construção do modelo, como se pode ver pelos dados apresentados na Tabela 2.

A água absorve fortemente no infravermelho e, como a maioria dos alimentos possui água na sua constituição, uma forte banda identifica a presença de umidade; já que amostras secas possuem bandas menos intensas. Em amostras de alimentos, as bandas de interesse nos espectros podem sofrer algumas variações dependendo do alimento, devido ao diferente teor de umidade presente em cada tipo de alimento e a forma como a água se apresenta ligada aos diferentes componentes dos alimentos (RÜCKOLD et al., 2000; WILLIANS; NORRIS, 1990). No trabalho de Büning-Pfaue (2003), a região compreendida entre 5159 a 4990 cm–1 foi usada para a determinação de umidade em diferentes matrizes de alimentos e foi atribuída às ligações do tipo O-H e ligações de C-H. As regiões espectrais selecionadas neste trabalho para a construção dos modelos de regressão estão relacionadas às bandas de combinação (estiramento + deformação angular) das ligações O-H e ligações C-O compreendidas entre 4650 a 4900 e 5004 a 5062; e região entre 6170 a 6180 que correspondem às ligações C-H.

Os resultados da previsão do teor de umidade pelo modelo PLS (modelo II) para as amostras do conjunto de calibração podem ser vistos no gráfico mostrado na Figura 3.


Os resultados da previsão do modelo PLS para o teor de umidade para as amostras da validação externa comparados com os valores do teor de umidade do método de referência estão presentes no gráfico da Figura 4. Os parâmetros de erro (g.100 g –1) para as amostras do conjunto de validação externa foram: Press = 21,495; MSE = 0,298; RMSE = 4,504 e r = 0,818. As 24 amostras do conjunto de validação externa foram tomadas em triplicata.


A Tabela 3 apresenta os valores experimentais e os valores preditos pelo modelo PLS para as 24 amostras do conjunto de validação externa. A maior discordância entre o valor experimental e o valor predito pelo modelo encontrado neste conjunto foi de 10,2%, a menor foi de 0% e a média para as 24 amostras foi de 4,1%.

4 Conclusões

A partir dos modelos de regressão PLS pode-se inferir o teor de umidade em amostras de grãos de café cru com os seguintes erros: erro quadrático médio de calibração e validação (g.100 g –1): 0,569 e 2,298; e erro relativo médio para as amostras do conjunto de validação: 4,1%.

O alisamento dos espectros utilizando SPLINE, a filtragem dos espectros utilizando média-móvel e a seleção de variáveis via correlograma e leverage das variáveis são importantes na construção dos modelos com melhor habilidade de predição.

O método proposto reduz o tempo requerido de análise, pois em cerca de 1 minuto se obtém um espectro da amostra, e também proporciona a mínima manipulação da amostra, sendo necessária apenas a homogeneização em moinho.

Embora as vantagens da técnica sejam menor tempo de análise e mínima manipulação da amostra, é necessário o conhecimento do cálculo do modelo de regressão e do software e também de um certo número de espectros e resultados para a construção e validação do modelo de regressão.

Agradecimentos

Ao Consórcio Brasileiro de Pesquisa e Desenvolvimento do Café e à FUNAPE, pelo apoio financeiro para a realização deste trabalho.

Recebido para publicação em 7/2/2006

Aceito para publicação em 18/12/2007 (001671)

  • ASSOCIATION OF OFFICIAL ANALYTICAL CHEMISTS. Official methods of analysis of the Association of Official Analytical Chemists 17. ed. Gaithersburg, Maryland: AOAC, 2000. v. 2. cap 30, met. 968.11, p. 4.
  • BARKER, P. J.; KOCH, A. Low resolution NMR. In: BALTES, W (Ed.), Rapid methods for food and food raw material Hamburg, Germany: Behr's, 1990, p. 267-283.
  • BÜNING-PFAUE, H. Analysis of water in food by near infrared spectroscopy. Food Chemistry, Oxford, v. 82, n. 1, p. 107-115, 2003.
  • FISCHER, K. Neus Verfahren zur mabanalytischen Bestimmung des Wassergehaltes von Flüssigkiten und festen Körpern. Angewandte Chemie, Weinheim, v. 48, n .1, p. 394-396, 1935.
  • GOLD, H. J. General application of near infrared moisture analysis to fruits and vegetables materials. Food Technology, Chicago, v. 18, n. 1, p. 184-185, 1964.
  • ISENGARD, H-D.; FÄRBER, J. M. 'Hidden parameters' of infrared drying for determining low water contents in instant powders. Talanta, Amsterdam, v. 50, n. 2, p. 239-246, 1999.
  • ISENGARD, H-D. Water content, one of the most important properties of food. Food Control, Oxford, v. 12, n. 7, p. 395-400, 2001.
  • ______. Rapid water determination in foodstuffs. Trends in Food Science & Technology, Oxford, v. 6, n. 1, p. 155-162, 1995.
  • ISO - International Organization for Standardization. International Standard 939: Spices and Condiments – Determination of moisture Content – Entrainment Method, Secrétariat central ISO, Geneva, Switzerland, 1980.
  • KENT, M.; MEYER, W. A. Density-independent microwave moisture meter for heterogeneous foodstuffs. Journal of Food Engineering, Oxford, v. 1, n. 1, p. 31-42, 1982.
  • KRASZEWSKI, A. Microwave aquametry A review. Journal Microwave Power, Mechanicsville, v. 15, n. 4, p. 207-220, 1980.
  • MARTENS, H.; NAES, T. Multivariate Calibration John Wiley & Sons, New York, 1996.
  • MATLAB – The Language of Tecnical Computing. MATLAB User's guide, Ver.5.1. The MathWorks Inc., New Jersey, 1997.
  • OSBORNE, B. G.; FEARN, T. Near infrared spectroscopy in food analysis New York: Longman Scientific & Technical, 1988.
  • OSBORNE, B. G.; FEARN, T. Applications of near infrared spectroscopy in food analysis. In: Near-infrared spectroscopy in food analysis; Longman Scientific & Technical: Harlow, UK, 1986.
  • RÜCKOLD, S.; GROBECKER, K. H.; ISENGARD, H-D. Determinations of the contents of water and moisture in milk powder. Fresenius Journal Analytical Chemistry, v. 368, n. 5, p. 522 527, 2000.
  • VILLAMARÍN, B. et al. Analysis of grass silage from Northwestern Spain by near-infrared reflectance spectrocopy, Journal of Association of Official Analytical Chemists International, Gaithersbur, v. 85, n.1, p. 541-545, 2002.
  • WATSON, C. A. Near-infrared reflectance spectrophotometric analysis of agricultural products. Analytical Chemistry Washington, v. 49, n. 9, p. 835A-840A, 1977.
  • WILLIANS, P.; NORRIS, K. Near Infrared Technology in the Agricultural and Food Industries American Association of Cereal Chemists, Inc. Minnesota, USA, 1990.
  • WISE, B. M.; GALLAGHER, N. B. PLS-Toolbox 2.1 for use with Matlab, EigenVector Research Inc, W.A. Manson, 1998.
  • *
    A quem a correspondência deve ser enviada
  • Datas de Publicação

    • Publicação nesta coleção
      28 Abr 2008
    • Data do Fascículo
      Mar 2008

    Histórico

    • Aceito
      18 Dez 2007
    • Recebido
      07 Fev 2006
    Sociedade Brasileira de Ciência e Tecnologia de Alimentos Av. Brasil, 2880, Caixa Postal 271, 13001-970 Campinas SP - Brazil, Tel.: +55 19 3241.5793, Tel./Fax.: +55 19 3241.0527 - Campinas - SP - Brazil
    E-mail: revista@sbcta.org.br