SciELO - Scientific Electronic Library Online

 
vol.22 issue3An investigation of product design and production in an automotive assembler and engine suppliers that adopt modularityManagement of fuzzy front end: case studies in medical device industry author indexsubject indexarticles search
Home Pagealphabetic serial listing  

Services on Demand

Article

Indicators

Related links

  • Have no similar articlesSimilars in SciELO

Share


Production

Print version ISSN 0103-6513

Prod. vol.22 no.3 São Paulo May/Aug. 2012 Epub May 29, 2012

http://dx.doi.org/10.1590/S0103-65132012005000032 

Seleção de atributos em avaliações sensoriais descritivas

 

Attribute selection in descriptive sensory analysis

 

 

Karina RossiniI; Michel José AnzanelloII; Flavio Sanson FogliattoIII

IUFRGS, Brasil. karinarossini@hotmail.com
IIUFRGS, Brasil. anzanello@producao.ufrgs.br
IIIUFRGS, Brasil. ffogliatto@producao.ufrgs.br

 

 


RESUMO

A seleção dos atributos a serem avaliados em uma análise sensorial é fundamental no planejamento de painéis sensoriais. O processo de seleção visa reduzir a lista de atributos a serem apresentados aos julgadores, evitando assim fadiga aos membros do painel, porém mantendo atributos significativos na caracterização das amostras avaliadas. Este artigo apresenta um método para seleção de atributos em painéis sensoriais baseados em avaliações descritivas das amostras, tais como os métodos QDA (Quantitative Descriptive Analysis) e Spectrum. O método proposto utiliza Análise de Componentes Principais para identificação dos atributos mais relevantes e então aplica Análise Discriminante para classificação das amostras em formulações distintas. O método é aplicado em um estudo de caso em que cubos de carne com molho são caracterizados em painel sensorial utilizando o método QDA. O método proposto reduz significativamente o número de atributos a serem avaliados e conduz à satisfatória acurácia de classificação das amostras em formulações.

Palavras-chave: Seleção de atributos. Análise sensorial. Análise multivariada.


ABSTRACT

The selection of attributes from a group of candidates to be assessed through sensory analysis is an important step when planning sensory panels. When selecting attributes, it is desirable to reduce the list of those to be presented to panelists in order to avoid fatigue, however keeping the attributes that are relevant to the sensory characterization of samples. This paper presents a multivariate method for attribute selection in descriptive sensory panels, such as those used in the QDA (Quantitative Descriptive Analysis) and Spectrum protocols. The proposed method is implemented using Principal Component Analysis and Descriptive Analysis, and it is evaluated in a case study where beef cubes in stew, used as combat ration by the American Army, are characterized in sensory panels through the Spectrum method. The method significantly reduced the number of attributes to be considered in sensory panels, while yielding satisfactory accuracy in the classification of samples.

Keywords: Attribute selection. Sensory evaluation. Multivariate analysis.


 

 

1. Introdução

Na indústria de alimentos, a análise sensorial é elemento chave para identificar as expectativas dos consumidores (LEDAUPHIN; POMMERET; QANNARI, 2008). A análise sensorial compreende um conjunto de técnicas para medir precisamente atributos sensoriais de produtos a partir de respostas humanas. Tais técnicas utilizam princípios oriundos da ciência de alimentos, fisiologia, psicologia e estatística, fornecendo respostas objetivas para as propriedades de alimentos, conforme percebidas pelos cinco sentidos (PIGGOTT; SIMPSON; WILLIAMS, 1998).

Informações obtidas através de avaliações sensoriais podem ser utilizadas por empresas como suporte técnico para pesquisa, industrialização, marketing e controle de qualidade dos itens produzidos, qualificando decisões técnicas e administrativas. Na perspectiva do consumidor, a avaliação sensorial em produtos industriais assegura que cheguem ao mercado com as características desejadas (DUTCOSKY, 1996; LAWLESS; HEYMANN, 1998).

A avaliação sensorial é realizada de acordo com diferentes testes que dependem da sua finalidade (ANZALDÚA-MORALES, 1994). Limitações comuns nesses testes referem-se ao número de amostras, número de julgadores ou quantidade de atributos a serem analisados. No que tange a esse último aspecto, Sahmer e Qannari (2008) apontam que a seleção de atributos tem sido foco de investigações em diversas áreas industriais. Em particular, no perfil sensorial descritivo, estratégias de seleção podem ser utilizadas para reduzir o conjunto de atributos, selecionando aqueles relevantes e não redundantes. Tal seleção reduz o tempo de execução, a fadiga imposta aos membros do painel, e os custos da avaliação.

Um atributo significativo em uma investigação sensorial é aquele cuja avaliação apresenta diferenças sistemáticas e significativas entre as amostras investigadas, tal que seja possível relacionar o nível do atributo (através de seu valor medido) com características das amostras (por exemplo, a presença ou ausência de um ingrediente). Atributos que apresentam tal comportamento poderiam, por exemplo, ser utilizados como variáveis de resposta em modelos de regressão, os quais permitiriam a otimização do produto investigado no painel sensorial. Neste artigo, propõe-se um método para identificação de tais atributos usando dados obtidos em uma análise sensorial preliminar usando métodos descritivos.

O método proposto utiliza ferramentas de análise multivariada de dados, conciliando a Análise de Componentes Principais (ACP) e a Análise Discriminante (AD) como meio para redução do número de atributos (variáveis) na avaliação sensorial. Os pesos gerados pela ACP são transformados em índices de importância dos atributos. Esses índices são vinculados à AD, a qual classifica as amostras em diferentes classes de formulação, e uma medida de desempenho da classificação (geralmente acurácia) é calculada. Na sequência, o atributo apontado como menos relevante pelo índice de importância é eliminado e uma nova classificação é realizada, acompanhada por uma nova medição de acurácia. Esse procedimento iterativo é finalizado ao atingir-se um número limite de atributos remanescentes, e o subconjunto de atributos responsável pela maior acurácia é retido. Por fim, um procedimento de enumeração permite refinar o subconjunto anteriormente gerado pela inclusão dos atributos eliminados imediatamente antes do ponto de maior acurácia ter sido atingido. Tal procedimento assegura a obtenção de um subconjunto com elevado poder de discriminação das amostras.

Na ACP, as variáveis são reescritas como combinações lineares, as quais são denominadas componentes principais. Cada componente descreve uma porção da variabilidade presente nas variáveis originais, e sua interpretação é geralmente baseada na magnitude dos pesos associados às variáveis. Apesar do número de componentes principais resultantes de uma ACP sobre um conjunto de variáveis ser igual ao número de variáveis analisadas, usualmente é possível obter uma boa representação dos dados utilizando um número reduzido de componentes (RENCHER, 1995). A AD, por sua vez, é uma técnica de classificação e discriminação de amostras que permite alocar novas observações a grupos pré-determinados. Na utilização da AD, um grupo de observações cujos membros já estão identificados é utilizado para estimar pesos (ou parâmetros) de uma função discriminante conforme alguns critérios, tal como a minimização de erros de classificação (SUEYOSHI; GOTO, 2009).

O presente artigo traz uma importante contribuição para a área da Sensometria: o desenvolvimento de procedimentos de seleção de atributos, usuais em estudos de classificação, aplicados a problemas de análise sensorial. Os métodos QDA e Spectrum, de ampla utilização prática, estão baseados na caracterização plena das amostras através de um grande número de atributos, muitos dos quais não contribuem na diferenciação das amostras investigadas. O método aqui proposto permite identificar tais atributos utilizando dados de uma análise preliminar, eliminando-os da coleta posterior de dados, envolvendo um maior número de julgadores. Otimiza-se, assim, a coleta de dados sensoriais, usualmente de alto custo no desenvolvimento de produtos industriais.

O presente trabalho é composto de cinco seções. Além da introdução, é apresentado um referencial teórico sobre seleção de variáveis, seguido pela descrição do método proposto e, posteriormente, apresenta-se o estudo aplicado, finalizando com as conclusões.

 

2. Referencial teórico

As seções seguintes apresentam abordagens para a identificação dos atributos mais relevantes em análises sensoriais, além de descrever os fundamentos das técnicas multivariadas utilizadas no método proposto (Análise de Componentes Principais e Análise Discriminante).

2.1. Seleção de atributos em análises sensoriais

Técnicas analíticas multivariadas têm sido amplamente utilizadas em diversas áreas do conhecimento, motivadas por variadas aplicações. Na indústria de alimentos, em particular no tratamento de dados sensoriais, ressalta-se seu envolvimento para fins de (i) previsão das propriedades sensoriais e caracterização de produtos; (ii) seleção e identificação de segmentos de consumidores; e (iii) seleção de atributos em análises sensoriais descritivas.

Com vistas à previsão das propriedades sensoriais e caracterização de produtos, Johansen et al. (2008), em pesquisa com iogurtes desnatados e cream cheese, utilizaram a Regressão por Mínimos Quadrados Parciais (PLSR, ou partial least squares regression) para relacionar os resultados da análise sensorial descritiva a imagens digitais das superfícies das amostras. Karoui et al. (2006) fizeram uso de PLSR e Análise de Correlação Canônica (CCA, ou canonical correlation analysis) para comparar os resultados da análise sensorial com os obtidos através do Infravermelho Próximo (NIR, ou near infra red) em queijos, ao passo que Esteban-Díez, González-Sáiz e Pizarro (2004) utilizaram estas mesmas técnicas para investigar as relações entre determinados atributos sensoriais do café expresso e dados espectrais de amostras de café torrado. Por fim, Kreutzmann et al. (2008) utilizaram uma abordagem multibloco (LS-ParPLS) para a caracterização de cenouras.

Uma sistemática para identificação de segmentos de consumidores foi proposta por Sahmer, Vigneau e Qannari (2006) através da combinação de análise de cluster e algoritmo hierárquico em estudos com café. Heenan et al. (2009) avaliaram três segmentos de consumidores quanto à percepção acerca de pães frescos através da Análise de Componentes Principais (APC) e análise de cluster, utilizando também PLSR para investigar a relação entre as percepções dos consumidores para cada segmento. Carbonell et al. (2008) investigaram a segmentação de consumidores através do uso de um coeficiente de correlação entre consumidores e atributos sensoriais. Naquele trabalho, a segmentação, por meio da análise de clusters , fundamentou-se na semelhança entre os coeficientes de correlação dos consumidores.

A seleção de atributos em análises sensoriais descritivas, tema do presente artigo, é abordado por outro grupo de pesquisadores. Dijksterhuis, Frøst e Byrne (2002) propuseram uma aplicação em análise sensorial para o método estatístico proposto em Krzanowski (1995): o estudo objetivou reduzir um grande grupo de variáveis determinantes da percepção da gordura no leite em subgrupos menores, utilizando ACP. Os autores utilizaram uma rotação procrustes nos subgrupos, sendo o subgrupo detentor da menor perda procrustes selecionado. Já Sahmer e Qannari (2008) compararam seis métodos distintos para identificação de um subconjunto de atributos sensoriais relevantes em dados descritivos oriundos de perfis sensoriais. Dois dos métodos testados baseiam-se em ACP, dois utilizam a análise generalizada de procrustes (pGPA, ou generalized rocrustes analysis) e dois envolvem análise de clusters. A análise visou reduzir o número total de atributos apresentados ao painel e preservar a estrutura multivariada dos dados. Os métodos utilizando análise de clusters obtiveram melhores resultados em conjuntos de dados reais e simulados. Porém, apesar de proporcionar a identificação dos atributos relevantes, o método desenvolvido pelos autores não dispensa a coleta de dados sobre atributos considerados não relevantes.

Westada et al. (2003) apresentam uma metodologia para identificação de atributos significantes em modelos multivariados, baseada na aplicação de ACP em dados de análise sensorial descritiva e de consumidores. O objetivo é interpretar fatores latentes que abrangem características como sabor, odor, aparência e textura em sorvetes e queijos, identificando produtos semelhantes ou diferentes, bem como os atributos que os diferenciam. O método foi baseado nas estimativas de incerteza provenientes da técnica de cross-validation/Jack-knifing, sendo o teste t de student utilizado para calcular a significância de cada variável para cada componente.

Carbonell, Izquierdo e Carbonell (2007) utilizaram a GPA para selecionar os atributos na avaliação de sucos natural e processado de tangerina. Peron (2000) identificou as diferenças entre variedades de batatas através de trinta atributos avaliados por 14 julgadores. Para tanto, selecionaram-se atributos de acordo com sua capacidade discriminativa utilizando ANOVA (Análise de Variância) e ACP. Por fim, o autor utilizou uma GPA normalizada para calcular o índice confiabilidade de cada julgador. Outro método para seleção de atributos discriminantes, desta vez aplicado a diferentes tipos de queijos, foi proposto por Granitto et al. (2007). Os autores compararam o método random forests (RFs) com análise discriminante linear (LDA, ou Linear Discriminant Analysis) e discriminante por mínimos quadrados parciais (DPLS, ou Discriminant Partial Least Squares). A função discriminante derivada do RFs atribui pesos de importância para os atributos, sendo esses pesos responsáveis pela seleção de um número reduzido de atributos que garanta um satisfatório poder discriminatório da função.

2.2. Análise de Componentes Principais e Análise Discriminante

A Análise de Componentes Principais (ACP) tem o objetivo de reduzir a dimensionalidade de um conjunto de dados sem perda significativa de informações. Os componentes principais são combinações lineares dos dados originais. Através da ACP é possível substituir os dados originais por um número reduzido de componentes principais independentes entre si (JACKSON, 1980, 1981).

Considere um conjunto de dados composto de realizações de p atributos sensoriais. É possível extrair desse conjunto de dados p componentes principais, sendo cada um uma combinação linear distinta dos p atributos originais. Cada componente principal (CP) captura uma direção de variabilidade do conjunto de dados originais. As direções capturadas por cada componente principal são ortogonais entre si (ou seja, garantindo a independência entre CPs).

A determinação dos componentes principais pode utilizar as informações na matriz de covariâncias ou de correlações associadas aos p atributos originais. A matriz de covariâncias é recomendada quando a escala dos atributos analisados pode fornecer informações relevantes sobre a estrutura dos dados (RENCHER, 1995). No caso de atributos descritos por escalas oriundas de questionário ou painéis, geralmente contidas no mesmo intervalo de valores, as análises feitas através da matriz de covariâncias e de correlação geram resultados semelhantes, a menos que haja efeito significativo de localização no uso da escala pelos diferentes julgadores. Nesse caso, recomenda-se a remoção de tais efeitos através de pré-tratamento dos dados (por exemplo, usando o método proposto em Ledauphin, Hanafi e Qannari, 2006) ou o uso da matriz de correlações na ACP.

Seja Σ a matriz de covariâncias, de dimensão (p × p), associada à matriz de dados observados para os atributos X = [x1, x2, ..., xp]. A dimensão de X é (n × p), ou seja, dispõem-se de n observações de cada atributo. O vetor xt denota uma linha qualquer de X, isto é, x1 = (xi1,xi2, ..., xin) sendo i = 1, 2, ..., p e n o tamanho da amostra. Os p autovalores de Σ são designados por λi, i = 1, ..., p, e os p autovetores normalizados designados por wi, i = 1,..., p, com elementos dados por (wi1, ..., wip). Associado a cada autovalor λi existe um autovetor wi. Assim, os pares (λ1, wi), (λ2, w2), ..., (λp, wp) correspondem aos autovalores e autovetores de Σ, com autovalores arranjados tal que λ1 > λ2 > .... > λp. O i-ésimo componente principal pode ser obtido pela expressão (SEBER, 1984):

O número de componentes principais a ser retido (M) pode ser definido com base no percentual de variância explicado pelos componentes. Para tanto, somam-se os autovalores (arranjados do maior ao menor) até atingir-se um valor desejado de variância (RENCHER, 1995). O percentual ideal da variância explicada pelos PCs depende da natureza do problema analisado.

Na Equação 1, os elementos do autovetor wi funcionam como pesos de importância dos atributos X1, ..., Xp na composição do i-ésimo CP, e são denominados cargas do componente. Em CPs obtidos a partir de atributos padronizados, a magnitude do peso associado ao atributo descreve importância relativa deste na composição dos CPs.

No restante desta seção, apresentam-se os fundamentos da Análise Discriminante (AD).

A AD é uma técnica de classificação de observações em classes distintas (JOBSON, 1996). Diferentemente das técnicas tradicionais de clusterização, a AD possibilita a classificação de novos objetos nas classes já existentes sem que seja necessário um rearranjo de classes (MINGOTI, 2005). Além do propósito de classificação, a AD também pode ser utilizada para obter um melhor entendimento das relações entre as observações e os grupos a que pertencem.

A técnica é operacionalizada através da construção de uma relação entre uma variável dependente não contínua (Z) e um conjunto de variáveis contínuas (x's). Essa relação é expressa através de uma função discriminante consistindo em uma combinação das variáveis contínuas (HAIR et al., 2006; ZANINE et al., 2008). Duas funções tradicionalmente geradas são as do tipo linear aplicada quando as matrizes de covariâncias são similares entre as classes analisadas e exemplificadas na Equação 2 ou do tipo quadrática, quando as matrizes de covariâncias entre as classes são distintas. Outras funções podem ser encontradas em Hair et al. (2006).

onde b0 é uma constante, bi são os coeficientes de ponderação associados às variáveis independentes, e Z é o escore discriminante obtido para cada objeto na análise.

Por constituir-se em uma técnica supervisionada (DUDA; HART; STORK, 2001), os coeficientes bi da AD são estimados com base em um banco de dados em que a classe de cada observação é conhecida a priori. Os coeficientes são determinados com base na média e na variância-covariância das variáveis pertencentes a cada classe, maximizando-se a diferença padronizada entre os escores médios provenientes de classes distintas. A classificação de observações futuras é feita através da determinação do seu escore Z, e posterior comparação com limites estabelecidos. Mais detalhes acerca da geração da função discriminante e obtenção dos coeficientes podem ser encontrados em Hair et al. (2006).

 

3. Método proposto

O método aqui proposto é baseado em uma sequência de etapas que utilizam, majoritariamente, duas técnicas de análise multivariada de dados: ACP e AD. Os pesos dos componentes principais da ACP geram subsídios para a identificação dos atributos que apresentam maior variabilidade, servindo com base para a geração de um índice de importância dos atributos. A AD, por sua vez, cumpre a função de categorizar as observações (amostras) nas classes de formulação com base nos atributos. Um processo iterativo de classificação via AD e eliminação dos atributos menos relevantes é balizado pelo índice de importância gerado para os atributos.

A aplicação do método pressupõe uma pré-coleta de dados sensoriais utilizando métodos descritivos, tais como o QDA (Quantitative Descriptive Analysis; ver STONE et al., 1974, e STONE; SIDEL, 1992) e o método Spectrum (ver MEILGAARD; CARR; CIVILLE, 1999). A principal característica desse tipo de método é a mensuração da intensidade de atributos em amostras utilizando escalas contínuas. Na pré-coleta, utiliza-se um número reduzido de julgadores e repetições. De posse dos dados da pré-coleta, aplicam-se as etapas detalhadas no restante desta seção.

O método fundamenta-se na seguinte lógica. Deseja-se identificar o conjunto de atributos que maximiza a diferença entre as formulações, aqui tratadas como classes, avaliadas no painel sensorial. Quanto maior a diferença entre classes, maior a chance da obtenção de modelos de regressão significativos, associando atributos a ingredientes testados em diferentes níveis nas formulações. Tais modelos viabilizam a otimização da formulação do produto analisado usando procedimentos de otimização de experimentos multirresposta (ver FOGLIATTO; ALBIN, 2001, entre outros). Desta forma, atributos a serem retidos são aqueles responsáveis por parcelas importantes da variabilidade observada entre classes. O resultado de um painel sensorial fornecido por um julgador é uma observação; nela, uma amostra, correspondendo a uma formulação, é analisada com relação a p atributos. Conhece-se, a priori, a qual classe pertence cada observação obtida na análise sensorial do produto, já que estão vinculadas às formulações testadas; o objetivo aqui é identificar quais atributos melhor caracterizam essa alocação de observações em classes.

3.1. Aplicação da ACP no banco de dados e geração do índice de importância dos atributos

A ACP é aplicada na matriz de correlação dos atributos e tem por objetivo gerar-lhes pesos de importância. Tais pesos, dados pelo autovetor wi associado ao i-ésimo componente principal, além de identificar atributos que apresentam maior variabilidade, são utilizados na geração de um índice de importância para cada atributo (designado por IAi).

O índice de importância do atributo i é estimado com base na magnitude dos pesos gerados pela ACP. Este índice é composto pela soma dos valores absolutos dos pesos sobre os M componentes retidos, conforme apresentado na Equação 3.

Atributos com valores de IA elevados na Equação 3 são considerados mais relevantes na análise, uma vez que apresentam maior variância associada. Segundo Duda, Hart e Stork (2001) e Anzanello, Albin e Chaovalitwongse (2009), atributos com elevada variância são desejados em procedimentos de classificação/discriminação, visto que possibilitam separações mais precisas entre os grupos.

3.2. Eliminação dos atributos irrelevantes para classificação das amostras em classes de formulação

Neste passo, almeja-se identificar os atributos mais relevantes para classificação das amostras em classes de formulação. Para tanto, adota-se uma sistemática de eliminação dos atributos menos relevantes no formato backward (ANZANELLO, 2009), em que os atributos são sistematicamente eliminados do banco de dados após cada classificação.

O procedimento de classificação proposto aplica AD sobre os p atributos. O desempenho da classificação das amostras (observações) nas classes pré-definidas (formulações) é estimado através da acurácia. A acurácia é definida como a razão entre o número de classificações corretas e o número total de classificações efetuadas. É importante enfatizar que o procedimento de classificação não se apoiou nas tradicionais porções de treino (construção do modelo) e de teste (validação em novas observações) em decorrência do limitado número de repetições dentro de cada combinação de formulação e julgador. Logo, a acurácia de classificação foi estimada com base nas mesmas observações utilizadas para construção da função discriminante.

Na sequência, o atributo com o menor valor de IA é eliminado do banco de dados, e os p-1 atributos remanescentes são utilizados em uma nova classificação das amostras. A acurácia de classificação é novamente calculada. Esse procedimento iterativo é mantido até atingir-se um número desejado de atributos remanescentes, sendo que dois atributos são o limite inferior recomendado.

Um gráfico associando acurácia e número de atributos retidos é gerado para monitorar o processo de eliminação. Esse gráfico auxilia na definição de um subconjunto apropriado de atributos, o qual é analisado em detalhes na etapa seguinte do método.

3.3. Análise do gráfico de acurácia e definição do melhor subconjunto de atributos

Essa etapa é composta por duas subetapas: (i) definição de um ponto de corte no gráfico de acurácia e seleção de um subconjunto de atributos, SA; e (ii) enumeração das possíveis combinações dos atributos em SA (incluindo um número limitado de atributos recentemente eliminados, AE), e seleção do subconjunto de atributos responsável pela máxima acurácia de classificação.

A definição de um ponto de corte no gráfico de acurácia é feita de forma subjetiva, e visa definir um número mínimo de atributos a ser considerado no procedimento de enumeração. Recomenda-se escolher um ponto que concilie um nível de acurácia satisfatório e um número reduzido de atributos retidos. Essa condição é verificada próxima a pontos em que a acurácia apresenta considerável redução com a eliminação de um atributo, conforme exemplo na Figura 1.

 

 

Na sequência, recomenda-se incluir alguns dos atributos recentemente eliminados (ou seja, pertencentes ao subconjunto AE) ao subconjunto SA (conforme Figura 1). Esse procedimento visa assegurar que atributos de importância intermediária sejam inseridos no procedimento de enumeração, podendo eventualmente gerar acurácias satisfatórias ao serem combinados aos atributos em SA. A não inclusão de elementos de AE em SA não compromete a eficiência do método, mas pode conduzir a acurácias inferiores. O número de atributos de AE é definido subjetivamente (recomenda-se de 3 a 5 atributos), sendo escolhidos os atributos com valor de IA imediatamente superior ao IA do último atributo incluído no subconjunto SA.

A subetapa (ii) consiste na enumeração total de combinações , onde m refere-se aos atributos em SA+AE e b denota o possível número de atributos a serem mantidos, variando de {SA} a {SA+AE}, onde {φ} denota o número de elementos em φ]. Cada combinação tem sua acurácia de classificação avaliada, sendo que a combinação responsável pela máxima acurácia indica o melhor subconjunto de atributos.

Por fim, enfatiza-se que uma análise simplificada pode ser conduzida através da seleção direta dos atributos responsáveis pelo ponto de corte no gráfico de acurácia (subconjunto SA), eliminando-se assim a necessidade de enumeração.

 

4. Estudo de caso

Nesta seção, aplica-se o método proposto para seleção de atributos utilizando dados obtidos em uma avaliação sensorial realizada utilizando o método Spectrum de análise sensorial descritiva. Trata-se de um dos mais rigorosos métodos para treinamento e coleta de informações sensoriais de julgadores, desenvolvido por Gail Civille e apresentado em Meilgaard, Carr e Civille (1999).

Julgadores candidatos a integrar o painel foram selecionados em duas etapas. A primeira etapa consistiu de uma entrevista telefônica, com o objetivo de identificar a disponibilidade do candidato e sua familiaridade com testes sensoriais. Candidatos considerados aptos foram convidados a realizar uma bateria completa de testes, nos quais atributos relacionados a sabor, textura e aparência foram investigados. De aproximadamente 25 candidatos, 8 foram selecionados ao término da fase preliminar de treinamento (3 meses). A segunda fase consistiu de duas sessões de treinamento semanais, de duração aproximada de 1,5 horas, durante mais 3 meses, ao cabo dos quais os julgadores foram considerados treinados.

Os painéis sensoriais buscavam a caracterização de uma ração militar constituída de cubos de carne ao molho embalados em pouches termoestáveis. Os oito julgadores analisaram 26 atributos de 8 formulações do produto em questão. Cada avaliação foi realizada em quadriplicata. Os painéis sensoriais foram realizados em 1994, no Nabisco Food Center da Rutgers University (EUA), como parte de um projeto de pesquisa para o exército norte-americano. Os atributos avaliados estão agrupados por similaridade, conforme apresentado na Tabela 1.

ACP foi aplicada na matriz de correlação dos atributos padronizados. A matriz de correlação e a variância dos atributos são apresentadas no Apêndice. Os 24 atributos (os atributos 3 e 4 foram descartados da análise por apresentarem dados incompletos) foram tratados como variáveis e as amostras como observações (8 formulações × 8 julgadores × 4 repetições). Foram retidos 4 componentes principais, respondendo por 68% da variância total. A inclusão de componentes adicionais não eleva a acurácia da classificação, de acordo com os testes realizados. Os pesos dos componentes foram manipulados através da Equação 3, gerando os índices de importância IA para os 24 atributos, conforme apresentado na Tabela 2 (observe que os atributos são apresentados em ordem decrescente de importância).

 

 

Na sequência, iniciou-se o processo iterativo de classificação e eliminação dos atributos (descrito na seção 3.2), gerando-se o gráfico de acurácia da Figura 2. A avaliação subjetiva deste gráfico mostra que o perfil de acurácia permanece estável à medida que os primeiros 11 atributos são removidos, e então existe uma queda considerável na acurácia (ponto destacado no perfil e definido como ponto de corte). Tal ponto corresponde a 14 atributos retidos.

A Tabela 3 apresenta os valores de acurácia após cada eliminação de atributo (bem como a identificação do atributo eliminado). A primeira linha numérica desta tabela apresenta 0,723 como a acurácia de classificação obtida quando 24 atributos são considerados; na linha seguinte, o atributo 24 é eliminado, e a acurácia de classificação utilizando os 23 atributos remanescentes cai para 0,711. O ponto de corte selecionado refere-se ao subconjunto formado por 14 atributos, os quais conduzem a uma acurácia de 0,676. Tal subconjunto (definido como subconjunto SA), que contém representantes de todos os quesitos pesquisados, é formado pelos seguintes atributos, em ordem decrescente de importância: 10, 2, 16, 17, 21, 18, 22, 15, 19, 9, 26, 6, 20 e 1. O subconjunto AE é constituído pelos 5 atributos removidos antes que o ponto de corte fosse atingido (atributos 7, 8, 25, 23 e 5), na Tabela 2.

 

 

A enumeração das possíveis combinações incluiu os atributos SA+AE acima listados. O número de atributos a serem retidos variou de 14 a 19; o primeiro valor é arbitrado como o número mínimo de atributos a serem mantidos com base no ponto de corte, enquanto que 19 reflete a inclusão dos 5 atributos oriundos de AE. Por exemplo, a primeira enumeração testou a acurácia de todos os possíveis subconjuntos de 14 atributos formados a partir dos 19 atributos candidatos (SA+AE), resultando em um valor de 0,714. A Tabela 4 traz a maior acurácia gerada pela retenção de diferentes números de atributos. Este procedimento confirma que 16 atributos devem ser retidos, o que assegura uma acurácia de 0,723, valor idêntico ao obtido quando todos os atributos são utilizados. Os atributos selecionados são: 1, 2, 5, 6, 7, 8, 9, 10, 16, 17, 19, 20, 21, 23, 25 e 26. Observe que, dentre os atributos selecionados, figuram todos os atributos de aparência, bem como a maioria dos atributos de sabor.

 

 

Por fim, a acurácia do método proposto (0,723 com 16 atributos) foi comparada à máxima acurácia possível, obtida através da enumeração total de combinações geradas pelos 24 atributos (i.e., +...+). O máximo valor de acurácia possível é 0,742, obtido com 19 atributos (os 19 atributos responsáveis pela acurácia de 0,742 são diferentes dos 19 atributos selecionados pelo método, acima apresentados). Vale enfatizar que a enumeração total das possibilidades demandou 32 horas de processamento em PC 2.4 GHz, ao passo que a enumeração decorrente do método proposto demandou 10 minutos de análise.

 

5. Conclusões

Em painéis de avaliação sensorial, a existência de um número elevado de atributos conduz a procedimentos longos e caros, além de impor fadiga aos membros do painel. De tal forma, a seleção dos atributos mais relevantes constitui-se em uma importante etapa no planejamento desses painéis.

Este estudo apresentou um método para seleção de atributos na avaliação sensorial de alimentos. O método concilia duas metodologias de análise multivariada: análise de componentes principais (ACP) e análise discriminante (AD). Os pesos gerados pela ACP dão origem a um índice de importância dos atributos. A AD é então utilizada para classificação das amostras em diferentes classes, denotando formulações distintas. Um procedimento iterativo é desencadeado através da classificação das amostras e subsequente eliminação dos atributos menos relevantes, de acordo com a ordem definida pelos índices de importância. A acurácia de classificação é avaliada após cada eliminação de atributo, indicando um subconjunto de potenciais atributos a serem utilizados. Por fim, um procedimento de enumeração identifica o melhor subconjunto de atributos a serem considerados em painéis sensoriais.

O método proposto permitiu reduzir o número de atributos em um painel de análise sensorial de cubos de carne ao molho de 24 para 16, mantendo-se os mesmos níveis de acurácia. Por fim, verificou-se que o resultado gerado pela metodologia proposta é similar à máxima acurácia possível, a qual é obtida de forma exaustiva por enumeração sobre a totalidade de atributos.

 

Referências

ANZALDÚA-MORALES, A. A. La evaluación sensorial de los alimentos en la teoria e la práctica. Zaragoza: Editorial Acribia S.A., 1994.         [ Links ]

ANZANELLO, M. J. Seleção de variáveis com vistas à classificação de bateladas de produção em duas classes. Gestão & Produção, v. 16, p. 526-533, 2009.         [ Links ]

ANZANELLO, M. J.; ALBIN, S.; CHAOVALITWONGSE, W. A., Selecting the best variables for classifying production batches into two quality levels. Chemometrics and Intelligent Laboratory Systems, v. 97, p. 111-117, 2009. http://dx.doi.org/10.1016/j.chemolab.2009.03.004         [ Links ]

CARBONELL, L.; IZQUIERDO, L.; CARBONELL, I. Sensory analysis of Spanish mandarin juices. Selection of attributes and panel performance. Food Quality and Preference, v. 18, p. 329-341, 2007. http://dx.doi.org/10.1016/j.foodqual.2006.02.008         [ Links ]

CARBONELL, L. et al. Segmentation of food consumers according to their correlations with sensory attributes projected on preference spaces. Food Quality and Preference, v. 19, p. 71-78, 2008. http://dx.doi.org/10.1016/j.foodqual.2007.06.006         [ Links ]

DIJKSTERHUIS, G.; FRØST, M. B.; BYRNE, D. V. Selection of a subset of variables: minimisation of Procrustes loss between a subset and the full set. Food Quality and Preference, v. 13, p. 89-97, 2002. http://dx.doi.org/10.1016/S0950-3293(01)00065-9         [ Links ]

DUDA, R.; HART, P.; STORK, D. Pattern Classification. 2. ed. New York: Wiley-Interscience, 2001.         [ Links ]

DUTCOSKY, S. D. Análise Sensorial de Alimentos. Curitiba: Champagnat, 1996.         [ Links ]

ESTEBAN-DÍEZ, I.; GONZÁLEZ-SÁIZ, J. M.; PIZARRO, C. Prediction of sensory properties of espresso from roasted coffee samples by near-infrared spectroscopy. Analytica Chimica Acta, v. 525, p. 171-182, 2004. http://dx.doi.org/10.1016/j.aca.2004.08.057         [ Links ]

FOGLIATTO, F. S.; ALBIN, S. L. A hierarchical method for evaluating products with quantitative and sensory characteristics. IIE Transactions, v. 33, p. 1081-1092, 2001. http://dx.doi.org/10.1080/07408170108936898         [ Links ]

GRANITTO, P. M. et al. Modern data mining tools in descriptive sensory analysis: A case study with a Random forest approach. Food Quality and Preference, v. 18, p. 681-689, 2007. http://dx.doi.org/10.1016/j.foodqual.2006.11.001         [ Links ]

HAIR, J. F. et al. Análise multivariada de dados. New York: Bookman, 2006.         [ Links ]

HEENAN, S. P. et al. Characterization of fresh bread flavor: Relationships between sensory characteristics and volatile composition. Food Chemistry, v. 116, p. 249-257, 2009. http://dx.doi.org/10.1016/j.foodchem.2009.02.042         [ Links ]

LAWLESS, H. T.; HEYMANN, H. Sensory Evaluation of Food: Principles and Practices. New York: Chapman & Hall, 1998.         [ Links ]

JACKSON, J. E. Principal Component and factor Analysis: Part I - Principal Components. Journal of Quality Technology, v. 12, p. 201-213, 1980.         [ Links ]

JACKSON, J. E. Principal Component and factor Analysis: Part II - Additional Topics Related to Principal Components. Journal of Quality Technology, v. 13, p. 46-58, 1981.         [ Links ]

JOBSON, J. D. Applied multivariate data analysis. New York: Springer-Verlag, 1996.         [ Links ]

JOHANSEN, S. M. B. et al. Prediction of sensory properties of low-fat yoghurt and cream cheese from surface images. Food Quality and Preference, v. 19, p. 232-246, 2008. http://dx.doi.org/10.1016/j.foodqual.2007.03.006         [ Links ]

KAROUI, R. et al. Prediction of sensory attributes of European Emmental cheese using near-infrared spectroscopy: A feasibility study. Food Chemistry, v. 101, p. 1121-1129, 2006. http://dx.doi.org/10.1016/j.foodchem.2006.03.012         [ Links ]

KRZANOWSKI, W. Selection of variables, and assessment of their performance, in mixed-variable discriminant analysis. Computational Statistics and Data Analysis, v. 19, p. 419-431, 1995. http://dx.doi.org/10.1016/0167-9473(94)00011-7         [ Links ]

KREUTZMANN, S. et al. Prediction of sensory quality in raw carrots (Daucus carota L.) using multi-block LS-ParPLS. Food Quality and Preference, v. 19, p. 609-617, 2008. http://dx.doi.org/10.1016/j.foodqual.2008.03.007         [ Links ]

LEDAUPHIN, S.; HANAFI, M.; QANNARI, E. M. Assessment of the agreement among the subjects in fixed vocabulary profiling. Food Quality and Preference, v. 17, p. 277-280, 2006. http://dx.doi.org/10.1016/j.foodqual.2005.03.017         [ Links ]

LEDAUPHIN, S.; POMMERET, D.; QANNARI, M. Application of hidden Markov model to products shelf lives. Food Quality and Preference, v.19, p.156-161, 2008. http://dx.doi.org/10.1016/j.foodqual.2007.04.006         [ Links ]

MEILGAARD, M. C.; CARR, B. T.; CIVILLE, G. V. Sensory Evaluation Techniques. 4. ed. Boca Ratón: CRC Press, 1999. http://dx.doi.org/10.1201/9781439832271         [ Links ]

MINGOTI, S. A. Análise de dados através de métodos de estatística multivariada: uma abordagem aplicada. Belo Horizonte: UFMG, 2005.         [ Links ]

PERON, L. Statistical analysis of sensory profiling data: data reductionand generalised Procrustes analysis. Food Quality and Preference, v.11, p.155-157, 2000. http://dx.doi.org/10.1016/S0950-3293(99)00070-1         [ Links ]

PIGGOTT, J. R.; SIMPSON, S. J.; WILLIAMS, S. A. R. Sensory analysis. International Journal of Food Science and Technology, v. 33, p. 7-18, 1998. http://dx.doi.org/10.1046/j.1365-2621.1998.00154.x         [ Links ]

RENCHER, A. C. Methods of Multivariate Analysis. New York: Wiley, 1995.         [ Links ]

SAHMER, K.; VIGNEAU, E.; QANNARI, E. M. A cluster approach to analyze preference data: choice of the number of clusters. Food Quality and Preference, v.17, p.257-265, 2006. http://dx.doi.org/10.1016/j.foodqual.2005.03.007         [ Links ]

SAHMER, K.; QANNARI, E. M. Procedures for the selection of a subset of attributes in sensory profiling. Food Quality and Preference, v. 19, p. 141-145, 2008. http://dx.doi.org/10.1016/j.foodqual.2007.03.007         [ Links ]

SEBER, G. A. F. Multivariate observations. New York: Wiley, 1984. http://dx.doi.org/10.1002/9780470316641         [ Links ]

STONE, H.; SIDEL, J. Sensory Evaluation Practices. 2. ed. San Diego: Academic Press, 1992.         [ Links ]

STONE, H. et al. Sensory Evaluation by Quantitative Descriptive Analysis. Food Technology, v. 28, n. 1, p. 24-34, 1974.         [ Links ]

SUEYOSHI, T.; GOTO, M. Methodological comparison between DEA (data envelopment analysis) and DEA-DA (discriminant analysis) from the perspective of bankruptcy assessment. European Journal of Operational Research, v. 199, n. 2, p. 561-575, 2009. http://dx.doi.org/10.1016/j.ejor.2008.11.030         [ Links ]

WESTADA, F. et al. Variable selection in PCA in sensory descriptive and consumer data. Food Quality and Preference, v. 14, p. 463-472, 2003. http://dx.doi.org/10.1016/S0950-3293(03)00015-6         [ Links ]

ZANINE, A. M. et al. Evaluation of the grass-tanzania ("Panicum maximum") using multivariate analyses. Revista Brasileira de Saúde e Produção Animal, v. 9, p. 179-189, 2008.         [ Links ]

 

 

Recebido 22/04/2010
Aceito 10/10/2011

 

 


Apêndice 1 - Clique para ampliar