Acessibilidade / Reportar erro

Recomendações para calibração em Química Analítica parte 2: calibração multianalito

Resumo

This paper is a translation of an IUPAC document by K. Danzer, M. Otto and L. A. Currie (Pure Appl. Chem., 2004, 76(6), 1215-1225). Its goal is to establish a uniform and meaningful standard for terminology (in Portuguese), notation, and formulation concerning multispecies calibration in analytical chemistry. Calibration in analytical chemistry refers to the relation between sample domain and measurement domain (signal domain) expressed by an analytical function x = f s (Q) representing a pattern of chemical species Q and their amounts or concentrations x in a given test sample and a measured function y = f (z) that may be a spectrum, chromatogram, etc. Simultaneous multispecies analyses are carried out mainly by spectroscopic and chromatographic methods in a more or less selective way. For the determination of n species Qi (i=1,2, ..., n), at least n signals must be measured which should be well separated in the ideal case. In analytical practice, the situation can be different.


ASSUNTOS GERAIS

Recomendações para calibração em Química Analítica parte 2. Calibração multianalito# # O presente artigo é uma tradução para o português (aprovada pelo Comitê Brasileiro para Assuntos de Química junto à IUPAC) do artigo "Guidelines for Calibration in Analytical Chemistry. Part 2. Multispecies Calibration" publicado em Pure Appl. Chem. 2004, 76, 1215, preparado por K. Danzer, M. Otto e L. A. Currie.

Maria Fernanda PimentelI; Roberto Kawakami Harrop GalvãoII; Mário César Ugulino de AraújoIII, * * e-mail: laqa@quimica.ufpb.br

IDepartamento de Engenharia Química, Universidade Federal de Pernambuco, Rua Teresa Méllia, s/n, 50740-521 Recife – PE, Brasil

IIDivisão de Engenharia Eletrônica, Instituto Tecnológico de Aeronáutica, Praça Mal. Eduardo Gomes, 50, 12228-900 São José dos Campos – SP, Brasil

IIIDepartamento de Química, Universidade Federal da Paraíba – Campus I, CP 5093, 58059-900 João Pessoa – PB, Brasil

ABSTRACT

This paper is a translation of an IUPAC document by K. Danzer, M. Otto and L. A. Currie (Pure Appl. Chem., 2004, 76(6), 1215-1225). Its goal is to establish a uniform and meaningful standard for terminology (in Portuguese), notation, and formulation concerning multispecies calibration in analytical chemistry. Calibration in analytical chemistry refers to the relation between sample domain and measurement domain (signal domain) expressed by an analytical function x = fs (Q) representing a pattern of chemical species Q and their amounts or concentrations x in a given test sample and a measured function y = f (z) that may be a spectrum, chromatogram, etc. Simultaneous multispecies analyses are carried out mainly by spectroscopic and chromatographic methods in a more or less selective way. For the determination of n species Qi (i=1,2, ..., n), at least n signals must be measured which should be well separated in the ideal case. In analytical practice, the situation can be different.

INTRODUÇÃO

Calibração em Química Analítica refere-se à relação entre o domínio das amostras e o domínio das medidas (domínio dos sinais) expressa por uma função analítica x = fs (Q) que representa uma associação entre os analitos Q e suas quantidades ou concentrações x em uma dada amostra-teste (Figura 1, lado esquerdo) e uma função de medida y = f (z) que pode ser representada por um espectro, cromatograma etc. (Figura 1, lado direito).


Determinações simultâneas de multianalitos são realizadas principalmente por métodos espectroscópicos e cromatográficos de forma relativamente seletiva. Para a determinação de n analitos Qi (i=1, 2, ..., n), pelo menos n sinais devem ser medidos. Em situações ideais estes sinais devem ser bem resolvidos (isto é, bem separados). Na prática analítica, entretanto, a situação pode ser diferente, como mostrado nas Figuras 2b e 2c, nas quais são ilustrados casos de sobreposição nos domínios dos sinais.




No caso da Figura 2a, o instrumento pode ser calibrado e avaliado para cada analito de maneira independente um do outro. Nesta situação completamente seletiva, o seguinte sistema de Equações 1a - 1c corresponde à matriz A da Equação 3:

onde o número de sinais de absorbâncias medidos é usualmente igual ao número de analitos, m = n.

Nos casos em que há sobreposição moderada entre sinais vizinhos, como ilustrado na Figura 2b, pode-se empregar a calibração linear múltipla quando as absorbâncias yi são aditivas e valores máximos de sinal podem ser associados a cada analito:

ou, em notação matricial,

Quando as pré-condições mencionadas acima são válidas, o sistema multianalito pode ser calibrado com um alto nível de confiança. As incertezas ei incluem tanto os desvios em relação ao modelo quanto os erros aleatórios (ruído).

Quando há uma grande sobreposição dos sinais (Figura 2c), a calibração linear múltipla não pode ser utilizada com confiabilidade, devido às seguintes razões:

(i) Em sistemas analíticos reais, nem todos os analitos são conhecidos. Nestes casos, uma alternativa é empregar o modelo de calibração inverso, Equação 6.

no qual Y pode ser uma matriz espectral com m comprimentos de onda e n misturas de calibração. Outras variações, como efeitos de linha de base, também devem ser incluídas no modelo. O vetor dos coeficientes de sensibilidade pode ser estimado por

(ii) Em princípio, multicolinearidades devem estar presentes em espectros semelhantes aos representados na Figura 2c. Com efeito, como as curvas dos sinais para cada analito individual são altamente sobrepostas, conseqüentemente, o somatório destas curvas contém sinais correlacionados, isto é, as absorbâncias medidas em diferentes comprimentos de onda não são independentes entre si. Assim, a Equação 7 torna-se mal-condicionada e outros métodos devem ser empregados para estimar os valores de a. Estes métodos são baseados em sistemas de equações super-determinados, como:

em vez da Equação 5. O número de comprimentos de onda (sensores, canais detectores), m, é geralmente muito maior que o número de analitos n (n = 3, no exemplo) e os coeficientes são estimados por calibração multivariada.

Diferentes métodos de calibração multianalito podem ser empregados dependendo se os espectros Y ou as concentrações X são considerados como variáveis dependentes (Figura 3).


CALIBRAÇÃO MULTIVARIADA CLÁSSICA

A calibração multivariada clássica representa a transição da determinação usual de um único analito a partir de uma única variável dependente (valor medido ou mensurado) para m variáveis dependentes, por exemplo, comprimentos de onda ou sensores, as quais podem ser incluídas simultaneamente no modelo de calibração. É possível determinar n > 1 analitos no sistema analítico. Empregando-se a notação matricial, a calibração linear clássica2 é representada pela relação:

na qual Y é a matriz (p x m) das variáveis dependentes (por exemplo, absorbâncias em m comprimentos de onda ou respostas em m sensores), X é a matriz (p x n) das variáveis independentes (por exemplo, concentrações de n analitos) e A é a matriz (n x m) dos coeficientes de calibração, comumente chamada de "matriz de sensibilidade"3-5; p é o número de padrões de calibração (misturas), que é idêntico ao número de espectros ou medidas similares. As linhas da matriz A correspondem aos espectros dos analitos puros, os quais podem ser medidos diretamente ou estimados indiretamente.

A calibração direta pode ser aplicada quando os coeficientes são conhecidos. No caso da calibração indireta, os coeficientes da calibração são calculados utilizando-se estimativas experimentais das relações entre espectros e concentrações.

O procedimento de calibração clássica só pode ser empregado quando todos os analitos que contribuem para o formato do espectro são conhecidos e podem ser incluídos na calibração. Adicionalmente, há a restrição de que não podem ocorrer interações entre os analitos e entre estes e outros constituintes das amostras (por exemplo, o solvente) ou efeitos (por exemplo, de temperatura).

Os resultados analíticos (concentrações) são estimados por

na qual A+ é a pseudo inversa generalizada de Moore-Penrose:

com as mesmas dimensões (m x n) da matriz transposta.

No caso da presença de variações da linha de base, as matrizes de sensibilidade das Equações 9 e 10 devem ser complementadas com adição de um vetor de números 1:

Em vez de adicionar o vetor de números 1, os dados de calibração podem ser centralizados (yi – e xi – , respectivamente). Nos casos em que os espectros dos analitos puros não podem ser medidos diretamente, a matriz A pode ser estimada indiretamente a partir dos espectros, desde que todos os analitos do sistema analítico sejam conhecidos.

Nota: Em vez do símbolo Ae do termo matriz de sensibilidade, também são utilizados o símbolo K e os termos matriz de coeficientes da calibração, matriz das constantes de resposta linear etc. Devido ao significado metrológico e analítico das sensibilidades aij da matriz A, o termo matriz de sensibilidades é mais recomendado.

Para inverter a matriz XTX, é necessário que se tenha um número suficiente de espectros medidos para diferentes níveis de concentração. Planejamentos experimentais devem ser utilizados para garantir que os vetores das concentrações sejam independentes uns dos outros6. Nos casos em que a preparação de amostras de composição definida não é possível, devem ser selecionadas, na medida do possível, as amostras que sejam as mais representativas e não-correlacionadas (planejamentos naturais3).

A previsão dos valores analíticos X de acordo com o modelo clássico de calibração inversa segue a Equação 14:

A independência requerida entre as variáveis dos diferentes sinais analíticos corresponde diretamente à seletividade do sistema analítico7-8. No caso da calibração multivariada, a seletividade é caracterizada pelo número de condição:

na qual ||A|| é a norma da matriz A e ||A -1|| é a norma da matriz inversa de A. A norma da matriz A é calculada a partir de img01, a raiz quadrada do maior autovalor lmax, e a norma de A-1 é calculada a partir do inverso da raiz quadrada do menor autovalor lmin:

A Equação 16 é válida para sistemas exatamente determinados (m = n). No caso de sistemas sobre-determinados, m > n, o número de condição é dado por:

Se os sistemas são bem condicionados, a seletividade é expressa por um número de condição próximo a 1.

INCERTEZA NA CALIBRAÇÃO MULTIVARIADA

A avaliação é realizada de acordo com as Equações 10 e 14. A previsão de um vetor linha x de dimensão n a partir de um vetor linha y, de dimensão m, é feita por:

A incerteza relativa para as previsões dos valores de x pode ser estimada por

na qual ||dy||/||y|| é a incerteza relativa dos valores de y (erro da medida) e ||dA||/||A|| a incerteza relativa das estimativas dos coeficientes de calibração (erro da modelagem). O número de condição é calculado a partir das Equações 15-17.

CALIBRAÇÃO INVERSA

A calibração clássica direta ou indireta é realizada através do método dos mínimos quadrados desenvolvido por Gauss. Assume-se que os valores de x são isentos de erros ou pelo menos que os erros em x sejam bem menores que os erros2 nas medidas de y. Além disso, todos os analitos do sistema em análise devem ser conhecidos e incluídos na calibração. Se estes requisitos não são atendidos a calibração inversa deve ser aplicada.

A calibração inversa faz a regressão dos valores analíticos (concentrações), x, nos valores medidos, y. Embora, dessa forma, um pré-requisito do método dos mínimos quadrados de Gauss seja violado, porque os valores de y não são isentos de erro, foi provado que as previsões com a calibração inversa são mais precisas que as previsões empregando a calibração clássica7 Isto vale, principalmente, para a calibração multivariada inversa.

Em quimiometria, o modelo de calibração inversa é também denominado de modelo da matriz P (a dimensão de P é m x n):

Os coeficientes da calibração são elementos da matriz P, os quais são estimados por

A concentração desconhecida de uma amostra é estimada multiplicando-se o espectro medido y pela matriz P

Não há vantagem significativa na calibração inversa quando são utilizadas as variáveis originais (valores medidos de y) exceto pelo fato de não ser necessária uma segunda inversão de matrizes na etapa de análise (ver Equação 22). Pelo contrário, é desvantajoso o fato dos coeficientes de calibração (elementos da matriz P) não apresentarem significado físico, uma vez que eles não refletem os espectros dos analitos puros. Além do mais, podem surgir multicolinearidades tornando difícil a inversão da matriz YTY (ver Equação 21).

Por outro lado, quando variáveis latentes são utilizadas em lugar das variáveis originais na calibração inversa, surgem poderosos métodos de calibração multivariada, os quais são freqüentemente empregados na determinação multianalito ou na determinação de um analito individual em sistemas multianalitos. Estes métodos são baseados, assim como os métodos da matriz P, no modelo de calibração inversa, em que se faz a regressão dos valores analíticos nos dados espectrais:

na qual B é a matriz (m x n) dos coeficientes da calibração. Ao contrário da matriz P, nem todas as dimensões dos espectros (matriz Y) são usadas, apenas aquelas consideradas significativas são percebidas por certas componentes principais. Portanto, a estimativa da matriz dos coeficientes B pode ser realizada por PCR ("principal component regression" – regressão em componentes principais) ou PLS ("partial least squares" – regressão por mínimos quadrados parciais).

Tanto PCR quanto PLS formam variáveis latentes T (componentes principais ou fatores, respectivamente) a partir das variáveis originais, isto é, a partir da matriz de valores medidos, de acordo com:

na qual T é a matriz de fatores (escores) e L a matriz de pesos com dimensões m x n; EY é a matriz dos fatores não-significativos, que pode ser considerada uma matriz de erros. No caso do PLS a matriz dos valores analíticos (por exemplo, concentrações) é decomposta da mesma forma:

PCR e PLS têm em comum os seguintes passos:

i) estimativa de uma matriz de autovalores V (a partir de Y em PCR e a partir de Y e X em PLS);

ii) cálculo da matriz de fatores T = ZV utilizando as variáveis padronizadas Z;

iii) cálculo das matrizes P e Q de acordo com:

Em PCR, os coeficientes da calibração (matriz B) são estimados coluna por coluna de acordo com:

A previsão é então realizada por:

A seleção das componentes principais significativas é feita com base na variância explicada por cada uma delas. Em geral, nos métodos analíticos, a principal fonte de variação dos dados é a concentração do analito. Entretanto, existem situações em que algumas propriedades das amostras, tais como umidade ou rugosidade da superfície, ou ainda efeitos ocasionados pelos procedimentos de medida tais como alterações na linha de base espectral ou espalhamento da radiação, podem exceder o efeito da concentração do analito. Portanto, testes adicionais são necessários para avaliar se há correlação entre os valores analíticos e as componentes principais tidas como não significativas pelo critério de variância explicada. Componentes principais altamente correlacionadas com a variável de interesse (por exemplo, concentração) devem ser incluídas no modelo, independentemente da sua variância explicada.

No PLS, ambas as matrizes Y (valores medidos) e X (valores analíticos) são decompostas, conforme as Equações 24 e 25: Y = TPT + EY e Y = TQT + EX e, portanto, relações entre os espectros e as concentrações são consideradas desde o princípio. A matriz B dos coeficientes da calibração é estimada por

Como as decomposições das matrizes Y e X são inter-relacionadas, a matriz B tem um ajuste melhor e mais robusto que na calibração usando PCR. A avaliação é feita pela Equação 23 de acordo com = Y. A aplicação do PLS a apenas uma variável é denominada PLS1. Quando duas ou mais variáveis são consideradas na forma de uma matriz, o procedimento é denominado PLS212.

DIAGNÓSTICO DE ERROS E VALIDAÇÃO

A confiabilidade da análise multianalito deve ser validada de acordo com os critérios usuais: seletividade, exatidão (veracidade e precisão), intervalos de confiança e previsão e calculados a partir destes, os valores críticos e limites de detecção. Em calibração multivariada, colinearidades entre as variáveis causadas por correlações entre as concentrações das amostras de calibração devem ser evitadas. Portanto, a composição das misturas de calibração não deve ser escolhida aleatoriamente, mas seguindo um planejamento experimental6.

Seletividade

Em geral, a seletividade de sistemas multianalitos9 pode ser expressa qualitativamente e estimada quantitativamente como postulado por Kaiser4 e empregando modelos avançados5. Em calibração multivariada, a seletividade pode ser quantificada de forma aproximada pelo número de condição (ver Equações 15-17). Infelizmente, como as concentrações dos analitos não são consideradas no número de condição, este serve apenas como uma orientação do erro analítico máximo esperado. A inclusão das concentrações dos padrões de calibração em modelos de seletividade permite estimar os limites de detecção multivariados10-12.

Precisão

As incertezas nas estimativas das concentrações dos analitos nas amostras do conjunto de calibração e de previsão são expressas pelo erro padrão de calibração SEC ("Standard Error of Calibration"), definido como:

e pelo erro padrão de previsão SEP ("Standard Error of Prediction"), definido como:

em que yi(observado, c) e yi(observado, t) são, respectivamente, os valores das concentrações verdadeiras dos analitos nas amostras de calibração e de previsão e yi(estimado) são os respectivos valores de y estimados pelo modelo.

Outra medida da precisão em calibração multivariada é a soma quadrática residual de previsão PRESS ("Predictive Residual Sum of Squares")13, definida como:

O valor da PRESS pode ser calculado usando os dados do conjunto de teste, como no caso do cálculo do SEP (ver Equação 32). Também é possível estimar a PRESS utilizando-se dados do conjunto de calibração e aplicando-se validação cruzada, através da chamada matriz chapéu H12,13:

A matriz H com dimensões n x n transforma o vetor dos valores medidos de y no vetor das estimativas, . Um elemento hij da matriz chapéu é calculado por

A partir dos elementos da matriz chapéu, algumas relações importantes podem ser calculadas, como o posto da matriz X obtida a partir da soma dos elementos significativos da diagonal principal da matriz chapéu:

(o posto da matriz chapéu é igual ao seu traço) e os resíduos podem ser obtidos como:

Os resíduos também podem ser calculados a partir das amostras de calibração de uma maneira diferente. A validação cruzada é um procedimento importante para determinar de forma realista uma métrica para o erro de previsão, como a PRESS. Os dados para k amostras são removidos da matriz de dados e então previstos pelo modelo. Os erros residuais de previsão por validação cruzada neste caso são calculados por

O valor da PRESS para a validação cruzada é calculado com base no erro de previsão obtido para todas as combinações de amostras de calibração tomadas k a k:

Intervalos de confiança para as estimativas das concentrações desconhecidas, xi, podem ser calculados. O cálculo depende do modelo de calibração multivariada em questão:

na qual sx é o desvio padrão de previsão estimado por:

ta,f é o valor tabelado da distribuição t de Student com f graus de liberdade no nível de confiança a. A variância sx2 depende do número de sensores ou comprimentos de onda, m, do número de analitos, n, do número de parâmetros p e do fator L, que é definido para a calibração multivariada clássica por:

para a calibração inversa, como:

e para validação cruzada quando os valores da influência são aplicados na calibração, por:

Veracidade

A ausência de erros sistemáticos pode ser testada tradicionalmente pelas funções de recuperação14 Assim, a concentração estimada pelo modelo, , é relacionada com a concentração real, c, pelo modelo de regressão:

no qual c podem ser os valores conhecidos de um conjunto de teste independente ou valores de referência estimados nas mesmas amostras empregando um método independente. Os coeficientes da regressão devem ser a = 0 e b = 1. Valores que excedam o intervalo de confiança ± Da indicam erros sistemáticos aditivos (constantes) e valores que excedem o intervalo de confiança 1 ± Db mostram a presença de erros sistemáticos proporcionais. Empregando estudos de recuperação, a exatidão pode ser testada e a precisão estimada.

LISTA DE SÍMBOLOS

n Número de analitos

m Número de valores dos sinais (absorbâncias) usados para calibração

p Número de misturas padrão (misturas usadas para calibração)

Qianalitos (elementos, íons, compostos), i = 1, ..., n

xi Quantidade (concentração) dos analitos Qi; i =1, ..., n

aijCoeficientes de calibração (coeficientes de regressão, coeficientes de sensibilidade), i = 1, ..., n, j = 1, ..., m

zj Posições dos sinais, por exemplo, comprimentos de onda nos quais são medidos os sinais de absorbância yj, j = 1, ..., m

yjSinais de absorbâncias nas posições zj, j = 1, ..., m

ej Incertezas (erros) associadas às medidas reais de y, j = 1, ..., m

NOTAÇÃO

Matrizes são representadas por letras maiúsculas, em itálico e em negrito, exceto para matrizes-coluna (vetores-coluna), que são representadas por letras minúsculas. Escalares são representados em itálico. Matrizes transpostas são indicadas pelo expoente "T"; a transposta de uma matriz-coluna é uma matriz-linha. Estimativas de matrizes, vetores (matrizes-linha ou matrizes-coluna), ou escalares são indicadas por "^"; por exemplo, é a estimativa do vetor x.

Recebido em 3/8/07; publicado na web em 26/2/08

  • 1. Eckschlager, K.; Dnazer, K.; Information Theory in Analytical Chemistry, John Wiley: New York, 1994.
  • 2. Danzer, K.; Currie, L. A.; Pure Appl. Chem. 1998, 70, 993
  • 3. Martens, M.; Naes, T.; Multivariate Calibration, Wiley: New York, 1989.
  • 4. Kaiser, H.; Fresenius' J. Anal. Chem 1972, 260, 252.
  • 5. Danzer, K.; Fresenius' J. Anal. Chem 2001, 369, 397.
  • 6. Deming, S. N.; Morgan, S. L.; Experimental Design: A Chemometrics Approach, 2nd ed., Elsevier: Amsterdam, 1993.
  • 7. Centner, V.; Massart, D. L.; De Jong, S.; Fresenius' J. Anal. Chem 1998, 361, 2.
  • 8. Otto, M.; Chemometrics, Statistics and Computer Application in Analytical Chemistry, Wiley-VCH: Weinheim, 1998.
  • 9. Vessman, J.; Stefan, R. L.; van Staden, J. F.; Danzer, K.; Lindner, W.; Thorburn Burns, D.; Fajgelj, A.; Müller, H.; Pure Appl. Chem 2001, 73, 1392.
  • 10. Bauer, G.; Wegscheider, W.; Ortner, H.M.; Fresenius' J. Anal. Chem 1991, 340, 135.
  • 11. Faber, K.; Kowalski, B. R.; J. Chemometrics 1997, 11, 181.
  • 12. Faber, K.; Kowalski, B. R.; Appl. Spectrosc. 1997, 51, 660.
  • 13. Frank, I. E.; Todeschini, R.; The Data Analysis Handbook, Elsevier: Amsterdam, 1994.
  • 14. Thorburn Burns, D.; Danzer, K.; Townshend, A.; Pure Appl. Chem 2002, 74, 2201.
  • #
    O presente artigo é uma tradução para o português (aprovada pelo Comitê Brasileiro para Assuntos de Química junto à IUPAC) do artigo "Guidelines for Calibration in Analytical Chemistry. Part 2. Multispecies Calibration" publicado em
    Pure Appl. Chem.
    2004,
    76, 1215, preparado por K. Danzer, M. Otto e L. A. Currie.
  • *
    e-mail:
  • Datas de Publicação

    • Publicação nesta coleção
      25 Set 2009
    • Data do Fascículo
      2008

    Histórico

    • Recebido
      03 Ago 2007
    Sociedade Brasileira de Química Secretaria Executiva, Av. Prof. Lineu Prestes, 748 - bloco 3 - Superior, 05508-000 São Paulo SP - Brazil, C.P. 26.037 - 05599-970, Tel.: +55 11 3032.2299, Fax: +55 11 3814.3602 - São Paulo - SP - Brazil
    E-mail: quimicanova@sbq.org.br