SciELO - Scientific Electronic Library Online

 
vol.27 issue6Interlaboratorial programs for improving the quality of analytical resultsMicrowave-assisted experiments for undergraduate courses author indexsubject indexarticles search
Home Pagealphabetic serial listing  

Services on Demand

Journal

Article

Indicators

Related links

Share


Química Nova

Print version ISSN 0100-4042On-line version ISSN 1678-7064

Quím. Nova vol.27 no.6 São Paulo Nov./Dec. 2004

http://dx.doi.org/10.1590/S0100-40422004000600027 

NOTA TÉCNICA

 

Validação de modelos de calibração multivariada: uma aplicação na determinação de pureza polimórfica de carbamazepina por espectroscopia no infravermelho próximo

 

Validation of models of multivariate calibration: an application in the determination of polymorphic purity of carbamazepine by near infrared spectroscopy

 

 

Jez Willian B. Braga; Ronei Jesus Poppi*

Departamento de Química Analítica, Instituto de Química, Universidade Estadual de Campinas, CP 6154, 13084-971 Campinas - SP

 

 


ABSTRACT

The application of analytical procedures based on multivariate calibration models has been limited in several areas due to requirements of validation and certification of the model. Procedures for validation are presented based on the determination of figures of merit, such as precision (mean, repeatability, intermediate), accuracy, sensitivity, analytical sensitivity, selectivity, signal-to-noise ratio and confidence intervals for PLS models. An example is discussed of a model for polymorphic purity control of carbamazepine by NIR diffuse reflectance spectroscopy. The results show that multivariate calibration models can be validated to fulfill the requirements imposed by industry and standardization agencies.

Keywords: validation; multivariate calibration; carbamazepine.


 

 

INTRODUÇÃO

A medida quantitativa de uma propriedade de interesse em um sistema químico é uma das práticas mais freqüentes em química analítica. Na grande maioria dos casos, essa propriedade trata da concentração de uma espécie presente no meio. Contudo, quando se utilizam técnicas instrumentais de análise, a concentração é uma propriedade determinada indiretamente por meio de relação com outra grandeza, como absorção ou emissão de luz, medidas de condutividade ou potencial elétrico, numa prática conhecida como calibração1.

O processo de calibração pode ser definido como uma série de operações que estabelecem, sob condições específicas, uma relação entre medidas instrumentais e os valores correspondentes à propriedade de interesse realizados em padrões2. Entre os métodos de calibração existentes, sem dúvida, os mais difundidos são os métodos univariados, onde se tem apenas uma medida instrumental para cada uma das amostras de calibração. Esses métodos são relativamente fáceis de serem aplicados, validados e se encontram descritos na literatura em vários trabalhos3-6. Porém, a aplicação de modelos univariados é restrita a situações em que a grandeza que é medida diretamente no sistema (ex.: absorbância de um composto) é livre de interferentes que possam provocar desvios entre sua relação linear com a propriedade de interesse.

Em métodos de Calibração Multivariada duas ou mais respostas instrumentais são relacionadas com a propriedade de interesse. Esses métodos possibilitam análises mesmo na presença de interferentes, desde que estejam presentes nas amostras de calibração, determinações simultâneas, análises sem resolução etc. Isso faz com que, modelos de Calibração Multivariada sejam uma alternativa quando métodos univariados não podem ser aplicados. Diversos modelos de calibração multivariada vêm sendo utilizados, tais como Regressão Linear Múltipla (MLR), Regressão por Componentes Principais (PCR) e Regressão por Mínimos Quadrados Parciais (PLS)7. Esses modelos têm apresentado ótimos resultados, com aplicações em diversas áreas. Contudo, sua aceitação e implementação têm sofrido restrições em alguns setores, como as áreas farmacêutica e médica, devido às exigências de validação. Essa validação é feita com base no cálculo e análise das chamadas figuras de mérito, que certificam que o modelo multivariado proposto é confiável e atende às especificações impostas pela indústria e órgãos de fiscalização nacionais e internacionais como "United States Pharmacopoeia" (USP), "International Conference on Harmonisation's" (ICH), "American Society for Testing and Materials" (ASTM), Instituto Nacional de Metrologia, Normalização e Qualidade Industrial (INMETRO), Agência Nacional de Vigilância Sanitária (ANVISA) etc.

 

OBJETIVO

Neste trabalho pretende-se apresentar procedimentos que podem ser utilizados para determinação de figuras de mérito em modelos de Calibração Multivariada, construídos pelo método de Mínimos Quadrados Parciais (PLS) e exemplificar sua utilização na validação de um modelo de calibração para a determinação de pureza polimórfica de Carbamazepina em misturas binárias dos polimorfos I e III, construído com base em dados de reflectância difusa na região do infravermelho próximo (NIR).

 

MODELO DE CALIBRAÇÃO MULTIVARIADA

Como na calibração univariada, a primeira etapa da construção do modelo de calibração multivariada trata da aquisição de respostas instrumentais para uma série de padrões (amostras de calibração), em que o valor da propriedade de interesse é conhecido. As respostas instrumentais para as amostras de calibração são arranjadas em uma matriz X(i x j) e os valores de referência da propriedade de interesse em um vetor y (i x 1), onde "i" é o número de amostras e "j" o número de variáveis. Utilizando o trabalho de Sijmen de Jong8 o modelo PLS pode ser construído, segundo o algoritmo SIMPLS, pela decomposição em componentes principais ("PCA - Principal Component Analysis") das matrizes X e y simultaneamente, levando a:

onde TA são os escores, PA e qA são os "loadings" e E e f, as matrizes de erro referentes à decomposição de X e y respectivamente, "A" é o número de variáveis latentes utilizado no modelo, o índice "T" sobrescrito indica a operação de transposição de uma matriz ou vetor e o símbolo "^" indica que as grandezas são estimativas.

Paralela à decomposição de X e y é calculada uma matriz de pesos R, de forma que quando multiplicada pela matriz de dados X apresenta como resultado os escores T.

A matriz de pesos R é determinada de forma a cumprir as seguintes condições:

  1. maximizar a covariância entre X e y, isto é: = max

  2. R e q são normalizados, isto é, para cada variável latente e

  3. os vetores escores são ortogonais entre si, assim: para as variáveis latentes 1 e 2, = 0.

Dessa forma, uma estimativa do vetor y poder ser obtida como descrito na Equação 2. Para um novo conjunto de amostras de previsão, podemos escrever:

onde ycal são as concentrações das amostras utilizadas na etapa de calibração. Dessa forma o vetor de coeficientes de regressão pode ser estimado por:

e o modelo de regressão representado por:

onde é o vetor de concentrações estimado através do modelo PLS e Î são os erros de previsão.

 

SINAL ANALÍTICO LÍQUIDO

A validação de modelos de calibração multivariada pode ser feita com base no cálculo de parâmetros que assegurem que o modelo apresenta performance adequada e dentro dos objetivos desejados. Em calibração multivariada o conceito de Sinal Analítico Líquido, do inglês "Net Analyte Signal" (NAS), exerce uma importante função na determinação de figuras de mérito.

Lorber9 propôs um método para o cálculo do NAS para modelos multivariados de calibração inversa, definindo NAS para uma propriedade de interesse k, como sendo a parte do sinal instrumental que é ortogonal às contribuições de outros possíveis constituintes presentes na amostra. A Figura 1 mostra a representação geométrica da propriedade de ortogonalidade do NAS10. Ferré et al.11 fizeram correções ao modelo proposto por Lorber, de forma a possibilitar o cálculo exato do NAS para modelos de calibração construídos a partir de PCR e PLS. No cálculo do NAS, primeiramente a matriz X é reconstruída com A variáveis latentes gerando a matriz (segundo a Equação 1), em seguida é determinada a matriz 1 que é a matriz que contém a informação de todas espécies presentes na amostra exceto da espécie de interesse k, como12:

 

 

onde é o vetor de concentrações da espécie de interesse k estimado com A variáveis latentes segundo a equação 2, ou por = , e o índice "+" sobrescrito indica a pseudoinversa do vetor ou da matriz em questão. Isso faz com que a matriz fique livre de qualquer contribuição da espécie k. O vetor NAS é então obtido como:

onde é o vetor de respostas instrumentais de uma amostra estimado com A variáveis latentes, calculado por = .

Uma vez que ,knas é livre de interferentes, é possível substituí-lo por uma representação escalar sem perda de informação. Assim temos:

onde || || representa a norma Euclidiana do vetor .

Com a possibilidade de calcular um valor escalar livre de interferentes, a partir de um vetor contendo contribuições de constituintes desconhecidos, torna-se possível a construção de uma nova forma de calibração multivariada, em que o modelo pode ser representado em uma forma univariada. Primeiro o cálculo do NAS é feito para as i amostras de calibração, em seguida o coeficiente de regressão é determinado por mínimos quadrados entre o vetor nâs e o vetor de concentrações y:

E o modelo de regressão pode, então, ser representado por:

onde os resultados obtidos por meio das Equações 6 e 11 são equivalentes.

Se os dados foram centrados na média, antes da determinação do coeficiente de regressão o vetor nas precisa ser corrigido de forma a evitar um erro de sinal que é introduzido pelo uso da norma Euclidiana. Esta correção pode ser feita pela multiplicação de cada elemento do vetor nas pelo seu sinal correspondente no vetor (y – ), onde é a média do vetor y, que contém os valores de referência13.

 

FIGURAS DE MÉRITO

No presente trabalho as definições para as figuras de mérito apresentadas seguem as recomendações presentes nos protocolos emitidos pela "International Union of Pure and Applied Chemistry" (IUPAC)14, "International Conference on Harmonisation (ICH)"15,16 e "American Society for Testing and Materials (ASTM)", norma E1655–0017.

Exatidão

Expressa o grau de concordância entre o valor estimado ou medido e o valor tido como verdadeiro ou de referência16. Comumente em aplicações com Calibração Multivariada a exatidão é estimada através da raiz quadrada do erro médio quadrático de previsão (RMSEP – "Root Mean Squares Error of Prediction"):

onde n é o número de amostras de validação.

Segundo o protocolo emitido pela ICH15, a exatidão deve ser determinada usando um mínimo de 9 determinações em no mínimo três níveis de concentração que cubram a faixa de aplicabilidade do modelo. No presente trabalho ela foi determinada com base nas 39 amostras utilizadas como conjunto de validação.

Precisão

Expressa o grau de concordância entre os resultados uma série de medidas feitas para uma mesma amostra homogênea em condições determinadas. Em geral é considerada em diversos níveis, tais como repetibilidade, precisão intermediária (interdias, interanalista, etc.), reprodutibilidade16 e precisão média17.

  • Repetibilidade: é a precisão do método em um curto intervalo de tempo. Pode ser determinada a partir de nove determinações (três concentrações e três replicatas) cobrindo a faixa útil do modelo de calibração, ou um mínimo de seis determinações de uma amostra.

  • Precisão intermediária: a extensão em que a precisão intermediária deve ser determinada depende das circunstâncias em que o método será aplicado. Ela é o desvio devido à variação de uma determinada condição experimental. Variações típicas estudadas incluem dias, analistas, equipamento, etc.

  • Reprodutibilidade: é acessada por meio de ensaios interlaboratoriais. É requerida apenas em casos de padronização de procedimentos analíticos como, por exemplo, inclusão de procedimentos em farmacopéias.

No presente trabalho foram determinadas a repetibilidade, a precisão média e interdias, calculada como18:

onde m é o número de replicatas feitas, n o número de amostras, é a média dos valores previstos de cada replicata

Ajuste do modelo

O grau de ajuste do modelo pode ser estimado a partir da correlação entre os valores de referência e os valores estimados da propriedade de interesse pelo modelo para as amostras de calibração. Isso é feito determinando-se, por mínimos quadrados, a reta que melhor se ajusta aos valores de referência e os estimados pelo modelo18,19. Uma vez que o escalar "nas" é determinado, o ajuste do modelo também pode ser determinado através da melhor reta que se ajusta ao gráfico do "nas" contra a concentração, para as amostras de calibração.

Linearidade

Em modelos de calibração multivariada uma medida quantitativa da linearidade não corresponde a uma tarefa simples, ou mesmo possível. Qualitativamente, gráficos de resíduos e dos escores contra a concentração, os quais devem ter comportamento aleatório e linear, respectivamente, podem indicar se os dados seguem ou não o comportamento linear.

Sensibilidade

É definida como fração de sinal responsável pelo acréscimo de uma unidade de concentração da propriedade de interesse. Para modelos de calibração multivariada, como PLS, pode ser determinada como9,11

ou, quando o NAS é determinado, o vetor de sensibilidade líquida para cada amostra i presente no conjunto de calibração pode ser determinado a partir do vetor como:

onde o vetor de sensibilidades deve ser igual para todas as amostras de calibração. O escalar SÊN pode ser determinado por:

Sensibilidade analítica

É definida como a razão entre a sensibilidade e uma estimativa do desvio padrão para a flutuação do sinal analítico (dx)20:

onde o inverso desse parâmetro (g-1) permite estabelecer a menor diferença de concentração entre amostras, a qual pode ser distinguida pelo método e dx é estimado por meio do desvio padrão do valor de NAS obtido para 15 espectros do sinal do branco (espectro de uma superfície metálica utilizada como referência).

Intervalo de confiança

O intervalo de confiança para o valor estimado de y para uma amostra i pode ser definido como o intervalo no qual se pode afirmar, com certo grau de confiança, ou probabilidade, que inclui o valor verdadeiro da propriedade de interesse3. É importante que os limites de confiança estimados sejam consistentes e cubram o intervalo esperado para aquele nível de probabilidade, isto é, para o nível de 95% de confiança, 95 em 100 amostras devem ter o valor verdadeiro da propriedade dentro do intervalo de confiança calculado. Sua utilidade não se restringe apenas à determinação da incerteza do valor estimado para a propriedade de interesse. Se existir um modelo de calibração que apresenta erros de previsão que possam ser bem representados por um modelo de distribuição de probabilidade, como por exemplo normal ou t-student, esses intervalos podem ser utilizados como um método na identificação de amostras anômalas.

O cálculo desses intervalos depende de uma estimativa razoável da variância dos erros de previsão (V(EP)) para amostras desconhecidas. De acordo com a norma E1655-00 da ASTM17, a variância dos erros de previsão para amostras desconhecidas, em modelos de calibração multivariada, pode ser calculada por:

onde ncal é o número de amostras de calibração, hi o "leverage" de uma amostra desconhecida, definido como:

onde e são os escores do conjunto de calibração e de uma amostras desconhecida, respectivamente, e MSEC é a média quadrática dos erros de calibração, definida como:

onde n é o número de graus de liberdade.

Essa aproximação de V(EP) leva em consideração que as variâncias das respostas instrumentais no conjunto de calibração e para amostras de previsão são iguais e que a variância dos erros devido ao método de referência é insignificante. Estudos feitos por Faber et al.21 mostram que a primeira suposição é consistente com a maior parte das aplicações práticas, contudo em ocasiões em que a variância do método de referência for significativa, esta deve ser adicionada à Equação 18.

Outra dificuldade no cálculo dos intervalos de confiança é estabelecer o número efetivo de graus de liberdade (n) envolvidos no cálculo do MSEC. Nesse sentido, Voet22 definiu o conceito de pseudograus de liberdade (PDF), que leva em consideração a diferença entre o erro médio quadrático de calibração estimado por validação cruzada (MSECV) e pela previsão das próprias amostras de calibração (MSEC), de modo que quanto maior é essa diferença, n é menor:

Após o cálculo da variância, com o número apropriado de graus de liberdade, os limites de confiança f podem ser obtidos por:

onde t1-a/2,n é o parâmetro estatístico da distribuição t-student com probabilidade (1-a)/2 de recobrimento.

Enfim, admite-se que os erros correspondentes às concentrações estimadas não são correlacionados, têm variância constante na faixa estudada e seguem uma distribuição normal.

Seletividade

É a medida do grau de sobreposição entre o sinal da espécie de interesse e os interferentes presentes na amostra e indica a parte do sinal que é perdida por essa sobreposição. Para modelos de calibração multivariada esse parâmetro é definido como9,11:

onde nâsi é o escalar NAS estimado para amostra 'i' e xi o vetor de dados original. O valor de seletividade estimado a partir da expressão 21 informa quanto do sinal original não é retirado por não ser ortogonal à propriedade de interesse. Dessa forma, a seletividade calculada a partir da Equação 23 não se refere ao sentido geralmente empregado para o termo em química analítica, com modelos univariados, e sim a uma forma de estimar quanto do sinal é perdido por ortogonalidade.

Razão sinal ruído

Indica quanto da intensidade do NAS da espécie de interesse está acima da estimativa do desvio padrão para a flutuação do sinal analítico (dx). É definido através do NAS como9,11:

Teste para erro sistemático ("bias")

Segundo a IUPAC, "bias" é definido como a diferença entre a média populacional e o seu valor verdadeiro. Erros sistemáticos são todas as componentes de erros que não são randômicas, logo, eles correspondem à parcela fixa do "bias" em uma medida química14. A existência desse tipo de erro afeta a precisão, a exatidão e a determinação dos intervalos de confiança. A norma E1655-00 da ASTM17 sugere um teste-t para avaliar se o "bias" incluso no modelo é significante. O "bias" médio pode ser calculado como:

Em seguida, o desvio padrão dos erros de validação (SDV, "standard deviation of validation") é estimado por:

O valor de t é então obtido:

Caso o valor de t calculado seja menor que o seu valor crítico para n graus de liberdade com 95% de confiança, o "bias" incluído no modelo pode ser considerado insignificante e desprezado.

 

PROCEDIMENTO EXPERIMENTAL

O polimorfo III, que é utilizado na formulação de medicamentos para tratamento de epilepsia, foi fornecido pela Indústria Cristália Produtos Químicos Farmacêuticos Ltda. O laudo de análises fornecido pela empresa indicou que a amostra enviada estava compatível com o padrão USP de concentração 100%. O polimorfo I foi obtido a partir da forma I por aquecimento à temperatura de 160 ºC por 3 h e 30 min. Os polimorfos I e III, em suas formas puras, foram caracterizados por meio de análises em Infravermelho em pastilha de KBr e Calorimetria de Varredura Diferencial (DSC)23,24.

As amostras foram preparadas por meio de misturas das formas I e III na faixa de 80 a 100%(m/m). As pesagens foram realizadas em uma balança analítica com precisão de 0,00001 g e misturadas em recipientes de 5 mL com ajuda de três esferas metálicas.

Os espectros de reflectância difusa na região do infravermelho próximo (NIR) foram registrados em um espectrofotômetro Bomen Hartman & Braun DA-8 Transformada de Fourier, equipado com lâmpada de quartzo halogênio (2000-25000 cm-1), divisor de feixe quartzo (4000-25000 cm-1), detector de InGaAs IPH 6300L resfriado com nitrogênio líquido e resolução de 4 cm-1. Foi utilizado o acessório de reflectância difusa Jasco modelo DR81. Cada espectro foi obtido como uma média de 128 varreduras e foram obtidos 4 espectros de cada amostra. O elevado número de replicatas foi adotado por problemas com a homogeneidade da amostra, visto que os polimorfos não se misturavam com facilidade. Foram feitas replicatas apenas das medidas instrumentais, portanto os erros com origem na pesagem dos polimorfos não foram levados em consideração nos cálculos de incerteza.

 

MODELO DE CALIBRAÇÃO

Para a construção do modelo de calibração foram preparadas 41 amostras com concentração entre 80 a 100% e 40 amostras para validação, distribuídas na mesma faixa de concentração.

Os espectros obtidos no infravermelho próximo apresentaram um acentuado desvio de linha base entre as replicatas, que pode ser visualizado na Figura 2. As principais causas desse desvio de linha de base são espalhamentos aditivos, que provocam o deslocamento do espectro na vertical e espalhamentos multiplicativos, que provocam uma inclinação da linha base do espectro. Além dos efeitos de espalhamento, observaram-se duas regiões com alto nível de ruído, entre 1350-1420 nm e 1800-1950 nm, que são devidas principalmente ao 1º sobretom e à banda de combinação da água. Como forma de correção foi adotada, como pré-processamento, a 1ª derivada das absorbâncias, seleção da melhor faixa espectral e dados centrados na média. Foram selecionadas duas faixas espectrais: 1440-1800 nm e 1925-2185 nm, que são devidas principalmente aos 1º e 3º sobretons de ligações N-H em amidas, 1º sobretom de ligações C-H em aromáticos (na primeira região) e 2º sobretom de ligações N-H em amidas, 3º sobretom de ligações C-C em aromáticos, 1º sobretom de ligações C=O em amidas e bandas de combinação de ligações C-H em aromáticos (segunda região).

 

 

Para a construção do modelo de calibração foi utilizado o espectro médio das quadruplicatas e a dimensionalidade do modelo foi determinada através do procedimento de validação cruzada "deixe uma fora" ("leave one out"). Para validação foram previstas individualmente cada replicata e a concentração da amostra obtida como a média dos resultados de cada replicata.

 

RESULTADOS E DISCUSSÃO

A Carbamazepina (CBZ) é um conhecido princípio ativo de medicamentos antiepiléticos, que apresenta quatro formas polimófícas, três anidras (formas I, II e III) e uma di-hidratada (IV)23. A Figura 3 mostra a fórmula estrutural da CBZ. Suas principais formas são I e III, sendo a forma I meta estável à temperatura ambiente com estrutura trigonal e a forma III estável com estrutura monoclínica24. O medicamento produzido à base de CBZ é feito com a forma III que é absorvida pelo organismo mais rapidamente, devido à sua solubilidade, sendo que a forma I é tida como impureza na matéria-prima que é adquirida pela indústria. O modelo de calibração PLS foi construído para a determinação quantitativa da forma III da CBZ em misturas binárias das formas I e III, entre a faixa de concentração de 80 a 100% (m/m), do polimorfo III em relação ao I.

 

 

Os termogramas e espectros de infravermelho referentes às formas I e III utilizados na etapa de caracterização são mostrados na Figura 4. Através da Figura 4a pode-se notar que o termograma da forma III apresenta dois sinais endotérmicos de fusão, o primeiro em aproximadamente 175 ºC correspondente à fusão da forma III, seguidos por um sinal exotérmico indicando a cristalização do polimorfo I em 180 ºC e sua subseqüente fusão em aproximadamente 192 ºC. O termograma da forma I apresenta apenas um pico endotérmico que corresponde à sua fusão. Os espectros de infravermelho em pastilha de KBr, na região do infravermelho médio apresentaram picos característicos da forma I em 955 cm-1 e em 1273 cm-1 (indicados). Foi feita a medida da intensidade desses sinais em relação a picos constantes para as duas formas23,o que apresentou como resultado que ambas as formas estavam em seu estado puro. Essa consideração foi admitida no cálculo dos valores de referência das concentrações das amostras preparadas.

 

 

Para construção do modelo, foram usadas 38 amostras na etapa de calibração e 39 para validação. As demais amostras foram apontadas como anômalas, segundo os testes descritos na norma E1655 da ASTM17.

O modelo PLS construído utilizou três variáveis latentes, que correspondem a mais de 95% da variância dos dados originais (espectrais e concentrações de referência). O maior erro percentual observado para as amostras de validação foi de 1,7%, com média igual a 0,6% (m/m) com valores absolutos seguindo aproximadamente uma distribuição normal.

O resultado do cálculo das figuras de mérito é apresentado na Tabela 1. O modelo linear parece se ajustar bem aos dados. As Figuras 5 e 6 mostram os gráficos dos valores de referência contra os valores estimados, e gráfico do escalar NAS contra a concentração, respectivamente, que demonstram o bom ajuste do modelo linear e a apresentação do modelo PLS na sua forma pseudounivariada.

 

 

 

 

 

 

A Figura 7 mostra o gráfico dos escores da primeira variável latente contra a concentração e a Figura 8, o gráfico de resíduos. Claramente observa-se um comportamento linear na Figura 7 e erros com comportamento aleatório na Figura 8. No gráfico de escores, os pontos que apresentam maior desvio do comportamento linear não devem ser encarados como indício de falta de linearidade dos dados, uma vez que o modelo PLS utiliza três variáveis latentes e não apenas uma, desprezando quatro pontos que apresentam maior desvio, o coeficiente de correlação dos escores contra os valores de referência calculado é 0,953.

 

 

 

 

Os indicadores de exatidão, mostrados na Tabela 1, apresentam um nível aceitável de dispersão e uma boa concordância entre si, implicando que o valor de MSEC é uma boa estimativa do desvio padrão dos erros de previsão observados no conjunto de validação. Segundo o teste-t para ocorrência de "bias", suas possíveis influências no modelo e nos parâmetros estimados podem ser desprezadas, uma vez que o valor de t calculado é menor que o valor de tcrítico tabelado da distribuição de t-student.

O modelo apresentou um baixo valor numérico de sensibilidade, que em parte é decorrência do pré-processamento utilizado. O valor para o inverso da sensibilidade analítica, apresentado na Tabela 1, pode ser interpretado de forma mais clara, por sua relação direta com a concentração. Segundo esse valor, o modelo é capaz de distinguir entre amostras com diferença de concentração da ordem de 0,2% (m/m).

Os valores de precisão apresentam um nível de dispersão aceitável. Os resultados para precisão intermediária e repetibilidade foram obtidos pelo desvio padrão das médias de 6 medidas de uma amostra de concentração 95%, feitas em 6 dias consecutivos e 6 vezes no mesmo dia, respectivamente. Para precisão média foi calculado o desvio padrão médio de três amostras de concentrações 83, 90, 97%, que foram medidos seis vezes em três dias consecutivos. Os resultados apresentados na Tabela 1 mostram que o valor obtido para precisão intermediária é maior que o obtido para repetibilidade, apresentando uma ordem inversa da que é esperada teoricamente. Essa diferença pode ser atribuída a possíveis variações instrumentais que ocorreram ao longo do dia em que foram realizadas as medidas de repetibilidade. Contudo, se um teste F for realizado, a partir dos quadrados dos respectivos valores de precisão intermediária e repetibilidade, observa-se que o valor de F calculado é de 3,24, enquanto que o valor de F95% tabelado (com 5 e 5 graus de liberdade) é de 5,05. Uma vez que o valor calculado não excede o valor crítico, pode-se concluir que não há diferença estatisticamente significativa entre as duas estimativas de precisão.

Os valores de seletividade que são mostrados na Tabela 1 representam a fração média do sinal do espectro da amostra que não é retirado, por não ser ortogonal em relação à propriedade de interesse. Logo, esses valores não se referem à seletividade no seu significado físico, que é em geral empregado em Química Analítica. Eles indicam que cerca de metade do sinal é retirado na etapa de aniquilação de posto realizado durante o cálculo do NAS.

Os valores para razão sinal ruído apresentados mostram o quanto o escalar NAS está acima do desvio padrão da flutuação do sinal instrumental. Segundo os resultados, a menor razão observada foi 3, que representa um limite mínimo aceitável para determinações quantitativas.

Os resultados para as percentagens de recobrimento dos intervalos de confiança, que representam a percentagem de amostras que possuem o valor verdadeiro dentro dos limites de confiança estimados os níveis de probabilidade 99,0, 95,0, e 90,0%, foram 100,0; 92,3 e 87,2%, respectivamente. Pode-se perceber que as variâncias estimadas através da equação presente na ASTM E165517 conseguem fornecer intervalos de recobrimento próximos aos esperados teoricamente. O histograma de resíduos estudentizados, apresentado na Figura 9, aproxima-se bem de uma distribuição t-student com desvio padrão igual a 1,13, sendo que os limites médios estimados ficam em torno de 1,7; 1,2 e 1,0 para os níveis de 99,0 95,0 e 90,0% de confiança, respectivamente. No gráfico de barras de erro para o nível de 95% de confiança, mostrado na Figura 10, pode-se visualizar as 3 amostras, que correspondem a 7,7% do conjunto de validação, que têm seu valor de referência fora do intervalo de confiança estimado. O maior erro observado para os intervalos de recobrimento foi de 2,7%, que corresponde ao erro no nível de 95% de confiança, que é um erro totalmente aceitável considerando o número reduzido de amostras de validação utilizadas nesse estudo.

 

 

 

 

CONCLUSÕES

O presente trabalho teve por objetivo apresentar procedimentos que possam ser utilizados na validação de modelos de calibração multivariada, tentando exemplificar, a partir da discussão de um modelo PLS, seu cálculo e aplicação. Os resultados das figuras de mérito determinadas para o modelo PLS discutido demonstram que modelos de calibração multivariada podem ser validados, de forma a atender às exigências impostas por órgãos de fiscalização e padronização. O resultados dos parâmetros estimados foram consistentes e de boa concordância com os resultados do modelo e valores teoricamente esperados. O mesmo pode ser utilizado para a validação de modelos PCR, salvo que o número de graus de liberdade utilizados no cálculo do MSEC não é determinado pela Equação 21. Para o PCR o número de graus de liberdade é estimado de forma usual, como o número de amostras menos o número de componentes principais utilizadas no modelo.

 

AGRADECIMENTOS

Os autores agradecem à Cristália Produtos Químicos Farmacêuticos Ltda., na pessoa do pesquisador Dr. J. A. Martins, que forneceu o polimorfo III da Carbamazepina.

 

REFERÊNCIAS

1. Barros Neto, B.; Pimentel, M. F.; Araújo, M. C. U.; Quim. Nova 2002, 25, 856.        [ Links ]

2. http://www.analytik-news.de/Presse/2002/178.html, acessada em Agosto 2003.        [ Links ]

3. Charne, R.; Freire, C. A. De Luna; Charnet, E. M. R.; Bovino, H.; Análise de Modelos de Regressão Linear: com aplicações, Ed. da UNICAMP: Campinas, 1999.        [ Links ]

4. Miller, J. N.; Miller, J. C.; Statistics and Chemometrics for Analytical Chemistry, 4ª ed., Prentice Hall: United Kingdom, 2000.        [ Links ]

5. Chui, Q. S. H.; Zucchini, R. R.; Lichtig, J.; Quim. Nova 2001, 24, 374.        [ Links ]

6. Barros Neto, B.; Scarminio, I. S.; Bruns, R. E.; Como Fazer Experimentos: Pesquisa e desenvolvimento na ciência e na industria, 2ª ed., Ed. da UNICAMP: Campinas, 2001.        [ Links ]

7. Brereton, R. G.; Analyst 2000, 125, 2125.        [ Links ]

8. Jong, S.; Chemom. Intell. Lab. Syst. 1993, 18, 251.        [ Links ]

9. Lorber, A.; Faber, K.; Kowalski, B. R.; Anal. Chem. 1997, 69, 1620.        [ Links ]

10. Faber, N. M.; Anal. Chem. 1998, 70, 5108.        [ Links ]

11. Ferré, J.; Brown, S. D.; Rius, F. X.; J. Chemom. 2000, 15, 537.        [ Links ]

12. Goicoechea, H. C.; Olivier; A. C.; Chemom. Intell. Lab. Syst. 2001, 56, 73.        [ Links ]

13. Faber, N. M.; J. Chemom. 1998, 12, 405.        [ Links ]

14. Curie, L. A.; Anal. Chim. Acta. 1999, 391, 105.        [ Links ]

15. International Conference on Harmonization, ICH Harmonised Tripartite Guideline – Validation of Analytical Procedures: Metodology, Fed. Regist. 1997, 62, 27463.        [ Links ]

16. International Conference on Harmonization, ICH Harmonised Tripartite Guideline – Text on Validation of Analytical Procedures, Fed. Regist.1995, 60, 11260.        [ Links ]

17. ASTM E 1655-00; Standards Practices for Infrared Multivariate Quantitative Analysis.        [ Links ]

18. Moffat, A. C.; Trafford, A. D.; Jee, R. D.; Graham, P.; Analyst 2000, 125, 1341.        [ Links ]

19. Laasonen, M.; Pulkkinen, T. H.; Simard, C.; Rasanen, M.; Vuorela, H.; Anal. Chem. 2003, 75, 754.        [ Links ]

20. De la Pena, A. M.; Mansilla, A. E.; Valenzuela, M. I. A.; Goicoechea, H. C.; Olivieri, A. C.; Anal. Chim. Acta 2002, 463, 75.        [ Links ]

21. Fernandez, J. A.; Jin, L.; Wahl, F.; Faber, N. M.; Massart, D. L.; Chemom. Intell. Lab. Sys. 2003, 65, 281.        [ Links ]

22. Voet, H. V. D.; J. Chemom. 1999, 13, 195.        [ Links ]

23. Borka, L.; Lönmo, A.; Winsnes, R.; Pharm. Acta Helv. 1992, 8, 231.        [ Links ]

24. Rustichelli, C.; Gamberini, G.; Ferioli, V.; Gamberini, M. C.; Ficarra, R.; Tommasini, S.; J. Pharm. Biomed. Anal. 2000, 23, 41.        [ Links ]

 

 

Recebido em 17/11/03; aceito em 29/3/04; publicado na web em 27/8/04

 

 

* e-mail: ronei@iqm.unicamp.br

Creative Commons License All the contents of this journal, except where otherwise noted, is licensed under a Creative Commons Attribution License