PLANEJAMENTO DE MISTURAS E VISUALIZAÇÃO DA REGIÃO ÓTIMA COM PLANILHAS NO EXCEL: UM TUTORIAL Esse trabalho é dedicado à memória do Prof. Dr. Ronei Jesus Poppi

Felipe Ferri Hilário Jeyne Pricylla Castro Tomas Edson Barros Edenir Rodrigues Pereira-Filho Sobre os autores

Resumo

MIXTURE DESIGN AND OPTIMUM REGION VISUALIZATION WITH SPREADSHEETS AT EXCEL: A TUTORIAL. This tutorial shows how to perform the data treatment for mixture design with two and multiple responses. Two data sets from the literature were used to exemplify the calculations. A template in Excel was proposed to prepare contour plot and response surface to visualize the optimum region of the mixture, which usually is made with commercial computational programs. The desirability function was used in example 2 (optimization of 5 responses simultaneously), and a code also available for download was proposed. Besides, 21 videos were prepared to show all the details for the readers and, it is available on YouTube. With this tutorial, it is possible to learn in a practical fashion how to handle the data from mixture design and, the authors hope to contribute with the researchers in this area.

Keywords:
Octave; mixture design; analysis of variance; regression model; template mixtures; partial derivatives


INTRODUÇÃO

O planejamento de misturas é bastante empregado em otimizações nas quais é fixa a relação entre as variáveis.11 Leardi, R.; Anal. Chim. Acta 2009, 652, 161. Um exemplo típico é a otimização da composição da fase móvel em um método de separação cromatográfico.22 Sahu, P. K.; Ramisetti, N. R.; Cecchi, T.; Swain, S.; Patro, C. S.; Panda, J.; J. Pharm. Biomed. Anal. 2018, 147, 590 Nesse tipo de planejamento, os níveis das variáveis não podem ser alterados de forma independente e sempre é mantida uma relação entre as mesmas. A literatura científica apresenta diversos textos excelentes sobre este tipo de planejamento.33 Coscione, A. R.; De Andrade, J. C.; May, G. M.; Quim. Nova 2005, 28, 1116.

4 Novaes, C. G.; Yamaki, R. T.; de Paula, V. F.; do Nascimento Júnior, B. B.; Barreto, J. A.; Valasques, G. S.; Bezerra, M. A.; Rev. Virtual Quim. 2017, 9, 1184.

5 Novaes, C. G.; Yamaki, R. T.; de Paula, V. F.; do Nascimento Júnior, B. B.; Barreto, J. A.; Valasques, G. S.; Bezerra, M. A.; Rev. Virtual Quim. 2018, 10.

6 Bezerra, M. A.; Ferreira, S. L. C.; Novaes, C. G.; dos Santos, A. M. P.; Valasques, G. S.; Cerqueira, U. M. F.; Alves, J. P. S.; Talanta 2019, 194, 941.
-77 Candioti, L. V.; Zan, M. M.; Cámara, M. S.; Goicoechea, H. C.; Talanta, 2014, 124, 123. Entretanto, a visualização da superfície de resposta e gráfico de contorno está restrita a alguns programas computacionais pagos e específicos.

Dessa forma, o objetivo deste tutorial é mostrar a aplicação de uma planilha no Microsoft Excel para a visualização do gráfico de contorno e superfície de resposta. Além disso, é empregado o Solver (Microsoft Excel) para o cálculo da melhor condição de trabalho. Os cálculos para obtenção do modelo de regressão podem ser efetuados em programa livre (Octave) e todos os procedimentos para execução dos cálculos já foram descritos no tutorial anterior publicado na Química Nova.88 Pereira, F. M. V.; Pereira-Filho, E. R.; Quim. Nova 2018, 41, 1061. Um dos objetivos deste tutorial é também apresentar uma análise criteriosa e com rigor matemático sobre a identificação da região ótima de um dado modelo.

Portanto, com este tutorial é possível apresentar ao público interessado uma alternativa viável e de fácil acesso para a utilização de planejamento fatorial no contexto do planejamento de misturas. Além da descrição dos conjuntos de dados e cálculos efetuados, foram preparados vídeos explicativos que estão disponíveis no Canal do prof. Edenir Pereira Filho no YouTube (https://www.youtube.com/c/EdenirPereiraFilho , ver Playlist 15).

PARTE EXPERIMENTAL

Descrição dos conjuntos de dados empregados

Para exemplificar as ferramentas deste tutorial, foram selecionados dois conjuntos de dados a partir de trabalhos publicados no periódico Journal of the Brazilian Chemical Society (JBCS). A utilização desses estudos, bem como o conjunto de dados neles publicados, foi gentilmente cedida pela Editora da Sociedade Brasileira de Química (PubliSBQ). Tais artigos foram selecionados por utilizarem planejamento de misturas objetivando a resolução de diferentes problemas analíticos.

Exemplo 1

No primeiro exemplo foi utilizado o trabalho publicado por Damasceno et al.,99 Damasceno, A. I. C.; Reis, C.; Reis, E. L.; Bellato, C. R.; Oliveira, A. F.; J. Braz. Chem. Soc. 2016, 27, 877. no qual os autores utilizaram um planejamento de misturas do tipo simplex centroide para visualizar a relação do chumbo presente em descarte de material eletrônico (placas de circuito impresso) com diferentes tipos de solos. Nesse caso, cada pseudocomponente foi avaliado em 6 níveis. A Tabela 1 mostra em detalhes o planejamento experimental utilizado pelos autores com três variáveis, OM (v1 - matéria orgânica), IO (v2 - óxido de ferro) e KA (v3 - caulinita), além de duas respostas que serão estudadas neste tutorial, F2 (concentração de Pb extraído na fração orgânica) e F3 (concentração de Pb extraído na fração residual). No experimento 1, por exemplo, da Tabela 1 temos uma mistura composta por 80 g (codificado em 1) de matéria orgânica (OM) e 10 g de cada um dos demais componentes: óxido de ferro (IO, codificado em 0) e caulinita (KA, codificado em 0).

Exemplo 2

Para o exemplo 2, foi utilizado o trabalho publicado por Estevão et al.1010 Estevão, P. L. S.; Peralta-Zamora, P.; Nagata, N.; J. Braz. Chem. Soc. 2018, 29, 2104. e o objetivo foi abordar um estudo com múltiplas respostas. Nesse caso, os autores otimizaram um procedimento de extração utilizando a técnica de microextração líquido-líquido dispersivo em solvente binário para a determinação de pesticidas em amostras de água natural. Na parte experimental foram realizados dois planejamentos de misturas com três componentes. O primeiro planejamento abordou uma faixa muito ampla da composição da mistura dos componentes extratores, sendo necessário um segundo com uma faixa mais restrita. Nesse tutorial abordamos apenas o segundo planejamento.

Tabela 1
Planejamento de misturas simplex centroid usado para verificar a influência das variáveis v1 a v3 nas respostas F2 e F3 (Exemplo 1)

A mistura foi realizada com dois extratores (diclorometano, DCM e clorofórmio, CLF) e um solvente dispersor (acetonitrila, ACN). O objetivo foi obter a melhor relação entre os três componentes que proporcionasse recuperações adequadas (da ordem de 100%) dos seguintes pesticidas nas amostras de água natural: Diuron (DIU), teflubenzuron (TFB), atrazine (ATZ), desisopropylatrazine (DIA) e desethylatrazine (DEA). Como se trata de múltiplas respostas (nesse caso, 5), foi abordada neste trabalho a utilização do cálculo da desejabilidade,1111 Costa, N. R.; Lourenço, J.; Pereira, Z. L.; Chemometr. Intell Lab. Syst. 2011, 107, 234. diferente da abordagem original dos autores. A função de desejabilidade foi proposta por Derringer e Suich em 19801212 Derringer, G.; Suich, R.; J. Qual. Technol. 1980, 12, 214. e tem como objetivo encontrar uma condição de compromisso onde todas as respostas estejam dentro de uma região aceita como desejável. Dessa forma, as respostas originais são codificadas entre 0 (condição indesejável) e 1 (condição desejável). Para esse cálculo, foi criada uma rotina computacional chamada “mydes2” (ver detalhes no Material Suplementar).

Rotinas computacionais utilizadas

Uma rotina computacional chamada “mydes2” foi preparada para a realização do cálculo de desejabilidade no programa livre Octave, independentemente do alvo de cada resposta (maximizar ou minimizar). Como input é necessário fornecer dois vetores/ matrizes: um deles é o conjunto de dados (respostas) que devem ser codificadas (matriz X) e o outro contém as condições (matriz Cond) para a realização do cálculo. Para Cond, é necessário fornecer o valor mínimo da resposta (posicionada na primeira linha), o valor máximo (segunda linha), o alvo (terceira linha) e o peso (quarta linha). O alvo é o objetivo de cada resposta. No caso do exemplo 2, a resposta monitorada foi a recuperação dos analitos, sendo assim o alvo foi igual a 100%. E o peso é quanto uma resposta influenciará no modelo final. Assim, pode-se colocar diferentes pesos para as respostas. Respostas que apresentaram modelos individuais melhor ajustados1313 Myers, R. H.; Montgomery, D. C.; Anderson-Cook, C. M.; Response surface methodology process and product optimization using designed experiments, Wiley: Hoboken, 2009. podem receber um peso maior que aquelas respostas que apresentaram modelos com falta de ajuste. Como output, a rotina irá fornecer dois resultados: a desejabilidade individual (di) de cada resposta e a desejabilidade global (D), ou seja, a média geométrica de todas as desejabilidades individuais. Com isso, pode-se calcular apenas um modelo de regressão que englobe todas as respostas utilizando a D. A rotina está disponível no Material Suplementar e, para os cálculos, utilizaram-se as equações mostradas na Figura 1.

RESULTADOS E DISCUSSÃO

Exemplo 1

No primeiro exemplo estudado os autores monitoraram como as diferentes proporções de matéria orgânica (v1), óxido de ferro (v2) e caulinita (v3) influenciam na absorção de Pb por uma amostra de solo. As concentrações de Pb utilizadas são aquelas que podem ser encontradas devido ao descarte inadequado de material eletrônico.

Figura 1
Equações para o cálculo da desejabilidade quando o objetivo é (a) maximizar e (b) minimizar

Segundo os autores, foram realizadas 3 réplicas em cada nível experimental, entretanto, são mostrados apenas o valor médio e desvio padrão obtido.

Para avaliar como os pseudocomponentes interferiram nas respostas avaliadas utilizou-se a rotina regression2, a qual foi proposta por Pereira e Pereira-Filho88 Pereira, F. M. V.; Pereira-Filho, E. R.; Quim. Nova 2018, 41, 1061. e tem a finalidade de calcular um modelo de regressão a partir de 4 dados de entrada (inputs): as matrizes X e Y, a soma quadrática do erro puro (pure error sum of squares - SSPE) e seu respectivo grau de liberdade (degree of freedom - DF). A linha de comando para a utilização da rotina regression2 é:

[Mod_par,Coef,Pred]=regression2(X,Y,SSPE,DF);

Na parte direita da linha de comando pode-se observar os inputs. A matriz X dá origem aos coeficientes de regressão (Coef) a serem calculados e possui m linhas e n colunas, onde as linhas correspondem aos experimentos e as colunas aos coeficientes de regressão que serão calculados, essa matriz pode ser vista em detalhes na Tabela 2. Os coeficientes calculados para ambas as respostas avaliadas foram: b1, b2, b3, b12, b13, b23, b123. Os três primeiros coeficientes, b1, b2 e b3, são obtidos a partir dos níveis codificados das variáveis v1, v2 e v3, mostrados na Tabela 1, o coeficiente b12 é obtido pela multiplicação da coluna correspondente ao coeficiente b1 pela coluna correspondente ao coeficiente b2. Os demais coeficientes são obtidos de forma análoga. A matriz Y corresponde aos resultados obtidos em cada experimento realizado, dessa forma será composta por m linhas e n colunas, onde as linhas correspondem aos experimentos e as colunas, as respostas monitoradas (F2 e F3, Tabela 1). SSPE corresponde a soma quadrática do erro puro obtida a partir das réplicas, porém, nesse caso não foi possível o cálculo desse parâmetro devido à ausência desses valores, sendo considerado 0. Na utilização da rotina regression2 é calculado um modelo para cada resposta. Dessa forma, recomenda-se o desmembramento da matriz Y em n vetores (as n respostas avaliadas).

A parte esquerda da linha de comando corresponde aos outputs (saídas) obtidos após o tratamento dos dados pela rotina regression2. Mod_par corresponde a tabela ANOVA (Analysis of Variance) considerando 95% de confiança, Coef aos coeficientes obtidos com seus respectivos intervalos de confiança e Pred corresponde aos valores previstos para cada experimento. Pereira e Pereira-Filho88 Pereira, F. M. V.; Pereira-Filho, E. R.; Quim. Nova 2018, 41, 1061. fornecem uma explicação detalhada da rotina utilizada.

Tabela 2
Matriz X utilizada para os cálculos dos modelos de regressão para as respostas F2 e F3 (Exemplo 1)

O primeiro passo foi calcular um modelo de regressão para cada resposta a fim de verificar quais coeficientes de regressão são significativos, isso é, valores maiores que seus respectivos intervalos de confiança. O Material Suplementar mostra as tabelas Anova para as respostas F2 (Tabela 1S) e F3 (Tabela 2S). Além disso, as informações dos modelos são também mostradas na forma de figuras (Figuras 1S to 2S). Para a resposta F2 apenas os coeficientes b1 e b2 foram significativos (Figura 1S), já para a resposta F3, b1, b2, b3, b12 e b13 foram válidos (Figura 2S). Todas as avaliações foram feitas ao nível de confiança de 95%.

A rotina regression2 foi aplicada novamente para ambas as respostas utilizando somente os coeficientes válidos. Mesmo com a exclusão dos coeficientes não significativos para cada uma das respostas, não foram identificadas réplicas, isso é, mais de um experimento com as mesmas condições, não sendo possível o cálculo de SSPE e DF.

A Figura 2, a Tabela 3 e a Equação 1 mostram os resultados obtidos após o refinamento do modelo para a resposta F2. E a Figura 3, Tabela 4 e Equação 2 descrevem os resultados para a resposta F3.

(1)F2=1874±328v1+1903±328v2
(2)F3=2804±396v1+2726±535v2+695±353v33133±1831v1v23340±1831v1v3

Nas Equação 1 e 2, v1, v2 e v3 são relativos à matéria orgânica, óxido de ferro e caulinita, respectivamente. Ambas as equações descrevem uma superfície de resposta com as três variáveis interrelacionadas. O ponto “ótimo” da superfície descrita pela equação representa as proporções de v1, v2 e v3 em que as respostas encontram seus valores “ótimos”, ou seja, região onde se observa maior fração de massa (concentração) de Pb nas frações orgânica (F2) e residual (F3), respectivamente. Os modelos obtidos foram analisados em um template preparado no Excel, que tem como finalidade a obtenção de um gráfico de contorno a partir dos valores dos coeficientes obtidos em um modelo de regressão. As Figuras 4a to 4b mostram os gráficos de contorno obtidos para F2 e F3, respectivamente. Analisando os gráficos obtidos é possível observar as proporções das pseudocomponentes que resultam em maior teor de Pb, em vermelho, e as proporções que resultam em menor teor de Pb, em verde.

Figura 2
Teste F para a média quadrática de regressão (MQR) e média quadrática de resíduo (MQres) (a), variação explicada (R22 Sahu, P. K.; Ramisetti, N. R.; Cecchi, T.; Swain, S.; Patro, C. S.; Panda, J.; J. Pharm. Biomed. Anal. 2018, 147, 590) e explicável (R22 Sahu, P. K.; Ramisetti, N. R.; Cecchi, T.; Swain, S.; Patro, C. S.; Panda, J.; J. Pharm. Biomed. Anal. 2018, 147, 590max) (b), coeficientes de regressão (c), gráfico dos valores experimental versus previsto (d), previsto versus o resíduo e histograma dos resíduos (e), para os cálculos da resposta F2 após o refinamento do modelo
Tabela 3
Tabela Anova para o modelo recalculado da resposta F2 com os coeficientes válidos (Exemplo 1)
Figura 3
Teste F para MQR e MQres (a), variação explicada (R22 Sahu, P. K.; Ramisetti, N. R.; Cecchi, T.; Swain, S.; Patro, C. S.; Panda, J.; J. Pharm. Biomed. Anal. 2018, 147, 590) e explicável (R22 Sahu, P. K.; Ramisetti, N. R.; Cecchi, T.; Swain, S.; Patro, C. S.; Panda, J.; J. Pharm. Biomed. Anal. 2018, 147, 590max) (b), coeficientes de regressão (c), gráfico dos valores experimental versus previsto (d), previsto versus o resíduo e histograma dos resíduos (e), para os cálculos da resposta F3 após o refinamento do modelo
Tabela 4
Tabela Anova para o modelo recalculado da resposta F3 com os coeficientes válidos (Exemplo 1)

Além do template descrito também foi utilizado a ferramenta do Solver no Excel para avaliar os modelos obtidos. Uma descrição detalhada deste recurso e sua utilização podem ser encontrados no tutorial anterior88 Pereira, F. M. V.; Pereira-Filho, E. R.; Quim. Nova 2018, 41, 1061. e na Playlist de número 7 que descreve o uso do Solver (https://www.youtube.com/playlist?list=PL4CuftF4l_fB7LRMzFBmw59FrigmAb0hy ). As proporções que resultaram em maior teor de Pb na F2 do solo são: 10% de matéria orgânica (v1), 80% de óxido de ferro (v2) e 10% de caulinita (v3). No caso da F3, a melhor condição exige que a v1 esteja no nível máximo.

Figura 4
Gráficos de contorno obtidos para o modelo final da resposta F2 (a), e para o modelo final da resposta F3 (b)

Para melhor entendimento do processo de tratamento de dados descrito neste trabalho foi elaborada uma lista de vídeos explicativos de livre acesso publicados no YouTube (https://www.youtube.com/playlist?list=PL4CuftF4l_fDBW0qIJ1gXZneN1Krgw5z_ ).

Exemplo 2

Na Tabela 5, tem-se o planejamento de misturas utilizado pelos autores com três variáveis (CLF, DCM e ACN), onde as proporções das condições escolhidas variaram de 0 a 1 quando convertidas em pseudocomponentes. As codificações de cada uma das variáveis são mostradas, sendo que a soma entre elas é 1. As respostas monitoradas são apresentadas na forma de recuperação dos cinco pesticidas determinados.

O primeiro passo foi calcular a desejabilidade individual para cada uma das respostas utilizando a rotina “mydes2” e construir a matriz X com os coeficientes cúbicos (b1, b2, b3, b12, b13, b23 e b123) que se deseja calcular. Neste caso, o alvo para o cálculo da desejabilidade foi 100% por se tratar de recuperações de cada um dos pesticidas. Fez-se um modelo de regressão utilizando a rotina regression2 para cada uma das desejabilidades individuais com o objetivo de atribuir diferentes pesos a cada uma das respostas e observar quais são mais influenciadas pelas variáveis testadas.88 Pereira, F. M. V.; Pereira-Filho, E. R.; Quim. Nova 2018, 41, 1061. Como no artigo original não foram fornecidos os valores das réplicas, não foi possível calcular o valor da soma quadrática do erro puro. Os pesos foram atribuídos de acordo com o resultado da razão entre a média quadrática de regressão (MQR) e a média quadrática do resíduo (MQres). Quanto maior essa razão, melhor é a regressão do modelo. De acordo com os resultados, DIA e ATZ obtiveram razões na faixa de 2,2; DEA e DIU na faixa de 1,7 e TFB na faixa de 0,9. Portanto, três diferentes pesos (s, Figura 1) foram atribuídos: 3 (DIA e ATZ), 2 (DEA e DIU) e 1 (TFB).

O segundo passo foi recalcular as desejabilidades individuais com os devidos pesos para cada uma das respostas e assim obter a desejabilidade global (D), a qual foi utilizada para calcular um modelo de regressão englobando todas as respostas simultaneamente. A matriz X (coeficientes cúbicos) e o vetor y (desejabilidade global, D) são mostrados na Tabela 6.

Tabela 5
Planejamento de misturas com três variáveis e cinco respostas monitoradas (Exemplo 2)
Tabela 6
Matriz X e vetor y para a realização do modelo de regressão global (Exemplo 2)

O modelo de regressão é calculado pela rotina “regression2” disponibilizada em Pereira e Pereira-Filho,88 Pereira, F. M. V.; Pereira-Filho, E. R.; Quim. Nova 2018, 41, 1061. a partir do qual é possível calcular e avaliar a Tabela Anova. Após o cálculo, apenas dois coeficientes foram significativos: b12 e b13. Assim, o modelo foi recalculado apenas com os coeficientes válidos, onde quatro réplicas foram identificadas permitindo obter a soma quadrática do erro puro. Na Tabela 3S, tem-se a tabela Anova para o modelo recalculado e na Figura 3S (ver ambos no Material Suplementar) tem-se os valores da razão do teste Fcalculado e Ftabelado para a falta de ajuste (a) e para a regressão (b), além da variância explicada do modelo (c).

Ao analisar o resultado da razão do primeiro teste Fcalculado (MQFaj/MQEP) e Ftabelado, tem-se que o Fcalculado é menor que o Ftabelado, em que os dois se confundem, portanto, o modelo não apresenta falta de ajuste (razão menor que 1, Figura 3Sa). Além da falta de ajuste, é necessário verificar a regressão do modelo, sendo que, nesse caso, a razão entre o Fcalculado (MQReg/MQres) e o Ftabelado está na faixa de 4,5 (Figura 3Sb), ou seja, a regressão é maior que o resíduo. Esse aspecto reflete que o modelo está adequado, porém, a situação ideal é que a razão dos valores de F fosse acima de dez.1414 Barros Neto, B.; Scarminio, I. S.; Bruns, R. E.; Como fazer experimentos, Bookman: Porto Alegre, 2010. Os parâmetros utilizados para os cálculos do teste F são encontrados na Tabela Anova (Tabela 3S). A variância explicada do modelo está na faixa de 0,6 (Figura 3Sc), o que pode afirmar que o modelo não é excelente, mas por outro lado é possível utiliza-lo para identificar uma condição de compromisso que poderá apresentar valores de recuperação adequados para todos os analitos. Assim, o modelo final foi:

(3)D=0,22v1v2+0,38v1v3
em que v1, v2 e v3 são CLF, DCM e ACN, respectivamente. D é a resposta (no caso, a desejabilidade global). Nota-se que apenas os coeficientes quadráticos foram significativos.

Na Figura 5, tem-se o gráfico de contorno com os coeficientes significativos, no qual observa-se uma região de ótimo na coloração vermelha da figura, resultando em 0,5 das variáveis 1 (CLF) e 3 (ACN) e 0 da variável 2 (DCM), ou seja, uma mistura “ideal” seria 50% de CLF e 50% de ACN, e 0% de DCM. A condição identificada pelos autores do trabalho foi: 47,5% de CLF e 47,5% de ACN, e 5% de DCM, ou seja, mesmo com diferentes abordagens para o tratamento de dados, os resultados foram praticamente os mesmos. O gráfico foi feito com o template de misturas no Excel disponibilizado neste tutorial.

Na Tabela 7, tem-se o resultado das respostas previstas para cada um dos pesticidas, onde empregou-se o modelo global com os coeficientes b12 e b13. Assim, utilizou-se os valores desses coeficientes (b12 e b13) dos modelos individuais calculados no início do tratamento dos dados para encontrar a di (desejabilidade individual) de cada um dos pesticidas em todos os níveis (coeficiente ± intervalo de confiança) e consequentemente, a resposta prevista. Para a di prevista, utilizou-se a Equação 3 com os devidos coeficientes significativos para cada nível e cada resposta, como pode ser observado no exemplo (Equação 4) para o pesticida DIA:

(4)dDIA=0,15×0,5×0+0,35×0,5×0,5=0,09

Figura 5
Gráfico de contorno do modelo cúbico com dois coeficientes significativos (Equação 3)

Lembrando que v1 = 0,5; v2 = 0 e v3 = 0,5. A recuperação prevista (y) foi calculada de acordo com a equação da Figura 1a. Nesse caso, tem-se a di prevista e o novo y será a resposta prevista em termos de recuperação. Ao observar a resposta do artigo (Tabela 7), tem-se valores muito semelhantes com os resultados obtidos no maior nível (coeficiente mais o intervalo de confiança). Vale ressaltar que ambos os trabalhos utilizaram abordagens diferentes e com isso os resultados podem ser considerados equivalentes.

Encontrando a região de ótimo usando ferramentas de cálculo diferencial

Tabela 7
Respostas previstas para cada um dos pesticidas, tendo os coeficientes ± intervalo de confiança e a resposta obtida pelos autores do Exemplo 2

A identificação da região ótima de trabalho de determinado modelo não é uma tarefa fácil e pode trazer dificuldades consideráveis de acordo com os coeficientes válidos do modelo. Para o caso da Equação 1, por exemplo, a região em que há a máxima retenção de Pb está na aresta em que a variável 2 (óxido de ferro) é máxima (1,0). Nesse ponto, a fração de massa prevista para o Pb é de 1903 mg kg-1;. Essa constatação corrobora com a aplicação do Solver do Microsoft Excel®.

Para o caso do modelo obtido para a resposta F3 (Equação 2), podemos calcular as derivadas parciais em função das variáveis v1 e v2 e substituir a v3 por 1-v1-v2:

(5)f3(v1,v2)=F3(v1,v2,1v1v2)=2804v1+2726v2+695(1v1v2)3133v1v23340(1v1v2)

As derivadas parciais são:

(6)f3/v1(v1,v2)=6680v1+207v21231
(7)f3/v2(v1,v2)=207v1+2031
(v1,v2) é o ponto crítico de f3f3/v1v1,v2=0ef3/v2v1,v2=0.
(8)v2=12316680v1207ev1=20312079,81
v1=9.81ev2=322.57(v1,v2)=(9,81;322,57)

Entretanto, esse ponto está fora do domínio T={(v1,v2): v1 ≥ 0, v2 ≥ 0 e v1 + v2 ≤ 1} da função f3. Portanto, novamente aqui, f3 não possui pontos críticos no interior de T.

O domínio de F3 é a região plana delimitada pelo triângulo equilátero com vértices (1,0,0), (0,1,0) e (0,0,1), mostrado na Figura 4S (Material Suplementar).

O domínio T de f3 é a região plana delimitada pelo triângulo retângulo com vértices (0,0), (1,0) e (0,1), como mostra a Figura 5S (Material Suplementar).

Notamos que o bordo de T é dado pela união dos segmentos a, b e c (dados em vermelho, azul e verde, respectivamente, ver Figura 5S).

Precisamos analisar os candidatos a ponto de máximo de f3 no bordo de T.
  1. Em a = {(v1,v2) ∈ T: v1 ≥ 0, v2 ≥ 0 e v1+v2 = 1}

    Nesse caso, analisamos os pontos de máximo da função g1:[0,1]→[0,1], definida por g1(v1) = f3(v1,1-v1) = 3133v122 Sahu, P. K.; Ramisetti, N. R.; Cecchi, T.; Swain, S.; Patro, C. S.; Panda, J.; J. Pharm. Biomed. Anal. 2018, 147, 590 – 3055v1 + 2726, a qual tem um único ponto crítico v1 = 235/482 ~ 0,49 ∈ (0,1). Assim, nesse caso, os candidatos a ponto de máximo de F3 são, (0,49, 0,51, 0), (0,1,0) e (1,0,0).

  2. Em b = {(0, v2) ∈ T: 0 ≤ v2 ≤ 1}

    Nesse caso, analisamos os pontos de máximo da função g2:[0,1]→[0,1], definida por g2(v2) = f3(0,v2) = 2031v2 + 695, a qual não possui pontos críticos. Logo, nesse caso, os candidatos a ponto de máximo de F3 são (0,0,1) e (0,1,0).

  3. Em c = {(v1,0) ∈ T: 0 ≤ v1 ≤ 1}

    Nesse caso, analisamos os pontos de máximo da função g3:[0,1]→[0,1], definida por g3(v1) = f3(v1,0) = 3340v122 Sahu, P. K.; Ramisetti, N. R.; Cecchi, T.; Swain, S.; Patro, C. S.; Panda, J.; J. Pharm. Biomed. Anal. 2018, 147, 590−1231v1 +695, a qual tem um único ponto crítico x = 1231/6680 ~ 0,18 ∈ (0,1). Assim, nesse caso, os candidatos a ponto de máximo de F3 são, (0,18, 0, 0,82), (0,0,1) e (1,0,0).

Agora testamos todos os candidatos:
  1. F3 (0,49, 0,51, 0) = 1981

  2. F3 (0,18, 0, 0,82) = 582

  3. F3 (1, 0, 0) = 2804

  4. F3 (0, 1, 0) = 2726

  5. F3(0, 0, 1) = 695

Logo, o ponto de máximo procurado é (1, 0, 0), ou seja, a variável 1 (v1 = Matéria Orgânica) no nível alto (1).

Para o caso do exemplo 2, no qual o modelo obtido é aquele mostrado na Equação 3, precisamos determinar o ponto de máximo absoluto da função

D(v1,v2,v3)=0,22v1v2+0,38v1v3sendo quev1+v2+v3=1.

Chamando v1 = x, v2 = y e v3 = z temos,

D(x,y,z)=0,22xy+0,38xzex+y+z=1

Isso é equivalente à:

d(x,y)=D(x,y,1xy)=0,38x20,16xy+0,38xcomx0,y0ex+y1

O ponto de máximo da função d ocorre entre os pontos críticos de d no interior de T=x,y:x0,y0ex+y1 e os pontos críticos do bordo de T, ou seja, b(T) = {(x,y): x = 0 ou y = 0 ou x+y = 1}.
  • Pontos críticos no interior de T

    (x,y) é ponto crítico de dd/xx,y=0,76x0,16y+0,38=0 e

    d/y(x,y)=0,16x=0(x,y)=(0,2,38)

    Como o ponto (0, 2,38) não pertence ao conjunto T (e, portanto, não pertence ao interior desse conjunto), temos que d não possui candidatos a ponto de máximo absoluto no interior de T.

  • Pontos críticos no b(T)
    1. x = 0

      Nesse caso, analisamos os pontos de máximo da função f1:[0,1]→[0,1], definida por f1(y) = d(0,y) = 0. Como essa é uma função constante, todos os pontos (0,y) são candidatos a ponto de máximo de d, ou seja, todos os pontos (0, y, 1-y) com 0 ≤ y ≤ 1 são candidatos a ponto de máximo de D.

    2. y = 0

      Nesse caso, analisamos os pontos de máximo da função f2:[0,1]→[0,1], definida por f2(x) = d(x,0) = 0,38(x-x22 Sahu, P. K.; Ramisetti, N. R.; Cecchi, T.; Swain, S.; Patro, C. S.; Panda, J.; J. Pharm. Biomed. Anal. 2018, 147, 590), a qual tem um único ponto crítico x = 1/2 ∈ (0,1). Assim, nesse caso, os candidatos a ponto de máximo de D são, (½, 0, ½), (0,0,1) e (1,0,0).

    3. x+y = 1

      Nesse caso, analisamos os pontos de máximo da função f3:[0,1]→[0,1], definida por f3(x) = d(x,1-x) = 0,22(x-x2), a qual tem um único ponto crítico x = 1/2 ∈ (0,1). Assim, nesse caso, os candidatos a ponto de máximo de D são (½, ½, 0), (0,1,0) e (1,0,0).

Agora testamos todos os candidatos:
  1. D (0, y, 1-y) = D (0, 0, 1) = D(0, 1, 0) = 0

  2. D (½, 0, ½) = 0,095

  3. D (½, ½, 0) = 0,055

  4. D (1,0,0) = 0

Logo, o ponto de máximo procurado é (½, 0, ½). Assim, as variáveis v1 (CLF) e v3 (ACN) devem ser 50% de cada.

CONCLUSÕES

Com este tutorial é possível aprender de forma didática como realizar o tratamento de dados de um planejamento de misturas para duas e múltiplas respostas. Também foi elaborado um template no Excel para a construção de gráfico de contorno e superfície de resposta com os resultados dos modelos de regressão de misturas, os quais são disponíveis apenas em programas computacionais pagos e restritos. O uso do Solver também foi exemplificado neste tutorial, sendo uma ferramenta gratuita que pode ser utilizada no Excel. Além disso, uma rotina computacional foi proposta para o cálculo das desejabilidades.

Tabela 8
Lista dos vídeos preparados com os dois exemplos ilustrados neste tutorial

A Tabela 8 mostra uma lista com os vídeos elaborados para a construção deste tutorial. Os vídeos são curtos e mostram o passo a passo até a resposta final. No link a seguir é possível acessar a Playlist 15, criada no canal do professor Edenir Pereira Filho no YouTube: https://www.youtube.com/playlist?list=PL4CuftF4l_fDBW0qIJ1gXZneN1Krgw5z_

As rotinas (“regression2”, “template_misturas” e “mydes2”) utilizadas neste trabalho estão disponíveis para download em: https://www.dropbox.com/sh/aiuvutcknbch5te/AAC-6Bef2WUsJZ-LJP2imh_Ea?dl=0

MATERIAL SUPLEMENTAR

O Material Suplementar apresenta os seguintes itens:
  1. Rotina computacional “mydes2”

  2. Tabela 1S. Tabela Anova para o modelo calculado da resposta F2 (Exemplo 1).

  3. Tabela 2S. Tabela Anova para o modelo calculado da resposta F3 (Exemplo 1).

  4. Tabela 3S. Tabela Anova do modelo calculado para a resposta D (Exemplo 2).

  5. Figura 1S. Teste F para MQR e MQr (a), teste F para a MQfaj e MQEP (b) variação explicada (R2) e explicável (R2max) (c), coeficientes de regressão (d), gráfico dos valores experimental versus previsto (e), previsto versus o resíduo e histograma dos resíduos (f) para os cálculos da resposta F2 (Exemplo 1).

  6. Figura 2S. Teste F para MQR e MQr (a), teste F para a MQfaj e MQEP (b) variação explicada (R2) e explicável (R2max) (c), coeficientes de regressão (d), gráfico dos valores experimental versus previsto (e), previsto versus o resíduo e histograma dos resíduos (f) para os cálculos da resposta F3 (Exemplo 1).

  7. Figura 3S. Teste F para MQR e MQr (b), teste F para a MQfaj e MQEP (a) variação explicada (R22 Sahu, P. K.; Ramisetti, N. R.; Cecchi, T.; Swain, S.; Patro, C. S.; Panda, J.; J. Pharm. Biomed. Anal. 2018, 147, 590) (c) para os cálculos da resposta D (Exemplo 2).

  8. Figura 4S. Região plana delimitada pelo triângulo equilátero com vértices (1,0,0), (0,1,0) e (0,0,1) que contém o domínio de F3.

  9. Figura 5S. Domínio T de f3 delimitado pelo triângulo retângulo com vértices (0,0), (1,0) e (0,1).

Todo o conteúdo se encontra em http://quimicanova.sbq.org.br, em formato PDF, com acesso livre.

AGRADECIMENTOS

Os autores são gratos à Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP, processos 2016/17221-8 e 2019/24223-5) e ao Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq, processos 302719/2020-2). Os autores expressam gratidão à PubliSBQ por permitir o uso dos exemplos em caráter ilustrativo neste tutorial. O presente trabalho foi realizado com apoio da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - Brasil (CAPES) - Código de Financiamento 001.

REFERÊNCIAS

  • 1
    Leardi, R.; Anal. Chim. Acta 2009, 652, 161.
  • 2
    Sahu, P. K.; Ramisetti, N. R.; Cecchi, T.; Swain, S.; Patro, C. S.; Panda, J.; J. Pharm. Biomed. Anal. 2018, 147, 590
  • 3
    Coscione, A. R.; De Andrade, J. C.; May, G. M.; Quim. Nova 2005, 28, 1116.
  • 4
    Novaes, C. G.; Yamaki, R. T.; de Paula, V. F.; do Nascimento Júnior, B. B.; Barreto, J. A.; Valasques, G. S.; Bezerra, M. A.; Rev. Virtual Quim. 2017, 9, 1184.
  • 5
    Novaes, C. G.; Yamaki, R. T.; de Paula, V. F.; do Nascimento Júnior, B. B.; Barreto, J. A.; Valasques, G. S.; Bezerra, M. A.; Rev. Virtual Quim. 2018, 10
  • 6
    Bezerra, M. A.; Ferreira, S. L. C.; Novaes, C. G.; dos Santos, A. M. P.; Valasques, G. S.; Cerqueira, U. M. F.; Alves, J. P. S.; Talanta 2019, 194, 941.
  • 7
    Candioti, L. V.; Zan, M. M.; Cámara, M. S.; Goicoechea, H. C.; Talanta, 2014, 124, 123.
  • 8
    Pereira, F. M. V.; Pereira-Filho, E. R.; Quim. Nova 2018, 41, 1061.
  • 9
    Damasceno, A. I. C.; Reis, C.; Reis, E. L.; Bellato, C. R.; Oliveira, A. F.; J. Braz. Chem. Soc. 2016, 27, 877.
  • 10
    Estevão, P. L. S.; Peralta-Zamora, P.; Nagata, N.; J. Braz. Chem. Soc. 2018, 29, 2104.
  • 11
    Costa, N. R.; Lourenço, J.; Pereira, Z. L.; Chemometr. Intell Lab. Syst. 2011, 107, 234.
  • 12
    Derringer, G.; Suich, R.; J. Qual. Technol. 1980, 12, 214.
  • 13
    Myers, R. H.; Montgomery, D. C.; Anderson-Cook, C. M.; Response surface methodology process and product optimization using designed experiments, Wiley: Hoboken, 2009.
  • 14
    Barros Neto, B.; Scarminio, I. S.; Bruns, R. E.; Como fazer experimentos, Bookman: Porto Alegre, 2010.

Datas de Publicação

  • Publicação nesta coleção
    03 Set 2021
  • Data do Fascículo
    2021

Histórico

  • Recebido
    03 Fev 2021
  • Aceito
    18 Mar 2021
Sociedade Brasileira de Química Secretaria Executiva, Av. Prof. Lineu Prestes, 748 - bloco 3 - Superior, 05508-000 São Paulo SP - Brazil, C.P. 26.037 - 05599-970, Tel.: +55 11 3032.2299, Fax: +55 11 3814.3602 - São Paulo - SP - Brazil
E-mail: quimicanova@sbq.org.br