Acessibilidade / Reportar erro

Só erra quem faz, e quem faz erra! um manifesto pelo cálculo da propagação de incertezas

Only those who experiment make errors, and who experiments, errs! a manifesto for the calculation of the propagation of uncertainties

Resumo

Making experimental measurements, whether we are at peace in the face of such a reality or not, invariably involves experimental uncertainty. Unfortunately, presenting uncertainty alongside the results is not as widespread as it should be. The author attempts here to simplify, improve understanding, and appeal to a healthy living with uncertainty. One of the main tools scientists should know that there is available is the uncertainty propagation equation, which can be applied to all equations involving experimental results.

Keywords:
central limit theorem; experimental errors; normal distribution; propagation of uncertainty


Keywords:
central limit theorem; experimental errors; normal distribution; propagation of uncertainty

INTRODUÇÃO

Há uma frase comum, quando o aluno motivado, mas ainda desajeitado, parte alguma coisa no laboratório:

- “Só erra quem faz!”

E aqui, o autor deste artigo, gostaria de acrescentar:

- “E quem faz erra!”.

As medidas experimentais têm, invariavelmente, erros. No limite, esta afirmação pode ser justificada com o princípio de incerteza de Heisenberg, que refere que quanto menor for a incerteza na medida da posição de uma partícula, maior será a incerteza na medição seu momento linear e vice-versa.11 Heisenberg, W.; Zeitschrift fur Phys. abrebold1927fechabold, 43, 172. Sendo assim, quando se apresenta o resultado de uma medição, e, obviamente, quando se apresentam as conclusões deduzidas desses resultados, deve vir associado uma incerteza. Esse conceito pode ser subliminar, mas pode também, e até é preferível, ser explícito e quantificado:

(1) x ± Δ x

onde x é o resultado experimental e Δx é a incerteza do resultado experimental.

O autor deste artigo é professor, bem como um leitor e revisor de artigos científicos, além de um leitor habitual de reportagens e livros com conteúdo científico. Em todas estas atividades é surpreendente o número de vezes que não se apresenta qualquer tipo de incerteza. E é uma pena. A manifestação de incertezas não é um reflexo de ignorância ou falta de profissionalismo. Pelo contrário, demonstra sapiência e demonstra sabedoria das limitações do conhecimento. E essa clarividência Socrática é fundamental para um bom pesquisador.

No geral, os cientistas têm uma boa noção de incerteza. Então, porque é tão difícil, quando expressam um resultado, associarem uma incerteza? É difícil identificar a origem do problema, talvez seja devido a uma antipatia natural para com o erro, talvez os livros (incluindo muitos dos livros de referência em química analítica) não deduzam a fórmula de propagação de incerteza ou adequadamente demonstrem a sua impressionante aplicabilidade, talvez seja pelo receio dos professores em expor os alunos a tanta matemática nas suas aulas. O autor não sabe, mas mesmo sem saber a causa, lamenta, e espera, contudo, que este manuscrito contribua um pouco para mudar a situação.

Teorema central do limite e ‘normalidade’

O teorema central do limite (TCL) talvez seja um bom ponto de partida. É um dos conceitos mais importantes em estatística (e até mesmo em toda a matemática), e é aqui importante porque a sua premissa nos ‘autoriza’ calcular a incerteza. O TCL refere que retirando algumas amostras de uma população (em particular um número elevado de amostras), a função de probabilidade (fdp) das médias das amostras adquire o formato de uma curva de distribuição normal. Uma função normal tem por base esta equação:

(2) f x = 1 σ 2 π e 1 2 x μ σ

onde µ é a média, e σ é o desvio-padrão, calculado por:

(3) σ = 1 N i = 1 N x i μ 2

Embora a história da distribuição normal seja fora do âmbito deste artigo é muito interessante, e o leitor mais interessado é aconselhado a ler sobre o tópico.22 Stahl, S.; Math. Mag. abrebold2006fechabold, 79, 96.

Explicando o TCL de forma mais elegante, a média amostral (Xoverline) é a soma de n dados (Sn) a dividir por n:

(4) X ¯ = X 1 + X 2 + ... + X n n = 1 n i = 1 n X i = S n n

O TCL estabelece que, com um valor de n elevado, a distribuição de Xoverline converge para uma distribuição normal padrão:

(5) X ¯ ~ N μ , σ 2 n

Isto porque na notação matemática mais comum: Y ~ N(a,b), significa que a variável Y segue uma distribuição (~) normal (N) de média a e variância b).

Para evitar a degeneração que ocorre à variância σ2n quando n tende para o infinito (pois variância passa a ser zero). Representamos:

(6) Z = X ¯ μ σ / n = S n n μ n σ = i = 1 n x i n μ n σ

Finalmente, a TCL estabelece que a distribuição de Zn converge para uma distribuição normal padrão quando o n tende para o infinito, com valor esperado de média de 0 (E[Zn] = 0) e variância de 1 (Var(Zn) = 1).

(7) Z n ~ N 0 , 1

O quão grande o número de amostras precisa ser depende do quão normal é a distribuição original. Se a distribuição original for próxima de uma curva ‘formato de sino’ basta um n de 10; para populações mais anormais alguns autores referem um n de 50; Outros simplificam e referem n de 30 independentemente da população.33 Cordeiro, N.; Magalhães, A.; Introdução à Estatística - Uma perspectiva química; 1st ed.; Lidel: Porto, 2004.

Como foi dito previamente, a fdp das médias das amostras adquire o formato de uma curva de distribuição normal, e se levarmos em conta a equação 2 acima descrita de uma função normal padrão, teremos que:

(8) fdp = 1 2 π e z 2 2

Um detalhe importante, a área de toda a curva fdp é sempre 1, o fator 12π garante isso, com pontos de inflexão -1 e 1, ou seja:

(9) + 1 2 π e z 2 2 dz = 1

O TCL é particularmente impressionante pois é aplicável mesmo a populações que não estão normalmente distribuídas (Figura 1).33 Cordeiro, N.; Magalhães, A.; Introdução à Estatística - Uma perspectiva química; 1st ed.; Lidel: Porto, 2004.

Figura 1
Representação esquemática do TCL. É calculada a média de cada uma das diferentes amostras retiradas da população não normal (no lado esquerdo). A distribuição dessas mesmas médias é, interessantemente, normal (no lado direito)

A propagação de incerteza per se

Após este pequeno introito sobre o TCL, podemos ir agora diretamente para a propagação de incerteza. Seja, então, Y uma variável calculada como função de várias variáveis aleatórias (X1, X2, …, Xn).

(10) Y = f X 1 , X 2 ,... X n

E considere-se que estas variáveis possuem uma distribuição normal de média µi e desvio padrão σi conhecidos. Se os desvios padrão σi forem suficientemente pequenos, a função f pode ser desenvolvida numa série de Taylor em torno dos valores médios {µi} e truncada nos termos lineares.33 Cordeiro, N.; Magalhães, A.; Introdução à Estatística - Uma perspectiva química; 1st ed.; Lidel: Porto, 2004.

(11) Y = f X 1 , X 2 ,... X n μ i + i = 1 n X i μ i f X i μ i

Desta forma os parâmetros da variável aleatória Y podem ser facilmente determinados:

a) média:

(12) E Y = E f X 1 , X 2 ,... X n μ i + i = 1 n X i μ i f X i μ i

E como:

(13) E X i μ i = E X i μ i = 0

Temos que:

(14) E Y = f X 1 , X 2 ,... X n μ i = μ Y

b) desvio-padrão

(lembrar que: (a + b)2 = a 2 + 2ab + b 2):

(15) σ Y = Var Y = E Y μ Y 2 = E Y 2 2 Y μ Y + μ Y 2 = E μ Y + i = 1 n X i μ i f X i μ i 2 2 μ Y + i = 1 n X i μ i f X i μ i μ Y + μ Y 2 = E μ Y 2 + 2 μ Y i = 1 n X i μ i f X i μ i + i = 1 n j = 1 n X i μ i X j μ j f X i μ i f X j μ j 2 μ Y 2 2 μ Y i = 1 n X i μ i f X i μ i + μ Y 2 = E i = 1 n j = 1 n X i μ i X j μ j f X i μ i f X j μ j = i = 1 n j = 1 n f X i μ i f X j μ j E X i μ i X j μ j = i = 1 n j = 1 n f X i μ i f X j μ j V ij

ou seja:

(16) σ Y = i = 1 n j = 1 n f X j μ j V ij

onde:

(17) V ij = X 1 i X 1 j X 1 i X n j X n i X 1 j X n i X n j

Onde V é a matriz de variância-covariância de uma função Y. Na prática, esta matriz infere como as diferentes variáveis interferem entre si, ou seja, quantifica o grau de não-independência.

A equação 16 também aparece elegantemente representada na literatura, como:44 Tellinghuisen, J.; J. Phys. Chem. A abrebold2001fechabold, 105, 3917.

(18) σ Y = g T Vg

onde g é um vetor e gT é o vetor transposto.

Se assumirmos que as variáveis são independentes, ou seja, sem covariâncias e Vij for igual a 1.

(19) σ Y = i = 1 n dy dx i 2 Δ x i 2

Para simplificarmos, vamos considerar que σY = Δy:

(20) Δ y = i δ y δ x i 2 Δ x i 2

E esta é talvez a equação mais relevante do tópico deste manuscrito, a equação de propagação de erros. Se o leitor deste artigo não a decorar, por favor coloque-a em grande na parede, colada com fita-adesiva.

Para estudantes que ainda não tenham feito Cálculo, é o mesmo que:

(21) Δ y = dy dx 1 2 Δ x 1 2 + dy dx 2 2 Δ x 2 2 + dy dx 3 2 Δ x 3 + ... + dy dx n 2 Δ x n 2

Estão a ser usadas derivadas parciais, ou seja, a+b2=a2+2ab+b2 é a derivada da função y em relação à variável x1 assumindo todas as outras variáveis como constantes (x1, x2, x3, …, xn), e dydx1 é a derivada da função y em relação à variável x 2, assumindo todas as outras variáveis como constantes (x1, x2, x3, …, xn); e assim sucessivamente.

Vejamos o que se passa quando aplicamos a equação de propagação de incertezas a alguns dos casos principais:

Na multiplicação com uma constante:

(22) y = k a

(sendo k uma constante), teremos que (lembrar que: dydx2).

(23) Δ y = a ka 2 Δ a 2 = k 2 Δ a 2 = k Δ a

Na adição:

(24) y = a + b

teremos que (lembrar que: ddxkx=k; ergo: ddxxn=nxn1).

(25) Δ y = a a + b 2 Δ a 2 + b a + b 2 Δ b 2 = 1 2 Δ a 2 + 1 2 Δ b 2 = Δ a 2 + Δ b 2

Na subtração:

(26) y = a b

teremos que:

(27) Δ y = a a b 2 Δ a 2 + b a b 2 Δ b 2 = 1 2 Δ a 2 + 1 2 Δ b 2 = Δ a 2 + Δ b 2

Na multiplicação:

(28) y = a b

teremos que:

(29) Δ y = a ab 2 Δ a 2 + b ab 2 Δ b 2 = b 2 Δ a 2 + a 2 Δ b 2 = y a 2 Δ a 2 + y b 2 Δ b 2 = y Δ a a 2 + Δ b b 2

Na divisão:

(30) y = a b

teremos que:

(31) Δ y = a a b 2 Δ a 2 + b a b 2 = 1 b 2 Δ a 2 + a b 2 2 Δ b 2 = y a 2 Δ a 2 + a b 2 2 Δ b 2 = y 2 a 2 Δ a 2 + a 2 b 2 b 2 Δ b 2 = y 2 a 2 Δ a 2 + y 2 b 2 Δ b 2 = y Δ a a 2 + Δ b b 2

Com potências:

(32) y = k a

(sendo k uma constante), teremos que (lembrar que: ddxkx=kxlnk):

(33) Δ y = a k a 2 Δ a 2 = k a ln a 2 Δ a 2 = y 2 ln a 2 Δ a 2 = y ln a Δ a

Com logaritmos:

(34) y = log k a

(sendo k uma constante), teremos que (lembrar que: ddxlogkx=1xlogke=1xlnk).

(35) Δ y = a log k a 2 Δ a 2 = 1 a ln k 2 Δ a 2 = Δ a ln k a

Estas equações estão resumidas na Tabela 1.

Tabela 1
Quadro resumo das fórmulas a aplicar no cálculo das incertezas

ALGUMAS NOTAS SOBRE A APLICAÇÃO DA PROPAGAÇÃO DE INCERTEZA NA QUÍMICA

Podemos começar por ver, na Tabela 2, algumas aplicações diretas das fórmulas da Tabela 1 em alguns exemplos práticos na vida de um químico.

Tabela 2
Alguns exemplos práticos de aplicação do cálculo da incerteza

Mas é importante perceber que a equação de propagação de erros não se aplica apenas em casos de aplicação mais trivial como os descritos na tabela. Pode ser sempre aplicada. Seguem alguns exemplos (o autor desafia o leitor mais interessado a fazer a demonstração por si mesmo antes de verificar a mesma em informação suplementar):

(36) V = l 3 Δ V = 3 l 2 Δ l
(37) s = K ps Δ s = Δ K ps 2 K ps
(38) P = nRT V Δ y = P Δ n n 2 + Δ T T 2 + Δ V V 2 se Δ R = 0
(39) V = 4 3 π r 3 Δ V = 4 π r 2 Δ r

Existem já, vários sites para calcular a incerteza,55 Error propagation calculator https://www.eoas.ubc.ca/courses/eosc252/error-propagation-calculator-fj.htm (accessed Apr 18, 2019).
https://www.eoas.ubc.ca/courses/eosc252/...

6 Propagation of error (uncertainty) https://www.wolframalpha.com/widgets/view.jsp?id=8ac60957610e1ee4894b2cd58e753 (accessed Apr 18, 2019).
https://www.wolframalpha.com/widgets/vie...
-77 Uncertainty Calculator http://web.mst.edu/~gbert/JAVA/uncertainty.html (accessed Apr 18, 2019).
http://web.mst.edu/~gbert/JAVA/uncertain...
e, inclusive, aplicativos para dispositivos móveis. Um bom exemplo, é o aplicativo para Android ‘Error Propagation Calculator’ criado por Julian Wien, quando estudava na Universidade de Würzburg na Alemanha.88 Julianibus http://julianibus.de/ (accessed Apr 18, 2019).
http://julianibus.de/...

Imagine que temos de preparar um litro de uma solução tampão de fosfato, pH 7.4, 0,1 mol L-1. Fazemos as contas e chegamos à conclusão que temos de pesar 20,210 g de hidrogenofosfato de sódio heptahidratado (m 1), massa molar de 268,07 g mol-1 (MM 1), e 3,395 g dihidrogenofosfato de sódio monohidratado (m2), massa molar de 137,99 g mol-1 (MM2). A incerteza da concentração (ΔC) é o seguinte (a demonstração encontra-se na informação suplementar):

(40) Δ C = C Δ m 1 MM 1 2 + Δ m 2 MM 2 2 m 1 MM 1 + m 2 MM 2 2 + Δ V V 2

Para esta fórmula não foi levado em conta a possível adição de ácido ou base para acertar o pH.

Se optarmos por fazer a solução usando uma balança analítica (± 0,1 mg) e um balão volumétrico classe A (± 0,3 mL) teremos de concentração com a respetiva incerteza: (0,09999 ± 0,00003) mol L-1. Se pelo contrário, for utilizada uma balança semi-analítica (± 1 mg) e um béquer comum (± 25 mL), teremos no final: (0,100 ± 0,002) mol L-1. Normalmente, o recurso a uma solução tampão é apenas para tamponar o meio, não é muito importante ter uma concentração muito precisa. Como tal, é justificado que se use um béquer e uma balança mais acessível. Deste modo, não só a preparação da solução é mais rápida e simples mas também não utilizamos material mais frágil.

Pensemos agora num exemplo antagónico. A titulação de 25 mL (Vtitulado) de um ácido forte monoprótico com hidróxido de sódio de concentração (Ctitulante) conhecida, (0,1223 ± 0,0002) mol L-1.

(41) Δ C titulado = C titulado Δ C titulante C titulante 2 + Δ V f 2 + Δ V i 2 V f V i 2 + Δ V titulado V titulado 2

Se a titulação (Vf de 42 mL e Vi de 9 mL) for feita de forma normal com uma bureta (ΔVf = ΔVi = 0,02 mL) e o titulado for medido com uma pipeta volumétrica (ΔVtitulado de 0,02 mL), teremos que: (0,1614 ± 0,0003) mol L-1. Se, porventura a “titulação” for feita com menos cuidado utilizando uma proveta (ΔVf = ΔVi = 1 mL) e o titulado for medido com um béquer (ΔVtitulado de 3 mL), teremos que: (0,16 ± 0,02) mol L-1, ou seja mais de 10% de incerteza. Neste caso, querendo conhecer a concentração do ácido com precisão faz mais sentido usar a bureta e uma pipeta volumétrica.

Estes dois exemplos demonstram que, sabendo como calcular a incerteza, podemos pensar como melhor realizar os experimentos, decidindo investir, ou não, em recursos para aumentar a precisão da nossa análise. É importante entender que é relevante não só calcular a incerteza como compreender a incerteza.

MATERIAL SUPLEMENTAR

As demonstrações das equações da Tabela 2 (Parte 1), bem como das equações 40 e 41 (Parte 2) estão disponíveis em http://quimicanova.sbq.org.br, com acesso livre.

CONCLUSÃO

Só para ficar inequivocamente claro: é impossível realizar uma análise química que não tenha uma incerteza associada. Quem faz erra! Mas os químicos, e outros cientistas, têm uma arma poderosíssima à sua disposição, a equação de propagação de incerteza. O autor apela que a compreendam e a usem com discernimento na produção de ciência.

AGRADECIMENTOS

O autor agradece o apoio da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - Brasil (CAPES) e Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP - 2018/14425-7). O autor agradece também aos alunos do grupo de pesquisa que se disponibilizaram para rever o artigo.

REFERÊNCIAS

Datas de Publicação

  • Publicação nesta coleção
    18 Maio 2020
  • Data do Fascículo
    Fev 2020

Histórico

  • Recebido
    31 Jul 2019
  • Aceito
    07 Out 2019
  • Publicado
    14 Jan 2020
Sociedade Brasileira de Química Secretaria Executiva, Av. Prof. Lineu Prestes, 748 - bloco 3 - Superior, 05508-000 São Paulo SP - Brazil, C.P. 26.037 - 05599-970, Tel.: +55 11 3032.2299, Fax: +55 11 3814.3602 - São Paulo - SP - Brazil
E-mail: quimicanova@sbq.org.br