A criação do termo “significância estatística” foi um grande erro histórico. Não sei quem teve essa péssima ideia.
Significância vem do latim significans, que conota “valor”, “importância”. Quando testamos estatisticamente uma associação, não avaliamos a importância da associação, apenas sua veracidade. Nem podemos afirmar que uma associação “significante” é causal, muito menos a relevância dessa causalidade. Sendo assim, a significância estatística apenas sugere que seria muito inusitado que tal associação aparecesse por acaso, se a hipótese nula fosse verdadeira.
Para complicar, a mente humana funciona de forma mais categórica (sim ou não) do que quantitativa. Por exemplo, nos contentamos com a observação “este tratamento reduz a mortalidade”, e poucas vezes procuramos saber o quanto. Sendo assim, proponho que o termo “significância estatística” seja com urgência substituído por “validade estatística”.
Ao alcançar validade estatística, mostramos que um fenômeno é verdadeiro. O segundo passo, agora sim, seria avaliar a real significância (relevância) do fenômeno. Para isso precisamos avaliar o efeito relativo e absoluto. Neste artigo, revisaremos o significado e importâncias dessas medidas.
O TAMANHO DO EFEITO
A mente humana é mais afetiva do que quantitativa. O psicólogo laureado com o Nobel, Daniel Kahneman, descreveu o viés de afeto (affect bias), que é uma das causas de confundirmos risco com lesão, superestimarmos riscos pequenos e subestimarmos riscos altos. Aspectos relacionados à emoção (afeto) interferem em nossa percepção da realidade, como já dizia Immanuel Kant.
Temos mais medo de entrar em um avião do que de entrar no banheiro para tomar banho, apesar do risco de morte por queda no banheiro ser muito maior do que o risco de morte por queda do avião. Tememos mais febre amarela do que gripe, mesmo que o risco de morte por gripe seja muito maior do que morte por febre amarela.
Ao descrevermos um tratamento, normalmente não quantificamos o benefício intrínseco, apenas o qualificamos. Nos limitamos a dizer “este tratamento é benéfico” ou “este tratamento reduz mortalidade”. Sim, mas quanto reduz?
Ao faltarmos na quantificação, caímos no risco de supervalorizar tratamentos de moderado impacto ou subvalorizar tratamentos de alto impacto. E isso vem ligado à forma “afetiva” e não quantitativa de analisarmos as nossas condutas.
COMO MENSURAR O TAMANHO DO EFEITO?
A abordagem tradicional da medicina baseada em evidências enfatiza a redução absoluta do risco e o número necessário a tratar (NNT) como as principais medidas de tamanho de efeito, em detrimento da redução relativa do risco e do risco relativo.
É comum dizermos, “o relativo engana, o que vale é o absoluto”. Eu mesmo costumo usar o exemplo da herança. Se ganhei 50% da fortuna de um tio (relativo), posso dizer que fiquei rico? Parece muito, mas se a fortuna for 1 real, ganhei apenas 50 centavos. O que vale é o absoluto.
Porém isso é só uma parte da história. O relativo tem grande importância e é essencial para o pensamento médico. Na verdade, a redução absoluta do risco (com a qual calculamos o NNT – Number Needed to Treat) não é uma propriedade intrínseca do tratamento, é uma propriedade do paciente que recebe o tratamento. Para um mesmo tratamento, o NNT varia de paciente para paciente, a depender de seu risco basal. Podemos dizer, assim, que um tratamento não tem NNT, quem tem NNT é aquele tipo de paciente que receberá aquele tratamento.
Na verdade, a propriedade intrínseca do tratamento é a redução relativa do risco, que tende a ser constante nos diferentes subgrupos de risco. Análises de subgrupo usualmente não mostram interação entre risco basal e impacto relativo do tratamento.
Um tratamento de pequeno efeito (redução relativa do risco) pode proporcionar uma grande redução absoluta (pequeno NNT) se aplicado a uma população de altíssimo risco. Da mesma forma, um tratamento de grande efeito, pode ter uma pequena redução absoluta (RAR) se aplicado a uma população de baixo risco. Portanto, a redução relativa (RRR) mostra o tamanho do efeito intrínseco do tratamento, enquanto a redução absoluta mostra o impacto do tratamento em um certo tipo de paciente, com um certo tipo de risco basal. Podemos dizer que a RRR traduz o tamanho de efeito e a RAR, o impacto do tratamento. Por isso, devemos mensurar o tamanho do efeito intrínseco do tratamento pela redução relativa do risco, enquanto o NNT é o impacto concreto em um dado paciente.
Se tivéssemos a chance de saber apenas uma das informações a respeito de um tratamento, qual escolheríamos: a redução relativa ou redução absoluta?
A relativa, é claro. Pois sabendo a redução relativa, pode-se calcular a redução absoluta de cada paciente individualmente, desde que saibamos o risco absoluto do paciente.
Por exemplo, digamos que a redução relativa do risco é 33%. Com base em um escore de risco, estimamos 10% como risco basal do paciente. Assim, a redução absoluta do risco desse paciente é 33% x 10%=3,3% (NNT = 100/3,3=30).
Como referência para análise, os bons tratamentos apresentam uma redução relativa do risco em torno de 30 a 40%.
INIBIDOR DA ENZIMA CONVERSORA DE ANGIOTENSINA NA INSUFICIÊNCIA CARDÍACA (IECA)
É surpreendente notar que o IECA na insuficiência cardíaca é um tratamento de pequeno tamanho de efeito. De acordo com o ensaio clínico SOLVD11 Yusuf S, Pitt B, Davis CE, Hood WB, Cohn JN. Effect of enalapril on survival in patients with reduced left ventricular ejection fractions and congestive heart failure. SOLVD Investigators. N Engl J Med. 1991;325(5):293-302.,{Yusuf, 1991 #125} a redução relativa do risco do IECA é apenas 16% menor que a maioria dos tratamentos cardiológicos que funcionam. Quase ninguém se toca disso, porque a mortalidade da doença é alta, provocando um bom NNT. Este é um tratamento de pequeno efeito, mas de impacto razoável devido à gravidade dessa doença.
Se eu digo que a redução absoluta no SOLVD foi 4,5%, isso parece muito bom. No entanto, a figura muda bastante se, ao invés de dizer a redução absoluta, mostramos os números de cada grupo: no grupo placebo, a mortalidade foi 39,7% e isso reduziu para 35,2%. Percebam que esses dois números não são tão diferentes. Muita gente sem enalapril morre (um pouco mais que 1/3 dos pacientes), mas muita gente continua morrendo com enalapril (um pouco mais que 1/3 dos pacientes). Não muda muita coisa. Quando olhamos sob essa ótica, vemos que o tamanho do efeito do tratamento é pequeno.
Além disso, o intervalo de confiança da redução relativa do risco apresentado por esse estudo de moderado tamanho (2.500 pacientes) é amplo, vai de 5 a 20%. Portanto, esse tratamento pode oferecer uma redução relativa de risco tão baixa quanto 5%. Já o extremo superior do intervalo de confiança (20%) não é tão diferente do que a medida pontual de 16%. Na medida do tamanho do efeito, é importante observarmos a precisão da estimativa descrita pelo intervalo de confiança.
Não estou aqui querendo reduzir o valor desse importante tratamento na insuficiência cardíaca, até mesmo porque o IECA também ajuda no controle dos sintomas. Mas é importante termos a perspectiva do tamanho do efeito, ao lado da perspectiva do NNT.
Essa perspectiva reduz o affect bias a favor do inibidor da ECA, nos tornando mais “pé no chão” e permitindo uma melhor análise do trade-off risco-benefício. Ficaremos mais parcimoniosos quando diante de certos pacientes, como hipotensos (suscetíveis a síncope) ou com certo grau de disfunção renal. Sem angústia, insistiremos menos nas altas doses (que poderiam desencadear os episódios de síncope) quando pensarmos na panaceia de um tratamento.
É muito interessante revisitar esses dados do passado. Na mente cardiológica, o IECA é uma panaceia. Era 1988, quando eu estava no segundo ano de medicina e foi publicado o estudo CONSENSUS no New England Journal of Medicine22 CONSENSUS Trial Study Group. Effects of enalapril on mortality in severe congestive heart failure. Results of the Cooperative North Scandinavian Enalapril Survival Study (CONSENSUS). N Engl J Med. 1987;316(23):1429-35., ensaio clínico seminal como teste dessa hipótese, sempre citado como respaldo da eficácia do IECA na insuficiência cardíaca congestiva (ICC). Mas na verdade, este é um minúsculo estudo (apenas 253 pacientes), que foi interrompido precocemente com apenas 118 desfechos (truncado com menos de 200 desfechos é risco de imprecisão). Aquele estudo mostrava uma redução relativa de risco de 40%. Foi isso que ficou na mente afetiva dos cardiologistas.
Uma das melhores formas de reter o aprendizado é fazer com que ele ocorra acompanhado de emoção. Uma criança queimada por tocar em uma panela quente (trauma) vai aprender, com certeza, que panela pode queimar a mão. Quando o CONSENSUS foi publicado, a notícia da redução relativa do risco de 40% veio como tamanha novidade que, emocionados, retemos essa informação, que ficará para sempre impregnada em nossas mentes. Depois veio o SOLVD, estudo maior que mostrou um valor mais preciso de 16% de redução relativa do risco. Mas não foram os 16% (efeito pequeno) que ficaram em nossa memória afetiva, foram os 40% que emocionaram mais e emocionaram primeiro.
NOVOS ANTICOAGULANTES ORAIS
Há um equívoco do pensamento comum em relação a esses fármacos. Consideramos que sua maior vantagem está na praticidade de não precisar dos exames de tempo de protrombina. Normalmente, pensamos que os novos anticoagulantes orais possuem eficácia equivalente à tradicional e barata warfarina. Por isso, usualmente discutimos as duas opções com o paciente: um fármaco prático e de alto custo versus outro menos prático e de baixo custo.
Mas esse pensamento comum desconsidera um fato importante. A maior vantagem desses fármacos não está na praticidade, a maior vantagem está na superioridade de seu efeito em relação à warfarina. Na verdade, esses fármacos, quando usados em uma dose ótima, são muito melhores do que warfarina. Superioridade esta que é mais importante do que a tão mencionada praticidade.
Na verdade, é muito difícil mostrar superioridade de um tratamento novo em relação a um tratamento tradicional que é eficaz. E se o tratamento novo for melhor do que o tradicional, essa superioridade tende a ser de pequena monta. Diferentemente do habitual, os novos anticoagulantes são muito melhores do que warfarina. No estudo RELY33 Connolly SJ, Ezekowitz MD, Yusuf S, Eikelboom J, Oldgren J, Parekh A, et al. Dabigatran versus warfarin in patients with atrial fibrillation. N Engl J Med. 2009;361(12):1139-51., a dose de 150 mg de dabigatran promoveu uma redução relativa do risco de eventos embólicos de 34% em pacientes com fibrilação atrial, algo que fica no mesmo nível dos bons tratamentos comparados a placebo. Isso é quase sem precedentes na comparação de tratamento versus tratamento. Da mesma forma, o estudo ARISTOTLE44 Granger CB, Alexander JH, McMurray JJ, Lopes RD, Hylek EM, Hanna M, et al. Apixaban versus warfarin in patients with atrial fibrillation. N Engl J Med. 2011;365(11):981-92. mostra que a apixabana promove uma redução relativa de 21% quando comparado à warfarina.
O que quero dizer é que usar warfarina ao invés de um novo anticoagulante é o mesmo que optar por um tratamento pior. Portanto, colocar praticidade versus preço, como o trade-off principal desse tipo de decisão compartilhada, é um equívoco. O trade-off correto é eficácia versus preço, e de quebra, essa eficácia ainda vem com mais praticidade.
O enfoque principal da praticidade, em detrimento de evidente superioridade, é um exemplo de erro pela falta de perspectiva da redução relativa do risco.
A VISÃO DO PACIENTE
Este artigo revisou os principais conceitos sobre medidas de impacto. Para finalizar, devemos pensar que a medida mais relevante que existe é mais subjetiva e difícil de quantificar. A medida mais relevante da significância de uma conduta é a felicidade do paciente com o desfecho final. Não adianta demonstrar uma redução de risco se o paciente termina livre do desfecho, porém aprisionado em sua insatisfação.
Análises relativas e absolutas de risco não dão todas as respostas. Primeiro, elas são probabilísticas, não uma garantia. Segundo, a prevenção do desfecho indesejado pode ser mediada por uma conduta que traga desconforto, insatisfação ao paciente, se for de encontro com seus valores.
No final das contas, o mais relevante é que nossas recomendações sejam primariamente influenciadas pela preferência do paciente.
REFERENCES
-
1Yusuf S, Pitt B, Davis CE, Hood WB, Cohn JN. Effect of enalapril on survival in patients with reduced left ventricular ejection fractions and congestive heart failure. SOLVD Investigators. N Engl J Med. 1991;325(5):293-302.
-
2CONSENSUS Trial Study Group. Effects of enalapril on mortality in severe congestive heart failure. Results of the Cooperative North Scandinavian Enalapril Survival Study (CONSENSUS). N Engl J Med. 1987;316(23):1429-35.
-
3Connolly SJ, Ezekowitz MD, Yusuf S, Eikelboom J, Oldgren J, Parekh A, et al. Dabigatran versus warfarin in patients with atrial fibrillation. N Engl J Med. 2009;361(12):1139-51.
-
4Granger CB, Alexander JH, McMurray JJ, Lopes RD, Hylek EM, Hanna M, et al. Apixaban versus warfarin in patients with atrial fibrillation. N Engl J Med. 2011;365(11):981-92.
Datas de Publicação
-
Publicação nesta coleção
Oct-Dec 2018