quarta-feira, 27 de janeiro de 2010

Quando Pequenos Ensaios Clínicos São Positivos

Esta semana foi publicado no JAMA um pequeno ensaio clínico randomizado (N = 500) que não confirmou a idéia de que um controle rigoroso da glicemia beneficia pacientes em choque séptico, mesmo que estes estejam usando corticóide. Embora esse seja um estudo pequeno, está de acordo com as últimas evidências a respeito do assunto e nos traz a reflexão que não podemos nos precipitar em relação a adoção de terapias sem evidências adequadas. Vale apena relembrar essa história.

Tudo começou com a plausibilidade do benefício do tratamento agressivo da hiperglicemia. Esta plausibilidade vem de estudos observacionais indicando que quanto maior a glicemia de pacientes críticos, maior a mortalidade. Aí vem o raciocínio teleológico: se glicemia alta está associada a mortalidade, quanto mais reduzirmos a glicemia, mais reduziremos a mortalidade. Inclusive alguns cardiologistas sugerem este tipo de tratamento no infarto apenas baseado no dado prognóstico da glicemia. Pura extrapolação.

Corroborando com o plausível, em 2001 foi publicado por Van den Berghe et al no NEJM um ensaio clínico randomizado, com 1500 pacientes sob ventilação mecânica. Este estudo mostrou redução de mortalidade com o tratamento agressivo da glicemia comparado ao tratamento convencional (P menor que 0.05). Daí veio um grande entusiasmo, fazendo com que a prescrição de tratamento agressivo se alastrasse pelas UTIs do mundo afora. O problema é que 5 anos depois outro estudo do NEJM, realizado pelos mesmos autores, não mostrou este benefício em pacientes admitidos em UTI, deixando a questão em aberto. Apesar disso, o tratamento continuou se alastrando. Porém no ano passado foi publicado o estudo NICE-SUGAR, que não só negou o benefício desta terapia, mas também mostrou (pasmem) aumento de mortalidade, à custa de eventos cardiovasculares.

Então precisamos entender melhor porque um estudo de 1500 pacientes, com valor de P menor que 0.05 não estava certo. Geralmente se pensa: um pequeno tamanho amostral reduz a capacidade de detectar diferença, mas quando a diferença é detectada a despeito do tamanho amostral, ela é verdadeira. Mas a segunda parte deste pensamento está errada, e daí vem mensagem principal desta discussão:

Quando não há poder estatístico adequado para se encontrar uma diferença plausível, é necessário que uma diferença além do plausível ocorra para se obter um resultado estatisticamente significante. Por isso que quando um pequeno ensaio clínico mostra P menor que 0.05 a despeito de poder estatístico insuficiente, a probabilidade de o resultado ser devido ao acaso pode ser maior do que mostra o valor de P (pois a diferença não é plausível).
A possibilidade de erro fica mais alta ainda quando o estudo é interrompido precocemente (quando se alcança significância estatística em análise interina), pois a significância pode ter sido momentânea/casual e seria corrigida com o progredir do estudo.
Foram estes dois fenômenos que ocorreram no primeiro estudo do NEJM, de resultado falso-positivo. Este estudo tinha sido planejado para se detectar uma diferença absoluta de 2% entre os grupos, o que se considerava plausível. Para isso seriam necessários 2500 pacientes. No entanto, o estudo foi interrompido com 1500 pacientes quando se alcançou uma diferença estatística com 3.6% de diferença, algo talvez acima do plausível para uma terapia que não trata a causa da doença, apenas reduz o teor de glicose no sangue.

Em resumo, um estudo de poder estatístico insuficiente não deve ser considerado uma evidência definitiva mesmo se o resultado for estatisticamente significante. Principalmente se o resultado for proveniente de uma análise interina, que interrompeu o estudo precocemente.
O estudo publicado esta semana no JAMA é mais uma evidência de que o primeiro estudo de Van den Berghe et al estava errado, mesmo com P de 0.04.

Um comentário:

  1. Postagem muito boa! Faz um link bastante interessante com o texto sobre o Champix onde ocorre justamente o contrário, mostrando que uma metodologia bem feita é fundamental para se encontrar evidências científicas congruentes. Para nos, estudantes, que durante a graduação achamos que quantidade é qualidade, esse é um bom exemplo de como uma metodologia bem trabalhada e aplicada geram evidências confiáveis. (Isso me fez lembrar da história da Rosiglitazona e o aumento de risco cardiovascular...)

    ResponderExcluir