O ensaio clínico PROMISE foi apresentado em março no congresso do American College of Cardiology e simultaneamente publicado no New England Journal of Medicine. Passadas algumas semanas, começo a perceber interpretações equivocadas destes estudo, que nos serve de gancho para uma interessante discussão a respeito do que chamo de jogo das hipóteses científicas.
O PROMISE estudou 10.000 pacientes com indicação de pesquisa de doença coronária, randomizados para duas estratégias de investigação não invasiva: teste anatômico (tomografia de coronárias) ou funcional (teste ergométrico, cintilografia miocárdica ou eco-estresse). O objetivo foi avaliar a influência da estratégia de investigação nos desfechos cardiovasculares.
Não houve diferença alguma entre os dois grupos na incidência do desfecho primário (3.3% versus 3.0%). A despeito disso, estranhamente, muitos estão interpretando o resultado do PROMISE como indicativo de que a melhor estratégia é a avaliação funcional. Vejam nos exemplos abaixo, como há uma conotação negativa para a tomografia de coronária. Ou uma conotação positiva para testes funcionais.
UpToDate: A randomized trial compared coronary computed tomographic angiography (CCTA) and functional testing and clinical outcomes over a median follow-up of two years were similar for both groups. We continue to recommend functional testing as the initial test for most patients with suspected coronary artery disease.
The Heart: CT angiography does not reduce coronary events compared with functional tests.
A razão destes estranhas interpretações está no jogo das hipóteses. Mas antes de explicar o que ocorreu neste trabalho, vamos revisar os diferentes testes de hipóteses que se adequam a ensaios clínicos randomizados: superioridade unidirecional, superioridade bidirecional e não inferioridade. O uso de hipóteses inadequadas gera vieses cognitivos de interpretação do resultado, como veremos a seguir.
Os 3 Tipos de Hipóteses
A superioridade unidirecional é o tipo que estamos mais acostumados e se aplica quando precisamos demonstrar a eficácia de uma estratégia para que se justifique sua utilização. Esta eficácia diz respeito a duas situações: (1) uma conduta deve ser superior à ausência de conduta; (2) uma conduta nova deve ser superior a uma conduta antiga quando esta conduta antiga já teve sua eficácia anteriormente comprovada. Estas duas situações se diferenciam pelo grupo controle. No primeiro caso, o grupo controle é não fazer a conduta (placebo, sham ou controle aberto). No segundo caso, o grupo controle é a estratégia tradicional.
Embora o teste estatístico de comparação seja sempre bicaudal nesta situação, o ônus da prova é unidirecional, pois o único resultado que influencia nossa conduta médica é a superioridade da nova proposta.
Antes de indicar reposição para pessoas que tem vitamina D baixa, precisamos demonstrar que esta estratégia é eficaz clinicamente, comparada a placebo. Este é exemplo da ausência de estratégia como grupo controle. Por que eu faria vitamina D se esta não fosse superior a não fazer vitamina D? Percebam que o ônus da prova está na superioridade.
Já o estudo PARADIGM-HF pretendeu demonstrar que LCZ696 é melhor que enalapril na insuficiência cardíaca. É um exemplo de que no novo precisa se provar melhor do que o antigo que já foi comprovado no passado. É o que se chama de eficácia comparativa. Por que eu trocaria enalapril por esse tal de LCZ696 se este não fosse superior? Não há vantagens práticas desta nova droga, e provavelmente ela viria com um maior custo. Mesmo se tivesse um custo igual, o tradicional é comprovado há muitos anos, está dando certo e já somos experientes com enalapril. Então porque mudar? Não haveria porque mudar se o LCZ696 fosse apenas igual ao enalapril.
A segunda situação que discutiremos é da hipótese de não inferioridade. Esta se aplica quando já existe uma conduta tradicional comprovada e a nova proposta traz alguma vantagem prática (mais simples de usar, mais segura, menos traumática). Neste caso, a nova proposta não precisa ser mais eficaz do que a tradicional, só precisa não ser muito pior. Daí testamos sua não inferioridade. Vejam postagem antiga sobre este tipo de desenho.
É o caso de demonstrar que um novo anticoagulante (que não necessita de controle do TP) é não inferior ao cumarínico; demonstrar que o fondaparinux (que sangra menos) é não inferior à enoxaparina; ou a tentativa mal sucedida do recente trial BEST em demonstrar que intervenção coronária percutânea com stent everolimus (tratamento menos traumático) é não inferior à cirurgia de revascularização.
Por fim, temos uma situação menos frequente, que é a superioridade bidirecional, o caso do estudo PROMISE. Nesta situação, temos duas estratégias e não há uma grande preferência por uma delas. Ambas são não invasivas; se considerarmos o funcional mais utilizado, a cintilografia, ambas as estratégias oferecem ao paciente uma certa dose de radiação. Se por um lado a tomografia usa contraste, a cintilografia às vezes usa dipiridamol (que causa grande desconforto). E por aí vai, vantagens e desvantagens para os dois lados.
Do ponto de vista prático, há pacientes que se adequam melhor a uma estratégia, outros à outra estratégia. Mas se houver uma estratégia superior em eficácia, esta será a primeira opção independente de questões de ordem prática. E isso valerá para qualquer dos lados. O ônus da prova é bidirecional.
Aí vem o desvio de hipótese promovido pelo estudo PROMISE. Inadequadamente, os autores descreveram um objetivo unidirecional, "testar a hipótese de que o prognóstico de pacientes submetidos ao teste anatômico seria superior aos pacientes submetidos ao teste funcional". Não há razão para que o ônus da prova esteja na tomografia. Mas o desvio na descrição da hipótese gerou o fenômeno de ancoragem cognitiva na maioria dos leitores.
Ancoragem Cognitiva
Este fenômeno cognitivo foi primeiro demonstrado por Daniel Kanheman e Amos Tvesky, dois psicólogos israelenses que ganharam o prêmio Nobel por descreverem nosso principais vieses cognitivos. Em um de seus experimentos, Kanheman pergunta a um grupo de competentes corretores se eles acham que o valor de um certo imóvel avaliado é maior ou menor que 10 milhões de dólares. Após responderem, os voluntários recebem uma segunda pergunta: e quanto você acha que vale o imóvel? A média da resposta foi algo como 7 milhões. Em seguida, ele mostra o mesmo imóvel a um segundo grupo de competentes corretores, só que troca a primeira pergunta. Desta vez, pergunta se o apartamento vale mais ou menos que 1 milhão de dólares. Isto fez com que a média da resposta à segunda pergunta fosse 3 milhões. Percebam que a primeira pergunta induziu a resposta da segunda pergunta. A segunda pergunta foi “ancorada” pelo efeito da primeira pergunta.
Observem que especialistas em apartamento estavam na ilusão de que decidiam o preço baseado em sua experiência. Na verdade, morro de medo de pessoas que se acham muito experientes (especialistas), pois estas esquecem do benefício da dúvida e abrem a guardam para vieses cognitivos.
E foi isso que aconteceu com o estudo PROMISE. A hipótese colocou o ônus da prova na tomografia de coronária e no momento em que esta não conseguiu se provar melhor, a negatividade do resultado ancorou a tomografia para um status abaixo dos exames funcionais. Parece um erro primário cometido por especialistas que escrevem o UpToDate. Mas assim são os vieses cognitivos, nos influenciam de forma inconsciente. É por isso que o pensamento científico precisa ser organizado de uma maneira cuidadosa.
Se reconhecemos esta hipótese do PROMISE como bidirecional, podemos reformular a interpretação. Se nenhuma estratégia foi superior, temos a liberdade de escolher a que melhor se adeque ao paciente.
O PROMISE nos mostra que vieses não provém apenas da metodologia dos trabalhos. Às vezes, o viés está em nossa mente, de maneira involuntária. Tenho dito que o raciocínio científico deve ser permeado pela humildade em reconhecer a incerteza de nossas crenças. A segunda razão para humildade é reconhecer as armadilhas de nosso pensamento.