Medicina Baseada em Evidências: maio 2017

sábado, 13 de maio de 2017

A verdadeira magnitude do efeito de um tratamento

* Da série "Tamanhos de Efeito"

A mente humana é mais afetiva do que quantitativa. O psicólogo laureado com o Nobel Daniel Kahneman descreveu o viés de afeto (affect bias), que é uma das causas de confundirmos risco com dano (postagem prévia), superestimarmos riscos pequenos e subestimarmos riscos altos. Aspectos relacionados a emoção (afeto) interferem em nossa percepção da realidade, como já dizia Immanuel Kant.

Temos mais medo de entrar em um avião do que de entrar no banheiro para tomar banho, apesar do risco de morte por queda no banheiro ser muito maior do que o risco de morte por queda do avião. Tememos mais febre amarela do que gripe, mesmo que o risco de morte por gripe seja muito maior do que morte por febre amarela. Eu mesmo já me vacinei contra febre amarela, mas contra gripe ainda não.

Ao descrevermos um tratamento, normalmente não quantificamos o benefício intrínseco, apenas o qualificamos. Nos limitamos a dizer “este tratamento é benéfico” ou “este tratamento reduz mortalidade”. Sim, mas quanto reduz?

Ao faltarmos na quantificação, caímos no risco de supervalorizar tratamentos de moderado impacto ou subvalorizar tratamentos de alto impacto. E isso vem ligado à forma “afetiva” e não quantitativa de analisarmos as nossas condutas.

Por este motivo, iniciaremos a série de postagens neste Blog denominada de “Tamanhos de Efeito”. Esta série trará exemplos de tratamentos e suas magnitudes de efeito.

Nesta postagem darei dois exemplos cardiológicos. Mas em futuras postagens, tentarei não me limitar ao coração e incentivo os colegas trazerem seus exemplos sob a forma de comentários neste Blog. Acho que será divertido perceber como nossa percepção do tamanho do efeito de um tratamento muitas vezes se distancia do que é apresentado pelas evidências. Não só divertido, este é um exercício necessário.

Como medir o tamanho do efeito?

A abordagem tradicional da medicina baseada em evidências enfatiza a redução absoluta do risco e o número necessário a tratar (NNT) como as principais medidas de tamanho de efeito, em detrimento da redução relativa do risco e do risco relativo.

É comum dizermos, “o relativo engana, o que vale é o absoluto.” Eu mesmo costumo usar o exemplo da herança. Se ganhei 50% da fortuna de um tio (relativo), posso dizer que fiquei rico? Parece muito, mas se a fortuna for 1 real, ganhei apenas 50 centavos. O que vale é o absoluto.

Porém isso é só uma parte da história. O relativo tem grande importância e é essencial para o pensamento médico. Na verdade, a redução absoluta do risco (com a qual calculamos o NNT) não é uma propriedade intrínseca do tratamento, é uma propriedade do paciente que recebe o tratamento. Para um mesmo tratamento, o NNT varia de paciente para paciente, a depender de seu risco basal. Podemos dizer assim, que um tratamento não tem NNT, quem tem NNT é aquele tipo de paciente que receberá aquele tratamento.

Na verdade, a propriedade intrínseca do tratamento é a redução relativa do risco, que tende a ser constante nos diferentes subgrupos de risco. Isto é demonstrado por análises de sensibilidade que usualmente não mostram interação entre risco basal e impacto relativo do tratamento.

Como já mencionamos neste Blog, um tratamento de pequeno efeito (redução relativa do risco) pode proporcionar uma grande redução absoluta (pequeno NNT) se aplicado a uma população de altíssimo risco. Da mesma forma, um tratamento de grande efeito, pode ter uma pequena redução absoluta se aplicado a uma população de baixo risco.

Portanto, a redução relativa mostra o tamanho do efeito intrínseco do tratamento, enquanto a redução absoluta mostra o impacto do tratamento em um certo tipo de paciente, com um certo tipo de risco basal.

RRR = tamanho de efeito

RAR = impacto do tratamento

Por isso, devemos mensurar o tamanho do efeito intrínseco do tratamento pela redução relativa do risco, enquanto o NNT é o impacto concreto em um dado paciente.

Se tivéssemos a chance de saber apenas uma das informações a respeito de um tratamento, qual escolheríamos: a redução relativa ou redução absoluta?

A relativa, é claro. Pois sabendo a redução relativa, a gente pode calcular a redução absoluta de cada paciente individualmente, desde que saibamos o risco absoluto do paciente.

Por exemplo, digamos que a redução relativa do risco é 33%. Com base em um escore de risco, estimamos 10% como risco basal do paciente. Assim, a redução absoluta do risco deste paciente é 33% x 10% = 3.3% (NNT = 100/3.3 = 30).

Como referência para análise, os bons tratamentos apresentam uma redução relativa do risco em torno de 30%-40%.

Inibidor da ECA na Insuficiência Cardíaca

É surpreendente notar que inibidor da ECA na insuficiência cardíaca é um tratamento de pequeno tamanho de efeito. De acordo com o ensaio clínico SOLVD, a redução relativa do risco do inibidor da ECA é apenas 16%, menor que a maioria dos tratamentos cardiológicos que funcionam. Quase ninguém se toca disso, porque a mortalidade da doença é alta, provocando um bom NNT. Este é um tratamento de pequeno efeito, mas de impacto razoável devido à gravidade dessa doença.

Foi neste momento que um aluno inteligente retrucou: “então o que importa mesmo é a redução absoluta, professor”. Nem tanto.

Observem que interessante. Se eu digo que a redução absoluta é no SOLVD foi 4.5%, isso parece muito bom. No entanto, a figura muda bastante se, ao invés de dizer a redução absoluta, mostramos os números de cada grupo: no grupo placebo, a mortalidade foi 39.7% e isso reduziu para 35.2%. Percebam que esses dois números não são tão diferentes. Muita gente sem enalapril morre (um pouco mais que 1/3 dos pacientes), mas muita gente continua morrendo com enalapril (um pouco mais que 1/3 dos pacientes). Não muda muita coisa. Quando olhamos sob esta ótica, vemos que o tamanho do efeito do tratamento é pequeno.

Além disso, o intervalo de confiança da redução relativa do risco apresentado por este estudo de moderado tamanho (2.500 pacientes) é amplo, vai de 5% a 20%. Portanto, este tratamento pode oferecer uma redução relativa de risco tão baixa quanto 5%. E o extremo superior do intervalo de confiança (20%) não é tão diferente do que a medida pontual de 16%. Na medida do tamanho do efeito, é importante observarmos a precisão da estimativa descrita pelo intervalo de confiança.

Não estou aqui querendo reduzir o valor deste importante tratamento na insuficiência cardíaca, até mesmo porque inibidor da ECA também ajuda no controle dos sintomas. Mas é importante termos a perspectiva do tamanho do efeito, ao lado da perspectiva do NNT.

Esta perspectiva reduz o affect bias a favor do inibidor da ECA, nos tornando mais “pé no chão” e permitindo uma melhor análise do trade-off risco-benefício. Ficaremos mais parcimoniosos quando diante de certos pacientes, como hipotensos desmaiadores ou com certo grau de disfunção renal. Sem angústia, insistiremos menos nas altas doses sincopantes que procuramos alcançar quando pensamos na panaceia de um tratamento.

É muito interessante revisitar estes dados do passado. Na mente cardiológica, inibidor de ECA é uma panacéia. Era 1988, quando eu estava no segundo ano de medicina, foi publicado o estudo CONSENSUS no New England Journal of Medicine, ensaio clínico seminal como teste dessa hipótese, sempre citado como respaldo da eficácia do inibidor da ECA na ICC. Mas na verdade, este é um minúsculo estudo (apenas 253 pacientes), que foi interrompido precocemente com apenas 118 desfechos (truncado com menos de 200 desfechos é risco de imprecisão). Aquele estudo mostrava uma redução relativa de risco de 40%. E isso que ficou na mente afetiva dos cardiologistas.

Uma das melhores formas de reter o aprendizado é fazer com que este ocorra acompanhado de emoção. Uma criança queimada por tocar em uma panela quente (trauma) vai aprender com certeza que panela pode queimar a mão. Quando o CONSENSUS foi publicado, a notícia da redução relativa do risco de 40% veio como tamanha novidade que, emocionados, retemos essa informação, que ficará para sempre impregnada em nossas mentes. Depois veio o SOLVD, estudo maior que mostrou um valor mais preciso de 16% de redução relativa do risco. Mas não foram os 16% (efeito pequeno) que ficaram em nossa memória afetiva, foram os 40% que emocionaram mais e emocionaram primeiro.

Novos Anticoagulantes Orais

Há um equívoco do pensamento comum em relação a estas drogas. Consideramos que sua maior vantagem está na praticidade. Normalmente, pensamos que os novos anticoagulantes orais possuem eficácia equivalente à tradicional e barata warfarina. Por isso, usualmente discutimos as duas opções com o paciente: uma droga prática e cara versus uma menos prática e barata.

Mas este pensamento comum desconsidera um fato importante. A maior vantagem destas drogas não está na praticidade, a maior vantagem está na superioridade de seu efeito em relação à warfarina. Na verdade, estas drogas, quando usadas em uma dose ótima são muito melhores do que warfarina. Superioridade esta que é mais importante do que a tão mencionada praticidade.

Na verdade, é muito difícil mostrar superioridade de um tratamento novo em relação a um tratamento tradicional que é eficaz. E se o tratamento novo for melhor do que o tradicional, esta superioridade tende a ser de pequena monta. Diferentemente do habitual, os novos anticoagulantes são muito melhores do que warfarina. No estudo RELY, a dose de 150 mg de Dabigatran promoveu uma redução relativa do risco de eventos embólicos de 34% em pacientes com fibrilação atrial, algo que fica no mesmo nível dos bons tratamentos comparados a placebo. Isto é quase sem precedentes na comparação de tratamento versus tratamento. Da mesma forma, o estudo ARISTOTLE mostra que a apixabana promove uma redução relativa de 21% quando comparado a warfarina.

(OBS: sem querer me aprofundar nestas comparações, a rivaroxabana deve ser tão boa quanto os outros, mas foi boicotada pelo injustificada posologia de uma vez ao dia, o que deve ter amputado parte de seu efeito. Por isso, a rivaroxabana se mostrou apenas não inferior à warfarina no estudo ROCKET. O que quero dizer é que provavelmente essas drogas todas são parecidas e se forem usadas em dose adequada terão superioridade em relação à warfarina de magnitude bem razoável. Mas o objetivo dessa postagem não é ficar nessa boba comparação entre os novos anticoagulantes orais).

O que quero dizer é que usar warfarina ao invés de um novo anticoagulante é o mesmo que optar por um tratamento pior. Portanto, colocar praticidade versus preço como o trade-off principal deste tipo de decisão compartilhada é um equívoco. O trade-off correto é eficácia versus preço, e de quebra essa eficácia ainda vem com mais praticidade.

E fica fácil entender porque estas drogas são melhores que warfarina. A warfarina tem um efeito muito variável e imprevisível. No mundo ideal dos ensaios clínicos boa parte dos pacientes não está em faixa terapêutica. Imaginem no mundo real. Se os novos anticoagulantes são mais eficazes que warfarina, a diferença de efetividade (mundo real) tende a ser até maior.

O enfoque principal da praticidade, em detrimento de evidente superioridade, é um exemplo de erro pela falta de perspectiva da redução relativa do risco.

Tá vendo, não só falo mal das coisas. A propósito, ao falar bem, preciso declarar ausência de qualquer vinculação com as indústrias que produzem estas drogas. Apenas estou olhando os números e evitando o viés de afeição.

_______________________________________________________________________

Conheça o nosso curso de MBE, clicando em Curso Online de Medicina Baseada em Evidências.

segunda-feira, 1 de maio de 2017

Quando o estudo é uma profecia auto-realizável (Compare-Acute)

Imaginem que sorteamos 500 cortes de cabelo para uma população de 1.000 mulheres. Depois acompanhamos estas mulheres por um certo período e observamos que as que não foram sorteadas para cortes cabelo têm maior probabilidade de irem no salão de beleza para cortar cabelo quando comparadas às mulheres que já tinham cortado o cabelo inicialmente. Em conclusão, corte de cabelo previne corte de cabelo subsequente.

Nada mais óbvio do que isso, não haveria sentido em fazer este estudo, pois seria uma profecia auto-realizável (tradução de self-fulfilling prophecy, termo comum na língua inglesa).

Chamo de profecia auto-realizável pois o próprio experimento para testar a hipótese faz da hipótese verdadeira.

Agora imaginem que sorteamos 885 pacientes com obstrução coronária para fazer angioplastia ou não fazer angioplastia. Depois acompanhamos estes pacientes por um certo período e observamos que os que não foram sorteados para angioplastia tinham maior probabilidade de irem no hospital para fazer uma angioplastia quando comparados aos pacientes que já tinham feito angioplastia inicialmente. Em conclusão, angioplastia previne angioplastia subsequente.

Nada mais óbvio do que isso, não haveria sentido em fazer este estudo, pois seria uma profecia auto-realizável.

Mas fizeram e este é o ensaio clínico Compare-Acute, apresentado como late-breaking clinical trial no recente congresso do American College of Cardiology e publicado no New England Journal of Medicine.

A chave para identificar este tipo de viés está na análise do desfecho: quando o desfecho é o mesmo da intervenção, ocorre a profecia auto-realizável. Neste estudo a intervenção é angioplastia e o desfecho é angioplastia.

Mas porque percebemos a obviedade da primeira hipótese testada (corte de cabelo) e não percebemos o mesmo na segunda hipótese (angioplastia)? Isto ocorre pois o segundo caso se travestiu de um estudo científico, testando uma hipótese clínica que vem sendo tema de debate intenso. Temos o hábito de analisar criticamente a qualidade metodológica do estudo, mas não temos o hábito de analisar criticamente a qualidade da hipótese do estudo.

Isso não está nem mesmo no algoritmo de critical appraisal típico da medicina baseada em evidências. Mas deveria estar: a primeira coisa a fazer é identificar a hipótese e analisar se esta merecia ter sido testada. A hipótese pode não merecer ser testada quando estamos nos extremos de plausibilidade (obviamente verdadeira ou obviamente falsa).

Quando é obviamente falsa, o resultado negativo não acrescenta nada (pois já sabemos) e o resultado positivo também não, pois a valor preditivo positivo do estudo será pequeno (probabilidade condicional (vejam última postagem).

Quando é obviamente verdadeira (o caso desta postagem), o resultado positivo do estudo (que não precisava ter sido realizado) cria uma falsa impressão de que descobrimos algo novo e isto induz médicos a adotarem o tratamento com base no resultado do estudo (medicina copiada de artigo) e não com base no conhecimento (que já se tinha) alinhado ao julgamento clínico. Um estudo positivo (mesmo que óbvio) funciona como um motivador para a adoção de uma conduta. Resultado do estudo garantido, impacto do resultado garantido.

Ensaio Clínico Compare-Acute

Vamos descrever este ensaio clínico randomizado utilizando o acrônimo PICO:

População: multi-arteriais submetidos a angioplastia primária da artéria culpada pelo infarto.

Intervenção: angioplastia das artérias não culpadas, mas que tinham obstruções hemodinamicamente importantes (testadas por FFR).

Controle: não realizar angioplastia das outras artérias.

Outcome (desfecho primário): Combinados de morte, infarto, qualquer revascularização e AVC em seguimento de 12 meses.

Ora, já sabemos de forma reprodutível (mesmo resultado em vários estudos) que angioplastia de placa não envolvida com síndrome coronariana aguda não reduz morte, não reduz infarto e não tem porque reduzir (nem causar, muito raro) AVC. O estudo FAME-2, publicado há alguns anos e que também usou fractional flow reserve (FFR) para escolher as obstruções significativas, não mostrou impacto algum na redução destes desfechos maiores.

Sim, sei que estes estudos prévios não foram feitos no cenário de infarto com supradesnível de ST, mas lembro que experimentos (ensaios clínicos) servem para testar conceitos (princípio da prova do conceito) e não testar cenários (princípio da complacência). Um placa não culpada em um paciente infartado está muito mais para uma placa de um paciente estável do que para a placa culpada do paciente infartado.

Desta forma, já era bastante previsível que o estudo seria negativo quanto aos desfechos maiores e óbvio que seria positivo quanto ao desfecho revascularização. Esta é uma demonstração que podemos, se quisermos, desenhar estudos com garantia de resultado positivo. É só usar profecias auto-realizáveis.

Resultado: o grupo intervenção apresentou menor incidência do desfecho primário, basicamente à custa do desfecho angioplastia, que é o mesmo da intervenção.

Conclusão: este é um estudo do tipo “salão de beleza”.

Imaginem que um grupo de pacientes teve infarto de parede anterior e foram submetidos a angioplastia primária da artéria DA, porém também tinham lesão de 70% na CD. Um grupo desses pacientes fazem angioplastia da CD no mesmo dia da angioplastia primária e o outro grupo não faz angioplastia da CD. Todos recebem alta. É claro que o grupo que não fez angioplastia da CD terá maior frequência de angioplastia da CD do que grupo que já fez angioplastia da CD, simplesmente porque o primeiro grupo terá mais artérias CD com lesão para serem angioplastadas do que o primeiro grupo. A disponibilidade de artérias para serem angioplastadas é maior em um grupo do que no outro grupo.

Desfecho do Tipo Criado pelo Médico

Mas há outra razão para a profecia se realizar. É importante entender que “revascularização” é um tipo de desfecho que é “criado pelo médico”. Diferente de morte, infarto e AVC, que são coisas que ocorrem espontaneamente, como consequência da doença do paciente, o desfecho revascularização passa pela cognição do médico para que ocorra.

Em um ensaio clínico randomizado, a decisão é tirada do domínio do médico. Quem decide é o sorteio. Isso gera uma inevitável sensação de impotência, um desconforto em não poder fazer o que o médico acha melhor para seu paciente. Naturalmente, este estudo é aberto, pois seria difícil e questionável deixar o médico sem saber se seu paciente fez ou não fez angioplastia.

Desta forma, a decisão é tirada do médico e o médico sabe qual foi a decisão do sorteio. Se a decisão do sorteio foi contrária à preferência do médico, ao longo dos 12 meses de seguimento, o médico terá uma tendência a corrigir essa “distorção”. Como ele ou ela corrigiria esta distorção (de forma muitas vezes inconsciente)?

Sintomas discretos e subjetivos (que normalmente seriam relevados) passam a ser supervalorizados como forma de justificar a intervenção; testes isquêmicos são solicitados e quando positivos promovem a intervenção, mesmo no paciente assintomático (reflexo óculo-isquêmico.); ou simplesmente o médico reinterna o paciente para fazer o procedimento.

Este último mecanismo parece uma violação, mas correspondeu a 1/3 das revascularizações realizadas no grupo randomizado para não fazer a angioplastia das artérias não culpadas pelo infarto. Isto está descrito no suplemento do artigo, onde há uma tabela que descreve os motivos das revascularizações. Eles chamaram de “angiography (no angina ou ischemia)”, denotando que o médico pediu uma angiografia coronária no paciente sem angina ou teste isquêmico e isso foi motivo de 33% das revascularizações.

Em estudo abertos, devemos evitar desfechos “criados pelo médico”, pois eles são enviesados pelo mecanismo de correção da distorção preferência-sorteio.

Quando entramos no mundo real, a decisão não é por sorteio. Sendo assim, o médico estará mais confortável com uma eventual decisão de não abordar as demais artérias. E quando preferência coincide com a decisão, o curso clínico tende a ser melhor. Sendo assim, podemos imaginar que a efetividade (mundo real) da conduta conservadora é melhor do que sua a eficácia (mundo dos ensaios clínicos). Artérias escolhidas pelo médico para não serem abordadas tendem a ser menos abordadas no futuro do que artérias escolhidas pelo sorteio para não serem abordadas.

A Decisão Clínica

Saliento que este trabalho não testou a eficácia da realização do FFR na escolha das artérias para serem abordadas. Todos os pacientes do grupo intervenção fizeram FFR, portanto o estudo não compara intervenção guiada por FFR versus intervenção guiada pela angiografia. Ou seja, o estudo não indica necessariamente o uso de FFR na rotina para testar placas não culpadas.

Outra questão é que o FFR não obrigatoriamente torna o grupo intervenção mais parcimonioso. Como parte do protocolo, um paciente com lesão não culpada de 50% faria um FFR, que se positivo implicaria em abordagem dessa artéria. Uma típica situação de reflexo óculo-isquêmico (uso inadequado de um falso paradigma isquêmico para induzir procedimentos - veja postagem prévia).

A análise da profecia auto-realizável não quer dizer que não devemos abordar as artérias não culpadas. Também não quer dizer que devemos abordar. Mais uma vez, se aplica o jargão da individualização, norteada por evidências já bastante conhecidas de que (1) angioplastia reduz sintomas e (2) angioplastia de placa estável não reduz infarto ou morte.

Devemos considerar a abordagem das demais artérias (no mesmo internamento ou no mesmo procedimento) em duas situações principais: (1) se o paciente tem angina crônica que culminou no infarto, temos tendência a fazer revascularização completa, pois o procedimento tende a ser benéfico no controle deste sintoma crônico; (2) quando o grau de obstrução da artéria não culpada é crítico demais fica evidente que não deixaremos a lesão sem ser abordada, pois o dado anatômico é fortemente sugestivo de um curso clínico indesejado (aqui me refiro a apenas a lesões extremas, sub-oclusivas, tipo 99%, um fio de cabelo ou ponta de lápis).

Na ausência destas circunstâncias e observando que a abordagem mais agressiva não reduz infarto ou morte, não há justificativa em sair desentupindo tudo, pois se não traz benefício, resta apenas o custo do procedimento, representado pelos eventos adversos que podem advir.

O conceito de consequência não intencional está no cerne da atitude parcimoniosa quando há incerteza do benefício de uma conduta. Para cada consequência intencional (benefício esperado) de um ato médico há uma infinidade de potenciais consequências não intencionais (eventos adversos inesperados). É 1 consequência concorrendo com uma infinidade de consequências imprevisíveis, fazendo com que a probabilidade de um evento adverso seja maior do que a probabilidade do benefício.

Por este motivo, deve haver uma probabilidade (evidência) razoável do benefício para compensar o maior número de consequências não intencionais concorrendo com 1 consequência intencional. Este é o pensamento que baseia não realizar atos fúteis, mesmo que estes não aumentem o risco do desfecho principal.

Conclusão

A discussão aqui apresentada mostra um resultado positivo no desfecho que tem dois componentes: um componente verdadeiro e um componente falso. O primeiro componente, o verdadeiro, depende do fenômeno de maior disponibilidade de artérias entupidas a serem angioplastias (óbvio, portanto não traz uma informação nova para mudar conduta). O segundo componente é falso, pois é mediado pelo viés correção da distorção preferência-sorteio, que ocorre em um ensaio clínico aberto, mas não ocorrerá na prática do mundo real.

Devemos estar atentos quando a profecias auto-realizáveis pois elas podem parecer como uma novidade a influenciar nossa conduta. E a chave para identificar esse problema é procurar por situações onde o desfecho é o mesmo da intervenção.
_______________________________________________________________________

Objetivos Didáticos desta Postagem:

- Desfechos de resultado garantido.
- Mecanismo de correção da distorção preferência-sorteio.

_______________________________________________________________________

Conheça o nosso curso de MBE, clicando em Curso Online de Medicina Baseada em Evidências.