Um grande congresso médico, de uma grande especialidade, tem o valor de apresentar um mosaico de highlights científicos, que serve de amostra de conveniência para descrever a (ir) racionalidade de um ecossistema que se propõe a trabalhar na interface entre ciência e medicina. Com esse objetivo, analisarei em uma só postagem os cinco ensaios clínicos randomizados apresentados há 1 mês no Congresso Europeu de Cardiologia e que foram publicados simultaneamente no NEJM.
No texto, mostrarei a diferença entre “novidade” e “inovação”, parafraseando um de meus preferidos Western ao utilizar os adjetivos “the good, the bad and the ugly” para caracterizar estes trabalhos.
O conteúdo deste texto foi tema de recente Podcast, que intitulei o Circo Europeu da Cardiologia. Decidi trazer a discussão para formato de texto, pois as análises contém uma certa densidade, que faz necessário reflexão entre os parágrafos. Ao aguçar os ouvidos na escuta das entrelinhas dos estudos, passamos a ouvir a música como se fosse clássica, diferente do rock’n’roll de aspecto circense que grandes congressos assumem nos dias atuais. Para aquecer a mente antes da leitura, ouçam o vídeo da música composta pelo genial Ennio Morricone para o filme de Sérgio Leone, tocada pela Orquestra Sinfônica Dinamarquesa.
Esta abordagem não tem o intuito de crítica pessoal a pesquisadores, nem ao meio cardiológico. Representa uma tentativa de retratar bom e o ruim do que hoje generalizamos como “ciência”.
“The Good”: Uma Elegante Prova de Conceito (LoDoCo2 Trial)
Um trial com nome de brinquedo, LoDoCo. Mas não é brincadeira, pois a elegância deste estudo está na prova do conceito de causalidade: o benefício da terapia anti-inflamatória na redução de eventos cardiovasculares nos proporciona a via final da comprovação da causalidade, pelo princípio da reversão. Se não podíamos randomizar pacientes para se inflamar ou não inflamar, foi possível randomizar para desinflamar ou não, demonstrando-se a associação entre desinflamação e redução de consequências da doença aterosclerótica.
Essa teoria inflamatória nasceu de forma deselegante, pois sem reconhecer a incerteza das evidências à época, tornou-se protagonista de aulas, livros textos, artigos de revisão. Virou moda falar em teoria inflamatória. Inicialmente se pensou que a inflamação poderia decorrer de infecção da placa aterosclerótica, porém ensaios clínico com antibióticos foram negativos, falhando em demonstrar reversão. Mas a teoria renasceu pela percepção de que estatinas promoviam redução de marcadores inflamatórios, embora fosse impossível separar este efeito da redução do colesterol. Explorou-se este efeito das estatinas como se fosse uma comprovação da teoria inflamatória.
Até que começaram a surgir ensaios clínicos de tratamentos anti-inflamatórios que não possuem efeito redutor de colesterol. O primeiro foi o CANTOS trial, ensaio clínico publicado em 2017, que estudou 10.000 pacientes pós infarto, mostrando redução relativa do risco de eventos cardiovasculares de 15% com canakinumab comparado a placebo. Era apenas um estudo e eu pensava se a probabilidade pré-teste dessa hipótese (probabilidade ≠ plausibilidade) era suficiente para considerar apenas este como confirmatório da hipótese inflamatória. Fiquei inquieto naquela época, pensei em escrever no Blog, mas acabei por deixar para depois, visto que eu não sentia um valor preditivo positivo suficiente. Para minha surpresa, foi publicado no ano passado o COLCOT trial, estudo de 4700 pacientes pós-infarto, que usou um antigo e fora da moda anti-inflamatório, colchicina, promovendo 23% de redução relativa do hazard de eventos cardiovasculares. Parecia bom demais para ser verdade.
Neste congresso europeu, apresenta-se e publica-se o que na minha opinião é um trabalho digno de reconhecimento. Para mim, o mais impactante trabalho apresentado nesse congresso, LoDoCo II, a confirmação final da hipótese inflamatória: 5.500 pacientes com doença coronária crônica, reproduzindo o resultado positivo do primeiro estudo e demonstrando 31% de redução relativa do risco, uma magnitude de efeito semelhante ao uso de estatinas.
Duas mensagens. A primeira, ciência é a construção cumulativa de um conjunto de evidências, até consideramos o conhecimento comprovado. Um evidência confirmatória nem sempre é um descoberta inédita. Já vinha uma tendência. Boa ciência não é feita de “novidades”, mas sim de confirmações.
Segundo, para consideramos que um ensaio clínico é uma prova conceitual, a intervenção deve representar um efeito único, que não se confunde com outras ações do tratamento. Estatinas reduzem colesterol, por isso não provam o conceito anti-inflamatório. No presente caso, colchicina é basicamente um anti-inflamatório.
Temos uma prova de conceito, reprodutível, que promove uma fácil e barata solução pragmática: colchicina, se tolerada (15% dos pacientes não toleram), agrega valor preventivo em doença cardiovascular. Provado isso, a tecnologia vai tratar de fabricar anti-inflamatórios mais toleráveis.
Um exemplo de pragmatismo baseado em conceito científico.
“The Bad”: Deselegante Pragmatismo sem Conceito (EMPEROR-Reduced Trial)
Highlight espetacular do congresso, estudo com nome de emperador, mas sem a grandeza de um império.
EMPEROR-REDUCED Trial foi tema de postagem recente neste Blog. Trata-se do segundo estudo a demonstrar glifozinas como uma classe de droga eficaz no tratamento da insuficiência cardíaca, independente do paciente ser diabético. Proposta de uso de um anti-diabético para tratar insuficiência cardíaca, independente de diabetes.
O primeiro estudo a demonstrar este resultado fora o DAPA-HF. São estudos similares em métodos, populações e resultados.
Não quero entrar em detalhes de pequenas diferenças. O que importa é que, em ambos os estudos, a hipótese nula foi rejeitada: a terapia foi positiva no desfecho primário, que conota “benefício cardiovascular”. Defendo portanto a conclusão pragmática deste estudo.
No entanto, este pragmatismo é insuficiente para gerar recomendação sólida. Falta o conceito científico.
É um exemplo de “falácia conceitual”, quando um resultado pragmático não têm um conceito por trás. O motivo: essas são drogas diuréticas. E estímulo a diurese é um tratamento usado universalmente para insuficiência cardíaca aguda ou crônica, com base em plausibilidade extrema (sem evidências empíricas, que nunca poderão existir). Estas drogas tem significativo efeito diurético. Portanto, qual o conceito demonstrado:
Pacientes aparentemente compensados da IC merecem um pouco mais de diurético? Ou estas drogas oferecem um efeito independente do diurético? São perguntas importantes, precisamos aguçar nossa curiosidade, pois ambas as hipóteses podem ter reflexos práticos bem interessantes.
Observem a diferença com o exemplo acima citado, do anti-inflamatório, cujo tratamento testado não tem um efeito colateral confundidor.
A curiosidade em relação a esta pergunta é ofuscada pelo entusiasmo da novidade. A falta de curiosidade é digna de nota, quando esta é substituída por argumentos mecanicistas ou baseados em análises secundárias, contrariando o que o primeiro médico baseado em evidências, Sextus Empiricus, propôs no século II DC, ou seja, o teste empírico das ideias.
Para responder essa pergunta haveria necessidade de um segundo grupo controle, caracterizado um aprimoramento diurético. Se glifozina reduzisse desfecho além do diurético, estaria, aí sim, demonstrado um conceito intrínseco desta classe de drogas.
Se não, ficaria comprovada uma simples, relevante e interessante hipótese: diurese é um tratamento tão bom que há benefício de uma dose extra para pacientes aparentemente compensados com mediana de NT-proBNP = 1800 pg/ml.
Não desejo negar a importância destes estudos. Mas ciência se faz pelo conjunto das partes. Ainda falta uma parte complementar essencial para a compreensão do valor deste tratamento específico.
E por enquanto, qual a conduta pragmática. Podemos pensar em algumas alternativas, mais liberais ou restritivas. Minha proposta é apenas que o pensamento contenha a base da racionalidade conceitual.
“The Ugly”: Falácia da Novidade (EAST-AFNET 4 Trial)
Um trial com cara de novidade. Uma pseudonovidade. A positivação de uma ideia antes negativa de acordo com estudos prévios de superior nível de evidência. O novo seduz, mesmo que de pior qualidade do que o antigo.
Embora o conceito da restauração do ritmo sinusal seja um dos mais plausíveis que existem em cardiologia, sucessivos ensaios clínicos falharam em comprovar este conceito. Os estudos prévios foram razoáveis tentativas que falharam em provar o conceito. Primeiro, o AFFIRM testou manutenção do sinusal pelo uso de drogas. Falhou em rejeitar a hipótese nula em suas análise primárias. Surgiu depois a tentativa de testar o conceito por uma maneira mais efetiva de manter o ritmo sinusal, a ablação. Expectativa frustrada: o estudo CABANA foi negativo.
Embora provar inexistência seja impossível, a cada estudo negativo a existência fica menos provável. Nunca poderemos dizer que a restauração do ritmo sinusal foi provada ineficaz. Mas devemos reconhecer que criticar as tentativas frustradas não valida a hipótese que não foi comprovada.
Surge então um novo ensaio clínico randomizado, que demonstra hazard de 3.9/pessoas-ano do grupo controle do ritmo versus 5.0/100 pessoas-ano no grupo controle da frequência (P = 0.005).
“Conseguimos finalmente provar, descobrir a verdade”. Mas que verdade?
A perspectiva de ganho cumulativo de conhecimento se perde na falácia da novidade, quando esquecemos evidências prévias e abraçamos a novidade positiva.
Este é um excelente exemplo de viés de confirmação: cegueira às limitações do pior estudo EAST-AFNET 4 Trial (positivo) e crítica ao melhor estudo CABANA (negativo).
Enquanto os estudos prévios utilizaram componentes objetivos no desfecho primário (morte ou AVC), o presente estudo utilizou um combinado de desfechos que incluiu internamento por insuficiência cardíaca ou por síndrome coronariana aguda. Estes são desfechos subjetivos e “criados pelo pensamento médico” (internamento), que quando colocados em um estudo aberto gera um devastador viés de aferição do desfecho. Em estudos abertos é essencial que os desfechos sejam invulneráveis à interpretação ou indução médica. A percepção que um pacientes em controle de ritmo está melhor cuidado gera alto risco de viés.
Além da análise do desenho do estudo (métodos), a avaliação dos números absolutos (resultado) pode nos dar boas pistas de que a aparente eficácia é mediada por vieses. Para isso servem desfechos secundários, para avaliar se os primários fazem sentido.
Há um desfecho secundário que é a manutenção de ritmo sinusal ao longo do estudo. Esta diferença foi de apenas 21% entre os grupos, ou 234 pacientes a mais em ritmo sinusal no grupo controle de ritmo. Como isso poderia ser suficiente para promover um benefício clínico demonstrado no estudo? Isso teria prevenido 67 desfechos, que foi o número excedente de eventos no grupo controle. Apenas 3 pacientes com sucesso na reversão para ritmo sinusal promoveria uma redução de 1 desfecho. Seria um NNT = 3 para o sucesso do ritmo sinusal.
Vale salientar que nos estudos prévios, essa diferença de ritmo sinusal foi maior entre os grupos. Como o estudo em que o gradiente de sinusal foi menor é o único positivo? Provavelmente o resultado é decorrente de viés de aferição.
Por fim, o estudo testa segurança com base em um desfecho que mistura eficácia e segurança. Esta é uma forma de diluir o desfecho composto com componentes que vão favorecer o tratamento. Tendo componentes de eficácia, o desfecho composto de segurança tende a ser iguais entre os grupos, diluindo uma eventual diferença em segurança com desfechos que não são de segurança. E isso ocorreu, pois o desfecho primário de segurança foi igual entre os grupos, mas quando se olha o componente efeitos adversos do uso de antiarrítmicos este é mais frequentes no grupo de controle do ritmo.
Duro de tolerar um estudo de tão má qualidade querendo modificar um paradigma. Seria mais digno abandonar ciência e assumir o paradigma da fé.
“The Bad”: Tripla Inversão do Ônus da Prova (Pop TAVI Trial)
No texto, os autores explicitam a hipótese primária como “aspirina sozinha é superior a aspirina + clopidogrel na incidência do desfecho sangramento”. Na conclusão, “sangramento foi menos frequente no grupo aspirina do que no grupo aspirina e clopidogrel” (15% versus 27%, RR = 0.57; P = 0.001)”.
Observem atentamente a peculiaridade da frase: o autor de refere à aspirina isolada, em relação à associação de drogas; não se refere à associação, em relação a aspirina isolada.
No entanto, este trabalho não testa aspirina, pois esta droga está alocada para ambos os grupos. Este é um trabalho sobre clopidogrel versus não clopidogrel, em pacientes que usam aspirina. A pergunta científica é se devemos utilizar clopidogrel em pacientes que já usam aspirina. A conclusão deveria ser que o uso de clopidogrel aumenta sangramento.
Esta é a primeira inversão do ônus da prova. Na realidade, o ônus da prova deve estar no tratamento mais complexo (a associação), e não no mais simples (apenas aspirina).
Isso não é apenas uma brincadeira lógica. É que quando jogamos o ônus da prova no simples, ficaremos com o complexo até que se prove o contrário. É um grande exemplo da “mentalidade do médico ativo”. É o fazer sem evidências, e só para parar de fazer quando surgir evidências contrárias a fazer. Inverte-se a hipótese nula. É irracionalidade científica.
Segunda inversão do ônus é a do desfecho primário e secundário. O estudo testa primariamente o óbvio e o deixa a dúvida válida como pergunta secundária. O desfecho primário é sangramento: óbvio que um antiagregante plaquetário sangra menos do que dois. Isso já sabemos, está demonstrado incontáveis vezes.
O desfecho secundário de eficácia é o composto de eventos tromboembólicos (morte cardiovascular, acidente vascular cerebral e infarto do miocárdio), que é o objetivo da terapia antiplaquetária. Este desfecho mostraria se valeria a pena associar clopidogrel à aspirina.
Em medicina, a justificativa de um tratamento está em seu benefício e não na ausência de malefício. Portanto, o objetivo primário dos estudos deve ser eficácia, e depois surge a questão da segurança (escrevi recentemente que o pensamento clínico-científico é diferente da filosofia ética, que coloca a não maleficência em primeiro lugar).
Além da importância do alinhamento dos sentidos clínico e científico das hipóteses, o tamanho amostral não é desenhado para o desfecho de eficácia. Isso aumenta possibilidade de erros aleatórios quanto a este que deveria ser o motivo do estudo.
A terceira inversão do ônus da prova esteve em definir a análise de eficácia como primariamente de não inferioridade. Ou seja, a aspirina isolada deveria se provar não inferior à associação quanto à prevenção de evento tromboembólico. Porém a associação nunca havia se provado eficaz em pacientes pós TAVI, era um tratamento padrão por “modismo”. Assim, a análise de eficácia deveria ser de superioridade, sendo o ônus colocado na terapia mais complexa.
Portanto, temos três inversões de ônus da prova: o simples precisando se provar melhor do que o complexo; segurança como argumento mais importante do que eficácia; e proposta de testar não inferioridade em relação a algo que não se demonstrou primariamente eficaz.
Pensamento científico não se resume a desenho de estudo adequado, mas principalmente na construção das hipóteses, aspecto essencial para utilidade epistemológica dos estudos. Este estudo é uma demonstração da carência de racionalidade científica no mainstream do circo cardiológico. O pesquisador pensa no desenho do estudo (vamos fazer um ensaio clínico), o verdadeiro cientista pensa na pergunta do estudo (o que preciso saber).
“The Good”: Princípio da Complacência (ELDERCARE-AF Trial)
Este foi um estudo que usou dose baixa de anticoagulante em idosos que tinham contraindicação de anticoagulação, no intuito de prevenir eventos tromboembólicos decorrentes de fibrilação atrial.
Pacientes randomizados para edoxabana 15 mg apresentaram 2.3% de eventos embólicos versus 6.7% no grupo placebo (P < 0.001). Sangramento foi respectivamente 3.3% versus 1.8% (P = 0.09). Parece vantajoso.
O princípio da complacência diz que quando um conceito é demonstrado em um ambiente, este tende a se reproduzir em outros ambientes. Refiro-me a ambiente como um tipo de população ou um tipo de estratégia.
Por exemplo, tudo que funciona em jovem, funciona em idoso. O problema da aplicabilidade no idoso é a dúvida se o risco absoluto do efeito adverso supera o benefício. Por exemplo, uma cirurgia de revascularização miocárdica funciona em sua eficácia anti-isquêmica em um paciente de 100 anos. Funciona se o paciente não morrer na cirugia ou se não sofrer uma sequela devastadora. Essa é a dúvida.
Anticoagulante reduz risco de evento antitrombótico. Reduz esse risco também no idoso. A dúvida é se no muito idoso o risco de sangramento supera o benefício.
Anticoagulante reduz risco qualquer que seja a dose. Quanto menor a dose, menor a redução de risco. Quanto menor a dose, menor a incidência de sangramento. A dúvida está se uma baixa dose não perde muito a eficácia a ponto de não valer a pena correr um risco, mesmo que menor.
Este estudo testa uma dose mais baixa de anticoagulante em muito idosos com risco de sangramento. Na construção da hipótese, o estudo se baseia em dois critérios de complacência: (1) anticoagulante tem eficácia na prevenção de eventos embólicos no muito idoso e (2) qualquer dose de anticoagulante vai ter algum benefício (o que varia é a magnitude).
Mas neste caso, o princípio da complacência serve para criar uma hipótese de eficácia, mas resta uma dúvida que precisa ser testada: a magnitude do benefício da dose baixa supera o risco da dose baixa. A dúvida é de magnitude e não de conceito.
E funcionou! Os conceitos já existiam, mas agora estes ganham um valor pragmático para tratamento de idosos de alto risco de sangramento, trazendo benefício com um risco aceitável.
Conclusão
Precisamos pensar menos em "pesquisa" e mais em "ciência". Pesquisa é o ato de executar protocolos, analisar dados, escrever e publicar artigos em revistas de impacto. Ciência é quando essas ações possuem um sentido maior, seja epistemológico, seja prático. A ciência eleva à era do conhecimento, a simples pesquisa nos prende à era industrial. Mais uma vez, Douglas Altman: "we need less research, better research and research done for the right reasons".
____________________________________________________________________________________
* Conheça nosso Curso Online de MBE, clicando aqui.
Uma crítica excelente e bastante instrutiva sobre recentes pesquisas e estudos, parabéns !
ResponderExcluirCaro Luis,
ResponderExcluirEste post foi "triplamente complexo"!
Tanto que é difícil até comentar. Mas vou arriscar um comentário, mais filosófico que científico, baseado nos comentários de Carl Gustav Jung à Tradução do famoso oráculo chinês, o "I Ching".
Antes vou explicar: o conhecido "livro das moedinhas furadas", que tanta gente hoje gosta de usar pra brincar de prever o futuro, consta de 64 Hexagramas. O mesmo número de Bits que faz um Byte de computador, ou "letras" no código genético. Nenhum mistério aí (Fritijoff Kapra que não me deixe mentir): são todos os três baseados no mesmo código binário, o qual alguns filósofos e polímatas já chamaram de "o código natural da vida".
Segundo a antiga lenda chinesa, era preciso um sábio para responder às perguntas do Oráculo. Ele escutava a pergunta do consulente e então usava o processo das varetas do caule do Milefólio (As três moedinhas vieram para simplificar), assim "determinando", com a ajuda do acaso e de sei lá qual deidade, o hexagrama da resposta. Considerava-se que ele assim "realizava uma amostragem – um átimo do momento" Com isso lograva interpretar aquele hexagrama e assim dar a resposta.
Hoje, qualquer um pode consultar o I Ching, pois o livro já foi tradu-interpretado para o ocidente, talvez em milhares de edições. Basta "dar um Google", e já temos sites e softwares que já fazem todo o sorteio de imediato, sem incenso, ritual das varetas ou moedinhas.
Entretanto uma coisa permanece verdade, e foi sobre isso que Jung comentou. Aquele que realiza uma consulta tem que antes clarear a mente, formulando assim uma única pergunta passível de resposta (pois o código é binário). Se não, ou se persiste em interrogar o Oráculo de maneira impertinente, terá no melhor uma resposta tão obscura como a pergunta.
Assim também na ciência: talvez esse seja um caso para os médicos linguistas... :-)
Adorei seu comentário
ExcluirA arte de fazer a pergunta certa em Ciência é tão ou mais importante que saber como respondê-la
Excelente reflexão.
ResponderExcluirFica um questionamento: o que faz pensar que o efeito antiagregante (tromboxano) da colchicina não tenha o viés similar das glifozinas como diuretico?