sexta-feira, 31 de janeiro de 2020

Coronavírus: a epidemiologia do medo


Este artigo, escrito em 31 de janeiro de 2020, é sobre risco perceptível individual, medo versus probabilidade. Passados 2 meses, a reflexão se tornou ainda mais relevante pelo aumento de casos de coronavírus. Os números à época, estáticos, foram usados para a reflexão da segurança perceptível à época, demonstrando uma dissociação que é universal, inerente da mente humana, independente de época ou local. 

Desde aquele momento, o texto reconhecia a importâncias das medidas de saúde pública. Assim, esse texto não deve ser interpretado como antagônico às medidas de prevenção. 

Por fim, a provocação "aconteceu um cisne negro?", continua nos intrigando do ponto de vista epidemiológico. Precisaremos de mais tempo para fazer essa reanálise. E o ponto de partida será este artigo. Aguardemos. 

31 de janeiro de 2020

Há duas semanas o surgimento do coronavírus na China é o principal assunto dos noticiários e manchetes de jornal. A bolsa de valores caiu, o dólar subiu, o ministro da saúde deu entrevista coletiva e a Organização Mundial de Saúde declarou que a infecção pelo novo coronavírus é uma “emergência de saúde pública”. 

O medo está instalado. Uma amiga, enfermeira, me questionou se deveria desmarcar suas férias nos Estados Unidos. Falei que ela deveria ir, desde que não passeasse de helicóptero. 


Risco Perceptível (população e indivíduo)


Nesta postagem, usarei o pensamento epidemiológico como norte probabilístico para a percepção de risco individual. Racionalmente, o risco perceptível do ponto de vista populacional deve ser diferente do risco perceptível de indivíduos da mesma população. 

Governos e órgãos de controle de doenças infecciosas devem encarar o risco potencial do novo coronavírus se tornar epidêmico. Assim, enfáticas medidas de saúde pública são tomadas para reduzir a probabilidade da doença se alastrar de forma indesejável. Estas medidas estão corretas. 

Mas o equívoco cognitivo surge quando essas medidas, por serem disseminadas, trazem a conotação inadequada de que indivíduos estão sob alto risco.

O risco significativo de uma população sofrer uma epidemia não é o mesmo risco de um indivíduo dessa população se tornar doente. 

População e indivíduos da população são diferentes. Para um indivíduo doente é bom que sua doença seja menos patogênica; mas para a população, a baixa patogenecidade não é tão boa, pois aumenta a transmissão da doença. 

Paradoxalmente, quanto menos patogênica a doença é, mais provável desta se disseminar. O novo coronavírus tem em torno de 2% de letalidade, diferente do SARS (2003) que apresentou 10% de letalidade. A menor patogenicidade deste vírus faz com que muitos infectados não se sintam doentes e continuem transitando normalmente, aumentando a disseminação da doença. Por isso que os agentes chineses medem a temperatura de qualquer pessoa que passa pela rua.

Por outro lado, doenças de maior letalidade fazem com que o indivíduo fique tão doente que não consegue sair de casa, a não ser que seja para ir ao hospital. Assim, fica mais fácil de isolar estes indivíduos. Pior para o indivíduo, melhor para a população. No entanto, ao ver as medidas de isolamentos de cidades e agentes vestidos de branco pelas ruas, isso nos remete a uma doença de maior gravidade. Intuitivamente, ficamos com mais medo das consequências.

Assim, a probabilidade de uma epidemia se instalar não é o mesmo da probabilidade de uma pessoa ficar doente, muito menos desta pessoa morrer da doença. Ao pensar individualmente (sentimento de medo) devemos racionalizar risco e dano.

Qual o risco de eu adquirir a doença?
Qual o dano se eu adquirir a doença?


Risco de Doença


Farei um exercício probabilístico que não tem a pretensão de retratar de forma acurada a epidemiologia do problema, mas sim de tratar de forma acurada a percepção de risco quanto ao problema. 

Vamos imaginar o pior cenário: vivemos na China. Até hoje foram 9.720 casos diagnosticados e 213 mortes na China. Se dividirmos o número de casos pela população da China (1,4 bilhões), a probabilidade de um chinês ter adquirido a doença até então é:

0.0007% (risco).

Justifica o medo? Não.

Sim, a doença vai se disseminar além das cifras atuais, afinal há um crescimento do número de casos. Mas observe que o denominador chinês não permitirá que a perspectiva mude. 

Sim, é diferente um chinês em Pequim (menor risco) de um Chinês em Wuhan (maior risco). Estou trabalhando com a média ou suposição de homogeneidade de risco na China. Por outro lado, não estamos na China e nosso risco em qualquer outro lugar do mundo é menor do que Pequim. Por isso o cálculo vale para o ajuste cognitivo. 


Dano da Doença


Agora vamos ao dano. Em adquirindo a doença, qual a probabilidade de morte? 2%

Não é desprezível, mas se pensarmos na probabilidade de 98% de sair vivo e ao comparar com outras doenças agudas, até que esta não é das piores. A letalidade da pneumonia bacteriana comunitária no idoso é muito maior do que isso, sendo esta uma doença muito mais comum do que coronavírus.

Mas ninguém anda com pânico de pneumonia.


Risco de Morte: Risco*Dano


Finalmente, devemos combinar risco e dano. Ou seja, qual a probabilidade de uma pessoa da população adquirir a doença e morrer dela. Isso é uma probabilidade condicional, ou seja, P1 x P2.

Risco da doença = 0.0007% x Risco de morte = 2% = 0.00001% = 1 morte por 7 milhões

Desta forma, do ponto de vista individual, o medo não se justifica por bases probabilísticas. 


Diálogo com a População


Justifica que ministros façam coletivas de imprensa? Justifica que as redes de TV convidem um exército de infectologistas para a televisão? Justifica que esta seja uma notícia dominante das últimas semanas?

Na verdade, isso pouco importa aos indivíduos da população, a não ser que o indivíduo trabalhe em algum escritório de controle de doenças infecciosas do ministério da saúde. Os governos precisam se planejar, cuidar do risco populacional. Enquanto os indivíduos podem viver suas vidas tranquilamente. 

É justificável a preocupação profissional com esta questão; mas não é justificável a preocupação pessoal. O assunto deve predominar em reuniões de profissionais voltados para controle epidemiológico. Não é conversa de shows televisivos. 

Claro, é natural que o assunto surja. Neste caso, como profissionais de saúde, devemos aproveitar a oportunidade para o literamento probabilístico da sociedade. Afinal, passamos a vida decidindo com base na razão de risco e benefício.

Se a população fosse uma pessoa, esta poderia estar com medo. A pessoa da população é o governo, este precisa se movimentar. Quando a nós, indivíduos, temos problemas muitos mais importantes para nos preocuparmos. Quanto mais nós, brasileiros bombardeados a cada dia por crises desencadeadas por problemas comportamentais que surgem de forma mais inesperada do que qualquer epidemia. Já temos nossos próprios “coronavírus”, incluindo nossos problemas de saúde pública. 


Teremos um Cisne Negro?


Cisnes Negros, definidos por Nassim Taleb, são eventos improváveis, imprevisíveis e de grande impacto, que escrevem a história do mundo. Caso essa doença se alastre enormemente, isto poderá mudar o mundo. No entanto, o cisne negro só ocorre quando é imprevisível, pois se for previsto medidas preventivas impedem seu surgimento. 

A epidemia já está prevista como uma possibilidade e medidas agressivas estão sendo tomadas pelos governos. Além disso, a história recente deste tipo de vírus (severe acute respiratory syndrome coronavirus (SARS-CoV) em 2002 e Middle East respiratory syndrome coronavirus (MERS-CoV) em 2012) sugere baixa probabilidade de uma catástrofe. 

Em termos probabilísticas, não teremos um cisne negro e, após algum tempo, essa história se dissipará


O Helicóptero da Racionalidade


Há poucos dias, meu ídolo do basquete americano, Kobe Bryant, morreu em um acidente de helicóptero. Isso me remeteu à seguinte questão: o que as pessoas mais temem nos dias atuais: 

uma viagem de alguns dias pela China ou 

um passeio de helicóptero sobre o Grand Canyon?

Fiz essa pergunta no tweeter:



 O mais frequente é o temor da China. Isto é racional?

Já sabemos que o risco de morte por coronavírus na china é 1 em 7 milhões. 

Pesquisei, e encontrei que o risco de uma queda fatal de helicóptero é 1 / 250.000 (passeios-hora).

Portanto, precisaríamos fazer 28 viagens à China para igualar o risco de morte em um despretencioso passeio turístico de helicóptero. 

De fato, emoção não é o mesmo que razão. Mas quando se trata de medo ou pânico, cabe a tutores da percepção sobre questões de saúde aproveitar a oportunidade e alfabetizar cientificamente a sociedade. 

Valorizem a incerteza, calculem as probabilidades. 

segunda-feira, 13 de janeiro de 2020

A Desfocada Controvérsia do EXCEL Trial


Forte controvérsia originada no final do ano passado decorreu da publicação dos resultados de cinco anos do ensaio clínico EXCEL no New England Journal of Medicine, o qual concluiu por semelhante eficácia entre angioplastia coronária e cirurgia de revascularização em pacientes com lesão de tronco de coronária esquerda. 

O principal argumento dos críticos ao estudo reside na definição do desfecho infarto do miocárdio (magnitude laboratorial da necrose) escolhida pelos autores do trabalho, o que teria induzido uma falsa semelhança entre angioplastia e cirurgia. 

Controvérsias se perpetuam quando os dois lados usam argumentos fracos e escolhidos por vieses de confirmação. A conclusão do EXCEL é inadequada, mas não exatamente pelas razões apontadas pelos seus críticos. Nesta postagem discutiremos as verdadeiras violações de racionalidade científica deste trabalho, que se apontadas corretamente resolveriam melhor esta questão.

O EXCEL trial nos dá oportunidade de discutir os conceitos de desfecho composto e estudo de não-inferioridade, que quando aplicados de forma inadequada podem gerar prejuízos científicos. 


BBC de Londres

O assunto se tornou mundialmente conhecido por uma reportagem da BBC de Londres, baseada em entrevistas com cardiologistas críticos ao estudo EXCEL. Protagonizou a controvérsia o cirurgião da Oxford David Taggart, que fazia parte do steering committee do EXCEL. Este retirou seu nome da lista de autores do EXCEL devido a insatisfação com a definição de infarto que teria promovido o “inadequado” resultado do estudo. 





O EXCEL trial randomizou 1905 pacientes com lesões de tronco de coronária esquerda para angioplastia coronária ou cirurgia de revascularização. Como é de conhecimento geral, esta é uma condição tradicionalmente tratada por cirurgia. Na última década, o tratamento por angioplastia com stent se mostrou factível para esta condição, tornando-se uma opção alternativa. O Excel comparou os dois tipos de tratamento quanto ao desfecho combinado de morte, infarto não fatal ou acidente vascular cerebral. E concluiu que não há diferença significativa entre os dois tratamentos. 

“There was no significant difference between PCI and CABG with respect to the rate of the composite outcome of death, stroke, or myocardial infarction at 5 years”.


O Equívoco da Crítica (definição de infarto)

O desfecho "infarto" foi definido a priori no protocolo do estudo e contempla infarto espontâneo e infarto periprocedimento (elevação de marcadores de necrose durante os procedimentos de angioplastia ou cirurgia). Os autores definiram que infarto periprocedimento seria elevação de 10 vezes o limite da normalidade da CK-MB ou elevação de 5 vezes se acompanhado de nova onda Q no eletrocardiograma, nova obstrução no cateterismo ou perda de motilidade de alguma parede ventricular. Mas o ponto principal da crítica foi a igualdade de definição de infarto para angioplastia ou cirurgia. 

Os críticos do estudo argumentam que o correto seria a utilização da “Definição Universal de Infarto”, que usa 5 vezes o limite da normalidade para angioplastia e 10 vezes para cirurgia. Se isto fosse usado, haveria mais infarto no grupo angioplastia, mudando o resultado do estudo. Conta a reportagem que a BBC teve acesso aos dados do estudo, fez a análise e concluiu que a conclusão seria favorável à cirurgia se fosse utilizada a definição universal. 

Aí surge o primeiro conceito a ser discutido neste contexto: a confusão entre critérios clínicos e critérios científicos. Critério clínico serve para rotular pacientes, com implicações diagnósticas, prognósticas e de decisão terapêutica. Critério científico serve para testar hipóteses. 

Na medida em que estamos avaliando qual dos dois tratamentos causa mais infarto (necrose miocárdica), o critério de necrose miocárdica deve ser igual entre os dois. Seria uma violação científica usar critérios diferentes. Isso geraria ascertainment bias, quando membros de um grupo são avaliados de forma diferente do outro grupo, predispondo a maior detecção do desfecho em algum dos grupos. É um tipo de viés de observação, que eu traduziria como viés de apuração.

Por outro lado, a Definição Universal de Infarto é clínica, não há preocupação científica e utilizamos um limite maior para pacientes cirúrgicos, pois do contrário haveria diagnóstico clínico de infarto em muita gente operada, sem grande impacto prognóstico. Observe a frase contida na introdução do documento da Definição Universal: “with increased cardiac markers, clinicians must distinguish whether patients have suffered a infarction". A definição universal é um critério clínico, não científico.

Embora meu argumento seja em defesa da escolha dos autores do trabalho, isso é apenas uma questão de definição. Outros argumentos poderiam ser utilizados para outras definições. Portanto, não há uma definição correta e outra errada. Eventos que correspondem a um combinado de critérios, como infarto ou sangramento, variam de estudo para estudo. E isso é natural. O importante é que haja um racional na definição e que, principalmente, seja definido a priori. 

Os critérios de infarto do EXCEL foram previamente definidos como desfecho primário. No entanto, os críticos do EXCEL desejam fazer prevalecer uma definição que não foi pré-definida como desfecho primário. Há uma violação intrínseca de um princípio de integridade científica básico na crítica ao EXCEL. 

A definição do EXCEL pode não ser a Definição Universal de Infarto, mas tem sentido científico e foi feita a priori. 

OBS: A publicação atual do EXCEL é uma análise secundária de um desfecho primário. A análise primária era seguimento de três anos que já havia sido publicado e discutido neste Blog em 2016. Importante salientar que análises secundárias também devem utilizar critérios pré-definidos, a fim de evitar o problema das múltiplas comparações. 


A Boa Crítica

A boa crítica metodológica ao EXCEL seria a inadequação de incluir infarto periprocedimento na definição de infarto. Isto porque um “desfecho” é uma ferramenta científica voltada para mensurar um “efeito”: neste caso, comparar o benefício entre um tratamento tradicional e uma nova proposta. Infarto periprocedimento não é benefício, é malefício. Quando um desfecho composto combina benefício e malefício, torna confusa a interpretação. E isso aconteceu no EXCEL. 

Para complicar, infarto periprocedimento tem valor prognóstico muito questionável, diferente de infarto espontâneo. São entidades de diferentes valores combinadas como se fossem os mesmos. 

Ao colocar infarto periprocedimento e infarto espontâneo no mesmo desfecho, estes apresentaram resultados diametralmente opostos (o primeiro a favor da angioplastia e o segundo a favor da cirurgia), um anulou o outro e os grupos ficaram semelhantes. No entanto, o que media benefício era apenas infarto espontâneo.

A melhor estratégia seria incluir apenas infarto espontâneo no desfecho primário de benefício e colocar infarto periprocedimento como um desfecho (secundário) de segurança. 

Exatamente isto foi feito no ensaio clínico NOBLE, um estudo parecido com o EXCEL, publicado no Lancet na última semana de dezembro, tendo falhado em demonstrar não-inferioridade por parte do grupo angioplastia. A conclusão do NOBLE trial foi “The findings of this study suggest that CABG might be better than PCI for treatment of left main stem coronary artery disease.”




Portanto, aqui está o segundo conceito de nossa discussão: um desfecho composto deve ter homogeneidade de função entre seus componentes, no sentido de que todos devem avaliar um mesmo fenômeno (no caso, o benefício). 


A Não-inferioridade

O segundo argumento correto para criticar o EXCEL está na mudança da hipótese primária do estudo. Primariamente, este foi um estudo desenhado para testar não-inferioridade da angioplastia. A margem de não-inferioridade pré-definida foi 4.2% em termos absolutos, ou seja, se toleraria até esta marca para afirmar que angioplastia não é muito inferior. Esta é a margem superior do intervalo de confiança. Ou seja, dentro da incerteza do estudo, a inferioridade não passaria de 4.2%. Na publicação original (3 anos de seguimento), a diferença absoluta no desfecho composto foi de 0.7% a favor da cirurgia, sendo que a margem superior do intervalo de confiança foi de 4.0%. Chegou perto, mas o estudo concluiu por não-inferioridade. 

Agora, observem que as curvas de sobrevida da cirurgia e angioplastia vão se separando com o tempo. Isto porque a cirurgia é um tratamento que bypassa todas as lesões, portanto mais duradouro - mesmo que surjam novas lesões as pontes a estão bypassando. É por isso que, com o tempo, a angioplastia vai perdendo espaço para a cirurgia. Foi exatamente esta percepção que provocou os autores a expandir a análise para cinco anos (publicação atual). E o intervalo de confiança desta análise ultrapassou sobremaneira o limite de não-inferioridade, chegando a 6.5%. Portanto, se a hipótese primária fosse mantida nessa análise de cinco anos, angioplastia não sobreviveria como um tratamento não-inferior. 

No entanto, sem uma clara justificativa, nem cálculo amostral prévio que garantisse poder estatístico, os autores modificaram a análise de não-inferioridade para superioridade. Na análise de não-inferioridade, o ônus da prova de benefício está na angioplastia, enquanto na análise de superioridade, o ônus da prova está na cirurgia que precisaria demonstrar ser melhor. Invertendo o ônus da prova, a diferença a favor da cirurgia (19.2% versus 22%) não se mostrou estatisticamente significante (P = 0.13). Ou seja, não podemos afastar o acaso na afirmação de que cirurgia é melhor. 

Neste momento surge o terceiro conceito a ser enfatizado nesta postagem: em estudos de não-inferioridade como o EXCEL, a premissa básica é de que o novo tratamento é inferior, até porque este tratamento não precisa ser igual, nem melhor, para que seja utilizado. Mesmo sendo inferior, pode valer a pena evitar uma cirurgia cardíaca. Claro, até um certo ponto. Portanto, não-inferioridade significa que não é inferior a ponto de tornar o tratamento inadequado. Não-inferioridade significa que a eventual inferioridade não invalida o tratamento.

Isto quer dizer que a hipótese de não-inferioridade parte da premissa de inferioridade. E isto está totalmente de acordo com o conhecimento prévio da literatura sobre o tema. Em pacientes com DAC grave, estudos prévios (FREEDOM, SYNTAX, BEST) mostram que cirurgia é melhor em pacientes com anatomia grave. Isso não seria muito diferente neste caso. Portanto, cirurgia é melhor, ponto. O que está em questão é o quanto angioplastia é pior. 

Aí surge o quarto conceito: estudo de não-inferioridade não deve ter um caráter dicotômico (inferior - sim ou não). Estudo de não inferioridade deve ter um caráter mais descritivo, refletindo a incerteza do grau de inferioridade. Precisamos evoluir para olhar o intervalo de confirança, considerar o limite superior como a pior das hipóteses, e usar essa informação na decisão individualizada. Para alguns pacientes de baixo risco cirúrgico, toleramos menos inferioridade da angioplastia, para outros de alto risco cirúrgico toleramos mais inferioridade. Assim, o que devemos ter em mente e levar para a decisão é a pior das hipóteses. Não é um fator primordial dicotomizar a análise em positiva ou negativa para não-inferioridade.

Diferente de estudo de superioridade, que tenta demonstrar qual dos dois tratamentos ganha o jogo (ganha ou perde - dicotômico), no estudo de não-inferioridade um dos tratamentos já chega com a premissa da derrota e nós avaliamos qual a derrota de pior placar possível (descritivo). 

Portanto, nunca deveria ter estado em questão se os tratamentos são equivalentes. A questão era o quanto a angioplastia poderia ser pior, e isso deveria ter sido avaliado neste seguimento de cinco anos pela análise de não-inferioridade. Isto foi feito no estudo NOBLE, que usou a análise de não-inferioridade aos cinco anos.


Conclusão

A controvérsia a respeito do estudo EXCEL falha ao se ligar em detalhes de menor relevância e facilmente contestados, negligenciando uma visão de conceitos científicos que tornariam mais clara a solução para o caso. O pensamento científico adequado transcende detalhes de definições clínicas,  e amplia nosso pensamento para o verdadeiro significado das evidências.

Cirurgia de revascularização é melhor. A questão é o quanto melhor. No estudo NOBLE, cirurgia (comparada a angioplastia) reduz risco de eventos em relativos 22% (morte foi igual),  absolutos 9%. Em média, precisamos operar 11 pacientes para prevenir um desfecho. Esta informação, descritiva, deve ser utilizada em uma decisão individualizada por perfil de risco cirúrgico e preferência do paciente. 

Cirurgia é algo melhor, e esse algo deve ser contemplado na decisão individual. Independente da discussão dicotômica, as evidências destes ensaios clínicos não devem servir para definir qual o tratamento de preferência. Mas sim para nos fazer entender que, antes de olhar o paciente, clínica e pessoalmente, não devemos ter preferência. A decisão final está na aplicação do norte vindo da evidência (NNT = 11) em uma pessoa com todas as suas individualidades.

No centro desta discussão, deveriam estar conceitos científicos e principalmente a pessoa que tem a pele no jogo.


--------------------------------------------------------------------------------------------------------------------------


Pessoal, cliquem aqui para serem direcionados ao nosso curso online de MBE, com 150 aulas em streaming, compreendendo princípios do pensamento médico-científico, princípios da medicina baseada em evidências, pensamentos originais, integridade científica e análise crítica de evidências científicas em forma de "arte" (visão do todo > partes). Leiam conteúdos dos módulos e experimentem as aulas disponíveis na plataforma de apresentação


Atenção: em janeiro, lançamento da primeira temporada de nosso podcast MBE. Aguardem.

segunda-feira, 23 de dezembro de 2019

ISCHEMIA Trial: Útil ou Fútil



Na tarde de um sábado recente, ao final de uma década, as redes sociais foram tomadas por uma avalanche de informações, slides e vídeos simultâneos à apresentação dos resultados do ensaio clínico ISCHEMIA no congresso da American Heart Association: Angioplastia coronária com stent não reduz desfechos cardiovasculares em pacientes estáveis. 

Considerado o maior trial da história do National Institute of Health, ao custo de 100 milhões de dólares e milhares de pacientes randomizados, a repercussão da apresentação do ISCHEMIA foi sem precedentes. Segundo  o site Medscape, durante os 75 minutos da sessão de apresentação do trabalho, 600 cardiologistas postaram mais de 2.000 tweets sobre o ISCHEMIA, totalizando mais de 7.500 mensagens nas horas que se seguiram. 

Mas não apenas o volume de comentários chamou atenção. Mais peculiar foi o tom comemorativo de boa parte dos cardiologistas, nos quais me incluo. Comemoramos naquela noite de sábado o resultado negativo do ISCHEMIA. 

No domingo, acordei me perguntando: porque participei da comemoração internacional de um resultado negativo? Comemorar a ausência de benefício não faz sentido, o natural seria frustração. 

A reflexão sobre este estudo deve ir além de seu resultado, estranhamente ainda não publicado na íntegra. Esta é uma oportunidade de lançar um olhar sociológico, dentro da perspectiva científica: o valor do ISCHEMIA é proporcional a sua repercussão? O que justifica a comemoração de um resultado negativo?

Neste final de década, o contexto de um ecossistema científico baseado em sensacionais notícias deve ser confrontado com princípios de filosofia científica que idealmente devem permear nossas interpretações do valor das evidências. 


A Pseudonovidade


Passados alguns dias, a novidade do ISCHEMIA chegou ao público pela mídia tradicional. Durante entrevista em horário nobre do canal americano NBC, a principal autora do ISCHEMIA afirmou “estar surpresa com o resultado”. No Brasil, em depoimento a Cláudia Collucci da Folha de São Paulo, cardiologista caracterizou o resultado como “mudança de paradigma”. Fico a imaginar a reação de Thomas Kuhn com a banalização do significado de paradigmas.

Não há surpresa, muito menos mudança de paradigma. Na verdade, o resultado do ISCHEMIA era tão previsível que sua própria existência, ao custo de 100 milhões de dólares, torna-se questionável.

Estudos prévios que testaram a hipótese do ISCHEMIA foram todos negativos, mostrando curvas de incidência de morte cardiovascular e infarto perfeitamente superponíveis. COURAGE e BARI 2D apresentavam um amplo espectro de gravidade de isquemia miocárdica. Importante reforçar que estes foram estudos com baixo risco de viés e com poder estatístico suficiente para determinar baixo risco de erro tipo II. Também negativo para os desfechos morte e infarto foi o ensaio clínico FAME-II  que estudou apenas pacientes com FFR positivo para isquemia.

Para completar, meta-análise de dados individuais, envolvendo apenas pacientes com isquemia que entraram neste ensaios clínicos, foi negativa. 

Mesmo assim, foi criada uma hipótese: se estudássemos apenas pacientes com isquemia moderada a severa, a total ausência de benefício observada nestes estudos se reverteria para a detecção de benefício clinicamente relevante no ISCHEMIA. O quanto provável é essa hipótese?

A crença da hipótese do estudo ISCHEMIA viola um importante princípio científico: a raridade da interação qualitativa. Já apresentamos evidências deste conceito algumas vezes neste Blog (12).

Este princípio é demonstrado pelas análises de subgrupos dos ensaios clínicos, onde se observa um fenômeno consistente: a redução relativa do risco (conceito de eficácia) não varia com a mudança do estrato de gravidade da doença. O que varia é a redução absoluta e o NNT, mas a propriedade intrínseca do tratamento é constante. 

Portanto, interação quantitativa (mudança na magnitude relativa do benefício) é improvável, o que faz com que interação qualitativa (ausência de benefício reverter para presença de benefício) seja ainda menos provável. E se formos falar em benefício clinicamente relevante, isto parece se tornar impossível. 

Quando existem, interações ocorrem de forma quantitativa, não qualitativa. Isto porque primeiro o efeito deve existir, para depois uma variável modificadora aumentar ou diminuir a magnitude do efeito. Isto é muito diferente de um efeito inexistente se tornar existente pois modificamos o tipo de paciente. Este tipo de interação qualitativa é surpreendentemente rara na natureza biológica. Achar que fenômenos biológico mudam da água para o vinho com a mudança do paciente é irracionalidade científica. 

Mas minha discussão não fica apenas no campo da teoria científica. Interação entre magnitude da isquemia e benefício da angioplastia foi testada nos estudos COURAGE e BARI-2D. Estas amostras tinham boa representatividade dos diferentes graus de isquemia, um amplo espectro de gravidade, o que as torna ideias para o teste de interação: ao mudar o estrato de isquemia, o efeito da angioplastia muda (modificação de efeito = interação)? Em ambos os estudos, a interação foi negativa, ausência de benefício independente do grau de isquemia. Estas referências estão apresentadas em nossa antiga portagem sobre o reflexo óculo-isquêmico

Em resumo: (1) interação quantitativa é rara; (2) interação qualitativa é quase impossível; (3) foi testada interação e tudo deu negativo. Assim, é muito curioso a crença na hipótese do ISCHEMIA e o sentimento de surpresa quanto ao resultado. 

E foi baseado neste raciocínio que em 2014 publicamos nos Arquivos Brasileiros de Cardiologia uma crítica ao que chamamos de reflexo óculo-isquêmico, onde previmos o resultado do ISCHEMIA: “Seguindo um raciocínio bayesiano, considerando a consistente ausência de interação entre carga isquêmica e benefício do tratamento de revascularização, a probabilidade a priori de que o ISCHEMIA venha demonstrar benefício em relação ao desfecho primário de morte ou infarto é pequena. Em outras palavras, se isquemia moderada-severa não é o determinante do benefício de acordo com a totalidade das evidências, não seria a seleção de pacientes com esse grau de isquemia que traria um resultado benéfico da intervenção.”


A (In) Utilidade do Estudo ISCHEMIA


Em um mundo que prevalece a teimosia clínica com o reflexo óculo-isquêmico (presença de isquemia justifica revascularizar pacientes assintomáticos), desconsiderando as evidências prévias, faz-se necessário criar uma nova evidência. O ISCHEMIA tem uma utilidade comportamental. 

Por outro lado, arrisco dizer que do ponto de vista científico, o ISCHEMIA é um estudo desnecessário. Digo que arrisco, pois há uma tônica vigente de que é válido testar hipóteses improváveis, evitando preconceitos, abrindo nossa mente para descobertas inesperadas. Isso é romântico, mas não científico. Ciência é a construção progressiva de conhecimento, onde evidências a priori embasam estudos futuros e a probabilidade de uma lei natural evolui prospectivamente, de forma condicionada ao conhecimento prévio (probabilidade condicional, bayesiana). 

Testar o improvável não promove descobertas inusitadas. Os cisnes negros científicos aparecem do nada, por acaso e não como hipóteses predeterminadas. A explicação para isso está na necessidade da multiplicidade de testes para que o inusitado apareça. Tentativas pré-definidas são em número limitado e carecem da multiplicidade necessária para que inusitado apareça. Por esses motivo, descobertas inesperadas são as não planejadas. 

Assim, não será predefinindo hipóteses de baixa probabilidade que faremos grandes descobertas. 
Descobertas surgem da (1) confirmação de hipóteses de moderada a alta probabilidade ou (2) geração de hipóteses que o acaso nos presenteia de forma imprevisível, a serem confirmadas no futuro por estudos que testam novamente essas hipóteses. 

Pré-definir hipóteses improváveis gera futilidade, pois o resultado negativo (ISCHEMIA) diz o que já sabemos (não agrega) e um eventual resultado positivo terá um baixo valor preditivo positivo (devido à baixa probabilidade pré-teste).

A futilidade de hipóteses não apenas promove gasto desnecessário de recursos pessoais e monetários ($100 milhões). O principal prejuízo da futilidade de hipóteses é o cognitivo. A mera existência de um grande estudo testando uma hipótese desvia para a direita a percepção de probabilidade a priori. A criação do estudo ISCHEMIA gerou expectativa tamanha que modificou a percepção de hipótese improvável para promissora. Alinhado ao viés de confiança por coerência, essa percepção influenciou escolhas médicas, reforçando por anos o reflexo óculo-isquêmico.


A Mudança do Desfecho


Foi no seu último ano que o ISCHEMIA evoluiu de quase desnecessário para potencialmente prejudicial. Ao perceber que a incidência do desfecho morte + infarto estava abaixo do projetado, os autores modificaram o desfecho primário, incluindo dois componentes vulneráveis ao viés de percepção de um estudo aberto (internamento por angina e insuficiência cardíaca). Assim o estudo perdeu confiabilidade, pois um eventual resultado positivo poderia ser mediado pelo risco de viés. Segundo, a hipótese original do estudo foi abandonada, deixando de testar impacto em desfechos maiores que justificariam indicação de angioplastia para além de controle dos sintomas. 

Esta decisão gerou grande controvérsia, nunca respondida a contento pelos autores. Estes argumentaram que a mudança havia sido predeterminada. Como se predeterminar uma péssima decisão a transformasse em uma boa decisão. 

Neste caso, um elefante na sala ficou de fora do campo de visão dos autores: a incidência de desfecho abaixo da planejada era o maior indicativo que, mesmo com isquemia importante, a doença coronária estável é benigna, não justificando ações invasivas com fins de prevenção de eventos que ocorrem de forma tão rara que um estudo bem dimensionado como o ISCHEMIA não conseguiria detectar efeito positivo. 

A história do ISCHEMIA é uma evidência do fenômeno de “aversão ao negativo”, que representa a maior preferência de autores pelo resultado positivo do que pela qualidade do estudo. Verdadeiros cientistas devem primar pela qualidade das evidências geradas por seus trabalhos, e não pela positividade em detrimento da qualidade.  

Assim, como se não bastasse o investimento de 100 milhões de dólares em uma ideia pouco provável, o ISCHEMIA seguiu seu último ano sob a sequela de uma mudança que o transformou em um estudo com alto risco de viés. 

O ISCHEMIA foi negativo. Mas devemos ter em mente que este estudo poderia ter falsamente se positivado pela modificação do desfecho. 


Reflexões Finais


Testes de hipóteses improváveis, sensacionalização de resultados óbvios, modificação do desfecho primário, aversão a resultados negativos não são fenômenos específicos do estudo ISCHEMIA. O ISCHEMIA é apenas mais um estudo dentro de um ecossistema de pesquisa clínica que parece mais valorizar o sensacionalismo de notícias do que o impacto clínico de evidências. 

A evolução deste ecossistema depende da ênfase no senso de valor de um trabalho, a ser definido pela integridade científica e impacto na criação de novos conceitos. O senso de impacto é totalmente ausente em testes de hipóteses como a do ISCHEMIA. Diante de uma hipótese que falhou em ser comprovada por bons estudos prévios, há duas possibilidades: a hipótese é falsa ou o tamanho de efeito é tão pequeno que não foi visto nos estudos prévios. Do ponto de vista prático, não há diferença entre pequeno benefício (condutas de baixo valor) e ausência de benefício. 

Por outro lado, vejo sinais positivos na reação de parte da comunidade cardiológica ao ISCHEMIA.  Primeiro, a estranha comemoração do resultado negativo pode indicar a percepção pela comunidade de que um eventual resultado positivo promoveria instabilidade cognitiva: seria a mistura de algo sensacional e falso (baixo valor preditivo positivo, decorrente de baixa probabilidade pré-teste e desfecho enviesado). Segundo, a resposta da comunidade cardiológica à mudança de desfecho do estudo foi um exemplo de que estamos nos tornando mais críticos. Não passou despercebido e imagino que os autores não anteviram tamanha reação à época. 

Sobre angioplastia coronária em pacientes estáveis, o ISCHEMIA não traz novidades. Por outro lado, a história que permeia essa “grande” estudo nos traz a percepção de que precisamos evoluir para o que Douglas Altman propôs quase três décadas atrás: "we need less research, better research and research done for the right reasons" (precisamos de menos pesquisa, melhores pesquisas e pesquisas feitas pelas razões certas).


--------------------------------------------------------------------------------------------------------------------------

OBS 1: dado a estranha demora da publicação do artigo original, nos abstemos de interpretar metodologicamente os resultados do ISCHEMIA. Nossa interpretação nesta postagem foi apenas sociológica. 

OBS 2: a curva de eventos morte e infarto do ISCHEMIA mostram separações não vistas nos estudos prévios. Após publicados os resultados, interpretaremos esse fenômeno. 

--------------------------------------------------------------------------------------------------------------------------


Pessoal, cliquem aqui para serem direcionados ao nosso curso online de MBE, com 150 aulas em streaming, compreendendo princípios de pensamento médico-científico, princípios da medicina baseada em evidências, pensamentos originais, integridade científica e análise crítica de evidências científicas em forma de "arte" (visão do todo > partes). Leiam conteúdo dos módulos e experimentem as aulas disponíveis na plataforma de apresentação


Atenção: em janeiro, lançamento da primeira temporada de nosso podcast MBE. Aguardem.