segunda-feira, 13 de janeiro de 2020

A Desfocada Controvérsia do EXCEL Trial


Forte controvérsia originada no final do ano passado decorreu da publicação dos resultados de cinco anos do ensaio clínico EXCEL no New England Journal of Medicine, o qual concluiu por semelhante eficácia entre angioplastia coronária e cirurgia de revascularização em pacientes com lesão de tronco de coronária esquerda. 

O principal argumento dos críticos ao estudo reside na definição do desfecho infarto do miocárdio (magnitude laboratorial da necrose) escolhida pelos autores do trabalho, o que teria induzido uma falsa semelhança entre angioplastia e cirurgia. 

Controvérsias se perpetuam quando os dois lados usam argumentos fracos e escolhidos por vieses de confirmação. A conclusão do EXCEL é inadequada, mas não exatamente pelas razões apontadas pelos seus críticos. Nesta postagem discutiremos as verdadeiras violações de racionalidade científica deste trabalho, que se apontadas corretamente resolveriam melhor esta questão.

O EXCEL trial nos dá oportunidade de discutir os conceitos de desfecho composto e estudo de não-inferioridade, que quando aplicados de forma inadequada podem gerar prejuízos científicos. 


BBC de Londres

O assunto se tornou mundialmente conhecido por uma reportagem da BBC de Londres, baseada em entrevistas com cardiologistas críticos ao estudo EXCEL. Protagonizou a controvérsia o cirurgião da Oxford David Taggart, que fazia parte do steering committee do EXCEL. Este retirou seu nome da lista de autores do EXCEL devido a insatisfação com a definição de infarto que teria promovido o “inadequado” resultado do estudo. 





O EXCEL trial randomizou 1905 pacientes com lesões de tronco de coronária esquerda para angioplastia coronária ou cirurgia de revascularização. Como é de conhecimento geral, esta é uma condição tradicionalmente tratada por cirurgia. Na última década, o tratamento por angioplastia com stent se mostrou factível para esta condição, tornando-se uma opção alternativa. O Excel comparou os dois tipos de tratamento quanto ao desfecho combinado de morte, infarto não fatal ou acidente vascular cerebral. E concluiu que não há diferença significativa entre os dois tratamentos. 

“There was no significant difference between PCI and CABG with respect to the rate of the composite outcome of death, stroke, or myocardial infarction at 5 years”.


O Equívoco da Crítica (definição de infarto)

O desfecho "infarto" foi definido a priori no protocolo do estudo e contempla infarto espontâneo e infarto periprocedimento (elevação de marcadores de necrose durante os procedimentos de angioplastia ou cirurgia). Os autores definiram que infarto periprocedimento seria elevação de 10 vezes o limite da normalidade da CK-MB ou elevação de 5 vezes se acompanhado de nova onda Q no eletrocardiograma, nova obstrução no cateterismo ou perda de motilidade de alguma parede ventricular. Mas o ponto principal da crítica foi a igualdade de definição de infarto para angioplastia ou cirurgia. 

Os críticos do estudo argumentam que o correto seria a utilização da “Definição Universal de Infarto”, que usa 5 vezes o limite da normalidade para angioplastia e 10 vezes para cirurgia. Se isto fosse usado, haveria mais infarto no grupo angioplastia, mudando o resultado do estudo. Conta a reportagem que a BBC teve acesso aos dados do estudo, fez a análise e concluiu que a conclusão seria favorável à cirurgia se fosse utilizada a definição universal. 

Aí surge o primeiro conceito a ser discutido neste contexto: a confusão entre critérios clínicos e critérios científicos. Critério clínico serve para rotular pacientes, com implicações diagnósticas, prognósticas e de decisão terapêutica. Critério científico serve para testar hipóteses. 

Na medida em que estamos avaliando qual dos dois tratamentos causa mais infarto (necrose miocárdica), o critério de necrose miocárdica deve ser igual entre os dois. Seria uma violação científica usar critérios diferentes. Isso geraria ascertainment bias, quando membros de um grupo são avaliados de forma diferente do outro grupo, predispondo a maior detecção do desfecho em algum dos grupos. É um tipo de viés de observação, que eu traduziria como viés de apuração.

Por outro lado, a Definição Universal de Infarto é clínica, não há preocupação científica e utilizamos um limite maior para pacientes cirúrgicos, pois do contrário haveria diagnóstico clínico de infarto em muita gente operada, sem grande impacto prognóstico. Observe a frase contida na introdução do documento da Definição Universal: “with increased cardiac markers, clinicians must distinguish whether patients have suffered a infarction". A definição universal é um critério clínico, não científico.

Embora meu argumento seja em defesa da escolha dos autores do trabalho, isso é apenas uma questão de definição. Outros argumentos poderiam ser utilizados para outras definições. Portanto, não há uma definição correta e outra errada. Eventos que correspondem a um combinado de critérios, como infarto ou sangramento, variam de estudo para estudo. E isso é natural. O importante é que haja um racional na definição e que, principalmente, seja definido a priori. 

Os critérios de infarto do EXCEL foram previamente definidos como desfecho primário. No entanto, os críticos do EXCEL desejam fazer prevalecer uma definição que não foi pré-definida como desfecho primário. Há uma violação intrínseca de um princípio de integridade científica básico na crítica ao EXCEL. 

A definição do EXCEL pode não ser a Definição Universal de Infarto, mas tem sentido científico e foi feita a priori. 

OBS: A publicação atual do EXCEL é uma análise secundária de um desfecho primário. A análise primária era seguimento de três anos que já havia sido publicado e discutido neste Blog em 2016. Importante salientar que análises secundárias também devem utilizar critérios pré-definidos, a fim de evitar o problema das múltiplas comparações. 


A Boa Crítica

A boa crítica metodológica ao EXCEL seria a inadequação de incluir infarto periprocedimento na definição de infarto. Isto porque um “desfecho” é uma ferramenta científica voltada para mensurar um “efeito”: neste caso, comparar o benefício entre um tratamento tradicional e uma nova proposta. Infarto periprocedimento não é benefício, é malefício. Quando um desfecho composto combina benefício e malefício, torna confusa a interpretação. E isso aconteceu no EXCEL. 

Para complicar, infarto periprocedimento tem valor prognóstico muito questionável, diferente de infarto espontâneo. São entidades de diferentes valores combinadas como se fossem os mesmos. 

Ao colocar infarto periprocedimento e infarto espontâneo no mesmo desfecho, estes apresentaram resultados diametralmente opostos (o primeiro a favor da angioplastia e o segundo a favor da cirurgia), um anulou o outro e os grupos ficaram semelhantes. No entanto, o que media benefício era apenas infarto espontâneo.

A melhor estratégia seria incluir apenas infarto espontâneo no desfecho primário de benefício e colocar infarto periprocedimento como um desfecho (secundário) de segurança. 

Exatamente isto foi feito no ensaio clínico NOBLE, um estudo parecido com o EXCEL, publicado no Lancet na última semana de dezembro, tendo falhado em demonstrar não-inferioridade por parte do grupo angioplastia. A conclusão do NOBLE trial foi “The findings of this study suggest that CABG might be better than PCI for treatment of left main stem coronary artery disease.”




Portanto, aqui está o segundo conceito de nossa discussão: um desfecho composto deve ter homogeneidade de função entre seus componentes, no sentido de que todos devem avaliar um mesmo fenômeno (no caso, o benefício). 


A Não-inferioridade

O segundo argumento correto para criticar o EXCEL está na mudança da hipótese primária do estudo. Primariamente, este foi um estudo desenhado para testar não-inferioridade da angioplastia. A margem de não-inferioridade pré-definida foi 4.2% em termos absolutos, ou seja, se toleraria até esta marca para afirmar que angioplastia não é muito inferior. Esta é a margem superior do intervalo de confiança. Ou seja, dentro da incerteza do estudo, a inferioridade não passaria de 4.2%. Na publicação original (3 anos de seguimento), a diferença absoluta no desfecho composto foi de 0.7% a favor da cirurgia, sendo que a margem superior do intervalo de confiança foi de 4.0%. Chegou perto, mas o estudo concluiu por não-inferioridade. 

Agora, observem que as curvas de sobrevida da cirurgia e angioplastia vão se separando com o tempo. Isto porque a cirurgia é um tratamento que bypassa todas as lesões, portanto mais duradouro - mesmo que surjam novas lesões as pontes a estão bypassando. É por isso que, com o tempo, a angioplastia vai perdendo espaço para a cirurgia. Foi exatamente esta percepção que provocou os autores a expandir a análise para cinco anos (publicação atual). E o intervalo de confiança desta análise ultrapassou sobremaneira o limite de não-inferioridade, chegando a 6.5%. Portanto, se a hipótese primária fosse mantida nessa análise de cinco anos, angioplastia não sobreviveria como um tratamento não-inferior. 

No entanto, sem uma clara justificativa, nem cálculo amostral prévio que garantisse poder estatístico, os autores modificaram a análise de não-inferioridade para superioridade. Na análise de não-inferioridade, o ônus da prova de benefício está na angioplastia, enquanto na análise de superioridade, o ônus da prova está na cirurgia que precisaria demonstrar ser melhor. Invertendo o ônus da prova, a diferença a favor da cirurgia (19.2% versus 22%) não se mostrou estatisticamente significante (P = 0.13). Ou seja, não podemos afastar o acaso na afirmação de que cirurgia é melhor. 

Neste momento surge o terceiro conceito a ser enfatizado nesta postagem: em estudos de não-inferioridade como o EXCEL, a premissa básica é de que o novo tratamento é inferior, até porque este tratamento não precisa ser igual, nem melhor, para que seja utilizado. Mesmo sendo inferior, pode valer a pena evitar uma cirurgia cardíaca. Claro, até um certo ponto. Portanto, não-inferioridade significa que não é inferior a ponto de tornar o tratamento inadequado. Não-inferioridade significa que a eventual inferioridade não invalida o tratamento.

Isto quer dizer que a hipótese de não-inferioridade parte da premissa de inferioridade. E isto está totalmente de acordo com o conhecimento prévio da literatura sobre o tema. Em pacientes com DAC grave, estudos prévios (FREEDOM, SYNTAX, BEST) mostram que cirurgia é melhor em pacientes com anatomia grave. Isso não seria muito diferente neste caso. Portanto, cirurgia é melhor, ponto. O que está em questão é o quanto angioplastia é pior. 

Aí surge o quarto conceito: estudo de não-inferioridade não deve ter um caráter dicotômico (inferior - sim ou não). Estudo de não inferioridade deve ter um caráter mais descritivo, refletindo a incerteza do grau de inferioridade. Precisamos evoluir para olhar o intervalo de confirança, considerar o limite superior como a pior das hipóteses, e usar essa informação na decisão individualizada. Para alguns pacientes de baixo risco cirúrgico, toleramos menos inferioridade da angioplastia, para outros de alto risco cirúrgico toleramos mais inferioridade. Assim, o que devemos ter em mente e levar para a decisão é a pior das hipóteses. Não é um fator primordial dicotomizar a análise em positiva ou negativa para não-inferioridade.

Diferente de estudo de superioridade, que tenta demonstrar qual dos dois tratamentos ganha o jogo (ganha ou perde - dicotômico), no estudo de não-inferioridade um dos tratamentos já chega com a premissa da derrota e nós avaliamos qual a derrota de pior placar possível (descritivo). 

Portanto, nunca deveria ter estado em questão se os tratamentos são equivalentes. A questão era o quanto a angioplastia poderia ser pior, e isso deveria ter sido avaliado neste seguimento de cinco anos pela análise de não-inferioridade. Isto foi feito no estudo NOBLE, que usou a análise de não-inferioridade aos cinco anos.


Conclusão

A controvérsia a respeito do estudo EXCEL falha ao se ligar em detalhes de menor relevância e facilmente contestados, negligenciando uma visão de conceitos científicos que tornariam mais clara a solução para o caso. O pensamento científico adequado transcende detalhes de definições clínicas,  e amplia nosso pensamento para o verdadeiro significado das evidências.

Cirurgia de revascularização é melhor. A questão é o quanto melhor. No estudo NOBLE, cirurgia (comparada a angioplastia) reduz risco de eventos em relativos 22% (morte foi igual),  absolutos 9%. Em média, precisamos operar 11 pacientes para prevenir um desfecho. Esta informação, descritiva, deve ser utilizada em uma decisão individualizada por perfil de risco cirúrgico e preferência do paciente. 

Cirurgia é algo melhor, e esse algo deve ser contemplado na decisão individual. Independente da discussão dicotômica, as evidências destes ensaios clínicos não devem servir para definir qual o tratamento de preferência. Mas sim para nos fazer entender que, antes de olhar o paciente, clínica e pessoalmente, não devemos ter preferência. A decisão final está na aplicação do norte vindo da evidência (NNT = 11) em uma pessoa com todas as suas individualidades.

No centro desta discussão, deveriam estar conceitos científicos e principalmente a pessoa que tem a pele no jogo.


--------------------------------------------------------------------------------------------------------------------------


Pessoal, cliquem aqui para serem direcionados ao nosso curso online de MBE, com 150 aulas em streaming, compreendendo princípios do pensamento médico-científico, princípios da medicina baseada em evidências, pensamentos originais, integridade científica e análise crítica de evidências científicas em forma de "arte" (visão do todo > partes). Leiam conteúdos dos módulos e experimentem as aulas disponíveis na plataforma de apresentação


Atenção: em janeiro, lançamento da primeira temporada de nosso podcast MBE. Aguardem.

6 comentários:

  1. Além do mais quem vai tratar o nosso paciente não é "a cirurgia" nem "a angioplastia" é um cirurgião ou um cardioligista Intervencionista.

    ResponderExcluir
  2. Mesmo para quem não é cardiologista, esse post é muito esclarecedor - independente do tema: cirurgia x angioplastia. Sempre aprendendo como analisar um estudo

    ResponderExcluir
  3. Perfeito!
    Independente de resultados, os trials são meros norteadores da conduta terapêutica, que deve se adequar, individualmente, a cada paciente.O procedimento pode demonstrar-se estatisticamente melhor e ser de péssima indicação considerando-se a condição de um paciente específico!!

    ResponderExcluir
  4. Perfeito.Trials são norteadores de conduta;o melhor procedimento é aquele que traz mais benefício e menos risco pra um determinado paciente, e isso, depende das condições particulares de cada um!

    ResponderExcluir
  5. Pode ser melhor em trial com baixíssima taxa de mortalidade operatório, muito longe da realidade brasileira.

    ResponderExcluir
  6. À sua época, o estudo Syntax reforçou que, em pacientes elegíveis para ambas as estratégias de revascularização (quando cirurgião e cardiologista intervencionista julgaram os procedimentos factíveis), com coronariopatia multivascular ou doença do tronco da coronária esquerda, cirurgia e angioplastia são equivalentes quando a complexidade anatômica é baixa. Nesse caso, tendemos a optar pelo tratamento que incorre em menor morbidade. Em complexidades anatômicas maiores (tercil de escore Syntax elevado), a cirurgia foi claramente superior em reduzir desfechos — possivelmente atribuível, pelo menos em parte, a menores taxas de revascularização incompleta. No tercil de complexidade intermediária, houve diferença não significativa, mas talvez relevante no sentido de que mostra incremento cumulativo de risco conforme o escore seja mais elevado. Nesse último caso, enxergamos com cuidado o tratamento percutâneo, deixando-o na posição de alternativa aceitável à cirurgia. Isso associado a análises de subgrupo do FREEDOM, em que pacientes com doença isolada de óstio ou corpo do tronco da coronária esquerda — ou seja, sem comprometimento da bifurcação — ou com doença biarterial sem comprometimento de DA proximal, os diabéticos apresentaram números semelhantes no desfecho composto (morte igual, mais nova revascularização no grupo angioplastia e mais AVC manifesto no grupo cirurgia). Como vocês enxergam os efeitos da inclusão equivocada de proporção substancial dos pacientes com erro na aplicação do escore Syntax, que na análise do Core Lab era de complexidade elevada?

    ResponderExcluir