sexta-feira, 20 de março de 2020

Hidroxicloroquina: o dia em que a ciência parou



O mundo não experimenta apenas a epidemia de coronavírus. Progressivamente fomos tomados por outras duas epidemias: do medo e da informação. Ontem, em menos de 12 horas, instalou-se a quarta epidemia: a da irracionalidade científica. Mais abrupta que as outras, experimentamos um ponto de inflexão: o dia em que a ciência parou. 

Tudo começou de manhã cedo. Eu subia as escadas do hospital em direção a minha sala, quando recebo a cópia de um artigo francês, enviado por um amigo que é uma das maiores referências mundiais no estudo de malária. Um cientista puro. O trabalho testara o benefício da hidroxicloroquina para o tratamento da COVID-19. A conclusão indicava que “o tratamento com hidroxicloroquina é significativamente associado a desaparecimento da carga viral” na doença em questão.

“... hydroxychloroquine treatment is significantly associated with viral load reduction/disappearance in COVID-19 patients”

Naquele primeiro lance de escada, comentei que este era um assunto para cientistas como ele, mas ainda não para corredor de hospital. Ele concordou. Minha resposta foi um tanto intuitiva, de relance. 

Já no segundo lance de escada (são apenas dois andares), me surpreendi com uma mensagem de um colega intensivista, mencionando que o estudo estava tendo grande repercussão nos grupos de medicina crítica. Comentei que já sabia (há 15 segundos).

Chegando ao corredor onde fica minha sala, me deparo com o coordenador das UTIs de meu hospital, que me expressou uma visão crítica a respeito do que estava acontecendo, embora todos ainda estivéssemos sem saber em detalhe do que se tratava. 

Ao longo do dia foram incontáveis mensagens apontando o estudo francês, culminando no anúncio do presidente Trump de que o FDA houvera aprovado a hidroxicloroquina para o tratamento do COVID-19.

"We have to remove every barrier or a lot of barriers that were unnecessary and they've done that to get the rapid deployment of safe, effective treatments" 

Trump acha que o rigor científico do FDA seria uma barreira desnecessária. Nessa irracionalidade, Trump não está sozinho. Muitos argumentam que em momentos de crise devemos reduzir este rigor. Há notícias que hospitais de referência incluíram este tratamento como opção em seus protocolos. 

Neste artigo, pretendemos abordar a inusitada qualidade do trabalho francês. No entanto, esta discussão perde o sentido diante de um ecossistema clínico em que evidência de qualidade é considerada “desnecessária devido à gravidade da situação”. 

Desta forma, mais do que uma discussão metodológica, precisamos aprofundar a interface do raciocínio clínico com a dimensão epistemológica da ciência. 


Coronavírus: devemos abandonar o ônus da prova?


No dia de hoje, a ciência parou e deu lugar a observações do tipo “nesta situação crítica, não podemos colocar barreiras científicas”. No entanto, estas observação carecem da diferenciação entre duas dimensões: sistêmica e a individual. 

Epidemia é uma situação sistêmica. Considera-se que a epidemia de coronavírus é potencialmente grave. Temos assim uma grave situação sistêmica, cuja conduta indicada são medidas populacionais  de redução da transmissão. Medidas de alto custo, que se julgam necessárias pela gravidade sistêmica. 

Por outro lado, uma vez adquirindo a doença, a análise de um paciente se torna individual e não sistêmica. Mesmo que uma doença tenha origem em uma epidemia, o tratamento do doente tem dimensão individual.

O doente tem um risco individual de morte e o tratamento oferecerá uma redução relativa do risco a este doente. Nesta dimensão individual, raciocinamos com probabilidade de desfecho indesejado em um paciente (risco individual). O risco individual é estimado pela mortalidade geral da doença. A mortalidade do coronavírus (dentre indivíduos que chegam ao diagnóstico) é de 2-3%. Observem que esta é uma mortalidade menor que sepse ou infarto do miocárdio. 

Sendo assim, a COVID-19 não representa uma condição em que se justifique a violação do ônus da prova científica. Se COVID-19 fosse o caso de dispensar evidências de tratamento individual, abandonaríamos evidências em muitas outras doenças agudas, cujos tratamentos são pautados na verdadeira demonstração de eficácia.

Portanto, aqueles que argumentam estarmos diante de uma situação em que se faz necessário a perda da integridade científica, na escolha de tratamentos individuais, estão confundindo as dimensões sistêmicas e individual. 


Quando evidências empíricas são desnecessárias?


Evidências empíricas de um tratamento são desnecessárias quando leis da natureza garantem a eficácia, independente de uma eventual comprovação empírica. Estas são situações de “plausibilidade extrema”, exemplificadas pelo paradigma do paraquedas, quando a lei da gravidade assegura a eficácia. Ventilar um paciente insuficiência respiratória extrema se encaixa nesta situação.

Uma variante da plausibilidade extrema são condições sem eficácia garantida da conduta, mas com prognostico negativo inexorável. Por exemplo, quando temos um quadro clínico de fatalidade garantida, em algumas situações, pode-se considerar a adoção de um tratamento empiricamente não comprovado. No entanto, esta conduta deve se restringir a tratamentos de efeito intermediário garantido. Por exemplo, ECMO na insuficiência respiratória ou circulatória extrema. Mesmo que não saibamos se no final das contas reduz mortalidade, sabemos que o tratamento tem um efeito garantido nas trocas gasosas ou circulatório. Este efeito intermediário é uma condição básica para que um eventual efeito benéfico final se faça presente. 

O caso do coronavírus não corresponde a condições de plausibilidade extrema. Primeiro, não temos uma doença de fatalidade inexorável, pelo contrário. Segundo, hidroxicloriquina não tem um efeito intermediário garantido.


Preciosismo científico?


Importante perceber que o rigor científico não serve à ciência. O rigor científico serve à sociedade e aos indivíduos. Ciência não é um fim, é um meio.

A tentativa de baixar o crivo da ciência carece da visão econômica sob a ótica probabilística. Economia no sentido de balancear consequências positivas e negativas. Probabilidade no sentido de reconhecer que benefícios e a consequências não intencionais têm imprevisibilidade. 

O benefício de um tratamento comprovadamente benéfico é probabilístico. O que oferecemos ao paciente é uma probabilidade. Ao reperfundir um paciente com infarto do miocárdio, temos uma probabilidade de 5% em salvar uma vida. Por isso que precisamos tratar 20 para beneficiar 1 (o paradigma do NNT). 

Se além disso, não sabemos se o tratamento é benéfico, a probabilidade vira condicional, ou seja P1 (probabilidade de benefício individual) x P2 (probabilidade do conceito científico ser verdadeiro). A multiplicação de duas probabilidades resulta em um probabilidade bem menor. 

Outro fator que não sabemos é o caráter do benefício: é prevenção de morte, de complicações, rapidez de recuperação, controle de sintomas? Estamos diante de uma pequena probabilidade de beneficiar e nem sabemos que tipo de benefício. 

Do outro lado, consequências não intencionais são múltiplas, desde algumas mais previsíveis a outras que nunca imaginaríamos. Neste caso não temos probabilidade condicional (P1 x P2). São muitas probabilidades, uma para cada tipo de consequência, e essas probabilidades de somam (P1 + P2 + P3 + P4 .....). 

Esta é a  base para o princípio da hipótese nula: partimos da premissa de não existência do benefício até que se prove o contrário. Isso não é apenas uma técnica científica, é um pensamento pragmático

Pode haver consequências clínicas negativas como efeitos adversos, interações medicamentosas. No entanto, julgo mais escalável as consequência indiretas: 

Primeiro, a dispersão dos esforços e atenção para condutas fúteis, em detrimento da valorização do básico, a qualidade assistencial. Diante de uma situação crítica, devemos nos concentrar para fazer de melhor o que devemos fazer, ao invés de nos distrairmos com condutas que não sabemos se devemos fazer. O impacto da qualidade assistencial (impossível de ser perfeita) em geral é imensurável e tente a ser maior que tratamentos específicos; 

Continuando as consequências indiretas: fadiga cognitiva da equipes médicas com um amontoado de informações inúteis; a falsa esperança; o uso político; o marketing clínico baseado em fantasia. No início desta epidemia, a comunidade médica criticava profissionais que tentavam vender suas terapias ortomoleculares ou coisas do gênero. Por que agora estamos fazendo o mesmo?

Essa discussão não corre em prol da proteção da ciência. Serve para protegermos nossa racionalidade, nosso paciente, nossa sociedade. 



O Artigo Francês


Este artigo é um aglomerado de vieses. Mas não são apenas vieses clássicos, há condutas que nem constam nos tradicionais checklists. Algo caricatural. Foram 26 pacientes que utilizaram hidroxicloroquina versus 16 pacientes controles. Um hospital de Marselha recrutou pacientes para o tratamento e outros centros de outras regiões recrutaram os controles. O desfecho foi substituto: a negativação virológica do swab nasal no sexto dia. 

At day6 post-inclusion, 70% of hydroxychloroquine-treated patients were virologicaly cured comparing with 12.5% in the control group (p= 0.001).  

Primeiro, viés de confusão. Randomização serviria para evitar o viés de confusão, o que não ocorreu. Mas este estudo vai além, ele causa viés de confusão. Não prevenir não é o mesmo que causar. 

O inusitado: pacientes de Marselha que recusavam o tratamento continuavam no estudo como grupo controle! Isso provoca grande heterogeneidade basal entre os grupos, pois pacientes que recusam são diferentes de pacientes que aceitam. Ao recusar um tratamento, os paciente não deveriam ser incluído no estudo. Na verdade, em um ensaio clínico, potenciais voluntários não recusam tratamento. O que eles recusam é entrar no estudo.

Seguindo o padrão de irracionalidade, pacientes que se encaixavam em critérios de exclusão (comorbidades, contraindicações à droga), eram incluídos no estudo como grupo controle. Pacientes mais graves, antes no grupo droga, foram transferidos para o grupo controle. 

Segundo, o estudo exclui do grupo tratamento pacientes que não completaram o tratamento, em um grosseira violação do princípio da intenção de tratar. Inadequadamente denominam isso de “loss of follow-up”. Não houve perda de seguimento, os pacientes continuavam disponíveis para ser avaliados. Na verdade, esta é uma análise por protocolo, em que 6 dos 26 pacientes saíram do estudo: 3 porque foram para a UTI, 1 porque morreu (!!), 1 porque teve náusea e outro teve alta hospitalar. Dos 6, 5 pacientes não continuaram o tratamento porque pioraram! E estes foram excluídos do grupo controle.

Terceiro, há possibilidade de viés de desempenho promovido por diferenças nas condutas gerais entre os grupos. Estudo aberto, grupo tratamento em hospital diferente do grupo controle. Devemos procurar sinais: espontaneamente 6 pacientes do grupo tratamento receberam azitromicina. Não que azitromicina vá resolver nada, mas isto é um sinal indicativo de maior atenção ou indicação de cuidados adjuntos. 

Quarto, risco de erro aleatório. Este é claramente um estudo pequeno, o que aumenta sobremaneira a probabilidade do erro aleatório. O cálculo amostral traz a ilusão de 85% de poder. No entanto, não apresenta a premissa de positividade do swab no grupo controle e estima uma inusitada eficácia de 50%. Algo bom demais para ser verdade para a maioria dos tratamentos, quanto mais para este de baixa probabilidade pré-teste. Portanto, aqui temos um estudo pequeno, com alto risco de erro aleatório. E para que um estudo pequeno consiga demonstrar “significância estatística”, esta precisa que ser tão grande que se torna “boa demais para ser verdade”. 

É uma redução relativa de 82% no positividade. Isso normalmente não acontece. No entanto, devemos reconhecer que para tratamento antibiótico esta grande magnitude de efeito pode acontecer. Por exemplo, se compararmos antibiótico com placebo em infecção bacteriana grave, o tamanho do efeito seria muito grande. Por outro lado, devemos evitar a ilusão de que estamos usando um antibiótico para o coronavírus.

Por fim, aqui estamos diante de um resultado laboratorial, o que conhecemos como desfecho substituto. Mesmo que considerássemos esse resultado confiável, ainda haveria uma grande incerteza do benefício clínico. 

Por tudo isso, este é um estudo a ser descartado, por seu alto risco de viés e acaso. Em um pensamento científico bayesiano, este estudo não aumenta a probabilidade da hipótese ser verdadeira. 


A Probabilidade Pré-teste


Há evidências de que a droga tem ação antiviral in vitro. Isso traz plausibilidade, que não deve ser confundida com probabilidade. A probabilidade é principalmente influenciada por dados clínicos geradores de hipótese (análise específica) e comportamento do ecossistema científico em casos semelhantes (análise genérica). Não temos dados empíricos prévios e é incomum que tratamento de um tipo de condição (malária, protozoário) tenha eficácia relevante em outra condição (viral). A estimativa probabilística deve ser feita assim, pensando no todo, e não na especificidade trazida por argumentos de plausibilidade. 

Desta forma, começamos por um tratamento de probabilidade pré-teste muito baixa, nos deparamos com um estudo que não tem valor em modificar esta probabilidade, e terminamos com a ilusão de um tratamento com alta probabilidade de benefício. O que aconteceu com nossa mente científica?



O Preço da Irracionalidade


Certa feita um velho encontrou um vírus na estrada e perguntou: para onde você está indo? O vírus respondeu que estaria indo matar 10.000 pessoas em uma certa cidade. Dias depois, o velho encontrou novamente o vírus e perguntou: porque você matou 100.000? O vírus respondeu: eu matei apenas 10.000, o resto morreu de medo. 

Em tempos segurança real moderadamente reduzida (consideremos o denominador), temos nossa segurança perceptível severamente afetada. A epidemia de coronavírus cedeu o protagonismo para  à epidemia do medo. A percepção da realidade é alterada por um viés de confirmação voltado para o pior cenário. Ao final do dia, o placar estatístico registra as piores notícias, os piores países, o número de doentes, o número de mortes, silenciando aqueles os que permanecem saudáveis, os que se curaram ou os países de menor impacto da doença. A interpretação do passado é enviesada. 

Já a predição do futuro tem esquecido que um intervalo de confiança que contém os extremos do pessimismo e otimismo. A ciência da predição e tomada de decisão probabilística deu lugar a decisões baseadas em medo.

Mesmo em situações não indicadas, preferimos usar máscaras que escondem nossa expressão facial, perdendo oportunidade de expressar um sorriso de esperança e otimismo. Não precisamos de hidroxicloriquina. Precisamos de um remédio para a irracionalidade, pois esta tem impacto potencial mais escalável do que o coronavírus. 

A perda da racionalidade pode ter um preço muito maior do que pensamos. Esse é valor da ciência, nos lembrar do incompreensível valor da incerteza e da racionalidade.

sexta-feira, 31 de janeiro de 2020

Coronavírus: a epidemiologia do medo


Este artigo, escrito em 31 de janeiro de 2020, é sobre risco perceptível individual, medo versus probabilidade. Passados 2 meses, a reflexão se tornou ainda mais relevante pelo aumento de casos de coronavírus. Os números à época, estáticos, foram usados para a reflexão da segurança perceptível à época, demonstrando uma dissociação que é universal, inerente da mente humana, independente de época ou local. 

Desde aquele momento, o texto reconhecia a importâncias das medidas de saúde pública. Assim, esse texto não deve ser interpretado como antagônico às medidas de prevenção. 

Por fim, a provocação "aconteceu um cisne negro?", continua nos intrigando do ponto de vista epidemiológico. Precisaremos de mais tempo para fazer essa reanálise. E o ponto de partida será este artigo. Aguardemos. 

31 de janeiro de 2020

Há duas semanas o surgimento do coronavírus na China é o principal assunto dos noticiários e manchetes de jornal. A bolsa de valores caiu, o dólar subiu, o ministro da saúde deu entrevista coletiva e a Organização Mundial de Saúde declarou que a infecção pelo novo coronavírus é uma “emergência de saúde pública”. 

O medo está instalado. Uma amiga, enfermeira, me questionou se deveria desmarcar suas férias nos Estados Unidos. Falei que ela deveria ir, desde que não passeasse de helicóptero. 


Risco Perceptível (população e indivíduo)


Nesta postagem, usarei o pensamento epidemiológico como norte probabilístico para a percepção de risco individual. Racionalmente, o risco perceptível do ponto de vista populacional deve ser diferente do risco perceptível de indivíduos da mesma população. 

Governos e órgãos de controle de doenças infecciosas devem encarar o risco potencial do novo coronavírus se tornar epidêmico. Assim, enfáticas medidas de saúde pública são tomadas para reduzir a probabilidade da doença se alastrar de forma indesejável. Estas medidas estão corretas. 

Mas o equívoco cognitivo surge quando essas medidas, por serem disseminadas, trazem a conotação inadequada de que indivíduos estão sob alto risco.

O risco significativo de uma população sofrer uma epidemia não é o mesmo risco de um indivíduo dessa população se tornar doente. 

População e indivíduos da população são diferentes. Para um indivíduo doente é bom que sua doença seja menos patogênica; mas para a população, a baixa patogenecidade não é tão boa, pois aumenta a transmissão da doença. 

Paradoxalmente, quanto menos patogênica a doença é, mais provável desta se disseminar. O novo coronavírus tem em torno de 2% de letalidade, diferente do SARS (2003) que apresentou 10% de letalidade. A menor patogenicidade deste vírus faz com que muitos infectados não se sintam doentes e continuem transitando normalmente, aumentando a disseminação da doença. Por isso que os agentes chineses medem a temperatura de qualquer pessoa que passa pela rua.

Por outro lado, doenças de maior letalidade fazem com que o indivíduo fique tão doente que não consegue sair de casa, a não ser que seja para ir ao hospital. Assim, fica mais fácil de isolar estes indivíduos. Pior para o indivíduo, melhor para a população. No entanto, ao ver as medidas de isolamentos de cidades e agentes vestidos de branco pelas ruas, isso nos remete a uma doença de maior gravidade. Intuitivamente, ficamos com mais medo das consequências.

Assim, a probabilidade de uma epidemia se instalar não é o mesmo da probabilidade de uma pessoa ficar doente, muito menos desta pessoa morrer da doença. Ao pensar individualmente (sentimento de medo) devemos racionalizar risco e dano.

Qual o risco de eu adquirir a doença?
Qual o dano se eu adquirir a doença?


Risco de Doença


Farei um exercício probabilístico que não tem a pretensão de retratar de forma acurada a epidemiologia do problema, mas sim de tratar de forma acurada a percepção de risco quanto ao problema. 

Vamos imaginar o pior cenário: vivemos na China. Até hoje foram 9.720 casos diagnosticados e 213 mortes na China. Se dividirmos o número de casos pela população da China (1,4 bilhões), a probabilidade de um chinês ter adquirido a doença até então é:

0.0007% (risco).

Justifica o medo? Não.

Sim, a doença vai se disseminar além das cifras atuais, afinal há um crescimento do número de casos. Mas observe que o denominador chinês não permitirá que a perspectiva mude. 

Sim, é diferente um chinês em Pequim (menor risco) de um Chinês em Wuhan (maior risco). Estou trabalhando com a média ou suposição de homogeneidade de risco na China. Por outro lado, não estamos na China e nosso risco em qualquer outro lugar do mundo é menor do que Pequim. Por isso o cálculo vale para o ajuste cognitivo. 


Dano da Doença


Agora vamos ao dano. Em adquirindo a doença, qual a probabilidade de morte? 2%

Não é desprezível, mas se pensarmos na probabilidade de 98% de sair vivo e ao comparar com outras doenças agudas, até que esta não é das piores. A letalidade da pneumonia bacteriana comunitária no idoso é muito maior do que isso, sendo esta uma doença muito mais comum do que coronavírus.

Mas ninguém anda com pânico de pneumonia.


Risco de Morte: Risco*Dano


Finalmente, devemos combinar risco e dano. Ou seja, qual a probabilidade de uma pessoa da população adquirir a doença e morrer dela. Isso é uma probabilidade condicional, ou seja, P1 x P2.

Risco da doença = 0.0007% x Risco de morte = 2% = 0.00001% = 1 morte por 7 milhões

Desta forma, do ponto de vista individual, o medo não se justifica por bases probabilísticas. 


Diálogo com a População


Justifica que ministros façam coletivas de imprensa? Justifica que as redes de TV convidem um exército de infectologistas para a televisão? Justifica que esta seja uma notícia dominante das últimas semanas?

Na verdade, isso pouco importa aos indivíduos da população, a não ser que o indivíduo trabalhe em algum escritório de controle de doenças infecciosas do ministério da saúde. Os governos precisam se planejar, cuidar do risco populacional. Enquanto os indivíduos podem viver suas vidas tranquilamente. 

É justificável a preocupação profissional com esta questão; mas não é justificável a preocupação pessoal. O assunto deve predominar em reuniões de profissionais voltados para controle epidemiológico. Não é conversa de shows televisivos. 

Claro, é natural que o assunto surja. Neste caso, como profissionais de saúde, devemos aproveitar a oportunidade para o literamento probabilístico da sociedade. Afinal, passamos a vida decidindo com base na razão de risco e benefício.

Se a população fosse uma pessoa, esta poderia estar com medo. A pessoa da população é o governo, este precisa se movimentar. Quando a nós, indivíduos, temos problemas muitos mais importantes para nos preocuparmos. Quanto mais nós, brasileiros bombardeados a cada dia por crises desencadeadas por problemas comportamentais que surgem de forma mais inesperada do que qualquer epidemia. Já temos nossos próprios “coronavírus”, incluindo nossos problemas de saúde pública. 


Teremos um Cisne Negro?


Cisnes Negros, definidos por Nassim Taleb, são eventos improváveis, imprevisíveis e de grande impacto, que escrevem a história do mundo. Caso essa doença se alastre enormemente, isto poderá mudar o mundo. No entanto, o cisne negro só ocorre quando é imprevisível, pois se for previsto medidas preventivas impedem seu surgimento. 

A epidemia já está prevista como uma possibilidade e medidas agressivas estão sendo tomadas pelos governos. Além disso, a história recente deste tipo de vírus (severe acute respiratory syndrome coronavirus (SARS-CoV) em 2002 e Middle East respiratory syndrome coronavirus (MERS-CoV) em 2012) sugere baixa probabilidade de uma catástrofe. 

Em termos probabilísticas, não teremos um cisne negro e, após algum tempo, essa história se dissipará


O Helicóptero da Racionalidade


Há poucos dias, meu ídolo do basquete americano, Kobe Bryant, morreu em um acidente de helicóptero. Isso me remeteu à seguinte questão: o que as pessoas mais temem nos dias atuais: 

uma viagem de alguns dias pela China ou 

um passeio de helicóptero sobre o Grand Canyon?

Fiz essa pergunta no tweeter:



 O mais frequente é o temor da China. Isto é racional?

Já sabemos que o risco de morte por coronavírus na china é 1 em 7 milhões. 

Pesquisei, e encontrei que o risco de uma queda fatal de helicóptero é 1 / 250.000 (passeios-hora).

Portanto, precisaríamos fazer 28 viagens à China para igualar o risco de morte em um despretencioso passeio turístico de helicóptero. 

De fato, emoção não é o mesmo que razão. Mas quando se trata de medo ou pânico, cabe a tutores da percepção sobre questões de saúde aproveitar a oportunidade e alfabetizar cientificamente a sociedade. 

Valorizem a incerteza, calculem as probabilidades. 

segunda-feira, 13 de janeiro de 2020

A Desfocada Controvérsia do EXCEL Trial


Forte controvérsia originada no final do ano passado decorreu da publicação dos resultados de cinco anos do ensaio clínico EXCEL no New England Journal of Medicine, o qual concluiu por semelhante eficácia entre angioplastia coronária e cirurgia de revascularização em pacientes com lesão de tronco de coronária esquerda. 

O principal argumento dos críticos ao estudo reside na definição do desfecho infarto do miocárdio (magnitude laboratorial da necrose) escolhida pelos autores do trabalho, o que teria induzido uma falsa semelhança entre angioplastia e cirurgia. 

Controvérsias se perpetuam quando os dois lados usam argumentos fracos e escolhidos por vieses de confirmação. A conclusão do EXCEL é inadequada, mas não exatamente pelas razões apontadas pelos seus críticos. Nesta postagem discutiremos as verdadeiras violações de racionalidade científica deste trabalho, que se apontadas corretamente resolveriam melhor esta questão.

O EXCEL trial nos dá oportunidade de discutir os conceitos de desfecho composto e estudo de não-inferioridade, que quando aplicados de forma inadequada podem gerar prejuízos científicos. 


BBC de Londres

O assunto se tornou mundialmente conhecido por uma reportagem da BBC de Londres, baseada em entrevistas com cardiologistas críticos ao estudo EXCEL. Protagonizou a controvérsia o cirurgião da Oxford David Taggart, que fazia parte do steering committee do EXCEL. Este retirou seu nome da lista de autores do EXCEL devido a insatisfação com a definição de infarto que teria promovido o “inadequado” resultado do estudo. 





O EXCEL trial randomizou 1905 pacientes com lesões de tronco de coronária esquerda para angioplastia coronária ou cirurgia de revascularização. Como é de conhecimento geral, esta é uma condição tradicionalmente tratada por cirurgia. Na última década, o tratamento por angioplastia com stent se mostrou factível para esta condição, tornando-se uma opção alternativa. O Excel comparou os dois tipos de tratamento quanto ao desfecho combinado de morte, infarto não fatal ou acidente vascular cerebral. E concluiu que não há diferença significativa entre os dois tratamentos. 

“There was no significant difference between PCI and CABG with respect to the rate of the composite outcome of death, stroke, or myocardial infarction at 5 years”.


O Equívoco da Crítica (definição de infarto)

O desfecho "infarto" foi definido a priori no protocolo do estudo e contempla infarto espontâneo e infarto periprocedimento (elevação de marcadores de necrose durante os procedimentos de angioplastia ou cirurgia). Os autores definiram que infarto periprocedimento seria elevação de 10 vezes o limite da normalidade da CK-MB ou elevação de 5 vezes se acompanhado de nova onda Q no eletrocardiograma, nova obstrução no cateterismo ou perda de motilidade de alguma parede ventricular. Mas o ponto principal da crítica foi a igualdade de definição de infarto para angioplastia ou cirurgia. 

Os críticos do estudo argumentam que o correto seria a utilização da “Definição Universal de Infarto”, que usa 5 vezes o limite da normalidade para angioplastia e 10 vezes para cirurgia. Se isto fosse usado, haveria mais infarto no grupo angioplastia, mudando o resultado do estudo. Conta a reportagem que a BBC teve acesso aos dados do estudo, fez a análise e concluiu que a conclusão seria favorável à cirurgia se fosse utilizada a definição universal. 

Aí surge o primeiro conceito a ser discutido neste contexto: a confusão entre critérios clínicos e critérios científicos. Critério clínico serve para rotular pacientes, com implicações diagnósticas, prognósticas e de decisão terapêutica. Critério científico serve para testar hipóteses. 

Na medida em que estamos avaliando qual dos dois tratamentos causa mais infarto (necrose miocárdica), o critério de necrose miocárdica deve ser igual entre os dois. Seria uma violação científica usar critérios diferentes. Isso geraria ascertainment bias, quando membros de um grupo são avaliados de forma diferente do outro grupo, predispondo a maior detecção do desfecho em algum dos grupos. É um tipo de viés de observação, que eu traduziria como viés de apuração.

Por outro lado, a Definição Universal de Infarto é clínica, não há preocupação científica e utilizamos um limite maior para pacientes cirúrgicos, pois do contrário haveria diagnóstico clínico de infarto em muita gente operada, sem grande impacto prognóstico. Observe a frase contida na introdução do documento da Definição Universal: “with increased cardiac markers, clinicians must distinguish whether patients have suffered a infarction". A definição universal é um critério clínico, não científico.

Embora meu argumento seja em defesa da escolha dos autores do trabalho, isso é apenas uma questão de definição. Outros argumentos poderiam ser utilizados para outras definições. Portanto, não há uma definição correta e outra errada. Eventos que correspondem a um combinado de critérios, como infarto ou sangramento, variam de estudo para estudo. E isso é natural. O importante é que haja um racional na definição e que, principalmente, seja definido a priori. 

Os critérios de infarto do EXCEL foram previamente definidos como desfecho primário. No entanto, os críticos do EXCEL desejam fazer prevalecer uma definição que não foi pré-definida como desfecho primário. Há uma violação intrínseca de um princípio de integridade científica básico na crítica ao EXCEL. 

A definição do EXCEL pode não ser a Definição Universal de Infarto, mas tem sentido científico e foi feita a priori. 

OBS: A publicação atual do EXCEL é uma análise secundária de um desfecho primário. A análise primária era seguimento de três anos que já havia sido publicado e discutido neste Blog em 2016. Importante salientar que análises secundárias também devem utilizar critérios pré-definidos, a fim de evitar o problema das múltiplas comparações. 


A Boa Crítica

A boa crítica metodológica ao EXCEL seria a inadequação de incluir infarto periprocedimento na definição de infarto. Isto porque um “desfecho” é uma ferramenta científica voltada para mensurar um “efeito”: neste caso, comparar o benefício entre um tratamento tradicional e uma nova proposta. Infarto periprocedimento não é benefício, é malefício. Quando um desfecho composto combina benefício e malefício, torna confusa a interpretação. E isso aconteceu no EXCEL. 

Para complicar, infarto periprocedimento tem valor prognóstico muito questionável, diferente de infarto espontâneo. São entidades de diferentes valores combinadas como se fossem os mesmos. 

Ao colocar infarto periprocedimento e infarto espontâneo no mesmo desfecho, estes apresentaram resultados diametralmente opostos (o primeiro a favor da angioplastia e o segundo a favor da cirurgia), um anulou o outro e os grupos ficaram semelhantes. No entanto, o que media benefício era apenas infarto espontâneo.

A melhor estratégia seria incluir apenas infarto espontâneo no desfecho primário de benefício e colocar infarto periprocedimento como um desfecho (secundário) de segurança. 

Exatamente isto foi feito no ensaio clínico NOBLE, um estudo parecido com o EXCEL, publicado no Lancet na última semana de dezembro, tendo falhado em demonstrar não-inferioridade por parte do grupo angioplastia. A conclusão do NOBLE trial foi “The findings of this study suggest that CABG might be better than PCI for treatment of left main stem coronary artery disease.”




Portanto, aqui está o segundo conceito de nossa discussão: um desfecho composto deve ter homogeneidade de função entre seus componentes, no sentido de que todos devem avaliar um mesmo fenômeno (no caso, o benefício). 


A Não-inferioridade

O segundo argumento correto para criticar o EXCEL está na mudança da hipótese primária do estudo. Primariamente, este foi um estudo desenhado para testar não-inferioridade da angioplastia. A margem de não-inferioridade pré-definida foi 4.2% em termos absolutos, ou seja, se toleraria até esta marca para afirmar que angioplastia não é muito inferior. Esta é a margem superior do intervalo de confiança. Ou seja, dentro da incerteza do estudo, a inferioridade não passaria de 4.2%. Na publicação original (3 anos de seguimento), a diferença absoluta no desfecho composto foi de 0.7% a favor da cirurgia, sendo que a margem superior do intervalo de confiança foi de 4.0%. Chegou perto, mas o estudo concluiu por não-inferioridade. 

Agora, observem que as curvas de sobrevida da cirurgia e angioplastia vão se separando com o tempo. Isto porque a cirurgia é um tratamento que bypassa todas as lesões, portanto mais duradouro - mesmo que surjam novas lesões as pontes a estão bypassando. É por isso que, com o tempo, a angioplastia vai perdendo espaço para a cirurgia. Foi exatamente esta percepção que provocou os autores a expandir a análise para cinco anos (publicação atual). E o intervalo de confiança desta análise ultrapassou sobremaneira o limite de não-inferioridade, chegando a 6.5%. Portanto, se a hipótese primária fosse mantida nessa análise de cinco anos, angioplastia não sobreviveria como um tratamento não-inferior. 

No entanto, sem uma clara justificativa, nem cálculo amostral prévio que garantisse poder estatístico, os autores modificaram a análise de não-inferioridade para superioridade. Na análise de não-inferioridade, o ônus da prova de benefício está na angioplastia, enquanto na análise de superioridade, o ônus da prova está na cirurgia que precisaria demonstrar ser melhor. Invertendo o ônus da prova, a diferença a favor da cirurgia (19.2% versus 22%) não se mostrou estatisticamente significante (P = 0.13). Ou seja, não podemos afastar o acaso na afirmação de que cirurgia é melhor. 

Neste momento surge o terceiro conceito a ser enfatizado nesta postagem: em estudos de não-inferioridade como o EXCEL, a premissa básica é de que o novo tratamento é inferior, até porque este tratamento não precisa ser igual, nem melhor, para que seja utilizado. Mesmo sendo inferior, pode valer a pena evitar uma cirurgia cardíaca. Claro, até um certo ponto. Portanto, não-inferioridade significa que não é inferior a ponto de tornar o tratamento inadequado. Não-inferioridade significa que a eventual inferioridade não invalida o tratamento.

Isto quer dizer que a hipótese de não-inferioridade parte da premissa de inferioridade. E isto está totalmente de acordo com o conhecimento prévio da literatura sobre o tema. Em pacientes com DAC grave, estudos prévios (FREEDOM, SYNTAX, BEST) mostram que cirurgia é melhor em pacientes com anatomia grave. Isso não seria muito diferente neste caso. Portanto, cirurgia é melhor, ponto. O que está em questão é o quanto angioplastia é pior. 

Aí surge o quarto conceito: estudo de não-inferioridade não deve ter um caráter dicotômico (inferior - sim ou não). Estudo de não inferioridade deve ter um caráter mais descritivo, refletindo a incerteza do grau de inferioridade. Precisamos evoluir para olhar o intervalo de confirança, considerar o limite superior como a pior das hipóteses, e usar essa informação na decisão individualizada. Para alguns pacientes de baixo risco cirúrgico, toleramos menos inferioridade da angioplastia, para outros de alto risco cirúrgico toleramos mais inferioridade. Assim, o que devemos ter em mente e levar para a decisão é a pior das hipóteses. Não é um fator primordial dicotomizar a análise em positiva ou negativa para não-inferioridade.

Diferente de estudo de superioridade, que tenta demonstrar qual dos dois tratamentos ganha o jogo (ganha ou perde - dicotômico), no estudo de não-inferioridade um dos tratamentos já chega com a premissa da derrota e nós avaliamos qual a derrota de pior placar possível (descritivo). 

Portanto, nunca deveria ter estado em questão se os tratamentos são equivalentes. A questão era o quanto a angioplastia poderia ser pior, e isso deveria ter sido avaliado neste seguimento de cinco anos pela análise de não-inferioridade. Isto foi feito no estudo NOBLE, que usou a análise de não-inferioridade aos cinco anos.


Conclusão

A controvérsia a respeito do estudo EXCEL falha ao se ligar em detalhes de menor relevância e facilmente contestados, negligenciando uma visão de conceitos científicos que tornariam mais clara a solução para o caso. O pensamento científico adequado transcende detalhes de definições clínicas,  e amplia nosso pensamento para o verdadeiro significado das evidências.

Cirurgia de revascularização é melhor. A questão é o quanto melhor. No estudo NOBLE, cirurgia (comparada a angioplastia) reduz risco de eventos em relativos 22% (morte foi igual),  absolutos 9%. Em média, precisamos operar 11 pacientes para prevenir um desfecho. Esta informação, descritiva, deve ser utilizada em uma decisão individualizada por perfil de risco cirúrgico e preferência do paciente. 

Cirurgia é algo melhor, e esse algo deve ser contemplado na decisão individual. Independente da discussão dicotômica, as evidências destes ensaios clínicos não devem servir para definir qual o tratamento de preferência. Mas sim para nos fazer entender que, antes de olhar o paciente, clínica e pessoalmente, não devemos ter preferência. A decisão final está na aplicação do norte vindo da evidência (NNT = 11) em uma pessoa com todas as suas individualidades.

No centro desta discussão, deveriam estar conceitos científicos e principalmente a pessoa que tem a pele no jogo.


--------------------------------------------------------------------------------------------------------------------------


Pessoal, cliquem aqui para serem direcionados ao nosso curso online de MBE, com 150 aulas em streaming, compreendendo princípios do pensamento médico-científico, princípios da medicina baseada em evidências, pensamentos originais, integridade científica e análise crítica de evidências científicas em forma de "arte" (visão do todo > partes). Leiam conteúdos dos módulos e experimentem as aulas disponíveis na plataforma de apresentação


Atenção: em janeiro, lançamento da primeira temporada de nosso podcast MBE. Aguardem.