Medicina Baseada em Evidências: 2016

domingo, 20 de novembro de 2016

Stent no Tronco (EXCEL Trial): Fato ou Ficção Científica?

Recentemente o EXCEL trial foi publicado no New England Journal of Medicine, o que desencadeou mensagens céticas pedindo que eu abordasse este estudo no Blog. Alguns colegas demonstraram desconforto com a credibilidade do estudo a favor da utilização da terapia percutânea no tratamento de lesões de tronco de coronária esquerda.

Este foi um ensaio clínico randomizado que testou a hipótese de não inferioridade da intervenção coronária percutânea com stent em relação à terapia cirúrgica, que é o tratamento convencional para pacientes com este tipo de anatomia.

Para quem ainda não é familiarizado com o conceito de não inferioridade, leiam posts prévios deste Blog (1, 2, 3).

Interpretação Clínica do Resultado

Vamos começar pela margem de não inferioridade de 4.2% em termos absolutos para o desfecho combinado de morte, infarto e AVC. É uma margem muito tolerante (muito ampla)? Talvez fosse se estivéssemos comparando um tratamento modestamente vantajoso em relação ao tradicional (por exemplo, um medicamento cuja via de administração fosse mais prática). No entanto, aqui estamos diante de um tratamento cuja vantagem é enorme. Ou seja, resolver seu problema com o implante de stent é enormemente mais vantajoso do que abrir o peito para fazer uma revascularização miocárdica. Vantajoso em relação a complicações graves, ao sofrimento físico e psicológico, ao tempo de internamento, à cicatriz, etc. Nesta circunstância, é possível aceitar uma margem de não inferioridade mais ampla.

Ao considerar a margem de não inferioridade de 4.2%, o estudo poderia dar significativo até mesmo se o limite superior do IC fosse de 4.1% a favor da cirurgia. E qual foi o resultado? O limite superior do intervalo de confiança foi 4.0%, fazendo com que o estudo fosse significativo (P = 0.02) para não inferioridade.

Em linhas gerais, 4% de risco absoluto é um aumento grande, mas se considerarmos a vantagem do tratamento percutâneo, este aumento se torna aceitável.

A lição principal é que a análise da margem de não inferioridade não é apenas estatística, deve considerar o quanto vantajoso é o tratamento alternativo.

Observem que 4% de aumento de risco com o tratamento percutâneo, significa um NNT = 25 a favor da cirurgia. Ou seja, 25 pacientes abdicariam do tratamento mais simples (menos sofrimento) e fariam cirurgia (mais sofrimento), para que apenas 1 paciente se beneficiasse da conduta mais sofrida.

Há formas diferentes de colocar isso em uma decisão compartilhada com o paciente: “Operando, você tem 4% de probabilidade de sair ganhando ou você pode dar a sorte (probabilidade) de ser 1 dos 25 que sairá ganhando ou você tem uma chance (odds) de sair ganhando de 1 para 24." Sabendo disso, você apostaria na cirurgia ou preferiria o tratamento mais simples?

No raciocínio de economia clínica, o preço do tratamento cirúrgico (mais sofrimento) é garantido. Porém o retorno do investimento não é garantido, há apenas 4% de probabilidade de retornar o investimento sob a forma de prevenção de desfecho cardiovascular (NNT = 25). Pensando economicamente, a maioria escolheria o tratamento com stent. Imagino que até mesmo cirurgiões que se tornassem pacientes prefeririam o tratamento com stent.

Mas tem outro argumento a favor do tratamento com stent. O limite superior do IC é o que pode ocorrer na pior das hipóteses, porém esse valor é sempre menos provável de ser verdade do que a medida pontual (central) do risco absoluto. Dentro de um intervalo de confiança, os valores não têm a mesma probabilidade de ocorrer. Quanto mais central o valor, mais provável. Portanto, depois de testarmos a hipótese estatisticamente pelo limite superior do IC, devemos olhar a medida pontual como uma análise complementar. E esta medida pontual foi praticamente zero (0.7%), indicando que é muito mais provável que os tratamentos sejam iguais, do que o tratamento percutâneo seja inferior à cirurgia na prevenção de eventos maiores.

Desta forma, considero esta uma evidência suficiente para colocar o tratamento com stent como uma opção, especialmente se o problema for limitado ao tronco e em pacientes de SYNTAX baixo, pois este estudo excluiu pacientes de SYNTAX alto. Esta alternativa fica ainda mais atraente se estivermos desconfortáveis pelo risco cirúrgico.

Por outro lado, a cirurgia é melhor para controle de sintomas, principalmente em pacientes multiarteriais (NEJM 2015). Desta forma, se o paciente for multiarterial e tiver angina crônica, o raciocínio de economia clínica muda. Passa a ser muito mais garantido o retorno do investimento cirúrgico sob a forma de controle de sintomas.

Embora eu julgue que a conclusão do EXCEL trial seja verdadeira e relevante, vale salientar duas espertezas que foram utilizadas pelo estudo para aumentar a probabilidade de sucesso em sua conclusão.

**Esperteza na Análise dos Dados (intenção de tratar)**

Análise por intenção de tratar é a mais adequada em estudo de superioridade, pois evita viés a favor da superioridade de algum tratamento ao excluir pacientes que não receberam tratamento. Estes tendem a ser pacientes de pior prognóstico e a exclusão deles promove que (a despeito da randomização inicial) o grupo se torne de melhor prognóstico.

Por outro lado, o raciocínio no estudo de não inferioridade é inverso. Neste tipo de estudo, a análise de intenção de tratar enviesa o resultado a favor da hipótese que o autor deseja comprovar. Isto porque ao manter na análise pacientes que receberam o tratamento para o qual não foram alocados (cross-over), o resultado dos dois grupos tendem a se aproximar, ou seja, a incidência do desfecho primário fica mais parecida entre os dois grupos. Neste estudo, por exemplo, a análise por intenção de tratar manteria pacientes do grupo stent que foram operados e pacientes do grupo cirurgia que receberam stent. Isso vai na direção de mostrar resultados semelhantes, enviesa o estudo em prol da não inferioridade.

Para evitar esse viés, se considera que a análise por protocolo (aquela que exclui pacientes que tiveram cross-over de tratamento) é a mais adequada (ou menos inadequada) em estudo de não inferioridade. Estranhamente, os autores não pré-definiram a análise por protocolo como a principal, preferiram considerar a análise por intenção de tratar como a primária. Fica claro aqui uma estratégia para tornar o estudo enviesado a favor da hipótese desejável.

Perceber uma provável intenção de levar vantagem não garante que um indivíduo levou vantagem. Ou seja, isso não necessariamente anula o resultado do trabalho. No presente estudo, análise por protocolo (secundária) mostrou resultados semelhantes à análise por intenção de tratar. A conclusão do trabalho seria a mesma se (corretamente) a análise por protocolo fosse a primária. Por este motivo, considero que este viés no desenho do estudo não invalida seu resultado.

A esperteza funcionaria se a análise por protocolo fosse negativa e a intenção de tratar (escolhida como primária) positiva. Daí suspeitaríamos que o resultado do estudo poderia ser um falso-positivo. Mas isso não ocorreu, as duas análises coincidiram. Fico com a veracidade do resultado do estudo.

Esperteza na Definição do Desfecho Combinado

O desfecho primário deste estudo é um combinado de morte, infarto e AVC. Este é um estudo de não inferioridade, no qual há razão para se achar que o tratamento cirúrgico é algo melhor do que o tratamento percutâneo nos componentes morte e infarto. Portanto está correto focar na não inferioridade da intervenção percutânea para estes desfechos. Mas observem o terceiro componente, AVC. Sabemos que cirurgia causa mais AVC do que intervenção percutânea, que quase não causa AVC. Portanto, ao colocar este componente em um desfecho combinado que testa não inferioridade do tratamento percutâneo, uma previsível vantagem em AVC por parte do tratamento percutâneo poderia compensar uma inferioridade deste nos desfechos morte e infarto.

Não se deve colocar em desfechos combinados componentes que apresentem diferentes direções, pois uma verdade pode anular outra verdade. Idealmente, o teste de não inferioridade deveria ser em relação a morte e infarto. E o AVC seria analisado em separado, sob a forma de superioridade, como um desfecho de segurança.

A despeito disso, olhando os números, não houve mais eventos de AVC no grupo cirurgia que anulasse uma vantagem em morte ou infarto. Sendo assim, usarei a mesma frase que usei no caso da escolha por intenção de tratar: este viés no desenho do estudo não invalida seu resultado.

Mas que foi uma combinação inadequada de desfechos, isso foi … Poderia ter sido comprovado uma falsa não inferioridade.

Isenção na Análise Crítica

Este estudo é um exemplo de que devemos ser isentos da análise crítica de um trabalho. Percebemos potenciais conflitos de interesse no desenho do estudo, porém não devemos nos emocionar com isso e jogar fora o resultado do trabalho. Principalmente quando se trata de um trabalho que randomizou 1900 pacientes com lesão de tronco de coronária esquerda para dois tipos de tratamentos intervencionistas. Não é porque o estudo cheirou a esperteza, que devemos desconsiderar seu resultado, caso a análise sugira veracidade. O estudo nos traz um resultado útil clinicamente.

O valor da informação proveniente de um trabalho científico pode ser maior do que o valor da intenção do pesquisador.

Enfim, Qual a Melhor Conduta?

Afirmei acima que o estudo sugere o tratamento percutâneo como uma alternativa válida. Mas qual seria a primeira opção, cirurgia ou stent?

Se a única lesão importante for a do tronco de coronária esquerda, acho que este estudo respalda o tratamento percutâneo com a melhor opção, pois este tenderá a ser semelhante no controle de sintomas, não inferior na prevenção de desfechos maiores e é um tratamento muito menos desagradável.

Por outro lado, se o paciente for multiarterial (metade dos pacientes do estudo), sabemos que a cirurgia é superior no controle de sintomas (NEJM 2015). Portanto, partindo de dois conceitos (o de não-inferioridade do tratamento percutâneo em desfechos maiores e o de superioridade da cirurgia em controle de sintomas), devemos tomar uma decisão individualizada pelo risco cirúrgico e pela preferência do paciente.

Medicina baseada em evidências não é medicina baseada em regras ou copiada de artigos, pelo contrário, é o exercício da individualização, norteada por conceitos científicos.

_______________________________________________________________________

Objetivos Didáticos desta Postagem:

- Análise crítica da margem de não inferioridade
- Raciocínio de economia clínica
- Análise por intenção de tratar versus análise por protocolo
- Desfechos contra-direcionais como combinados

Conheça nosso Curso Online de Medicina Baseada em Evidências, clicando aqui.

sábado, 12 de novembro de 2016

Precisamos do Janeiro Branco

Saímos de um outubro rosa, entramos em um novembro azul. Todos os outros meses já estão ocupados por doenças e não há mais cores para todas elas. Segundo artigo da Folha de São Paulo, fevereiro é da leucemia, março do câncer de colo de útero e câncer de colorretal, abril é do câncer de testículo, maio é da hepatite, lúpus e câncer cerebral, junho do melanoma e leucemia, julho das hepatites virais, setembro das doenças cardiovasculares, câncer de pâncreas e suicídio, dezembro da AIDS e câncer de pele.

Fico a me perguntar se a cultura mensal de homenagem colorida à doenças promove redução de mortalidade ou melhora de qualidade de vida. Intuitivamente sim, mas às vezes a verdade é contra-intuitiva.

Esta é uma questão de economia clínica: há sempre um preço (não monetário) a pagar por nossas condutas, portanto precisamos avaliar qual o benefício que recebemos em troca do que pagamos. Vejamos primeiro o benefício, depois o preço relacionados aos meses mais coloridos do ano, outubro e novembro.

O Benefício (ou a falta dele)

Considerando que a tônica mais forte das campanhas é a detecção precoce dos cânceres, estas incentivam os rastreamentos em indivíduos assintomáticos, o que de fato aumenta a incidência dos diagnósticos. Porém evidências científicas adequadas não demonstram redução de mortalidade total pelo rastreamento azul (próstata) ou rosa (mama).

Ensaios clínicos de boa qualidade, envolvendo grande número de pacientes, mostram idêntica mortalidade por câncer de próstata quando comparados indivíduos randomizados para rastreamento ou não rastreamento desta patologia.

Já no caso rosa, acho as evidências ainda mais interessantes. Por exemplo, revisão sistemática da Cochrane mostra ensaios clínicos em que o rastreamento reduz (bem pouquinho) mortalidade por câncer de mama. No entanto, quando os trabalhos foram divididos por qualidade metodológica em dois grupos, os estudos de boa qualidade eram negativos, enquanto os estudos positivos eram os de pior qualidade metodológica. Porém o dado mais relevante está na análise de mortalidade total (independente da causa). Os ensaios clínicos são consistentes em demonstrar semelhante incidência de morte total em pacientes rastreadas ou não rastreadas.

No fundo, o que importa é salvar uma vida, e não trocar o mecanismo de morte em umas poucas pacientes. Na verdade, esta diferença de resultado entre morte específica e morte total sugere que para cada vida salva por um diagnóstico de câncer de mama, há uma vida perdida pelas complicações que advém do tratamento.

Mas vamos deixar mortalidade de lado. Será que o diagnóstico precoce pelo menos não melhoraria qualidade de vida das pessoas?

Estimativas científicas indicam que de cada 1000 homens rastreados para câncer de próstata, 120 sofrem biópsias de resultado normal, 100 são submetidos a tratamentos desnecessários, 29 se tornam impotentes e 18 incontinentes. Já no caso das mulheres, para cada 1000 rastreadas, 500 tem um resultados falso-positivo da mamografia, 100 terminam em biópsias normais e 6 recebem tratamento desnecessário. Tudo isso sem que em troca haja um benefício de redução de mortalidade. Portanto, mesmos os diagnósticos corretos se constituem em overdiagnosis: diagnósticos que promovem sequelas mentais e físicas, sem trazer benefício que compense tudo isso.

Claro que haverá um ou outro caso anedótico em que um homem ou mulher se beneficia, porém para cada caso desse, há um prejuízo que o anula. Desta forma, do ponto de vista probabilístico, o efeito é nulo.

Em recente postagem sobre segurança perceptível, comentei que nunca houve uma vida salva pelos famosos coletes salva-vidas dos aviões. Passado alguns dias, um colega postou um interessante comentário, em que nos apresentava um caso documentado de vida salva. Era uma selfie de um passageiro boiando com o colete salva-vidas (salvou o celular também) com um pequeno avião afundando no mar do Havaí. Mas tem outra história que nos remonta ao raciocínio probabilístico que menciono no parágrafo anterior. Em 1998 um avião da Ethiopian Airlines fez um pouso forçado no mar. O avião se despedaçou e alguns passageiros presumidamente tiveram suas vidas salvas pelos coletes, pois caíram no mar, não afundaram e sobreviveram. No entanto, um número maior de pessoas morreu pois ficaram presas nas ferragens, presumidamente devido ao uso dos coletes. Houve mais prejuízo do que benefício. O raciocínio probabilístico não é individual, é coletivo.

Se pensarmos direitinho, a irracionalidade chega a ser caricatural. Mas não é por mal. Como mostra o psicólogo Dan Ariely (Universidade de Duke), o raciocínio econômico humano tende a ser irracional. Neste caso, prejudicamos nossa segurança real, em prol da segurança perceptível.

Mas alguns argumentam que os meses coloridos têm outros objetivos além de propor rastreamento, como conscientizar as pessoas em relação à importância dessas doenças ou promover estilo de vida saudável com fins de prevenir estes cânceres. Mas isso também não cola, pois não precisamos falar em câncer para promover estilo de vida saudável ou controle de fatores como obesidade. Bastaria falar em qualidade de vida.

Além do mais, não há estudos (ensaios clínicos) que comprovem que mudança de estilo de vida reduz a probabilidade de câncer. Até mesmo para doenças cardiovasculares (onde a penetração causal dos fatores de risco é muito mais forte do que câncer), mudança de estilo de vida não se provou eficaz em reduzir risco. E de efetividade, nem se fala.

Desta forma, fica bastante questionável qual o benefício real do ponto de vista individual e social proveniente das campanhas coloridas. Mas há um preço e este é o maior sentido desta nossa postagem.

O Preço

O preço está na antecipação inútil de algo que pode nem mesmo acontecer.

Estudos de psicologia positiva demonstram que um dos determinantes da felicidade é o enfoque no momento presente. No entanto, a cultura ocidental tem uma tendência de se projetar excessivamente para o passado (ruminar fatos negativos) ou futuro (pré-ocupação com coisas que provavelmente nunca acontecerão). A probabilidade de uma pessoa morrer de uma dada doença é sempre pequena, pois há várias mecanismos de morte candidatos para uma dada pessoa. Propomos que as mulheres passem o mês de outubro pensando em câncer de mama, enquanto apenas 4% delas morrerão deste problema. Mas para resolver esta questão, criamos outros meses, um para cada doença, de forma que a população, pensando em todas, estará antecipando em algum mês do ano seu mecanismo de morte. Genial. Só que nada disso reduz o risco de morte.

Assim, ocupamos nossa mente com o inexorável, passamos a vida na expectativa do que nos matará, e nos esquecemos de viver. Tudo isso, sem benefício em prolongamento de vida.

O Janeiro Branco

Por estes motivos tenho pensado: precisamos de um Janeiro Branco!

Claro, pelo menos um mês que tenhamos o direito de não falar em doença. Um mês para se falar em qualidade de vida. Um mês em que a justificativa para que façamos exercício não seja prevenção de doença, mas sim o prazer de andar de bicicleta com os filhos em uma manhã de domingo. Um mês em que se diga que o sentido de evitar excesso de peso seria a vaidade de ficar mais bonito para conseguir um namorado legal ou de conseguir vestir aquela roupa de que tanto gosta. Ou um mês para dizer que gordinhos também são lindos e podem ter muitos namorados.

E nada melhor do que janeiro para fazer isso. Precisamos deste primeiro mês do ano para não ocupar nossas mentes com estas antecipações inúteis, de forma que sobre espaço para nossa criatividade no planejar de um novo ano. Sim, pois para ser criativo precisamos de um certo ócio mental. E nada melhor do que a cor branca para estimular o ócio.

Sim, precisamos de um Janeiro Branco, o Mês Sem Doença.

_______________________________________________________________________

Conheça nosso curso online de medicina baseada em evidências.

quarta-feira, 2 de novembro de 2016

Síncope, Embolia Pulmonar e o Temor do Overdiagnosis.

Um dos trabalhos recentes que mais despertou comentários e compartilhamentos nas redes sociais foi o estudo italiano PESIT, publicado no New England Journal of Medicine, que descreveu 17% de prevalência de embolia pulmonar em pacientes internados com síncope. Número que surpreende, dada a gravidade da primeira condição (embolia) e a usual benignidade da segunda condição (síncope).

Este é o tipo de trabalho que ocupará espaço eterno em nossas argumentações clínicas, com garantida popularidade nas visitas de enfermaria. Pela impressionante dimensão desta prevalência, imagino que casos rotineiros de síncope passarão a ser vistos com mais atenção e cuidado para evitar que embolias passem despercebidas. Por outro lado, este também é o tipo de trabalho que predispõe ao viés cognitivo da superestimativa de um resultado científico.

Recentemente escrevemos postagem sobre a importância de analisar nossas evidências internas antes de acessar evidências externas. Agora me refiro a um segundo momento de análise de nossas evidências internas, que deve ocorrer depois da leitura do trabalho. Depois de avaliar um trabalho, concluindo por sua veracidade e relevância, precisamos avaliar: o resultado do trabalho modificou nossa percepção interna de forma proporcional à relevância do mesmo?

Este processo analítico é importante, pois seres humanos (médicos e profissionais de saúde são humanos) sofrem do viés cognitivo de superestimativa da relevância das coisas. Problemas viram catástrofes, riscos baixos são hiperdimensionados pela confusão com dano, marcadores prognósticos passam a ser interpretados como bolas de cristal, tratamentos de usual benefício modesto são interpretados como se o NNT fosse 1.

Portanto, ao ver um trabalho de tamanho impacto, devemos analisar cuidadosamente como este modifica nossas crenças internas.

O Estudo PESIT

Este é um estudo de caráter descritivo e transversal, modelo voltado para avaliação de prevalência, o objetivo primordial deste trabalho. O estudo avaliou 560 pacientes internados por embolia pulmonar em 11 centros italianos, considerando não portadores de embolia 330 que tinham baixa probabilidade pré-teste pelos critérios de Well e d-dímero negativo. Os 230 restantes realizaram angiotomografia de artérias pulmonares ou cintilografia pulmonar, cujos exames foram positivos em 97 pacientes, correspondendo a 42% dos que realizaram o exame e 17% de prevalência na amostra total de 560.

Apesar de que nem todos tenham feito a pesquisa de embolia por método de imagem (seria o ideal), considero a metodologia razoável. Se este eventual viés de informação tiver ocorrido, este estaria subestimando esta alta prevalência e não superestimando. Enfim, o estudo convence pela alta prevalência.

Neste contexto, devemos lembrar qual o valor clínico de estudos de prevalência. A grande utilidade destes estudos está na determinação da probabilidade pré-teste, componente chave do raciocínio diagnóstico probabilístico. Prevalência é sinônimo de probabilidades pré-teste, pois a frequência da doença em uma dada população corresponde exatamente à probabilidade do paciente naquela condição ser portador da doença.

De acordo com o trabalho de Well, probabilidade pré-teste para embolia pulmonar acima de 5% configura pelo menos moderada probabilidade. Portanto 15% é uma probabilidade significativa, dada a gravidade da condição. Vejam então a relevância deste achado: ter tido uma síncope já garante moderada probabilidade pré-teste de embolia pulmonar.

Suspeito que este achado (este é meu receio) transforme síncope em embolia pulmonar, ou seja, sempre que tivermos uma síncope, pensaremos em embolia pulmonar como uma possibilidade razoável. Pelo temor de embolia (dano), esta probabilidade diagnóstica tenderá a ser superestimada inconscientemente.

Mas será que síncope sozinha atribui aos pacientes moderada probabilidade pré-teste de embolia pulmonar?

A Prevalência

Estudos descritivos são muito mais sensíveis ao tipo de população estudada do que estudos analíticos. O princípio da complacência (validade do conceito em populações diferentes) não funciona em estudos descritivos, como funciona em estudos analíticos que testam hipóteses. Ou seja, prevalência e incidência são demasiadamente influenciados pela população estudada. Desta forma, devemos analisar cuidadosamente que população foi avaliada neste trabalho.

Em primeiro lugar, como diz o próprio título, este estudo se refere a pacientes internados por síncope, o que já traduz uma população mais grave do que síncope em geral. Em segundo lugar, estes pacientes internados corresponderam a apenas 30% do total de síncope atendida nos 11 hospitais, ou seja, provavelmente o terço de pacientes mais complexos. Sendo assim, 17% é uma prevalência maior do que o que seria observado no paciente sincopal mediano. Temos que cuidar para que nosso viés cognitivo não influencie nosso pensamento a respeito de qualquer paciente com síncope, o que será uma tendência inconsciente.

Outro detalhe é a manifestação que motivou o internamento. Os autores mencionam superficialmente que os pacientes foram “admitidos por síncope”. No entanto, em torno de 45% dos pacientes com exame positivo para embolia estavam taquipneicos. Ou seja, boa parte destes indivíduos tinham um quadro de insuficiência respiratória como sintoma, que poderia ser inclusive uma manifestação mais importante do que a síncope.

A Causalidade

Em segundo lugar, como já pontuamos nas lúdicas discussões sobre zika e microcefalia, co-existência não é o mesmo que associação. Este estudo demonstra apenas co-existência de síncope e embolia pulmonar. Associação seria demonstrada se houvesse um grupo controle de características semelhantes ao grupo síncope, evidenciando maior frequência de trombos pulmonares nas síncopes quando comparada a não síncopes.

De fato, fico curioso em saber qual a prevalência de trombos pulmonares em idosos (76 anos, metade com mais de 80 anos), admitidos em hospitais terciários por outras causas.

A despeito do trabalho não testar associação, os autores tentam inferir uma certa causalidade quando concluem que a frequência de embolia pulmonar foi mais alta nos pacientes que tinham síncope inexplicada (sugerindo que a explicação era a embolia). No entanto, se formos observar os números, metade dos pacientes com embolia tinham uma causa definida para a síncope, nos permitindo pensar que nem toda embolia foi o causador da síncope.

Desta forma, devemos ter em mente que este trabalho não traz nem mesmo inferência de causalidade. Este se presta a descrever probabilidade pré-teste em uma amostra selecionada de pacientes internados, idosos e mais complexos do que o geral. E esta probabilidade pré-teste é para a presença de trombo em artéria pulmonar, não exatamente para o que conhecemos como embolia pulmonar clinicamente manifesta.

Em uma analogia (grosseira) com dor torácica, se fizéssemos coronariografia em todo octagenário com dor torácica de origem muscular, encontraríamos doença coronariana importante em mais da metade destes indivíduos. Porém isso não quer dizer que a dor foi causada pela doença coronariana. Deveríamos tratar a doença coronariana? Neste caso, me parece evidente que não.

O Tratamento

No caso da embolia pulmonar, reconheço que uma vez vendo um trombo em artéria pulmonar, a tendência a anticoagular é grande por qualquer um de nós. Mas se isso for um trombo crônico? Ou até mesmo agudo, porém sem relevância? Quantos trombos devem ser formar em nossa árvore pulmonar momentaneamente e nosso saudável sistema trombolítico endógeno os dissolvem. Quantas pequenas rupturas de placas coronárias com agregação plaquetária local sofremos momentaneamente e nosso sistema resolve silenciosamente. Quantas células cancerígenas se formam a cada momento e nosso sistema de defesa as destrói. O sistema complexo é assim, o saudável é a variabilidade de medidas biológicas e de coisas que surgem e desaparecem a todo momento.

Desta forma, estamos diante do princípio da equipoise (incerteza que implica na necessidade de teste empírico), sendo necessário demonstrar que a anticoagulação destes pacientes trará benefício clínico.

Overdiagnosis

Não estou propondo que trombos grandes sejam todos deixados de lado. Uma vez detectando, fica difícil voltar atrás. O caminho está em reconhecer o potencial do overdiagnosis. A melhor forma de prevenir overtreatment é prevenir overdiagnosis.

Devemos atentar para o overdiagnosis. Temo que o protocolo do estudo seja copiado. Ou seja, todo paciente com síncope realize um inespecífico D-dímero, que virá positivo com frequência (D-dímero positivo não tem valor), levando à realização de angiotomografia, que detectará em 40% dos casos trombos em artéria pulmonar.

A pesquisa de embolia pulmonar deve estar mais indicada em pacientes complexos, com probabilidade mais alta, de preferência algum sintoma associado. Neste sentido, o trabalho perdeu a grande oportunidade de criar um modelo probabilístico de embolia pulmonar em pacientes com TEP. Era só colocar as variáveis que na tabela 2 se associaram a embolia em um modelo multivariado e definir os preditores independentes. Por que isso não foi feito? Com um modelo multivariado, nosso pensamento passaria a ser probabilístico, evitando o viés de achar que todo pacientes com síncope tem embolia até que se prove o contrário.

Conclusão

Este trabalho tem satisfatória qualidade metodológica, porém é do tipo que potencializa vieses cognitivos.

Primeiro, o viés da superestimativa de uma probabilidade geral. Considerando que a probabilidade pré-teste de síncope foi descrita em um subgrupo de indivíduo que não representa a maioria dos pacientes com síncope, devemos nos cuidar para que inconscientemente esta informação probabilística não influencie nosso pensamento na maioria das síncopes.

Segundo, o viés de causalidade. Este trabalho em nada prova o conceito de que estas embolias foram as causas da maioria das síncopes. Estimo que foram as causas na minoria das síncopes sem sintomas típicos de embolia. Parte deles são trombos em artérias e não embolias clínicas. Da mesma forma que temos obstruções coronárias em dores não anginosas.

Terceiro, o viés do pensamento univariado. Síncope = 17% de probabilidade de embolia. Se o estudo tivesse criado um modelo multivariado, poderíamos individualizar a probabilidade de embolia em cada paciente, selecionando os de mais alta probabilidade para serem investigados.

Muitas vezes nos deparamos com evidências verdadeiras, mas com risco de serem mal interpretadas, influenciando nosso pensamento de forma inadequada. Nossa análise crítica não deve ser apenas da informação, mas do resultado da interação da informação com nosso modo de pensar.

Medicina baseada em ciência deve ter como um de seus pilares uma análise criteriosa de nosso processo interno de percepção das evidências.
_______________________________________________________________________

Conheça nosso Curso Online de Medicina Baseada em Evidências.

domingo, 23 de outubro de 2016

O Problema das Múltiplas Comparações

*Da série, Como Criar um Estudo Falso Positivo

Imaginem que um farsante pretende provar ser vidente, capaz de adivinhar coisas. Um cético faz um experimento em que sobra apenas 4.9% de probabilidade do suposto vidente acertar por acaso (sorte). Se ele acertar, P = 0.049 será estatisticamente significante (< 0.05), rejeitaremos a hipótese nula (farsante) e acreditaremos na sua capacidade premonitória.

Mas isso só funcionará se o suposto vidente tiver apenas 1 tentativa de acertar. Por outro lado, se ele tentar 30 vezes e cada uma das vezes a probabilidade for 5%, ele terá 80% de probabilidade de acertar em alguma das vezes. Calculei 80% pela fórmula P = 1 - (1 - P)^N, sendo N o número de tentativas ou comparações. Ou seja, 1 - (1 - 0.05)³⁰= 0.80

Já pensou se acreditássemos no acerto depois do farsante tentar 30 vezes?

Utilizando o problema das múltiplas comparações, provamos o que queremos. Imaginem que desejo demonstrar que meu time do coração (Bahia) é superior ao time do Barcelona. Difícil provar isso em um único jogo de futebol, cuja probabilidade de sucesso do Bahia seria, digamos, 5%. Mas se eu fizesse 30 jogos de futebol, haveria 80% de probabilidade do Bahia vencer em um deles. Eu poderia fazer isso e publicar na imprensa apenas o jogo que o Bahia ganhou.

Concordo que seria difícil esconder 29 jogos realizados em grandes estádios. Assim como é difícil esconder o resultado de um grande ensaio clínico multicêntrico. Por outro lado, não é difícil esconder 29 estudos pequenos e unicêntricos. Aliás, estes estudos se escondem naturalmente, pois é mais difícil publicar estudos negativos do que estudos positivos ou o autor fica desestimulado em preparar um artigo que não traz a novidade desejada. É o que chamamos de viés de publicação.

Veja que perfeita combinação de três características presentes em estudos pequenos:

São inúmeros estudos pequenos (múltiplas comparações)
São imprecisos (mais fácil o Bahia ganhar do Barcelona por sorte em um jogo de 20 minutos do que em um jogo de 90 minutos).
São fáceis de esconder (viés de publicação).

Portanto, a existência de estudos pequenos gera as múltiplas comparações, sendo um prato cheio para provar o que é falso, via viés de publicação.

Não dá para confiar em estudos pequenos. O que é pequeno? Vide nosso post sobre cálculo do tamanho amostral.

Mas podemos julgar inexequível fazer 30 jogos Bahia x Barcelona, mesmo que cada jogo tenha apenas 20 minutos. Neste caso, a boa notícia é que podemos fazer múltiplos testes em um único jogo de futebol. Ou em um único estudo clínico. Há 3 formas:

1. Supervalorização de desfechos secundários (que são múltiplos): gol é o desfecho primário de um jogo de futebol. Mas sei que este desfecho pode ser difícil de provar minha tese. Portanto, eu analiso inúmeros desfechos secundários: chutes a gol, posse de bola, chutes na trave, impedimentos, escanteios, etc, etc. Desta forma, se o Bahia não fizer mais gols do que o Barcelona (provável que não faça), escolherei para valorizar algum desfecho secundário que por sorte (acaso) tenha sido favorável ao Bahia. E posso concluir o estudo da seguinte forma: "Embora o Bahia não tenha feito mais gols, seu número de escanteios foi maior". Observe que esta conclusão tem uma conotação positiva. É assim que se faz para induzir leitores de trabalhos a uma ideia desejada. Até mesmo porque a mente humana tem maior tropismo por afirmações positivas do que negativas.

Em estudos clínicos, isto é feito quando o desfecho primário não mostra diferença entre os grupos, e o autor passa a valorizar mais um desfecho secundário. Vejam como conclui um estudo publicado no Circulation (revista de maior impacto em cardiologia), que queria mostrar Omapatrilato como superior a Enalapril em insuficiência cardíaca. Este estudo foi negativo na análise do desfecho primário, daí o autor determinou a posteriori um desfecho secundários e conseguiu positividade, concluindo da seguinte forma:

"Omapatrilat reduces the risk of death and hospitalization in chronic heart failure but was not more effective than ACE inhibition alone in reducing the risk of a primary clinical event." Vejam que ele consegue fazer uma conclusão para todos os gostos.

Fico fascinado quando o técnico de um time diz: "jogamos muito bem, o que faltou foi a bola entrar". Ele está fazendo exatamente isso. Jogar muito bem, funciona como um desfecho secundário.

Assim como o que dita o vitorioso em um jogo de futebol é o número de gols, o que deve ditar a conclusão de um trabalho é o desfecho primário, que usualmente é único, evitando as múltiplas comparações na conclusão do trabalho.

Outro ótimo exemplo do problemas das múltiplas comparações gerando equívocos são as múltiplas análises de desfechos adversos comentada na nossa última postagem “A Insegurança das Análises de Segurança”. Quem não leu, vejam o mito do diabetes e estatina relatado naquela postagem.

2. Análise de subgrupo: outra forma de provar que meu time é superior ao Barcelona seria dividir o jogo de futebol em pequenos subgrupos de jogadas, delimitador por um tempo de 10 minutos. Depois de perceber que o resultado final do jogo foi 4 x 1 para o Barcelona, inicio minha estratégia de análise de subgrupos. Por exemplo, nos primeiros 10 minutos, qual foi o resultado do jogo? Entre o minuto 10 e 20, qual foi o placar? E por aí vai, vou analisando subgrupos de 10/10 minutos. Se em algum desses períodos, o Bahia fizer mais gols que o Barcelona, esse momento seria valorizado como uma evidência a favor do Bahia.

Parece absurdo, mas autores inconformados com seus resultados negativos, tendem a valorizar mais suas análises de subgrupo. Certa feita, um estudo publicado no New England Journal of Medicine não encontrou diferença de desfecho cardiovascular entre pacientes randomizados para comprimido de ômega-3 ou placebo. Veja o que foi escrito:

“However, there was a 27% reduction in major cardiovascular events with ALA among women, which approached significance (hazard ratio, 0.73; 95% CI, 0.51 to 1.03; P=0.07)”.

Em geral, a comunidade científica é (corretamente) cética quanto a análises de subgrupo. Assim, fica difícil que um autor conclua um estudo como plenamente positivo baseado apenas no resultado de subgrupo. Mas ao trazer a possibilidade de benefício em algum subgrupo, ou autores confundem o leitor, amenizando o impacto da informação negativa. Isso funciona e a gente nem percebe. Melhor dar uma informação negativa seguida de uma positiva (subgrupo), do que apenas concluir pela negatividade.

Há algum tempo devo neste Blog uma postagem dedicada especificamente a análise de subgrupo.

3. Estudo truncado: essa é genial. Imaginem que (por sorte) o Bahia faça um gol, aos 25 minutos do primeiro tempo. Neste momento, com o jogo 1 x 0 para o Bahia, digo que está provada a superioridade do Bahia e interrompo o jogo. Apesar de uma atitude grosseira em um jogo de futebol, esta é a forma mais elegante de usar do problemas das múltiplas comparações em ensaios clínicos. Elegante porque se utiliza do argumento (pseudo) ético de que não podemos deixar um grupo sem o uso da terapia, pois ficou provado seu benefício. O problema é que não foi demonstrado benefício de uma forma metodologicamente segura, pois o estudo sendo interrompido precocemente carece de precisão. Na verdade, anti-ético é concluir algo com falsidade.

Estudos como PRAMI, PREDIMED, JUPITER, FAME-2, PROWESS são alguns dos muitos que já citamos nesse Blog.

As Ilusões do Mundo Real

A falta de percepção do fenômeno das múltiplas comparações faz com que muitas vezes consideremos como tão inusitado um evento, que este só pode ter sido decorrente de algum plano maior.

Nesta cena do filme "O Estranho Caso de Benjamin Button" (vide abaixo), o personagem principal argumenta o quanto improvável tenha sido o acidente que ocorreu com Daisy. Ele descreve a sequência de pequenos eventos necessários para terminar no desfecho do acidente. Uma sequência de tantos eventos ocorrendo na hora certa, no lugar certo, que se torna altamente improvável o que ocorreu com ela. Tão improvável que isto não poderia ter ocorrido por acaso. Afastado o acaso, sobre a causa. Então ele insinua que algo tem que ter causado aquilo, imagino algo como Deus ou destino.

Sim, é improvável aquilo ter ocorrido com Daisy. No entanto, no mundo não há apenas uma Daisy candidata ao atropelamento. Há bilhões de Daisys, cada uma com sua mínima probabilidade deste evento, resultando em uma altíssima probabilidade de um atropelamento acontecer com alguma Daisy no mundo. É o problemas das múltiplas tentativas. O mesmo fenômeno.

No entanto, nós sofremos do vies da falácia narrativa, quando contamos a história de frente para trás. Uma vez ocorrendo um fenômeno, procuramos uma causa platônica retrospectivamente, sem perceber que aquilo pode ter sido decorrente do acaso.

Deus não planeja o mal para as pessoas. Deus prefere reger o mundo pelo acaso, como discutimos na postagem “A Oração do Acaso”. É por isso que o mundo é repleto de fenômenos estatísticos explicando o que não pode ser explicado.

* Para conhecer nosso curso online de MBE, clique aqui.