Medicina Baseada em Evidências

quinta-feira, 8 de fevereiro de 2018

Quando nos confundimos com 'Gurus da Saúde"

O termo "guru" é originado do gu que significa sombra e ru que significa dissipar. Portanto, guru é aquele que traz luz para dissipar a escuridão.

Nestas férias, li um artigo publicado no New York Times e reproduzido pela Folha de São Paulo, bastante compartilhado nas mídias virtuais. O artigo da médica Lisa Pryor aborda os “gurus da saúde”. O termo "guru" foi usado de forma pejorativa, não como um mestre que dissipa a escuridão, mas como profissionais que aumentam a escuridão.

Lisa denomina de “gurus” aqueles profissionais eloquentes e influentes, cujas ideias carecem de real embasamento científico. Estes profissionais promovem uma confusão entre verdade e fantasia. Ao final, a autora apresenta a solução para os gurus da saúde: a medicina baseada em evidência.

Penso que precisamos aprofundar a reflexão. Gurus não são seres tão distintos de nós, o que implica em evitarmos uma visão maniqueísta do bem contra o mal. Da mesma forma, seria simplista colocar medicina baseada em evidências como solução para gurus.

Na verdade, não me preocupo muito com esses gurus caricatos. Embora os caricatos possam ser um tanto irritantes, são mais inofensivos do que parecem. Suas propostas não prevalecem como modificadoras de condutas. Em sua maioria, atuam em "guetos" sofisticados, vendendo seus tratamentos fantasiosos para uma elite que procura fórmulas platônicas da felicidade.

Preocupo-me mais com gurus menos caricatos, que se confundem com profissionais científicos.

Preocupo-me mais quando nós mesmos nos tornamos, sem sentir, gurus da saúde.

A difícil distinção entre "gurus da saúde" e profissionais científicos.

O artigo de Lisa Pryor foi claro da descrição de características dos gurus, criando um estereótipo. Porém este estereótipo não deve nos fazer pensar que é fácil discriminar gurus de profissionais embasados em ciência.

De um lado, temos profissionais que argumentam contra vacinação de crianças, citando evidências científicas de que vacina causa autismo. Do outro lado, profissionais argumentam contra rastreamento de câncer de próstata. Quais são gurus e quais são profissionais científicos?

Ambos os grupos propõem o abandono de condutas médicas tradicionais, nos causando desconforto cognitivo. Ambas as ideias parecem absurdas ou progressistas, a depender da interpretação.

Gurus podem ser confundidos com profissionais científicos, enquanto profissionais científicos podem ser rotulados injustamente de gurus. Precisamos reconhecer essa dificuldade de diferenciação como um problema social.

Embora o artigo de Lisa Pryor reforce a medicina baseada em evidências como o antídoto para o problema dos gurus, este conceito per si não é suficiente como solução. Gurus costumam sequestrar o conceito de medicina baseada em evidências, deturpando-o em prol de seus objetivos. Gurus são ótimos em simular uma postura científica.

Portanto, a utilização de estereótipos não garante acurácia na discriminação de "gurus da saúde". O padrão-ouro deste diagnóstico estaria na análise criteriosa do nível de evidências que embasa as ideias dos gurus. O problema é que este método é tecnicamente difícil, trabalhoso, leva tempo. Até chegarmos a uma conclusão por esse método, corremos o risco de sermos pegos em armadilhas. O risco de sermos seduzidos e convencidos.

Portanto, precisamos de um método intermediário, que faça uma triagem rápida, porém mais acurada do que o uso de estereótipos que só identificaria os mais caricatos. Este método seria usado para gerar um certo ceticismo em relação a alguns profissionais pseudo-científicos, que ficariam no limbo até serem melhor escrutinados por uma análise crítica baseada em evidências.

Qual seria esse método? Sara Gorman e Jack Gorman, pesquisadora em saúde pública e psiquiatra, respectivamente, descrevem no livro "Denying to the Grave" o que chamam de "líderes carismáticos". Estas são características que podem ser identificadas como um diagnóstico inicial de gurus que não se parecem gurus.

Indícios de Líderes Carismáticos

Gurus da saúde são inteligentes, eloquentes, soam revolucionários. Porém cientistas também podem ter essas qualidades. Cientistas se baseiam em evidências, porém gurus são ótimos em citar evidências e parecer científicos. Não é óbvia a diferenciação dos dois. Precisamos avançar para características subliminares.

Primeiro, líderes carismáticos costumam acionar nosso sistema límbico pelo medo. Observem que o medo sempre está na base do discurso: “medo do filho ficar autista por ter sido vacinado”. Usualmente é um discurso catastrófico, que traz uma solução a seguir.

Um estímulo de perigo ativa o sistema límbico, que promove uma série de reações sentidas como medo. Por outro lado, o pensamento racional é mediado pelo córtex pré-frontal. A questão é que ativação do sistema límbico inibe o córtex pré-frontal. Assim, quando líderes carismático nos provocam medo, inibem nossa capacidade de julgar corretamente as evidências.

Segundo, líderes carismáticos criam um mundo maniqueísta, do "nós contra eles". Demonizam pessoas de opinião diferentes como inimigos. Criam teorias da conspiração.

Um cientista pode ser contra o rastreamento de certos cânceres com base em evidências, entendendo a prática usual do overdiagnosis como um viés cognitivo do pensamento médico. Já um líder carismático criaria a teoria da conspiração de que médicos e indústria se uniram com intuito capitalista em detrimento da saúde pública. Claro, de tudo um pouco, mas não precisamos exagerar. Somos humanos e conflito de interesses não é o único, nem o principal viés cognitivo.

Terceiro, líderes carismáticos são categóricos, fazem um discurso de certeza. Dissonância cognitiva se dá quando estamos divididos entre duas opiniões contraditórias. Isso causa desconto cognitivo. Uma forma de agradar as pessoas é curar seus desconfortos, suas dissonâncias. Líderes carismáticos portanto garantem a certeza de suas ideias, não deixam dúvida de que aquele é o caminho certo.

Portanto, o culto ao medo, a guerra do bem contra o mal, a solução baseada em certeza caracterizam líderes carismáticos que podem estar atuando como gurus da saúde.

Ao detectar este perfil, fiquemos atentos e mais céticos à uma primeira impressão a respeito da ideia proposta.

Por que precisamos distinguir os gurus?

Antes de falar na valorização de evidências, precisamos discutir como se passa o mecanismo mental da persuasão de uma ideia.

Psicólogos apontam que há duas vias de persuasão: uma central e outra periférica. Na via central, a mensagem é escrutinada com base em uma análise criteriosa da qualidade das evidências. Assim fazem os bons juízes ou profissionais baseados em evidências.

A via periférica utiliza “pistas” para decidir a veracidade da ideia. Este é um processo heurístico, baseado em atalhos de pensamento, facilitando o processo, sendo portanto o mais utilizado. No entanto, este é um método menos acurado, pois abre espaço para vieses cognitivos.

Por exemplo, uma heurística sugestiva de veracidade é a quantidade de argumentos. Normalmente, quando vemos um indivíduo articular uma grande lista de argumentos em prol de uma ideia, tendemos a interpretá-lo como verdadeiro. Mas este é um método falho de julgamento, visto que a ausência de uma validação real tende a ser preenchida por vários argumentos inválidos. Gurus usam muitos argumentos.

Paradoxalmente, a via de persuasão que mais utilizamos ao julgar uma ideia é a periférica, pela sua facilidade e rapidez. E como seria de se esperar, é por meio desta via que líderes carismáticos melhor convencem seus seguidores.

Evidências científicas demonstram que “a primeira impressão é a que fica”. Ou seja, após um primeiro julgamento rápido e periférico, já estamos enviesados pela impressão inicial, mesmo que depois façamos nossa análise central. Portanto, não basta treinarmos a via central no escrutínio das evidências.

Um estudo de ressonância magnética funcional foi publicado no Journal of Neuroscience em 2014. Neste, indivíduos receberam uma informação falsa, que depois foi corrigida por uma verdadeira informação. A informação falsa ativou regiões límbicas, porém estas permaneceram "quentes" mesmo depois da informação verdadeira ter sido apresentada. Isso inibe o córtex pré-frontal no processamento da nova informação. Portanto, uma vez acreditando em uma fantasia, temos dificuldade de corrigir o erro pela razão.

Desta forma, precisamos criar mecanismos para nos proteger desta primeira impressão da via periférica. Estes mecanismos consistem na identificações de sinais que apontem um líder carismático tentando acionar sua via periférica de persuasão.

Quando nos tornamos Gurus

Mas o problema ganha uma grandeza ainda maior quando profissionais de verdadeiro intuito científico, sem perceber, se transformam em "gurus da saúde".

Vejam medicina baseada em evidências, a proposta de uma prática clínica norteada por paradigmas científicos. Nesta prática, precisamos exercitar a base da ciência contemporânea: a incerteza.

Quando profissionais embasados em evidências utilizam trabalhos científicos para construir sua certeza de decisão, estes se tornam "gurus da saúde".

Quando profissionais embasados em evidências usam resultados de bons trabalhos como receitas de bolo (ao invés de bússola norteadora) para suas condutas, estes se tornam gurus da saúde.

Quando profissionais se guiam apenas por conhecimento de eficácia, esquecendo que entre o conceito e a prática existe efetividade, estes se tornam gurus da saúde.

Quando profissionais se guiam pelo resultado do ensaio clínico, desconsiderando a influência da preferência do paciente no desfecho final, estes se tornam gurus da saúde.

Quando confundimos decisão consentida com decisão compartilhada, nos tornamos gurus da saúde.

Quando pensamos apenas no benefício comprovado, subestimando o custo pessoal do paciente, nos tornamos gurus da saúde.

Quando fazemos análise crítica das evidências externas, mas esquecemos a análise crítica de nossas evidências internas, nos tornamos gurus da saúde.

Precisamos nos preocupar menos com personagens folclóricos que são inerentes à humanidade e olhar para nós mesmos para perceber quando nos tornamos gurus da saúde? Pois todos nós, em algum momento, mesmo que sem querer, fazemos esse papel.

Humildade está no cerne do pensamento científico.

_______________________________________________________________________

Conheça nosso curso online de medicina baseada em evidências, clicando aqui.

domingo, 19 de novembro de 2017

O Crepúsculo do Novembro Azul

Novembro vai terminando e a bela luminosidade azul do Elevador Lacerda começará a se esvair. É neste crepúsculo azul que o patologista clínico Fernando Araujo defenderá uma das mais importantes Teses de Doutorado desenvolvidas na Escola Bahiana de Medicina e Saúde Pública, sob orientação do urologista-cientista Ubirajara Barroso.

Fernando revisou sistematicamente guidelines internacionais sobre o assunto Azul, demonstrando uniformidade na recomendação de cautela quanto ao rastreamento de câncer de próstata em homens saudáveis. Depois ele saiu de congresso em congresso entrevistando médicos, e encontrou que 93% dos urologistas brasileiros e 83% dos generalistas brasileiros prescrevem rastreamento de câncer de próstata regularmente.

Mas como algo que requer cautela tem uso tão universal?

Em outubro (“rosa”) Richard Thaler, professor da Universidade de Chicago, foi laureado com o Prêmio Nobel de Economia. Seus experimentos psicológicos demonstraram que a decisão humana carece do pensamento econômico, não temos uma boa habilidade de ponderar o valor versus o custo das nossas escolhas.

Muitas vezes perdemos foco discutindo se algo existe ou não existe. Porém o que importa é se o que existe tem magnitude suficiente para impactar em nossas vidas.

Uma boba discussão se faz prevalente. Alguns argumentam que o rastreamento do câncer de próstata salva vidas, outros dizem que não. Dois grandes ensaios clínicos testaram essa hipótese, um demonstrou redução de morte por câncer, outro não conseguiu demonstrar este achado. Quem é a favor do rastreamento cita o primeiro estudo, quem é contra cita o segundo estudo. Mas poucos percebem que o resultado dos dois estudos é igual: se existe benefício, este é pequeno e inferior ao custo pessoal dos homens que decidem pelo rastreamento.

É óbvio que rastrear câncer salva algumas vidas do câncer em questão. O estudo não serve para testar o óbvio, mas sim para quantificar a magnitude do beneficio e os possíveis dados da conduta. A eventual redução de morte por câncer observada pelo primeiro estudo não é suficiente para tornar perceptível a consequente redução de mortalidade geral. Claro, existirá redução de mortalidade geral, mas esta é tão pequena que fica imperceptível em um estudo com 160.000 homens. Mas o imperceptível benefício tem um preço: para cada 1000 homens rastreados, 50 terminarão com impotência ou incontinência urinária. Parte dos rastreados terminam em biópsia, outra parte destes em cirurgia para ressecção da próstata e boa parte desses ficam sequelados. É probabilidade condicional.

Existe também o fator tempo nesta equação. O malefício, quando ocorre, é imediato. Esse malefício precoce existe em função da expectativa de um benefício que poderá surgir, porém no longo prazo. Muitos se prejudicam agora na esperança de um benefício futuro. Isso deve ser levado em conta no pensamento econômico.

A cautela sugerida pelos guidelines vem sob a forma de recomendação de que seja discutido com os pacientes se estes desejam fazer o rastreamento. Apenas devemos prescrever se for o desejo do paciente. Mas será que esta tem sido de fato uma decisão informada? Ou seja, os pacientes sabem que se aderirem ao rastreamento terão 5% de probabilidade de virem a precisar de fraldas ou próteses penianas? São informados de que o retorno desse arriscado investimento seria uma redução de mortalidade geral tão pequena que não é detectada por estudo com mais de 100.000 pacientes?

Por que tomamos decisões anti-econômicas a toda hora?

Em seu excelente ensaio sobre o Homo Sapiens, o historiador israelense Yuval Harari menciona que o maior advento de nossa espécie, responsável por termos prevalecido e dizimado outras espécies humanas, é nossa capacidade de fantasiar. Ao fantasiar, o Sapiens foi capaz de reunir grandes exércitos em torno de uma causa fictícia, coisa que outras espécies não conseguiam. Prevaleceram os fantasiosos Sapiens sobre os realistas Neandertals.

A fantasia é essencial quando precisamos reunir muitas pessoas com alto grau de motivação. Por que conseguimos reunir 30.000 pessoas na Fonte Nova torcendo e vibrando com a excelente vitória do Bahia sobre o Santos, na semana passada? Porque nós fantasiamos que Bahia é um ser concreto, algo que tem um sentido simbólico maior. Mas se for ver, tem até jogadores que foram trocados entre os dois times oponentes na temporada anterior. Não é concreto, o Bahia é uma fantasia. Uma boa fantasia que mobiliza milhares, assim como o Azul do novembro mobiliza milhões. E todos ficam felizes.

Mas nosso Bahia, este pode até perder quase sempre, mas não deixa ninguém impotente.

Na final década de 70, o Reverendo Jim Jones, fundador do culto Tempo dos Povos, promoveu um suicídio coletivo de 918 pessoas. Impressionante seu poder de convencimento. Com racionalidade ou pensamento econômico, ele não conseguiria fazer com que aquelas pessoas tirassem suas vidas e a de suas famílias. Mas com o pensamento fantasioso conseguimos dar valor a uma causa maior, mesmo que absurda.

Não estou querendo falar que rastreamento de câncer é suicídio, nem comparar médicos bem intencionados a Jim Jones. Mas o que faz os homens desejarem o rastreamento é parecido: o pensamento fantasioso de que aquilo nos garantirá não morrer de câncer. Assim, somos capazes de optar por um investimento muito grande (dano) em troca de um retorno incerto (benefício).

Outra conduta muito comum, porém irracional, é gastar dinheiro na loteria. A probabilidade de ganhar é tão baixa, que só devemos jogar a menos de 20 minutos do sorteio. Pois se jogarmos antes disso, a probabilidade de morrermos antes do sorteio é maior do que de ganhar no sorteio.

Richard Thaler também menciona o “conservadorismo coletivo: uma tendência de grupos a permanecer com comportamento padrão. Uma vez que a prática se estabelece, é provável que se perpetue, mesmo na ausência de base racional.” Lembra rastreamento de câncer de próstata?

Por isso precisamos compreender de que não é pecado, nem desonestidade, promover rastreamento de câncer, pois isso decorre de algumas deficiências cognitivas naturais da mente humana.

Mas se é questionável o benefício do rastreamento, quem se beneficia da propaganda Novembro Azul?

Também em novembro, Olavo Amaral, médico-escritor, publicou um imperdível ensaio na Revista Piauí, intitulado Novembro Cinza, em que traz interessantes fatos relacionados às campanhas de rastreamento de próstata. Sabem quem são os financiadores dessas campanhas, em diferentes países? A indústria produtora de quimioterápicos para câncer de próstata, a indústria de equipamentos cirúrgicos e, pasmem, fabricantes de fraldas descartáveis. Rastreamento aumenta frequência de biópsias, de tratamentos, de incontinências.

Não vejo nada disso como uma grave crise. Pelo contrário, acho tudo natural. Mesmo se não houvesse interesses, os meses coloridos existiriam, mediados pela nosso desejo humano de reforçar a segurança perceptível. Mas precisamos refletir, discutir, evoluir. Rastreamento de câncer de próstata é a caricatura do pensamento médico anti-econômico. Serve para nos alertar dessa nossa natural limitação.

A observação final da Tese de Fernando é otimista. Utilizando o banco de dados de um grande laboratório nacional, Fernando analisou 2.5 milhões de pedidos de exames de PSA realizados ao longo destes últimos 10 anos. Utilizando sofisticada análise temporal, ficou demonstrado uma redução progressiva na solicitação de PSA ao longo deste período. Embora tênue, essa é uma excelente notícia. Daniel Kahneman, cientista do comportamento, costuma comentar que mudanças de comportamento tendem a ser tênues, lentas e progressivas. Não devemos esperar uma mudança abrupta.

No século XX, a revolução científica foi tecnológica. No século XXI, cabe à ciência aprimorar o processo de decisão humana. E esta nova revolução científica já começou, haja visto que o crescente reconhecimento de estudiosos do pensamento humano, como Kahneman e Thaler, ambos ganhadores do Prêmio Nobel.

No futuro, o rastreamento do câncer de próstata será visto como caricatural, assim como hoje vemos a terapia de sangria como um absurdo que em outras épocas era rotina da prática médica. Estamos em constante evolução.

Enquanto isso, nosso Elevador Lacerda se livrará da cor azul. Esta será substituída por cores natalinas, trazendo um Papai Noel sábio, em uso de estatina há décadas pois é dislipidêmico, anti-hipertensivo pois é hipertenso e vacina de gripe pois é muito idoso. No entanto, o sábio velhinho nunca foi submetido a rastreamento de câncer de próstata, nem de doença coronária subclínica.

______________________________________________________________________________________________

Leia também neste Blog: Precisamos do Janeiro Branco.

Conheça nosso curso de medicina baseada em evidências, clicando aqui.

domingo, 12 de novembro de 2017

O Efeito Placebo dos Stents

Um trabalho científico de qualidade merece um interpretação científica de qualidade. Não é isso que vem ocorrendo com o elegante estudo ORBITA, cuja leitura sensacionalista gerou manchetes do tipo “Stents não aliviam dor cardíaca, mostra estudo” (Folha de São Paulo) ou “Stents não melhoram sintoma de angina, diz estudo” (Revista Veja).

O ORBITA é um ensaio clínico inglês, recentemente publicado no prestigioso Lancet. Dentre os inúmeros ensaios clínicos que comparam angioplastia versus controle, este é o primeiro a cegar os pacientes quanto à alocação do tratamento.

Ensaios clínicos prévios, todos abertos, são consistentes em não demonstrar redução de mortalidade ou incidência de infarto. Por outro lado, baseado em forte lógica e em observações abertas, acredita-se que a angioplastia contribui substancialmente no controle da angina. O ORBITA é o primeiro estudo devidamente preparado a avaliar este efeito.

Após a coronariografia e demonstração de lesão funcionalmente importante pelo FFR, pacientes com angina classe II ou III foram randomizados para angioplastia versus controle, sendo os dois grupos igualmente sedados para o procedimento. Desta forma, ficaram cegos os pacientes e seus médicos quanto à verdadeira realização do procedimento. Este avanço metodológico ajustou o resultado para um esperado efeito placebo do procedimento.

Coincidindo com a experiência clínica, o estudo demonstrou que pacientes submetidos a angioplastia desfrutaram de melhora da angina. No entanto, de forma surpreendente, essa melhora não foi significativamente superior à melhora obtida pelo fingimento da angioplastia. Subtraindo um pelo outro, não sobrou um efeito verdadeiramente decorrente da dilatação do vaso.

Dor (angina) é um tipo de desfecho reconhecidamente susceptível ao efeito placebo. Mesmo um analgésico que tenha um mecanismo real oferece um efeito placebo adicional (o que é bom). Cientificamente, precisamos reconhecer quanto do efeito é placebo e quanto resulta do mecanismo primário do tratamento (efeito direto).

O estudo ORBITA não detectou efeito além do placebo.

Mas o que isso quer dizer? Isso prova que a dilatação do vaso e implante de stent não oferecem efeito anti-anginoso direto?

Interpretação de Resultado Negativo

Para interpretar um resultado negativo, devemos partir de uma premissa científica básica: experimentos científicos não se prestam a provar ausência de um fenômeno. Isso é impossível, por dois motivos.

Primeiro, a frase “demonstrar que não existe” é uma armadilha filosófica. Se não existe, não podemos demonstrar. Segundo, para provar que algo não existe precisaríamos de uma ferramenta observacional capaz de observar qualquer fenômeno, por menor que seja, por mais efêmero que dure, por mais escondido que esteja. Isso não é possível.

Por exemplo, não é possível provar que não existem discos voadores. Como nenhuma observação tem lente de aumento infinita, o fenômeno pode ser tão discreto que não está sendo visto. Para demonstrar ausência, precisaríamos ser capazes de observar o infinito. Ainda não somos …

Sendo assim, o ônus da prova nunca pode estar na inexistência de um fenômeno, mas sim na existência. Isso explica a sequência do teste de hipótese. A premissa natural, nossa posição inicial, é a hipótese nula. Caso se demonstre o fenômeno, rejeitamos a nulidade e adotamos uma posição a favor da existência. Se o estudo não consregue rejeitar a hipótese nula, ficamos com a premissa básica = não sei se existe = não existe até que se prove o contrário.

Portanto, devemos evitar dizer que um estudo prova que algo não tem benefício.

Mas vamos além nesta discussão. Quando estamos diante de uma observação negativa, precisamos avaliar qual o tamanho do fenômeno que a lente de observação do estudo era capaz de perceber. Pois o estudo é negativo para este tamanho de efeito, não tendo capacidade de sugerir inexistência de efeitos menores.

O desfecho primário do ORBITA era tempo de exercício no teste de esforço, um desfecho que traduz o quanto a angina limita o paciente. Por ser um desfecho de caráter objetivo, este é muito utilizado na avaliação de efeito anti-anginoso.

O ORBITA tinha poder para detectar uma melhora de 30 segundos no tempo de exercício, decorrente da dilatação do vaso: subtraindo a melhora do grupo angioplastia pela melhora do placebo, sobraria 30 segundos. Mas o que significa 30 segundos?

Os autores partiram de evidências prévias de que o uso de drogas anti-anginosas superam o placebo em 55 segundos. Espera-se que a dilatação do vaso seja mais efetiva do que drogas. Assim, era provável que o efeito do stent fosse maior que 55 segundos. Mesmo assim, o estudo se preparou para detectar uma diferença menor que esta, a de 30 segundos. Portanto, o ORBITA tem poder para detectar o benefício típico de intervenção anti-anginosas e até efeitos menores do que esse.

Assim, o resultado do ORBITA pode ser resumido em duas frases:

Angioplastia não promove um efeito anti-anginoso tipicamente esperado.
Por outro lado, o estudo não prova inexistência de efeitos menos relevantes.

Não seria científico dizer que o estudo demonstra que “stents não melhoram sintoma de angina”.

Na verdade, o grupo stent apresentou uma melhora de 28 segundos e o grupo placebo de 12 segundos. Isso gerou um incremento de 16 segundos com a angioplastia (após subtraída do efeito placebo). Porém esse pequena melhora não alcançou significância estatística, portanto não sabemos se é real ou acaso. Mas não deixa de ser um indício de que pode haver alguma melhora.

Vale salientar que o resultado se reproduziu de forma negativa em todos os outros desfechos secundários: escore de angina, classe funcional, qualidade de vida, tempo para surgimento de isquemia no exercício, escore de DUKE, consumo máximo de oxigênio. É um estudo consistente.

E essa é uma das utilidades de desfechos secundários. Mostrar a consistência do resultado primário. Errado é procurar um resultado positivo em algum desfecho secundário quando o estudo é primariamente negativo. Mas desfechos secundários podem reforçar o resultado primário.

De fato, é difícil encontrar algo que coloque em dúvida o resultado do ORBITA, por mais inquietante que este seja. E isso fica mais claro quando analisamos com cuidado os detalhes metodológicos.

A Veracidade do Resultado

O ORBITA é um ensaio clínico randomizado, cego para paciente, médicos e avaliadores dos desfechos, com número mínimo aceitável de pacientes (200) para gerar homogeneidade de grupos da randomização, sem potencial de viés de desempenho (cegamento, drogas utilizadas de forma semelhante), risco baixo de viés de observação (desfecho primário objetivo, estudo cego), analisado por intenção de tratar. Além destas questões clássicas, vale salientar cuidados adicionais:

Pacientes foram testados quanto à efetividade do cegamento e o índice foi perfeito (resposta igual entre os dois grupos quando os pacientes eram perguntados em que grupo estavam).
Mesmo sedados, havia um isolamento acústico que reduzia a possibilidade do pacientes ouvir o som dos procedimentos.
Em 69% a obstrução estava na descendente anterior, a mais importante coronária.
Classe funcional III (angina aos mínimos esforços) estava presente em 39% dos pacientes, sendo o restante classe funcional II.
Todas as lesões eram confirmadas pelo FFR como hemodinamicamente importantes e a média de estenose foi 84%.
Pacientes que teriam alguma lesão não angioplastada foram excluídos, evitando angina residual decorrente de outro vaso.
O grupo sham também manteve dupla anti-agregação plaquetária.

Surpreendente?

Na verdade, o resultado não é muito surpreendente, pois dor é muito susceptível ao efeito placebo e quanto mais complexo for o procedimento, mais forte será o placebo. Comprimido azul tem placebo mais forte que comprimido branco, placebo injetável é mais intenso que placebo oral e placebo caro é mais “eficaz” que placebo barato.

Portanto, o resultado de que stent tem efeito placebo não é surpresa e de certa forma já havia sido demonstrado.

Em 1960 foi publicado o primeiro ensaio clínico da história a utilizar sham no grupo controle de um procedimento cirúrgico. Coincidentemente, a doença em questão era angina do peito e o estudo foi publicado no American Journal of Cardiology. O estudo foi realizado para avaliar se uma popular cirurgia na época (ligadura da artéria mamária interna) realmente melhorava angina. Na prática, a melhora da angina relatada pelos pacientes entusiasmava os clínicos. Até que cientistas (céticos) resolveram testar a verdade. Fizeram um ensaio clínico onde todos os pacientes recebiam a incisão cirúrgica, mas apenas metade era sorteada para ligadura da artéria. O resultado? Igual ao estudo ORBITA. A melhora do grupo cirurgia também ocorreu no grupo sham.

Portanto, já sabíamos que angina é um sintoma muito susceptível ao efeito placebo de intervenções. Porém esperávamos um maior efeito direto do stent.

E como fica a prática clínica?

Na prática clínica atual, quando o paciente tem angina estável, considera-se a intervenção coronária percutânea como um meio eficaz de melhorar os sintomas, melhor do que o tratamento clínico. Essa é uma indicação frequente. Isso muda depois do ORBITA?

Para responder a esta questão, devemos utilizar o pensamento científico bayesiano, calculando o valor preditivo negativo do ORBITA. Sendo o ORBITA um estudo negativo, qual a probabilidade de inexistência de um efeito direto minimamente relevante do stent?

Valor preditivo resulta da probabilidade pré-estudo da hipótese ser verdadeira e da qualidade do estudo. Antes do estudo, a probabilidade do stent melhorar angina era alta, com base na lógica e em estudos randomizados não cegos. O ORBITA é um estudo de boa qualidade, portanto deve ser capaz de promover uma redução desta probabilidade. Mas como partimos de uma probabilidade pré-estudo alta, terminamos com uma probabilidade pós-estudo ainda razoável. Devido à probabilidade pré-teste, o ORBITA não afasta de todo alguma melhora da angina.

Por outro lado, o ORBITA é suficiente para nos alertar que provavelmente superestimamos o benefício direto do stent na angina estável. O estudo reduz o “valor” do procedimento, colocando um pouco menos de peso neste benefício dentro de uma perspectiva econômica (benefício - custo).

Benefício = evidência clínica x preferência do paciente

Custo = custo pessoal do paciente + custo monetário do sistema.

Valor = benefício - custo.

Nesta equação, o “valor” do stent ficará algo menor após o ORBITA, principalmente se a preferência do paciente pender ao tratamento clínico e/ou se o custo pessoal do paciente for individualmente grande (risco de complicações, por exemplo).

Há sempre uma questão filosófica quanto ao placebo, que já abordamos nesse Blog: se placebo promove uma melhora real, não poderíamos fazer uso disso? Bem, é interessante desfrutar do placebo quando este incrementa um tratamento que já tem efeito direto. No entanto, entraremos em um dilema ético ao propor “simular” para o paciente que algo funciona apenas para obter um efeito placebo. É uma linha tênue que se desenha entre o adequado e o inadequado.

Epílogo

A elegância do ensaio clínico ORBITA nos faz lembrar que medicina baseada em evidências nada mais é do que medicina baseada em humildade. A humildade de reconhecer que muito do que fazemos possui impacto menor do que imaginamos. Nem por isso fecharemos com a negação plena do efeito anti-anginoso do stent. Este efeito ainda é provável.

“Nudge” é um termo proposto pelo ganhador do prêmio Nobel de economia deste ano. Richard Thaler demonstrou que o pensamento humano é anti-econômico, superestimando ganho e subestimando custos. "Nudge" é um empurrãozinho que realoca nosso pensamento em uma direção menos enviesada. O resultado do ORBITA funciona como um “nudge” na direção do pensamento clínico racional.

_______________________________________________________________________

Conheça nosso curso de medicina baseada em evidências, clicando aqui.

quarta-feira, 6 de setembro de 2017

Carboidrato versus Gordura: Estudo PURE, glamour e impureza

É garantido o glamour de um estudo apresentado como destaque no Congresso Europeu de Cardiologia, com autores de renome internacional, envolvendo 135.000 indivíduos, publicado no Lancet. É a mesma garantia de sucesso que tem um blockbuster de Hollywood com autores famosos e orçamento estratosférico. Mas como sabemos, filmes de Hollywood nem sempre são os melhores, assim como estudos glamourosos nem sempre são os que trazem as melhores evidências.

Este foi um estudo de coorte prospectiva, observacional, de amostra gigantesca, recrutada em 18 países, a maioria deles de baixo-médio nível sócio-econômico. A grande repercussão deste estudo reside no fato de que seu resultado contradiz o que se tem recomendado como dieta preventiva de eventos cardiovasculares (American Heart Association - AHA). Em resumo, houve associação entre dieta rica em carboidrato e maior mortalidade, enquanto dieta rica em gordura foi associada a menor mortalidade.

Há décadas, o AHA recomenda que a base da pirâmide alimentar seja constituída por carboidratos, enquanto o percentual de gordura deve ser < 10% das calorias totais. De fato, deve-se reconhecer que a recomendação do American Heart Association, copiada pela maioria das sociedades de cardiologia do ocidente, nunca foi embasada em evidências científicas de qualidade. Essa recomendação se baseia principalmente na plausibilidade biológica: colesterol é fator de risco para doença cardiovascular, dieta rica em gordura saturada aumenta colesterol, portanto a dieta pobre em gordura prevenirá eventos cardiovasculares. No entanto, não existem dados empíricos comprovando que a plausibilidade da dieta pobre em gordura se confirma como estratégia preventiva. Do ponto de vista epidemiológico, há apenas questionáveis estudos ecológicos e observacionais.

Portanto, é correto levantar a dúvida em relação à recomendação dietética preventiva de eventos cardiovasculares. Por outro lado, não é correto considerar que o estudo PURE tem poder de promover uma mudança de paradigma, como os autores tentam sugerir na frase conclusiva do artigo:

“Global dietary guidelines should be reconsidered in light of the consistency of findings from the present study …”

Na verdade, o estudo PURE não oferece um nível de evidência proporcional ao seu sucesso quanto à prova de conceito de qual a melhor dieta preventiva de eventos cardiovasculares. E há duas razões para esta minha afirmação: (1) uma teórica, relacionada ao desenho observacional do estudo e (2) outra empírica, relacionada a uma interessante peculiaridade do próprio resultado do estudo que não foi discutida pelos autores.

Considerações Teóricas quanto ao Caráter do Estudo

Não se trata apenas do PURE ser um estudo observacional, sujeito a viés de confusão. Estamos diante do maior risco de viés de confusão, que ocorre quando estudos observacionais avaliam o impacto de comportamento (behavioral studies). Isto porque comportamento tem forte associação com características de influência prognóstica, tornando impuras inferências causas a partir de associações entre exposição e desfecho. Neste sentido, o nome do estudo (PURE) soa paradoxal. Fico a imaginar como foi o processo de escolha deste nome pelos autores. Bastidores ...

Aproveitarei esse assunto para aprofundar a história do risco de viés de confusão em estudos observacionais. Na verdade, há dados mostrando uma razoável acurácia de estudos observacionais em predizer eficácia. Portanto, nem todo estudo observacional é tão impuro. Isso pode soar estranho ou diferente do que venho falando, mas explicarei.

Quando se compara de forma observacional tratamento A versus tratamento B, e a escolha destes tratamentos não tem muita associação com fatores prognósticos, estes estudos ganham mais acurácia para causalidade. Por exemplo, se comparo dois tipos de cirurgia, onde a escolha se dá pela conduta do serviço (serviço A prefere cirurgia A, serviço B prefere cirurgia B) e não pela gravidade do paciente, estes estudos tendem a ter resultados confirmados por ensaios clínicos. Mas se a cirurgia A for menos invasiva do que a cirurgia B, e a escolha se der pela gravidade do paciente, claro que haverá um imenso viés de confusão.

Portanto, há situações e situações … e aqui estamos na pior das situações em que um estudo observacional tenta inferir sobre causalidade: hábitos de vida.

Esta é a situação responsável por equívocos históricos (vitaminas, exercício, fio dental, terapia de reposição hormonal por opção da mulher). E como sabemos, todos estes estudos observacionais apresentaram sofisticadas análises multivariadas que ajustavam para conhecidos efeitos de confusão. Se o ajuste para os “conhecidos” é imperfeito, imaginem o ajuste para variáveis de confusão desconhecidas. Tudo isso gera efeito de confusão residual. E residual não significa pequeno.

Epidemiologicamente, dieta rica em carboidratos é sinônimo de condição sócio-econômica desfavorável, tal como reforçado pelos próprios resultados do PURE: regiões mais pobres tiveram maior ingestão de carboidrato. Um indivíduo do Zimbábue que caia do cavalo ou desenvolva um câncer poderá ter um atendimento de pior qualidade no seu hospital comunitário, se comparado ao sueco que precise de assistência médica. Em paralelo, a dieta do Zimbábue é mais rica em carboidrato do que a dieta da Suécia. Isso me faz lembrar do estudo caricatural publicado no NEJM que mostrou associação do consumo de chocolate e sucesso da conquista de prêmios Nobel. Nível sócio-econômico pode explicar aquela associação representada na figura abaixo.

Mas devemos lembrar, a teorização acima é apenas um exemplo de potencial fator de confusão. No fundo, não sabemos que fatores poderiam estar agindo, há fatores previsíveis e imprevisíveis.

Confusão entre “veracidade” e “precisão”

Percebo nesta discussão que parte do glamour está na confusão entre tamanho do estudo e sua assertividade. Um grande tamanho amostral é responsável por maior precisão do estudo, menor risco de erro aleatório, intervalos de confiança mais estreitos, associações estatísticas mais significantes. Tudo isso reduz o efeito do acaso como causador de ilusões. Mas isso não garante veracidade dos resultados.

Podemos estar com um estudo muito preciso para uma informação muito errada.

Assim, precisamos então relembrar o que é precisão.

Se fizéssemos o mesmo estudo, com a mesma metodologia, em outras 100 amostras de 135.000 pacientes, os resultados das medidas de associação (hazard ratio) seria quase o mesmo nestas 100 amostras. A isso chamamos de precisão, o mesmo que reprodutibilidade.

Porém a informação que sempre será a mesma pode estar errada devido a erros sistemáticos. E aqui estamos em potencial com o maior causador de ilusões epidemiológicas: o viés de confusão.

Viés é um erro sistemático, que tende a se repetir da mesma forma. Se temos um grande tamanho amostral, o erro sistemático tende a se repetir mais vezes e o achado influenciado pelo viés terá maior significância estatística. O imenso tamanho amostral amplifica estatisticamente um erro sistemático.

Será que o estudo PURE precisava mesmo de 135.000 pacientes? Fico a questionar como se chegou a este número, até porque não está descrito nos métodos o cálculo do gigante tamanho amostral. Sem dúvida esse tamanho amostral tem um impacto: glamour.

Fica a mensagem: precisão não é exatamente a mesma coisa que veracidade.

Considerações quanto ao Resultado do Estudo

Até aqui argumentei com base em princípios da medicina baseada em evidências. Agora vem o argumento mais importante, o qual sugere que no caso específico do estudo PURE estamos tratando de um resultado decorrente de efeito de confusão.

Os autores se isentaram de comentar sobre o mais importante resultado do estudo: embora dieta rica em carboidrato se associe a maior mortalidade geral e dieta rica em gordura a menor mortalidade geral, nenhuma delas se associa a mortalidade cardiovascular, nem eventos cardiovasculares! Ou seja, a discussão a respeito de prevenção cardiovascular perde todo o sentido. Se alguém morreu ou viveu, não foi pela influência da dieta no sistema cardiovascular. Foi por outra coisa.

Que coisa?

Quando vemos efeitos de intervenções em mortalidade geral que não são explicados por redução nos eventos específicos que explicariam o benefício na mortalidade, estamos diante de uma forte sugestão de que os resultados decorrem de efeito de confusão.

Se a prevenção (dieta rica em gordura) ou causa (dieta rica em carbo) não ocorreu por intermédio de eventos cardiovasculares, ocorreu por quê? Os estudos mostram associações com morte não cardiovascular, que podem estar representando o conjunto de condições que terão uma maior mortalidade quando a assistência médica é deficitária. Ou seja, a causa do resultado são efeitos de confusão.

Não quero deixar este post mais longo... Desta forma, prometo que em postagem futura discutirei quando é melhor escolher o desfecho mortalidade geral ou mortalidade específica.

Mas então não seria de se esperar que a dieta rica em carboidrato tivesse maior mortalidade cardiovascular, pelos mesmos efeitos de confusão que estariam causando as outras mortes? Sim, pode ser que haja esse efeito, mas ele estaria apenas anulando uma menor mortalidade cardiovascular na dieta rica em carboidrato. O efeito de confusão poderia neutralizar um resultado que seria a favor da dieta rica em carboidrato.

Reconheço que acabo de especular. Mas como já disse, quanto ao mecanismo de confusão exato, podemos apenas especular. Confusão é um sistema complexo, imprevisível. Embora não tenhamos como prever que os mecanismos de confusão, temos como prevenir qualquer um deles quando desejamos inferir causalidade: a randomização.

O que dizem os ensaios clínicos randomizados?

Em 2015 foi publicada pela Cochrane uma revisão sistemática dos ensaios clínicos randomizados que avaliaram a eficácia da redução de gordura saturada na dieta, tal como recomenda o American Heart Association. São 15 ensaios clínicos, com alto nível de heterogeneidade em seus resultados (I = 65% - vide post sobre meta-análise), sendo que a qualidade média das evidências foi considerada apenas moderada. É sempre bom lembrar que meta-análise de estudos de moderada qualidade não resulta em evidência de alta qualidade. Pelo contrário, fica mais incerto combinar estudos problemáticos e heterogêneos.

Portanto, devemos considerar a incerteza em relação a estes assuntos, que precisam ser explorados por melhores ensaios clínicos. Ao reconhecer esta incerteza devemos concluir que a totalidade das evidências intervencionistas nos traz mais insights exploratórios do que confirmatórios.

Mas o que dizem esses insights exploratórios? Sugerem que há um pequeno efeito benéfico na restrição de gordura saturada na prevenção de eventos cardiovasculares:

The findings of this updated review are suggestive of a small but potentially important reduction in cardiovascular risk on reduction of saturated fat intake.

Ou seja, aqui temos um grande estudo observacional, com alto risco de viés de confusão sendo comparado ao conjunto de ensaios clínicos randomizados de qualidade moderada. Fica a critério de cada um decidir qual a tendência, mas torna-se bastante duvidoso se apostar nos resultados do PURE.

É frequente se utilizar o argumento da dificuldade de realizar estudos randomizados sobre dieta: como garantir que as pessoas randomizadas para dieta A de fato façam dieta A, e as pessoas alocadas para dieta B de fato comam B? Isso não é o mesmo que usar um comprimido. No entanto, essa colocação não leva em conta um conceito científico importante: contraste.

O que testa conceitos é o contraste entre os grupos, e não a perfeição na execução da recomendação, que não existe em nenhum experimento. Claro que pessoas randomizadas para dieta rica em gordura vão transgredir com carboidrato em alguns momentos, porém o efeito desejado da randomização é garantir um contraste de exposição entre os grupos. Mesmo transgredindo, o grupo gordura vai comer mais gordura do que o grupo carboidrato e vice-versa. É o contraste que testa a hipótese.

Portanto, realizar estudos intervencionistas com dieta é factível, pois estes são capazes de gerar contraste dietético e testar hipóteses. Nestes estudos estarão as respostas para nossas perguntas, não em gigantescos estudos observacionais que amplificam efeitos de confusão.

Epílogo

A antítese da medicina baseada em evidências é a medicina baseada em autoridade. A autoridade dos autores, do tamanho do estudo, do destaque no Congresso Europeu. Autoridade sob a forma de glamour.

O glamour do estudo PURE nada tem a ver com a qualidade ou relevância da evidência. O problema é que nossa mente é mais seduzida por glamour do que pela rigidez do pensamento científico. Precisamos de novidades, mesmo que estas sejam falsas.

Esse estudo não faz evoluir o conhecimento científico a respeito de dieta preventiva de eventos cardiovasculares. Apenas confunde uma questão já carente de evidências. Este estudo, serve mais para nos lembrar que (1) precisão não é o mesmo que veracidade e (2) precisão pode ser uma forma de amplificar erros aleatórios, aumentando sua significância estatística.

Devemos reconhecer a incerteza quanto ao impacto de carboidratos e gorduras no risco cardiovascular. Incerteza das recomendações do AHA e incertezas do impuro estudo PURE. Por enquanto recomendações não devem ser baseadas em qualidade do alimento, mas sim quantidade, pois esta última é plausibilidade extrema. Seja carboidrato, seja gordura, o pior é quando um alimento é muito gostoso, nos fazendo passar dos limites da necessidade biológica. Comer demais reduz qualidade de vida no longo prazo.

Que sempre diferenciemos medicina baseada em evidências de medicina baseada em glamour. Diferenciar pureza e impureza.

_______________________________________________________________________

Conheça nosso curso de medicina baseada em evidências, clicando aqui.