sexta-feira, 15 de fevereiro de 2019

O verdadeiro sentido de um “estudo negativo”



Voltando à nossa série de postagens sobre a “arte de ler um artigo científico”, iniciaremos a discussão de como interpretar um “estudo negativo”. Mas antes de abordar o julgamento da veracidade deste tipo de estudo (próximo post), precisamos discutir o que significa um estudo negativo. Essa discussão é quase filosófica. 

Neste contexto, “negativo” não quer dizer ruim, nem que foi demonstrado um efeito deletério de uma conduta médica. “Negativo” significa que o estudo não conseguiu comprovar a existência de um fenômeno. Mas aqui vai a ideia central: na verdade, não existe estudo negativo. 

Não existe estudo negativo, pois um estudo não é planejado para negar a veracidade de uma ideia. Por dois motivos: (1) negar existência é impossível; (2) seria inútil negar existência.

Primeiro, nenhum experimento é capaz de negar a possibilidade de existência. Em analogia, há sempre possibilidade de que algo seja menor do que a potência da lente do microscópio; ou esteja além da lente do telescópio; ou tenha aparecido em um momento anterior ou posterior à observação realizada. Por exemplo, é impossível provar que disco voador não existe. Simplesmente, a gente ainda pode não ter conseguido detectar sua existência. 

Sendo impossível provar inexistência, o ônus da prova está da existência de um fenômeno, dando origem ao princípio da hipótese nula: partimos da premissa da inexistência e ficaremos com esse pensamento até que alguma evidência comprove existência, rejeitando a nulidade. 

Partindo da premissa inicial de inexistência, o ônus da prova está na existência.

Segundo, diante da teoria da hipótese nula, negar existência é inútil, pois já partimos da inexistência. Um estudo é necessário para rejeitar a hipótese nula e evoluir para o conhecimento de que algo existe. 

A nulidade não precisa ser comprovada, apenas precisa ser rejeitada. 

Não há motivo em “acreditar” em disco voador se isto não está comprovado. Eu pessoalmente, pouco me importo com isso. Simplesmente, não sei. A gente precisa se importar menos com o que não está comprovado. Portanto, estudos não são desenhados para provar que algo não existe. 

Um estudo negativo é um estudo desenhado para ser positivo, mas que não conseguiu ser positivo. 
Quando um estudo de resultado negativo contraria a crença ou conduta vigente, entusiastas da crença ou conduta costumam criticar o estudo negativo como se este fosse um estudo limitado para provar a ausência: “este estudo não é suficiente para provar que tal tratamento não funciona”. Este tipo de argumentação carece da percepção de que um estudo é desenhado para provar a existência do fenômeno. Apesar deste desenho, o estudo negativo não conseguiu provar. 

Cuidado com a inversão do ônus da prova. 

Do ponto de vista científico, é um erro (teórico e pragmático) propor um estudo no intuito de provar que algo não existe ou algo não funciona. Isto ocorreu recentemente, quando oncologistas, sabendo que a eficácia da fosfoetanolamina não fazia sentido, propuseram um estudo para confirmar que aquilo não passava de uma falácia. O estudo foi negativo,  claro. No entanto, entusiastas da fosfoetanolamina argumentaram que aquele estudo não era suficiente para provar que a droga não funcionava. Tinham razão … não pode haver prova que não funciona. Este é um exemplo de estudo inútil pois nunca conseguirá provar uma inexistência que não precisa ser provada.

Oncologistas, com um intuito válido de combater anti-ciência, se propuseram a algo impossível: provar inexistência. Apesar da boa intenção científica, caíram na própria armadilha.

Não se pode dizer que um estudo “demonstrou ausência de benefício”. O correto é dizer que o estudo não demostrou benefício. 

Cuidado com a semântica. 

Ontem eu explicava a importância da postura cética em respeito à hipótese nula, quando um perspicaz aluno me interrompeu e questionou: “professor, como nós estudantes, ainda sem grande experiência, podemos contestar um médico experiente que implementa uma conduta sem comprovação científica.” A pergunta vai ao cerne da questão e me permitiu o insight: “não cabe a vocês provar que a conduta implementada não funciona, cabe ao médico demonstrar que a conduta funciona.” Repetindo, o ônus da prova está na demonstração de benefício. Desta forma, sugeri aos meus alunos que apenas questionem: “professor, qual o embasamento científico desta conduta.” Meus alunos não precisam provar que o preceptor está errado. O preceptor que precisa provar que está correto. 

A responsabilidade do argumento está em quem defende a conduta. 

Esta discussão é essencial para a interpretação adequada de um estudo negativo: a existência do fenômeno não foi comprovada. Um bom estudo é desenhado para ter sensibilidade e especificidade da detecção do fenômeno. A especificidade depende do método científico que previne contra erro aleatório tipo I (afirmar casualmente o falso) e vieses de positividade. A sensibilidade é obtida pelo recrutamento de amostra populacional de tamanho ideal (previne erro tipo II - deixar de afirmar casualmente o verdadeiro), característica ideal, dose ideal, competência ideal dos profissionais, monitoramento da correta aplicação da conduta. Tudo isso melhor do que ocorre no mundo real. 

Sendo assim, quando um bom estudo não consegue provar um conceito, a probabilidade deste conceito ser verdadeiro se reduz. E os estudos negativos vão diminuindo a probabilidade até um ponto em que se julga que não vale mais a pena insistir na comprovação da hipótese. Servem para nos fazer desistir de comprovar uma ideia, o que não é o mesmo de provar inexistência.

Em conclusão, na análise de um artigo negativo, será inadequado concluir que aquele trabalho é insuficiente para provar inexistência.  A interpretação correta é que o trabalho não conseguiu provar existência. A utilidade deste trabalho reside na redução da probabilidade da ideia vir a ser comprovada no futuro. O impacto na redução da probabilidade é proporcional à qualidade do estudos. Isto abre caminho para nossa próxima postagem da "arte de ler um artigo científico": como analisar a qualidade metodológica de um estudo negativo?

---------------------------------------------------------------------------------

Acesse nosso Curso Online de MBE, clicando aqui

terça-feira, 29 de janeiro de 2019

Brumadinho e a Lógica Científica do Cisne Negro


* Artigo publicado no Jornal A Tarde em 01 de fevereiro de 2019

A lógica do cisne negro é um conceito proposto pelo cientista da incerteza Nassim Taleb, que define eventos (1) raros, (2) imprevisíveis e (3) de grande impacto. São os “cisnes negros” que mudam o curso da humanidade: queda da bolsa de 1929, surgimento de Hitler, descobrimento casual dos antibióticos, surgimento do iPhone, internet, 11 de setembro. Nenhum desses raros eventos poderia ser previsto, portanto não poderiam ser prevenidos, nem planejados. E o impacto deste eventos é proporcional a sua imprevisibilidade.

Em ciência, a lógica do cisne negro torna cientistas atentos ao papel da serendipidade (ideia que surge do nada) e do acaso nas grandes descobertas. Verdadeiros cientistas não se garantem apenas com  plausibilidade, focalizam o máximo na experimentação e reconhecem resultados inusitados como geradores de hipóteses. Respeitam o cisne negro.

Na interpretação da história social ou clínica, a falta de reconhecimento do conceito do cisne negro faz com que interpretemos eventos com base em falaciosas hipóteses causais criadas pelo fenômeno de “previsibilidade retrospectiva”: contamos a história de frente para trás, inventando sentido para um fato. 

Por outro lado, nossa elaboração mental deve perceber quando o evento não se trata de um cisne negro. Assim, a diferenciação entre cisnes brancos e negros deve estar no cerne da alfabetização científica da sociedade. 

Quando ocorreu o desastre de Mariana, pensei: será que este foi um cisne negro? Embora analistas responsabilizassem a Vale por não ter prevenido aquele evento, eu me questionava se a impressão de que aquela catástrofe seria evitável não seria uma falácia narrativa. Aquele foi um evento raro e impactante. E como ninguém previu, poderia ser um evento imprevisível. Os três critérios do cisne negro estariam presentes. 

Brumadinho desvendou o dilema: o desabamento das barragens da Vale não são cisnes negros. Ao ocorrer o mesmo evento em curto período, este deixou de ser raro e imprevisível. Um único evento inusitado pode decorrer do acaso, mas fica menos provável que dois eventos inusitados repetidos em pouco tempo decorram do acaso. Cientificamente, reprodutibilidade reduz a probabilidade do acaso. 

A percepção de que isso não foi por acaso implica na possibilidade de prevenção a partir da identificação de causas. Portanto, abre-se o caminho para que isto nunca mais ocorra. 

No entanto, surge uma preocupação ...

Se por um lado, o impacto local foi devastador, a perda do inusitado reduz o impacto histórico daquele evento. De acordo com a lógica do cisne negro, quanto mais inusitado, mais impactante é o evento. Brumadinho deixou de ser imprevisível, inusitado. Assim, passado o trauma da semana, o assunto naturalmente se diluirá entre tantos outros e a probabilidade de mudança de atitude pode ser menor do que após o inusitado desastre de Mariana. 

Portanto, fiquemos atentos, Brumadinho não é um cisne negro!

domingo, 27 de janeiro de 2019

A arte de ler um artigo científico


Neste ano planejo uma série de postagens que denominarei de “bússolas” para a interpretação crítica de trabalhos científicos. Normalmente discuto interpretação científica no contexto de algum artigo ou assunto controverso. Pretendo agora revisar estes conceitos de forma estruturada, em postagens definidas por tipos de estudo e tipos de resultado. 

Não gosto muito da conotação burocrática e simplista dos termos “guia” ou “checklist” de análise de uma evidência científica. A leitura de um artigo requer não apenas a “checagem” de detalhes. Checklist é para avião que vai decolar ou cirurgia que vai começar. Não basta checklist na interpretação científica. É necessário visão do todo, envolvimento com o assunto, percepção intuitiva trazida pela experiência, capacidade de reflexão, um equilíbrio entre ceticismo e pragmatismo. É como ler um livro ou assistir a um filme, nossa interpretação não se resume a um checklist

Imaginem um crítico de cinema que analisa filmes pela forma estruturada de um checklist. Não chegaria ao seu objetivo. Por outro lado, na análise de uma evidência científica não podemos ter liberdade artística para interpretar como quisermos pois isso seria um convite ao viés de confirmação de crenças ou valorização seletiva de resultados. Precisamos controlar nossos vieses pessoais durante a leitura; precisamos saber como procurar componentes ilusórios dos trabalhos, perceber quando ruídos se confundem com sinais; precisamos seguir princípios científicos. Estes princípios devem nos nortear como uma bússola.

A leitura de um artigo não é um processo passivo. Mais do que uma leitura, é um processo de pensamento baseado em dados. Pensamos primeiro, depois procuramos a resposta no trabalho. E assim vamos construindo uma ideia mental do quanto aquela evidência deve influenciar nosso pensamento. 

Com estas colocações não quero transmitir a ideia de que a interpretação de uma evidência é difícil ou laboriosa. Pelo contrário, a leitura de um artigo deve ser atividade leve, natural, e até divertida.

Como tenho proposto ao longo de múltiplas postagens, a leitura do artigo começa antes do artigo. Começa dentro de nós, com a procura de vieses pessoais que atrapalhem uma análise racional. Precisamos nos preparar mentalmente para a análise de qualquer evidência externa, pois esta pode vir de encontro a nossas perspectivas internas. Essa preparação passa pelo questionamento de quais são nossas evidências internas (crenças) a respeito do assunto que está exposto no título do trabalho de interesse. Esta proposta de aquecimento mental foi tema de postagem prévia no Blog

Prosseguindo com a reflexão pré-artigo, precisamos saber do que o artigo trata. Para isso teremos um contato inicial com o conteúdo do trabalho, pela leitura de apenas duas sentenças do resumo:  objetivo e conclusão. Esses são os pilares de nossa análise. O objetivo mostra a hipótese testada ou a realidade descrita. A conclusão reflete o que o autor quer que você acredite como mensagem final do artigo. Neste momento exercitaremos o ceticismo, pois a leitura do artigo deve ser uma tentativa de refutar a conclusão. Uma rigorosa análise de ruído (viés, acaso) versus sinal (verdade). Uma baixa relação sinal/ruído trará dúvida quanto à veracidade da conclusão do trabalho. 

A leitura da conclusão também nos permite um importante insight do quanto o autor é enviesado. Refiro-me ao diagnóstico de spin, quando o autor reconhece um resultado primário negativo, mas logo em seguida gera uma tendência positiva a partir da apresentação de um resultado secundário. Por exemplo, “na análise global não houve diferença entre os grupos quanto à fração de ejeção do ventrículo esquerdo [desfecho primário], porém houve melhora da troponina [desfecho secundário]”. Spin é um forte marcador de tendenciosidade. A detecção desde o início nos fará mais atentos.  

Ainda na leitura pré-artigo, vale apenas observar se (1) o estudo é uma iniciativa do fabricante do produto testado, (2) se é realizado por grupo independente, porém recebe ajuda de custo do fabricante ou (3) se o trabalho não possui nenhuma relação de financiamento com o fabricante. Essa numeração representa uma escala do grau de envolvimento do fabricante com o trabalho científico. Teoricamente, quanto menor o envolvimento, mais isento seria o estudo. Recente trabalho publicado no Annals of Internal Medicine demonstrou que quanto maior a vinculação com indústria farmacêutica, mais utilização de métodos estatísticos inadequados com objetivo de obter o resultado desejado. 

Devemos também investigar se os autores possuem conflito de interesses, seja relação com indústria, seja conflitos assistenciais ou intelectuais. Conflito de interesses assistencial é aquele desejo do autor em provar uma hipótese que fortaleça sua atividade profissional. Esse pode ser um conflito maior do que o daqueles que recebem um dinheirinho da indústria. Por exemplo, trabalhos que testam acurácia de métodos diagnósticos ou eficácia de tratamentos podem ser feitos por profissionais cuja atividade principal é ligada ao método ou tratamento. Já conflito de interesses intelectual ocorre quando um autor faz parte de uma legião de estudiosos e crentes a respeito de um assunto. Por exemplo, no caso do escândalo do estudo PREDIMED, os autores fazem parte de uma legião de crentes na dieta do mediterrâneo. 

Não proponho aqui invalidar o estudo se este tiver fonte financiadora interessada ou conflito de interesses. Mas devemos aumentar nosso grau de atenção. Revisão sistemática da Cochrane mostra que trabalhos com conflito de interesses apresentam maior probabilidade de resultados positivos do que trabalhos sem financiamento do fabricante, um viés que não deveria existir. Interessante notar que, pela avaliação tradicional de risco de viés da Cochrane, o estudo não detectou maior risco de viés nos trabalhos com conflito de interesses. Isto ocorre porque estudos financiados pela indústria são "bem feitos" de acordo com uma avaliação metodológica superficial: seguem a metodologia padrão (tamanho amostral, randomização, cego). Os ruídos destes trabalhos usualmente são detectados pelo tipo de leitura que propomos, algo que vai além de um checklist presente em revisões sistemáticas. 

Portanto, até aqui analisamos primeiro a nossa tendenciosidade como leitor, depois a tendenciosidade do autor.

Em se tratando de um trabalho analítico, o próximo passo é a análise da probabilidade pré-teste da hipótese testada. O experimento científico é o teste, enquanto o pré-teste é o conhecimento que existe antes do trabalho. Há dois componentes da probabilidade pré-teste: a plausibilidade da hipótese (mecanismo lógico, conhecimento de ciência básica que suporta este mecanismo) e trabalhos prévios que testaram a hipótese. 

Esta etapa é importante pois o valor preditivo do resultado do trabalho depende não só do trabalho, como também da probabilidade pré-teste da ideia sugerida pelo trabalho. Ao final da leitura de um artigo, queremos saber qual a probabilidade daquela conclusão ser verdadeira. Isso depende também da qualidade pré-teste da ideia. 

Trabalhos cujo resultado propõe ideias sem sentido terão baixo valor preditivo positivo, independente da força da evidência. Assim como trabalhos negativos terão menor valor preditivo negativo quando a ideia for muito promissora. Esta é a perspectiva bayesiana que defendo para o processo de análise crítica de uma evidência. Uma evidência não deve ser analisada no vácuo, mas sim no contexto da ideia. 

Além de analisar qualidade da hipótese testada, devemos analisar a probabilidade pré-teste do resultado encontrado. Resultado improváveis possuem menor probabilidade pré-teste e menor valor preditivo positivo. Precisamos avaliar se estamos diante de um resultado "bom demais para ser verdade".

A próxima etapa será a procura dos registros prévios do protocolo, com o intuito de saber: o protocolo foi publicado a priori (bases de protocolos ou revistas)? O protocolo a priori coincide com método publicado no artigo ou houve mudanças a posteriori? Respostas “sim” para a primeira pergunta e “não” para a segunda pergunta trarão credibilidade aos resultados. Não é frequente com grosseiras mudanças de protocolo, como exemplificadas por duas postagens prévias (ISCHEMIA E SCOT-HEART). Uma recente varredura nos registros do clinicaltrials.org demonstrou que 30% dos trabalhos modificam o desfecho primário definido a priori. Estas mudanças reduzem substancialmente o valor preditivo do estudo, ou seja, sua credibilidade.

Chegamos finalmente à leitura do artigo. Agora, procuraremos por erros sistemáticos (vieses) e aleatórios (acaso) que promovam ruídos e resultados ilusórios. Esta leitura do artigo se resume a “métodos” e “resultados”. 

Um parêntese: “introdução” e “discussão” não precisam ser lidas. Eu quase nunca leio. Não que seja ruim ler, é que minha preguiça não me deixa perder tempo com o desnecessário. Mas se lerem, não simplesmente acreditem (fé) nos argumentos do autor para a ideia do trabalho (introdução), nem na interpretação dos resultados (discussão). Não leiam acreditando, leiam duvidando. Mesmo que ao final concordem.

Temos que saber o que procurar em métodos e resultados. O que procurar depende do objetivo do estudo: eficácia de tratamento, acurácia diagnóstica, acurácia prognóstica. A análise também depende de se o estudo for positivo ou negativo. A direção da leitura do artigo é diferente a depender da direção do resultado. Coisas diferentes causam falsos-negativos ou falsos-positivos.

Outra questão interessante é o diferente nível de atenção que devemos ter em métodos e resultados. Em métodos avaliamos predominantemente erros sistemáticos. Em resultados avaliamos erros aleatórios. P

Detectamos potenciais vieses quando notamos falhas no desenho do estudo descritos nos métodos. 

Mas é nos resultados que veremos o grau de significância estatística ou a imprecisão dos intervalos de confiança, aspectos que representam o risco de erro aleatório. Nos resultados que perceberemos se a amostra cumpriu com as premissas do cálculo do tamanho amostral descrito nos métodos. Por exemplo, o cálculo (métodos) está perfeito e supõe uma certa incidência do desfecho, porém veremos em resultados que esta premissa não foi obedecida. Portanto, este seria um trabalho com maior risco de erro aleatório. Também será nos resultamos que veremos desvios de integridade científica que predispõem a erro aleatório: o estudo foi interrompido precocemente pois o resultado aparentou positivo (truncado), o autor começa a valorizar descrição de desfechos secundários ou análise de subgrupo (reporting bias).

Depois de toda essa análise, na ausência de mudanças de protocolo e quando observamos baixo risco de viés ou acaso, concluiremos que temos um estudo com alto nível de evidência. 

Por fim, a resposta final será bayesiana: devemos calcular a probabilidade pós-teste. Quando temos uma hipótese moderadamente provável a priori, um estudo de baixo risco de viés e erro aleatório é suficiente para gerar um valor preditivo positivo alto. No caso de hipótese pouco provável, um bom estudo terá valor preditivo positivo moderado e requeremos um segundo estudo para confirmar a ideia (reprodutibilidade).

No caso do estudo negativo, quando desistir da ideia? Normalmente, se a hipótese não for promissora, temos uma tendência a julgar que não vale mais a pena insistir na ideia. Mas se a ideia for muito provável, precisaremos de mais de um estudo negativo para nos fazer desistir do conceito. 

Ciência não prova inexistência, ciência prova existência de conceitos. Como é impossível provar que algo não existe, o que está em jogo na análise de um estudo negativo é se este deve nos fazer desistir de provar a ideia ou se devemos continuar tentando provar. Devemos avaliar quando estamos sendo teimosos ou quando abandonar a ideia. Isso depende do valor preditivo negativo do estudo, que depende da probabilidade pré-teste e da relação sinal/ruído do estudo. 

Resumindo, devemos avaliar:

  • Tendenciosidade do leitor (minhas crenças internas)
  • Tendenciosidade intrínseca do autor (spin)
  • Tendenciosidade extrínseca do autor (conflito de interesses)
  • Probabilidade pré-teste da ideia
  • Mudanças de protocolo a posteriori
  • Relação sinal/ruído do estudo (métodos e resultados)
  • E finalmente, calcularemos mentalmente o valor preditivo do trabalho

Após esta introdução genérica de como ler artigos científicos, trabalharei em uma a série de postagens ao longo desse ano, com as especificidades de cada tipo de análise crítica:

  • Como avaliar probabilidade pré-teste de uma ideia
  • Como julgar se premissas do cálculo amostral foram obedecidas
  • Como julgar trabalhos negativos sobre condutas médicas
  • Como julgar trabalhos positivos sobre condutas médicas
  • Como julgar trabalhos de acurácia diagnóstica
  • Como julgar estudos de coorte para marcadores prognósticos
  • Como julgar estudos de coortes para causalidade
  • Como julgar estudos caso-controle para causalidade

Bem, não será exatamente nessa ordem, pois a inspiração vem de diferentes fontes, de trabalhos que surgem para ser analisados, de aulas que dou, de perguntas desafiadoras de alunos, de discussões interessantes com colegas e de casos clínicos que um provocam reflexões (skin in the game, como diria Taleb). Textos assim ficam bons mesmo quando surgem do sentimento de nossa “pele no jogo”, de nossa experiência clínica.

Portanto, não esperem nada previsível, pois esse blog é imprevisível, como já devem ter percebido.

Denominarei estes posts de “bússolas”, pois não há mapas precisos ou GPSs quando se trata do verdadeiro pensamento científico. Nossas “bússolas de análise crítica” estimularão um pensamento reflexivo, livre de dogmas, repleto de perguntas e com poucas certezas. 

________________________________________________________________________________


_______________________________________________________________________

Conheça nosso curso online de medicina baseada em evidências, clicando aqui.

quinta-feira, 17 de janeiro de 2019

Analfabetismo Científico e o Escândalo do Médium-Cirurgião




* Texto de Luis Correia recentemente publicado no Jornal A Tarde

Ceticismo é desejo de explorar antes de aceitar uma verdade. Ceticismo promove dúvida, que por sua vez promove a curiosidade necessária para o início da investigação. 

Crença é o alicerce do pensamento religioso, cuja proposta se distancia da curiosidade. 

Os paradigmas do ceticismo e da crença representam dois modelos mentais essenciais na vida humana, porém com funções diversas. Não faz sentido aplicar ceticismo a questões religiosas, assim como é inadequado aplicar crença a questões científicas. 

Inteligência científica não é o mesmo que conhecimento científico. É prevalente a coexistência de conhecimento científico e analfabetismo científico. Saber transitar entre os paradigmas dogmático e cético é o que caracteriza uma pessoa alfabetizada cientificamente.

Quando uma abordagem espiritual se intitula “cirurgia” com objetivo de beneficiar o prognóstico clínico de um paciente, devemos abandonar o paradigma religioso e adotar o paradigma científico. Produtos ou condutas médicas requerem demonstração experimental de eficácia e segurança.

É válido acreditar em benefícios espirituais de uma intervenção espiritual. Porém falta inteligência científica para conseguir dar crédito ao um indivíduo que promove “cirurgias espirituais” com instrumentos perfuro-cortantes sob a premissa de benefício clínico, a despeito da ausência de comprovação experimental da eficácia de suas abordagens; falta inteligência científica para não perceber que uma afirmação extraordinária requer evidência extraordinária. 

Violar o paradigma científico pode ter consequências não intencionais imprevisíveis. A confiança nas propostas curativas do médium-cirurgião promoveu uma santificação de sua pessoa, deixando a sociedade cega a respeito do óbvio. Não se pode confiar em indivíduos que se propõem a tais condutas sem antes realizar os devidos testes científicos. O mundo tem alguns exemplos clássicos de tragédias promovidas por líderes carismáticos. Estamos diante de mais uma dessas tragédias, sofrida por centenas de mulheres que procuravam alívio de algum sofrimento. 

Inteligência científica é uma questão de responsabilidade social. Como sociedade, precisamos assumir parte da responsabilidade, pois não bastou um indivíduo com baixa integridade moral, foi necessária uma sociedade de baixa “integridade científica” para aceitar uma fantasia curativa inaceitável.

Uma sociedade evoluída cognitivamente nãutiliza o paradigma da fé para questões científicas, nem o ceticismo em questões de crença. Uma sociedade evoluída tem religião ou espiritualidade como valores essenciais, mas sabe dar o protagonismo necessário à visão cético-científica.




Conheça nosso curso online de medicina baseada em evidências, clicando aqui.

A Confusão entre Decisão Compartilhada e Decisão Consentida





* Texto de Luis Correia, publicado originalmente no site do Slow Medicine sob o título "Médico sem Jaleco e Decisão Compartilhada"


Planejava há algum tempo escrever sobre o paradigma da “decisão compartilhada”, gravemente confundida com “decisão consentida”. E foi uma história de bastidor que inspirou a concretização deste texto. 

Recentemente, fui convidados pelo programa matinal Bem Estar, a fim de discutir o paradigma do choosing wisely (menos é mais). Embutida no choosing wisely está a decisão compartilhada. 

Ao chegar nos estúdios da Rede Globo em São Paulo, eu e Thiago Trindade (Sociedade dos Médicos de Família) fomos apresentados à ideia de que os médicos que participam do programa vestem um jaleco branco. E nos ofereceram um armário de jalecos, com todos os modelos e tamanhos para escolhermos. Confesso que fiquei desconfortável com a ideia do jaleco, por algum motivo aquilo não me pareceu “sábio”. E pensei, como vou sair dessa?

Neste momento, me veio uma metáfora em mente: “médico choosing wisely não usa jaleco”. Um dos componentes principais da sabedoria médica é a decisão compartilhada, quando o médico sai do seu pedestal e se coloca no nível do paciente. E vou mais longe, médico choosing wisely também não usa o símbolo fálico da gravata (mulheres são mais sábias), nem precisa usar roupa branca. Enfim, não há nada de sábio em tentar se diferenciar do paciente com base na autoridade da roupa. Precisamos nos aproximar. 

Consegui o que queria, o programa nos dispensou de usar o jaleco, nos despimos da farda, o que nos possibilitou “conversar” com o público, ao invés de “ensinar” aos espectadores. E o médico sem jaleco foi a temática que iniciou o debate do programa. 

Essa simbologia do médico sem gravata, sem jaleco, sem branco remonta à necessidade de discutirmos o que é uma verdadeira decisão compartilhada, conceito pouco compreendido até mesmo pelos que propõem a estratégia como componente importante do exercício da medicina baseada em evidências.


O que é decisão compartilhada?


Decisão compartilhada não é um médico de jaleco apresentar ao paciente uma opinião especializada e deixar que o paciente tome a decisão final. Isso é “decisão consentida”, quando damos ao paciente o direito de consentir ou não com nossa opinião de jaleco. 

Decisão compartilhada não é um médico de gravata traduzir uma série de dados estatísticos ao paciente, para que este possa tomar sua decisão final. Isso é “decisão delegada” ao paciente.

Decisão compartilhada não é apenas respeitar a preferência do paciente. Decisão compartilhada é utilizar as preferências e valores do paciente na formação da opinião médica. 

Na decisão compartilhada a opinião do médico é primariamente influenciada pelo paciente e não o contrário. Por este motivo, o médico precisa deixar o jaleco no armário (ou jogar fora de preferência, junto com suas roupas brancas). E pode guardar uma gravata para dias de casamento.

Há uma grande diferença entre respeitar (ética) e utilizar (raciocínio clínico). Devemos sempre respeitar, mas isso é básico, mas o respeito não implica necessariamente em compartilhamento. Utilizar a preferência do paciente aumenta a efetividade de nossas escolhas. Afinal, não queremos apenas ser eficazes (aplicar conceitos científicos), no final queremos ser efetivos (beneficiar no mundo real).


Como fazer decisão compartilhada?


Etapa 1. A Evidência

O processo de decisão começa pela evidência científica, pela prova do conceito. Imagine um tratamento comprovadamente benéfico de acordo com estudos de qualidade. Esse é o ponto de partida, o benefício e a magnitude desse benefício. Digamos um tratamento com redução relativa do risco de 30%. A redução relativa é a propriedade intrínseca do tratamento, constante em diferentes tipos de pacientes. Por isso, a redução relativa é o conceito científico trazido pela evidência. 


Etapa 2. A Clínica

Em segundo lugar, analisaremos a individualidade clínica do paciente, calculando seu risco e consequentemente seu número necessário a tratar (NNT). Sabemos que escores de risco estão disponíveis para a maioria das situações. Ao utilizar um modelo probabilístico, faremos a estimativa do risco individual do paciente com base em suas características individuais. Quanto maior o risco, maior será o benefício individual do tratamento que possui uma dada redução relativa do risco  (RRR) demonstrada cientificamente. 

Enquanto a RRR é uma prova de conceito generalizável, o NNT é uma propriedade individual do paciente que recebe o tratamento. 

Uma decisão individualizada não deve copiar o NNT do trabalho científico, pois este é apenas uma média dos NNTs da amostra. Para calcular o NNT individual do paciente, multiplicamos a RRR (evidência) pelo risco basal do paciente (individualidade clínica). 

Assim, se eu aplicar 30% de redução em um paciente de 10% de risco, obterei 3% de redução absoluta e NNT = 33. 

Se eu aplicar o mesmo 30% de redução de risco em um paciente de 1% de risco, obterei 0.33 de redução absoluta, e um NNT = 333. 

Para um mesmo tratamento, obteremos diferentes efeitos individuais. Portanto, nesta segunda etapa, olhamos o paciente em sua individualidade clínica, não copiamos o resultado de um trabalho, mas nos baseamos no conceito científico e generalizável para chegar à individualidade do paciente. 

Nesta fase, devemos avaliar também o risco de efeito adverso do tratamento. Os ensaios clínicos trazem o risco relativo para efeito adverso. Por exemplo, clopidogrel tem um RR = 1.29 para sangramento em pacientes com síndromes coronarianas agudas sem supradesnível do ST.  Significa 29% de aumento do risco. Multiplicamos o risco basal de um paciente que usam apenas aspirina por 29% e saberemos qual o NNT para causar um sangramento com a adição de clopidogrel. 

Aqui vale um parêntese. Ouvimos frequentemente um lema contra a evidência e a favor da intuição médica de que “uma coisa é o que mostra um estudo, outra coisa é o paciente individual”. Isso é uma falácia, pois se não nos basearmos no estudo (RRR), não poderemos saber do impacto individual de nossa conduta.


Etapa 3. O Paciente, seus valores e preferências 

Agora vamos à terceira etapa, que levará em consideração o paciente do ponto de vista pessoal, seus valores e preferências. O que calculamos até a segunda etapa foi a probabilidade do paciente se beneficiar de sua conduta. A partir de agora, devemos nos perguntar: o paciente deseja fazer essa aposta probabilística

Digo aposta pois toda conduta implica em um custo para o paciente, não monetário. Custos não monetários podem ser de várias categorias: obrigação de lembrar de tomar um remédio diariamente ou gastar seu tempo fazendo um tratamento fora do domicílio; insatisfação de precisar tomar remédio quando o paciente é aquele que preza por coisas mais naturais; efeitos adversos que podem ser mais frequentes do que mostram ensaios clínicos; complicações sérias, sequelas, estresse psicológico de um tratamento.

Na prática, quando é uma conduta é voltada para melhorar prognóstico (futuro), o paciente paga um preço hoje para talvez (probabilidade) desfrutar de um benefício futuro (prevenção de doença ou melhor evolução de doença). A depender do paciente, este pode querer apostar ou não. E isso depende do valor do benefício no ponto de vista do paciente. Uma cirurgia de joelho para um jogador de futebol tem muito mais valor do que para um burocrata. O primeiro estaria disposto a pagar um preço mais alto para obter o mesmo benefício do segundo paciente.

Portanto, o benefício varia com o valor do desfecho para o paciente, que deve ser computado no processo de construção de nossa opinião médica. E o caminho não é exatamente perguntar ao paciente “qual o valor desta conduta para você?”. Cabe a nós, profissionais treinados, fazermos a leitura das preferências de nosso paciente, com base no que conhecemos dela (e) e no que conversamos com ela (e). Neste momento, nossa opinião está sendo moldada pela preferência do paciente. 

Este processo de utilização das preferências do paciente na construção de nossa recomendação é o inverso do habitual. Normalmente o médico emite sua preferência de conduta para que o paciente assimile essa recomendação de acordo com seu ponto de vista. Porém o paciente não é treinado para isso, ou seja, incorporar a evidência de acordo com sua preferência. Portanto, porque não considerar a perspectiva do paciente antes de emitir nossa opinião? Esta é a verdadeira decisão compartilhada, que não precisa estar explícita, mas sim implícita no pensamento médico.

Há dois motivos para a proposta deste tipo de decisão compartilhada. O primeiro é a efetividade da recomendação e o segundo é a satisfação do paciente.






Efetividade Clínica


Há uma lacuna entre eficácia (prova do conceito no trabalho científico) e efetividade (mundo real). Um dos fatores que promovem essa lacuna é que há certas condutas cuja efetividade depende da preferência do paciente. Uma recomendação dietética terá mais efetividade em um paciente que deseja muito perder peso, do que para um paciente que não tem esse interesse. Imaginem dois tipos de dieta (A e B), sendo que a dieta A é mais eficaz para perda de peso, de acordo com ensaios clínicos randomizados. No entanto, a dieta A é menos saborosa, mais difícil de obedecer, implica em uma série de privações, enquanto a dieta B é mais agradável. Assim, no mundo real, a dieta A pode ser menos efetiva do que a dieta B. Como médicos, nosso objetivo é efetividade. Teremos maior efetividade quando conseguirmos acoplar a evidência com a preferência. Pode ser que para alguns pacientes a dieta B seja uma melhor escolha, mais efetiva embora menos eficaz.  

Existem evidências de que a decisão compartilhada promove efetividade clínica? Até certo ponto, sim. Revisão sistemática de ensaios clínicos randomizados que compararam intervenção pró decisão compartilhada versus controle (Clin Psychol Rev 2014) sugere benefício em desfechos clínicos, de magnitude modesta. No entanto, a maioria dos modelos de decisão compartilhada corresponde ao que chamei de “decisão delegada” no início do texto. Ou seja, utilizam ferramentas que traduzem riscos e benefícios para que o paciente tome sua decisão.

Neste texto, propomos uma abordagem evolutiva em relação à tradicional: a opinião do médico ser influenciada pelo paciente. É possível que esta abordagem tenha maior tamanho de efeito. Nesta questão, precisamos de mais evidência.


Satisfação, o desfecho primordial


Em medicina falamos muito em desfechos clínicos duros, representando eventos relevantes que desejamos prevenir utilizando nossas condutas médicas. Neste sentido, o desfecho mais duro que existe é morte. Mas será que o desfecho primordial não deveria ser satisfação? 

Satisfação tem um componente garantido e imediato, que é o conforto com a conduta preferida; e um componente probabilístico e futuro, que é o resultado da conduta no desfecho clínico. Quando um paciente “aceita” um tratamento a contra-gosto, sua insatisfação é garantida e imediata. Enquanto o componente clínico da satisfação é probabilístico e futuro. 

Desta forma, pode não ser uma decisão muito econômica escolher uma conduta baseada apenas no benefício clínico probabilístico, em detrimento da preferência do paciente. Precisamos equacionar os dois. 

E quanto a evidências? Uma revisão sistemática de 115 ensaios clínicos randomizados publicada pela Cochrane em 2014 indica que decisão compartilhada promove mais satisfação sob a forma de conforto quanto à decisão, sensação de conhecimento do assunto e participação na decisão, redução de conflitos. 

The Doctor


“The Doctor” é o nome dessa famosa pintura, que retrata a cena de uma criança gravemente enferma. É uma obra de Sir Luke Fildes (1890) e está exposta no Museu Tate Britain de Londres. A menina era a filha do pintor, que morreu dias depois. 



Enquanto esta figura tem inspirado uma legião de médicos, uma peculiaridade precisa ser ressaltada: esta cena é a antítese da decisão compartilhada. Observem que o médico pensa com maestria no caso clínico, enquanto a presença dos pais passa quase desapercebida. Ao fundo, discretos, há uma pai que olha o médico e uma mãe desesperada. Os pais não têm participação ativa na cena, muito menos participação na decisão, imagino. A cena é uma apologia ao médico, que está no centro da figura, é uma antítese ao paradigma do médico sem jaleco.

The Doctor representa um aspecto da medicina tradicional, bem caracterizada na frase de Hipócrates: “Qualquer leigo que diga como o médico deve fazer seu trabalho está cometendo uma impertinência ultrajante.”

Decisão compartilhada não é o tradicional, e para que faça parte de nosso cotidiano médico necessitamos evoluir culturalmente. Choosing wisely é um movimento de transformação cultural. No processo compartilhado, o “menos é mais” poderá prevalecer a depender da preferência do paciente. Choosing wisely representa um paradigma a ser modificado progressivamente, a partir do diálogo entre profissionais e de profissionais com a sociedade. 

No estágio em que estamos, ainda confundimos decisão compartilhada com decisão consentida. E na prática científica, o que tem sido testado como decisão compartilhada é na verdade decisão delegada. Ensaios clínicos randomizados utilizam a metodologia de uma boa comunicação das evidências (panfletos com figuras que demonstram as probabilidades de benefício e risco) para que o paciente tome sua decisão. Porém esta metodologia faz o paciente se sentir sozinho, a ponto dele retornar a pergunta ao médico: “Dr., se fosse seu pai, o que você faria?”

Vale salientar que este é um texto conceitual. Este conceito de decisão compartilhada precisa ser testado cientificamente, a fim de demonstrar o efeito de uma verdadeira decisão compartilhada: reduz desfechos clínicos? Qual o tamanho do efeito na satisfação se comparado à decisão delegada ou consentida? 

O que de fato funcionará melhor, um médico de jaleco ou sem jaleco?

Enquanto aguardamos evidências a respeito do jaleco, utilizo minha preferência pessoal, evito o jaleco no consultório, abandono a gravata e as roupas brancas já entraram em desuso há quase três décadas. Essas escolhas pessoais nos tornam mais humilde, abrindo espaço para o desejo de  compartilhar incertezas com o paciente, conversar com transparência, e nos deixar influenciar pelos valores de quem está de fato com a “pele no jogo”.

_________________________________________________________________________________

Conheça nosso curso online de medicina baseada em evidências, clicando aqui.





quarta-feira, 19 de dezembro de 2018

A Provável e Inconveniente Causalidade entre Tiazídico e Câncer de Pele



Gerou grande controvérsia a recente nota de alerta da ANVISA sobre a relação causal entre uso cumulativo de hidroclorotiazida e câncer de pele não-melanoma. Enquanto a imprensa leiga reproduziu a nota em tom de sensacionalista (1, 2, 3), profissionais de pensamento baseado em ciência saíram em defesa desta terapia diurética no tratamento anti-hipertensivo (12), questionando a qualidade da evidência que suportava o papel cancerígeno da droga. 

Recebi mensagens de vários colegas questionando o caráter observacional do estudo que motivou a recomendação (J Am Acad Dermatol, abril 2018) e meu reflexo natural foi o de concordar com a crítica. Mas ao analisar com mais critério, desenvolvi uma opinião diferente que explicitarei nessa postagem. Minha análise se baseia na aplicação dos conceitos que apresentei no recente artigo  sobre o valor de “estudos observacionais: quando confiar, desconfiar ou descartar?". Vale a pena revisitar. 

Primeiro, precisamos nos preparar mentalmente para a análise de qualquer evidência externa, pois esta pode vir de encontro com nossas perspectivas científicas. Essa preparação passa pelo seguinte questionamento: quais são minhas evidências internas (crenças) a respeito do assunto? Esta proposta de aquecimento mental foi tema de postagem prévia no Blog. Vale a pena revisitar. 

A pergunta permite identificar nossa predisposição ao viés de confirmação. No meu caso pessoal, identifico uma predileção baseada em evidências pela terapia antihipertensiva com tiazídicos , o que pode me gerar um preconceito contra o argumento do efeito carcinogênico. Alguns colegas aventaram uma “teoria da conspiração” contra os baratos diuréticos, motivada por conflitos de interesse da indústria produtora de medicamentos "inovadores". É possível, mas antes precisamos analisar as evidências de uma forma a evitar a influência demasiada de nossos vieses pessoais.

A ANVISA poderia ter gerado uma nota baseada neste estudo observacional?

O primeiro passo é avaliar se o dado observacional diz respeito da “dano” ou “proteção”. Esta diferenciação é essencial para definir a magnitude do ônus da prova. Diferente da proposta da implementação de uma conduta “protetora”, quando investigamos potencial efeito danoso (fator de risco) estudos observacionais ganham força de evidência e, a depender de  alguns critérios, podem ser considerados evidências potencialmente confirmatórias.

Algumas razões suportam a maior tolerância com o nível de evidência para "dano". 

Primeiro, dizer “tome cuidado” traz consigo uma menor responsabilidade do que induzir a adoção uma conduta nova. 

Segundo, o sentido da indicação depende primariamente da eficácia e de forma complementar da segurança. Por este motivo, não se faz ensaios clínicos para demonstrar efeito adverso. Ensaios clínicos são dimensionados para eficácia e secundariamente avaliam segurança. 

Terceiro, os eventos adversos são menos comuns do que desfechos clínicos a serem prevenidos pelo tratamento. Por isso, estudos intervencionistas são subdimensionados para eventos adversos. Isto faz com que se precise comumente recorrer a relatos observacionais em estudos de fase IV para detectar eventos adversos. 

Portanto, guardadas algumas premissas, estudos observacionais podem definir fatores de risco. Que premissas? Como propomos na postagem sobre estudos observacionais são três as premissas: significativa probabilidade pré-teste em uma abordagem bayesiana, grande força de associação e dificuldade de evidências intervencionistas confirmatórias. Estes são o caso do tabagismo e etilismo como fatores de risco para suas respectivas doenças. 

Vamos agora analisar estas premissas no caso dos tiazídicos e câncer de pele.

A probabilidade pré-teste tem os componentes de plausibilidade e evidências prévias. Precisei estudar para acessar este tópico. Os tiazídicos estão no conjunto de drogas que causam fotosensibilidade à pele. Naturalmente, isto explica a plausibilidade biológica de que a droga pode deixar pacientes mais predispostos a um câncer induzido pela exposição a raios ultravioletas. Inclusive, há evidências sugerindo que fotossensibilidade farmacológica induz câncer de pele

Quanto a evidência prévias, notei que este não o primeiro estudo observacional a sugerir tal associação. O conjunto de evidências prévias é sugestivo, merecendo destaque um estudo prévio do mesmo grupo, mostrando associação com carcinoma de células escamosas. Portanto, o estudo que induziu a recomendação da ANVISA é um estudo reproduz evidências prévias. Portanto, temos uma probabilidade pré-teste razoável a favor da hipótese. Não estamos diante de uma ideia que acaba de surgir. Estamos diante de uma ideia vem sendo construída progressivamente e o presente estudo serve como mais uma evidência a favor. 

E quanto à força de associação? O trabalho em questão avaliou dois tipos de cânceres de pele não melanomas: basocelular e células escamosas. Ambos apresentaram um nítido gradiente dose-resposta e no caso de células escamosas, a maior dose da droga acumulada apresenta odds ratio de 7. Ou seja, estamos diante de grande força de associação, maior do que boa parte dos fatores de risco para doenças cardiovasculares ou cânceres. 



Por fim, é pouco provável que tenhamos um ensaio clínico desenhado para testar essa hipótese e estudos intervencionistas já realizados seriam de poder insuficiente e provavelmente carecem deste dado. A incidência desses cânceres de pele gira em torno de 1% ao ano, portanto um estudo de 5 anos teria uma incidência de evento menor do que a incidência de eventos usualmente testados por estudos prospectivos, que gira em torno de 10%-20%. Seria necessário um ensaio clínico de tamanho amostral em torno de 4 vezes maior do que os estudos usuais de anti-hipertensivos. 

Estes são três critérios sistêmicos a favor da ideia de causalidade. Mas precisamos ir no especifico e avaliar a qualidade do estudo observacional em questão. Trata-se de um estudo de caso-controle aninhado, proveniente de registros eletrônico dinamarquês. Guardando as limitações inerentes ao desenho, o estudo é bem realizado, na coleta e análise dos dados. Muito importante salientar que o estudo foi realizado tendo esta hipótese determinada a priori como o objetivo principal. Além disso, a escolha do tipo de antihipertensivo não tem grande potencial de carregar pacientes com maior risco de câncer de pele. 

Neste momento, vale reafirmar: aceitar efeito danoso de uma droga com base em estudos observacionais requer rigidez de avaliação, a qual não está presente da maioria das situações. Como comparação, podemos citar interessante exercício epidemiológico que mostrou associação entre uso de digoxina e morte em pacientes com fibrilação atrial. Aquele estudo tem grande potencial de efeito de confusão, pois a escolha por digoxina tende a carrear pacientes com disfunção ventricular esquerda e consequentemente maior risco de morte. Além disso, a associação não foi encontrada na análise usuários versus não usuários de digoxina, sendo percebida quando se migrou para uma análise baseada na concentração plasmática da droga (problema das múltiplas comparações). Por fim, a força de associação foi mais fraca do que observamos no presente caso dos tiazídicos (HR = 1.56). Trago este exemplo para exemplificar uma situação em que não julgo ser evidência suficiente para gerar uma advertência de risco.

Concluo portanto, com base em análise bayesiana que engloba a probabilidade pré-teste e a nova informação (força de associação, gradiente dose-resposta, qualidade do estudo), que devemos considerar possivelmente verdadeiro o conceito de causalidade entre tiazídicos e câncer de pele. Assim como ocorre com boa parte dos eventos adversos “estabelecidos”, que são baseados em dados observacionais.


Implicações e Lições


Nossa conclusão não deve implicar que evitemos os tiazídicos como antihipertensivos e a ANVISA não quis dizer isso. Devemos apenas considerar esta informação como mais um detalhe em nosso processo mental de decisão. Digo isso pois grandes tamanhos de efeito (odds ratio > 2) se deram com doses cumulativas a partir de 75.000 mg, o que corresponde a 16 anos de uso da dose de 12.5 mg. Vale salientar que não estamos falando aqui de desfechos graves como melanoma. Especialistas discutem até mesmo se é adequada a denominação de câncer para estes não-melanomas. 

Além disso, o câncer que gera preocupação se constitui em um desfecho probabilístico em futuro remoto, o que tem menor força no processo decisório do que o benefício obtido no presente: controle antihipertensivo e bom perfil de tolerabilidade da droga.

A ANVISA fez uma advertência com um critério adequado, como costuma fazer em muitas situações semelhantes. A diferença desta vez foi que a advertência foi contra uma pet drug (droga de estimação) de boa parte dos médicos, na qual me incluo. É droga de estimação de médicos baseados em evidências.

Podemos defender o valor dos tiazídicos, mas sem precisar negar este potencial efeito danoso. Se por um lado considero sensacionalista e inadequada a reação da imprensa, por outro lado foi a reação emocional com que parte da comunidade médica se posicionou que mais me chamou atenção neste caso. E em geral os que mais gritaram foram aqueles de mente analítica e científica. 

Este caso mostra que não são apenas os fantasiosos que se reunem em tribos apaixonadas. Temos que ter cuidado para que os científicos também não se dogmatizem em uma cega defesa de suas ideias. Esta é a principal lição deste caso.