terça-feira, 14 de junho de 2016

Curso de Saúde Baseada em Evidências no Rio de Janeiro

Colegas, com a organização da Somax Fisioterapia, faremos no Rio de Janeiro o Curso de Saúde Baseada em Evidências, nos dias 01 e 02 de outubro. 

As inscrições estão abertas, vejam maiores detalhes no cartaz. 

É uma oportunidade de interagirmos de forma presencial, em um intensa troca de ideias a respeito do pensamento científico na prática clínica.




domingo, 12 de junho de 2016

quinta-feira, 2 de junho de 2016

Vídeo: Segurança Perceptível - Franz Porzsolt e Luis Correia

Neste vídeo, conversamos com Franz Porzsolt a respeito de "perceived safety", conceito que discutimos em nossa última postagem.




sábado, 28 de maio de 2016

O Entrelace entre “Segurança Perceptível” e Choosing Wisely




Estamos acostumados a conviver com demonstrações teatrais nos momentos que precedem a decolagem de um avião comercial, abordando como utilizar os coletes salva-vidas posicionados estrategicamente abaixo do assento de cada passageiro.

Dentre os milhares de passageiros em vôos comerciais diários, quais se fazem a seguinte pergunta: quantas vidas foram salvas por este importante dispositivo de segurança? 


Considerando o alto custo do consumo de gasolina promovido pelo peso destes coletes,  surge a segunda pergunta: Por que então as empresas prezam tanto por estes coletes, se os mesmos não aumentam a segurança dos passageiros?

Resposta: porque os coletes aumentam a “segurança perceptível”.

Não aumentam segurança, mas aumentam a percepção de segurança. Dentro de um avião, é importante gerar esta percepção, pois voar não é exatamente algo que nós, serem humanos, fazemos com naturalidade. 

Não só os coletes, como o desligar dos celulares e computadores, além de outras das muitas (chatas) obrigações de comportamento no decolar ou aterrisagem servem apenas para gerar uma sensação de que “tudo está sob controle”.

O termo “perceived safety” foi cunhado pelo médico alemão Franz Porzsolt e se encaixa perfeitamente na discussão Choosing Wisely. Este fenômeno cognitivo descrito por Franz é a causa raiz do uso indiscriminado de procedimentos inúteis em medicina. 

Somos avessos a qualquer tipo de risco, e esta aversão garantiu a sobrevivência de uma espécie que em épocas passadas estava constantemente sob risco iminente de morte. O psicólogo Daniel Kahneman, ganhador do prêmio nobel, demostrou nossa aversão a qualquer tipo de risco ao perguntar a voluntários se eles desejavam receber $1.000 garantidos ou responder uma pergunta para receber $ 2.000 caso acertassem. Considerando que nenhum dos montantes mudaria a vida de ninguém, a expectativa seria que um bom número preferiria arriscar, algo como 50% das pessoas. Mas isto não aconteceu, prevaleceu de forma significativa a primeira escolha. Isto reflete nossa aversão a riscos, explicando porque fazemos qualquer coisa (mesmo coisas sem efeito real) para reduzir a nossa sensação de insegurança. 

Perseguimos a certeza platônica de que nada nos acontecerá e acreditamos que exames e procedimentos nos darão essa garantia. Ficamos até surpreendidos quando, depois de “todos os exames normais”, alguém aparece doente ou morre.

Exemplos típicos de procedimentos diagnósticos que geram (apenas) segurança perceptível são rastreamentos universais (assintomáticos) de doença coronária, câncer de próstata e câncer de mama. Exatamente, os meses rosas e azuis servem apenas para gerar segurança perceptível, uma sensação compartilhada por médicos e por pacientes. 

Mas qual o problema de gerar segurança perceptível?

Os três tipos de segurança perceptível


Divido as condutas geradoras de segurança perceptível em 3 tipos: as que trazem segurança real, as que não modificam a segurança real e as que reduzem a segurança real. 

No primeiro caso, devemos adotar a conduta pelo seu real benefício. Mas também podemos aproveitar para explorar o benefício da segurança perceptível, ao enfatizar para o paciente a magnitude do benefício de nossa decisão. Assim teremos um resultado positivo duplo, físico e emocional. 

No segundo caso, a conduta deve ser adotada em situações onde a segurança perceptível se faz coletivamente necessária, como é o caso do controle de ansiedade dentro de uma aeronave. Por outro lado, devemos evitar a promoção de condutas fantasiosas individuais. É uma linha tênue que nos dividiria do charlatanismo: como poderíamos gerar a segurança perceptível de forma transparente, sem dizer ao nosso paciente que aquilo não promove segurança real? Isso dá um bom debate ...

Mas é o terceiro caso que mais preocupa os indivíduos de pensamento epidemiológico. E este é exemplificado pelas consequências não intencionais dos rastreamentos diagnósticos acima descritos. 

Enquanto os ensaios clínicos de qualidade superior não demonstram redução de mortalidade com rastreamento para câncer de mama, para cada 1.000 mulheres rastreadas por 10 anos, estima-se que haverá 500 mamografias falso-positivas, 100 biópsias desnecessárias e, pasmem, 6 tratamentos (radioterapia, quimioterapia, cirurgia mutilante) desnecessários são adotados em pacientes cuja alteração supostamente maligna nunca evoluiria para limitar suas vidas. Para cada 1.000 homens rastreados para câncer de próstata, não há redução de mortalidade, porém estima-se 120 biópsias desnecessárias, 100 tratamentos fúteis, deixando 29 homens impotentes e 19 incontinentes. Sem falar dos assintomáticos que recebem procedimentos invasivos coronários inúteis, restando-os desfrutar das eventuais complicações, pois de benefício real eles não desfrutam.

O pensamento não é estatístico, pois se fosse perceberíamos o seguinte: para cada consequência intencional, há uma infinitude de consequências não intencionais concorrendo para prevalecer. A probabilidade, em geral, é maior das consequências não intencionais. Isso fica pior quando a consequência intencional é fictícia.

Viés Cognitivo


Não é por má intenção que adotamos condutas fúteis. É verdade que há conflitos de interesses, porém este é apenas um fator agravante. O cerne do problema está em nossa forma de ingênua e natural de pensar. Mesmo se não houvesse conflitos de interesses, condutas fúteis continuariam a existir, por intermédio do viés de segurança perceptível. É humano procurar por esta segurança. 

Hoje mesmo eu conversava com um dos mais competentes e inteligentes dos cirurgiões cardíacos que conheço. Ele mencionava da dificuldade de não utilizar o balão intra-aórtico em certos pacientes graves, mesmo sabendo que tal conduta carece de benefício clínico. Concordo, por vezes é difícil vencer o apelo da segurança perceptível. É humano ser assim …

Mas “ser humano” não é o mesmo que “ter razão”. Profissionalmente, precisamos controlar nossos vieses cognitivos, procurando um pensamento racional e embasado em evidências. Tenho a impressão de que é isso que nosso cliente espera de nós. 

A forma relaxada de pensar é enviesada por natureza. Pensar se prevenindo contra vieses é trabalhoso, gasta energia. Mas profissão é trabalho, portanto temos que assumir um raciocínio um pouco mais trabalhoso. Mais profissional. 

Muitos dizem que o uso inapropriado de exames e tratamentos é culpa do cliente que já entra no consultório pedindo por diversas prescrições. A verdade é que a mente do cliente é moldada por nós, os formadores de opinião. Normalmente a comunidade médica promove o paradigma do mais é mais, a mentalidade do médico ativo. Médicos em evidência nos programas de TV matinais, infelizmente, perdem a oportunidade de trazer ideias positivamente transformadoras, limitando-se a falar o “óbvio equivocado”. 


A Campanha Choosing Wisely


Choosing Wisely é o remédio para o mau uso da segurança perceptível.

Há um ano, escrevi neste Blog sobre Choosing Wisely e postei uma série de vídeos em que conversávamos com personalidades internacionais envolvidas com esta campanha, como Aseem Malhotra, Wendy Levinson e Daniel Wolfson.

A campanha Choosing Wisely promove uma discussão crítica em torno de condutas médicas de baixo valor e muito prevalentes. São condutas que oferecem razoável probabilidade de malefício ao paciente (efeitos adversos, incômodos, estresse psicológico), com baixa probabilidade de benefício. É uma provocação em direção ao paradigma do menos é mais (less is more)

Passado um ano, a campanha ganhou força em nosso país: implementamos a lista na Sociedade Brasileira de Cardiologia em iniciativa realizada durante o ano 2015; a Sociedade de Medicina de Família seguiu a mesma tendência, iniciando sua campanha no presente ano. O PROQUALIS adotou a companha, estando próximo ao lançamento de seu site Choosing Wisely. Reportagens recentes na Folha de São Paulo e BBC Brasil começam a trazer esta discussão para a Sociedade. Estamos aos poucos evoluindo em pensamento.

Choosing Wisely não é apenas sobre fazer menos. É principalmente sobre pensar melhor. Importante entender que esta não é uma campanha que visa cercear a decisão médica. Choosing Wisely visa promover reflexão. 

É compreensível que alguns esperneiem quando vêem recomendações do tipo “não realizar intervenção coronário percutânea com stents em indivíduos assintomáticos”. Revoltam-se com um mero convite para uma reflexão inteligente. Isto é natural, pois decorre de outro viés prevalente na mente humana: o conforto cognitivo. O conforto cognitivo gerado por nossos próprios dogmas. De fato, é bem desconfortável questionar nossos dogmas. 

Vejo o futuro com otimismo, esta evolução me parece ser um caminho sem volta. Digo isto graças a outra característica da mente humana: a vaidade. Quando mentes resistentes perceberem que a postura reflexiva vem sendo adotada por um grupo crescente e que esta atitude tem um caráter de vanguarda, estes passarão a desejar fazer parte do processo. 

Choosing Wisely se define como um movimento. Um movimento não dogmático ou extremista, um movimento em prol da incerteza, do cuidado nas decisões médicas. 

Também enfatizado nos encontros internacionais do grupo de trabalho Choosing Wisely é o cuidado para guardar uma distância do paradigma político típico de sociedades médicas. 

Choosing Wisely é um movimento de reconhecimento de nossos vieses cognitivos. Para sermos sábios, conforme sugere o nome da campanha, precisamos estudar nossa forma de pensar. Uma grande deficiência do ensino médico é ser pautado no acúmulo de conhecimento, e pouco se estuda como nossa mente funciona durante decisões incertas.  

Conclusão


Há 100 anos William Osler tentava nos ensinar algo que poucos aprenderam: “medicina é a ciência da incerteza e a arte da probabilidade”. Ao longo das décadas, promovemos uma cultura de certeza platônica, gerando atos médicos fúteis, que muito mais fragilizam os pacientes do que os protegem. Precisamos ser sábios em diferenciar o joio do trigo, saber quando fazer muito e saber quando fazer pouco. 

Muito precisamos evoluir para chegar do nível de William Osler. E nossa evolução começa pela humildade de reconhecer que nossas hipóteses precisam ser testadas e que os resultados dos testes muitas vezes surpreendem nossa lógica. 

Segurança perceptível é a causa principal do overdiagnosis e overtreatment.  Choosing Wisely é a provocação de que precisamos pensar mais. Pensar melhor.


________________________________________________________________________________

* Em breve, postaremos entrevista com Franz Porzsolt sobre o conceito de Perceived Safety.

quinta-feira, 26 de maio de 2016

Vídeo: O Conceito de Economia Clínica



Neste vídeo, conversamos com o Prof. Franz Porzsolt, criador do conceito de "clinical economics" como parte essencial do raciocínio médico embasado em evidências. Este conceito não se refere à questão monetária, mas utiliza a palavra "economia" em seu significado amplo. Assistam ao vídeo para entender. 

Franz é professor da Universidade de Ulm na Alemanha e criador do Institute of Clinical Economics

Esta entrevista foi gravada durante o nosso Workshop de Pensamento Médico Baseado em Evidências, promovido pela Universidade Federal Fluminense.




Abaixo do vídeo a transcrição traduzida para o português, feita por Dr. Felipe Ferreira. 


LC: Franz, seu conceito de Economia Clínica referente a valor é muito interessante, acredito que seja muito importante para os Clínicos. Então, nos explique o que é pensamento de Economia Clínica, e talvez o que é a própria Economia.

FP: Na verdade, isso começou na minha antiga profissão quando eu trabalhava como médico e oncologista. Por alguns momentos eu estava muito preocupado se os efeitos colaterais e o fardo do nosso tratamento oncológico estava realmente equilibrando os benefícios que os pacientes recebiam. Então eu estava pensando sobre a necessidade de análises que comparassem o que nós precisamos investir e o que recebemos em retorno. E fazendo essas considerações, eu me deparei dentro de uma análise econômica que é nada além do que uma comparação de custos, e não são custos monetários. É tudo que nós temos que renunciar. E no outro lado as consequências, isso é, tudo o que nós recebemos, e o que é importante numa análise econômica completa é que você compara custos e consequências de formas alternativas de agir.

LC: Então por exemplo para um paciente, como eu acabei de escrever no blog, quando analisamos o STICH trial, no qual o paciente é candidato para uma cirurgia cardíaca, uma cirurgia cardíaca de alto risco, visto que os pacientes têm insuficiência cardíaca grave. Então esse é o custo, o estresse, o estresse físico, a dor, talvez risco de até mesmo morrer nos momentos próximos a cirurgia. E o que os pacientes recebem em troca? Neste caso, o paciente seria recompensado muitos, muitos anos após a cirurgia. Então você investe aqui muita dor para receber algum benefício de sobrevida daqui a 10 anos. Isso deve ser pensado numa forma econômica como você pensa.

FP: Veja bem, nós podemos aprender muito com os economistas. Eles chamam isso de “Discounting”. Quando você tem que ceder, você tem que pagar hoje, mas você somente receberá o valor 10 anos depois, então você tem um valor descontado por um período de 10 anos. Essa é a diferença quando comparado com receber o valor imediatamente, é muito mais recompensador. 

LC: E sobre você como um oncologista, você pode dar um exemplo desta troca econômica?

FP: Eu diria, essa troca é importante em qualquer tratamento oncológico porque muitos desses tratamentos têm efeitos colaterais e riscos, e você deve discutir esses riscos com o seu paciente. Você deve dizer a eles a verdade e você deve saber a dimensão da chance de nós atingirmos o benefício esperado. Você percebe como isso é difícil e como isso está conectado ao outro tema que discutimos anteriormente, se os resultados de um ensaio clínico são realmente verdadeiros. Então como nós podemos comunicar ao paciente os resultados de um ensaio clínico, a menos que você possa ler e detectar os potenciais erros deste Trial. Você percebe? Tudo está conectado a tudo.

LC: Pacientes podem valorizar as coisas de formas diferentes, então você dá o exemplo de um dedo quebrado de um pianista. Você pode discorrer sobre isso?

FP: Sim, você sabe, eu estou usando este exemplo de um dedo quebrado quando é um pianista. Esta é uma situação horrível e ele gastará muito dinheiro para conseguir uma recuperação completa. Quando você tem um advogado com um dedo quebrado isso não é uma catástrofe. Você sabe, ele não será capaz de assinar alguns papéis, mas é somente isso.

LC: Então o pianista poderá assumir um custo de tratamento muito mais elevado porque o que ele está recebendo em troca compensa. Por exemplo, se o tratamento traz muita dor, muitas cirurgias, ele faria isso. Talvez o advogado falaria: “Bem, isso não vale a pena para mim, vamos ficar com o dedo da forma que ele está”.

FP: Exatamente.

LC: Então, é por isso que nós devemos ser guiados por evidências científicas em termos de considerar o que o tratamento nos oferece, mas a nossa decisão final deve ser compartilhada com o paciente, certo?

FP: Sim, os pacientes esperam que nós ajudemos eles a tomar essas decisões. Nós fornecemos a eles que eles esperem ter a liberdade de fazer essas decisões. Mas eles precisam de assistência, e eles precisam de informação para chegar a uma decisão final.

LC: Até drogas ou medicamentos têm um custo. Por exemplo, a terapia de estatina, algumas pessoas dizem “Eu não quero tomar estatina porque posso vir a ter uma dor muscular e eu gosto de correr”. Então é possível haver um custo ou risco nisto. E algumas pessoas podem querer tomar. Não um grande problema, na minha opinião, essa questão muscular, mas algumas pessoas realmente podem não querer, porque elas são corredoras, elas não querem arriscar isto, e para outras pessoas: “Está tudo bem, isso não é um grande problema”. Então até em drogas, você tem custos que devem ser considerados. Existem algumas pessoas que gostariam de evitar drogas, porque são pessoas mais naturais, então para eles é um custo tomar um medicamento.

FP: Claro. E esta é uma dificuldade extrema dos médicos para comunicar os riscos. Imagine, pense no folheto informativo das drogas que vem nas suas caixas, você sabe, do medicamento que você compra numa farmácia. Nele estão todos os tipos de precauções. Quando você informa o paciente de acordo com este folheto, quase nenhum paciente estará apto a tomar essa droga. Você vê, a responsabilidade do médico. Você não pode fornecer qualquer informação que é, você tem que desenvolver um instinto fino, quais são as informações essenciais que você deve fornecer por razões éticas e quais são as informações que induzem mais prejuízo ao paciente do que benefício.

segunda-feira, 18 de abril de 2016

Workshop de Pensamento Médico Baseado em Evidências

Colegas, 

a convite da Universidade Federal Fluminense, na próxima semana promoveremos o curso de Pensamento Médico Baseado em Evidências, ao lado do Prof. Franz Porzsolt. Será um curso de dois dias, com 20 aulas, divididas entre eu e Prof. Porzsolt, abordando análise crítica de artigos científicos e raciocínio médico baseado em incerteza e probabilidade. 

Porzsolt é professor da Universidade de Ulm na Alemanha e vem ao Brasil especialmente para este evento. Ele é uma grande referência na área de Medicina Baseada em Evidências e criador do conceito de Clinical Economics. 

Esta é  portanto uma parceria da Universidade Federal Fluminense, na pessoa de Tânia Thomaz, organizadora do curso, Escola Bahiana de Medicina e Saúde Pública e Universidade de Ulm. 

Todos estão convidados. 

Abaixo cartaz com detalhes de datas, local e inscrição para o curso. 


domingo, 17 de abril de 2016

STICH versus STICHES: estudos discordantes ou concordantes?



Em 2011, no post “STICH: uma mudança de paradigma”, reconheci minha arrogância epistêmica ao ter a assumido durante anos o paradigma de que pacientes com disfunção ventricular grave se beneficiavam da revascularização miocárdica. O primeiro ensaio clínico randomizado de alta qualidade metodológica, o STICH, derrubara este paradigma que havia sido criado sem o devido embasamento científico. Foi uma lição de humildade para a comunidade cardiológica quando o STICH trouxe esta observação aparentemente adequada de que a mortalidade geral foi semelhante entre os grupos randomizados para cirurgia ou controle. 

Cinco anos se passaram e acaba de ser publicado no mesmo New England Journal of Medicine o estudo STICHES, que conclui por uma “mortalidade significantemente menor no grupo cirúrgico, quando comparado ao tratamento clínico”. 

E então, onde fica nossa eloquência do post de 2011?

O primeiro detalhe que me chamou atenção foi a semelhança de nome dos dois estudos. O segundo é apenas o plural do primeiro. Foi quando percebi que na verdade se tratavam do mesmo estudo, sendo que STICHES traz o resultado baseado em um seguimento mais prolongado do que o STICH. Enquanto aquele resultado negativo do STICH foi obtido no seguimento médio de 5 anos, o SITCHES mostra um resultado positivo quando o acompanhamento é extendido para 10 anos. 

É correto estender o seguimento de um estudo?

Em primeiro lugar, em termos de ajustes metodológicos, é melhor estender o seguimento do que encurtar o seguimento de um estudo. Indo além, prolongar pode ser melhor do que não prolongar o seguimento. Ao prolongar um seguimento, aumentamos o número de desfechos, o que aumenta o poder estatístico. Isso pode ser bom pois reduz a probabilidade do erro tipo II (deixar de afirmar algo verdadeiro).

Para ser adequado, o prolongamento precisa ter dois critérios.

Primeiro, o novo tempo de seguimento deve ser definido, impedindo que o autor pare o estudo quando quiser. O problema ocorreria se esse prolongamento fosse feito na conveniência do resultado. Ou seja, vamos prolongar até conseguir significância estatística e quando isso ocorrer, paramos o estudo. Isso seria tendencioso. No STICHES o tempo de prolongamento foi pré-definido. 

Segundo, durante o prolongamento a terapia dever continuar a ser oferecida e a qualidade do acompanhamento deve se manter. No caso, o paciente continua a ter seus enxertos durante o prolongamento, o que resolve a manutenção do tratamento. E no STICHES a qualidade do follow-up foi a mesma no tempo regulamentar e na prorrogação.

Ao validar o prolongamento do seguimento, poderíamos concluir que o resultado positivo do STICHES está correto e o resultado negativo do STICH foi um equívoco.

Essa é a correta interpretação? 

Não exatamente ... Mostrarei porque.


A Magnitude do Efeito


Nos parágrafos anteriores julgamos que o resultado positivo apresentado pelo STICHES é verdadeiro, pois há baixo risco de viés e de acaso. 

Depois de avaliar veracidade, devemos julgar a relevância (impacto, magnitude) do efeito da terapia. Neste particular, os autores nos trazem o NNT = 14, o que em geral é interpretado como indicativo de grande benefício.

Por outro lado, este NNT = 14 é obtido em seguimento médio de 10 anos, um tempo bastante prolongado. O paciente precisa se operar hoje, desfrutar de um certo aumento de mortalidade imediato (como em toda cirurgia, mas principalmente neste caso), assumir o desconforto físico e mental da cirurgia, além das eventuais sequelas cirúrgicas, em troca de uma possibilidade de se beneficiar durante um longo período de espera. 

Enquanto o preço da cirurgia (sofrimento físico e estresse psicológico) é garantido para todos os 14 pacientes operados, o retorno deste investimento ocorre em apenas 1 dos 14 pacientes. Será que este benefício é relevante o suficiente para que o paciente faça a opção cirúrgica?

Isso sem considerar que este resultado cirúrgico obtido no STICH é de alto padrão, com baixa incidência de complicações. Aplicável a qualquer local?

Para aprofundar nossa reflexão, nada como uma boa analogia. Vamos comparar este benefício da cirurgia com um tratamento muito mais simples, que também reduz mortalidade em pacientes com insuficiência cardíaca: espironolactona em baixa dose. De acordo com o ensaio clínico RALES, a redução de mortalidade com esse simples diurético é expressa por um NNT = 9 em apenas 2 anos ! E isso é apenas um comprimido diário, algo muito menos agressivo do que uma cirurgia cardíaca. 

E aí? O benefício obtido com a cirurgia é de fato relevante? Compensa ser operado mesmo? De fato, é uma reflexão caso a caso, mas não parece ser uma grande panacéia.

O STICHES é um bom exemplo de que ao olhar o valor do NNT, devemos pensar no tempo de seguimento para se obter aquele benefício. É o NNT se tornando relativo a depender do tempo. De fato, o tempo relativiza tudo, como já dizia um certo cientista no início do século passado. 

Os autores do STICHES não consideraram esta questão ao espetacularizar o NNT do trabalho. 

Por estas razões, em circunstância de tempo muito prolongado, o calculo do NNT em análises de sobrevida não é feito na maneira usual. Explicarei a seguir como deve ser feito.


O NNT do Hazard Ratio


Neste Blog, já abordamos muitas vezes cálculo de NNT e seus intervalos de confiança, mas nunca discutimos o cálculo do NNT utilizando o hazard ratio. Esta é uma forma mais avançada, que considera tempo de exposição e a probabilidade cumulativa do desfecho. 

Normalmente não precisamos nos preocupar com esse ajuste do NNT, pois os tempos de seguimento em estudos são um tanto padronizados para cada doença (1-2 anos para insuficiência cardíaca, 5 anos para prevenção de eventos coronários, 30 dias para intervenções agudas no infarto). Porém quando o tempo se prolonga em demasia, gerando um trade-off entre o investimento na cirurgia (risco, sofrimento) na expectativa de um retorno em muito longo prazo, precisamos levar em consideração a analise de sobrevida.

Os autores do STICHES não fizeram isso, calcularam o NNT da forma tradicional, ou seja, 100 / redução absoluta do risco. 

RAR = frequência de desfecho no grupo clínico - frequência de desfecho no grupo cirúrgico
RAR = 66.1% - 58.9% = 7.2%. 
Então 100/7.2 = 14 cirurgias para 1 vida salva.

Este foi o cálculo simplório feitos pelos autores do STICHES. 

Vamos agora sofisticar.

Para calcular o NNT considerando a análise de sobrevida (NNTH), devemos obter do artigo a probabilidade cumulativa do desfecho e o hazard ratio. Lembrem que hazard é calculado pelo número de eventos / tempo de exposição (pessoas-tempo). Portanto hazard ratio é como um risco relativo que leva o tempo de exposição em consideração. 

Tendo estes dados, podemos calcular o NNTH utilizando a fórmula de Altman

NNTH = 1 / Prob Desfecho Grupo ControleHazard Ratio - Prob Desfecho Grupo Controle

O estudo não fornece numericamente o hazard (eventos/pessoas-ano), ou seja, a probabilidade cumulativa do desfecho. Mas olhando o gráfico de sobrevida (abaixo) podemos obter a mortalidade cumulativa, traçando uma linha imaginária nos 10 anos de seguimento, que é a mediana do tempo de seguimento. Observem na linha que a probabilidade cumulativa de morte no grupo controle é 0.69 (69%). Além disso, o artigo nos traz o hazard ratio para morte geral = 0.84. 





Portanto,

NNTH = 1 / 0.690.84 - 0.69 = 25

Em se considerando o tempo de seguimento o NNT correto é 25. 

Por que este NNT é diferente do original? A diferença está no uso dos dados da análise de sobrevida. Ao invés do risco de evento, usa-se hazard, que é uma probabilidade condicional. Esta parte da premissa de que a probabilidade de sobrevida muda na medida em que o paciente sobrevive a um primeiro período analisado. Imaginem um grupo de pacientes que são acompanhados durante 10 anos. Vamos dividir esse tempo em 10 períodos de 1 ano. No primeiro ano, alguns morrem. Os que sobram e entram no segundo ano terão uma probabilidade de morte menor do que o grupo inicial do estudo, pois os mais graves já morreram. 

Desta forma, o calculo do hazard é condicional: o programa de computador divide o tempo em mini-períodos, calcula o hazard de cada um deles e multiplica o hazard de todos os períodos, encontrando o hazard final. Observem que 69% de probabilidade de evento no grupo controle (o que vemos no gráfico) é diferente da mortalidade de 66.1% descrita na tabela. O motivo da diferença é que hazard é diferente de risco.

Mas devemos ir além disso e calcular o intervalo de confiança deste NNTH. Isso é importante pois na análise de sobrevida, na medida em que vão morrendo pacientes, vai tendo menos gente nos anos finais, o que reduz a precisão das estimativas. Portanto, devemos calcular os limites do intervalo de confiança do NNT utilizando os limites do intervalo de confiança do hazard ratio. De acordo com o artigo, o intervalo de confiança no nível 95% do hazard ratio é 0.73 - 0.97.

NNTH = 1 / 0.690.73 - 0.69 = 14
NNTH = 1 / 0.690.97 - 0.69 = 129

Desta forma, o NNT = 25 tem uma imprecisão representada por intervalo de confiança que vai de 14 a 129. Pasmem, a imprecisão é tão grande que não podemos descartar a possibilidade do NNT ser 129.


Conclusão


Antes de escrever esse post, reli o texto de 2011 sobre o STICH e para minha surpresa eu havia previsto o resultado do STICHES, sem nem mesmo saber que este estudo viria a ser publicado. Vejam minha colocação naquela época:

“Se o poder estatístico fosse ainda maior ou o seguimento fosse de 10 anos, poderia se encontrar uma pequena redução na frequência de morte no grupo cirúrgico, mas esse raciocínio de temporalidade faz com que esse benefício modesto não compense (se existir).”

Foi exatamente isso que aconteceu. O prolongamento do estudo, aumentou o número de desfechos, que aumentou o poder estatístico, que detectou uma diferença modesta.

O hazard ratio é o mesmo nos dois estudos, 0.86 no STICH e 0.84 no STICHES. Enquanto no STICH o número de desfecho não foi suficiente para dar significância estatística ao resultado, o mesmo hazard ratio consegue significância estatística no STICHES (P = 0.02, intervalo de confiança de 0.73 a 0.97 - por pouco não envolve o 1).

O poder estatístico para o STICH foi calculado para detectar um benefício relevante, enquanto o STICHES tem poder para benefícios menos relevantes. 

Enquanto o STICH não demonstrou um benefício relevante, o STICHES demonstrou um benefício não relevante. Ambos são estudos negativos para um impacto relevante do tratamento. 

STICH e STICHES são estudos concordantes. 



_________________________________________________________________________________

Objetivos Didáticos da Postagem:

- Cálculo do NTT baseado no Hazard Ratio
- Revisão do conceito de Hazard Ratio
Revisão do conceito de NNT
- Análise do prolongamento de seguimentos

quinta-feira, 14 de abril de 2016

O Sofisma Científico no Caso Zika e Microcefalia.





Em dezembro do ano passado, utilizei a suposta causalidade entre Zika e microcefalia com gancho para discutir o paradigma científico (ou ausência dele) no pensamento médico. O texto ganhou grande repercussão, com 57.000 acessos, citações na Folha de São Paulo e Associated Press. A partir daí, resolvi deixar o assunto de lado, pois nosso Blog não objetiva esgotar tópicos específicos, mas visa discutir ciência aplicada à medicina. Além do mais, sou cardiologista e fiquei cansado desse assunto.

Mas o assunto nunca me deixou de lado, pois colegas insistem em me mandar cada artigo publicado sobre o microcefalia. Este é o exemplo de Julival Ribeiro, infectologista e amigo de Brasília, um inconformado com a carência de pensamento científico sobre esta questão. Foi nesse contexto que Julival me mandou ontem uma manchete do CDC: "Zika Virus Definitely Causes Microcephaly", que cita um novo artigo do New England Journal of Medicine. Não li o artigo, deixei para depois, quando chega uma nova mensagem de Julival dizendo “vale a pena ler”. E nas horas subsequentes, mais três colegas me mandaram o artigo em PDF. 

Daí pensei, deve ser uma nova evidência que surge, quem sabe algum estudo epidemiológico grande, mostrando uma decente associação entre Zika e microcefalia. Então resolvi verificar e me surpreendi com o fato de que não havia uma nova evidência, apenas uma análise das poucas evidências existentes até o momento. 

O título do trabalho publicado ontem e que gerou essa posição “definitiva” do CDC é “Zika Virus and Birth Defects: Reviewing the Evidence for Causality”. Lendo a revisão, podemos confirmar que de fato há muito pouca evidência dando suporte à associação causal.  Nenhuma novidade. 

O que me chamou atenção neste artigo foi o espetacular sofisma científico criado pelos autores. Ficou irresistível, tive que voltar usar Zika e microcefalia para falar de ciência. 

Aristóteles, o filósofo, foi o primeiro a dividir argumentos em duas classes: os verdadeiros e outros que não o são, embora pareçam. Estes últimos são os sofismas. Os sofismas parecem verdadeiros, pois são pautados em fatos verdadeiros. Porém estes fatos não levam necessariamente a argumentos verdadeiros. 

O uso dos Critérios de Shepard para teratogênese criou um bom ambiente para sofismar, pois deu veracidade ao texto, uma veracidade baseada na autoridade de um cientista respeitável. Foi nesta ambientação que a aplicação das evidências existentes aos Critérios de Shepard se constituiu em um grande sofisma.

A leitura do artigo é um tanto cansativa, pois passa por vários critérios. Por isso vou resumir aqui a engenhosidade do sofisma. De acordo com os Critérios de Shepherd, a causalidade é sugerida quando os critérios 1, 3 e 2 ou 1, 3 e 4 estão presentes. 

O critério 2 não se faz presente, tal como reconhecido pelos autores. Seria a existência de estudos epidemiológicos de alta qualidade. Sendo assim, sobra a combinação dos critérios 1, 3 e 4 para fechar a causalidade. O critério 3 existe, pois representa a descrição de um fenótipo específico relacionado aos casos. Os fenótipos estão bem descritos nos relatos. 

Vamos então abordar os critérios 1 e 4, que nos apresentam interessantes sofismas.

O critério 4 diz que, em casos de associação exposição-desfecho, a exposição ao agente teratogênico deve ocorrer em momento crítico da gravidez (nos primeiros meses). Sim, há muitos relatos de casos em que a Zika foi diagnosticada nos primeiros meses. 

O problema é que as observações não representam associações: quase todas são relatos de caso, representando co-existência, o que é diferente de associação, como mencionado em nossa postagem anterior. O único trabalho que demonstra associação foi a coorte longitudinal de 88 mulheres publicada recentemente no New England Journal of Medicine: 72 mulheres que tiveram sorologia positiva para Zika versus 16 de sorologia negativa. O primeiro grupo apresentou casos de filhos com defeitos congênitos, enquanto o segundo grupo não. Detalhe é que este estudo não traz o valor de P desta comparação. Por curiosidade eu calculei: P = 0.054, ou seja, esta associação, neste pequeno estudo, não alcançou significância estatística. 

Portanto, este critério 4 (exposição nos primeiros meses de gravidez) é observado em relatos de caso (não são associações) e em um único estudo que "mostra" uma associação não estatisticamente significante. Sofismou, pois descreveu estudos, porém estes não são suficientes para conclusão.

Sofisma Estatístico


É a discussão do critério 1 a mais interessante do ponto de vista estatístico e científico. Este é o critério da combinação entre uma rara exposição associada a um raro desfecho (raro tipo de defeito congênito). A lógica desse critério é que a co-existência de duas coisas raras é aleatoriamente improvável. Tão improvável de ocorrer aleatoriamente, que sugere ser uma relação causal (o que não é acaso, é causa).   

Sim, é aceitável que microcefalia seja considerado um evento raro. Mas Zika é raro? Claro que não, em nosso meio. Mas daí o autor usou raras observações feitas de grávidas que moravam em lugares sem Zika, que transitoriamente passaram por países como o Brasil e terminaram com um filho acometido pela microcefalia. É raro mulheres não brasileiras pegarem Zika e microcefalia é raro. 

Esse método de rara exposição/raro desfecho é também chamado do “método do médico astuto”, pois caracteriza um caso inesperado (não procurado) com que o médico se depara e por ser astuto ele percebe algo importante. No entanto, o médico só seria astuto se tivesse se deparado com um caso raro/desfecho raro antes do modismo atual. 

Hoje em dia, reconhecer essa associação não faz de ninguém astuto. Não ser astuto significa que todo mundo está procurando uma associação dessa, portanto encontrar no mundo duas coisas raras coexistindo, quando o mundo todo está procurando por isso, deixa de ser raro. Este encontro deixa de ser improvável.

É pouco provável que essa rara coexistência seja encontrada aleatoriamente. Porém é muito provável que essa rara coexistência seja encontrada se todos os médicos do mundo estiverem procurando por isso. 

Sendo assim, aqui não estamos diante de uma coisa inusitada. Se procuramos é fácil encontrar coincidências raras. O raro é encontrar isso sem procurar, como faria o médico astuto. 

Portanto, esse é o sofisma mais inteligente de todos. 

Problema das Múltiplas Comparações


Isso nos remonta ao fenômeno que faz com que, no momento inicial de testes de hipóteses, haja uma grande prevalência de pequenos estudos positivos, pois está todo mundo tentando encontrar significância estatística em milhares de observações simultâneas no mundo. Ocorre o problemas das múltiplas comparações. 

Se apenas um estudo está sendo realizado e o alfa do estudo for 0.05, ao obter um valor de P < 0.05 o pesquisador vai rejeitar a hipótese nula e comprovar a hipótese de causalidade. Ele rejeita a hipótese nula pois tem no máximo 5% de probabilidade de errar por acaso. 

No entanto, imaginem que 1.000 pesquisadores estão testando uma mesma hipótese, que é falsa. Se cada pesquisador usar o alfa de 0.05 (como usual), 50 estudos serão positivos (P = 0.05) por acaso (falso-positivos). 1000 x 5% = 50 estudos.

Sabemos que no período inicial do teste de uma dada hipótese, o entusiasmo faz com que cada um desses 50 estudos falso-positivos tenham mais chance de ser publicados do que cada um dos 950 estudos verdadeiro-negativos (viés de publicação).

Os autores da revisão das evidências, publicada na mais importante revista médica do mundo, falam apenas dos Critérios de Shepard, criando um ambiente sofístico. Mas se esquecem que a premissa científica inicial é escrutinar a qualidade da evidência que dá suporte às análises de causalidade. Estas evidências são de qualidade insatisfatória.

Secundariamente, os autores ainda avaliam a causalidade pelos critérios de Hill, mas esta análise deve ter feito Hill levantar do caixão. Nem comentarei. 


O Estado da Arte


Do ponto de vista de experimental, está comprovado (in vitro) que o vírus da Zika tem competência para destruir neurônios. Esta informação traz plausibilidade biológica para a relação causal entre  infeção por Zika e aumento da incidência de microcefalia. Mas este é apenas o primeiro passo, precisamos evoluir para confirmação de associação em estudos de qualidade, seguida de ajustes estatísticos que demonstrem que a associação é independente de confundidores. O vírus mata neurônios, mas isso é diferente de dizer que o vírus é o causador de um suposto aumento substancial de microcefalia.

Neste momento, a discussão de causalidade não pode ser definitiva, como dizem as manchetes. Assim corremos o risco de sofismar. Esta questão será resolvida dentro de uns três anos, quando o entusiasmo baixar e as evidências positivas que estão rapidamente surgindo (viés de publicação é mais prevalente na fase inicial dos testes de hipótese) forem confrontadas com evidências negativas que aparecerão gradativamente. 

Depois de uma análise cuidadosa da totalidade das evidências, dentro de alguns anos, poderemos chegar a uma conclusão a respeito da probabilidade desta hipótese causal ser verdadeira. 

Por enquanto, vale mais a pena discutir o que é ciência: a humildade de reconhecer a incerteza das hipóteses e utilizar a lente do método científico na prevenção das ilusões criadas pelo mundo a nossa volta. 

_________________________________________________________________________________

Objetivos Didáticos da Postagem:

- Pensamento científico (ceticismo versus crença)
- Teste estatístico de hipóteses
- Casualidade versus causalidade
- Problema das múltiplas comparações
- Viés de publicação