sexta-feira, 30 de dezembro de 2011
sábado, 24 de dezembro de 2011
Papai Noel Baseado em Evidências
Papai Noel existe? Essa é uma pergunta
comum nesta época do ano. Considerando que este Blog se propõe a discutir a
veracidade dos fatos sob o paradigma científico, precisamos abordar esta
importante questão, a qual impactará na vida de milhares de famílias nas
próximas horas.
Partimos inicialmente do
Princípio da Hipótese Nula (Princípio 2), o qual afirma que todo fenômeno é
inexistente até que se prove o contrário (prova
científica). Esta é a justificativa para eventualmente nos questionarmos
sobre a existência de Papai Noel. Ou seja, duvidar de vez em quando, é natural,
humano e faz parte do pensamento científico. Mas não podemos parar por aqui,
temos que evoluir nosso pensamento.
Após considerar o Princípio 2,
devemos evoluir e nos perguntar se a presente questão se adéqua ao Princípio 3,
o da Plausibilidade Extrema. Este princípio se aplica a situações de exceção,
onde o fenômeno é tão plausível, que dispensamos comprovação científica. Por
exemplo, na prática clínica ter uma boa relação médico-paciente, saber ouvir e
conversar com nosso cliente, representa uma habilidade que deve ser utilizada,
mesmo sem um ensaio clínico randomizado demonstrando que a boa relação é benéfica. É extremamente plausível que um médico atencioso faz bem ao seu
paciente e por isso aplicamos (ou devemos aplicar) essa abordagem mesmo na
ausência de evidência científica.
A existência de Papai Noel é
extremamente plausível. Isto porque esta existência
só se materializa se formos capazes de acreditar. Se acreditarmos, Papai Noel
existirá, se não acreditarmos, ele desaparecerá (ou não aparecerá). Desta forma,
só nos resta aplicar o Princípio 3, pois acreditando que Papai Noel é
extremamente plausível, este se tornará extremamente verdadeiro. É um perfeito
exemplo do Princípio da Plausibilidade Extrema, que deve ser aplicado apenas a
situações especiais, onde dispensamos o Princípio 2 (da necessidade de
demonstração) e ficamos como a verdade, simplesmente porque aquela verdade é
indubitável.
Há também o argumento da
plausibilidade extrema do benefício em se acreditar em Papai Noel. Óbvio que
esta crença faz bem para a alma, portanto devemos nutri-la. E não faz bem
apenas para crianças, para adultos também.
Nós todos devemos acreditar em Papai Noel.
É tão plausível que ao
imaginarmos um ensaio clínico randomizado para provar esta questão,
percebemos que este seria inútil. Imaginem que vamos randomizar famílias, metade
para acreditar em Papai Noel e metade para não acreditar. É óbvio que nas famílias
que acreditarem, as árvores acordarão repletas de presentes, enquanto nas
famílias randomizadas para não acreditar, as árvores estarão vazias, se é que
nestas casas haveria árvores de natal. É tão óbvio que seria uma perda de tempo
fazer esse estudo.
Poderíamos então fazer um estudo
observacional. Observem como o Natal de famílias crentes é mais mágico do que o
Natal de famílias descrentes.
Percebam que todo esse pensamento
é baseado em uma seqüência lógica que respeita dos princípios da medicina baseada
em evidências. Mas para aqueles que ainda permanecem com o Princípio da
Hipótese Nula a despeito de meus argumentos, vamos fazer um teste: amanhã, ao
acordar, se houver presentes na árvore, estará provado que Papai Noel
passou em sua casa.
Na verdade, todo
mundo acredita em Papai Noel, mesmo aqueles que fingem não acreditar.
Feliz Natal a todos.
* Esta é a postagem mais embasada em evidência de todas já escritas neste Blog.
quinta-feira, 22 de dezembro de 2011
SCIENTIA TOTUM CIRCUMIT ORBEM: Cálculos científicos para a viagem de Papai Noel
SCIENTIA TOTUM CIRCUMIT ORBEM: Cálculos científicos para a viagem de Papai Noel: Na noite do dia 24, enquanto Papai Noel atravessa o mundo todo para entregar presentes a todas as crianças, você pesquisador deve se faz...
domingo, 27 de novembro de 2011
Viés, Acaso e Demissão
Na
recente postagem Ensaio sobre Conflito de Interesse, utilizei como exemplo um editorial escrito por Podermans D, o qual defendia o uso dos
beta-bloqueadores em pré-operatório de cirurgia não cardíaca, exatamente quando
o ensaio clínico POISE mostrou aumento da mortalidade com esta terapia. Aquele foi um exemplo especulativo, pois coincidentemente eu
havia “flagrado” o mesmo médico fazendo o papel de speaker da indústria de
beta-bloqueadores no congresso mundial de cardiologia.
Na
semana passada, o colega Roberto
Dutra me chamou atenção de uma notícia no theheart.org:
Podermans
foi demitido por um padrão inadequado de conduta científica.
Muitas vezes alunos me perguntam como a gente pode saber se um pesquisador fraudou seus dados. Minha resposta é que isso geralmente não é o caso. O que normalmente ocorre é uma tendenciosidade no desenho, condução ou interpretação do estudo, mais do que exatamente uma fraude. E dá para diagnosticar este padrão com a análise metodológica do trabalho em questão.
Muitas vezes alunos me perguntam como a gente pode saber se um pesquisador fraudou seus dados. Minha resposta é que isso geralmente não é o caso. O que normalmente ocorre é uma tendenciosidade no desenho, condução ou interpretação do estudo, mais do que exatamente uma fraude. E dá para diagnosticar este padrão com a análise metodológica do trabalho em questão.
Vamos
exemplicar com o estudo DECREASE I, publicado por Podermans et al em 1999, no prestigiado New England Journal of Medicine, artigo bastante
citado pelos entusiastas do uso de beta-bloqueador em pré-operatório de
cirurgia não cardíaca.
O
estudo DECREASE é um prato cheio para treinamento de análise crítica. Trata-se
de um ensaio clínico que randomizou 112
pacientes (candidatos a cirurgia vascular e que tinham isquemia miocárdica)
para dois tipos de tratamento: usar bisoprolol (iniciado uma semana antes da
cirurgia e mantido por 30 dias depois) ou não usar bisoprolol. O estudo mostrou
uma impressionante redução de mortalidade cardiovascular (3.4% vs. 17%, P = 0.02) e redução de infarto
(0% vs. 17%; P < 0.001). Impressionante
mesmo, NNT = 7 (100/redução absoluta do risco = 100/14) para redução de morte. Sinceramente, eu nunca
vi um NNT tão bom para redução de mortalidade com qualquer terapia
farmacológica. Os tratamentos farmacológicos de maior impacto em cardiologia,
como inibidor de ECA em ICC ou trombólise no infarto possuem NNT em torno de
20. O NNT = 7 é um achado sem precedentes.
Precisamos
então analisar a veracidade deste achado. Epidemiologicamente, uma associação
pode decorrer de 3 fatores: viés, acaso ou causa. Causa é quando de fato a
droga está provocando redução de mortalidade. Mas antes temos que analisar as
outras duas possibilidades.
Viés
é um erro decorrente de falha na metodologia do trabalho. Neste estudo, existe
um potencial viés de mensuração da
variável desfecho: o estudo é aberto, sem
utilização de placebo no grupo controle.
Usualmente desfechos duros como morte são mais resistentes ao viés de mensuração de um estudo aberto. Isto porquê morte é um desfecho tão objetivo que sofre menos de erro de interpretação. Porém devemos notar que o desfecho no estudo DECREASE I é morte cardiovascular, não morte geral. Segundo o trabalho, não houve morte não cardiovascular, todas as 9 mortes do grupo controle e as duas no grupo bisoprolol foram de origem cardiovascular. Estranho só ter morte cardiovascular. E o que é morte cardiovascular em cirurgia vascular? É morte por infarto ou morte por complicação da cirurgia vascular foi considerada? De fato, o saber que um paciente estava no grupo controle poderia ter induzido os médicos a considerar a causa da morte do paciente como cardiovascular. Ou seja, morte de uma dada origem não é desfecho tão objetivo como morte geral. De forma que ocorre aqui a interação do caráter aberto do estudo com um desfecho que não é plenamente objetivo, interação esta já mencionada previamente neste Blog. Isso representa um potencial viés de mensuração do desfecho.
Usualmente desfechos duros como morte são mais resistentes ao viés de mensuração de um estudo aberto. Isto porquê morte é um desfecho tão objetivo que sofre menos de erro de interpretação. Porém devemos notar que o desfecho no estudo DECREASE I é morte cardiovascular, não morte geral. Segundo o trabalho, não houve morte não cardiovascular, todas as 9 mortes do grupo controle e as duas no grupo bisoprolol foram de origem cardiovascular. Estranho só ter morte cardiovascular. E o que é morte cardiovascular em cirurgia vascular? É morte por infarto ou morte por complicação da cirurgia vascular foi considerada? De fato, o saber que um paciente estava no grupo controle poderia ter induzido os médicos a considerar a causa da morte do paciente como cardiovascular. Ou seja, morte de uma dada origem não é desfecho tão objetivo como morte geral. De forma que ocorre aqui a interação do caráter aberto do estudo com um desfecho que não é plenamente objetivo, interação esta já mencionada previamente neste Blog. Isso representa um potencial viés de mensuração do desfecho.
Na
verdade, não podemos ter certeza qual o mecanismo exato pelo qual este viés pode
ter contribuído para os resultados. O fato é que temos duas situações
inusitadas: um estudo aberto de apenas 112 pacientes publicado no NEJM e uma
redução de mortalidade nunca antes vista com
um tratamento farmacológico. Talvez tenha alguma coisa errada.
Mas não
ficamos por aqui. Falamos em três possibilidades: viés, acaso e causa. Analisando
agora a segunda possibilidade, acaso, percebemos outro potencial problema. Este é um estudo
truncado - interrompido precocemente devido a achado favorável à droga. Inicialmente
o autor planejou um tamanho amostral de 226 pacientes para lhe fornecer um
poder estatístico adequado. De início, já acho esse cálculo de tamanho amostral
questionável, pois foi baseado em uma premissa de altíssima incidência de
desfecho (28%). Mas vamos considerar que este cálculo de tamanho amostral como adequado.
Mesmo assim, não foram randomizados os 226 pacientes prometidos. O autor
interrompeu o estudo com apenas metade dos pacientes randomizados, pois
verificou um resultado muito bom a favor da droga. Muito bom para ser verdade.
E é
exatamente este o problema de estudos truncados. Quando
o tamanho amostral é muito pequeno, uma diferença muito grande entre os dois
grupos é necessária para que se consiga significância estatística. Diferença
tão grande que se torna inverossímil. Diferença tão grande que só pode ter
decorrido do acaso. Por isto que quando o poder estatístico é insuficiente, o
valor de P tende a subestimar a probabilidade do acaso. Ou seja, o acaso pode ter
ocorrido, apesar do valor de P < 0.05. Este é o primeiro problema. O segundo
problema é que o autor está interrompendo o estudo no melhor momento,
garantindo que aquele resultado desejável não seja corrigido pelo crescimento
do tamanho amostral, se de fato precisar ser corrigido. Terceiro, são várias as
análises interinas, e a probabilidade do acaso aumenta pelo problema das
múltiplas comparações (postagem futura abordará este problema). Desta
forma, este estudo tem grande possibilidade de estar errado, não devendo servir
de argumento para o uso de beta-bloqueador.
Em 2009 Podermans publicou o DECREASE IV, agora no Annals of Surgery. E fez a mesma coisa: estudo aberto e truncado. Havia sido planejado 6.000 pacientes e o cara interrompeu o estudo com apenas 1.000 pacientes! Assim, ele demonstra benefício, porém de uma magnitude muito menor (mortalidade total: 1.1% bisoprolol vs. 3.4% controle - NNT = 43) do que o impressionante benefício do DECREASE I. Isso é uma prova de que o DECREASE I era um estudo enviesado e impreciso. O DECREASE IV é menos impreciso, pois tem maior tamanho amostral, porém sofre dos mesmos problemas metodológicos.
Em 2009 Podermans publicou o DECREASE IV, agora no Annals of Surgery. E fez a mesma coisa: estudo aberto e truncado. Havia sido planejado 6.000 pacientes e o cara interrompeu o estudo com apenas 1.000 pacientes! Assim, ele demonstra benefício, porém de uma magnitude muito menor (mortalidade total: 1.1% bisoprolol vs. 3.4% controle - NNT = 43) do que o impressionante benefício do DECREASE I. Isso é uma prova de que o DECREASE I era um estudo enviesado e impreciso. O DECREASE IV é menos impreciso, pois tem maior tamanho amostral, porém sofre dos mesmos problemas metodológicos.
Por outro lado, há o estudo POISE, co-patrocinado pela indústria farmacêutica e por orgãos governamentais do Canadá, Austrália e Inglaterra. Este estudo randomizou 8.000 pacientes e não demonstrou benefício do uso do beta-bloqueador. Na verdade, houve até maior incidência do desfecho primário no grupo beta-bloqueador. Este estudo foi criticado pela forma intempestiva com que o beta-bloqueador foi utilizado, o que poderia ter sido responsável pelo resultado insatisfatório. Pode até ser, mas isso não nos autoriza a utilizar beta-bloqueador. O que nos autorizaria a usar o beta-bloqueador seria a demonstração de benefício, o que não ocorreu no estudo POISE. Benefício foi apenas demonstrado por estudos de má qualidade metodológica.
Em 2008 foi publicada no Lancet uma meta-análise de 33 ensaios clínicos randomizados que avaliaram a questão. A conclusão foi ausência de benefício. Interessante foi a análise de sensibilidade, onde os estudos classificados como alto risco de viés sugeriam benefício e os estudos classificados como baixo risco de viés não sugeriam benefício.
É
neste momento que presenciamos uma dos maiores exemplos de violação do segundo
princípio da medicina baseada em evidências (A Hipótese
Nula). O recente Guideline Europeu de Pré-operatório (2009 - coordenado por Poderman) e a recente Diretriz Brasileira (2011) recomendam o uso de beta-bloqueador como Classe I, sem dados científicos suficientes para rejeitar a hipótese nula e passar a acreditar neste benefício. Lembrem-se, o que
justifica uma terapia é a demonstração do benefício. A ausência de demonstração definitiva de
malefício com formas mais brandas de utilização do beta-bloqueador não indica terapia nenhuma. Já o Guideline Americano atualizou sua diretriz em 2009 no intuito de retirar a indicação classe I do beta-bloqueador. Classe I foi apenas para pacientes que já vinham em uso de beta-bloqueador.
Drogas
não devem ser recomendadas com base apenas em plausibilidade (Princípio 4), nem com base em estudos como os DECREASE I ou IV, nem com base na não demonstração
de prejuízo se for usada de forma mais cuidadosa. Até que se prove o contrário,
beta-bloqueador não é benéfico e pode até ser deletério.
Basear-se em estudos como DECREASE I e IV é um tipo de erro de pensamento médico
denominado de ancoragem. Este erro ocorre quando queremos acreditar em uma
hipótese (clínica ou científica) e nos ancoramos em argumentos que nunca
utilizaríamos se não tivéssemos um viés a favor daquela conclusão.
domingo, 13 de novembro de 2011
Valor Diagnóstico do Escore de Cálcio Zero
Recentemente postamos uma série de
artigos entitulada Análise Crítica de
Métodos Diagnósticos.
Naquelas postagem discutimos
detalhadamente como analisar a veracidade da informação sobre acurácia (1),
magnitude da acurácia (2) e utilidade de métodos dignósticos (3,4). A intenção daquela
série foi servir de guia para futuras análises da literatura, onde revisamos
este conhecimento. Foi o que fizemos na análise do artigo sobre troponina de
alta sensibilidade (5) e faremos agora com um artigo publicado ahead of print no Journal of the American College of
Cardiology por Villines et al (Estudo CONFIRM).
O trabalho intitulado Prevalence and Severity of Coronary Artery Disease and Adverse Events Among Symptomatic Patients With Coronary Artery Calcification Scores of Zero Undergoing Coronary Computed Tomography Angiography avalia
a acurácia diagnóstica do escore de cálcio coronário na detecção de doença
coronária obstrutiva em 10.000 pacientes com sintomas possivelmente anginosos, tendo angiotomografia de coronária como
padrão de referência. Nesta postagem, discutiremos o significado diagnóstico destes achados.
Na
discussão do trabalho, o autor afirma:
In
this large, multicenter, international cohort without known CAD, clinically
referred for noninvasive coronary angiography, the absence of measurable CAC
significantly reduced, but did not fully exclude, the presence of obstructive
CAD on current generation CCTA.
Observem que esta sentença tem uma
afirmação positiva (the absence of
measurable CAC significantly reduced, the presence of obstructive CAD) e
outra negativa (but did not fully exclude)
– ambas corretas. Mas o que deve prevalecer como mensagem
final? As frases de conclusão do autor sugerem que a mensagem negativa deve
prevalecer:
Conclusão do
Resumo: In symptomatic patients with a
CAC score of 0, obstructive CAD is possible.
Conclusão do Artigo: In symptomatic patients referred for CCTA, the absence of
CAC reduces but does not fully eliminate the occurrence of obstructive CAD.
É neste ponto que discordamos.
Primeiro devemos reconhecer que a especificidade do escore de cálcio é insatisfatória, apenas 59%. Mas nossa discussão aqui será mais focada na sensibilidade, pois esta é a propriedade que interfere nas conclusões acima citadas.
Em sentido estrito, a conclusão é
correta, ou seja, o escore de cálcio zero não afasta a possibilidade da
presença de estenose coronária. Isto porquê a sensibilidade relatada foi 89%
para estenose > 50%. Significa que 11% dos pacientes com estenose coronária
não teriam este problema detectado pelo escore de cálcio.
Depois de reconhecer que o método não
afasta a doença, devemos partir para uma análise mais aprofundada da
acurácia. Primeiro, precisamos ter a perspectiva de que nenhum método não invasivo é capaz de afastar totalmente a presença de
doença coronária. Mesmo métodos consagrados, tais como cintilografia
miocárdica (sensibilidade de 87%), eco-estresse (80%) e até mesmo a angiotomografia de coronária
(83%) não têm sensibilidade melhor do que a relatada aqui. Ou seja, nenhuma pesquisa não invasiva de doença coronária é determinística. Isto faz com que precisemos aplicar nesta discussão o raciocínio
probabilístico, ou seja, o quanto um resultado negativo do escore de cálcio
reduz a probabilidade do indivíduo ter doença obstrutiva. Este é o
raciocínio que vai definir o valor da informação escore de cálcio zero.
Para saber o quanto um resultado negativo
(escore zero) é capaz de reduzir a probabilidade da doença, precisamos avaliar
a razão de probabilidade (RP) negativa (1-sensibilidade/especificidade).
O autor fez este cálculo (1 – sensibilidade 0.89 / especificidade 0.59): RP negativa = 0.19. Este é um valor bem razoável, pois entre 0.10 e 0.20 o resultado negativo promove uma mudança moderada na probabilidade pré-teste de doença (RP negativa menor que 0.10 seria uma grande mudança).
Testes com RP negativa moderada são utéis
para afastar doença em pacientes com probabilidade pré-teste até intermediária.
E foi exatamente isto que aconteceu neste trabalho. A probabilidade pré-teste
de doença, estimada pelos critérios de Diamond-Forrester, foi de 32% no grupo
com escore negativo e 54% no grupo com escore positivo (probabilidades
intermediárias). Desta forma, se o teste for negativo, vamos aplicar uma RP
negativa de 0.19 a uma probabilidade pré-teste moderada. Isto é suficiente para
reduzir a probabilidade de doença para valores bem baixos. É suficiente para
nos deixar em uma zona de conforto. Na mesma zona de conforto que qualquer
outro método não invasivo nos deixaria.
Probabilidade pós-teste é o mesmo que valor
preditivo. Neste caso, os autores relatam que o valor preditivo negativo do
escore de cálcio foi de 96% para afastar estenose > 50% (ou seja, sobra
apenas 4% de probabilidade de doença).
Na verdade, o escore de cálcio é um bom
teste para reduzir a probabilidade de doença. Se quisermos tanta certeza para
afastar a doença, apenas o cateterismo (que é definido como padrão-ouro) faria
melhor. Nenhum outro método não invasivo faria melhor.
Vamos imaginar um homem de 50 anos, que
dá entrada no setor de emergência com dor torácica de características intermediária.
Digamos uma dor atípica, porém não atípica o suficiente para termos segurança
de liberar este paciente. Eletrocardiograma normal, troponina negativa. De
acordo com critérios de Diamond-Forrester, este paciente tem 22% de probabilidade
pré-teste de doença obstrutiva. Se fizer um escore de cálcio zero, aplicando a
RP negativa de 0.19, este indivíduo passa a ter apenas 5% de probabilidade de
doença obstrutiva (como calculei? acabo de usar o Medcalc do meu Iphone – categoria
evidence-based medicine – post-test probability). Assim, ele pode ser liberado.
A coisa ainda fica melhor se
considerarmos os resultados do trabalho relativos a estenose > 70% como
definição de doença obstrutiva. Neste caso, a sensibilidade do escore de cálcio
sobe para 92%, a razão de probabilidade negativa passa para 0.15 e o valor
preditivo negativo (nessa amostra de probabilidade intermediária) para
99%.
Metade dos pacientes deste estudo tiveram
escore de cálcio zero. E neste caso, a probabilidade de estenose > 50% cai
para 4% e > 70% cai para 1%. Então
como rejeitar o valor deste método em pacientes de probabilidade baixa ou
intermediária?
Um possível argumento contra a minha
idéia é o de que não queremos perder a detecção destes 4% dos pacientes (ou 1%
dos pacientes com placa > 70%), pois doença coronária é um problema grave.
Mas então, como fazer para melhorar ainda mais a sensibilidade, o que levaria a
uma melhora na RP negativa e finalmente a um valor preditivo negativo ainda
melhor? Faríamos um angiotomografia de coronária?
Qual a acurácia da angiotomografia de
coronária mesmo? Vamos utilizar o CORE-64, principal estudo desta área,
publicado no NEJM: a sensibilidade é 83%, especificidade 91%, razão de
probabilidade negativa de 0.19. Isto mesmo, 0.19, exatemente a mesma RP negativa do escore de
cálcio igual a zero. Por isso, o valor
preditivo negativo da angiotomografia de coronária no CORE-64 foi 81%, também
não afasta a doença. Ou seja, uma vez que o resultado seja negativo,
angiotomografia de coronária não é melhor que escore de cálcio coronário para
afastar a doença. Se quisermos certeza mesmo da ausência de doença, deveríamos solicitar cateterismo cardíaco para todo mundo. Porém isso não faz sentido, usar o raciocínio diagnóstico probabilístico faz mais sentido, claro.
Devemos
reconhecer que o resultado da angiotomografia identifica um maior número de
pacientes sem a doença (especificidade). Este
pode ser um argumento válido a favor da angiotomografia. Mas o argumento de que o
escore de cálcio zero não afasta doença é errado, pois ele não afasta
exatamente da mesma forma que a angiotomografia não afasta.
Aí surge um novo problema do
estudo em questão. Diferente dos estudos
prévios (por exemplo, Gotllieb et al, JACC 2010), o estudo que discutimos hoje não utilizou o
cateterismo como padrão de referência para avaliar a acurácia do escore de
cálcio. Utilizou a angiotomografia de coronária, a qual não tem melhor
sensibilidade do que o escore de cálcio (apesar de ter melhor especificidade).
É como uma aluno mediano corrigir a prova de outro aluno mediano (no que diz
respeito à sensibilidade). Desta forma, há um problema de veracidade,
relacionado à escolha do padrão de referência. Como já comentamos, este é um
dos principais ítens da análise de veracidade: qualidade do padrão de
referência.
Em resumo, o que precisamos entender é
que nenhum método não invasivo afasta a doença coronária obstrutiva. Neste caso,
o que temos que procurar é o raciocínio probabilístico e não o pensamento determinístico.
O raciocínio probabilístico promove a interação do quadro clínico com o
resultado de um exame, nos oferecendo uma probabilidade de doença final que nos
deixa confortáveis para tomar uma decisão.
Na verdade, o artigo em questão vai ao encontro das evidências que mostram ser o escore de cálcio um método aceitável para afastar doença coronária em pacientes com probabilidade pré-teste baixa ou intermediária. Não vai de encontro, tal como tentam sugerir os autores.
* Um melhor entendimento desta discussão ocorre após revisão das série de postagens Análise Crítica de Métodos Diagnósticos.
* Um melhor entendimento desta discussão ocorre após revisão das série de postagens Análise Crítica de Métodos Diagnósticos.
sábado, 5 de novembro de 2011
Ensaio sobre o Pensamento Lógico - Quarto Princípio da MBE
Após ter discutido na postagem
anterior os três mais básicos princípios da medicina baseada em evidências.
Hoje discutiremos o quarto princípio: plausibilidade
biológica não garante benefício clínico.
É função da mente humana fazer conexões
lógicas de causa-efeito, um dos principais determinantes de nossa evolução
intelectual. René Descartes foi o filósofo que melhor organizou o pensamento lógico
e acreditava ser este suficiente para que o homem dominasse o conhecimento de
todas as leis que regem o universo. Este é o paradigma científico cartesiano. Na
verdade, muito antes de Descartes, desde que o homem é homem, a lógica tem sido
essencial, até mesmo para nossa sobrevivência: como não sou pássaro, não devo
pular do despenhadeiro, pois vou morrer.
Assim, são tão numerosos os exemplos
onde a lógica é extremamente plausível, que a utilização deste tipo de
pensamento se torna de grande utilidade no cotidiano. Estou muito cansado, devo
dormir mais cedo hoje, mesmo que ninguém tenha feito um ensaio clínico
randomizado para avaliar o efeito terapêutico do sono.
É exatamente pela grande
utilidade e freqüente acurácia do pensamento lógico em suas funções mais
básicas, que o homem se condicionou a utilizar tanto a lógica. O problema surge
quando extrapolamos a crença no pensamento lógico das funções mais básicas para
funções mais complexas. Assim como há inúmeras situações (básicas) em que a
plausibilidade prevalecerá, há inúmeras situações (complexas) onde plausibilidade
é diferente da realidade. E isto é muito comum quando estamos lidando com
sistemas complexos, onde um desfecho é decorrência de uma multiplicidade de
causas, que interagem entre si, tornando impossível prever o que acontecerá com
base no pensamento cartesiano. O sistema biológico é dos mais complexos, por isto que em medicina a lógica é apenas o início da história. Pensem, por exemplo, na complexidade do sistema
inflamatório, o número de tipos celulares e citocinas envolvidas do processo.
Em medicina, são inúmeros os
exemplos nos quais a lógica é diferente da realidade. É só revisar um pouco as
postagens deste Blog, todo dia surgem evidências frustrando hipóteses lógicas e
nos lembrando deste Princípio 4.
Existe algo mais lógico do que
inotrópicos positivos serem benéficos para pacientes com insuficiência cardíaca
devido a disfunção sistólica do ventrículo esquerdo. Apesar da forte lógica,
sabemos que potentes inotrópicos tendem a ser maléficos no longo prazo
(Vernarinone) e digitálicos são apenas medicações sintomáticas, os quais não
reduzem mortalidade. No outro extremo, existe algo mais lógico do que drogas
inotrópicas negativas serem prejudiciais para este tipo de paciente? No
entanto, há uns 15 anos se descobriu que beta-bloqueadores são altamente
benéficos nesta situação, um dos mais eficazes prolongadores da vida destes
pacientes. Este é um exemplo de total inversão da lógica: inotrópicos positivos
maléficos e inotrópicos negativos benéficos. Hoje ninguém duvida disso, pois
temos evidências científicas consistentes.
Desta forma, em medicina a
palavra final não deve ser a lógica ou a plausibilidade. A lógica serve para criar
hipóteses, que devem ser testadas experimentalmente antes de aplicadas na
prática clínica. Até a comprovação científica, tudo fica no terreno da
especulação e deve prevalecer a hipótese nula (Princípio 2). A exceção de
situações de plausibilidade extrema, onde a terapia deve ser adotada de pronto,
antes de qualquer evidência científica (Princípio 3). Por exemplo, uso de
corticóide em certas doenças inflamatórias, uso de insulina em diabéticos tipo I ,
uso de diuréticos em insuficiência cardíaca.Nada disso necessita de ensaios
clínicos randomizados para sabermos que a terapia é melhor que placebo.
Portanto, devemos distinguir em que situações utilizar o Princípio 2 ou o
Princípio 3. Mas percebam que o Princípio 3 são exceções.
Escrevendo assim parece até o
mais óbvio dos pensamentos. Porém é impressionante a freqüência com que este
óbvio é violado. Até inventaram o termo plausibilidade moderada, o qual serve
para que cada um proponha o que quiser, baseado na sua própria lógica (na
lógica do desejo). O grande problema de se basear em plausibilidade menor que
extrema é a grande incerteza do quanto isto corresponde à realidade. A lógica
do benefício pode terminar na adoção de uma conduta deletéria (que pensávamos
ser benéfica), ou uma conduta nova que é menos benéfica do que o usual (um
anti-hipertensivo novo, mais caro, da moda, mas sem evidência), ou uma conduta
sem benefício (porém que gere custos, desconforto ou expectativa falsa).
Em cardiologia, um dos maiores
exemplos é a lógica do desentupimento de artérias. Artigo recente no JAMA demonstrou
nos Estados Unidos apenas 50% das indicações de angioplastias coronárias eletivas
são consideradas apropriadas. Minha observação não científica sugere que o
Brasil não é muito diferente disso (talvez até pior). Desentupimos coronárias
de pacientes assintomáticos, com boa função ventricular; desentupimos
coronárias ocluídas que antes irrigavam músculos hoje totalmente necrosados por
um infarto transmural que ocorreu há mais de um dia. Tudo isso se faz a
despeito da comprovação científica da ausência de benefício. Estes são exemplos
que sofrem da tal plausibilidade moderada. Se formos analisar cuidadosamente, há
forte plausibilidade para se rejeitar de pronto o benefício de uma angioplastia
em uma artéria que irriga um músculo morto. Mas quando se tolera qualquer nível
de plausibilidade, pensamentos mais básicos podem prevalecer sobre pensamentos
mais criteriosos. Neste caso, prevalece a plausibilidade do encanador, ou seja,
de desentupir o que está entupido (a lógica do desejo, o desejo de fazer a angioplastia). Este é um bom exemplo
do que o oba-oba da plausibilidade promove.
Muitas vezes alunos criteriosos
me perguntam se não seria antiético deixar de oferecer terapias apenas porque
não há comprovação. Seria sim, na situação de plausibilidade extrema. Mas fora
disso, mesmo que haja certa possibilidade da conduta ser benéfica, devemos
esperar. Já pensou se começássemos a fazer tudo que tem alguma possibilidade de
ser benéfico. São inúmeras (talvez infinitas) as idéias que podemos ter
baseadas em plausibilidade. Faríamos todas? Seria antiético deixar de fazer
alguma? Eu posso gerar a hipótese de que corticóide é benéfico nos
pós-operatório de cirurgia cardíaca. Faz sentido? Se tiver uns conflitos de
interesse envolvidos ou se eu for um daqueles figurões que praticam medicina
baseada em eloquência, a idéia pode pegar. Assim como pegou a idéia de fazer
amlodipina no pós-operatório de cirurgia cardíaca. Cirurgiões me ajudem,
existem ensaios clínicos de qualidade dando suporte a esta conduta, a qual pode
causar hipotensão e fechamento precoce de enxertos?
Não podemos nos dar o luxo de
aceitar um sistema caótico no qual cada uma faz o que faz baseado em sua
própria lógica ou na lógica de outrem. Em medicina o sistema é complexo,
devemos abandonar nosso Complexo de Deus e aceitar que nossa mente não é capaz
de prever o resultado exato das intervenções. Plausibilidade
biológica, pensamento fisiopatológico, raciocínio farmacológico servem para se
gerar idéias, para inventar novas drogas e devices.
Mas estas idéias devem ser testadas cientificamente.
O paradigma cartesiano tem sua
utilidade, porém em medicina o pensamento não determinístico representa um
estágio evolutivo maior. Qual o estágio evolutivo que você prefere utilizar no
seu cotidiano médico?
* Esta é a segunda postagem da
série Os Sete Princípios da Medicina Baseada em Evidências.
quinta-feira, 27 de outubro de 2011
Estudo PROTECT: Medida de BNP protege indivíduos com insuficiência cardíaca?
A figura acima foi escolhida para ilustrar a discussão que teremos em relação ao estudo PROTECT. Pretendo demonstrar porque em ciência, água mole não deve perfurar a pedra dura. Isto diz respeito à importância de desfechos duros e moles na veracidade e relevância da informação científica.
Embora ensaios clínicos randomizados sejam
mais utilizados para testar eficácia de terapias, este tipo de desenho também tem
sido proposto como melhor nível de evidência na validação de biomarcadores. Ou
seja, biomarcadores (plasmáticos ou métodos de imagem) devem ser também
eficazes, sua utilização deve beneficiar os pacientes.
No último número do Journal of the American College of Cardiology foi publicado o ensaio clínico randomizado PROTECT, que testa a eficácia do NT-pro-BNP na condução
ambulatorial de pacientes com insuficiência cardíaca. Pro-BNP é um peptídeo
sintetizado pelo ventrículo quanto há estresse de
parede, ou seja, descompensação da insuficiência cardíaca. O pro-BNP é quebrado
em BNP (ativo) e NT-pro-BNP. Ambos podem ser medidos como marcadores de
insuficiência cardíaca descompensada. As medidas destas substâncias no plasma podem servir de guia para o ajuste da dose de diuréticos e vasodilatadores, teoricamente aprimorando a qualidade do tratamento. Faz sentido.
Inicialmente me entusiasmei
com a notícia deste trabalho. Primeiro porque gosto de ver ensaios clínicos
randomizados sendo usados para exames diagnósticos ou prognósticos. Isso é uma
evolução científica. Segundo, porque nas notícias se relatava um NNT (número
necessário a tratar ou testar) de apenas 5 pacientes para prevenção de um
evento cardiovascular. Um NNT raramente visto em ensaios clínicos, sugerindo
grande impacto da estratégia de utilização do BNP na prática clínica.
Mas não podemos ficar com
notícias de sites médicos ou de congressos. Precisamos ler os artigos na
íntegra, julgando-os criticamente.
O trabalho em questão
randomizou 150 pacientes para duas estratégias de condução ambulatorial: dosagens de NT-pro-BNP para ajuste da terapia versus terapia usual (sem BNP). Ao cabo de 1 ano, apenas 28% do grupo NT-pro-BNP apresentou um evento cardiovascular,
comparado a 48% do grupo tratamento padrão. NNT = 100 / (redução absoluta do
risco = 48 – 28) = 5. De acordo com este número, uma terapia que traz um grande benefício. Lembrem-se que o NNT < 25 para eventos combinados representa uma terapia de grande impacto.
Mas a primeira lição deste
exemplo é que não devemos apenas analisar o NNT numérico, devemos analisar a
qualidade dos desfechos que são utilizados para computar o NNT. Normalmente os
estudos de insuficiência cardíaca utilizam reinternamento e/ou morte como
desfechos. No estudo PROTECT, foi utilizado um combinado de desfechos: morte,
reinternamento, síndrome coronariana aguda, arritmia, isquemia cerebral e um
sexto desfecho, bastante subjetivo, definido como piora da insuficiência
cardíaca (sem necessitar internamento). Este desfecho subjetivo foi responsável por
metade dos eventos registrados pelo estudo, sendo o mais frequente de todos.
Neste momento, precisamos discutir
a diferença de desfecho duro (hard em inglês) para
desfecho mole (soft em inglês) - estes termos em português me soam estranhos, prefiro as palavras equivalentes em inglês. Um desfecho duro tem duas características: ser clinicamente relevante e ser muito objetivo, ou
seja, pouco sujeito a interpretações. Percebam que morte é o desfecho mais duro que existe: grave e objetivo, não
há controvérsia se houve morte ou não. Fazendo uma escala decrescente de
importância dos desfechos em insuficiência cardíaca, vem em segundo lugar o
reinternamento, menos grave que morte, porém bastante objetivo. Por outro lado,
o desfecho piora da insuficiência cardíaca sem requerer internamento é
altamente subjetivo e pouco grave. É bastante mole. E quase nunca usado em estudos deste tipo.
Esta subjetividade se torna
mais problemática quando combinada com outra característica inerente deste tipo
de estudo: seu caráter aberto, onde o
paciente e o médico estão cientes da estratégia utilizada. Desta forma, o
paciente pode se sentir mais seguro com a estratégia do NT-pro-BNP e relatar menos
piora da insuficiência cardíaca, assim como o médico pode ser induzido a
registrar menos este desfecho no grupo NT-pro-BNP, pela simples percepção de um
paciente melhor tratado.
Ou seja, neste caso temos um
viés de mensuração do desfecho, que pode promover um resultado falso. É
uma combinação perigosa: um estudo aberto associado a um desfecho muito mole.
Além disso, este é um estudo
truncado. Foi planejado para randomizar 300 pacientes, mas quando alcançou
significância estatística, foi interrompido, com apenas 150 pacientes - aquele vício de interromper o estudo assim que a coisa fica boa. Como já
comentamos neste Blog, estudos truncados são menos precisos.
Só para comprovar que
provavelmente a informação do estudo PROTECT é falsa, há um ano foi publicado
na mesma revista o ensaio clínico
PRIMA, que randomizou mais que o dobro de pacientes do PROTECT, considerando apenas reinternamento como desfecho. Este estudo não demonstrou benefício da estratégia do uso de NT-pro-BNP.
Desta forma, após uma análise
criteriosa, podemos afirmar que a hipótese nula (princípio 2) do NT-pro-BNP não foi rejeitada. Este
estudo tem uma boa possibilidade de estar nos mostrando um resultado incorreto. E na vigência de estudos de
melhor qualidade sendo negativos, o uso rotineiro do NT-pro-BNP na condução de
pacientes ambulatoriais com insuficiência cardíaca não deve ser implementado.
Um detalhe. A Roche é a fabricant deste NT-pro-BNP. Veja a
declaração de conflitos de interesse do PROTECT: This study was supported in part by Roche Diagnostics, Inc. Dr. Januzzi
has received research grants and consultancy fees from Roche Diagnostics, Inc.,
Siemens Diagnostics, and Critical Diagnostics; and has received speakers fees
from Roche Diagnostics, Inc. and Siemens Diagnostics.
Por
outro lado, o estudo PRIMA é financiado prioritariamente por um orgão
governamental e apenas segundariamente pela indústria: Main funding (€200,000) for this study was
provided by the Netherlands Heart Foundation, Netherlands Organisation for
Scientific Research (NWO), and the Royal Nether- lands Academy of Arts and
Sciences (KNAW)–Interuniversity Cardiology Institute of the Netherlands. Minor
funding of an unrestricted research grant (€70,000 per sponsor) was
provided by Pfizer, AstraZeneca, Medtronic, and Roche Diagnostics.
Não sejamos ingênuos. Argumentos moles não devem ser
suficientes. Em ciência, água mole não
deve furar a pedra dura.
Fica o exemplo de uma perigosa
combinação: um estudo aberto avaliando um desfecho mole. Pior ainda quando
tudo isso é aliado a conflitos de interesse.
sábado, 22 de outubro de 2011
domingo, 16 de outubro de 2011
Princípios da Medicina Baseada em Evidências
Ao longo destes dois anos de Blog, 137 postagens, temos realizado análise de relevantes publicações científicas, utilizando conceitos de medicina baseada em evidências. Nesta postagem, descreverei os conceitos que devem nortear a formação de opinião a respeito de determinada evidência. Chamo isso dos Sete Princípios da Medicina Baseada em Evidências.
Gosto de chamar de princípios, pois assim nos remetemos aos princípios humanos universais
que devem (ou deveriam) nortear os indivíduos no comportamento social e pessoal. Por exemplo, ninguém discorda do princípio da honestidade. Ele
simplesmente existe e em momento de decisão, idealmente deve nos
influenciar. Assim deve funcionar com medicina, princípios devem
nortear nossa decisão clínica baseada em evidências.
Ao contrários de princípios humanos que
fazem parte do inconsciente coletivo e são intuitivos, os princípios médico-científicos são absorvidos pelo entendimento profundo do sistema biológico (sistema
complexo, imprevisível) e da metodologia científica. Muitas vezes a falta de
entendimento destes princípios fazem com que uma evidência científica seja
encarada de forma inadaquada ou até mesmo a própria existência da medicina baseada em evidências seja
interpretada de forma equivocada.
Mas porque sete princípios? Não sei, simplesmente ao organizar
meu pensamento, vieram sete princípios mais importantes em minha mente. Se o número sete tem algum significado
adicional, não sei. Uma rápida pesquisa no Google me lembrou que sete são as
notas musicais, as cores do arco-iris, os dias da semana, os pecados capitais e ainda tem escrito
que sete é o número da perfeição de acordo com a Bíblia. Interessante ...
Nesta postagem falaremos dos três
primeiros princípios.
Princípio 1: O Nível de Evidência – Toda
evidência deve passar por uma análise crítica, que indique qual o grau de
veracidade e relevância da informação. A depender desta análise, chegamos à
conclusão de que o nível de evidência é suficiente para (1) modificar nossa
conduta, (2) apenas para gerar uma hipótese, ou (3) não serve para nada. Já
ouvi algumas pessoas dizerem: “a maioria das evidências não é verdadeira,
portanto não podemos fazer medicina baseada em evidências.” Percebam o
equívoco. Medicina baseada em evidências existe exatamente para nos trazer
ferramentas que resolvam esta questão, separando o joio do trigo, identificando
dentre uma infinidade de publicações, quais as evidências modificadoras de
conduta. A depender do objetivo do trabalho científico (avaliar eficácia de
terapia, acurácia de método diagnóstico ou valor prognóstico de marcadores de
risco), há diferentes aspectos a serem analisados no artigo científico,
aspectos estes que procuramos descrever neste Blog. Médicos precisam desenvolver conhecimento metodológico para analisar evidências. Assim como
treinamos exame clínico, precisamos treinar exame de evidências.
Assim, o termo medicina baseada em evidências na verdade quer dizer medicina baseada em evidências científicas de qualidade. Parece uma coisa óbvia, porém percebo que muitos
esquecem deste princípio básico.
Princípio 2: A Hipótese Nula – Este é
princípio se aplica a ciência em geral. Um fenômeno não deve ser considerado
verdadeiro antes de sua demonstração. O conhecimento científico se constrói com
base na demonstração da veracidade de um fenômeno. Desta forma, a premissa
básica é a hipótese nula, que indica que o fenômeno não é verdadeiro. De posse
desta premissa, o cientista realiza experimentos (estudos metodologicamente
adequados) que se demonstrarem forte grau de evidência positiva, a hipótese
nula é rejeitada e ficamos com a hipótese da existência do fenômeno (hipótese alternativa).
Se formos refletir um pouco, perceberemos que é assim que pensamos no cotidiano. Por exemplo, a maioria não acredita em disco voador. Por que não acreditar? Porque simplesmente a hipótese nula é a premissa básica, ou seja, não existe disco voador. No dia em que alguém demonstrar um forte nível de evidência a este respeito, passaremos a acreditar. Muitos dizem que acreditam em horóscopo. Mas no fundo não acreditam, usam isso apenas como uma atividade lúdica. Digo que não acreditam pois a maioria não norteia as decisões críticas de sua vida baseada nessas coisas. na hora do vamos ver, não é ao horóscopo que as pessoas recorrem. Celular causa câncer de cérebro? A maioria das pessoas acredita que não, pois todo mundo está usando celular. Isto porque a hipótese nula deve prevalecer, até que se prove o contrário.
Se formos refletir um pouco, perceberemos que é assim que pensamos no cotidiano. Por exemplo, a maioria não acredita em disco voador. Por que não acreditar? Porque simplesmente a hipótese nula é a premissa básica, ou seja, não existe disco voador. No dia em que alguém demonstrar um forte nível de evidência a este respeito, passaremos a acreditar. Muitos dizem que acreditam em horóscopo. Mas no fundo não acreditam, usam isso apenas como uma atividade lúdica. Digo que não acreditam pois a maioria não norteia as decisões críticas de sua vida baseada nessas coisas. na hora do vamos ver, não é ao horóscopo que as pessoas recorrem. Celular causa câncer de cérebro? A maioria das pessoas acredita que não, pois todo mundo está usando celular. Isto porque a hipótese nula deve prevalecer, até que se prove o contrário.
Embora estes exemplos indiquem que
intuitivamente norteamos nossas vidas pelo princípio da hipótese nula,
paradoxalmente este princípio é violado com frequência em medicina. É a
violação deste princípio que faz os médicos adotarem condutas sem evidências
científica de eficácia ou segurança, o que pode prejudicar seus pacientes de diversas formas; ou prejudicar o sistema de saúde; ou distorcer a forma como o conhecimento científico deve ser acumulado.
Com muita frequência, evidências subsequentes demonstram que aquela conduta não deveria ter sido adotada, pois não é benéfica e às vezes é até maléfica. Um grande exemplo foi a adoção da terapia de reposição hormonal na década de 90 para prevenção cardiovascular. Como não havia evidências definitivas (apenas de estudos observacionais), deveríamos ter ficado com a hipótese nula. Ensaios clínicos randomizados subsequentes indicaram exatamente o contrário, ou seja, esta terapia aumenta o risco cardiovascular. Assim ocorre com frequência quando a indústria farmacêutica convence médicos a prescreverem novas drogas baseadas apenas em evidências de desfechos substitutos. Os médicos prescrevem e depois a droga é suspensa do mercado, pois evidências subsequentes mostram que a terapia aumenta a incidência de desfechos clínicos indesejados. São tantos os exemplos, é só revisar um pouco nossas postagens.
Com muita frequência, evidências subsequentes demonstram que aquela conduta não deveria ter sido adotada, pois não é benéfica e às vezes é até maléfica. Um grande exemplo foi a adoção da terapia de reposição hormonal na década de 90 para prevenção cardiovascular. Como não havia evidências definitivas (apenas de estudos observacionais), deveríamos ter ficado com a hipótese nula. Ensaios clínicos randomizados subsequentes indicaram exatamente o contrário, ou seja, esta terapia aumenta o risco cardiovascular. Assim ocorre com frequência quando a indústria farmacêutica convence médicos a prescreverem novas drogas baseadas apenas em evidências de desfechos substitutos. Os médicos prescrevem e depois a droga é suspensa do mercado, pois evidências subsequentes mostram que a terapia aumenta a incidência de desfechos clínicos indesejados. São tantos os exemplos, é só revisar um pouco nossas postagens.
Com procedimentos isto também é
frequente. Um bom exemplo é o hábito (ou melhor, vício) de realizar angioplastia da artéria ocluída no
infarto tardio. Para que abrir uma artéria que irriga um músculo já todo
necrosado? Bem, isso virou hábito (ou melhor, vício), representando mais uma violação da hipótese nula. Anos
depois, foi publicado o ensaio clínico OAT, desenhado para rejeitar a hipótese
nula e demonstrar que a angioplastia seria benéfica. No entanto, o estudo OAT
demonstrou que não há benefício deste procedimento. Porém os entusiastas
continuam violando este princípio, pois ainda ouvimos o argumento de que o "OAT
não é um estudo suficiente para rejeitar a hipótese de que a angioplastia é
benéfica".
Percebem a inversão de valores? Na
verdade, precisamos provar que algo é bom para que seja adotado, e não provar que
é ruim para que não seja adotado. O ônus da prova está na
existência do fenômeno.
Ouço também as pessoas afirmarem que o conhecimento médico muda muito rapidamente, e isto decorre da evolução científica. Hoje pensamos de um jeito, amanhã de outro. Em grande parte, estas mudanças decorrem do fato de que idéias pouco substanciadas são consideradas verdadeiras de forma precipitada. Estas podem ser posteriormente derrubadas por evidências.
Ouço também as pessoas afirmarem que o conhecimento médico muda muito rapidamente, e isto decorre da evolução científica. Hoje pensamos de um jeito, amanhã de outro. Em grande parte, estas mudanças decorrem do fato de que idéias pouco substanciadas são consideradas verdadeiras de forma precipitada. Estas podem ser posteriormente derrubadas por evidências.
Princípio 3: O Paradigma do Para-quedas –
este representa as exceções ao Princípio 2. Na vigência de plausibilidade
extrema, devemos acreditar no fenômeno ou adotar uma conduta médica,
independente de demonstração científica. Para entender o que é plausibilidade
extrema, utilizamos o paradigma do para-quedas. Percebam que para-quedas
representa uma conduta utilizada para reduzir a mortalidade de pessoas que
pulam de uma avião. Neste caso é tão plausível que o para-quedas vai prevenir a
morte, que não se realizou um ensaio clínico randomizado (para-quedas vs. placebo) para comparar o desfecho
morte entre os dois grupos. Seria até anti-ético.
Em medicina, toracotomia em indivíduos
baseado no tórax, drenagem de certos abcessos, marca-passo no bloqueio AV total com
frequência cardíaca muito baixa, troca valvar em jovem com estenose aórtica
crítica, sintomático. Estas são condutas corretamente adotadas sem ensaio clínico
randomizado.
Por outro lado, precisamos ter cuidado com a banalização deste paradigma. Percebo às vezes argumento a favor do uso de condutas, baseada em alguma plausibilidade. Não é isso, plausibilidade extrema é aquilo que se assemelha ao exemplo do para-quedas, algo que indubitavelmente deve ser feito. Algo que seria enti-ético deixar de fazer.
Por outro lado, precisamos ter cuidado com a banalização deste paradigma. Percebo às vezes argumento a favor do uso de condutas, baseada em alguma plausibilidade. Não é isso, plausibilidade extrema é aquilo que se assemelha ao exemplo do para-quedas, algo que indubitavelmente deve ser feito. Algo que seria enti-ético deixar de fazer.
É um risco fazermos algo apenas beseado em
plausibilidade menor que extrema. Estamos repletos de exemplos em medicina de
que isto não dá muito certo. A terapia de reposição hormonal tinha uma certa
plausibilidade de ser benéfica; antiarrítmicos que antes se acreditava prevenir morte súbita, depois demonstraram aumentar morte súbita; drogas inotrópicas positivas
(vesnarrinone) são maléficas em pacientes com insuficiência cardíaca, apenas de
parecer bom aumentar a contratilidade. E por aí vai, os exemplos são inúmeros.
Mas quando nos deparamos com
plausibilidade extrema, aí não temos dúvida, devemos adotar a conduta. E esse
julgamento que torna a medicina baseada em evidências interessante, pois cabe sempre
ao médico dissernir em que situação ela está: plausibilidade extrema ou não?
Percebam que fica mais fácil decidir baseado em princípios do
que baseado em emoção, interesses ou coisas do tipo. Na dúvida, devemos
recorrer aos princípios e a conclusão parece vir naturalmente. Assim termos norteado as postagens deste Blog.
Na postagem seguinte, apresentaremos os quatro demais princípios. Por enquanto, deixo a reflexão de que o conhecimento médico-científico deve ser construído por evidências de qualidade (Princípio 1), que sejam suficientes para rejeitar a hipótese nula (Princípio 2), exceto em situações de plausibilidade extrema (Princípio 3).
Parece óbvio, não? Mas o problema é que o absurdo frequentemente prevalece sobre o óbvio.
Na postagem seguinte, apresentaremos os quatro demais princípios. Por enquanto, deixo a reflexão de que o conhecimento médico-científico deve ser construído por evidências de qualidade (Princípio 1), que sejam suficientes para rejeitar a hipótese nula (Princípio 2), exceto em situações de plausibilidade extrema (Princípio 3).
Parece óbvio, não? Mas o problema é que o absurdo frequentemente prevalece sobre o óbvio.
quinta-feira, 6 de outubro de 2011
sexta-feira, 30 de setembro de 2011
Queremos realmente transformar troponina em D-dímero?
Há 1 semana foi publicado no Jounal
of American College of Cardiology o artigo intitulado Rapid Exclusion of Acute Myocardial Infarction in Patients with Undetectable Troponin using a High-sensitivity Assay. A análise e interpretação dos dados por parte dos
autores provoca uma interessante discussão sobre a interpretação dos
componentes da acurácia e utilidade de certas propostas diagnósticas.
Nos últimos anos, a indústria tem aprimorado a capacidade dos ensaios de troponina em detectar mínimas
concentrações desta proteína plasmática e com maior precisão
(reprodutibilidade). Estas são as chamadas troponinas de alta sensibilidade.
Nesta coorte de 703 indivíduos com dor torácica aguda,
Body R. et al demonstraram que o uso de um ensaio de troponina alta
sensibilidade associado a um ponto de corte mais baixo que o habitual (qualquer
nível detectável seria definido como troponina positiva) produz 100% de
sensibilidade para o reconhecimento de infarto do miocárdio, levando a um valor preditivo
negativo perfeito. Assim, os autores concluíram que "esta estratégia pode
ser usada para reduzir as internações desnecessárias".
É exatamente esta frase que pretendo analisar sob
a ótica da metodologia de avaliação de métodos diagnósticos.
Em primeiro lugar, a fim de reduzir o número de pacientes
desnecessariamente internados no hospital, um teste deve ter uma melhor
capacidade de reconhecer indivíduos saudáveis que podem receber alta. A
capacidade de reconhecer as pessoas saudáveis é definida como especificidade. Ao reduzir o ponto de
corte de qualquer teste diagnóstico, ocorre um aumento de sensibilidade, à
custa de redução na especificidade.
E foi exatamente isso que aconteceu quando os autores compararam o
desempenho da troponina de alta sensibilidade associada ao mínimo ponto de
corte, com a referência da troponina tradicional. Houve um aumento da
sensibilidade de 85% para 100%. No entanto, ocorreu também diminuição na
especificidade de 82% para 34%. E uma
vez que um número menor de pessoas saudáveis serão identificados, é altamente
questionável se esta abordagem realmente reduz internações desnecessárias. Mesmo
que diferentes pontos de corte sejam adotadas para diagnosticar e afastar infarto,
uma zona cinzenta de confusão será criada, levando a uma dúvida considerável se
realmente esta abordagem seria útil na prática clínica.
Desta forma, apenas 28% dos pacientes apresentaram troponina negativa. O problema é que o estudo não relatou quantos destes 28% realmente receberem alta hospitalar logo após o resultado da troponina. Destes
pacientes, alguns poderiam ter dor no peito muito típica, caracterizando angina
instável; alguns poderiam ter alterações isquêmicas do ECG; e outros poderiam
ter outra causa grave de dor torácica que impediria a alta. Portanto, uma
troponina negativa não significa necessariamente alta hospitalar. E o número
real de pacientes em que o resultado ajudou na decisão de alta não está claro
no artigo.
Segundo a Definição Universal de Infarto, devemos
considerar o percentil 99 da troponina como o ponto de corte para este diagnóstico,
o que proporciona boa acurácia diagnóstica (sensibilidade 85% e especificidade
82%, segundo o artigo de Body et al). Antes
de trocar esta boa acurácia da definição universal de infarto, por uma maior
sensibilidade à custa de bem menor especificidade (semelhante ao D-dímero para embolia pulmonar),
evidências científicas convincentes devem ser apresentadas. Por enquanto, não
está demonstrado, nem é plausível, que uma significativa redução de
especificidade (detecção de saudáveis) proporcione maior liberação precoce de
pacientes com dor torácica. Pelo contrário, isso poderá provocar maior número
de internamentos desnecessários.
O D-dímero é um teste que intrinsecamente não tem especificidade. Não há outra alternativa,
ele só pode nos oferecer sensibilidade. Mas a troponina é diferente. Este teste
tem tanto sensibilidade como especificidade. Não parece fazer tanto sentido
transformar a troponina em D-dímero.
Talvez faça sentido para a indústria da troponina de alta sensibilidade. É a briga
intensa pelo mercado de dosagens bioquímicas.
Cuidado com algo muito sensível, pode ser pouco específico.
Cuidado com algo muito específico, pode ser pouco sensível. Nem sempre vale a pena trocar o equilíbrio da sensibilidade e especificidade (crossover no gráfico acima), pela priorização de alguma destas propriedades.
quinta-feira, 22 de setembro de 2011
Ensaio sobre Conflitos de Interesse
De acordo com a enciclopédia Wikipedia, conflito de interesse é um termo que se aplica quando um indivíduo (ou organização) tem envolvimento com múltiplos interesses, de forma que um interesse pode corromper a motivação pelo outro interesse.
Conflito de
interesse é
um fenômeno intrínseco na natureza, todos nós lidamos com isso, a toda hora.
Alguém pode ter interesse em perder peso, porém ao mesmo tempo tem interesse em
se divertir tomando um sorvete. Claro que o interesse na diversão vai prejudicar
a meta de perda de peso.
O conflito de interesse começa a se
tornar algo mais sério quando envolve situações profissionais. Recentemente Palocci perdeu seu cargo de Ministro da Casa Civil, pois seu forte envolvimento
prévio (no sentido monetário) com empresas privadas poderia influenciar suas
ações públicas em prol destas empresas. Um advogado não pode representar a
pessoa A contra a pessoa B, se em outro processo o mesmo advogado representa a
pessoa B contra outra pessoa C. Se
o segundo processo for maior que o
primeiro, a pessoa A pode ser mal representada para que B seja favorecido.
Em ciência não poderia ser diferente, conflitos de interesse permeiam diversas
relações. Aqui o primeiro interessado é a verdade
científica. O problema é que diversas vezes a verdade científica é
enviesada devido a outros interesses dos cientistas ou dos formadores de
opinião. É o conflito da verdade científica versus
interesses pessoais.
Há diversos níveis de conflitos de
interesse, vamos analisar de um extremo a outro.
No extremo superior, estão aqueles
formadores de opinião que recebem verba para dar palestas em eventos
organizados pela indústria farmacêutica (ou de equipamentos) ou escrever
boletins informativos em nome da indústria. Nesta situação, é grande a probabilidade
de viés (consciente ou inconsciente) na forma como as coisas são colocadas. Por
outro lado, não vejo grande problema, pois a intenção do evento ou boletim está
explícita, é fazer propaganda. E fazer propaganda não é pecado, principalmente
no mundo capitalista. Nesta situação, cabe aos ouvintes ou leitores julgar
criticamente as informações, separando o que concordamos ou discordamos. Ou
simplesmente fazer o mesmo que fazemos com propaganda política: desligamos a
televisão ou mudamos para o canal da TV fechada. Na prática, significa não se
vender por um jantarzinho da indústria. Ficar em casa estudando pode ser uma idéia
bem melhor. Ou, automaticamente jogar fora aqueles encartes que os
representantes distribuem. Melhor ainda jogar em lixo reciclável.
Assim, resolvemos esta situação.
Inclusive, devo salientar que este tipo de conflito
de interesse de formadores de opinião não pode ser considerado um problema
ético, pois o conflito é declarado. É algo que faz parte do nosso mundo
capitalista. Simplesmente é assim.
O problema é
quando vamos nos distanciando deste extremo e as coisas começam a ficar menos
claras. Por
exemplo, o mesmo palestrante do evento da indústria pode ser convidado por um
evento de sociedade médica para falar de um assunto semelhante. Nestas
situações, os palestrantes devem declarar conflitos antes da aula. Porém, mesmo
que o façam, é difícil definir o grau de influência que o conflito pode estar
tendo no palestrante.
Pior é quando se trata de editoriais
escritos por indivíduos de referência em revistas científicas de respeito. Há
alguns anos, foi publicado o ensaio clínico POISE no Lancet, demonstrando que o
uso de beta-bloqueador iniciado em pré-operatório de cirurgia não cardíaca
aumenta mortalidade. No entanto, o editorial que acompanhou o artigo, escrito
por Poldermans D, defendia a manutenção da prática do
beta-bloqueador. Isso mesmo, sem nem mesmo propor um outro estudo que
utilizasse uma abordagem diferente de uso de beta-bloqueador, o editorialista
sugere que se continue usando, desde que de forma mais cuidadosa. Dias depois
fui ao Congresso Mundial de Cardiologia em Buenos Aires. Estava sem alternativa
para almoçar e aí resolvi pegar uma daquelas caixinhas de comida de simpósio
satélite. Quando entrei na sala para pegar o lanche (reconheço, foi um conflito
de interesse, mas eu estava com fome), percebi que ali estava ele, o mesmo Polderman D, falando em um simpósio satélite sobre uso de beta-bloqueador em
cirurgia não cardíaca. Não resisti, fiz uma pergunta bastante provocativa, o
que o irritou bastante. Percebo que a irritação do speaker é um sinal de que
ele não está plenamente confortável naquele papel.
Há alguns anos foi publicado um editorial favorável ao uso de Levosimedan nos Arquivos Brasileiros de Cardiologia, por um autor suíço. Naquela época
o ensaio clínico Survive já havia
sido publicado, demonstrando ausência de benefício desta droga em pacientes com
insuficiência cardíaca descompensada. Como reação a este editorial fora de
contexto, Flávio Fuchs enviou carta ao editor, chamando atenção sobre as afirmações não embasadas em evidências e mostrando que o autor do editorial havia omitido seus conflitos de interesse na
publicação do estudo.
Sem querer dar uma de puritano, devemos
reconhecer que conflitos de interesse fazem parte de todas as facetas da vida. Cabe a nós sabermos nos proteger. Mas como? Desenvolvendo um senso
crítico e aprimorando nossa capacidade de julgamento da literatura médica,
pelas técnicas da medicina baseada em evidências.
Finalmente, lhes convido a assistir a
brilhante conferência (5 minutos) do psicólogo americano Dan Airely sobre
conflitos de interesse, apresentada durante o evento anual TED, na Califórnia.
Assinar:
Postagens (Atom)