sexta-feira, 30 de abril de 2010

Escores de Risco por Júlio Braga

Não há dúvidas que a utilização de escores de risco é melhor para prever eventos que a estimativa clínica. Dados similares a este já haviam sido publicados (p.ex. Risk scores for risk stratification in acute coronary syndromes: useful but simpler is not necessarily better. European Heart Journal 2007; 28:1072–1078). Entretanto, e para esclarecer os comentários que fiz com Luis Claudio: eu disse nós não temos escores FACILMENTE disponíveis. Afinal por que os médicos usam rapidamente escores como Killip no IAM a classificação de Angina Instável de Braunwald, as Classes Funcionais de IC, etc. Eu creio que porque são FACILMENTE aplicáveis.
Em uma UCO que trabalhei com Luis Cláudio tínhamos o TIMI Risk Score automaticamente preenchido pelo programa de computador após o médico preencher a história clínica. Porém o programa e este recurso foram substituídos por um “Prontuário Informatizado”, que não tinha o mesmo recurso. Para aplicarmos o TIMI que é o mais simples, não necessariamente o melhor, em uma UTI realmente é preciso “convencer” os plantonistas. E para aplicarmos o GRACE ou o PURSUIT? Creio que os sistemas de informática médica poderiam facilitar esta aplicação se não fossem ferramentas voltadas basicamente para as áreas financeiras. E para facilitar a aplicabilidade, estes escores poderiam ser disponibilizados pelos autores dos trabalhos como programas de computador para baixarmos para computadors, smartphones, etc.
Agora outra questão: a melhor estimativa de prognóstico vai ajudar a cuidar melhor de meus pacientes? A informação geral de que os pacientes mais graves são os que mais se beneficiam de estratégias invasivas nem sempre se aplica. Por exemplo, Influence of Renal Function on the Effects of Early Revascularization in Non–ST-Elevation Myocardial Infarction (Circulation 2009; 120:851-858). Creio que ainda falta a evidência de que a aplicação dos melhores escores levem a melhores desfechos. Creio que, embora a estimativa de risco seja melhor com “Escores” isto não necessariamente descarta a importância do julgamento clinico que em um excelente trabalho do brasileiro Whady Hueb et col. (Clinical Judgment and Treatment Options in Stable Multivessel Coronary Artery Disease J Am Coll Cardiol 2006;48: 948–53) foi eficaz em cuidar melhor dos pacientes.
Resumindo, escores de risco são melhores para prever desfechos, mas ainda são difíceis de achar, de aplicar e há dúvidas se são melhores do que o julgamento clinico para definir condutas e beneficiar nossos pacientes. Mas tentarei “convencer” os plantonistas a usar o TIMI Risk...

quinta-feira, 29 de abril de 2010

Escore de Risco: Uma Ferramenta Negligenciada


Publicado esta semana no Archives of Internal Medicine um artigo que avalia a freqüência de utilização de escores de risco na prática clínica de médicos alemães. O artigo mostrou que na maioria das vezes os médicos preferem utilizar as informações clínicas da maneira intuitiva, ao invés de utilizar escores. Alguns motivos são relatados, como a ignorância da existência de um escore, ou a crença de que escore não avaliam bem o risco individual.
Os escores de risco são modelos multivariados desenvolvidos e validados em estudos de coorte, permitindo que marcadores sejam computados conjuntamente, considerando o valor prognóstico ponderado de cada um deles. Há evidências de que os escores de risco possuem acurácia prognóstica e reprodutibilidade superior à impressão clínica de médicos experientes. E é fácil entender a razão: é praticamente impossível computar mentalmente todas as variáveis prognósticas. Por este motivo, os escores representam a forma mais adequada para estimativa de risco.

Contudo, existem algumas dificuldades para a disseminação prática de escores. Primeiramente, o benefício da utilização de escores em geral é pouco reconhecido pelos médicos. É prevalente a crença de que a experiência pessoal e a avaliação intuitiva do risco são insubstituíveis, ou seja, “bons médicos não necessitam de escores de risco”. No entanto, a impressão clínica é sujeita a erros, tais como experiência enviesada, memória prioritária para casos de evolução muito boa ou muito ruim, tempo limitado para consideração mental de todas as covariáveis e suas interações. Por estes motivos, os escores possuem melhor capacidade preditora do que a impressão clínica.
Além disso, o simples uso da impressão clínica muitas vezes predispõe ao paradoxo risco-tratamento, onde pacientes de alto risco são tratados menos agressivamente do que pacientes de baixo risco. Isso porque ao utilizar a somente a impressão clínica ficamos mais sujeitos a erros cognitivos relacionados a conceitos mentais predeterminados. Por isso que nos Estados Unidos minorias (negros, mulheres, hispânicos) são tratadas de forma menos adequada do que os indivíduos que representam o cidadão típico de uma determinada região. Não é proposital, mas inconscientemente o médico tente a subestimar o risco de determinados grupos de pacientes.

Apesar de reconhecidos científicamente como a melhor forma de avaliar prognóstico, até mesmo os guidelines científicos falham na ênfase dada aos escores. Por exemplo, na recente Diretriz Brasileira sobre Angina Instável e Infarto Agudo do Miocárdio sem Supradesnível do Segmento ST apenas o Escore TIMI é mencionado rapidamente, enquanto o melhor escore, o GRACE, ficou esquecido. No Guidelines dos American College of Cardiology e American Heart Association os dois escores são abordados, porém não há discussão em relação à acurácia destes.

Fico impressionado como há escores disponíveis para quase todas as situações clínicas. Hoje mesmo Dr. Júlio Braga comentava pertinentemente a inexistência de um escore que avaliasse o risco de sangramento com o uso crônico de anti-agregantes plaquetários. Coincidentemente me deparei esta noite com um artigo recentemente publicado no European Heart Journal, validando este escore. Ele estava certo, não tinha mesmo este escore, até ontem. De qualquer forma, precisamos sempre avaliar criticamente a qualidade do escore. Isso será motivo de outra postagem.
Ao utilizar escores, podemos realizar árvores de decisões clínicas para resolver certos dilemas. Por exemplo, quando estamos na dúvida se vamos anticoagular um paciente com fibrilação atrial, podemos utilizamos o Escore CHADS2 para estimar o risco de AVC embólico e comparamos com o risco de sangramento grave decorrente da anticoagulação através do escore de Shireman et al.
Recentemente foi publicado o CRUSADE, escore de sangramento em síndromes coronarianas agudas, que deve ser confrontado como escore GRACE, para decisão de tratamento antiisquêmicos que predispõem a graves fenômenos hemorrágicos.
Isso não significa deixar a experiência clínica de lado, até mesmo porque para acessar as informações dos escores, para saber se o paciente se adequa ao uso de um escore específico, precisamos de experiência clínica também. Mas o erro é considerar a experiência clínica hierarquicamente mais importante do que a informação obtida pelo escore.

Desta forma, precisamos estreitar a lacuna comumente encontrada entre a existência e a aplicação das evidências. Os escores são ferramentas valiosas que devem ser utilizadas a fim de melhorar nossa capacidade de avaliar prognóstico. Medicina Baseada em Evidências não é apenas ler criticamente trabalhos científicos, é também transferir o conhecimento científico para a prática clínica. Do ponto de visto prognóstico, os escores representam a melhor forma de fazer isso.

quarta-feira, 21 de abril de 2010

Amamentação traz Benefício Clínico?


Um dos mais fortes paradigmas na área de saúde é aquele que propaga o benefício da amamentação. Mas qual o nível de evidência a respeito desta conduta? Esta resposta está em uma meta-análise publicada no site do Ministério da Saúde Americano, que apresenta a seguinte conclusão:
A history of breastfeeding is associated with a reduced risk of many diseases in infants and mothers from developed countries. Because almost all the data in this review were gathered from observational studies, one should not infer causality based on these findings. Also, there is a wide range of quality of the body of evidence across different health outcomes.
Portanto, percebe-se que praticamente não há ensaios clínicos randomizados para responder a questão. Em segundo lugar, o documento chama a atenção para a pobre qualidade metodológica de boa parte dos trabalhos.

Mas o que mostram os resultados? Há de fato uma associação entre amamentação e menor incidência de problemas comuns, tais como asma, gastroenterite, obesidade, sem redução de mortalidade. Falamos em associação, pois não se pode garantir causalidade, visto que os estudos são observacionais. Infelizmente, a meta-análise não nos traz dados de risco absoluto, portanto fica faltando informação a respeito da magnitude do benefício.

Na prática vemos dois tipos de situação: de um lado, mães que têm tempo e prazer em amamentar. Estas devem amamentar, pois o processo vai ser gratificante e possivelmente é benéfico. Além disso, garante o alimento sem custo para pessoas de baixo nível sócio-econômico.

Do outro lado, há mães sem tempo e/ou com dificuldade de se adaptar à prática da amamentação. Estas se tornam ansiosas, sentem-se culpadas, principalmente quando começam a trabalhar e deixam seus filhos sem a amamentação "necessária". Muitas vezes tentam tirar leite para deixar em casa ou voltam correndo para casa várias vezes ao dia. Sem falar naquelas que sofrem com processos inflamatórios nos mamilos, mas não desistem do ato. Ou desistem e se sentem culpadas pelo resto da vida.

Para estes casos, seria necessário um bom nível de evidência que servisse de base para a tomada de decisão: amamentar ou não amamentar sem drama de consciência. Ou seja, em primeiro lugar precisamos saber se há de fato benefício. Estes estudos observacionais são carregados de vieses de confusão que podem ser responsáveis pelo aparente benefício. Pode haver diferença clínica ou social entre filhos de mães que amamentam e filhos de mães que não amamentam. Desta forma, precisamos de ensaios clínicos randomizados. Fico a me perguntar por que em área de tamanho interesse social não há investimento no nível de evidência ideal. Segundo, precisamos saber a magnitude deste benefício. Qual o NNT da amamentação? A partir disso, uma mãe pode decidir se vale a pena ficar mais alguns meses sem trabalhar ou se é melhor voltar mais cedo ao trabalho.

Precisamos deixar os mitos e procurar as evidências. À luz das evidências atuais, acredito que amamentação deve ser incentivada. Por outro lado, não há razão para insistir em uma conduta sem evidência, se for instituida à custa de sofrimento, preocupação ou drama de consciência.

domingo, 18 de abril de 2010

O Avesso do Avesso


O tipo de evidência científica mais discutido no meio médico é aquele que diz respeito a eficácia terapêutica. Porém precisamos ficar atentos a qualquer tipo de evidência científica e neste aspecto incluo artigos que abordam acurácia diagnóstica ou valor prognóstico de métodos complementares. Critérios para análise critica destes tipos de trabalhos são menos discutidos e por isso erros metodológicos passam desapercebidos por revisores de importantes revistas. Recentemente foi publicada no JAMA uma revisão sistemática demonstrando que a maioria dos artigos sobre valor prognóstico de biomarcadores cardiovasculares não utilizou a metodologia científica adequada.

Um exemplo recente de artigo sobre acurácia diagnóstica me chamou atenção. Em fevereiro, foi publicado o artigo intitulado The Absence of Coronary Calcification Does Not Exclude Obstructive Coronary Artery Disease or the Need for Revascularization in Patients Referred for Conventional Coronary Angiography no Journal of the American College of Cardiology, a mais importante revista cardiológica ao lado no Circulation. Este estudo avaliou a acurácia do escore de cálcio coronário no diagnóstico da doença coronária obstrutiva. Sabemos que a especificidade e conseqüentemente o valor preditivo positivo do escore de cálcio coronário são ruins, ou seja, calcificação não indica necessariamente doença aterosclerótica obstrutiva. Por outro lado, ausência de calcificação oferece um excelente valor preditivo negativo em população com probabilidade pré-teste baixa ou intermediária. De acordo com uma recente meta-análise, o valor preditivo negativo é 93% neste tipo de paciente. No entanto, o artigo mencionado demonstrou um valor preditivo negativo muito abaixo do esperado, 68%. Isso causou espanto entre os especialistas, incluindo Dra. Rita Redberg, que escreveu no Editorial do JACC: A paper in this issue of the Journal presents astarkly contrasting picture [em relação à literatura prévia].

No entanto, é fácil explicar a razão de tão ruim valor preditivo negativo. Observem a seguinte frase do resultado e tentem identificar o erro metodológico: The overall sensitivity for CS zero to predict the absence of lesions by CCA on individual participants was 45%, specificity was 91%, negative predictive value was 68%, and positive predictive value was 81%.

Sensibidade da ausência de cálcio para identificar ausência de doença? Isso é o avesso do avesso. Para o cálculo da sensibilidade se deve usar o teste positivo. Ao usar escore de cálcio zero para calcular sensibilidade, eles estão definindo escore de cálcio zero como teste positivo. Mas o que é um teste positivo? É o resultado que sugere doença, claro. Então o teste positivo deve ser a presença de calcificação e não ausência de calcificação. Ao definir incorretamente, tudo ficou pelo avesso. O mesmo se aplica para a especificidade e os valores preditivos.

Se a definição usada fosse a correta, como fizeram todos os estudos prévios, o valor preditivo negativo seria 81% e não 68%. Muito diferente. Vale salientar que o valor preditivo negativo de 81% ainda é inferior ao 93% reportado na meta-análise. Isto porque 0 trabalho avalia pacientes que tinham indicação de cateterismo cardíaco, ou seja, pacientes com alta probabilidade pré-teste.

Interessante notar que o valor preditivo negativo calculado da maneira correta é idêntico ao relatado no artigo do NEJM que avaliou nos mesmos pacientes a acurácia da angiotomografia (81%). Ou seja, quando negativo o valor preditivo do escore de cálcio tem o mesmo valor do que a angiotomografia.

Assim como evidências sobre tratamento, devemos ficar atentos para a metodologia de estudos sobre diagnóstico e prognóstico, pois estas também são sujeitas a viéses que podem nos levar ao avesso da conclusão correta.

sexta-feira, 16 de abril de 2010

Estatina Causa Diabetes?



Uma recente meta-análise publicada no Lancet sugere que o uso de estatina causa diabetes, idéia que parece pouco plausível. No entanto, muitas vezes coisas verdadeiras não parecem plausíveis, o que nos mostra que precisamos respeitar as evidências, desde que sejam de boa qualidade. Portanto, vamos avaliar a qualidade desta evidências.

Tudo começou com o fato do ensaio clínico JUPITER ter demonstrando aumento na incidência de diabetes com uso de rosuvastatina no cenário de prevenção primária. No entanto, esta observação do JUPITER tinha probabilidade considerável de ser devido ao acaso. Apesar de naquele estudo o valor de P para incidência de diabetes ter sido estatisticamente significante, este não refletia a verdadeira probabilidade do acaso. Primeiro, porque diabetes não foi desfecho primário, o que provoca o problema das múltiplas comparações. Ou seja, inúmeros desfechos colaterais são avaliados de uma só vez, podendo surgir significância estatística em algum deles, simplesmente por acaso. Segundo, surgimento de diabetes não foi um desfecho pré-especificado, ou seja, foi relatado no estudo porque apareceu como significativo. Terceiro, este desfecho não foi definido de forma objetiva, dependia da impressão do médico. O valor da glicemia, um desfecho mais objetivo, não apresentou diferença entre os grupos. Quarto, o desfecho não foi adjudicado, ou seja, revisado por uma auditoria, como se faz com qualquer desfecho importante. Portanto, este dado do JUPITER não é suficiente nem para gerar uma hipótese.
Mesmo assim, gerou a hipótese para que se realizasse esta meta-análise de 13 ensaios clínicos randomizados, todos com a mesma limitação do JUPITER na avaliação de diabetes. Ou seja, combinou-se um monte de estudos que não tinham diabetes como desfecho pré-definido, nem objetivamente definido, nem adjudicado. Em 7 dos 13 estudos nem mesmo analisado este desfecho havia sido. Foi por solicitação dos autores da meta-análise que os autores dos estudos voltaram aos seus registros e colheram esta informação. Sabe-se lá como.

Outra importante questão é que o estudo JUPITER foi o estudo com maior tendência para aumento de diabetes com estatina e este foi o maior estudo dentre os 13 incluídos. Muito maior que a maioria dos outros, o que dá um peso maior a ele no cálculo do resultado final. Porém o que mais preocupa é o seguinte: o mesmo estudo que gerou uma hipótese implausível é incluído na meta-análise que vai responder a questão. É o mesmo que utilizar o conhecimento da probabilidade pré-teste de doença para laudar a imagem de um exame diagnóstico. Claro que a interpretação da imagem do teste vai ser influenciada pelo que se sabe previamente. Outra analogia: quando se cria um escore prognóstico a partir de uma amostra, este deve ser validado em outra amostra, diferente da que foi utilizada para a derivação do escore. Para evitar o erro da repetição. Considerando que a hipótese não foi criada a partir da plausibilidade, mas sim de um achado possivelmente espúrio do JUPITER, seria necessário ter excluído este estudo da meta-análise em questão. Aí sim seria uma validação da hipótese gerada pelo JUPITER.

Parece-me uma idéia que surgiu de um argumento falho (análise inadequada do JUPITER), que foi confirmada por repetição de erros metodológicos, inlcuindo o mesmo dado falho do JUPITER. Estas evidências estão mais para um boato de que estatina aumenta diabetes do que para a verdade científica.

Alguns já estão discutindo que o benefício da estatina supera muito este potencial malefício de surgimento de diabetes. Acho que a discussão nem chega neste nível. Como já comentei anteriormente, devemos analisar com cuidado as meta-análises.

quinta-feira, 8 de abril de 2010

Dronedarona: serve para alguma coisa?

Há muitos anos os cardiologistas esperam o surgimento de um antiarrítmico tão eficaz quanto a amiodarona, porém sem os mesmos efeitos colaterais. Durante algum tempo esta foi a expectativa criada a respeito da dronedarona, o mais novo lançamento da Sanofi-Aventis. Porém as evidências mostram que a realidade não corresponde às expectativas.

A dronedarona tem propriedades eletrofisiológicas similares à amiodarona, porém não tem iodo em sua molécula, o que reduz sua toxicidade contra a tireóide e o pulmão. No entanto, precisamos ver o que estas vantagens teóricas promovem na prática. Primeiro problema, esta “promissora” droga é menos eficaz do que a amiodarona no que diz respeito à sua principal indicação: controle do ritmo cardíaco em pacientes com fibrilação atrial não-permanente. O ensaio clínico randomizado DYONYSUS demonstrou recorrência de fibrilação atrial em 63% dos pacientes que usaram dronedarona versus 42% do grupo amiodarona. Ou seja, dronedarona não é bem uma amiodarona melhorada. Segundo, do ponto de vista de tolerância, este estudo demonstrou 13.3% de descontinuidade da amiodarona versus 10.4% de descontinuidade da dronedarona. Um ganho de tolerabilidade muito menor do que a perda de eficácia. Terceiro, dronedarona não é exatamente mais segura do que a amiodarona. O ensaio clínico ANDROMEDA foi interrompido precocemente por aumento de mortalidade em pacientes com insuficiência cardíaca.

Então, para que tolerar um pouco mais uma droga que é menos eficaz, e que deve ser restrita a pacientes de baixo risco, ou seja, sem insuficiência cardíaca?

Normalmente, as drogas boas são mais efetivas em pacientes de alto risco. Ou seja, o benefício absoluto é maior em pacientes que tem maior risco absoluto. Aqui é o contrário. A droga é contra-indicada em pacientes de alto risco, devendo ser restrita a pacientes de baixo risco, porém com menos eficácia do que a droga tradicional. Tudo isso para desfrutar um pouco mais de tolerabilidade? Não faz muito sentido como droga de primeira linha.

Sendo assim, esta é uma droga de segunda linha, tal como o FDA liberou. O risco pode vir do entusiasmo pelo novo. Ou seja, decorrente de marketing exagerado, a comunidade pode se entusiasmar com as falsas promessas, passando a preferir esta nova opção. Por exemplo, no site do The Heart tem um “simpósio” patrocinado pela Sanofi-Aventis no qual todos os participantes têm vínculo com este fabricante e um deles afirma:

We would be willing to conclude that we didn’t see anything that would make us really worried about making a switch [from amidarone to dronedarone] in a relatively short period of time.
Parece um tanto tendencioso, não?

domingo, 4 de abril de 2010

Revista TIME - Falta de Embasamento Científico

A revista TIME contribuiu negativamente com a saúde pública, quando publicou na semana passada uma reportagem questionando o benefício de estatinas em mulheres. Esta reportagem teve grande repercussão no público americano, reduzindo a aderência das mulheres a este tipo de terapia. Ao reduzir a aderência, uma droga eficaz nos ensaios clínicos torna-se menos efetiva no mundo real. E este foi o resultado da infeliz reportagem.

Não há base científica para a TIME negar o benefício deste tipo de droga em mulheres. Em boa parte das postagens deste Blog, nós questionamos o benefício de drogas que não possuem comprovação científica. Porém no caso das estatinas é o contrário. Apesar de ser mais divertido questionar paradigmas vigentes, neste caso preciso reconhecer a existência de evidências científicas comprovando benefício e segurança, em ambos os sexos.

A reportagem da revista TIME afirma que o benefício comprovado em homens não se estende a mulheres, ao passo que os efeitos colaterais, como dor muscular, são mais freqüentes em mulheres.
Yet there is little evidence that they prevent heart disease in women. Researchers who have broken out and analyzed the data on healthy female patients in these trials found that the lifesaving benefit, which extends to men, does not cross the gender divide. What's more, there's evidence that women are more likely than men to suffer some of the drugs' serious side effects, which can include memory loss (?), muscle pain and diabetes (?).

Um fato verdadeiro é que mulheres são subrepresentadas nos ensaios clínicos, ou seja, o número de homens é sempre maior do que o número de mulheres. Isso faz com que análises de subgrupo mostrem nos homens resultados mais convincentes do ponto de vista estatístico. Porém isso é efeito do tamanho amostral. A correta análise de subgrupo é aquela que procura verificar se há uma mesma tendência do efeito observado nos subgrupos específicos. Não se deve esperar significância estatística em cada subgrupo, pois um SUBgrupo tem menor número de pacientes, levando a menor poder estatístico.

Além disso, estudos mais recentes em prevenção primária, como o HPS e JUPITER, mostram nítida consistência do benefício da estatina em ambos os sexos. Talvez a confusão venha do fato de que a redução absoluta de risco é menor nas mulheres, pois em geral o risco cardiovascular é menor neste grupo. Mas isso não quer dizer que as mulheres não se beneficiam. De fato, ao considerar a relevância do tratamento, um maior número de homens terá indicação da terapia, quando comparado a mulheres, pois a indicação leva em conta o risco cardiovascular. Mas se uma mulher tiver um risco que justifique a estratégia preventiva, a droga está indicada da mesma forma que nos homens. Vale salientar que, com base em evidências, o nível de risco necessário para indicar estatinas é cada vez menor.
Além disso, estamos falando de prevenção de infarto, AVC ou morte versus o efeito adverso de dor muscular. Ou seja, o efeito colateral enfatizado pela reportagem não se compara qualitativamente ao benefício da droga. Mesmo assim, se alguém não tolerar estatina por dor muscular (fato infrequente, mesmo em mulheres), suspende-se a droga, sem prejuízo para o paciente. O prejuízo maior seria não tentar usar uma terapia benéfica por medo de dor muscular.

A imprensa leiga tem um conflito de interesse inerente, que é a necessidade de audiência. Desta forma, as reportagens são feitas para causar impacto. Às vezes este impacto vem da supervalorização de uma terapia ou exame novo, como se estes fossem panacéias. Outras vezes, a imprensa tenta causar impacto trazendo uma visão crítica sobre coisas bem estabelecidas. As duas situaçõe são inadequadas. A comunidade médica precisa ficar atenta para exigir uma imprensa baseada em evidências.

sexta-feira, 2 de abril de 2010

Eficácia não é o mesmo que Efetividade

Os ensaios clínicos randomizados, placebo-controlados, representam o modelo mais adequado para demonstração da eficácia de uma droga. Neste ambiente controlado contra fatores de confusão e vieses dos mais diversos, uma conduta médica tem seu benefício comprovado, ou seja, eficácia estabelecida. Não há melhor desenho de estudo para avaliar eficácia.

Por outro lado, devemos estar conscientes de que eficácia é diferente de efetividade. Efetividade é o benefício de uma conduta médica no mundo real. Este conceito parte da premissa de que nem tudo que é eficaz, consegue ser efetivo. O melhor time de basquete do mundo, o dream team, perdeu para a Argentina na semifinal das olimpíadas de 2004, ficando apenas com a medalha de bronze. Por quê? Porque nas olimpíadas as circunstâncias dos jogos são diferentes do mundo da NBA. Ou seja, o Dream Team é eficaz, mas não foi efetivo nas olimpíadas.

Stephen Covey, um dos mais renomados acadêmicos sobre efetividade administrativa, tem um conceito interessante sobre eficácia e efetividade aplicado à vida pessoal. Uma pessoa pode ser eficaz em alguma atividade: um empresário conseguir sucesso financeiro; um cientista conseguir publicar um artigo em revista de impacto; um esportista ganhar uma competição. Porém a verdadeira efetividade na vida é conseguir contemplar de forma equilibrada todos os setores de valor: físico, material, emocional, espiritual, social. É o equilíbrio disso tudo que nos trará felicidade, ou seja, efetividade.

Voltando à medicina, o mesmo pode ocorrer com condutas terapêuticas. Uma droga farmacologicamente competente nem sempre consegue reproduzir seus benefícios na prática. Não por culpa da droga, mas devido às circunstâncias práticas que distanciam os ensaios clínicos do mundo real. O primeiro motivo é a ausência da prática da medicina baseada em evidências. Muitas vezes a informação existe, mas os médicos não a incorporam por ignorância ou porque as evidências vão de encontro com suas crenças. Outra possibilidade é a aplicação incorreta das evidências. Em 1999 foi publicado o ensaio clínico RALES, que demonstrou redução de mortalidade com espironolactona em pacientes com insuficiência cardíaca. Em 2004, foi publicado no NEJM um estudo observacional, mostrando vertiginoso aumento da utilização desta droga, porém acompanhado de vertiginoso aumento dos internamentos por hipercalemia. Os médicos estavam prescrevendo a droga para pacientes que não haviam sido testados no ensaio clínicos, incluindo aqueles com disfunção renal.

Há 5 anos, foi publicado no JAMA um estudo mostrando que até 30% dos pacientes com síndromes coronarianas agudas recebem a dose incorreta de heparina. Este erro na prescrição provoca um resultado não efetivo (aumento de mortalidade por sangramento) de uma terapia eficaz. Outras vezes a limitação é na logística da assistência médica.

Angioplastia primária é uma terapia mais eficaz do que trombólise no infarto. No entanto, quando o atraso para o início da angioplastia é maior que 90 minutos, este tratamento eficaz perde sua efetividade. Outras vezes, é o paciente responsável pela falta de eficácia, quando este adere de forma insatisfatória à terapia.

Como resolver esta questão? Primeiro realizando estudos de eficácia, Outcome Research. Estes são estudos observacionais, cujo objetivo não é testar a hipótese de eficácia, e sim verificar como as coisas estão sendo aplicadas na prática clínica. Estes tipos de estudo detectam problemas, e servem de base para estratégias que devem ser testadas para uma melhor aplicação da evidência científica.

Portanto, a medicina baseada em evidência não estuda apenas eficácia. Avalia também o mundo real, testando até que ponto o que é eficaz consegue ser também efetivo. Devemos ficar atentos para estes tipos de estudos observacionais, pois a implementação das condutas nem sempre é fácil e requer conhecimento dos potenciais obstáculos que devemos superar.

terça-feira, 30 de março de 2010

Reforma da Saúde Americana e Medicina Baseada em Evidências



Na semana passada foi aprovado pelo congresso americano a Health Care Reform. Após uma batalha de vários meses contra os republicanos, Barack Obama conquistou o que provavelmente será seu maior legado. Algo que muitos tentaram, mas só agora o 44º presidente conseguiu este feito, após muito sacrifício, prejudicando inclusive sua popularidade.

Atualmente, o estado americano não oferece saúde universal para a população, tal como o SUS faz no Brasil. O estado americano confia na força de sua economia para gerar as coberturas de saúde, tendo apenas plano de saúde público para os idosos (Medicare) e para os muito pobres (Medicaide). Porém 46 milhões de americanos ficam sem cobertura de saúde, pois estes são intermediários, não têm condições de contratar um plano de saúde, porém não são tão pobres para qualificar no Medicaide.

A reforma de Obama tem três objetivos. Primeiro, oferecer serviço de saúde àqueles desprovidos deste benefício. Os republicanos não deixaram que houvesse um plano público, então o governo vai subsidiar os carentes na contratação de seus planos ou para alguns casos ampliar os critérios para o Medicaide. Segundo objetivo, impedir que planos de saúde neguem cobertura a pessoas com doenças pré-existentes ou cortem o cabertura de pessoas que desenvolvam doenças graves. Mas é só no terceiro objetivo que vemos a relação da reforma de saúde com a medicina baseada em evidências: reduzir os custos da saúde. Percebam, mesmo aumentando a cobertura para mais 46 milhões de pessoas, acredita-se que se pode reduzir os custos com a saúde. Como? Aplicando corretamente o conhecimento científico, gastos desnecessários podem ser prevenidos, ao passo em que a assistência à saúde melhora. É fazer melhor gastando menos. Parece uma coisa muito difícil, mas considerando a grande distorção que é a forma da medicina praticada nos Estados Unidos (no Brasil também), não é difícil melhorar.
Muitas de nossas postagens abordam esta questão. Só para citar algumas recentes, já comentamos de evidências de que tratamento clínico é tão eficaz quanto tratamento intervencionista para a doença coronária; comentamos que a maioria dos cateterismos realizados tem resultados normais; já criticamos alguns exames de triagem que não reduzem mortalidade, tendo grande potencial de prejudicar os pacientes e gerar custos. É só focar no que é bom para o paciente, reduzindo a medicina baseada em mercantilismo.

Nosso SUS é um exemplo de assistência universal. Porém ao passo que os Estados Unidos gastam $3.000/pessoa/ano com a saúde, sabem quanto se gasta o Brasil? Apenas $374/pessoa/ano. Se eles precisam racionalizar os custos, nós mais ainda, pois nossos recursos são muito limitados. Minha impressão pessoal é que falta assessoria baseada em evidências aos gestores do SUS, pois vemos muitas distorções.

Espero que a reforma da saúde nos Estados Unidos provoque também uma reforma do pensamento médico em direção ao paradigma da medicina baseada em evidências.

Curiosidade: acima está o vídeo em que o atrapalhado vice-presidente americano apresenta Obama quando da conquista da reforma de saúde. Sem perceber que os microfones captariam o som de suas palavras, Joe Biden falou no ouvido de Obama: This is a big fuking deal. Com atenção dá para ouvir exatamente isso. Percebam como Obama que estava sorrindo fica subitamente sério ao ouvir a empolgada saudação de seu vice.

domingo, 28 de março de 2010

Interrupção Precoce de Ensaios Clínicos

Ensaios clínicos truncados são definidos como aqueles interrompidos precocemente devido a detecção de benefício estatisticamente significante. Simulações estatísticas sugerem que estes trabalhos superestimam a magnitude do benefício do tratamento que está sendo avaliado.

Esta inferência acaba de ser comprovada cientificamente. Na semana passada, foi publicado no JAMA um estudo da McMaster University, que comparou o risco relativo de ensaios clínicos truncados com ensaios clínicos concluídos com obtenção do tamanho amostral inicialmente planejado. Em extensa revisão de literatura, os autores identificaram 217 estudos truncados. Em 91 destes artigos, foi possível identificar trabalhos com o mesmo objetivo, porém não truncados. Desta forma, os resultados dos 91 artigos truncados foram comparados com seus equivalentes não truncados.

Identificou-se que o risco relativo (risco droga/risco placebo) dos artigos truncados foi 29% menor do que o risco relativo dos artigos não truncados. Lembrem-se que quanto menor o risco relativo, maior o efeito benéfico da droga. Portanto, isto indica que a magnitude do efeito do tratamento é superestimada em 29% quando o estudo é interrompido com um número de pacientes recrutado inferior ao inicialmente calculado com base nas premissas estatísticas iniciais.

Isto não é um preciosismo. De fato, a cada paciente que entra em um estudo, ocorre uma variabilidade em torno do verdadeiro efeito da terapia. Portanto, se avaliarmos o efeito do tratamento em vários momentos durante a inclusão dos pacientes, em algum momento pode ocorrer uma diferença entre os grupos decorrente do acaso. Neste momento, o estudo é interrompido rapidamente, não permitindo que este acaso seja diluído com a inclusão dos futuros pacientes. É verdade que os critérios de interrupção são mais rígidos do que um valor de P menor que 0.05, porém o estudo do JAMA mostra que estes critérios não são suficientes para prevenir resultados incorretos.

É de interesse da indústria patrocinadora do estudo que este seja interrompido. Primeiro, porque há economia monetária na medida em que o trabalho fica menor e mais curto. Segundo, se garante a demonstração de um benefício antes que a inclusão de mais pacientes mostre que não há benefício. Ou garante a afirmação de um benefício maior do que o real.

Alguns argumentam questões éticas em manter o grupo placebo de uma terapia que foi demonstrada como benéfica antes do término do estudo. O problema é que esta análise interina não demonstra nada com certeza. Antiético é obter uma conclusão incorreta, que será aplicada a pacientes futuros. Inclusive, em 2/3 dos casos os estudos não truncados não mostraram benefício algum.

Paradoxalmente, os estudos truncados apresentaram o dobro da probabilidade de serem publicados em revistas de alto impacto, quando comparados aos seus pares não truncados (63% vs. 30%). Isto decorre do viés de publicação, em que estudos positivos têm mais aceitação pelas revistas do que estudos negativos.

O estudo do JAMA também identificou que o número de desfechos primários apresentados pelos estudos truncados foi um preditor importante da imprecisão dos resultados. Ou seja, quando da interrupção do trabalho, se menos que 500 pacientes tiverem apresentado desfecho, há maior probabilidade de superestimativa do benefício do tratamento.

O exemplo mais recente deste tipo de viés é o festejado estudo JUPITER, que demonstrou benefício da terapia com estatina em pacientes saudáveis, de risco intermediário e colesterol normal. Este estudo foi interrompido precocemente, quanto apenas 393 desfechos haviam ocorrido, ao passo que o planejamento inicial havia sido de 520 pacientes. Além disso, ao interromper o estudo, muitos dos pacientes incluídos não completaram o tempo de follow-up inicialmente previsto, de cinco anos. Na realidade, o estudo iniciou com 8900 pacientes por grupo, porém apenas 3800 foram seguidos por 2 anos, 1353 foram seguidos por 3 anos, e, pasmem, 157 por grupo foram seguidos por 5 anos. É uma aberração argumentar um NNT de 25 para cinco anos, pura extrapolação de uma magnitude de benefício implausível, obtida em um estudo interrompido precocemente, com número de eventos e tempo de seguimento inadequados para o teste de hipótese.

Pessoalmente, acredito que haja benefício do uso de estatina no cenário do estudo JUPITER. Porém não podemos acreditar na magnitude deste benefício, caracterizada como sendo tão grande quando em pacientes portadores de doença coronariana. Isso não foi provado e é implausível. O estudo apenas demonstra benefício estatisticamente significante, porém ficamos impossibilitados de saber corretamente a relevância deste tratamento (NNT), um critério muito importante para nosso julgamento clínico. Os autores ou patrocinadores perderam a oportunidade de descrever de forma precisa a relevância do benefício da rosuvastatina em pacientes de prevenção primária.

Em conclusão, este deve ser mais um critério de avaliação da veracidade de uma informação fornecida por um ensaio clínico. Estudos truncados não menos confiáveis. Inclusive, pode ser considerado antiético truncar um estudo com interesse nos seus resultados e sua interrupção precoce, pois os dados apresentados serão aplicados a pacientes futuros. O critério correto de interrupção de um estudo é segurança. Ou seja, quando um tratamento proposto apresenta precocemente efeitos adversos importantes, aí sim, justifica-se interromper o estudo.