sexta-feira, 16 de abril de 2010

Estatina Causa Diabetes?



Uma recente meta-análise publicada no Lancet sugere que o uso de estatina causa diabetes, idéia que parece pouco plausível. No entanto, muitas vezes coisas verdadeiras não parecem plausíveis, o que nos mostra que precisamos respeitar as evidências, desde que sejam de boa qualidade. Portanto, vamos avaliar a qualidade desta evidências.

Tudo começou com o fato do ensaio clínico JUPITER ter demonstrando aumento na incidência de diabetes com uso de rosuvastatina no cenário de prevenção primária. No entanto, esta observação do JUPITER tinha probabilidade considerável de ser devido ao acaso. Apesar de naquele estudo o valor de P para incidência de diabetes ter sido estatisticamente significante, este não refletia a verdadeira probabilidade do acaso. Primeiro, porque diabetes não foi desfecho primário, o que provoca o problema das múltiplas comparações. Ou seja, inúmeros desfechos colaterais são avaliados de uma só vez, podendo surgir significância estatística em algum deles, simplesmente por acaso. Segundo, surgimento de diabetes não foi um desfecho pré-especificado, ou seja, foi relatado no estudo porque apareceu como significativo. Terceiro, este desfecho não foi definido de forma objetiva, dependia da impressão do médico. O valor da glicemia, um desfecho mais objetivo, não apresentou diferença entre os grupos. Quarto, o desfecho não foi adjudicado, ou seja, revisado por uma auditoria, como se faz com qualquer desfecho importante. Portanto, este dado do JUPITER não é suficiente nem para gerar uma hipótese.
Mesmo assim, gerou a hipótese para que se realizasse esta meta-análise de 13 ensaios clínicos randomizados, todos com a mesma limitação do JUPITER na avaliação de diabetes. Ou seja, combinou-se um monte de estudos que não tinham diabetes como desfecho pré-definido, nem objetivamente definido, nem adjudicado. Em 7 dos 13 estudos nem mesmo analisado este desfecho havia sido. Foi por solicitação dos autores da meta-análise que os autores dos estudos voltaram aos seus registros e colheram esta informação. Sabe-se lá como.

Outra importante questão é que o estudo JUPITER foi o estudo com maior tendência para aumento de diabetes com estatina e este foi o maior estudo dentre os 13 incluídos. Muito maior que a maioria dos outros, o que dá um peso maior a ele no cálculo do resultado final. Porém o que mais preocupa é o seguinte: o mesmo estudo que gerou uma hipótese implausível é incluído na meta-análise que vai responder a questão. É o mesmo que utilizar o conhecimento da probabilidade pré-teste de doença para laudar a imagem de um exame diagnóstico. Claro que a interpretação da imagem do teste vai ser influenciada pelo que se sabe previamente. Outra analogia: quando se cria um escore prognóstico a partir de uma amostra, este deve ser validado em outra amostra, diferente da que foi utilizada para a derivação do escore. Para evitar o erro da repetição. Considerando que a hipótese não foi criada a partir da plausibilidade, mas sim de um achado possivelmente espúrio do JUPITER, seria necessário ter excluído este estudo da meta-análise em questão. Aí sim seria uma validação da hipótese gerada pelo JUPITER.

Parece-me uma idéia que surgiu de um argumento falho (análise inadequada do JUPITER), que foi confirmada por repetição de erros metodológicos, inlcuindo o mesmo dado falho do JUPITER. Estas evidências estão mais para um boato de que estatina aumenta diabetes do que para a verdade científica.

Alguns já estão discutindo que o benefício da estatina supera muito este potencial malefício de surgimento de diabetes. Acho que a discussão nem chega neste nível. Como já comentei anteriormente, devemos analisar com cuidado as meta-análises.

quinta-feira, 8 de abril de 2010

Dronedarona: serve para alguma coisa?

Há muitos anos os cardiologistas esperam o surgimento de um antiarrítmico tão eficaz quanto a amiodarona, porém sem os mesmos efeitos colaterais. Durante algum tempo esta foi a expectativa criada a respeito da dronedarona, o mais novo lançamento da Sanofi-Aventis. Porém as evidências mostram que a realidade não corresponde às expectativas.

A dronedarona tem propriedades eletrofisiológicas similares à amiodarona, porém não tem iodo em sua molécula, o que reduz sua toxicidade contra a tireóide e o pulmão. No entanto, precisamos ver o que estas vantagens teóricas promovem na prática. Primeiro problema, esta “promissora” droga é menos eficaz do que a amiodarona no que diz respeito à sua principal indicação: controle do ritmo cardíaco em pacientes com fibrilação atrial não-permanente. O ensaio clínico randomizado DYONYSUS demonstrou recorrência de fibrilação atrial em 63% dos pacientes que usaram dronedarona versus 42% do grupo amiodarona. Ou seja, dronedarona não é bem uma amiodarona melhorada. Segundo, do ponto de vista de tolerância, este estudo demonstrou 13.3% de descontinuidade da amiodarona versus 10.4% de descontinuidade da dronedarona. Um ganho de tolerabilidade muito menor do que a perda de eficácia. Terceiro, dronedarona não é exatamente mais segura do que a amiodarona. O ensaio clínico ANDROMEDA foi interrompido precocemente por aumento de mortalidade em pacientes com insuficiência cardíaca.

Então, para que tolerar um pouco mais uma droga que é menos eficaz, e que deve ser restrita a pacientes de baixo risco, ou seja, sem insuficiência cardíaca?

Normalmente, as drogas boas são mais efetivas em pacientes de alto risco. Ou seja, o benefício absoluto é maior em pacientes que tem maior risco absoluto. Aqui é o contrário. A droga é contra-indicada em pacientes de alto risco, devendo ser restrita a pacientes de baixo risco, porém com menos eficácia do que a droga tradicional. Tudo isso para desfrutar um pouco mais de tolerabilidade? Não faz muito sentido como droga de primeira linha.

Sendo assim, esta é uma droga de segunda linha, tal como o FDA liberou. O risco pode vir do entusiasmo pelo novo. Ou seja, decorrente de marketing exagerado, a comunidade pode se entusiasmar com as falsas promessas, passando a preferir esta nova opção. Por exemplo, no site do The Heart tem um “simpósio” patrocinado pela Sanofi-Aventis no qual todos os participantes têm vínculo com este fabricante e um deles afirma:

We would be willing to conclude that we didn’t see anything that would make us really worried about making a switch [from amidarone to dronedarone] in a relatively short period of time.
Parece um tanto tendencioso, não?

domingo, 4 de abril de 2010

Revista TIME - Falta de Embasamento Científico

A revista TIME contribuiu negativamente com a saúde pública, quando publicou na semana passada uma reportagem questionando o benefício de estatinas em mulheres. Esta reportagem teve grande repercussão no público americano, reduzindo a aderência das mulheres a este tipo de terapia. Ao reduzir a aderência, uma droga eficaz nos ensaios clínicos torna-se menos efetiva no mundo real. E este foi o resultado da infeliz reportagem.

Não há base científica para a TIME negar o benefício deste tipo de droga em mulheres. Em boa parte das postagens deste Blog, nós questionamos o benefício de drogas que não possuem comprovação científica. Porém no caso das estatinas é o contrário. Apesar de ser mais divertido questionar paradigmas vigentes, neste caso preciso reconhecer a existência de evidências científicas comprovando benefício e segurança, em ambos os sexos.

A reportagem da revista TIME afirma que o benefício comprovado em homens não se estende a mulheres, ao passo que os efeitos colaterais, como dor muscular, são mais freqüentes em mulheres.
Yet there is little evidence that they prevent heart disease in women. Researchers who have broken out and analyzed the data on healthy female patients in these trials found that the lifesaving benefit, which extends to men, does not cross the gender divide. What's more, there's evidence that women are more likely than men to suffer some of the drugs' serious side effects, which can include memory loss (?), muscle pain and diabetes (?).

Um fato verdadeiro é que mulheres são subrepresentadas nos ensaios clínicos, ou seja, o número de homens é sempre maior do que o número de mulheres. Isso faz com que análises de subgrupo mostrem nos homens resultados mais convincentes do ponto de vista estatístico. Porém isso é efeito do tamanho amostral. A correta análise de subgrupo é aquela que procura verificar se há uma mesma tendência do efeito observado nos subgrupos específicos. Não se deve esperar significância estatística em cada subgrupo, pois um SUBgrupo tem menor número de pacientes, levando a menor poder estatístico.

Além disso, estudos mais recentes em prevenção primária, como o HPS e JUPITER, mostram nítida consistência do benefício da estatina em ambos os sexos. Talvez a confusão venha do fato de que a redução absoluta de risco é menor nas mulheres, pois em geral o risco cardiovascular é menor neste grupo. Mas isso não quer dizer que as mulheres não se beneficiam. De fato, ao considerar a relevância do tratamento, um maior número de homens terá indicação da terapia, quando comparado a mulheres, pois a indicação leva em conta o risco cardiovascular. Mas se uma mulher tiver um risco que justifique a estratégia preventiva, a droga está indicada da mesma forma que nos homens. Vale salientar que, com base em evidências, o nível de risco necessário para indicar estatinas é cada vez menor.
Além disso, estamos falando de prevenção de infarto, AVC ou morte versus o efeito adverso de dor muscular. Ou seja, o efeito colateral enfatizado pela reportagem não se compara qualitativamente ao benefício da droga. Mesmo assim, se alguém não tolerar estatina por dor muscular (fato infrequente, mesmo em mulheres), suspende-se a droga, sem prejuízo para o paciente. O prejuízo maior seria não tentar usar uma terapia benéfica por medo de dor muscular.

A imprensa leiga tem um conflito de interesse inerente, que é a necessidade de audiência. Desta forma, as reportagens são feitas para causar impacto. Às vezes este impacto vem da supervalorização de uma terapia ou exame novo, como se estes fossem panacéias. Outras vezes, a imprensa tenta causar impacto trazendo uma visão crítica sobre coisas bem estabelecidas. As duas situaçõe são inadequadas. A comunidade médica precisa ficar atenta para exigir uma imprensa baseada em evidências.

sexta-feira, 2 de abril de 2010

Eficácia não é o mesmo que Efetividade

Os ensaios clínicos randomizados, placebo-controlados, representam o modelo mais adequado para demonstração da eficácia de uma droga. Neste ambiente controlado contra fatores de confusão e vieses dos mais diversos, uma conduta médica tem seu benefício comprovado, ou seja, eficácia estabelecida. Não há melhor desenho de estudo para avaliar eficácia.

Por outro lado, devemos estar conscientes de que eficácia é diferente de efetividade. Efetividade é o benefício de uma conduta médica no mundo real. Este conceito parte da premissa de que nem tudo que é eficaz, consegue ser efetivo. O melhor time de basquete do mundo, o dream team, perdeu para a Argentina na semifinal das olimpíadas de 2004, ficando apenas com a medalha de bronze. Por quê? Porque nas olimpíadas as circunstâncias dos jogos são diferentes do mundo da NBA. Ou seja, o Dream Team é eficaz, mas não foi efetivo nas olimpíadas.

Stephen Covey, um dos mais renomados acadêmicos sobre efetividade administrativa, tem um conceito interessante sobre eficácia e efetividade aplicado à vida pessoal. Uma pessoa pode ser eficaz em alguma atividade: um empresário conseguir sucesso financeiro; um cientista conseguir publicar um artigo em revista de impacto; um esportista ganhar uma competição. Porém a verdadeira efetividade na vida é conseguir contemplar de forma equilibrada todos os setores de valor: físico, material, emocional, espiritual, social. É o equilíbrio disso tudo que nos trará felicidade, ou seja, efetividade.

Voltando à medicina, o mesmo pode ocorrer com condutas terapêuticas. Uma droga farmacologicamente competente nem sempre consegue reproduzir seus benefícios na prática. Não por culpa da droga, mas devido às circunstâncias práticas que distanciam os ensaios clínicos do mundo real. O primeiro motivo é a ausência da prática da medicina baseada em evidências. Muitas vezes a informação existe, mas os médicos não a incorporam por ignorância ou porque as evidências vão de encontro com suas crenças. Outra possibilidade é a aplicação incorreta das evidências. Em 1999 foi publicado o ensaio clínico RALES, que demonstrou redução de mortalidade com espironolactona em pacientes com insuficiência cardíaca. Em 2004, foi publicado no NEJM um estudo observacional, mostrando vertiginoso aumento da utilização desta droga, porém acompanhado de vertiginoso aumento dos internamentos por hipercalemia. Os médicos estavam prescrevendo a droga para pacientes que não haviam sido testados no ensaio clínicos, incluindo aqueles com disfunção renal.

Há 5 anos, foi publicado no JAMA um estudo mostrando que até 30% dos pacientes com síndromes coronarianas agudas recebem a dose incorreta de heparina. Este erro na prescrição provoca um resultado não efetivo (aumento de mortalidade por sangramento) de uma terapia eficaz. Outras vezes a limitação é na logística da assistência médica.

Angioplastia primária é uma terapia mais eficaz do que trombólise no infarto. No entanto, quando o atraso para o início da angioplastia é maior que 90 minutos, este tratamento eficaz perde sua efetividade. Outras vezes, é o paciente responsável pela falta de eficácia, quando este adere de forma insatisfatória à terapia.

Como resolver esta questão? Primeiro realizando estudos de eficácia, Outcome Research. Estes são estudos observacionais, cujo objetivo não é testar a hipótese de eficácia, e sim verificar como as coisas estão sendo aplicadas na prática clínica. Estes tipos de estudo detectam problemas, e servem de base para estratégias que devem ser testadas para uma melhor aplicação da evidência científica.

Portanto, a medicina baseada em evidência não estuda apenas eficácia. Avalia também o mundo real, testando até que ponto o que é eficaz consegue ser também efetivo. Devemos ficar atentos para estes tipos de estudos observacionais, pois a implementação das condutas nem sempre é fácil e requer conhecimento dos potenciais obstáculos que devemos superar.

terça-feira, 30 de março de 2010

Reforma da Saúde Americana e Medicina Baseada em Evidências



Na semana passada foi aprovado pelo congresso americano a Health Care Reform. Após uma batalha de vários meses contra os republicanos, Barack Obama conquistou o que provavelmente será seu maior legado. Algo que muitos tentaram, mas só agora o 44º presidente conseguiu este feito, após muito sacrifício, prejudicando inclusive sua popularidade.

Atualmente, o estado americano não oferece saúde universal para a população, tal como o SUS faz no Brasil. O estado americano confia na força de sua economia para gerar as coberturas de saúde, tendo apenas plano de saúde público para os idosos (Medicare) e para os muito pobres (Medicaide). Porém 46 milhões de americanos ficam sem cobertura de saúde, pois estes são intermediários, não têm condições de contratar um plano de saúde, porém não são tão pobres para qualificar no Medicaide.

A reforma de Obama tem três objetivos. Primeiro, oferecer serviço de saúde àqueles desprovidos deste benefício. Os republicanos não deixaram que houvesse um plano público, então o governo vai subsidiar os carentes na contratação de seus planos ou para alguns casos ampliar os critérios para o Medicaide. Segundo objetivo, impedir que planos de saúde neguem cobertura a pessoas com doenças pré-existentes ou cortem o cabertura de pessoas que desenvolvam doenças graves. Mas é só no terceiro objetivo que vemos a relação da reforma de saúde com a medicina baseada em evidências: reduzir os custos da saúde. Percebam, mesmo aumentando a cobertura para mais 46 milhões de pessoas, acredita-se que se pode reduzir os custos com a saúde. Como? Aplicando corretamente o conhecimento científico, gastos desnecessários podem ser prevenidos, ao passo em que a assistência à saúde melhora. É fazer melhor gastando menos. Parece uma coisa muito difícil, mas considerando a grande distorção que é a forma da medicina praticada nos Estados Unidos (no Brasil também), não é difícil melhorar.
Muitas de nossas postagens abordam esta questão. Só para citar algumas recentes, já comentamos de evidências de que tratamento clínico é tão eficaz quanto tratamento intervencionista para a doença coronária; comentamos que a maioria dos cateterismos realizados tem resultados normais; já criticamos alguns exames de triagem que não reduzem mortalidade, tendo grande potencial de prejudicar os pacientes e gerar custos. É só focar no que é bom para o paciente, reduzindo a medicina baseada em mercantilismo.

Nosso SUS é um exemplo de assistência universal. Porém ao passo que os Estados Unidos gastam $3.000/pessoa/ano com a saúde, sabem quanto se gasta o Brasil? Apenas $374/pessoa/ano. Se eles precisam racionalizar os custos, nós mais ainda, pois nossos recursos são muito limitados. Minha impressão pessoal é que falta assessoria baseada em evidências aos gestores do SUS, pois vemos muitas distorções.

Espero que a reforma da saúde nos Estados Unidos provoque também uma reforma do pensamento médico em direção ao paradigma da medicina baseada em evidências.

Curiosidade: acima está o vídeo em que o atrapalhado vice-presidente americano apresenta Obama quando da conquista da reforma de saúde. Sem perceber que os microfones captariam o som de suas palavras, Joe Biden falou no ouvido de Obama: This is a big fuking deal. Com atenção dá para ouvir exatamente isso. Percebam como Obama que estava sorrindo fica subitamente sério ao ouvir a empolgada saudação de seu vice.

domingo, 28 de março de 2010

Interrupção Precoce de Ensaios Clínicos

Ensaios clínicos truncados são definidos como aqueles interrompidos precocemente devido a detecção de benefício estatisticamente significante. Simulações estatísticas sugerem que estes trabalhos superestimam a magnitude do benefício do tratamento que está sendo avaliado.

Esta inferência acaba de ser comprovada cientificamente. Na semana passada, foi publicado no JAMA um estudo da McMaster University, que comparou o risco relativo de ensaios clínicos truncados com ensaios clínicos concluídos com obtenção do tamanho amostral inicialmente planejado. Em extensa revisão de literatura, os autores identificaram 217 estudos truncados. Em 91 destes artigos, foi possível identificar trabalhos com o mesmo objetivo, porém não truncados. Desta forma, os resultados dos 91 artigos truncados foram comparados com seus equivalentes não truncados.

Identificou-se que o risco relativo (risco droga/risco placebo) dos artigos truncados foi 29% menor do que o risco relativo dos artigos não truncados. Lembrem-se que quanto menor o risco relativo, maior o efeito benéfico da droga. Portanto, isto indica que a magnitude do efeito do tratamento é superestimada em 29% quando o estudo é interrompido com um número de pacientes recrutado inferior ao inicialmente calculado com base nas premissas estatísticas iniciais.

Isto não é um preciosismo. De fato, a cada paciente que entra em um estudo, ocorre uma variabilidade em torno do verdadeiro efeito da terapia. Portanto, se avaliarmos o efeito do tratamento em vários momentos durante a inclusão dos pacientes, em algum momento pode ocorrer uma diferença entre os grupos decorrente do acaso. Neste momento, o estudo é interrompido rapidamente, não permitindo que este acaso seja diluído com a inclusão dos futuros pacientes. É verdade que os critérios de interrupção são mais rígidos do que um valor de P menor que 0.05, porém o estudo do JAMA mostra que estes critérios não são suficientes para prevenir resultados incorretos.

É de interesse da indústria patrocinadora do estudo que este seja interrompido. Primeiro, porque há economia monetária na medida em que o trabalho fica menor e mais curto. Segundo, se garante a demonstração de um benefício antes que a inclusão de mais pacientes mostre que não há benefício. Ou garante a afirmação de um benefício maior do que o real.

Alguns argumentam questões éticas em manter o grupo placebo de uma terapia que foi demonstrada como benéfica antes do término do estudo. O problema é que esta análise interina não demonstra nada com certeza. Antiético é obter uma conclusão incorreta, que será aplicada a pacientes futuros. Inclusive, em 2/3 dos casos os estudos não truncados não mostraram benefício algum.

Paradoxalmente, os estudos truncados apresentaram o dobro da probabilidade de serem publicados em revistas de alto impacto, quando comparados aos seus pares não truncados (63% vs. 30%). Isto decorre do viés de publicação, em que estudos positivos têm mais aceitação pelas revistas do que estudos negativos.

O estudo do JAMA também identificou que o número de desfechos primários apresentados pelos estudos truncados foi um preditor importante da imprecisão dos resultados. Ou seja, quando da interrupção do trabalho, se menos que 500 pacientes tiverem apresentado desfecho, há maior probabilidade de superestimativa do benefício do tratamento.

O exemplo mais recente deste tipo de viés é o festejado estudo JUPITER, que demonstrou benefício da terapia com estatina em pacientes saudáveis, de risco intermediário e colesterol normal. Este estudo foi interrompido precocemente, quanto apenas 393 desfechos haviam ocorrido, ao passo que o planejamento inicial havia sido de 520 pacientes. Além disso, ao interromper o estudo, muitos dos pacientes incluídos não completaram o tempo de follow-up inicialmente previsto, de cinco anos. Na realidade, o estudo iniciou com 8900 pacientes por grupo, porém apenas 3800 foram seguidos por 2 anos, 1353 foram seguidos por 3 anos, e, pasmem, 157 por grupo foram seguidos por 5 anos. É uma aberração argumentar um NNT de 25 para cinco anos, pura extrapolação de uma magnitude de benefício implausível, obtida em um estudo interrompido precocemente, com número de eventos e tempo de seguimento inadequados para o teste de hipótese.

Pessoalmente, acredito que haja benefício do uso de estatina no cenário do estudo JUPITER. Porém não podemos acreditar na magnitude deste benefício, caracterizada como sendo tão grande quando em pacientes portadores de doença coronariana. Isso não foi provado e é implausível. O estudo apenas demonstra benefício estatisticamente significante, porém ficamos impossibilitados de saber corretamente a relevância deste tratamento (NNT), um critério muito importante para nosso julgamento clínico. Os autores ou patrocinadores perderam a oportunidade de descrever de forma precisa a relevância do benefício da rosuvastatina em pacientes de prevenção primária.

Em conclusão, este deve ser mais um critério de avaliação da veracidade de uma informação fornecida por um ensaio clínico. Estudos truncados não menos confiáveis. Inclusive, pode ser considerado antiético truncar um estudo com interesse nos seus resultados e sua interrupção precoce, pois os dados apresentados serão aplicados a pacientes futuros. O critério correto de interrupção de um estudo é segurança. Ou seja, quando um tratamento proposto apresenta precocemente efeitos adversos importantes, aí sim, justifica-se interromper o estudo.

quarta-feira, 24 de março de 2010

Estudos de Não Inferioridade (por Júlio Braga)

Um estudo de não inferioridade é aquele que tenta demonstrar que, em relação a um desfecho específico, uma intervenção não é pior que outra já estabelecida. Para dizermos que não é pior, temos de determinar qual o limite de tolerância, até o qual podemos dizer que a intervenção é não inferior. Por exemplo, uma incidência de desfechos até 10 % maior que no grupo controle pode ser considerada não inferior: 11% vs 10% de reinfarto.

O limite desta tolerância não é constante entre os diferentes estudos, pois depende do tipo de desfecho avaliado e do que os autores consideram como aceitável. Podemos definir como “aceitável” 1% a mais de reinfarto mas não 1% a mais de óbitos. Este limite é determinado com um nível de significância estatística (valor de P) que estima se repetindo o estudo haveria 95% de chance da nova intervenção ser ser melhor ou até 1% pior. Esta tolerância com a possibilidade da nova intervenção ser ligeiramente pior se justifica quando há vantagens na utilização da nova intervenção: menos efeitos colaterais, maior facilidade na aplicação, menor custo, etc.

Porém, devemos ter uma visão crítica em relação à definição dos autores do que eles consideram não inferior. Por exemplo, no final do ano passado foi publicado o estudo Dabigatran versus Warfarin in the Treatment of Acute Venous Thromboembolism no New England Journal of Medicine. Este estudo pré-definiu o dabigatran (150mg de 12/12h) como não inferior à warfarin se a recorrência de tromboembolismo venoso e óbito associado fosse até 275% maior do que com warfarin. Ou seja, se a incidência de eventos com warfarin for de 2%, a incidência com dabigatran poderia ser de até 5,6% que seria considerado como não inferior.

A incidência foi desfechos combinados foi de 2,4% com dabigatran vs 2,1% com warfarin. O valor de P foi inferior a 0,001. Porém este valor de P foi calculado de acordo com os pressupostos acima. Se o pressuposto fosse de uma diferença menor, este valor de P seria menor. O intervalo de confiança a 95% da diferença absoluta na incidência de eventos entre os dois grupos foi de -0.8% a 1.5%. Ou seja, mesmo se a incidência de desfechos fosse de 3,6% com dabigatran vs 2,1% com warfarina, a primeira nova droga seria considerada não inferior. Essa diferença não seria muito grande?

Podemos considerar o dabigatran não-inferior? De acordo com os pressupostos para não inferioridade estabelecidos pelos autores, e estranhamente aceitos pelas comissões de ética em pesquisa, creio que não.
Texto escrito por Dr. Júlio Braga.

terça-feira, 23 de março de 2010

Estamos Indicando Cateterismo Corretamente ?


A utilização de métodos diagnósticos deve ser racionalizada para proporcionar benefício aos pacientes. No entanto, evidências demonstram que métodos diagnósticos têm sido utilizados em demasia, o que nem sempre beneficia os pacientes, pelo contrário. Em parte isso decorre da medicina defensiva, onde o médico considera que a solicitação de exames o protege contra questionamentos futuros. Ou simplesmente decorre do Paradigma do Médico Ativo, que se aplica também a exames: quanto mais exames solicitados, melhor o médico se sente por conhecer mais seu paciente.

Nada disso considera que a solicitação de um exame médico virá acompanhada de um resultado, o qual pode gerar uma cascata de acontecimentos, positivos ou negativos. Já postamos neste Blog a este respeito, quando comentamos sobre indicações de mamografia de rotina em pacientes com menos de 40 anos ou pesquisa de câncer de próstata. A indicação do exame deve ocorrer em circunstâncias adequadas.

Há duas semanas foi publicado no New England Journal of Medicine dados de um grande registro americano realizado por 660 hospitais, o qual descreve o resultado das angiografias coronárias de 400.000 pacientes com suspeita de doença coronariana, realizados entre 2004 e 2008. Este estudo mostrou que a maioria dos pacientes que realizam cateterismo não tem doença coronariana obstrutiva. Apenas 38% dos pacientes apresentavam obstrução coronária acima de 70% em pelo menos um vaso coronário (40% dos pacientes se o critério fosse estenose de 50%).

Esse dado sugere falta de eficiência dos médicos na indicação deste sofisticado e invasivo exame. Cateterismo cardíaco não é um exame de triagem, portanto não deveria ter uma grande quantidade de resultados negativos. Esta proporção de resultados negativos se aproxima do que ocorre com métodos de triagem, ou seja, o cateterismo está sendo indicado de forma muito liberal.

Realmente, o trabalho mostra que 67% dos pacientes que realizaram cateterismo eram assintomáticos ou tinham sintomas atípicos. Ou seja, eram pacientes com baixa probabilidade pré-teste, situação na qual o cateterismo cardíaco não está bem indicado.

Mas porque estes pacientes estão realizando cateterismo? O estudo também permite perceber a razão, pois ficou demonstrado que 85% dos pacientes realizaram testes para pesquisa de isquemia (tipo teste ergométrico, cintilografia miocárdica ou tomografia de coronária), o que em muitos casos devem ter mostrado um resultado positivo ou duvidoso, provocando a realização do cateterismo.

Porém, a interpretação de um teste diagnóstico não deve considerar apenas o resultado do teste (positivo ou negativo), deve considerar também a probabilidade pré-teste de doença. Este é o raciocínio Bayesiano ou probabilístico. Caso este raciocínio fosse aplicado, pacientes de baixo risco, mesmo com um teste positivo para isquemia não teriam probabilidade pós-teste suficientemente alta para induzir o cateterismo. Portanto, não é só a indicação dos exames que está inadequada, a interpretação também. Ou seja, muitas vezes o simples resultado de um teste positivo para isquemia é interpretado como provável doença, sem considerar a probabilidade pré-teste. Às vezes a probabilidade pré-teste é baixa o suficiente para que a probabilidade pós-teste de doença continue pequena mesmo com o teste positivo.

De fato, o estudo do NEJM mostra que os dados clínicos são mais fortes preditores de doença coronariana do que o resultado dos exames para pesquisa de isquemia. Ou seja, neste caso a clínica é soberana. Além disso, quando considerado todos os preditores clínicos no modelo multivariado, o resultado da pesquisa não invasiva de coronariopatia não incrementou a capacidade diagnóstica.

Desta forma, este trabalho nos traz evidência incontestável de que precisamos melhorar a indicação dos exames voltados para diagnóstico da doença coronária. O erro começa com a indicação desnecessária de exames não invasivos, como teste ergométrico, cintilografia miocárdica e mais recentemente angiotomografia de coronária em pacientes com baixa probabilidade de doença coronariana. Estes nem precisam fazer os exames. O segundo erro vem quando resultados positivos não são interpretados a luz da probabilidade pré-teste.
Por fim, como comentado na discussão do artigo, em pacientes estáveis, o único benefício do tratamento de revascularização é o controle do sintomas, portanto não há benefício clínico em diagnosticar doença coronariana silenciosa (salvo situações especiais). Só esta simples constatação já reduziria bastante as indicações desnecessárias de coronaniografia.
Precisamos melhorar a indicação de exames não invasivos e a interpretação destes. Isso reduziria o número de cateterismo desnecessários. Além disso, precisamos sempre antever qual o benefício concreto que uma eventual demonstração de coronariopatia obstrutiva no cateterismo traria para o paciente. Tudo isso baseado em evidências.

sexta-feira, 19 de março de 2010

Mixing Apples and Oranges

Recebeu destaque neste Congresso do ACC uma metaanálise apresentada pelo britânico Keith Fox, respeitado cientista na área de síndromes coronarianas agudas (SCA). Esta meta-análise teve o objetivo de avaliar se a estratégia invasiva (CAT e angioplastia de rotina) é superior à estratégia seletiva em pacientes com SCA sem supradesnível do ST. Para isso o trabalho analisou conjuntamente os dados dos ensaios clínicos FRISC II, RITA-3 e ICTUS. Exatamente aqueles que discutimos em postagem recente.

O resultado mostrou superioridade da estratégia invasiva quando comparada à seletiva, em relação ao combinado de infarto e morte em seguimento de 5 anos. A particularidade é que a meta-análise combina três grandes estudos, dois deles da década de 90, que mostram benefício (FRISC e RITA-3) e outro contemporâneo (ICTUS) que não mostra benefício.

Meta-análises são mais úteis quando combinam trabalhos pequenos, sem poder estatístico. Quando combinados, estes trabalhos passam a desfrutar de poder estatístico adequado, pois o tamanho amostral fica maior.

Por outro lado, quando se têm três trabalhos grandes e de resultados heterogêneos, as discordâncias decorrem de diferenças intrínsecas dos trabalhos e não diferenças resultantes do acaso. Portanto é menos adequado combinar estes trabalhos.

Comentamos na postagem anterior que as diferenças destes trabalhos provavelmente se devem ao fato de que o tratamento medicamentoso na época dos estudos FRISC e RITA-3 era inferior ao tratamento atual. Por isso a estratégia invasiva fez diferença. Já o ICTUS não mostrou benefício da estratégia invasiva, na vigência do tratamento medicamentoso contemporâneo.

Ao fundir os resultados de 2 estudos favoráveis ao tratamento invasivo (N = 4.267) com 1 estudo desfavorável (N = 1200), claro que o tratamento invasivo leva vantagem.

Em meta-análises podemos fundir estudos heterogêneos, desde que a heterogeneidade se deva ao acaso decorrente do pequeno tamanho amostral entre os estudos. Mas se a heterogeneidade for decorrente da realidade de cada estudo, não é adequado fundi-los. Ou um vai anular o resultado do outro, gerando um resultado neutro, ou um vai prevalecer devido ao tamanho amostral. Este foi o caso da meta-análise do Dr. Fox.

Na prática clínica, o importante é estratificar os pacientes e dedicar a estratégia invasiva para os pacientes de alto risco. Nos de baixo risco, podemos ficar com a estratégia seletiva. Nos intermediários, a decisão final será mais individualizada.

terça-feira, 16 de março de 2010

O Ótimo é Inimigo do Bom

O ótimo é inimigo do bom. Esta é a principal mensagem dos estudos ACCORD e RACE II, que demonstraram ser o controle moderado da pressão arterial suficiente, mais fácil e seguro (bom), do que tentar controlar excessivamente a pressão arterial (ótimo) no diabético - ACCORD; o mesmo aconteceu com o controle moderado da freqüência cardíaca na fibrilação atrial permanente (bom), em relação ao controle mais estrito da freqüência (ótimo) – RACE II. Nem sempre o que parece ser uma estratégia mais rigorosa (ótimo) representa uma vantagem terapêutica.

Lembrado isso, precisamos detalhar um pouco mais estes trabalhos.

O estudo ACCORD não mostrou benefício no desfecho primário, que foi definido como o combinado de morte cardiovascular, infarto do miocárdio e acidente vascular cerebral. Porém se analisado o objetivo secundário de AVC isoladamente, observa-se que há uma redução neste desfecho, a qual alcança significância estatística. Então, como interpretar este estudo: negativo ou positivo? A interpretação deve ser baseada no objetivo primário, para o qual o estudo foi dimensionado. Nunca o resultado de um desfecho secundário deve prevalecer sobre o desfecho primário. Como já comentamos neste Blog, o estudo não é dimensionado para uma diferença no objetivo secundário. Portanto, se esta diferença é observada, a probabilidade do acaso é maior do que o expressado pelo valor de P. Neste caso, existe o problema dos múltiplos testes, ou seja, há vários objetivos secundários, o que aumenta a probabilidade de um deles aparecer significativo por acaso. Portanto, o estudo é negativo.

Desfecho secundário serve para avaliar se um benefício observado no desfecho primário é resultado do benefício em todos os desfechos individuais. Ou para gerar hipóteses, que devem avaliar ser testadas em estudos dimensionados para tal. Finalmente, mesmo se fosse um efeito verdadeiro, o NNT para prevenir o AVC seria de 89 em 8 anos, um benefício de pequena magnitude.

Então, o achado relativo ao risco de AVC não deve nos influenciar no tratamento anti-hipertensivo. Ficamos com a meta de pressão abaixo de 140 mmHg. Isso não quer dizer que precisamos reduzir as drogas se o indivíduo ficar com pressão menor que 120 mmHg após um esquema terapêutico inicial. Mas se a pressão estiver em 135 mmHg, não precisamos associar mais drogas.

No diabético com disfunção renal, esta ainda é uma questão em aberto, pois estes pacientes foram excluídos. Talvez diabéticos de maior risco se beneficicem. Mas isso precisa ser demonstrado. Há outro estudo que está sendo desenhado pelo NIH para avaliar esta questão em diabéticos de alto risco. Mas só teremos este resultado daqui a uns 10 anos.

Quanto ao controle estrito versus liberal da freqüência cardíaca em pacientes com fibrilação atrial permanente (RACE II), devemos lembrar que este estudo não incluiu pacientes com insuficiência cardíaca descompensada. O que nos faz pensar que se estivermos com um paciente cuja freqüência de 105 bpm e insuficiência cardíaca aguda, pode ser útil controlar melhor a freqüência. A insuficiência cardíaca pode ser decorrente de taquicardiomiopatia, situação em que seria benéfico controlar a freqüência mais estritamente.

Portanto, aém de avaliar veracidade e relevência de uma evidência científica, precisamos avaliar aplicabilidade. Aplicabilidade é o mesmo que validade externa. Ou seja, o resultado de um trabalho é aplicável no tipo de paciente que foi estudado.

Outra questão de aplicabilidade se refere ao braço lipídico do estudo ACCORD. Este não mostrou benefício do fibrato em diabéticos que usavam estatina. Porém devemos lembrar que a média de triglicérides foi 162 mg/dl neste estudo. Isso não quer dizer que diabéticos com hipertrigliceridemia importante não se beneficiem. Esta é uma hipótese sugerida pela análise do subgrupo de pacientes com triglicérides elevados. Mas esta hipótese precisa ser demonstrada em ensaios clínicos.

Em resumos, os trabalhos aqui discutidos nos lembram de dois princípios importantes: o desfecho primário define o resultado do estudo; e todo estudo deve ser avaliado quanto a sua validade externa (aplicabilidade).