quinta-feira, 27 de outubro de 2011

Estudo PROTECT: Medida de BNP protege indivíduos com insuficiência cardíaca?




A figura acima foi escolhida para ilustrar a discussão que teremos em relação ao estudo PROTECT. Pretendo demonstrar porque em ciência, água mole não deve perfurar a pedra dura. Isto diz respeito à importância de desfechos duros e moles na veracidade e relevância da informação científica.

Embora ensaios clínicos randomizados sejam mais utilizados para testar eficácia de terapias, este tipo de desenho também tem sido proposto como melhor nível de evidência na validação de biomarcadores. Ou seja, biomarcadores (plasmáticos ou métodos de imagem) devem ser também eficazes, sua utilização deve beneficiar os pacientes.

No último número do Journal of the American College of Cardiology foi publicado o ensaio clínico  randomizado PROTECT, que testa a eficácia do NT-pro-BNP na condução ambulatorial de pacientes com insuficiência cardíaca. Pro-BNP é um peptídeo sintetizado pelo ventrículo quanto há estresse de parede, ou seja, descompensação da insuficiência cardíaca. O pro-BNP é quebrado em BNP (ativo) e NT-pro-BNP. Ambos podem ser medidos como marcadores de insuficiência cardíaca descompensada. As medidas destas substâncias no plasma podem servir de guia para o ajuste da dose de diuréticos e vasodilatadores, teoricamente aprimorando a qualidade do tratamento. Faz sentido.

Inicialmente me entusiasmei com a notícia deste trabalho. Primeiro porque gosto de ver ensaios clínicos randomizados sendo usados para exames diagnósticos ou prognósticos. Isso é uma evolução científica. Segundo, porque nas notícias se relatava um NNT (número necessário a tratar ou testar) de apenas 5 pacientes para prevenção de um evento cardiovascular. Um NNT raramente visto em ensaios clínicos, sugerindo grande impacto da estratégia de utilização do BNP na prática clínica.

Mas não podemos ficar com notícias de sites médicos ou de congressos. Precisamos ler os artigos na íntegra, julgando-os criticamente.

O trabalho em questão randomizou 150 pacientes para duas estratégias de condução ambulatorial: dosagens de NT-pro-BNP para ajuste da terapia versus terapia usual (sem BNP). Ao cabo de 1 ano, apenas 28% do grupo NT-pro-BNP apresentou um evento cardiovascular, comparado a 48% do grupo tratamento padrão. NNT = 100 / (redução absoluta do risco = 48 – 28) = 5. De acordo com este número, uma terapia que traz um grande benefício. Lembrem-se que o NNT < 25 para eventos combinados representa uma terapia de grande impacto.

Mas a primeira lição deste exemplo é que não devemos apenas analisar o NNT numérico, devemos analisar a qualidade dos desfechos que são utilizados para computar o NNT. Normalmente os estudos de insuficiência cardíaca utilizam reinternamento e/ou morte como desfechos. No estudo PROTECT, foi utilizado um combinado de desfechos: morte, reinternamento, síndrome coronariana aguda, arritmia, isquemia cerebral e um sexto desfecho, bastante subjetivo, definido como piora da insuficiência cardíaca (sem necessitar internamento). Este desfecho subjetivo foi responsável por metade dos eventos registrados pelo estudo, sendo o mais frequente de todos.

Neste momento, precisamos discutir a diferença de desfecho duro (hard em inglês) para desfecho mole (soft em inglês) - estes termos em português me soam estranhos, prefiro as palavras equivalentes em inglês. Um desfecho duro tem duas características: ser clinicamente relevante e ser muito objetivo, ou seja, pouco sujeito a interpretações. Percebam que morte é o desfecho mais duro que existe: grave e objetivo, não há controvérsia se houve morte ou não. Fazendo uma escala decrescente de importância dos desfechos em insuficiência cardíaca, vem em segundo lugar o reinternamento, menos grave que morte, porém bastante objetivo. Por outro lado, o desfecho piora da insuficiência cardíaca sem requerer internamento é altamente subjetivo e pouco grave. É bastante mole. E quase nunca usado em estudos deste tipo.

Esta subjetividade se torna mais problemática quando combinada com outra característica inerente deste tipo de estudo: seu caráter aberto, onde o paciente e o médico estão cientes da estratégia utilizada. Desta forma, o paciente pode se sentir mais seguro com a estratégia do NT-pro-BNP e relatar menos piora da insuficiência cardíaca, assim como o médico pode ser induzido a registrar menos este desfecho no grupo NT-pro-BNP, pela simples percepção de um paciente melhor tratado.

Ou seja, neste caso temos um viés de mensuração do desfecho, que pode promover um resultado falso. É uma combinação perigosa: um estudo aberto associado a um desfecho muito mole.

Além disso, este é um estudo truncado. Foi planejado para randomizar 300 pacientes, mas quando alcançou significância estatística, foi interrompido, com apenas 150 pacientes - aquele vício de interromper o estudo assim que a coisa fica  boa. Como já comentamos neste Blog, estudos truncados são menos precisos.

Só para comprovar que provavelmente a informação do estudo PROTECT é falsa, há um ano foi publicado na mesma revista o  ensaio clínico PRIMA, que randomizou mais que o dobro de pacientes do PROTECT, considerando apenas reinternamento como desfecho. Este estudo não demonstrou benefício da estratégia do uso de NT-pro-BNP.

Desta forma, após uma análise criteriosa, podemos afirmar que a hipótese nula (princípio 2) do NT-pro-BNP não foi rejeitada. Este estudo tem uma boa possibilidade de estar nos mostrando um resultado incorreto. E na vigência de estudos de melhor qualidade sendo negativos, o uso rotineiro do NT-pro-BNP na condução de pacientes ambulatoriais com insuficiência cardíaca não deve ser implementado.

Um detalhe. A Roche é a fabricant deste NT-pro-BNP. Veja a declaração de conflitos de interesse do PROTECT: This study was supported in part by Roche Diagnostics, Inc. Dr. Januzzi has received research grants and consultancy fees from Roche Diagnostics, Inc., Siemens Diagnostics, and Critical Diagnostics; and has received speakers fees from Roche Diagnostics, Inc. and Siemens Diagnostics.

Por outro lado, o estudo PRIMA é financiado prioritariamente por um orgão governamental e apenas segundariamente pela indústria: Main funding (€200,000) for this study was provided by the Netherlands Heart Foundation, Netherlands Organisation for Scientific Research (NWO), and the Royal Nether- lands Academy of Arts and Sciences (KNAW)–Interuniversity Cardiology Institute of the Netherlands. Minor funding of an unrestricted research grant (€70,000 per sponsor) was provided by Pfizer, AstraZeneca, Medtronic, and Roche Diagnostics.

Não sejamos ingênuos. Argumentos moles não devem ser suficientes. Em ciência, água mole não deve furar a pedra dura.

Fica o exemplo de uma perigosa combinação: um estudo aberto avaliando um desfecho mole. Pior ainda quando tudo isso é aliado a conflitos de interesse.

domingo, 16 de outubro de 2011

Princípios da Medicina Baseada em Evidências



Ao longo destes dois anos de Blog, 137 postagens, temos realizado análise de relevantes publicações científicas, utilizando conceitos de medicina baseada em evidências. Nesta postagem, descreverei os conceitos que devem nortear a formação de opinião a respeito de determinada evidência. Chamo isso dos Sete Princípios da Medicina Baseada em Evidências

Gosto de chamar de princípios, pois assim nos remetemos aos princípios humanos universais que devem (ou deveriam) nortear os indivíduos no comportamento social e pessoal. Por exemplo, ninguém discorda do princípio da honestidade. Ele simplesmente existe e em momento de decisão, idealmente deve nos influenciar. Assim deve funcionar com medicina, princípios devem nortear nossa decisão clínica baseada em evidências.

Ao contrários de princípios humanos que fazem parte do inconsciente coletivo e são intuitivos, os princípios médico-científicos são absorvidos pelo entendimento profundo do sistema biológico (sistema complexo, imprevisível) e da metodologia científica. Muitas vezes a falta de entendimento destes princípios fazem com que uma evidência científica seja encarada de forma inadaquada ou até mesmo a própria existência da medicina baseada em evidências seja interpretada de forma equivocada.

Mas porque sete princípios? Não sei, simplesmente ao organizar meu pensamento, vieram sete princípios mais importantes em minha mente. Se o número sete tem algum significado adicional, não sei. Uma rápida pesquisa no Google me lembrou que sete são as notas musicais, as cores do arco-iris, os dias da semana, os pecados capitais e ainda tem escrito que sete é o número da perfeição de acordo com a Bíblia. Interessante ...

Nesta postagem falaremos dos três primeiros princípios.

Princípio 1: O Nível de EvidênciaToda evidência deve passar por uma análise crítica, que indique qual o grau de veracidade e relevância da informação. A depender desta análise, chegamos à conclusão de que o nível de evidência é suficiente para (1) modificar nossa conduta, (2) apenas para gerar uma hipótese, ou (3) não serve para nada. Já ouvi algumas pessoas dizerem: “a maioria das evidências não é verdadeira, portanto não podemos fazer medicina baseada em evidências.” Percebam o equívoco. Medicina baseada em evidências existe exatamente para nos trazer ferramentas que resolvam esta questão, separando o joio do trigo, identificando dentre uma infinidade de publicações, quais as evidências modificadoras de conduta. A depender do objetivo do trabalho científico (avaliar eficácia de terapia, acurácia de método diagnóstico ou valor prognóstico de marcadores de risco), há diferentes aspectos a serem analisados no artigo científico, aspectos estes que procuramos descrever neste Blog. Médicos precisam desenvolver conhecimento metodológico para analisar evidências. Assim como treinamos exame clínico, precisamos treinar exame de evidências.

Assim, o termo medicina baseada em evidências na verdade quer dizer medicina baseada em evidências científicas de qualidade. Parece uma coisa óbvia, porém percebo que muitos esquecem deste princípio básico.

Princípio 2: A Hipótese Nula – Este é princípio se aplica a ciência em geral. Um fenômeno não deve ser considerado verdadeiro antes de sua demonstração. O conhecimento científico se constrói com base na demonstração da veracidade de um fenômeno. Desta forma, a premissa básica é a hipótese nula, que indica que o fenômeno não é verdadeiro. De posse desta premissa, o cientista realiza experimentos (estudos metodologicamente adequados) que se demonstrarem forte grau de evidência positiva, a hipótese nula é rejeitada e ficamos com a hipótese da existência do fenômeno (hipótese alternativa). 

Se formos refletir um pouco, perceberemos que é assim que pensamos no cotidiano. Por exemplo, a maioria não acredita em disco voador. Por que não acreditar? Porque simplesmente a hipótese nula é a premissa básica, ou seja, não existe disco voador. No dia em que alguém demonstrar um forte nível de evidência a este respeito, passaremos a acreditar. Muitos dizem que acreditam em horóscopo. Mas no fundo não acreditam, usam isso apenas como uma atividade lúdica. Digo que não acreditam pois a maioria não norteia as decisões críticas de sua vida baseada nessas coisas. na hora do vamos ver, não é ao horóscopo que as pessoas recorrem. Celular causa câncer de cérebro? A maioria das pessoas acredita que não, pois todo mundo está usando celular. Isto porque a hipótese nula deve prevalecer, até que se prove o contrário. 

Embora estes exemplos indiquem que intuitivamente norteamos nossas vidas pelo princípio da hipótese nula, paradoxalmente este princípio é violado com frequência em medicina. É a violação deste princípio que faz os médicos adotarem condutas sem evidências científica de eficácia ou segurança, o que pode prejudicar seus pacientes de diversas formas; ou prejudicar o sistema de saúde; ou distorcer a forma como o conhecimento científico deve ser acumulado. 

Com muita frequência, evidências subsequentes demonstram que aquela conduta não deveria ter sido adotada, pois não é benéfica e às vezes é até maléfica. Um grande exemplo foi a adoção da terapia de reposição hormonal na década de 90 para prevenção cardiovascular. Como não havia evidências definitivas (apenas de estudos observacionais), deveríamos ter ficado com a hipótese nula. Ensaios clínicos randomizados subsequentes indicaram exatamente o contrário, ou seja, esta terapia aumenta o risco cardiovascular. Assim ocorre com frequência quando a indústria farmacêutica convence médicos a prescreverem novas drogas baseadas apenas em evidências de desfechos substitutos. Os médicos prescrevem e depois a droga é suspensa do mercado, pois evidências subsequentes mostram que a terapia aumenta a incidência de desfechos clínicos indesejados. São tantos os exemplos, é só revisar um pouco nossas postagens.

Com procedimentos isto também é frequente. Um bom exemplo é o hábito (ou melhor, vício) de realizar angioplastia da artéria ocluída no infarto tardio. Para que abrir uma artéria que irriga um músculo já todo necrosado? Bem, isso virou hábito (ou melhor, vício), representando mais uma violação da hipótese nula. Anos depois, foi publicado o ensaio clínico OAT, desenhado para rejeitar a hipótese nula e demonstrar que a angioplastia seria benéfica. No entanto, o estudo OAT demonstrou que não há benefício deste procedimento. Porém os entusiastas continuam violando este princípio, pois ainda ouvimos o argumento de que o "OAT não é um estudo suficiente para rejeitar a hipótese de que a angioplastia é benéfica".

Percebem a inversão de valores? Na verdade, precisamos provar que algo é bom para que seja adotado, e não provar que é ruim para que não seja adotado. O ônus da prova está na existência do fenômeno.

Ouço também as pessoas afirmarem que o conhecimento médico muda muito rapidamente, e isto decorre da evolução científica. Hoje pensamos de um jeito, amanhã de outro. Em grande parte, estas mudanças decorrem do fato de que idéias pouco substanciadas são consideradas verdadeiras de forma precipitada. Estas podem ser posteriormente derrubadas por evidências. 

Princípio 3: O Paradigma do Para-quedas – este representa as exceções ao Princípio 2. Na vigência de plausibilidade extrema, devemos acreditar no fenômeno ou adotar uma conduta médica, independente de demonstração científica. Para entender o que é plausibilidade extrema, utilizamos o paradigma do para-quedas. Percebam que para-quedas representa uma conduta utilizada para reduzir a mortalidade de pessoas que pulam de uma avião. Neste caso é tão plausível que o para-quedas vai prevenir a morte, que não se realizou um ensaio clínico randomizado (para-quedas vs. placebo) para comparar o desfecho morte entre os dois grupos. Seria até anti-ético.

Em medicina, toracotomia em indivíduos baseado no tórax, drenagem de certos abcessos, marca-passo no bloqueio AV total com frequência cardíaca muito baixa, troca valvar em jovem com estenose aórtica crítica, sintomático. Estas são condutas corretamente adotadas sem ensaio clínico randomizado. 

Por outro lado, precisamos ter cuidado com a banalização deste paradigma. Percebo às vezes argumento a favor do uso de condutas, baseada em alguma plausibilidade. Não é isso, plausibilidade extrema é aquilo que se assemelha ao exemplo do para-quedas, algo que indubitavelmente deve ser feito. Algo que seria enti-ético deixar de fazer.

É um risco fazermos algo apenas beseado em plausibilidade menor que extrema. Estamos repletos de exemplos em medicina de que isto não dá muito certo. A terapia de reposição hormonal tinha uma certa plausibilidade de ser benéfica; antiarrítmicos que antes se acreditava prevenir morte súbita, depois demonstraram aumentar morte súbita; drogas inotrópicas positivas (vesnarrinone) são maléficas em pacientes com insuficiência cardíaca, apenas de parecer bom aumentar a contratilidade. E por aí vai, os exemplos são inúmeros.

Mas quando nos deparamos com plausibilidade extrema, aí não temos dúvida, devemos adotar a conduta. E esse julgamento que torna a medicina baseada em evidências interessante, pois cabe sempre ao médico dissernir em que situação ela está: plausibilidade extrema ou não?

Percebam que fica mais fácil decidir baseado em princípios do que baseado em emoção, interesses ou coisas do tipo. Na dúvida, devemos recorrer aos princípios e a conclusão parece vir naturalmente. Assim termos  norteado as postagens deste Blog.

Na postagem seguinte, apresentaremos os quatro demais princípios. Por enquanto, deixo a reflexão de que o conhecimento médico-científico deve ser construído por evidências de qualidade (Princípio 1), que sejam suficientes para rejeitar a hipótese nula (Princípio 2), exceto em situações de plausibilidade extrema (Princípio 3). 

Parece óbvio, não? Mas o problema é que o absurdo frequentemente prevalece sobre o óbvio.

quinta-feira, 6 de outubro de 2011

sexta-feira, 30 de setembro de 2011

Queremos realmente transformar troponina em D-dímero?



Há 1 semana foi publicado no Jounal of American College of Cardiology o artigo intitulado Rapid Exclusion of Acute Myocardial Infarction in Patients with Undetectable Troponin using a High-sensitivity Assay. A análise e interpretação dos dados por parte dos autores provoca uma interessante discussão sobre a interpretação dos componentes da acurácia e utilidade de certas propostas diagnósticas.

Nos últimos anos, a indústria tem aprimorado a capacidade dos ensaios de troponina em detectar mínimas concentrações desta proteína plasmática e com maior precisão (reprodutibilidade). Estas são as chamadas troponinas de alta sensibilidade.

Nesta coorte de 703 indivíduos com dor torácica aguda, Body R. et al demonstraram que o uso de um ensaio de troponina alta sensibilidade associado a um ponto de corte mais baixo que o habitual (qualquer nível detectável seria definido como troponina positiva) produz 100% de sensibilidade para o reconhecimento de infarto do miocárdio, levando a um valor preditivo negativo perfeito. Assim, os autores concluíram que "esta estratégia pode ser usada para reduzir as internações desnecessárias".

É exatamente esta frase que pretendo analisar sob a ótica da metodologia de avaliação de métodos diagnósticos.

Em primeiro lugar, a fim de reduzir o número de pacientes desnecessariamente internados no hospital, um teste deve ter uma melhor capacidade de reconhecer indivíduos saudáveis que podem receber alta. A capacidade de reconhecer as pessoas saudáveis é definida como especificidade. Ao reduzir o ponto de corte de qualquer teste diagnóstico, ocorre um aumento de sensibilidade, à custa de redução na especificidade.

E foi exatamente isso que aconteceu quando os autores compararam o desempenho da troponina de alta sensibilidade associada ao mínimo ponto de corte, com a referência da troponina tradicional. Houve um aumento da sensibilidade de 85% para 100%. No entanto, ocorreu também diminuição na especificidade de 82% para 34%. E uma vez que um número menor de pessoas saudáveis serão identificados, é altamente questionável se esta abordagem realmente reduz internações desnecessárias. Mesmo que diferentes pontos de corte sejam adotadas para diagnosticar e afastar infarto, uma zona cinzenta de confusão será criada, levando a uma dúvida considerável se realmente esta abordagem seria útil na prática clínica.

Desta forma, apenas 28% dos pacientes apresentaram troponina negativa. O problema é que o estudo não relatou quantos destes 28% realmente receberem alta hospitalar logo após o resultado da troponina. Destes pacientes, alguns poderiam ter dor no peito muito típica, caracterizando angina instável; alguns poderiam ter alterações isquêmicas do ECG; e outros poderiam ter outra causa grave de dor torácica que impediria a alta. Portanto, uma troponina negativa não significa necessariamente alta hospitalar. E o número real de pacientes em que o resultado ajudou na decisão de alta não está claro no artigo.

Segundo a Definição Universal de Infarto, devemos considerar o percentil 99 da troponina como o ponto de corte para este diagnóstico, o que proporciona boa acurácia diagnóstica (sensibilidade 85% e especificidade 82%, segundo o artigo de Body et al). Antes de trocar esta boa acurácia da definição universal de infarto, por uma maior sensibilidade à custa de bem menor especificidade (semelhante ao D-dímero para embolia pulmonar), evidências científicas convincentes devem ser apresentadas. Por enquanto, não está demonstrado, nem é plausível, que uma significativa redução de especificidade (detecção de saudáveis) proporcione maior liberação precoce de pacientes com dor torácica. Pelo contrário, isso poderá provocar maior número de internamentos desnecessários.

O D-dímero é um teste que  intrinsecamente não tem especificidade. Não há outra alternativa, ele só pode nos oferecer sensibilidade. Mas a troponina é diferente. Este teste tem tanto sensibilidade como especificidade. Não parece fazer tanto sentido transformar a troponina em D-dímero.

Talvez faça sentido para a indústria da troponina de alta sensibilidade. É a briga intensa pelo mercado de dosagens bioquímicas.  

Cuidado com algo muito sensível, pode ser pouco específico. Cuidado com algo muito específico, pode ser pouco sensível. Nem sempre vale a pena trocar o equilíbrio da sensibilidade e especificidade (crossover no gráfico acima), pela priorização de alguma destas propriedades.

* Esta é mais uma postagem da séria Análise Crítica de Evidências Diagnósticas.
* Uma versão modificada destes artigo foi aceita para publicação no Journal of the American  College of Cardiology (in press).

quinta-feira, 22 de setembro de 2011

Ensaio sobre Conflitos de Interesse




De acordo com a enciclopédia Wikipedia, conflito de interesse é um termo que se aplica quando um indivíduo (ou organização) tem envolvimento com múltiplos interesses, de forma que um interesse pode corromper a motivação pelo outro interesse.

Conflito de interesse é um fenômeno intrínseco na natureza, todos nós lidamos com isso, a toda hora. Alguém pode ter interesse em perder peso, porém ao mesmo tempo tem interesse em se divertir tomando um sorvete. Claro que o interesse na diversão vai prejudicar a meta de perda de peso.

O conflito de interesse começa a se tornar algo mais sério quando envolve situações profissionais. Recentemente Palocci perdeu seu cargo de Ministro da Casa Civil, pois seu forte envolvimento prévio (no sentido monetário) com empresas privadas poderia influenciar suas ações públicas em prol destas empresas. Um advogado não pode representar a pessoa A contra a pessoa B, se em outro processo o mesmo advogado representa a pessoa B contra outra pessoa C.  Se o segundo processo for maior que o primeiro, a pessoa A pode ser mal representada para que B seja favorecido.

Em ciência não poderia ser diferente, conflitos de interesse permeiam diversas relações. Aqui o primeiro interessado é a verdade científica. O problema é que diversas vezes a verdade científica é enviesada devido a outros interesses dos cientistas ou dos formadores de opinião. É o conflito da verdade científica versus interesses pessoais.

Há diversos níveis de conflitos de interesse, vamos analisar de um extremo a outro.

No extremo superior, estão aqueles formadores de opinião que recebem verba para dar palestas em eventos organizados pela indústria farmacêutica (ou de equipamentos) ou escrever boletins informativos em nome da indústria. Nesta situação, é grande a probabilidade de viés (consciente ou inconsciente) na forma como as coisas são colocadas. Por outro lado, não vejo grande problema, pois a intenção do evento ou boletim está explícita, é fazer propaganda. E fazer propaganda não é pecado, principalmente no mundo capitalista. Nesta situação, cabe aos ouvintes ou leitores julgar criticamente as informações, separando o que concordamos ou discordamos. Ou simplesmente fazer o mesmo que fazemos com propaganda política: desligamos a televisão ou mudamos para o canal da TV fechada. Na prática, significa não se vender por um jantarzinho da indústria. Ficar em casa estudando pode ser uma idéia bem melhor. Ou, automaticamente jogar fora aqueles encartes que os representantes distribuem. Melhor ainda jogar em lixo reciclável.

Assim, resolvemos esta situação. Inclusive, devo salientar que este tipo de conflito de interesse de formadores de opinião não pode ser considerado um problema ético, pois o conflito é declarado. É algo que faz parte do nosso mundo capitalista. Simplesmente é assim.

O problema é quando vamos nos distanciando deste extremo e as coisas começam a ficar menos claras. Por exemplo, o mesmo palestrante do evento da indústria pode ser convidado por um evento de sociedade médica para falar de um assunto semelhante. Nestas situações, os palestrantes devem declarar conflitos antes da aula. Porém, mesmo que o façam, é difícil definir o grau de influência que o conflito pode estar tendo no palestrante.

Pior é quando se trata de editoriais escritos por indivíduos de referência em revistas científicas de respeito. Há alguns anos, foi publicado o ensaio clínico POISE no Lancet, demonstrando que o uso de beta-bloqueador iniciado em pré-operatório de cirurgia não cardíaca aumenta mortalidade. No entanto, o editorial que acompanhou o artigo, escrito por Poldermans D, defendia a manutenção da prática do beta-bloqueador. Isso mesmo, sem nem mesmo propor um outro estudo que utilizasse uma abordagem diferente de uso de beta-bloqueador, o editorialista sugere que se continue usando, desde que de forma mais cuidadosa. Dias depois fui ao Congresso Mundial de Cardiologia em Buenos Aires. Estava sem alternativa para almoçar e aí resolvi pegar uma daquelas caixinhas de comida de simpósio satélite. Quando entrei na sala para pegar o lanche (reconheço, foi um conflito de interesse, mas eu estava com fome), percebi que ali estava ele, o mesmo Polderman D, falando em um simpósio satélite sobre uso de beta-bloqueador em cirurgia não cardíaca. Não resisti, fiz uma pergunta bastante provocativa, o que o irritou bastante. Percebo que a irritação do speaker é um sinal de que ele não está plenamente confortável naquele papel.

Há alguns anos foi publicado um editorial favorável ao uso de Levosimedan nos Arquivos Brasileiros de Cardiologia, por um autor suíço. Naquela época o ensaio clínico Survive já havia sido publicado, demonstrando ausência de benefício desta droga em pacientes com insuficiência cardíaca descompensada. Como reação a este editorial fora de contexto, Flávio Fuchs enviou carta ao editor, chamando atenção sobre as afirmações não embasadas em evidências e mostrando que o autor do editorial havia omitido seus conflitos de interesse na publicação do estudo.

Sem querer dar uma de puritano, devemos reconhecer que conflitos de interesse fazem parte de todas as facetas da vida. Cabe a nós sabermos nos proteger. Mas como? Desenvolvendo um senso crítico e aprimorando nossa capacidade de julgamento da literatura médica, pelas técnicas da medicina baseada em evidências.

Finalmente, lhes convido a assistir a brilhante conferência (5 minutos) do psicólogo americano Dan Airely sobre conflitos de interesse, apresentada durante o evento anual TED, na Califórnia. 

terça-feira, 20 de setembro de 2011

Menopausa e Doença Cardiovascular: a queda de um paradigma?



Um pensamento coletivo bem consolidado é o da menopausa como fator de risco para doenças cardiovasculares. Teoricamente, as mulheres passam a apresentar maior risco cardiovascular após a menopausa, pois perdem o efeito protetor do estrógeno. Seria neste momento que o risco das mulheres se aproxima do risco dos homens.


Na semama passada, foi publicado no British Medical Journal um sofisticado estudo, que traz forte questionamento à idéia corrente a respeito do assunto. Mas antes de discutir esta nova evidência, vamos revisar quais evidências prévias sugerem que o status pós-menopáusico representa um fator de risco cardiovascular.


A idéia faz sentido e todos nós aprendemos desta forma. No entanto, devemos reconhecer que este conceito é embasado em um raciocínio fisiopatológico, sem comprovação epidemiológica. Pelo contrário: desde a década de 60, estudos compararam mortalidade por doença cardiovascular entre diferentes populações separadas por faixa etária e demonstraram que quanto maior a idade da população, maior o risco cardiovascular. Porém, na idade típica da menopausa (50 anos), não se observou um aumento adicional no risco além da influência do "envelhecimento". Ou seja, os estudos não demonstravam um ponto de inflexão que indicasse algo mudar no momento da menopausa.



No entanto, estes estudos eram limitados por seu desenho. Eram estudos transversais, realizados em diferentes amostras de pacientes, de faixas etárias diferentes. Estas amostras de faixas etárias diferentes eram comparadas, mostrando maior mortalidade por doença cardiovascular nas amostras de idade mais avançada. Porém o ideal seria acompanhar prospectivamente os mesmos pacientes, demonstrando o efeito do tempo na ocorrências dos desfechos. Isto ainda não havia sido publicado, até a semana passada.


Desta forma, no último número do British Medical Journal, foi publicado o trabalho Ageing, menopause, and ischaemic heart disease mortality in England, Wales, and the United States, pelo grupo da Universidade de Johns Hopkins. Estas análises foram realizadas em bases de dados censitárias destes países, as quais acompanham a mesma população ao longo do tempo.  Utilizando estes dados, a mortalidade por doença isquêmica do coração foi registrada ao longo do tempo, na mesma população. De fato, esta mortalidade vai aumentando com o progredir do tempo, ou seja, com o envelhecimento da população. Porém não houve nenhum incremento desta mortalidade na faixa etária típica da menopausa. Ou seja, o aumento de risco ao longo do tempo é constante, aparentemente o efeito é apenas da idade. Não há ponto de inflexão.


Isto é importante, pois a principal diferença entre mulheres menopausadas e não menopausadas é exatamente a idade. Desta forma, as primeiras podem ter risco cardiovascular aumentado somente (ou principalmente) por isso, sem grande influência dos hormônios propriamente ditos. Neste caso, idade seria uma variável de confusão na associação entre menopausa e risco.


Faz sentido, não?

Em contraste, quando mortalidade por câncer de mama foi analisada, observou-se uma queda específica do risco após a menopausa. Ou seja, no caso do câncer de mama, o estudo detectou o efeito de fatores além da idade, provavelmente fatores hormonais. 

Mas se não há associação entre menopausa e risco, por que o risco da mulher tende a se igualar ao do homem em torno deste momento? O estudo também responde isto. Enquanto a mulher cresce de forma uniforme o risco de infarto com o passar da idade, o homem tem uma aceleração inicial e na quinta década há uma certa desaceleração no crescimento de seu risco, o que os aproxima das mulheres.

Esta evidência vai ao encontro dos ensaios clínicos que mostram que terapia de reposição hormonal não reduz risco cardiovascular. Dentre os critérios de causalidade, este seria um dos principais: reversibilidade. Ou seja, ao retirar (ou tratar) o fator,  a consequência desaparece. Por exemplo, ao tratar colesterol, infarto reduz sua incidência. Ao tratar  hipertensão, AVC reduz. Por outro lado, ao tratar a queda de hormônio típica da menopausa, o risco não diminui. Por que? Provavelmente porque não é a menopausa que aumenta o risco da paciente. É a sua idade e os fatores de risco clássicos que acompanham o envelhecimento. Agora fica melhor explicado porque terapia de reposição hormonal não tem benefício cardiovascular.

A idéia aqui discutida parece nova, mas na verdade não é. Em 1997, em artigo de revisão publicado no Circulation (Sex Differences in Coronary Heart Disease), Elizabeth Barrett-Connor afirmava “the universal excess risk of CHD in men noted above, coupled with the apparent loss of the female advantage in women who had an early menopause, led to the hypothesis that endogenous estrogen is cardioprotective. Proof of this hypothesis has been surprisingly elusive.”
Dizem que paradigmas ou verdades científicas mudam a toda hora. Penso diferente. Mudam aquelas idéias que na realidade nunca foram paradigmas, pois eram só idéias sem comprovação científica.

Quando vejo estas idéias sendo derrubadas, lembro-me da história dos Três Porquinhos. O porquinho que construía rapidamente sua casa, de forma precipitada, sem muita base (casa de palha), sempre se dava mal. Nossos argumentos, nossas idéias, nossas verdades devem se construir com base em fortes alicerces, ou seja, evidências de alta qualidade. Senão, algum dia, mais cedo ou mais tarde, o sopro do lobo será capaz de derrubar o idéia, que nunca foi um paradigma verdadeiro.

domingo, 11 de setembro de 2011

Estudos de Não Inferioridade II (por Adriana Latado)

Existem dois aspectos críticos na hipótese na não inferioridade. O primeiro é a definição da margem de não inferioridade. A idéia é que se defina qual o limite máximo de diferença entre o tratamento novo e o controle ativo considerado clinicamente irrelevante, quando o efeito for a favor do controle ativo. Ou melhor, o tratamento teste pode ter resultado melhor, aparentemente igual ou até “um pouco” pior do que o controle ativo para ser considerado não inferior. Para isso, esse “pouco pior” deve cair dentro da margem de não inferioridade. A definição desse limite pode levar em consideração critérios clínicos e estatísticos, sendo muito interessante a união de ambos os conhecimentos. Do ponto de vista estatístico, comumente utilizá-se o intervalo de confiança para se definir a margem de não inferioridade. A estratégia é usar o limite inferior do intervalo de confiança da medida de associação obtida em ensaio clínico que testou o controle ativo versus placebo, cujo resultado demonstrou efeito benéfico estatisticamente significante a favor do controle ativo. Ou seja, admite-se que o limite inferior desse intervalo de confiança é o mínimo efeito clinicamente relevante que se espera ter de um tratamento específico de modo reduzir o risco de um desfecho (quando comparado a não fazer intervenção). Se, no estudo de não inferioridade, o efeito do tratamento novo ou teste, comparado ao controle ativo, é menor do que esse limite (significa que está dentro da margem de não inferioridade), conclui-se que a nova intervenção é não inferior ao tratamento habitual com o que foi comparada. Na verdade, é comum o uso de uma fração de correção (f) sobre o limite inferior do intervalo de confiança, com objetivo de corrigir inconsistências entre a comparação atual e aquela entre controle ativo e placebo.

Outro aspecto crucial é o planejamento do estudo de não inferioridade, especialmente no que diz respeito à seleção da amostra, definição de desfechos e estratégia de análise estatística. Os indivíduos selecionados para o estudo de não inferioridade entre tratamento teste e controle ativo devem ter características demográficas, clínicas) muito semelhantes às pessoas estudadas no ensaio clínico de qualidade que serviu de base para a definição da margem de não inferioridade. Deve-se ter em mente que ‘tratamento novo não inferior ao controle ativo’ significa admitir que o tratamento novo tem efeito em relação ao placebo não inferior ao que o controle ativo apresentou sobre placebo em estudo prévio. 

Sobre a definição de desfechos de interesse, a mesma questão se impõe. O estudo de não inferioridade deve medir evento similar ao que foi avaliado no ensaio clínico entre controle ativo e placebo que lhe serviu de base. Caso contrário, a extensão do conceito de não inferioridade fica prejudicada. 

Finalmente, a escolha da estratégia de análise de dados tem se mostrado um ponto importante de discussão, e, recentemente, tem-se sugerido que a análise por intenção de tratamento seja complementada pela análise por protocolo nos estudos de não inferioridade. Aspectos que envolvem a análise por intenção de tratamento (intention to treat analysis) tendem a favorecer a não inferioridade, na medida em que caminham em direção à ausência da diferença entre os grupos, o que, no estudo de não inferioridade, está contemplada pela hipótese alternativa do investigador. Apesar dos vieses conhecidos e implícitos da análise por protocolo (ou seja, avaliam-se apenas os integrantes dos grupos que efetivamente utilizaram a intervenção), tem-se defendido que a premissa da não inferioridade deverá ser aceita apenas se o tratamento teste demonstrar-se não inferior ao controle ativo nas análises por intenção de tratamento e por protocolo.

domingo, 4 de setembro de 2011

O que são Ensaios Clínicos de Não Inferioridade?


Este tipo de estudo tem se tornado frequente entre importantes trabalhos publicados em revistas de alto impacto. No entanto, a razão da escolha por este desenho de estudo e a metodologia por trás dele é pouco compreendida.

Esta pouca compreensão leva alguns a pensarem que este desenho de estudo é um subterfúgio da indústria farmacêutica para demonstrar o valor de coisas que não têm tanto valor. Apesar de minha usual visão crítica em relação à indústria, devo afirmar que não é bem assim. Estudos de não inferioridade representam uma metodologia adequada e útil, quando corretamente aplicada.

Então, quando se usa e para que servem estes estudos?

Estes estudos fazem parte de um grupo classificado como estudos de eficácia comparativa, os quais são usados quando um tratamento novo é comparado a um tratamento tradicional. Neste caso, os estudos podem ser de superioridade ou de não inferioridade.

Os estudos de superioridade representam o modelo tradicional, com o qual estamos acostumados a lidar. Se aplicam tanto para eficácia comparativa (tratamento novo vs. tratamento tradicional), como para eficácia (tratamento vs. placebo/controle). No caso da eficácia comparativa, este tipo de desenho parte da premissa de que o tratamento novo tem motivos para ser superior ao tratamento tradicional. A possível superioridade justifica a troca do tradicional pelo novo. Por exemplo, stent farmacológico (novo) tem motivos para ser melhor do que stent convencional na prevenção de reestenose (um pouco). Desta forma, os estudos que comparam estes dois tipos de stent são de superioridade, pois a hipótese é de que o farmacológico é melhor do que o convencional.

A segunda situação é quando o tratamento novo não tem vantagem teórica que suporte uma hipótese de maior eficácia. Porém mesmo que não seja mais eficaz, o novo pode ser preferido devido a outras vantagens: ter maior praticidade na administração do tratamento, ser menos agressivo (traumático), ter menos efeitos adversos.

Alguns exemplos: heparina de baixo peso molecular (novo na década de 90) no tratamento de embolia pulmonar, comparada a heparina não fracionada (tradicional) . Ambos vão anticoagular o paciente, portanto não há grandes motivos para se acreditar que o novo será melhor.  Porém a HPBM tem administração subcutânea, não precisa de acesso venoso, não necessita de controle do nível de anticoagulação, eliminando a necessidade de exames laboratoriais frequentes e permitindo alta da UTI mais precoce. É grande a vantagem prática.

Dabigatran é um anticoagulante oral que não necessita de controle do tempo de protrombina. Mesmo que não fosse superior aos cumarínicos, possuiria uma enorme vantagem prática. 

Trombolítico de administração em bolus (TNK-tPA) são mais práticos do que rt-PA cuja administração requer infusão de 90 minutos. Mesmo que não sejam superiores, podem ser preferidos.

Angioplastia coronária é um tratamento menos agressivo e mais confortável para o paciente, quando comparado a cirurgia de revascularização. Angioplastia pode ser menos eficaz que cirurgia no controle de angina, porém a vantagem da menor agressividade pode justificar a opção por este tratamento.

Nestas situações, o tratamento novo pode ser justificado se ele não for muito pior do que o tratamento tradicional. Digo muito pior, pois nos estudos de não inferioridade se tolera uma certa margem de inferioridade, uma margem que pode ser compensada por outras vantagens. Isto que dizer que não inferioridade não é sinônimo de equivalência. Não inferioridade significa que não é suficientemente inferior para anular a vantagem prática no novo tratamento.

A margem aceitável de inferioridade nunca deve ultrapassar o razoável, nunca deve haver perda de mais de 50% de eficácia do tradicional em relação ao controle (preferencialmente bem menos que isso). Os autores determinam previamente a margem que definirá não inferioridade. Por exemplo, se vamos tolerar apenas uma perda de 20% da eficácia, o limite superior do intervalo de confiança do risco relativo não deve ultrapassar 1.2. Imaginem, RR = 1.1 (95% IC = 1.03 – 1.19) não ultrapassou o 1.2, então consideramos isto não inferior. Isto pode ser feito tanto com risco relativo, como com risco absoluto.

Com base nisso, calcula-se o valor de P, cuja interpretação é o contrário de estudos de superioridade. Ou seja, P < 0.05 indica não inferioridade, mostrando que significância estatística neste caso mostra uma ausência de diferença grande (nos estudos de superioridade P < 0.05 indicam diferença).

Parece confuso, mas é só entender que o estudo de não inferioridade testa a hipótese nula de que o tratamento novo é inferior. Caso P < 0.05 rejeita-se a hipótese nula e ficamos com a hipótese alternativa de que o tratamento novo é não inferior. Estatisticamente, hipótese nula e alternativas estão trocadas em relação aos estudos de superioridade.

Em suma, se o intervalo de confiança não ultrapassar o limite de pouco pior, consideramos não inferior. Ou, se o valor de P estiver abaixo de 0.05, consideramos não inferior.

Vamos agora à situação prática que nos motivou a escrever esta postagem, o estudo PRECOMBAT, recentemente publicado no NEJM.

Tradicionalmente, lesões de tronco de coronária esquerda possuem indicação cirúrgica quase inquestionável. Porém, o tratamento de angioplastia com stent tem evoluído, se tornando factível o procedimento em tronco. Não podemos partir de premissa de que angioplastia é superior a cirurgia, mas poderíamos imaginar que se não fosse muito pior, a vantagem de evitar uma cirurgia de risco poderia compensar. Desta forma, o estudo PRECOMBAT é um estudo de não inferioridade da angioplastia versus cirurgia de tronco. Faz sentido, não?

Assim, os autores definiram que 7% seria a margem de não inferioridade, ou seja, o limite superior do intervalo de confiança do aumento absoluto de risco de morte, infarto, AVC ou necessidade de revascularização. Sem dúvida, esta margem está ampla demais, 7% aumento de risco absoluto representaria um NNT de 19 (100/7) para provocar um evento indesejado se angioplastia fosse realizada ao invés de cirurgia. Mas mesmo assim, poderíamos considerar isso aceitável em pacientes de altíssimo risco cirúrgico ou que se recusem a fazer cirurgia.

Bem, no seguimento de um ano, o aumento absoluto de risco não ultrapassou essa margem (absolute risk difference, 2.0 percentage points; 95% confidence interval −1.6 to 5.6; P=0.01 for non- inferiority), porém a incidência de eventos foi menor do que o esperado, fazendo com que esta análise tivesse baixo poder estatístico. Assim os autores prolongaram a análise para o seguimento de 2 anos. Só que neste momento (espertamente), eles modificaram a regra do jogo e fizeram uma análise de superioridade (ilógica), na qual não mostraram diferença significante. Caso tivessem mantido a estratégia, o estudo não teria comprovado não inferioridade da angioplastia.

Desta forma, terminamos esta  postagem com duas mensagens principais: (1) estudos de não inferioridade representam uma metodologia útil e necessária para muitos casos; (2) devemos estar atentos para a esperteza de autores que burlam regras metodológicas no intuito de comprovar suas hipóteses.

Esta esperteza foi tão evidente que nos motivou enviar uma carta ao editor, aceita para publicação no NEJM no dia seguinte à sua submissão. Terminamos esta postagem com o teor de nosso texto:

To the Editor: In their report on a noninferiority trial involving patients with left main coronary artery disease, Park et al. (May 5 issue) conclude that percutaneous coronary intervention (PCI) was noninferior to coronary-artery bypass grafting (CABG). However, the authors recognize that a lower-than-expected incidence of the primary end point at 1 year provided insufficient statistical power. Therefore, a 2-year analysis was reported, with a cumulative incidence of the primary end point of 12.2% for PCI and 8.1% for CABG. At this point, the authors shifted the statistical approach to a superiority analysis and reported a P value of 0.12, indicating no significant difference between the two groups.

Taking the number of events listed in Table 2 of the article, we calculated the 95% confidence interval for the 2-year incidence of events as 9 to 16% for PCI and 5 to 12% for CABG. Considering these limits, we estimated the 95% confidence interval for the difference between the treatments as −3 to 11%, which encompasses the predefined noninferiority margin of 7%. Therefore, if the authors had used the initial approach of nonineriority analysis in analyzing the 2-year data, the conclusion would be that PCI did not meet the noninferiority criterion, as compared with CABG.