terça-feira, 18 de setembro de 2012

III Curso de Medicina Baseada em Evidências


Anualmente, fazemos em Salvador o Curso de Medicina Baseada em Evidências, que tem como intuito transmitir conceitos metodológicos básicos e avançados, discutir a abordagem filosófica da medicina baseada em evidências e oferecer um roteiro prático de como analisar e aplicar evidências científicas. O curso é bastante interativo, com muitos exemplos práticos e participação ativa da platéia na discussão.

Como normalmente ocorre, será realizado no Hospital São Rafael, nos dias 09 e 10 de novembro. As atividades ocorrerão sexta a tarde e durante todo o dia de sábado, tendo o formato de curso de imersão.

A inscrição poderá ser feita no local (no primeiro dia, sexta). Se quiserem se prevenir, podem fazer inscrição prévia. Para tal, façam contato telefônico de acordo com a orientação do cartaz abaixo. Cliquem no cartaz para ampliar.

Espero vocês.



sábado, 1 de setembro de 2012

Devemos congelar pacientes? – O Mito da Hipotermia na Parada



Texto escrito por Luis Correia e Márcia Noya

Nos últimos anos, temos experimentado um crescente entusiasmo pela terapia de hipotermia após reanimação cardio-respiratória. Uns mencionam que esta conduta é recomendada pelo ACLS, outros lembram do impressionante número necessário ao tratar de 6 para prevenir uma morte, alguns consideram a adoção desta conduta um marcador de qualidade em unidades de tratamento intensivo.

Paradoxalmente, percebemos que este não é um tratamento implementado na maioria das UTIs do Brasil. Então, das duas uma: ou somos muito incompetentes ao ponto de deixar de implementar uma terapia com NNT de 6; ou na verdade a hipótese nula da ausência de benefício não foi rejeitada pelas evidências atuais.

Para esclarecer qual das duas alternativas é a verdadeira, precisamos fazer uma análise das evidências que testaram a hipótese de que “congelar” pacientes traz benefícios neurológicos e preservam vida.

Assim, temos que voltar no tempo até fevereiro de 2002, quando o New England Journal of Medicine publicou simultaneamente dois ensaios clínicos com resultados positivos a favor do benefício da hipotermia, um trabalho austríaco e outro australiano. O primeiro com (pasmem) apenas 77 pacientes e o segundo com (pasmem) apenas 275 pacientes pós-parada. Analisaremos estes trabalho de acordo com os critérios indicados na série de postagens sobre análise crítica de evidências sobre terapia. Há ainda dois trabalhos menores (2001 e 2012), os quais não mencionarei nesta postagem por questão de espaço e porque estes não mudariam nosso raciocínio.

Efeito de Confusão

Sabemos que o ideal é a randomização para os grupos tratamento ou controle, pois desta forma não há tendenciosidade da escolha da conduta, o que torna os grupos semelhantes em características clínicas, reduzindo a possibilidade de efeito de confusão como explicação do resultado. O estudo australiano (o menor deles) de fato randomizou (sorteou) pacientes para tratamento ou controle. A despeito do pequeno tamanho amostral, esta randomização foi suficiente para tornar os dois grupos semelhantes, tal como demonstrado na tabela de características clínicas do estudo.

Por outro lado ... embora o estudo austríaco tente nos induzir a achar o contrario, este não foi um estudo randomizado. Os autores descrevem patients were randomly assigned to hypothermia or normothermia according to the day of the month, with patients assigned to hypothermia on odd-numbered days”. Esta é na realidade uma frase paradoxal, pois este não se constitui em um método (aceitável) de randomização. Randomização pressupõe imprevisibilidade para qual grupo o paciente será alocado. Esta imprevisibilidade previne tendenciosidade na alocação de pacientes menos graves para o grupo tratamento. Percebam. Se hoje é dia ímpar, o paciente será alocado para o grupo “congelamento” caso este seja incluído no estudo. Sabendo disso, podemos não incluir no estudo pacientes de pior prognóstico em dias ímpares, sendo mais liberais na inclusão de pacientes em dias pares. Esse processo (mesmo que inconsciente) promove uma maior possibilidade de fatores de confusão explicando os resultados. E foi justamente este estudo que não mostrou uma tabela completa comparando características clínicas entre os dois grupos. A tabela se limitou basicamente a dados da reanimação.

Sendo assim, um dos dois estudos pode ter sofrido de um processo de alocação não randomizado. Fico a me perguntar o que custava sortear o paciente na chegada; por que a escolha desse questionável método de alocação? Será que nos dias pares uma equipe melhor preparada ficava de sobreaviso para implementar a hipotermia? Isso seria outro viés, um viés de qualidade da equipe.

Viés de Aferição

Embora ambos os estudos descrevem que avaliação do desfecho neurológico tenha sido realizada por um pesquisador cego em relação à alocação do tratamento, não podemos considerar este um estudo cego. Do ponto de vista do paciente, pode até ser cego, pois o mesmo estava em coma. No entanto, toda a UTI sabia que o paciente estava sendo resfriado. Mesmo que o médico que avaliou o desfecho não soubesse, pode ser que a alocação aberta para um tratamento complexo e experimental como hipotermia tenha promovido mais grau de atenção e cuidado para este paciente, em comparação ao paciente que recebeu o tratamento monótono e usual que todos sempre recebem. Mesmo que não seja possível cegar o tratamento neste caso, um esforço especial deveria ser feito para que o tratamento do grupo controle fosse tão bom quanto o grupo hipotermia. Em ambos os trabalhos parece que isto pode não ter ocorrido. Na verdade, a média de temperatura do grupo controle foi acima de 37oC em ambos os estudos. É como se houvessem comparado “febre” versus hipotermia, e não normotermia versus hipotermia. Mesmo que esta "febre" não tenha influenciado diretamente no desfecho, esta representa um marcador de que este grupo não foi tratado com excelência. Por outro lado, toda a atenção necessariamente dispensada aos pacientes “congelados” possivelmente promoveu um tratamento excelente qualidade.

Observe que isto gera um viés de aferição. Devidos a estes mecanismos, o que pode ter sido aferido não foi o efeito da hipotermia, mas sim a excelência de tratamento recebido por estes pacientes. Não podemos garantir que isto não ocorreu.

Acaso

Quando identificamos um valor de P estatisticamente significante, consideramos que a probabilidade da diferença observada ocorrer se a hipótese nula for verdadeira é muito pequena. Por isso rejeitamos a hipótese nula e passamos acreditar na diferença encontrada. No entanto, a validade do valor de P depende também do poder estatístico do estudo. Ou seja, em um estudo positivo a despeito de reduzido poder estatístico, o valor de P pode ter aparecido estatisticamente significante por acaso.

A explicação disto está no fato de que quando o tamanho amostral é muito pequeno, uma diferença muito grande entre os dois grupos é necessária para que se consiga significância estatística. Diferença tão grande que se torna inverossímil. Diferença tão grande que mais provavelmente decorreu do acaso. Por isto que quando o poder estatístico é insuficiente, o valor de P tende a subestimar o acaso. Ou seja, o acaso pode ter ocorrido, apesar do valor de P < 0.05.

Não é que o cálculo do valor de P esteja errado. É porque do ponto de vista de uma análise qualitativa, a observação tem mais proximidade com a possibilidade do acaso. Por exemplo, se uma coisa absurda acontecer, com um valor de P = 0.01, é mais provável que a coisa caiu exatamente no 1% dos resultados extremos com a hipótese nula verdadeira, do que se a coisa não fosse absurda. Este é um pensamento sutil, mas muito verdadeiro.

Desta forma, se faz necessário que o estudo tenha um poder estatístico para detectar uma diferença predeterminada entre os grupos e que esta diferença seja razoável.  Em nenhum dos dois trabalhos isso ocorreu. Enquanto o estudo austríaco não descreveu cálculo do tamanho amostral, o estudo australiano calculou um tamanho amostral que dá um poder de 80% para detectar uma diferença sem precedentes em nenhum estudo sobre terapia, ou seja, uma diferença absoluta de 36%. É muito otimismo, isso é irreal.

Viés de Publicação

O fato de que o resultado positivo ocorreu simultaneamente em dois estudos independentes, feitos em diferente locais do mundo, nos induz a pensar que de fato o efeito benéfico observado deve ser verdadeiro. Isso seria verdade se apenas estes dois estudos fossem os que tivessem sido realizados em todo o universo. E nesse momento entra o viés de publicação.

Sabemos que isso não é verdade, ou seja, outros estudos devem ter sido realizados. Imaginem 30 estudos, em diferentes locais do mundo, todos de pequeno tamanho amostral, tal como os que estamos discutindo. Agora imaginem que a hipótese nula é verdadeira, ou seja, que na verdade hipotermia não serve para nada. Neste contexto, consideremos que 28 destes estudos mostram o resultado correto, ou seja, semelhança entre os grupos. E dois destes estudos mostram resultado positivo, meramente por acaso. Neste contexto, os dois estudos positivos possuem maior probabilidade de serem aceitos para publicação em revistas de impacto do que os 28 que mostram resultados negativos. Além disso, muitos dos estudos de resultados negativos nem mesmo são escritos ou submetidos para publicação pelos autores. Isso promove um viés de publicação a favor de estudos positivos.

O viés de publicação é um fenômeno inerente de estudos pequenos, geralmente unicêntricos. Grandes estudos multicêntricos são publicados, mesmo quando negativos. Mas os estudos pequenos ficam mais vulneráveis a este fenômeno. Isso ocorre devido à dificuldade de publicar um estudo pequeno. Assim, estes estudos precisam ser pelo menos positivos, para atrair a atenção de revisores e editores para a aceitação do artigo.

O viés de publicação vem de nossa inadequada tendência a valorizar mais dados positivos do que dados negativos, como retratado na frase de Francis Bacon: "It is peculiar and perceptual error of the human understanding to be more moved and excited by affirmatives than negatives."


Crendice versus Ciência

Já comentei previamente neste Blog o problema da mente crente. Por questões evolutivas, nossa mente tende a acreditar mais em dados positivos do que em dados negativos. Corroborando com a mente crente, temos a mentalidade do médico ativo, onde nos sentimos mais úteis, melhores médicos, se adotarmos condutas novas e interessantes, em detrimento do pensamento científico.

São muitos os que argumentam insistentemente de que precisamos fazer coisas sem evidências, pois não há evidência para todo tipo de conduta. Chegam a estragar a inteligente frase “ausência de evidência não é evidência de ausência”, quando a utilizam para sofismar a favor da adoção de terapias sem base científica. Aplicar esta frase como justificativa para adotar uma terapia é inadequado. Esta frase foi criada no contexto de que certos estudos negativos podem não ser definitivos. Neste caso, a frase está estimulando estudos futuros, com maior poder estatístico, por exemplo. Mas a idéia da frase não deve ser usada na tomada de decisão clínica, permitindo a adoção de condutas incertas.

Esta  discussão está no cerne dos princípios da medicina baseada evidências, já colocados inúmeras vezes em postagens deste Blog. Primeiro, devemos avaliar se o caso corresponde a uma situação de plausibilidade extrema, o princípio dopára-quedas. São situação óbvias, que não devem requerer um ensaio clínico para confirmar a idéia. É a efetividade do pára-quedas na prevenção de morte durante salto livre de uma avião em pleno vôo; o caso do diurético no edema agudo de pulmão; insulina no diabético tipo I; laparotomia em indivíduo baseado no abdômen. Se estamos diante de plausibilidade extrema, devemos adotar a conduta, pois nunca existirá um estudo para testar esta hipótese, porque estes estudos seriam desnecessário e anti-éticos.

As demais situações, que correspondem à maioria da terapias em medicina, partem do princípio da equipoise, ou seja, quando há uma dúvida suficiente para justificar um estudo controlado, onde parte dos pacientes não adotem a terapia. Nestas situações devemos partir do princípio da hipótese nula, onde a premissa é de ausência de benefício, e quando surgem evidências suficientes, rejeitamos a hipótese nula e ficamos com a hipótese alternativa de que a conduta deve ser adotada.

Mas qual seria o prejuízo de preferir preferir o princípio da crendice, em detrimento da hipótese nula?

Primeiro, muitas terapias cuja expectativa é de serem benéficas, podem na verdade ser maléficas. Muitos são os exemplos na literatura em que o princípio da crendice foi utilizado, a terapia foi adotada e depois descobriu-se que a coisa era maléfica, sendo a conduta suspensa: a adoção de terapia de reposição hormonal para prevenção vascular, otimização do nível de hemoglobina em pacientes críticos pela conduta de transfusão liberal, terapia agressiva com insulina em paciente críticos, para citar apenas uns dos múltiplos exemplos históricos.

No caso particular do “congelamento”, pensemos. Essa terapia foi testada em pacientes que apresentaram morte súbita presenciada, cuja etiologia principal é a doença aterosclerótica coronariana. Estes paciente podem estar com alguma lesão coronária instável, tipo uma artéria subocluída. Qual será o efeito do “congelamento” nesta coronária. Será que causaria vasoespasmo, piorando o status isquêmico do paciente? Não sabemos, mas esta idéia mostra que há plausibilidade para o malefício também . Outro potencial prejuízo seria o enfoque na terapia de “congelamento”, em detrimento de condutas mais voltadas para a etiologia do problema, como a realização de cateterismo cardíaco de urgência em alguns casos.

O segundo grande prejuízo do princípio da crendice é o fenômeno denominado reversão médica. Este fenômeno é caracterizado pelo vai e vem dos paradigmas. Ou seja, paradigmas que são criados sem base científica, sendo depois derrubados por evidências. O prejuízo da reversão médica é mais coletivo do que individual. É o prejuízo de uma cultura precipitada em criar idéias, fazendo do que deveria ser conhecimento científico, um processo caótico e pouco criterioso de acúmulo de pensamentos. Além disso, quando ocorre reversão médica, alguns dos falsos paradigmas podem estar tão enraizados no inconsciente coletivo, que fica difícil derrubá-los.

Em terceiro lugar, a dúvida de se um tratamento é benéfico, maléfico ou neutro muitas vezes vem junto com a certeza de que o tratamento gera gastos significativos (Xigris), prolongamento do internamento para realização de procedimentos desnecessários (tipo uma fechamento de FOP) e muitas vezes sofrimento ao paciente e sua família.


Expectativa

Em minha opinião, a evolução da medicina no próximo século dependerá muito mais da evolução do pensamento médico, do que do surgimento de novos tratamentos. Se por algum motivo (não estou propondo isso) descobertas de novos tratamentos fossem congeladas por um século e o enfoque passasse a ser no estudo do raciocínio médico e de como melhor aplicar o conhecimento que já temos, esta seria uma era de renascimento. Uma era de muito mais evolução e benefício para os pacientes do que observamos hoje.

Torço para que estudos futuros de boa qualidade testem corretamente a hipótese do “congelamento” e tomara que esta conduta seja benéfica. Porém minha torcida maior, com otimismo, é para que este venha a ser um século de iluminismo do pensamento médico.

terça-feira, 28 de agosto de 2012

Medicina Baseada em Evidências Comenta Munich - ESC 2012



Até então, quatro estudos chamaram mais atenção no Congresso Europeu de Cardiologia, em Munich. Abaixo comentários sob a visão da medicina baseada em evidências.

IABP Shock II: ensaio clínico randomizado, indicando que balão intra-aórtico não reduz mortalidade em pacientes com infarto Killip IV. Mais um dos inúmeros exemplos de que plausibilidade biológica (ou plausibilidade mecânica) não garante eficácia clínica. Mais um conceito enraizado na mente dos cardiologistas que cai por terra, pois nunca deveria ter sido criado na ausência de evidências. Mais uma demonstração do Princípio da Hipótese Nula, que indica que as condutas devem ser embasadas em demonstração de benefício, salvo aquelas de plausiblidade extrema. Mais uma demonstração de que plausibilidade extrema se refere a coisas indubitáveis, não é o mesmo que plausibilidade moderada.  Fica a pergunta: qual o custo e o impacto clínico de complicações vasculares decorrente desta conduta, aplicada desnecessariamente por tantos anos? Agora é esperar para ver como a comunidade reagirá a esta evidência. Se seguir a mesma tendência que ocorre com o estudo OAT (rejeição de uma evidência que vai de encontro a nossa crença), continuaremos a usar BIA. 

FAME-II: ensaio clínico randomizado que compara angioplastia versus não angioplastia de lesões funcionalmente importantes de acordo com FFR, em pacientes com tratamento clínico otimizado. Foi observado redução do desfecho composto de morte, IAM e necessidade de revascularização no grupo angioplastia. Vale a pena ler de novo nosso comentários críticos feitos neste Blog há alguns meses, os quais se confirmam com a publicação na íntegra do trabalho. Mais um estudo truncado, conduta injustificada e tendenciosa a favor do tratamento ativo. Em segundo lugar, a redução do desfecho composto se deu apenas por redução da necessidade de revascularização. Este é exatamente o resultado do COURAGE, ou seja, mais uma confirmação de que angioplastia não reduz morte, nem IAM, reduzindo apenas sintomas. O COURAGE foi confirmado e não negado pelo FAME-II. Mesmo assim, precisamos observar que este é um estudo aberto, o que tende a reduzir o limiar de decisão por revascularização no grupo de tratamento clínico. Enfim, vamos esperar para ver a reação dos entusiastas por tratamento invasivo. Será que usarão este estudo como argumento?

ALTITUDE: ensaio clínico randomizado que testa o uso de Aliskireno associado a IECA ou BRA em pacientes com nefropatia diabética? Como mencionado em postagem anterior, "uma droga não embasada em evidências", porém já comercializada e prescrita. Bem, o estudo não mostrou redução do desfecho combinado primário, evidenciando uma tendência a aumento de AVC. Claro, dar droga demais pode não ser boa idéia.

WOEST: ensaio clínico inteligente, que testa hipótese clinicamente útil. Em pacientes anticoagulados por outros motivos, precisamos usar AAS e Clopidogrel ou apenas Clopidogrel após angioplastia? Apenas Clopidogrel manteve a eficácia na prevenção de trombose do stent, acompanhada de redução significativa na incidência de sangramento maior. Essa evidência vai mudar conduta. Mais uma confirmação do Princípio do Less is More.

TRILOGY-ACS: ensaio clínico randomizado, comparando Plasugrel com Clopidogrel em pacientes com SCA tratados clinicamente. Não tem jeito para o Plasugrel, mais uma evidência contra sua implementação, estudo negativo. Seria de se esperar, pois quanto menos grave é o paciente (evidenciado por tratamento  clínico em SCA), menor o impacto  positivo de exacerbar a terapia anti-trombótica.

Enfim, tentos resultados negativos enfatizam a necessidade de não adotarmos condutas com base em crença. A crença serve para gerar hipóteses, que precisam ser comprovadas antes de implementadas.

sexta-feira, 24 de agosto de 2012

Jorge Pinto Ribeiro


“A teacher affects eternity; he can never tell where his influence stops.” 
― Henry Adams

Esta frase se aplica perfeitamente a Jorge, um indivíduo de pensamento embasado em evidências,  provocador de reflexões, desafiador de paradigmas, cientista de grande produção científica, formador de grandes cardiologistas e acadêmicos. Sentiremos falta, mas sempre na certeza de que Jorge é uma das pessoas cuja obra acadêmica lhe eternizou.







domingo, 15 de julho de 2012

O Pensamento Univariado e o Uso Indiscriminado de Stents Farmacológicos



Dando sequência à reflexão do multivariado versus univariado, um dos maiores exemplos clínicos da inadequada predominância do pensamento univariado é a escolha pelo tipo de stent (convencional ou farmacológico) a ser usado no tratamento de obstruções coronárias.

Esta questão foi muito bem retratada em um importante artigo publicado (online first) esta semana nos Archives of Internal Medicine, intitulado Use of Drug-Eluting Stents as a Function of Predicted Benefit, o qual demonstrou como os stents farmacológicos são usados de forma indiscriminada nos Estados Unidos. Neste trabalho, foram analisados 1.5 milhão de procedimentos realizados entre 2004 e 2010, dados provenientes de um registro nacional de intervenção coronária.

Para contextualizar esta questão, os stents farmacológicos são próteses que apresentam um risco de reestenose coronária menor do que os stents convencionais. No entanto, seu custo é maior, tanto o custo financeiro como o custo da necessidade de terapia anti-agregante plaquetária agressiva por mais tempo. Não há vantagem do stent farmacológico em relação ao risco de infarto ou morte. Portanto, a escolha de stents farmacológicos deve ser criteriosa, para valer a pena o custo de sua utilização.

Para sabermos se vale a pena, temos que pensar na magnitude de seu benefício, ou seja, no NNT do stent farmacológico (no lugar do convencional) para se prevenir uma reestenose. Reestenose é um inconveniente, mas não é exatamente um desfecho na mesma importância de morte, infarto ou AVC. Portanto, somos mais exigentes com o NNT e considera-se que um NNT de 25 é razoável para justificar o uso de stent farmacológico. Significa implantar stents farmacológicos em 25 pacientes para que apenas um paciente se beneficie da prevenção de reestenose. Vejam que estamos sendo bondosos.

Para uma mesma redução relativa do risco (em torno de 40% de acordo com trabalhos prévios), quanto maior o risco absoluto de reestenose, maior a redução absoluta do risco e consequentemente menor (melhor) será o NNT. Sendo assim, é necessário que o risco absoluto de reestenose com o stent convencional seja de pelo menos 10%, para que a redução absoluta do risco seja de 4%, o que dará o NNT de 25.

Mas como saber o risco absoluto de reestenose? No ano passado foi publicado importante trabalho no Circulation (Predicting the Restenosis Benefit of Drug-Eluting Versus Bare Metal Stents in Percutaneous Coronary Intervention), o qual validou um modelo multivariado que calcula a probabilidade de reestenose com base em muitas variáveis clínicas e angiográficas, denominado MassDAC model. Este modelo é disponível na internet para que calculemos o risco de reestenose se o paciente utilizar stent convencional, podendo assim selecionar os de maior risco para o stent farmacológico. 

No trabalho publicado nesta semana, os autores utilizaram o MassDAC e calcularam o risco de reestenose dos 1.5 milhão de pacientes, dividindo-os em baixo risco (< 10%), moderado risco (10 – 20%) e alto risco (> 20%). Na amostra, 43% dos pacientes eram de baixo risco, 44% eram de moderado risco e apenas 13% de alto risco. Em seguida foi descrita a proporção dos pacientes em cada grupo que tiveram a escolha por stent farmacológico.

Seria de esperar que quanto maior o risco basal de reestenose, maior o uso do stent farmacológico. Porém, impressionou o quanto semelhante foi a frequência de stent farmacológico nos grupos de baixo, moderado e alto risco. Respectivamente, 74%, 78% e 83%. Ou seja, o stent farmacológico é muito usado em pacientes de baixo risco, quase na mesma proporção dos pacientes de alto risco. E estas proporções são bastante altas.

É neste momento que entra a discussão do pensamento univariado versus multivariado. O modelo utilizado pelo trabalho para predizer reestenose foi multivariado, ou seja, considerou todas as variáveis que se associam de forma independente com o risco, dando o peso que cada uma merece de acordo com sua força de associação.  Diferentemente, o que os médicos têm feito na decisão do stent é um pensar de forma univariada:

Se o paciente for diabético, escolherei stent farmacológico, não importa as demais variáveis.
Se o diâmetro da lesão for < 3 mm, escolherei stent farmacológico, não importa as demais variáveis.
Se a lesão for longa, escolherei stent farmacológico, não importa as demais variáveis.
E outros critérios, que somados não dão chance a quase ninguém de receber um stent convencional. Por isso que só sobra 20% utilizando o stent convencional.

Os autores estimaram que uma redução de 78% para 50% de uso de stent farmacológicos nestes pacientes de baixo risco, geraria uma economia de 205 milhões de dólares. 

Sabemos que as instituições ganham com o uso de materiais de alto custo. E aí está uma simbiose do pensamento univariado com o conflito de interesse a favor dos stents farmacológicos. É muito mais fácil justificar a escolha com um único e simples argumento univariado, do que ficar a mercê da real probabilidade de reestenose, calculada a partir do conjunto das variáveis relevantes.

Corroborando com estes achados, em trabalho realizado por nosso grupo, demonstramos que o julgamento de um intervencionista treinado no pensamento univariado indica muito mais stent farmacológico do que o modelo multivariado (dados ainda não publicados).

Este é um dos grandes exemplos de um pensamento univariado prejudicando o sistema de saúde. Ao contrário da realidade americana, no Reino Unido o uso do stent farmacológico é muito mais restrito. E o desfecho dos pacientes ingleses não é em nada pior do que os americanos. O modelo de gasto americano deve servir de exemplo do que não fazer.

No entanto, nós imitamos os americanos direitinho e ainda ficamos a reclamar quando nossa remuneração não é boa. Claro, essa não é a única causa da baixa remuneração médica, porém precisamos perceber que nessa discussão deve entrar nossa parte de responsabilidade na equação. Se estamos queimando os recursos com utilização indiscriminada, vai sobrar menos para nosso salário. Desta forma, acredito que uma discussão madura deva contemplar propostas médicas de uso racional dos recursos. Principalmente para o serviço público, mas também para o privado. Esse é o racional da proposta de Obama para universalizar o sistema de saúde americano, sem necessariamente aumentar impostos. Seria saúde para todos, oferecida de forma mais racional, sob um custo menor.

Outra exemplo comum: como podemos reclamar do valor que nos pagam pelo teste ergométrico, se a grande maioria das indicações são inapropriadas? Pacientes assintomáticos ou de baixa probabilidade pré-teste representam a maior parte da população submetida a este exame. Modelos multivariados devem primeiro estimar a probabilidade pré-teste e indicar o teste naqueles de probabilidade intermediária.

Em conclusão, o cerne da questão está nossa tendência (natural) de pensar de forma univariada. Esse tipo de pensamento é principal responsável pelo uso indiscriminado de stents farmacológicos, descrito no artigo recém publicado. É mais um exemplo da importância do pensamento multivariado. O modelo probabilístico multivariado está disponível, é só utilizar.

Programação do Simpósio de Cardiologia Baseada em Evidências

Simpósio Pré-Congresso Brasileiro de Cardiologia - clique na figura para ampliar


quinta-feira, 12 de julho de 2012

sábado, 7 de julho de 2012

Mundo Univariado versus Mundo Multivariado



Nosso mundo é multivariado, no sentido de que vários fatores influenciam simultaneamente a ocorrência de um evento. No entanto, nossa mente é mais condicionada a pensar de forma univariada, o que gera alguns equívocos científicos. Na realidade, não existe uma causalidade cartesiana, aquela na qual um único fator determina um desfecho. Principalmente em se tratando de sistemas biológicos, que são tradicionalmente classificados como sistemas complexos, representados pela figura acima.

Um exemplo destes equívocos é a conclusão da meta-análise publicada esta semana no Journal of the American College of Cardiology, cujo titulo é  Invasive or Conservative Strategy in Patients With Diabetes Mellitus and Non–ST-Segment Elevation Acute Coronary Syndromes: A Collaborative Meta-Analysis of Randomized Trials. Os autores do trabalho concluíram que “These data support the updated guidelines that recommend an invasive strategy for patients with diabetes mellitus and non–ST-segment elevation acute coronary syndromes.”

Ou seja, se for diabético, a estratégia deve ser invasiva. Será?

Esta é uma meta-análise dos 9 principais ensaios clínicos que compararam a conduta invasiva versus conversadora em síndromes coronarianas agudas sem supradesnível do segmento ST. Em uma análise de subgrupo, os autores da meta-análise nos mostram dados sugerindo que a estratégia invasiva é melhor do que a conservadora na prevenção de infarto nos pacientes diabéticos; por outro lado, nos não diabéticos, as estratégias são semelhantes. Portanto, se o paciente é diabético, devemos preferir a estratégia invasiva, segundo os autores. 

Não quero fugir do tema da postagem, entrando em aspectos metodológicos do estudo que reduzem a confiabilidade desta análise. Mas só para registrar, esta é uma conclusão tirada a partir de análise de subgrupo e de apenas um desfecho, o que foi significativo (infarto), pois os demais não mostraram diferença.

Voltando ao tema, o grande problema da conclusão do trabalho é que este raciocínio é puramente univariado. Como se só existisse uma característica a ser avaliada nesta decisão (diabético ou não). Este raciocínio implica que todo diabético é de alto risco e necessita de estratégia invasiva. No mundo real, multivariado, há diabéticos de baixo a alto risco, pois outras variáveis (multi) atuam juntamente com diabetes, determinando o risco final do paciente. Da mesma forma, não diabéticos podem ser de baixo a alto risco. Portanto, é de baixo risco um diabético jovem com angina instável, sem alteração de eletrocardiograma, troponina negativa, sem sinais de congestão pulmonar, estável hemodinamicamente, boa função renal.  Ao passo que um não diabético idoso, com infradesnível do segmento ST, troponina positiva, com congestão pulmonar é de alto risco.

Em nosso mundo multivariado, não podemos considerar apenas uma variável na determinação do risco do paciente. Esta determinação deve ser multivariada, tal como se faz quando usamos um escore de risco validado, que considera todas as variáveis conjuntamente, dando o peso que cada variável merece, calculado a partir de uma análise multivariada (regressão logística ou regressão de Cox, as mais comuns).

O próprio estudo demonstra que a diferença de benefício da estratégia entre diabéticos e não diabéticos depende apenas do risco basal do paciente. Isto porquê a redução relativa do risco de infarto com a estratégia invasiva é igual nos diabéticos e não diabéticos. Ou seja, o tratamento tem o mesmo efeito redutor de risco nos dois grupos. O que difere é a redução absoluta de risco. Quando a redução absoluta do risco com o tratamento difere entre os grupos (diabéticos vs. não diabéticos), mas a redução relativa é constante, não é o tratamento que tem melhor efeito no tipo de paciente, é simplesmente porque sendo o risco absoluto maior, a redução absoluta do risco será maior.

Portanto, o resultado é decorrente do grupo de diabético ser de maior risco na análise univariada. Porém sabemos que no mundo multivariado (mundo real) diabetes não é preditor independente de risco. Querem ver uma coisa? Por que diabetes não faz parte do escore GRACE? Porque naquele grande estudo de coorte, após ajuste para os outros fatores de risco, diabetes perdeu significância.


Sozinha, a informação diabetes não quer dizer nada. A questão é que os diabéticos tem mais troponina positiva, piores alterações eletrocardiográficas, maior idade, pior função renal, etc. Isto já está computado no modelo multivariado (tipo GRACE), portanto neste contexto seria redundante e errado analisar diabetes como um único fator determinante do risco. 


Se a idéia a primeira vista parece estranha, é porque não estamos acostumados a lidar com o pensamento multivariado. Daí a importância dessa discussão.

Portanto, (1) se a interação do tipo de estratégia e diabetes só ocorre com a redução absoluta de risco (não a relativa), (2) a superioridade do tratamento invasivo no diabético depende apenas do fato de que este grupo é de alto risco; (3) porém, no mundo real (multivariado) o simples fato de ser diabético não garante ser o paciente de alto risco; (4) portanto, não é verdadeira a conclusão de que o diabético deve ser sempre (ou quase sempre) submetido à estratégia invasiva.


Quando um ensaio clínico mostra que pacientes com troponina positiva apresentam benefício de estratégia invasiva, não quer dizer que isso ocorrerá em todos os pacientes. Em média, há superioridade desta estratégia, mas análises de subgrupo confirmam que nos pacientes de baixo risco o benefício absoluto é menor ou inexistente. Como mencionei na postagem anterior, critério de inclusão de um trabalho não é exatamente um guia para determinação de que pacientes devem ser submetidos à conduta.

Em síndromes coronarianas agudas sem supradesnível do ST temos duas opções razoáveis: fazer estratégia invasiva de rotina (CAT seguido de procedimento de revascularização em todos) ou individualizar a decisão de acordo com seu risco basal do paciente (estratificação). Se optamos pela segunda forma (minha preferência), devemos considerar simultaneamente os preditores independentes, para estimar de maneira acurada o risco basal do paciente e decidir pela estratégia.

O que tem ocorrido na prática é que as recomendações (guidelines americano e europeu) sugerem fazer estratificação, porém colocam uma série de critérios univariados, que quando isoladamente presentes, devem determinar uma estratégia invasiva. E assim, eles indicam diabetes como critério de invasividade. Na verdade, são tantos os critérios univariados que não sobra quase ninguém para a estratégia conservadora. No fundo, isso é como dizer para ser invasivo de rotina, independente do risco do paciente. Digo independente do risco, pois simplesmente ser diabético não é suficiente para determinar um risco alto. Depende de uma conjunção multivariada de fatores. Seria mais razoável que estes guidelines assumissem a estratégia invasiva como escolha, especificando raras exceções. No fundo, é isso que estão fazendo, porém querem parecer estar estratificando. Isso não é estratificação, pelo contrário.

Uma dos maiores exemplos desse equívoco é o uso isolado da troponina na decisão. Quando consideramos, por exemplo, a análise multivariada realizada na coorte do GRACE, percebemos que (1) troponina é um preditor independente de risco; (2) troponina é apenas um fator na determinação do risco dentre muitos outros, tais como idade, desvio do ST; (3) o peso da troponina positiva não é suficiente para que sozinha esta implique em alto risco. Por exemplo, o peso da troponina é metade do peso do infradesnível de ST.

Sendo assim, temos que pensar em avaliação prognóstica como um processo multivaraiado. O correto é usar troponina, eletrocardiograma, idade, etc, conjuntamente, considerando o peso de cada uma destas variáveis merece após ajuste para as demais. Isto é o que faz um  escore multivariado tipo do GRACE.

Portanto, generalizar que todo paciente diabético deve ser submetido à estratégia invasiva é uma visão reducionista. Limitada a um pensamento univariado, o qual é inadmissível considerando o status atual de conhecimento científico.

Esta discussão exemplifica a necessidade de reconhecermos o mundo como multivariado, evitando assim equívocos científico que podem determinar inadequada utilização dos recursos médicos.

É só olhar ao nosso redor e perceber que o mundo é multivariado. Os exemplos cotidianos, deixo para vocês mencionarem nos comentário do Blog. São muitos ...

segunda-feira, 2 de julho de 2012

Cirurgia Precoce em Endocardite - Analisando um Estudo Pequeno




No último número do New England Journal of Medicine foi publicado o primeiro ensaio clínico randomizado que testou a hipótese de que cirurgia precoce reduz o risco do desfecho combinado de morte ou embolia sistêmica em pacientes com endocardite e grande vegetação em valva nativa. Este trabalho randomizou 76 pacientes para cirurgia em 48 horas da randomização ou tratamento convencional, demonstrando que o grupo cirúrgico reduziu significativamente o risco deste desfecho combinado (3% vs. 23%; P = 0.03), à custa de prevenção de evento embólico (mortalidade foi igual).

Mesmo tendo alcançado significância estatística, ensaios clínicos pequenos como este merecem uma análise crítica mais cuidadosa. Seguindo nosso roteiro de análise critica (1234, 5), vamos avaliar veracidade, relevância e aplicabilidade destes resultados.

Veracidade

O valor de P < 0.05 indica que é pouco provável que este resultado tenha decorrido do acaso. Ou seja, se a hipótese nula fosse verdadeira, a probabilidade de um resultado tão diferente entre os dois grupos (3% vs. 23%) ter aparecido aleatoriamente é de apenas 3%. Isso rejeita a hipótese nula e ficamos com a hipótese alternativa de que a cirurgia é melhor do que o tratamento convencional.

Porém seria simplório parar por aqui. Quando um estudo pequeno assim alcança significância estatística para desfechos duros ficamos a nos questionar se este valor de P representa a realidade. Revisando, o que poderia gerar um valor de P inacurado?

Primeiro, um resultado proveniente de desfecho secundário. Neste caso há o problemas das múltiplas comparações (muitos desfechos testados simultaneamente), fazendo com que haja uma maior probabilidade de significância estatística na ausência de diferença real. Não é o caso deste estudo,  pois a conclusão é baseada no desfecho primário, que foi pré-definido e o tamanho amostral dimensionado para oferecer um poder de 80%.

Segunda preocupação, um estudo truncado pode gerar um valor de P significativo, por acaso. Também não á o caso deste estudo, pois o tamanho amostral planejado de 74 pacientes foi alcançado e o seguimento hospitalar foi completado.

Sendo assim, acreditamos que o valor de P de 0.03 é representativo da realidade.

Mas ainda há um problema capcioso, mas que é real: para um estudo pequeno ter um resultado estatisticamente significante (P < 0.05) em relação a um desfecho categórico (evento ou não evento), é necessário que haja uma diferença absoluta tão grande que esta pode se tornar inverossímil.  A diferença pode ser tão inverossímil que passamos a acreditar mais na possibilidade de que o estudo caiu naqueles 3% de probabilidade desta diferença aparecer na presença da ausência de benefício real (hipótese nula verdadeira). Ou seja, aqui não estamos questionando o valor de P de 3%, este deve está certo. Mas a questão é se o estudo caiu exatamente nestes 3% de probabilidade do resultado ter aparecido aleatoriamente.

Lembram-se do estudo de Poderman, do beta-bloqueador em pré-operatório de cirurgia não cardíaca? Tinha apenas 112 pacientes e mostrou redução de mortalidade (3.4% vs. 17%, P = 0.02). Este enorme benefício é inverossímil, pois nenhuma droga cardiovascular provocou tal redução de mortalidade (nem trombólise no IAM, cuja redução de mortalidade é 1/3 desta), quanto mais beta-bloqueador em cirurgia não cardíaca. Como sabemos, estudos posteriores mostraram que esse benefício não é verdadeiro.

Portanto, devemos nos perguntar se uma diferença absoluta de 20% neste estudo é plausível. Primeiro, 23% de eventos é o que se espera de embolia sem a cirurgia? Parece que sim, de acordo com registros prévios citados pelo próprio autor. Segundo, faz sentido praticamente eliminar o risco de embolia com a cirurgia? Também parece fazer sentido, pois se a vegetação é retirada, não vai embolizar.

Portanto, este resultado não parece ter sido devido ao acaso, devemos acreditar no valor de P e acreditar que um valor de P < 0.05 sugere benefício, pois neste caso a diferença é clinicamente plausível.

Ainda resta a possibilidade dos resultados serem decorrentes de efeito de confusão ou vieses. Efeito de confusão não parece existir, pois a randomização foi suficiente para que as amostras fossem homogêneas. Quanto a vieses, nos preocupamos com o fato do estudo ser aberto poder gerar erro na aferição dos eventos embólicos (tendenciosidade). Porém estes desfechos foram definidos de forma bastante objetiva: embolia teria que ser um evento muito bem caracterizado clinicamente e demonstrado por exame de imagem. Sendo assim, é pouco provável que o resultado seja decorrente deste viés. Quanto ao tratamento, todos os pacientes do grupo cirúrgico foram operados; e apesar de que 70% do grupo convencional foram operados também, estas cirurgias foram bem tardias e todos os eventos registrados nesse grupo ocorreram antes da cirurgia. Portanto, o estudo é adequado para avaliar o benefício da cirurgia precocemente indicada.

Sendo assim, concluímos que o benefício é verdadeiro, de fato a cirurgia previne embolia sistêmica.

Relevância

Se formos calcular, ficaremos impressionados com um NNT de 5. Muito baixo, benefício de magnitude quase nunca observado. É verdade? Tal como mencionamos na postagem do estudo da tenecteplase no AVC, estudos pequenos não possuem precisão na medida do NNT.

Só de olhar o intervalo de confiança do hazard ratio percebemos a imprecisão na magnitude do benefício. Vejam, os autores descrevem um hazard ratio de 0.10, mas com intervalo de confiança que varia de 0.01 a 0.82. Vejam que imprecisão, a redução relativa do risco pode ser tão grande quando 99% a tão pequena quando 16%.  Mas a medida do hazard ratio é relativa, precisamos ir para a redução absoluta e calcular o NNT. O autor não faz isso, porém podemos calcular os intervalos de confiança com um simples software estatístico (WINPEPI, por exemplo):

Risco de embolia/morte no grupo cirúrgico = 3% (95% IC = 0.1% a 13% - que imprecisão!)
Risco de embolia/morte no grupo convencional = 23% (95% IC = 12% a 38% - que imprecisão!)

Sendo assim, a redução absoluta do risco (risco cirúrgico - risco convencional) tem o intervalo de confiança variando de 1% a 38%. Portanto, o NNT (100/RAR) pode variar de 100 (pequeno impacto) a 2.6 (impacto enorme).

Portanto, este estudo não é suficiente para nos garantir que o benefício é de grande magnitude. Isto seria importante, pois se soubéssemos que a magnitude é enorme, insistiríamos em cirurgia mesmo para pacientes de muito alto risco ou instáveis clinicamente. Mas diante da incerteza na magnitude do benefício, a escolha deve ser mais ponderada, caso a caso.

Aplicabilidade

Conhecendo os pacientes pela tabela de características clínicas, 3 aspectos julgo dignos de nota.

Primeiro, o mais óbvio: todos tinham vegetação > 10 mm, tal como definido pelo critério de inclusão. Portanto aqui nos referimos a pacientes com vegetação grande, não qualquer vegetação. Seguindo o raciocínio da postagem anterior (aplicabilidade), há razão para acreditarmos que se a vegetação for pequena, o benefício pode não existir. Como estamos falando de cirurgia cardíaca, um procedimento agressivo, os resultados não devem ser extrapolados para vegetação muito menores que isso.

Segundo, aqui não se tratam de pacientes com infecção descontrolada, sépticos, daqueles que os cirurgiões não gostam de colocar na sala. Digo isso pois os tempo sem febre teve uma mediana de 2 dias, com 75% dos pacientes com mais de um dia sem febre (intervalo interquartil = 1 – 3). Há razão para o resultado cirúrgico ser pior em pacientes sem controle da infecção? Acho que sim. Portanto, não devemos extrapolar estes resultados para pacientes com infecção descontrolada, pois o resultado cirúrgico pode não ser o mesmo.

Corroborando com esta observação, a grande maioria dos casos era por infecção estreptocócica, a mais branda de todas, sendo apenas 10% dos pacientes com infecção por estafilococos.

Conclusão

Embora o resultado seja visualmente impressionante (vide gráfico acima), nossa conclusão deve ser mais ponderada, em se considerando as características deste estudo.

Devemos indicar cirurgia precoce de rotina na endocardite de valva nativa na presença de grandes vegetações e quadro infeccioso parcialmente ou plenamente controlado (em sépticos há incerteza). Mesmo assim, considerando a imprecisão da magnitude do benefício, devemos ponderar a decisão quando nos deparamos com risco cirúrgico muito alto, desconforto do cirurgião quanto às condições do paciente ou desejo do paciente em evitar cirurgia.

Seríamos mais enfáticos na indicação se a mesma magnitude de benefício fosse demonstrada em estudo de grande porte, de maior precisão. Mas este provavelmente nunca existirá ...

domingo, 1 de julho de 2012

Simpósio de Cardiologia Baseada em Evidência no Congresso Brasileiro em Recife

Colegas, nós do Grupo de Estudos em Cardiologia Baseada em Evidências organizamos cuidadosamente este Simpósio de imersão nos conceitos de medicina baseada em evidências. Terá a participação dos grandes nomes da cardiologia baseada em evidências, que transmitirão conceitos importantes de análise crítica da literatura médica. Além de palestras, este simpósio terá um foco reflexivo, priorizando os momentos de discussão aberta sobre os temas. 

Precisamos desenvolver uma análise crítica em relação aos conhecimentos que nos são apresentados. Nada melhor do que iniciar o congresso com esta abordagem.