Medicina Baseada em Evidências: setembro 2014

No início desta semana, foi apresentado no Congresso Europeu de Cardiologia e simultaneamente publicado no New England Journal of Medicine o ensaio clínico PARADIGM-HF. A comunidade cardiológica tem considerado esta a mais importante notícia das últimas duas décadas quando se trata de insuficiência cardíaca. O entusiasmo a respeito deste estudo se deve ao fato de que, pela primeira vez em 20 anos, um tratamento mostra redução adicional de mortalidade em pacientes com insuficiência cardíaca.

O PARADIGM-HF testa uma droga denominada LCZ696. Este que se parece nome de uma engenhosa molécula, na verdade é a combinação do velho valsartan com uma nova droga denominada sacubritil. Este sacubritil inibe a ação do neprilysin. O neprilysin age degradando boas moléculas, como peptídeo natriurético e bradicinina. Quando inibimos o neprilysin, aumentamos a concentração dessas boas moléculas, que têm ação vasodilatadora e natriurética.

Antes do nos definirmos entusiasmados com o LCZ696, precisamos analisar o trabalho e determinar o nível de evidência em que este se encaixa. Determinado o nível de evidência, discutiremos a força de recomendação deste tratamento. O entusiasmo deve ser diretamente proporcional ao nível de evidência e força de recomendação.

Começando pelo nível de evidência, este depende de três fatores: veracidade, relevância e aplicabilidade da informação.

Adianto que o grande diferencial desta postagem estará na análise de aplicabilidade. Mas antes de chegar lá, temos que passar por veracidade e relevância.

VERACIDADE

Como sabermos, dois fatores podem interferir na veracidade da evidência: erros sistemáticos (vies) e de erros aleatórios (acaso).

Em análise sistematizada, percebemos que o estudo tem baixo risco de viés: randomizado (evita viés de confusão), duplo-cego (evita viés de desempenho e viés de aferição do desfecho), análise por intenção de tratar (preserva a homogeneidade da randomização), pequena perda de follow-up.

Quanto ao erro aleatório, este é um estudo com adequado poder estatístico e sem situações que reduziriam confiabilidade do valor de P: as conclusões positivas são baseadas em desfecho primário e em toda a amostra do estudo (em vez de desfechos secundário ou análise de subgrupo).

Resta uma preocupação, que poderia reduzir a precisão dos achados: este foi um estudo truncado, o que predispõe a superestimava do benefício ou simulação de um falso efeito da droga. Salientamos, no entanto, que neste caso o truncamento não foi crítico. Já mencionamos neste Blog que quando mais de 500 desfechos são alcançados pelo estudo, o truncamento não implica em superestimativa do efeito do tratamento. Quando o PARADIGM-HF foi interrompido, todos os pacientes já tinham sido incluídos, apenas o follow-up teve uma redução de tempo. Assim, o estudo alcançou 2.031 desfechos, o que preserva sua veracidade a deleito do truncamento.

Sendo assim, este estudo tem validade interna, ou seja, o que observamos aqui não é resultado de ilusões causadas por viés ou acaso. É verdadeiro.

RELEVÂNCIA (IMPACTO)

Agora o próximo passo é avaliar o quanto este (verdadeiro) benefício é relevante. Quando ao tipo de desfecho, este foi o combinado de morte cardiovascular e internamento, ou seja, os dois mais importantes desfechos em insuficiência cardíaca. Na próxima postagem, usarei o PARADIGM-HF como exercício para analisar detalhadamente a medida pontual de impacto e sua precisão. Mas nesse momento quero ser mais prático e vou direto ao NNT: 21 pacientes precisam ser tratados para prevenir um desfecho primário (morte ou internamento) e 30 pacientes precisam ser tratados para prevenir uma morte. O que se observa é um tratamento de bom impacto na redução dos desfechos.

Assim, o estudo é intrinsecamente verdadeiro e de resultado relevante. Vamos então pensar na aplicabilidade.

APLICABILIDADE

Agora, de posse da informação científica, precisamos olhar para nossa realidade e avaliar o quanto aplicável é a conclusão do trabalho. É a transição da validade interna do estudo (veracidade) para a validade externa de suas conclusões.

Neste tópico, apresento o importante conceito de evidência científica indireta. Uma evidência pode ser indireta em relação a dois principais aspectos: tipo de paciente e forma de aplicar o tratamento.

O princípio da complacência determina que evidências verdadeiras podem ser extrapoladas para populações ou formas de aplicação diferentes, desde que não haja uma grande razão para se acreditar que a extrapolação não dará certo. Por exemplo, quando usamos inibidor da ECA e beta-bloqueador na criança com insuficiência cardíaca, estamos extrapolando o conhecimento de grandes ensaios clínicos realizados em adultos. Fazemos isso pois não há uma grande razão para acreditar que o resultado será diferente.

Observem que quando usamos o princípio da complacência, estamos adotando uma evidência indireta, pois esta não foi testada exatamente em quem faremos ou como faremos. Este princípio se baseia no fato de que interação (modificação de efeito de acordo com população ou circunstância) é um fenômeno raro. O mundo funciona assim.

No entanto, precisamos salientar que apesar de podermos extrapolar em certas situações, devemos reconhecer que quanto mais indireto é o trabalho em relação à nossa realidade, menor o nível de evidência. Ou seja, indirecteness é um dos critérios na definição do nível de evidência. Na medida em que trabalho vai se tornando mais indireto, mais se distancia da garantia de reprodutibilidade e o nível de evidência vai caindo.

Por exemplo, parece adequado aplicar beta-bloqueador em um idoso de 80 anos com insuficiência cardíaca, mesmo que os trabalhos clássicos tenham 65 anos como média de idade. Porém, na medida em que a idade vai aumentando, mais indireta fica a evidência e mais dúvida nós temos da aplicabilidade. Será que o paciente de 100 anos com insuficiência cardíaca deve usar beta-bloqueador?

Vamos agora avaliar o quanto a evidência do PARADIGM-HF é indireta em relação à nossa realidade. Como falei, duas são as formas de um dado ser indireto: tipo de paciente e forma de aplicar o tratamento.

Primeiro, vejamos tipo de paciente. Este é o primeiro grande teste do sacubritil, não só quanto à eficácia, mas também quanto à segurança e tolerabilidade. No entanto, este estudo tem uma peculiaridade, que é uma fase de run-in, ou seja, antes de serem randomizados, os dois tratamentos foram testados e só entraram no estudo os pacientes que toleraram o tratamento. Portanto só vemos aqui o resultado de pacientes selecionados para tolerarem a droga, o que reduz a validade externa do estudo quanto à segurança. E também quanto à eficácia, pois no princípio de intenção de tratar, má tolerância reduz eficácia. Ou seja, não estamos vendo o resultado testado em uma amostra que de fato representa a população. É uma amostra selecionada. Interessante notar que essa fase de run-in não é habitual em ensaios clínicos de fase III.

Desta forma, quando formos aplicar este benefício em nossos pacientes, teremos dúvida se o resultado seria o mesmo. Será que nosso próximo paciente não corresponde a um daqueles que nem entraram no estudo, pois não se dariam bem com a droga?

Observem que isso não compromete a veracidade do estudo quanto ao tipo de paciente estudado (baixo risco de viés), mas a superseleção pode ter distanciado o paciente do estudo do nosso paciente. Esta fase de run-in tornou a evidência indireta quanto ao tipo de paciente.

Quando observamos a tabela de características clínicas, vemos que são pacientes predominantemente em classe funcional II, com pressão sistólica de média de 120 mmHg. Ou seja, são pacientes compensados, estáveis, sem tendência a hipotensão, capazes de suportar os 320 mg de valsartan. Mas uma vez, é um amostra selecionada para que a terapia não gere problemas. Temos que ficar cientes disso.

Mas é no segundo modo de evidência indireta que está o maior problema deste estudo: aplicação da terapia. Quando surge uma nova intervenção candidata a incrementar um tratamento padrão, esta nova terapia deve ser comparada a um grupo controle (sem a terapia), sendo que o grupo intervenção e controle devem fazer o mesmo tratamento padrão otimizado. Ou seja, o correto é comparar intervenção + tratamento padrão ideal versus tratamento padrão ideal.

O que fez o PARADIGM-HF? Estranhamente, o tratamento padrão do grupo sacubritil foi melhor do que o tratamento padrão do grupo controle. Ou seja, na amostra o estudo, o grupo sacubritil objetivou um bloqueio do sistema angiotensina-aldosterona em dose máxima (valsartan 320 mg/dia), comparado ao grupo controle, que utilizou metade da dose máxima de enalapril (20 mg/dia, de forma fixa).

Os autores mencionaram que usaram valsartan no grupo sacubritil (ao invés de IECA), pois a associação de inibidores do neprylisin com IECA causaria muito angioedema. Deram duas referência que suportariam esta afirmação: os estudos OCTAVE e OVERTURE, que testaram omapatrilato, um desses inibidores. Tive o cuidado de olhar estes estudos e nenhum deles testou associação do omapatrilato com IECA, apenas compararam os dois. E por falar nisso, a frequência de edema foi inferior a 5%. Portanto, me parece que inventaram uma justificativa para usar tratamento padrão diferente nos dois grupos. Mas mesmo que usassem drogas diferentes, que pelo menos usassem doses equivalentes. Porque usar dose máxima de valsartan do grupo sacubritil versus metade da dose de enalapril no grupo controle? A coisa fica tão confusa que pode passar desapercebida. Se pensarmos com calma, usaram drogas diferentes, pois assim o uso de doses diferentes ficaria menos evidente.

Não importa que 20 mg/dia é a dose média de enalapril de estudos prévios (como foi mencionado pelos autores), o que importa é na amostra que está testando um a hipótese em questão, o grupo intervenção foi melhor tratado do que o grupo controle. Isso fica confirmado pela pressão sistólica mais baixa no grupo intervenção.

Portanto, há duas possibilidades para explicar a redução de mortalidade no grupo do sacubritil: (1) a droga de fato reduz mortalidade; (2) a droga não tem efeito e o que estamos vendo é o benefício de um bloqueio mais efetivo do SRAA. Ficará sempre esta dúvida.

MECANICISTA versus PRAGMÁTICO

Um estudo pode ser mecanicista ou pragmático. No primeiro caso, deseja-se demonstrar um conceito, por exemplo, sacubritil reduz mortalidade? No segundo caso, não importa o conceito, só precisamos saber o resultado prático: LCZ696 é melhor que enalapril 20 mg/dia?

Em um estudo mecanicista, o que acaba de ser discutido deve ser considerado um viés, ou seja, algo que falseia o resultado. Podemos optar por este caminho e invalidar estes trabalho.

Ou podemos interpretar o estudo como pragmático. Neste caso, esse problema não é um viés, é um problema de aplicabilidade. Um estudo pragmático não está analisando o mecanismo, está apenas testando a hipótese de que o LCZ 696 (sacubritil + Valsartan máximo) é superior a enalapril meia boca. E isso ficou demonstrado neste estudo, com baixo risco de vies.

Acreditando na veracidade deste pragmatismo, precisamos analisar o quanto a comparação aqui realizada é indireta em relação a nossa realidade. Parece-me pelo menos moderadamente indireta, pois meus pacientes de CF II, PAS = 120 mmHg e boa função renal estão usando dose máxima de IECA e não metade da dose. Sendo assim, eu não tenho certeza de que o tal LCZ será melhor que o IECA de meu paciente.

E se meu paciente estiver com uma dose mais baixa de enalapril, mas está evoluindo muito bem nos últimos anos, devo trocar pelo valsartan dose máxima + sacubritil? E se este paciente meu for um dos que seriam excluídos na fase de run-in, pois não tolerariam a hipotensão do LCZ696?

De acordo com o princípio da complacência, evidência indireta pode ser aplicada, porém quanto mais indireta, menor o nível de evidência. Sem a análise de aplicabilidade, classificaríamos o nível de evidência deste estudo pragmático como alto. Porém, após considerar o caráter indireto deste trabalho, devemos reduzir o nível de evidência para moderado.

Não temos aqui a evidência de melhor qualidade, o que torna menor sua influência em nossa conduta. A partir deste diagnóstico, discutiremos o nível de recomendação do LCZ696.

NÍVEL DE RECOMENDAÇÃO

Como recomendar um moderado nível de evidência? Neste momento, entra a utilidade do que é proposto pelo critério GRADE: definir a recomendação em forte ou fraca. A recomendação forte é a que deve ser feita em todos os paciente possíveis. Por exemplo, uso de IECA na insuficiência cardíaca. A recomendação fraca é a que deve ser ponderada caso a caso.

Portanto, baseado no moderado nível de evidência, a recomendação para usar o LCZ696 no lugar de IECA deve ser fraca. Ou seja, devemos ponderar as peculiaridades de nosso paciente, se este é um virgem de tratamento, se é um paciente que está se dando muito bem com o esquema tradicional, além de questão logísticas como custo da nova droga.

E para quem ficou incomodado com minha fraca recomendação, é só pensar probabilisticamente. O que significa um NNT de 21 para redução de morte? Significa que ao trocar o IECA por LCZ696 nosso paciente tem apenas 5% (1/21) de probabilidade de se beneficiar. Nossos bons tratamentos não são panacéias, portanto antes de entrar com tanto entusiasmo, precisamos ponderar os aspectos aqui discutidos.

O entusiasmo com o PARADIGM-HF está exagerado.

Medicina Baseada em Evidências

terça-feira, 30 de setembro de 2014

Nosso Curso Intensivo de Análise Multivariada - Novembro

sábado, 6 de setembro de 2014

PARADIGM-HF: o entusiasmo é proporcional à evidência?