quarta-feira, 4 de maio de 2011

CHADSVASc: Uma Prosposta Inadequada


No ano passado, o Guideline Europeu de Fibrilação Atrial propôs que os cardiologistas passassem a utilizar um novo escore de risco para predição de acidente vascular cerebral em pacientes com fibrilação atrial. Deixaríamos de lado o velho escore CHADS2 e passaríamos a usar o novo CHADSVASc. Esse escore tornou-se uma sensação, sendo enfatizado em eventos científicos, nos quais especialistas em arritmia têm proposto a utilização do CHADSVASc como uma evolução na condução do paciente com fibrilação atrial. Utilizando este escore, seríamos capazes de identificar melhor os pacientes que necessitam de anticoagulação, pois faríamos uma melhor estimativa do risco de AVC. Esse foi o racional para o CHADSVASc.

Mas como proceder após ouvir uma sugestão de mudança de conduta médica? Claro, devemos analisar as evidências científicas que embasam o que está sendo proposto. Aqui falamos da evidência científica a favor de um modelo preditor de risco. Em fevereiro de 2010 foi publicado no CHEST o trabalho que avaliou e comparou o CHADSVASc com outros escores de risco, o qual acompanhou prospectivamente 1.080 pacientes sem anticoagulante e com fibrilação atrial. Devemos ler este trabalho e julgar o valor do novo escore.

O que um escore de risco precisa fazer é discriminar (diferenciar, distinguir) os pacientes que no futuro terão o desfecho e aqueles que permanecerão livres do desfecho. Análise discriminatória é mensurada pela área abaixo da curva ROC, também chamada de estatística-C, quando se fala de prognóstico. Resumidamente, a curva ROC é construída por vários pontos hipotéticos que são plotados em um gráfico cujo eixo vertical é a sensibilidade do marcador em reconhecer os que terão desfecho, enquanto o eixo horizontal é o complemento da especificidade (1-especificidade), que significa os pacientes sem eventos erradamente rotulados como pacientes que teriam desfecho. Parece complicado, mas essa plotagem gera uma curva, cuja área abaixo dela representa a capacidade discriminatória do escore (ou do teste) que está sendo avaliado (vide figura acima). Em outras palavras, a área abaixo da curva representa a probabilidade de um paciente que terá o desfecho ter um escore de risco maior do que um paciente que não terá o desfecho. Se essa probabilidade for 100%, o teste é perfeito e a área abaixo da curva (estatística-C) seria igual a 1. Sendo assim, quanto mais próximo de 1, melhor o teste. Se um teste não tiver nenhuma capacidade discriminatória, sua área abaixo da curva seria 0.5, ou seja, 50% de probabilidade de um paciente que terá o desfecho ter um escore de risco maior do que um paciente que não terá o desfecho. Entre 0.5 e 1.0, o escore tem diferentes níveis de capacidade discriminatória.

Desta forma, quando temos um novo teste ou um novo escore, devemos comparar sua estatística-C com a do escore antigo. Calcula-se que um ganho de pelo menos 0.05 na estatística-C é necessário para considerar um valor incremental relevante. Vamos então comparar a estatística-C do velho CHADS2, com a estatística-C do novo e entusiástico CHADSVASc. De acordo com o trabalho do CHEST, a estatística-C do CHADSVASc é 0.61, comparado a 0.59 do CHADS2. Ou seja, não houve praticamente nenhum incremento, o que nos impede de dizer (como estão dizendo) que o CHADSVASc é melhor.

Além de analisar a capacidade discriminatória, devemos analisar se um escore é capaz de estimar corretamente a probabilidade numérica de eventos em diferentes subgrupos, estratificados por faixa de risco. Isso se chama de calibração. Um escore calibrado é aquele que nos permite predizer com boa acurácia qual a probabilidade de que um indivíduo apresentar o desfecho. Ou seja, se eu digo que um paciente tem a probabilidade estimada de 3% de AVC, ao analisar uma amostra desse tipo de paciente, a incidência de evento deve ser algo próximo a isso. O problema é que o trabalho que valida o CHADSVASc não sugere que teremos uma ferramenta calibrada, pois as estimativas de risco são menos precisas devido à maior amplitude de seus possíveis resultados (0 a 9). Além disso, os intervalos de confiança das estimativas de risco de acordo com as pontuações são amplos (menos precisos) e bastante superponíveis. Só para demonstrar isso claramente, CHADSVASc de 2 a 6 tem risco de, respectivamente, 1.6%, 3.9%, 1.9%, 3.2%, 3.6%. Não há nenhum gradiente, nem nas medidas pontuais, nem nos intervalos de confiança (vide tabela abaixo). Já quando olhamos o CHADS2, percebemos que as 6 classes distinguem bem o risco do paciente (1.9%, 2.8%, 4.0%, 5.9%, 8.5%, 12.5%, 18.2%) e os intervalos de confiança não são superponíveis. CHADS2 um escore melhor calibrado.

O CHADSVASC classifica um maior número de pacientes como alto risco, porém sua estatística-C não é melhor do que o CHADS2. Isso indica que boa parte dessas reclassificações como alto risco estão erradas. E isso deve ser verdade. Por exemplo, um escore de 8 seria alto pelo CHADSVASc. Isso indica 8% de risco de AVC, mas vejam o intervalo de confiança: 1% a 26%, que imprecisão!


Ou seja, não vale muito coisa esse novo CHADSVASc.

O Guideline Europeu apresenta uma tabela que mostra o risco de acordo com o valor do CHADSVASc. Aquela tabela dá a impressão de uma boa relação entre risco e CHADSVASc. Inclusive a tabela cita um artigo de 7.000 pacientes, que "validou" aqueles números. Li o artigo. Primeiro, é uma amostra de pacientes submetidos a ensaios clíncios que comparam anticoagulantes (Warfarin x Ximelagatran), ou seja, a população não é adequada para avaliar risco, pois todos estão anticoagulados (diferente dos outros trabalhos que validaram os escores). Então ele ajusta a probabilidade de AVC para se o paciente não estivesse usando anticoagulante. Como? Empiricamente, manualmente, o autor aumenta o risco de cada grupo em 70%. E apresenta os riscos, sem intervalo de confiança. Ou seja, na verdade os riscos apresentados na tabela não são dados estatísticos verdadeiros. São resultantes de uma grande exptrapolação, nos apresentada sem intervalos de confiança, ou seja, sem a medida da imprecisão. O que vale mesmo é o artigo original do CHADSVASc. Esse é metodologicamente correto e não mostra boa calibração.

Mas porque então este novo escore foi proposto? Talvez haja uma vantagem em classificar mais pessoas como alto risco, mesmo errando parte dessas classificações. O uso do CHADSVASc vai implicar em maior número de pacientes anticoagulados. Mas qual a vantagem de anticoagular mais pacientes? Bem, o lançamento do CHADSVASc está coincidindo como lançamento do Dabigatran, o novo anticoagulante oral, de eficácia comprovadamente não inferior à Warfarina e muito mais prático de usar. Sendo mais prático, será mais atraente indicar o tratamento para mais pessoas. No final, mais pessoas usarão Dabigatran. Ou estou imaginando demais?

Na verdade, o que precisamos é anticoagular os pacientes que realmente precisam ser anticoagulados, o que não ocorre de forma ideal na prática. Não precisamos rotular, de forma imprecisa, mais pacientes como indicados para anticoagulação.

Precisamos também entender que um escore melhor é aquele capaz de discriminar melhor (estatística-C) e capaz de predizer a probabilidade de eventos de maneira correta (calibração). Isso é predição baseada em evidências.

6 comentários:

  1. Parabéns pelo texto. Ctza que serei leitor assíduo do blog

    ResponderExcluir
  2. Pois é Luis, acho estes comentarios apontam para a luicidez com que devemos avançar em ciencia; imagino que a maioria dos medicos, e me incluo entre eles, não saberiam analisar esta estatistica como voce nos traz e penso que este seja o caminho para podermos desconstruir muitos sensacionalismos infundados;
    Existe um outro paradigma a ser desconstruido que é aquele do medico ativo em ciencia que tem sempre publicar alguma coisa ( "publish or die!"),então hoje tem uma invasão desnecessaria de trabalhos, teses e estudos que não só não levam a nada como também podem ter um carater deleterio pelos caminhos potenciais de suas induçoes.
    Nila

    ResponderExcluir
  3. "Teoria da conspiração é um termo usado para referir qualquer teoria que explica um evento histórico ou actual como sendo resultado de um plano secreto levado a efeito geralmente por conspiradores maquiavélicos e poderosos, tais como uma "sociedade secreta" ou "governo sombra".
    http://pt.wikipedia.org
    É mais um inimigo para a prática médica...
    Parabéns, mais uma vez, Luis

    ResponderExcluir
  4. Particularmente acho o CHADS2 muito mais prático e adaptado a nossa realidade, desde que frequentemente encontramos muitos osbtáculos para iniciar anticoagulação oral no nosso meio, pelas condições sócio-econômica e educacional insatisfatória de muitos pacientes, aliada a acesso precário aos serviços de saúde, o que impossibilita ou dificulta a manutenção e controle adequado da anticoagulação. O risco de anticoagulação ineficaz ou de sangramento faz o médico optar pelo AAS em situações onde o Warfarin está indicado.

    ResponderExcluir
  5. Quando li o trabalho que originou o CHA2DS2VASc, também fiquei com a impressão de que, apesar de sexo feminino e idade>65 anos serem preditores de risco para tromboembolismo, o novo escore proposto não acrescentaria muito à prática diária. Acreditei até mesmo que pudesse induzir à indicação de anticoagulação para pacientes que não necessitassem.

    Minha opinião mudou após ler outro trabalho publicado pelo mesmo grupo. BMJ do final do ano passado:

    http://www.bmj.com/content/342/bmj.d124.full.pdf+html

    Esse trabalho compara o desempenho preditivo do CHADS2 e do CHA2DS2VASc em população de mais de 70000 pacientes com FA não valvular e sem anticoagulação. Nessa coorte, o uso do novo escore foi capaz sim de definir melhor os pacientes de baixo risco.

    Parabéns pelo blog, Marcus.

    ResponderExcluir
  6. Parabéns pelo blog!

    Seu site foi comentado hoje em uma sessão controvérsia, no congresso da SOCESP, quanto ao uso do CHADS2.
    Gostei muito da forma como você expôs a análise do poder discriminativo entre os dois escores, baseada nos estudos do Lip. A mesma forma de expor esse raciocínio foi usada por um dos debatedores nesse congresso.
    Acho que esse estudo publicado por outro grupo, no BMJ, citado no comentário anterior, acrescenta muito à discussão em torno da validade do CHA2DS2VASc, principalmente ao concluir dessa forma:
    "CHA2DS2-VASc is more valid for stroke prediction in patients categorised as being at low and intermediate risk by the CHADS2 scheme
    This is clinically important, as many of the patients at low risk according to CHADS2 are not at “truly low risk” and treatment guidelines are not conclusive for those at intermediate risk.
    Apesar de ser uma coorte retrospectiva com seus vieses inerentes, acho que a forma como se conclui o artigo é de muito bom senso, ao sugerir o uso do escore ampliado, com as variáveis de risco intermediário, para refinar a classificação daquela grande parcela com risco intermediário pelo CHADS2. As tabelas desse estudo, com os riscos relativos para cada combinação de variáveis são muito esclarecedoras, e talvez aí esteja uma falha no artigo do Lip, que expôs somente uma tabela com pontuação de 0-9 sem discriminar diferentes associações de fatores. Além disso, o número de pacientes e o tempo de seguimento maiores possibilitaram o aparecimento de uma diferença mais ampla entre os escores pela estatística-C. Por favor, alguém me explique se eu estiver errado, mas acho que com esse estudo, o uso do novo escore para refinar a classificação de risco é válido.

    Obrigado!
    Danilo

    ResponderExcluir