No ano passado, o Guideline Europeu de Fibrilação Atrial propôs que os cardiologistas passassem a utilizar um novo escore de risco para predição de acidente vascular cerebral em pacientes com fibrilação atrial. Deixaríamos de lado o velho escore CHADS2 e passaríamos a usar o novo CHADSVASc. Esse escore tornou-se uma sensação, sendo enfatizado em eventos científicos, nos quais especialistas em arritmia têm proposto a utilização do CHADSVASc como uma evolução na condução do paciente com fibrilação atrial. Utilizando este escore, seríamos capazes de identificar melhor os pacientes que necessitam de anticoagulação, pois faríamos uma melhor estimativa do risco de AVC. Esse foi o racional para o CHADSVASc.
Mas como proceder após ouvir uma sugestão de mudança de conduta médica? Claro, devemos analisar as evidências científicas que embasam o que está sendo proposto. Aqui falamos da evidência científica a favor de um modelo preditor de risco. Em fevereiro de 2010 foi publicado no CHEST o trabalho que avaliou e comparou o CHADSVASc com outros escores de risco, o qual acompanhou prospectivamente 1.080 pacientes sem anticoagulante e com fibrilação atrial. Devemos ler este trabalho e julgar o valor do novo escore.
O que um escore de risco precisa fazer é discriminar (diferenciar, distinguir) os pacientes que no futuro terão o desfecho e aqueles que permanecerão livres do desfecho. Análise discriminatória é mensurada pela área abaixo da curva ROC, também chamada de estatística-C, quando se fala de prognóstico. Resumidamente, a curva ROC é construída por vários pontos hipotéticos que são plotados em um gráfico cujo eixo vertical é a sensibilidade do marcador em reconhecer os que terão desfecho, enquanto o eixo horizontal é o complemento da especificidade (1-especificidade), que significa os pacientes sem eventos erradamente rotulados como pacientes que teriam desfecho. Parece complicado, mas essa plotagem gera uma curva, cuja área abaixo dela representa a capacidade discriminatória do escore (ou do teste) que está sendo avaliado (vide figura acima). Em outras palavras, a área abaixo da curva representa a probabilidade de um paciente que terá o desfecho ter um escore de risco maior do que um paciente que não terá o desfecho. Se essa probabilidade for 100%, o teste é perfeito e a área abaixo da curva (estatística-C) seria igual a 1. Sendo assim, quanto mais próximo de 1, melhor o teste. Se um teste não tiver nenhuma capacidade discriminatória, sua área abaixo da curva seria 0.5, ou seja, 50% de probabilidade de um paciente que terá o desfecho ter um escore de risco maior do que um paciente que não terá o desfecho. Entre 0.5 e 1.0, o escore tem diferentes níveis de capacidade discriminatória.
Desta forma, quando temos um novo teste ou um novo escore, devemos comparar sua estatística-C com a do escore antigo. Calcula-se que um ganho de pelo menos 0.05 na estatística-C é necessário para considerar um valor incremental relevante. Vamos então comparar a estatística-C do velho CHADS2, com a estatística-C do novo e entusiástico CHADSVASc. De acordo com o trabalho do CHEST, a estatística-C do CHADSVASc é 0.61, comparado a 0.59 do CHADS2. Ou seja, não houve praticamente nenhum incremento, o que nos impede de dizer (como estão dizendo) que o CHADSVASc é melhor.
Além de analisar a capacidade discriminatória, devemos analisar se um escore é capaz de estimar corretamente a probabilidade numérica de eventos em diferentes subgrupos, estratificados por faixa de risco. Isso se chama de calibração. Um escore calibrado é aquele que nos permite predizer com boa acurácia qual a probabilidade de que um indivíduo apresentar o desfecho. Ou seja, se eu digo que um paciente tem a probabilidade estimada de 3% de AVC, ao analisar uma amostra desse tipo de paciente, a incidência de evento deve ser algo próximo a isso. O problema é que o trabalho que valida o CHADSVASc não sugere que teremos uma ferramenta calibrada, pois as estimativas de risco são menos precisas devido à maior amplitude de seus possíveis resultados (0 a 9). Além disso, os intervalos de confiança das estimativas de risco de acordo com as pontuações são amplos (menos precisos) e bastante superponíveis. Só para demonstrar isso claramente, CHADSVASc de 2 a 6 tem risco de, respectivamente, 1.6%, 3.9%, 1.9%, 3.2%, 3.6%. Não há nenhum gradiente, nem nas medidas pontuais, nem nos intervalos de confiança (vide tabela abaixo). Já quando olhamos o CHADS2, percebemos que as 6 classes distinguem bem o risco do paciente (1.9%, 2.8%, 4.0%, 5.9%, 8.5%, 12.5%, 18.2%) e os intervalos de confiança não são superponíveis. CHADS2 um escore melhor calibrado.
O CHADSVASC classifica um maior número de pacientes como alto risco, porém sua estatística-C não é melhor do que o CHADS2. Isso indica que boa parte dessas reclassificações como alto risco estão erradas. E isso deve ser verdade. Por exemplo, um escore de 8 seria alto pelo CHADSVASc. Isso indica 8% de risco de AVC, mas vejam o intervalo de confiança: 1% a 26%, que imprecisão!
Ou seja, não vale muito coisa esse novo CHADSVASc.
O Guideline Europeu apresenta uma tabela que mostra o risco de acordo com o valor do CHADSVASc. Aquela tabela dá a impressão de uma boa relação entre risco e CHADSVASc. Inclusive a tabela cita um artigo de 7.000 pacientes, que "validou" aqueles números. Li o artigo. Primeiro, é uma amostra de pacientes submetidos a ensaios clíncios que comparam anticoagulantes (Warfarin x Ximelagatran), ou seja, a população não é adequada para avaliar risco, pois todos estão anticoagulados (diferente dos outros trabalhos que validaram os escores). Então ele ajusta a probabilidade de AVC para se o paciente não estivesse usando anticoagulante. Como? Empiricamente, manualmente, o autor aumenta o risco de cada grupo em 70%. E apresenta os riscos, sem intervalo de confiança. Ou seja, na verdade os riscos apresentados na tabela não são dados estatísticos verdadeiros. São resultantes de uma grande exptrapolação, nos apresentada sem intervalos de confiança, ou seja, sem a medida da imprecisão. O que vale mesmo é o artigo original do CHADSVASc. Esse é metodologicamente correto e não mostra boa calibração.
O Guideline Europeu apresenta uma tabela que mostra o risco de acordo com o valor do CHADSVASc. Aquela tabela dá a impressão de uma boa relação entre risco e CHADSVASc. Inclusive a tabela cita um artigo de 7.000 pacientes, que "validou" aqueles números. Li o artigo. Primeiro, é uma amostra de pacientes submetidos a ensaios clíncios que comparam anticoagulantes (Warfarin x Ximelagatran), ou seja, a população não é adequada para avaliar risco, pois todos estão anticoagulados (diferente dos outros trabalhos que validaram os escores). Então ele ajusta a probabilidade de AVC para se o paciente não estivesse usando anticoagulante. Como? Empiricamente, manualmente, o autor aumenta o risco de cada grupo em 70%. E apresenta os riscos, sem intervalo de confiança. Ou seja, na verdade os riscos apresentados na tabela não são dados estatísticos verdadeiros. São resultantes de uma grande exptrapolação, nos apresentada sem intervalos de confiança, ou seja, sem a medida da imprecisão. O que vale mesmo é o artigo original do CHADSVASc. Esse é metodologicamente correto e não mostra boa calibração.
Mas porque então este novo escore foi proposto? Talvez haja uma vantagem em classificar mais pessoas como alto risco, mesmo errando parte dessas classificações. O uso do CHADSVASc vai implicar em maior número de pacientes anticoagulados. Mas qual a vantagem de anticoagular mais pacientes? Bem, o lançamento do CHADSVASc está coincidindo como lançamento do Dabigatran, o novo anticoagulante oral, de eficácia comprovadamente não inferior à Warfarina e muito mais prático de usar. Sendo mais prático, será mais atraente indicar o tratamento para mais pessoas. No final, mais pessoas usarão Dabigatran. Ou estou imaginando demais?
Na verdade, o que precisamos é anticoagular os pacientes que realmente precisam ser anticoagulados, o que não ocorre de forma ideal na prática. Não precisamos rotular, de forma imprecisa, mais pacientes como indicados para anticoagulação.
Precisamos também entender que um escore melhor é aquele capaz de discriminar melhor (estatística-C) e capaz de predizer a probabilidade de eventos de maneira correta (calibração). Isso é predição baseada em evidências.









