Na interpretação de evidências científicas, percebo que os equívocos são mais freqüentes quando se trata de métodos diagnósticos do que quando o assunto se refere a métodos terapêuticos. Na mente médica, a análise crítica da eficácia de uma terapia está mais desenvolvida do que a análise da adequação de um método diagnóstico. Desta forma, vemos métodos de nenhum valor clínico sendo utilizados sob falsas premissas de acurácia. Vemos autores de artigos concluindo pelo valor do método avaliado, quando o próprio trabalho mostra o contário. Chega a ser algo caótico.
Portanto, precisamos discutir em detalhe métodos diagnósticos sob o paradigma da medicina baseada em evidências. Diferentes perguntas devem ser feitas quando analisamos este tipo de evidência: (1) o método é acurado? (2) o método é preciso? (3) Em sendo acurado e preciso, o método é útil clinicamente.
Nessa postagem vamos começar pelo básico, ou seja, pelo primeiro item. O que é acurácia?
Respondendo de forma simples, acurácia é a capacidade do método de acertar o diagnóstico.
Quando estamos diante de um diagnóstico dicotômico (presença ou ausência de doença), os componentes da acurácia são sensibilidade e especificidade. Devemos nos lembrar que um método precisa ter um equilíbrio desses dois parâmetros. Sensibilidade é a capacidade do método em reconhecer os doentes, enquanto especificidade é a capacidade do método em reconhecer os saudáveis. Precisamos discriminar os doentes e saudáveis, portanto precisamos tanto de sensibilidade como de especificidade. É fácil simular a invenção de um método 100% sensível: é só dizer que toda a população é doente. Porém nesse caso teremos 0% de especificidade, ou seja, nenhum saudável será reconhecido como tal. Esse método não serve para nada. Não discrimina nada. Daí surge a importância de pensar sempre nos dois parâmetros conjuntamente.
Para isso existem as razões de probabilidade, que são parâmetros que combinam sensibilidade e especificidade.
1. Razão de probabilidade positiva (sensibilidade / (1 – especificidade) é um número que representa o quanto um método de resultado positivo aumenta a chance de um indivíduo ser doente. Quando mais alto este número, melhor, ou seja: RP positiva: > 10 (acurácia ótima); 5-10 (acurácia moderada); 2-5 (acurácia pequena); 1-2 (acurácia nula).
2. Razão de probabilidade negativa (1 – sensibilidade / especificidade) representa o quanto um método de resultado negativo influencia a chance de um indivíduo ser saudável. Quanto mais próximo de zero, melhor: RP negativa: < 0.1 (acurácia ótima); 0.1-0.2 (acurácia moderada); 0.2-0.5 (acurácia pequena); 0.5-1.0 (acurácia nula).
Seguindo esses números, teremos a noção exata da acurácia de um exame, ou seja, da capacidade do teste em influênciar corretamente nosso pensamento a respeito da presença ou ausência de doença.
Devemos evitar um equívoco grave, porém muito frequente: argumentação de acurácia baseada em valor preditivo, pois este não é uma propriedade intrínseca do método, depende da probabilidade pré-teste da doença. Valor preditivo positivo é a probabilidade de uma pessoa ser doente se o resultado do exame for positivo. Valor preditivo negativo é a probabilidade de a pessoa ser saudável se o teste for negativo. Desta forma, valor preditivo é uma propriedade do indivíduo submetido ao exame, não do exame em si.
Se a probabilidade de doença é muito baixa, qualquer método terá um bom valor preditivo negativo e ruim valor preditivo positivo. Se a probabilidade de doença for muito alta, qualquer método terá ruim valor preditivo negativo e bom valor preditivo positivo.
Por exemplo, um método muito ruim pode ter um excelente valor preditivo negativo se quase ninguém tiver a doença. Em 2009, foi publicado um artigo nos Arquivos Brasileiros de Cardiologia que sugeria ser a cintilografia miocárdica realizada durante dor precordial um bom método para ser usado em pacientes com dor torácica aguda. O argumento era baseado em um bom valor preditivo negativo. Porém as razões de probabilidade eram muito ruins (RP positiva = 1.6 e RP negativa = 0.3), pois a especificidade era ruim (46%) com sensibilidade de 86%. Mas mesmo assim, o valor preditivo negativo foi 98%. Baseado nisso, o autor concluiu que o método teria valor, porém esse valor preditivo se deveu basicamente à probabilidade pré-teste baixa (6% apenas). Ou seja, mesmo que o método seja péssimo, sendo a probabilidade de doença muito baixa, é só dizer que o resultado é negativo que teremos boa possibilidade de acertar.
O mesmo ocorre com o exame de sangue oculto nas fezes como pesquisa de câncer do colon. Um estudo publicado em 2005 no Annals of Internal Medicine mostrou sensibilidade mínima (5%) e especificidade excelente (97%). Mesmo com essa especificidade, devido à baixa sensibilidade, o método não tem valor nenhum. RP positiva = 1.7e RP negativa = 0.98. Ou seja, o resultado do método não muda em nada a chance do paciente ser doente. Mesmo assim, o valor preditivo negativo do método foi 90%. Isso porque a prevalência de câncer era 10%, ou seja, 90% dos pacientes não eram doentes. Ou seja, de acordo com esse artigo de boa qualidade metodológica, a pesquisa de sangue oculto nas fezes não tem valor nenhum. Então porque esse exame existe? Deve ser porque as pessoas não têm o hábito de procurar as evidências de acurácia e mesmo se procuram há grande confusão em relação ao que significa cada um desses parâmetros de acurácia.
Percebam bem como nós aprendemos medicina na faculdade: partindo de um quadro clínico, surge uma suspeita diagnóstica. Para cada suspeita aprendemos os exames que devem ser pedidos para confirmar ou afastar a suspeita. Pronto. Pouco se discute qual a acurácia dos métodos, muitas vezes isso nem está escrito nos livros. Devemos criar o hábito de procurar essas evidências, procurar saber quais as razões de probabilidade, pois este conhecimento vai melhorar tanto a utilização dos exames, como a interpretação de seus resultados.
Em postagem futura, apresentaremos um roteiro de avaliação crítica das evidências relativas a acurácia. Precisamos analisar criticamente os trabalhos que nos trazem essas informações.
* Essa postagem representa o início da série "Análise Crítica de Métodos Diagnósticos".