sábado, 23 de maio de 2015

O Princípio da Prova do Conceito


Tradicionalmente, nossos textos argumentam a favor do uso de evidências científicas na decisão clínica. Esta atual postagem está além da discussão do paradigma do embasamento científico. Este texto é feito para aqueles que estão convencidos da necessidade da decisão embasada em evidências científicas. Hoje vamos propor um refinamento, o uso do paradigma na medida certa. 

O princípio da prova do conceito é pouco entendido em sua essência, provocando um uso caricatural da medicina baseada em evidências. A Prova do Conceito define a medicina baseada em evidências como a prática do julgamento clínico individualizado, norteado por conceitos científicos. Nortear é diferente de obrigar ou comandar. 

Afirmações como “não devo fazer desta forma, pois não foi exatamente isso que foi testado nos estudos” são muito frequentes por praticantes da medicina baseada em evidências. Observe que esta frase tem o intuito de reforçar o paradigma da medicina baseada em ciência, porém exagera ao aprisionar a decisão clínica dentro da metodologia do trabalho científico.

Ao violar o princípio da hipótese nula (ceticismo), erramos pela liberdade de fazer o que se quer ou o que se crê. Ao violar o princípio da prova do conceito nos tiramos a liberdade de raciocinar a respeito do paciente. São dois erros, diametralmente opostos.

O princípio da prova do conceito previne dois equívocos comuns: (1) achar que a conclusão do trabalho cria uma regra ou receita de bolo a ser sistematicamente reproduzida; (2) copiar o método do trabalho científico na prática clínica.

A Receita de Bolo (o caso do PEGASUS)


Imaginem um estudo de excelente qualidade metodológica que prova o conceito de eficácia de uma terapia. Com base nisso, observamos muitas vezes a criação de uma regra a favor da terapia, representada por uma indicação classe I. A “rotina" passa a ser a utilização do tratamento. 

Não deve ser exatamente assim. O trabalho científico serve para criar um conceito e não para determinar uma conduta individual. Quem determina a conduta é o médico, com base em decisão multifatorial. 

Por exemplo, o recente ensaio clínico PEGASUS-TIMI 54 demonstrou que a associação de dupla anti-agregação plaquetária  (Ticagrelor + AAS) reduz eventos cardiovasculares comparado a apenas AAS, em pacientes estáveis, que tiveram infarto em passado remoto. Analisando criticamente a metodologia do trabalho, concluímos que este representa um alto nível de evidência, devido ao baixo risco de vies ou erro aleatório. Fica então demonstrado um novo conceito: mesmo em pacientes sem instabilidade de placa, anti-agregar mais agressivamente traz benefício. Complementando a informação de benefício, há o conceito da magnitude do benefício, representada neste estudo pela uma redução relativa do risco (hazard neste caso) de 16%. A redução relativa do risco representa a propriedade intrínseca do tratamento, pois tende a ser constante, independente da gravidade do paciente (observe isso nas análises de subgrupos de estudos positivos). Portanto, este estudo de boa qualidade prova o conceito de que a dupla anti-agregação promove uma redução adicional de risco de 16%, em termos relativos. 

E agora? Fica então indicado de forma rotineira este tratamento? É uma receita de bolo? 

Agora depende do raciocínio clínico. Observem que neste estudo a redução absoluta do risco foi de 1.27%, resultando em NNT = 79. Esse é um alto NNT, sugerindo um benefício de pequena magnitude. Mas essa pequena magnitude não é exatamente um conceito genérico que está sendo demonstrado. Este NNT é o que ocorre em média, considerando o amplo espectro de pacientes na amostra do estudo. 

Uma confusão comum é achar que o NNT é uma propriedade intrínseca do tratamento. Não é, pois este varia de acordo com o risco basal do paciente. O que é constante é a redução relativa. Assim, o NNT nos chama atenção que o tratamento pode ser de pequena magnitude, em média. 

Partimos de uma conceito e individualizamos a conduta. O conceito foi a redução relativa do risco de 16%. Agora olhamos para o risco absoluto de nosso paciente. Observem que aplicando a redução relativa em pacientes de risco baixo ou intermediário, terminaremos com um NNT insatisfatório, não valendo a pena pagar o preço de mais sangramento. Porém, em paciente no extremo de gravidade, o NNT será mais baixo e este tratamento pode valer e pena. 

Em um paciente com incidência de eventos de 9% (como observado no estudo), o NNT é 79. Mas um paciente cuja incidência é 20%, o NNT já seria 31.

Isto mostra que um conceito demonstrado não promove um regra que deve ser copiada sistematicamente. Apenas nos dá subsídio para raciocinar a respeito de nosso paciente. 

Violando este princípio, a indústria pode querer induzir os médicos a vender este tratamento para pacientes de qualquer faixa de risco. Já estou até vislumbrando o lançamento de um Brillinta Light, na dose de 60 mg para pacientes estáveis, tal como fez o estudo. Não devemos nos deixar enganar por esta lucrativa regra. 

Por outro lado, médico mais atentos ao paradigma científico podem rejeitar totalmente o uso da dupla anti-agregação com base no cálculo do NNT do trabalho e no risco de sangramento apresentado. A rejeição total também não seria adequada. 

O correto é aceitar o conceito da redução relativa do risco, pois a evidência é de qualidade, e a aplicar ao risco basal de seu paciente. Neste caso, acredito que o uso se limitará a exceções de alto risco.

Ler artigo e valorizar a evidência é uma coisa diferente de adotar a evidência. 

Devemos evitar a confusão entre nível de evidência e grau de recomendação. Observem que o nível de evidência diz respeito à confiabilidade do trabalho (risco de vies ou erro sistemático). Um trabalho como o PEGASUS é um nível top de evidência (nível A), demonstrando um conceito verdadeiro. Isso pode induzir as pessoas a achar que o grau de recomendação deve ser forte (Grau I). No entanto, com base no NNT médio demonstrado no trabalho, este tratamento deve ser classificado como fraco grau de recomendação. Vejam então que um tratamento pode ter alto nível de evidência e fraco grau de recomendação. Esta fraca recomendação significa reservar a terapia para exceções. 

A Cópia do Método do Trabalho


Como mencionei, a pouca clareza a respeito do princípio da prova do conceito promove o caricatural cópia do método do trabalho, que ocorre de 3 formas: copiar o critério de inclusão do estudo, copiar a forma de tratamento ou copiar (pasmem) o grupo controle do estudo. 


Copiar o Critério de Inclusão

A cópia da população-alvo é a negação do princípio da complacência ou de evidências indiretas. Muito comum que guidelines limitem a indicação de tratamentos de ressincronização apenas para pacientes com fração de ejeção < 35%. E o pacientes com fração de ejeção de 36% deve ficar de fora? Vemos na prática as engraçadas situações onde os médicos solicitam outros métodos mais acurados de medidas de fração de ejeção na esperança de que o resultado venha abaixo de 35%. No fundo, o médico está convencido do benefício, baseando-se na prova do conceito, porém se sente engessado ao método do trabalho. Essa conduta aparenta ser uma conduta respeitosa com o paradigma da medicina baseada em evidências, porém é equivocada. 

Percebam mais uma vez de que o ensaio clínico representa uma metodologia que testou um conceito. Testou e demonstrou o conceito de que pacientes com disfunção sistólica clinicamente importante se beneficiam do tratamento. A fração de ejeção < 35% não é o conceito, é apenas um método do estudo para recrutar o melhor tipo de paciente para testar a hipótese, sem cometer erros. A fração de ejeção no extremo inferior é uma forma de recrutar uma amostra que terá um número maior de desfechos clínicos, o que garantirá o poder estatístico do estudo. É uma forma metodológica de prevenir o erro tipo II. Apenas isso, não que a proposta seja apenas tratar pacientes com fração de ejeção < 35%, deixando necessariamente de fora qualquer outro tipo de paciente. Usar a terapia de ressincronização em pacientes com bloqueio de ramo esquerdo, QRS devidamente alargado e fração de ejeção de 37% é um ótimo exemplo de utilização correta de uma evidência indireta. O mesmo funcionaria para o paciente com fração de ejeção de 40%, se clinicamente a doença fosse importante. Mas na medida em que o seu paciente vai se distanciando muito da média da amostra analisada, ficamos mais céticos, até deixarmos de aplicar a evidência indireta. 

Duas coisas: a comparação se faz melhor com a característica média da amostra do que com os critérios de inclusão; não há um limite preciso de onde parar de aplicar a evidência indireta, este é um julgamento clínico individualizado. Por outro lado, não vamos querer aplicar essa evidência em pacientes sem bloqueio de ramo esquerdo, pois esta variação de característica tem muita plausibilidade interferir na eficácia do tratamento em questão. É um julgamento caso a caso.

Esta complacência na aplicação de um tratamento custoso como ressincronização pode gerar uma certa sensação de liberalidade. Mas não é essa a proposta. Não haverá liberalidade, pois quando julgamos individualmente, podemos também identificar indivíduos com fração de ejeção < 35% e que não deverão usar o tratamento. A proposta é apenas não nos engessar no pensamento clínico. 

Um exemplo de aplicação da prova do conceito é o tratamento farmacológico de hipertensão leve. Imaginem um paciente com pressão arterial de 150 x 95 mmHg. Na maioria das vezes, quando corretamente diagnosticados, estes pacientes recebem indicação de tratamento. No entanto, as evidências de eficácia dos tratamentos se restringiram os critérios de inclusão a pacientes com pressão > 160 x 100 mmHg e múltiplos fatores de risco cardiovascular. Por que? Essa foi uma forma de estudar uma amostra mais grave, que terá mais eventos, proporcionando adequado poder estatístico. Estes estudos comprovaram o conceito de que a redução da pressão arterial traz benefício do hipertenso e este conceito pode ser aplicado a pessoas menos hipertensas do que a amostra utilizada. Até um certo limite. Que limite? Isso é discutível, haja visto nossa história discussão neste Blog com o professor Flávio Fuchs. 

Há alguns anos a eficácia da Sibutramina foi testada em pacientes de alto risco cardiovascular, e o estudo falhou em comprovar redução de eventos em pacientes de alto risco cardiovascular. Não só falhou em reduzir eventos, mas aumentou a incidência. Daí me vêem os entusiastas da Sibutramina querendo dizer que só entraram no estudo pacientes de alto risco cardiovascular e portanto poderiam continuar utilizando nos demais. Que bobagem … Vejam que foi a amostra de alto risco cardiovascular que permitiu ao estudo ter poder estatístico. E foi neste cenário de poder estatístico que o estudo não conseguiu demonstrar benefício. Desta foram, o conceito comprovado é de que a  Sibutramina não reduz eventos, de acordo com o melhor cenário científico, aquele que nos tranquiliza quando ao erro tipo II. E se algo não tem o conceito de benefício demonstrado, por que utilizar?


Cópia da Forma de Tratamento

No início da década de 2000, o estudo MIRACL demonstrou que atorvastatina 80 mg ao dia (comparada a placebo) reduzia eventos cardiovasculares (modestamente) ao longo de 4 meses após síndromes coronarianas agudas. Isto gerou um carimbo prescritor de 80 mg de atorvastatina em pacientes internados nestas condições. Mas porque 80 mg na velinha com colesterol apenas moderadamente alto? 

Essa é uma confusão comum entre conceito e o método do trabalho. A dose é apenas o método utilizado pelo trabalho para testar o conceito. No experimento, este foi o melhor método, pois dada a variabilidade individual de resposta, a dose máxima garantiria um contraste médio entre a droga e o placebo no curto prazo. Além disso, ao usar a dose máxima, um eventual resultado negativo não poderia ser atribuído a uma dose insuficiente. 

Por outro lado, na prática individual, esta pode não ser a melhor dose na maioria dos pacientes. A dose diz mais respeito ao desenho do estudo do que ao que devemos fazer com nosso paciente. 

Esta discussão não se refere apenas a dose de medicação, mas a qualquer outra forma de adoção de conduta clínica. Gosto do exemplo de dose, pois posologia é um dos mais inadequados paradigmas na medicina. Posologia conota uma regra a ser seguida de forma consistente em nossos pacientes. Medicação não tem dose ideal, na verdade cada paciente tem a SUA dose ideal. Só não sabemos qual, por isso que tentemos a partir de um norte posológico. 

O estudo deve ser bem desenhado para provar um conceito. Uma vez provado, a forma de aplicação do conceito paciente pode e deve ser individualizada. Medicina baseada em evidências é individualizar uma decisão norteada por um conceito comprovado. Ao individualizar, estamos aprimorando o tratamento para o nosso paciente, pois cada indivíduo deve ser tratado de uma forma um pouco diferente, considerando suas particularidades. 


Cópia do Grupo Controle

Este é o mais caricatural dos equívocos por praticantes da medicina baseada em evidências. Um dos melhores exemplos são os estudos que testaram a eficácia de transfusão liberal em pacientes criticamente enfermos. Transfusão liberal (more is more) foi definida na maioria dos trabalhos como repor o sangue para colocar a hemoglobina > 10g%. E o grupo controle em boa parte dos trabalhos foi transfundir se hemoglobina < 7 g% ou instabilidade clínica. Estes estudos foram todos negativos, não mostraram benefício da transfusão liberal. Fica então a prova do conceito de less is more na transfusão de pacientes críticos.

No entanto, de forma equivocada surgem recomendações do tipo (olhe o UpToDate de novo): salvo instabilidade clínica, a transfusão deve ser realizada apenas se hemoglobina < 7 g%. Esse é um grande exemplo de cópia do grupo controle. Observem que 7 g% é apenas o método usado pelo trabalho para promover contraste da quantidade de transfusão entre os dois grupos. Mais uma vez, a prova do conceito está no contraste, e o método do trabalho deve ser desenhado para garantir esse contraste. Mas isso não quer dizer que 7 é um número mágico. Observem que 7 não foi comparado a 7.5, 8, 8.5 ….. Não foi isto que foi testado. A interpretação correta é de que 7 é apenas o método e o conceito que fica é de ser restritivo na indicação, pensar de forma multifatorial, considerar as circunstâncias. 

Na individualização dos nossos pacientes, evitaremos transfundir porque a hemoglobina está abaixo de 10g. Mas não há motivo de nos guiar em um numero 7 ou 8, que não foram testados como o melhor limite para desencadear a transfusão. Temos que nos basear em nosso julgamento, norteados pelo paradigma do less is more

Caricatural é quando o paciente está com hemoglobina de 7.3g,  a mão fica coçando para transfundir (julgamento clínico), mas não o fazemos. Ficamos na expectativa (torcendo) para que a hemoglobina do dia seguinte chegue em 6.9g, nos autorizando a dar sangue ao paciente.

Conclusão


É comum o equívoco de confundir ciência e assistência como coisas próximas. A ciência deve influenciar a assistência e a assistência deve gerar ideias para serem testadas cientificamente. Mas as duas são diferentes e devem ser tratadas como diferentes. O pensamento do cientista no desenho do estudo não deve ser o mesmo do pensamento do médico na decisão quanto a seu paciente. 

O desenho do estudo se preocupa em evitar conclusões erradas, decorrentes de acaso ou vies. O médico se preocupa em beneficiar seu paciente, aplicando corretamente os conceitos provenientes da ciência, usando sua sensibilidade, experiência e percepção a respeito de seu cliente.


Assista ao vídeo gravado pelo autor sobre A Prova do Conceito