domingo, 20 de maio de 2012

Xigris: Uma Lucrativa Falácia Provocada por um Estudo Truncado



Como a Eli Lilly and Company conseguiu convencer as agências reguladoras e a comunidade médica de que o placebo denominado alfa-drotrecogina (Xigris) reduzia mortalidade em pacientes com sepse severa?

Em outubro do ano passado, o fabricante deste placebo suspendeu “voluntariamente” sua lucrativa comercialização, devido aos achados negativos do estudo PROWESS-SHOCK (ainda não publicado). A suspensão da venda do Xigris ocorre após vários anos de utilização na prática clínica, sob o custo estimado no Brasil de R$ 56.000 por paciente, tal como estimado pelo Blog Médico Nerd.

Na verdade, a suspensão da droga não foi tão “voluntária” assim, pois o FDA e a EMEA (agência européia) fariam esta recomendação de qualquer forma. É como aquele político que renuncia antes de ser cassado. 

Como o PROWESS-SHOCK ainda não foi publicado, não podemos analisá-lo com detalhe. O que sabemos é que este estudo incluiu o tipo de paciente que mais se beneficiou no estudo PROWESS, ou seja, pacientes mais graves, em choque séptico. Sendo assim, este foi um estudo negativo, a despeito de otimizado para encontrar benefício. Por não estar publicado na íntegra, nossa análise do PROWESS-SHOCK só pode ir até este ponto. Mas o que precisamos realmente analisar é o estudo PROWESS, pois foi este que gerou a lucrativa falácia.

Este estudo foi publicado em 2001 no New England Journal of Medicine, tendo testado o novo invento da proteína C-ativada versus placebo, em pacientes com sepse severa. Este trabalho demonstrou redução de mortalidade com a droga. Sendo assim, o FDA liberou a droga para comercialização e a comunidade médica adotou a terapia de forma entusiasmada. Vale salientar que dentro do FDA a liberação foi bastante controversa, com 10 votos a favor e 10 votos contra.

Hoje sabemos que o estudo PROWESS rejeitou a hipótese nula (ausência de benefício), quando esta era verdadeira. Este é chamado de erro tipo I. Este caso tem sido usado como exemplo do poder da indústria em convencer médicos de falsas verdades.

Mas o que precisamos é discutir qual foi o mecanismo metodológico utilizado para gerar esta falsa verdade. Para descobrir o motivo do engano, devemos utilizar nosso roteiro e analisar criticamente a veracidade da informação que sugere redução de mortalidade.

Observem que este é um estudo de intervenção, randomizado, que compara grupos muito semelhantes, o que elimina fatores de confusão que possam ser responsáveis pelo resultado; não há viés de aferição do desfecho, pois é um estudo duplo-cego e desfecho é morte, bastante objetivo; as diferenças encontradas foram estatisticamente significantes (P = 0.005), mortalidade foi desfecho pré-definido como primário (ausência do problema das múltiplas comparações, que aumentaria a probabilidade do acaso). Então, aonde está o problema? Parece ser um estudo de boa qualidade, de tamanho amostral razoável, classificado como de fase III. Ou seja, daquele tipo de estudo que tem o potencial de mudar conduta clínica. Por esta aparente qualidade metodológica, o estudo foi convincente.

Porém há uma limitação que geralmente passa pelo crivo científico, principalmente há 10 anos atrás, quando pouco se falava nisso: este foi um estudo truncado.

Estudos truncados são aqueles interrompidos precocemente devido a resultados positivos. É quando o autor fica tão entusiasmado com o resultado interino, que resolve terminar o estudo e concluir pelo benefício da droga. Já comentamos neste Blog que este tipo de estudo pode superestimar a diferença entre os grupos ou em alguns casos indicar uma diferença inexistente. A maioria destes estudos possuem critérios estatísticos pré-definidos para o truncamento, mas isso não resolve o problema, pois pré-definir que vai fazer uma coisa errada não elimina o erro. Esse negócio de truncamento com critérios pré-definidos não passa de uma forma mais elegante aplicar um método tendencioso.

O truncamento é ótimo para a indústria, pois garante o resultado e ainda economiza por ter interrompido um estudo de alto custo.

Normalmente os autores justificam o truncamento por motivos éticos, ou seja, uma vez demonstrado o benefício, seria anti-ético insistir em continuar o estudo com metade dos pacientes usando placebo. Isso é uma das coisas mais esdrúxulas, pois ao truncar um estudo, sua veracidade se torna questionável e nada fica demonstrado. Quanto mais um benefício de tal magnitude que proíba a continuidade do estudo. Anti-ético é gerar uma falsa verdade.

Anti-ético é promover a comercialização de um placebo de alto custo, que compromete o tênue equilíbrio financeiro do sistema de saúde, sem trazer benefício clínico.

Truncar um estudo por benefício é errado e injustificável, apesar de que cada vez mais frequente. Ao contrário desta situação, vale salientar duas justificativas aceitáveis para interromper um ensaio clínico precocemente: primeiro, quando o novo tratamento está trazendo prejuízo significativo, ou seja, interromper por efeito colaterais. Vejam que isto é muito diferente de interromper porque parece que o tratamento é bom. Segundo, é aceitável interromper um estudo por futilidade, ou seja, quando os grupos estão tão iguais, que é muito improvável que surja um benefício relevante como decorrer do estudo. Isto é aceitável, pois neste caso se preserva a premissa inicial, que é a hipótese nula. Lembrem-se que pelo Princípio 2 da medicina baseada em evidências, só devemos rejeitar a hipótese nula, quando há evidências muito fortes contra ela.

Mas porque truncar um estudo estatisticamente significante aumenta a probabilidade do erro tipo I (rejeitar a hipótese nula quando esta é verdadeira) ?

Vamos imaginar que queremos fazer um estudo para avaliar qual time é melhor: Bahia ou Vitória. A hipótese nula do estudo é que os times são iguais em qualidade, ninguém é superior (por falar nisso, a tomar pelas finais com campeonato baiano, os times são bastantes semelhantes em qualidade, semelhantes nas suas mediocridades). O melhor modelo de estudo para avaliar a questão é o chamado jogo de futebol, um estudo prospectivo de 90 minutos. Agora imagine que eu sou o investigador principal. Por ser Bahia desde criança, tenho um conflito de interesse intrínseco a favor deste time. Desta forma, vou pré-determinar que se o Bahia fizer 3 x 0 no Vitória, interromperei o jogo a qualquer momento, pois  já estaria provado que o Bahia é melhor.

Tem lógica? Claro que não. Então porque isso tem lógica em ensaios clínicos randomizados? Não deveria.

Voltando ao jogo. O Bahia faz 3 x 0 nos primeiros 20 minutos do primeiro tempo. Isso representa a realidade? Isso prova que o Bahia é melhor? Não prova, pois estes 3 gols podem ter sido por acaso, ou seja, por sorte, por vacilo da zaga do Vitória. Caso estes dois gols tenham sido por acaso, ao longo dos próximos 70 minutos de jogo essa diferença casual vai se diluir e haverá uma tendência a aproximação dos dois times. Mas se eu interrompo o jogo aos 20 minutos do primeiro tempo, não estou dando oportunidade ao meu estudo de se auto-corrigir, de se aproximar da verdade. É exatamente isso que acontece quando estudos são truncados pela observação de benefício de drogas que não tem efeito algum.

Vejam que a final do campeonato baiano teve dois jogos e não apenas um. Ou seja, ao invés de truncar o primeiro jogo, a federação de futebol escolhe fazer  dois jogos (dois estudos), a fim de reduzir ainda mais a probabilidade do acaso. Já nós, cientistas médicos, fazemos o contrário, truncamos estudos, aumentando a incerteza a respeito do resultado encontrado.

Ao longo de um estudo, o acaso ocorre com frequência, fazendo com que o resultado se modifique a todo momento. Na medida em que o tamanho amostral vai aumentando, os fatos casuais vão se diluindo na verdade. Se eu interrompo precocemente, o estudo pode não ter tido amostra suficiente para diluir o acaso. Porém o pior é que a interrupção do estudo é motivada pelo resultado de interesse. Este é o ponto crucial, favorece que o acaso trabalhe em prol do interesse.

O estudo PROWESS foi planejado para incluir 2280 pacientes e foi truncado em 1680 pacientes. Hoje, sabendo do resultado do estudo PROWESS-SHOCK, podemos imaginar que a diferença de mortalidade (31% vs. 25%) poderia se diluir se o estudo tivesse sido concluído conforme planejado. Esse estudo foi interrompido aos 15 minutos do segundo tempo.

Foi por isso que o FDA recomendou a realização de um segundo estudo para confirmar o resultado do PROWESS. Se recomendou, é porque estava em dúvida e não deveria ter liberado a droga para comercialização, principalmente com o placar de 10 x 10 na votação da liberação da droga.

A dúvida decorreu do truncamento do estudo e, secundariamente, do fato do estudo não ter sido por intenção de tratar.

Havia naquele momento o que chamamos de equipose. Equipose é definida por uma dúvida suficiente para justificar a utilização de placebo em um ensaio clínico. Se existia equipose, a hipótese nula não deveria ter sido rejeitada, a droga nunca deveria ter sido liberada ou prescrita.

Há estudos a respeito do impacto do truncamento. Estes mostram que quanto menor o tamanho amostral, maior a probabilidade de equívoco no resultado. Já comentamos neste Blog que o estudo JUPITER (o qual mostrou estatina ser benéfica na prevenção primária de indivíduos com colesterol normal) foi truncado. Pelo fato do JUPITER ter 18.000 pacientes, acredito que o truncamento promoveu uma superestimativa da magnitude do benefício, mas o benefício deve ser verdadeiro. Na medida em que o tamanho amostral vai diminuindo, a informação pode estar não só superestimada, como totalmente falsa.

Um outro estudo truncado que gerou falso resultado foi o de Van de Berghe, que demonstrou redução de mortalidade com controle agressivo da glicemia de pacientes críticos. Anos depois, o estudo NICE-SUGAR (não truncado) demonstrou efeito deletério desta conduta.

O que ocorreu com o Xigris tem muitas implicações e chama a atenção que nós médicos precisamos ser mais responsáveis pelas falsas verdades que aceitamos. Como podemos reclamar que os convênios nos pagam mal, se ao mesmo tempo ajudamos a indústria promover um tratamento de R$ 56.000 por paciente, sem benefício clínico. Se queremos melhorar nossa remuneração, acho que o caminho seja sentar na mesa de negociação, utilizar o paradigma da medicina baseada em evidências e racionalizar a terapia médica. O primeiro passo é eliminar placebos de alto custo. Enfim, precisamos ser responsáveis pelo absurdo custo da medicina contemporânea, principalmente a modelo americano, o qual o Brasil copia direitinho. Seria melhor copiarmos os modelos inglês ou canadense.

Desta forma, este é mais um exemplo de que não podemos negligenciar o problema do truncamento. Analisar se um estudo é truncado deve fazer parte da análise de veracidade, dentro do tópico acaso. Pois ao truncar, aumentamos a probabilidade do acaso.

Não podemos brincar de adivinhar o futuro, rejeitando de forma tendenciosa a hipótese nula. Não podemos negligenciar o Princípio 2 da medicina baseada em evidências.

domingo, 22 de abril de 2012

A História da Medicina Baseada em Evidências



Esta semana assisti ao filme Um Método Perigoso (A Dangerous Method) que retrata a relação entre Freud, o pai psicanálise, e seu discípulo Jung. Este filme me fez lembrar de quem considero um dos pais da Medicina Baseada em Evidências no Brasil, Dr. Carlos Alfredo Marcílio, e de sua influência em nosso pensamento médico-científico.

O filme de ontem me inspirou a relatar uma recente conversa de fim de tarde com Dr. Marcílio, quando ele me relatou sua experiência nos primórdios da medicina baseada em evidências.

Em dezembro do ano passado, Dr. Marcílio me telefona e fala de forma direta e objetiva: “impressionante como duas pessoas com tanto em comum não conseguem um tempo para sentar e conversar”. Entendi a mensagem e prontamente me agendei para ir à casa dele no dia seguinte, o que vinha prometendo há meses. Naquele final de tarde, na companhia de um vinho do porto, como uma linda vista para o mar de seu apartamento em São Lázaro, conversamos sobre a vida e sobre medicina baseada em evidências.

Esta postagem e suas reflexões refletem o conteúdo desta conversa.

Dr. Marcílio morava em Boston na década de 70, onde era residente de nefrologia em Harvard. Durante sua residência, ele presenciou um período histórico, quando os conceitos epidemiológicos se tornaram mais prevalentes no pensamento do médico clínico.

Epidemiologia é uma ciência que surgiu muito antes disso, no início do século XX, promovendo avanços significativos no campo da saúde pública, como controle de doenças infecciosas e, na segunda metade do século passado, o descobrimento dos fatores de risco cardiovascular. Esta última descoberta (Framingham Heart Study) é responsável pela progressiva queda da mortalidade cardiovascular que experimentam a maioria dos países do mundo, incluindo o Brasil.

No entanto, ao longo das décadas permanecia uma dicotomia entre epidemiologia e raciocínio clínico. O conhecimento de metodologia científica era de domínio dos epidemiologistas ou sanitaristas, enquanto o clínico não se preocupava com isso. Uma lacuna histórica.

Lentamente, os clínicos começaram a perceber que a decisão individual seria melhor embasada no conhecimento obtido por estudos da coletividade, ou seja, de amostras populacionais. Claro, estudando uma amostra de pacientes podemos chegar a uma conclusão mais confiável do que considerar apenas algumas experiências individuais. Isso foi aproximando a clínica da epidemiologia. O termo Epidemiologia Clínica começa a ser usado com mais frequência.

O termo Epidemiologia Clínica foi criado muito tempo antes, na década de 30, por John Paul, que sugeria que conhecimento a nortear nossas decisões deve ser proveniente de evidências epidemiológicas, em detrimento do achismo baseado em plausibilidade e da “minha experiência clínica” restrita aos poucos e enviesados pacientes que vivenciamos. Mas era um termo um tanto esquecido, ou pelo menos sua prática era esquecida. Dr. Marcílio vivenciou de perto este ponto de inflexão, o início da mudança de paradigma. Isto porque Harvard foi um dos principais locais onde a idéia floresceu. 

Apesar da ênfase na Epidemiologia Clínica, percebeu-se que a dicotomia permanecia com o passar dos anos, os clínicos em geral eram resistentes à mudança de paradigma, pois não tinham aprendido medicina desta forma. Conta Dr. Marcílio que foi na década de 80 que os estudiosos no assunto começaram a discutir um termo que tirasse o estigma da epidemiologia e aproximasse a ciência médica da prática clínica. Foi então que David Sackett e seu grupo da Universidade de McMaster no Canadá cunharam o termo medicina baseada em evidências. 

Percebam que medicina baseada em evidências não surgiu neste momento, foi apenas uma mudança de nome, uma estratégia de marketing, no intuito de promover um avanço na prática médica, avanço este que já deveria ter acontecido décadas atrás. Nesta época, já de volta ao Brasil e como diretor do CNPQ, Dr. Marcílio trouxe o grupo da McMaster ao Brasil para promoção de cursos nesta área e se deu o início da difusão deste conhecimento em nosso país.

No entanto, percebemos que a dicotomia ainda existe de forma bastante prevalente. Ainda hoje quem mais entende de metodologia científica são os epidemiologistas, que em sua maioria não praticam clínica. Isso gera uma lacuna entre conhecimento cientifico e prática clínica. Os clínicos, em sua maioria, se julgam distantes deste conhecimento. Esta sequela história é a maior barreira à medicina baseada em evidências.

Mas existem outras barreiras. Em paralelo com o “surgimento” da medicina baseada em evidências, os conflitos de interesse cresceram vertiginosamente nas últimas décadas. Antigamente, eram em menor número as opções de fármacos, os métodos diagnósticos sofisticados, assim como procedimentos de alto custo. Como desejável progresso tecnológico, surge o indesejável conflito de interesse na prática médica. São mais remédios a serem prescritos, mais exames a serem solicitados, mais material a ser usado em procedimentos. Mais propaganda a ser realizada. Mais lucro de procedimentos.

Esta coincidência cronológica entre surgimento do paradigma da medicina baseada em evidências com o ponto de inflexão do progresso tecnológico bloqueou de certa forma a aplicação do paradigma. E isto ocorreu por meio dos conflitos de interesse. Imagino que se o paradigma da epidemiologia clínica tivesse se estabelecido tempos antes, como na década de 50, hoje estaríamos em outra fase.

Dr. Marcílio tem sido uma das vozes mais ativas contra a influência maciça da indústria farmacêutica no pensamento médico. A despeito dele ser nefrologista, testemunhei sua presença eventual em congressos de cardiologia, geralmente “puxando a orelha” da comunidade cardiológica quando esta se deixa seduzir em demasia pela indústria. 

Outro mecanismo de inibição da medicina baseada em evidências é o fato de que todo progresso tecnológico ativa nossa mente cartesiana e a idéia de que a mera aplicação da tecnologia, do tratamento novo, do exame novo, do novo procedimento fará bem ao paciente (mentalidade do médico ativo). Neste caso, as pessoas se esquecem de procurar saber se a nova tecnologia de fato traz benefício clínico.

Mas Dr. Marcílio é otimista e acho que este otimismo vem de vivência de tempos mais remotos, quando menos se falava disso tudo. Começamos a ver nas escolas médicas alguns focos de pensamento baseado em evidências: a Sessão de Medicina Baseada em Evidência, criada e coordenada pelo Prof. Antônio Alberto Lopes (outro pioneiro da epidemiologia clínica em nosso meio) no Hospital das Clínicas; o surgimento da disciplina Raciocínio Clínico Baseado em Evidências no curso médico da Escola Bahiana de Medicina há cinco anos, a qual tenho o prazer de coordenar. Devo a idéia desta disciplina à mente constantemente criativa da Profa. Marta Menezes, coordenadora do curso. Outro aspecto positivo é o atual foco que a Associação Bahiana de Medicina está dando ao tema por meio de seu Diretor Científico Jorge Pereira e do presidente Antônio Carlos Vieira Lopes (ambos entusiastas da medicina baseada em evidências).

Porém ainda estamos engatinhando. Quando o pensamento baseado em evidências estiver de fato presente no curso médico, não será necessária uma disciplina específica para isso, pois todas as disciplinas abordarão seus assuntos sob esta ótica. Assim como todas as sessões clínicas enfatizarão este paradigma.

Este é um mero resumo de uma conversa de fim de tarde, no fim do ano passado, que perpassa questões individuais até chegar na medicina baseada em evidências, o motivo de nossas constantes conversas neste Blog.

O filme Um Método Perigoso mostra um Freud genial, que procura manter um pensamento científico, evitando os devaneios místicos de Jung. Porém o Freud do filme tem uma diferença de Dr. Marcílio. O primeiro prefere seguidores sem criatividade e se incomoda quando Jung propõe novos paradigmas. O segundo é um constante incentivador. Por exemplo, devo a idéia da criação deste Blog a Dr. Marcílio.

O título deste filme também nos remonta a uma reflexão final. Não praticar medicina baseada em evidência é um método perigoso de fazer medicina. 

terça-feira, 17 de abril de 2012

A Evidência Científica e o Julgamento Clínico




* Esta é a terceira postagem da série Os Sete Princípios da Medicina Baseada em Evidências. Na primeira postagem apresentamos os primeiro três princípios; na segunda demonstramos o quarto princípio. Nesta postagem nos antecipamos e descreveremos o sétimo princípio. Em breve completaremos como os princípios 4, 5 e 6.

Estas são as duas principais ferramentas da prática médica, se complementam com perfeição e devem coexistir na tomada de decisão, cada uma com sua função específica. Este é o sétimo princípio da medicina baseada em evidências, o princípio da complementaridade entre a ciência e a decisão clínica. Este é o princípio que dá sentido a tudo que se fala sobre evidências científicas, é o momento em que a ciência se une com a habilidade do médico.

Denominamos propositadamente este como o Princípio da Complementaridade, pois é prevalente o equívoco de que ciência faz oposição ao julgamento clínico. Alguns se opõem à medicina baseada em evidências, pois acreditam que esta prática exclui o julgamento clínico do processo, engessa o médico, o impede de pensar. Pelo contrário, a evidência científica precisa do julgamento clínico para ser empregada. Na verdade, o processo mental de aplicação do conhecimento científico é bem mais intenso do que na medicina baseada em receita de bolo.

Outros consideram que evidência científica é coisa para ser discutida nos porões da academia, enquanto medicina é a prática, o mundo real. Como se teoria e prática fossem coisas antagônicas. Mal percebem que a teoria vem da prática, observada cuidadosamente, por estudos metodologicamente adequados. Lembremos do quarto princípio, aquele que diz que não basta plausibilidade biológica (teoria) para garantir eficácia ou efetividade (prática). Temos que observar a prática, usando uma observação metodológica, científica. Por isso que teoria (evidência científica) é coisa muito mais prática do que o achismo.

Evidência sem julgamento clínico ou julgamento clínico sem evidência torna capenga a prática médica. Este é uma das grandes causas de decisões médicas equivocadas. 

Sendo assim, o primeiro objetivo desta postagem é deixar claro que ciência e julgamento clínico são funções complementarem e não antagônicas. 

Em segundo lugar, precisamos discutir como estas duas funções devem se complementar. Outro erro muito comum de pensamento médico é confundir as funções destas duas ferramentas cognitivas. Digo, achar que o julgamento clínico pode determinar se uma terapia é eficaz ou achar que o médico deve copiar exatamente a conduta aplicada em um ensaio clínico. Equívocos.

Vamos organizar o pensamento: evidência serve para determinar se uma terapia é eficaz, ou qual a melhor terapia ou se um exame é acurado. Ponto. Julgamento clínico serve para analisar se a terapia eficaz (ou a melhor terapia ou o método acurado) deve ser aplicada a um dado paciente.

Vamos aos exemplos.

Exemplo 1. Imaginem que um ensaio clínico determina a eficácia de uma terapia quimioterápica que prolonga de 3 meses para 6 meses a vida de um paciente com câncer. Porém o mesmo ensaio clínico demonstra que a qualidade de vida do paciente piora como consequência dos efeitos colaterais da quimioterapia e ainda quantifica o grau de redução na qualidade de vida. Até aqui temos uma informação científica verdadeira, que não poderia ser obtida com a mesma confiabilidade a partir da experiência clínica. Até aqui utilizamos a ferramenta científica, como deve ser feito. Agora vamos começar a usar o julgamento clínico na decisão final. O que é melhor: 3 meses de vida com razoável qualidade ou 6 meses de vida de ruim qualidade? Essa não é uma pergunta cientifica. Para tomar esta decisão, o médico precisa de experiência com casos anteriores, sensibilidade, intuição, capacidade de captar (ou ouvir) o real desejo do paciente e de sua família. Percebam neste exemplo, que os dois processo cognitivos (conhecimento científico e julgamento clínico) se complementam, porém cada um com sua função.

Exemplo 2. O conhecimento científico indica que, na doença coronária estável, implante de stent coronário não reduz mortalidade, nem infarto. Apenas promove melhor controle dos sintomas do que o tratamento farmacológico isolado. Sendo assim, temos a liberdade de escolher tratamento clínico ou angioplastia para um paciente com angina estável.  A escolha é nossa, e essa liberdade é embasada em evidências. Agora usaremos o julgamento clínico para escolher, utilizando nossa experiência, intuição, sensibilidade. Se tivermos um idoso, limitado funcionalmente pela própria idade, o tratamento medicamentoso pode ser a melhor escolha inicial. Mas se tivermos um paciente de 40 anos, que gosta de jogar tênis e vinha muito limitado pela angina, talvez a angioplastia traga um grande benefício de qualidade de vida. Isto é julgamento clínico. Se tivermos um paciente assintomático com obstrução coronário, é burrice clínica instituir um tratamento que apenas controla sintomas. Controlar sintoma no assintomático? Bem, para quem mora em marte, aviso que esta é uma prática em nosso mundo. E isso não decorre só do distanciamento do médico em relação à evidência, decorre também do distanciamento em relação ao julgamento clínico, preguiça de pensar.

Exemplo 3. Estatina em prevenção secundária reduz mortalidade de pacientes com dislipidemia. Isso é evidência científica proveniente do estudo 4S. Quanto reduz? NNT de 25 para um tratamento de 5 anos. Deparo-me agora com um paciente que há um ano apresentou um problema de rabdomiólise sem causa definida (não usava estatina), com disfunção renal, ficando 40 dias internado na UTI. Uso estatina? Estatina reduz mortalidade, é prevenção secundária! O julgamento clínico utiliza o dado científico de que apenas 1 em 25 pacientes tratados com estatina se beneficiará com a prevenção de morte. Este conhecimento científico quanto à magnitude do benefício nos permite julgar que não devemos indicar estatina para este paciente, que quase morre de rabdomiólise recentemente. Mas se o NNT da estatina fosse de 1, sem dúvida usaríamos a droga. Entre 1 e 25, pensaríamos. Isso é julgamento clínico, é a prática do pensar. 

Exemplo 4. Em prevenção primária, estatina não reduz mortalidade, apenas eventos cardiovasculares, com NNT maior do que prevenção secundária. Se um paciente relata dor muscular com uso da droga, o que faço? Se o julgamento clínico me indica que a qualidade de vida do paciente está muito prejudicada, não seria absurdo suspender a droga (julgamento), visto que é apenas 1 em muitos pacientes que se beneficiam da terapia (evidência), que nem chega a reduzir mortalidade.

Exemplo 5. Temos um método de imagem comprovadamente acurado com base em ciência. Mas é o julgamento clínico quem vai nos dizer qual paciente deverá ter o método utilizado, é o pensamento médico que determinará a probabilidade pré-teste que mostrará a necessidade do exame. Pacientes de baixa probabilidade pré-teste não se beneficiam da pesquisa de isquemia por métodos de imagem ou teste ergométrico, pois as razões de probabilidade não são boas o suficiente para nos fazer mudar de idéia no sentido de que este paciente de baixa probabilidade clínica na verdade tem doença. O conhecimento da acurácia destes testes é científico (não por experiência), enquanto este raciocínio probabilístico é julgamento clínico.

Como diz o Princípio da Hipótese Nula, uma conduta se justifica pela demonstração de sua eficácia. Na ausência desta demonstração, não devemos adotar a conduta. Mas precisamos do julgamento clínico para identificar a exceção ao Princípio da Hipótese Nula. Precisamos do julgamento clínico para identificar quando estamos nas raras situações de Plausibilidade Extrema, onde o tratamento deve ser adotado a despeito da ausência de evidências.

Precisamos também do julgamento baseado em experiência clínica para reconhecer que o paciente em questão é o tipo de paciente que foi representado por um dado ensaio clínico. Sei que um anticoagulante deve ser usado em síndromes coronarianas agudas, por evidências científicas. Porém preciso do julgamento clínico para avaliar se realmente aquele caso se trata de uma síndrome coronariana aguda. Ou é uma elevação de marcador de necrose circunstancial, secundário a aumento de consumo ou redução de oferta por hipotensão, hipoxemia? O edema agudo de pulmão foi conseqüência de um infarto ou foi o edema agudo que causou a elevação de troponina. Isto é julgamento clínico.

Percebam em todos estes exemplos que utilizamos as duas ferramentas cognitivas e em nenhum caso confundimos as suas funções. Não devemos achar que é o julgamento ou experiência clínica que determina a verdade sobre eficácia, nem sobre acurácia. Mas não é apenas a evidência que determinará a conduta médica final.   

Evidência científica precisa de médico para beneficiar o paciente. E o bom médico é aquele que se utiliza do conhecimento científico como premissa básica para seu julgamento clínico. O mau médico é aquele que acha que pode gerar conhecimento baseado no achismo ou em sua anedótica experiência médica. Experiência médica boa é a resultante do treinamento em alinhar o conhecimento científico com o julgamento clínico.

Temos dois cérebros, o esquerdo (racional) e o direito (intuitivo, emocional, criativo). Precisamos utilizar os dois cérebros da decisão médica e não apenas um deles, como se tivéssemos tido um AVC hemisférico. Não podemos ser médicos sequelados, sem o hemisfério esquerdo (sem evidências) ou sem o hemisfério direito (julgamento). Estes dois devem se complementar, como em tudo na vida.

Falamos em postagem recente da Magia no NNT. Mas devo confessar que me precipitei com o termo magia. Magia mesmo ocorre quando nosso processo mental de decisão permite a sinergia da evidência com o julgamento clínico da tomada de decisão médica. Neste momento, a medicina baseada em evidência ganha outra dimensão, a dimensão de beneficiar o paciente. A dimensão médica, que vai além da ciência.

sábado, 7 de abril de 2012

Toninho Cerezo, Falcão e o Fenômeno de Regressão à Média



Toninho Cerezo foi demitido do cargo de técnico do Vitória. Impressionante como este tipo de atitude dos clubes reflete uma completa ignorância a respeito do fenômeno de regressão à média (motivo de postagem prévia neste Blog). Pode parecer pedante achar que os presidentes do Vitória ou Bahia, carentes de inteligência, tenham condição de entender estatística. Mas não é querer demais, pois em países da Europa e nos Estados Unidos, pessoas que trabalham com esporte têm o conhecimento básico da aleatoriedade dos fenômenos para não se deixar levar pela idiota crença de que trocar toda hora um técnico bom por outro técnico bom vai resolver o problema do time.

A esta altura, vocês devem estar se perguntando o que tem a ver Cerezo com o fenômeno de regressão à média. Como já explicado neste Blog, este conceito indica que após uma medida extrema, a medida seguinte provavelmente será menos extrema do que a primeira. Após uma sequência aleatória de derrotas (ou empates), a tendência é que a sequência seguinte seja de menos derrotas, ou mais vitórias.

Nos Estados Unidos há o mito de que dá azar o esportista aparecer na capa da Sports Illustrated. Não é incomum que após a reportagem de capa da Sports Illustrated, o atleta não tenha um desempenho na próxima prova tão bom quanto anteriormente. Mas isso é fácil de explicar pelo fenômeno de regressão à média. O que levou à reportagem de capa foi um desempenho extraordinário na última prova. Pelo fenômeno, este desempenho provavelmente será seguido por outro desempenho menos extraordinário. Não tem nada a ver com a aparição na capa. Simplesmente esta aparição estava associada ao um fenômeno de extremo sucesso.

Estatisticamente, não é difícil de explicar. Todo desempenho é o resultado da qualidade do atleta + uma parcela de aleatoriedade (chance, sorte). Um desempenho extraordinário resulta do atleta ser muito bom e também da sorte naquela dia. Sorte é acaso, se a sorte foi muito grande em um dia, é normal que seja menor no dia seguinte. Da mesma forma, um péssimo desempenho tende a ser seguido por um desempenho melhor.

Além de nossa incompreensão cotidiana quando à presença do fenômeno de regressão, há um segundo processo mental que gera equívoco na interpretação de fatos cotidianos. Temos uma tendência nata de perceber ordem em fenômenos que na verdade são aleatórios. Imaginem que a probabilidade de um time mediano de basquete ganhar é 1/3 (33%). Isto fará com que em 100 jogos, o time ruim ganhe 33 jogos e perca 66 jogos. Nossa mente espera que o time tenha sempre a sequência ganha-perde-perde-ganha-perde-perde. Mas não é exatamente assim, a coisa pode funcionar diferente. Às vezes ocorre ganha-ganha-perde-perde-perde-perde, o que representa 33% também. Mas quando o presidente do clube brasileiro percebe uma sequência de 4 derrotas, se desespera e demite logo o técnico, sem parar para pensar que esta sequência pode ser mero resultado do acaso, não significa piora do time mediano. Já o CEO do time americano de basquete sabe que 4 derrotas consecutivas é simplesmente a forma como os resultados se arrumaram para que desse 66% de derrotas. A sequência era meramente aleatória, porém nossa mente é treinada para perceber ordem em qualquer coisa.

Estes fenômenos que exemplifiquei com fatos do esporte estão também presentes no pensamento científico e médico. Primeiro fenômeno, regressão à média: um paciente em crise de dor lombar tende a melhorar naturalmente, pois crise é um extremo e na semana seguinte a medida da intensidade da dor tenderá regredir à média. Utilizando o fenômeno de regressão à média, tratamentos “alternativos” ganham o rótulo de efetivos baseados apenas na tendência de regressão da intensidade da dor nos dias ou semanas subseqüentes. Segundo fenômeno, o fato de que a aleatoriedade não se apresenta sempre com cara de aleatório: não é porque os primeiros 3 casos submetidos ao tratamento tiveram sucesso, que o tratamento deve ser eficaz. Daí a importância dos estudos possuírem um tamanho amostral suficiente para diluir fenômenos casuais.

Toninho Cerezo saiu, vai ser substituto por não sei quem (não importa) e a próxima sequência de jogos do Vitória vai ser um pouco melhor do que a última. Essa prática esportiva de trocar técnicos na dependência de sequências casuais de jogos é o maior marcador de como os dirigentes do futebol brasileiros são limitados em inteligência. Nos Estados Unidos todo time de basquete, football, baseball, qualquer coisa, tem um serviço de estatística, onde tudo é computado profissionalmente. Não espero que seja assim neste nosso país, mas que pelo menos os responsáveis fossem um pouco menos ignorantes.

Mas qual o problema de ter uma postura ignorante? Isto é apenas futebol, que é feito de folclore, o importante é a resenha no dia seguinte. Talvez não seja bem assim, principalmente neste que se diz o país do futebol e vai sediar a próxima Copa do Mundo. Isso demonstra que futebol não é brincadeira e deveria haver uma postura inteligente em tudo que diz respeito a este esporte. De burrice em burrice, como diz Romário esta Copa do Mundo será o “maior roubo da história”. Mais fácil roubar quando no universo permeia ignorância e falta de senso crítico.

Na medicina, quando não há senso crítico quanto à aleatoriedade dos fenômenos, fica mais fácil da indústria farmacêutica convencer médicos do valor de drogas ineficazes ou de médicos charlatões convencer pacientes da eficácia de falsos tratamentos.

Ainda bem que sou Bahia e meu técnico é Falcão. Aliás, essa frase não tem sentido. O destino de Falcão será o mesmo: em breve, ele será demitido pelo fenômeno de regressão à média; ou receberá uma proposta milionária do Flamengo quando Joel Santana for demitido pelo mesmo fenômeno de regressão à média.

Atualização: Três meses depois desta postagem, na mesma semana de 16 de julho, Falcão foi demitido do Bahia e Joel Santana do Flamengo. 

domingo, 1 de abril de 2012

Refinando a Discussão sobre Análise de Relevância Terapêutica – Tenecteplase versus Alteplase no AVC


Da Série Análise Crítica de Evidências sobre Terapia - Quarta Postagem

Na terceira postagem desta série, discutimos como utilizar o NNT para avaliar a magnitude do benefício de uma terapia ou a superioridade de uma nova terapia sobre a terapia tradicional. Neste texto, refinaremos esta discussão utilizando o artigo A Randomized Trial of Tenecteplase versus Alteplase for Acute Ischemic Stroke, recentemente publicado no New England Journal of Medicine e motivo de intenso debate nas últimas duas semanas. Este ensaio clínico randomizou pacientes para trombólise com tecneteplase versus alteplase na fase aguda de AVC isquêmico, demonstrando superioridade do tecneteplase.

Mas não podemos ficar nesta conclusão genérica, precisamos avaliar a magnitude desta superioridade. O quanto tenecteplase é melhor do que alteplase? De acordo com nossa última postagem, a melhor forma de responder esta pergunta é calculando o NNT em relação ao desfecho primário do estudo. Neste estudo, o desfecho primário foi a melhora na Escala NIHSS após 24 horas da terapia. Esta escala representa uma medida numérica da funcionalidade do paciente após o AVC (varia de 0 a 42), sendo que quanto maior, pior é a sequela do AVC. O artigo mostra que no grupo tenecteplase a melhora da Escala NIHSS após a trombólise foi de 8.0 ± 5.5, comparado a 3.0 ± 6.3 no grupo alteplase (P < 0.001).

Como calcular o NNT desta superioridade? Difícil, não?

O NNT é calculado pela divisão de 100 pela redução absoluta do risco. Como redução absoluta do risco é a subtração da proporção de pacientes que apresentam o desfecho em um grupo pela proporção no outro grupo, fica evidente que para calcular o NNT é necessário que o desfecho seja dicotômico (tipo sim ou não), pois só assim podemos ter a proporção do ocorrido. 

Mas no caso deste artigo, o desfecho principal é numérico, o que impossibilita o cálculo do NNT! Então como fazer?

Parêntese 1: na verdade, escalas ou escores são variáveis ordinais, mas estou as denominando numéricas para simplificar a discussão.

Neste caso, precisamos olhar com calma os números e fazer uma análise de caráter mais subjetivo do que quando temos o NNT. Por ser mais subjetiva, esta análise é algo mais dificultosa. Precisamos nos perguntar se 3 é muito diferente de 8 no que diz respeito à melhora da Escala NIHSS. Nas últimas duas semanas, andei perguntando a colegas neurologistas que encontrava pelos corredores. Todos responderam que esta vantagem pode ser relevante, pode ser a diferença entre falar e não falar, andar e não andar. Muito bem, isso já é alguma coisa, pode fazer diferença. Mas ainda não estou plenamente satisfeito, preciso saber qual a proporção de pacientes em que ocorre este grande benefício. Isso ocorre em raramente ou frequentemente?

Observem com atenção os desvios-padrão das médias de melhora na Escala (8.0 ± 5.5 versus 3.0 ± 6.3). Vejam que estes são grandes em relação às médias. Isso indica grande variabilidade na melhora dos pacientes. Alguns melhoram muito menos do que mostra a média e outros melhoram muito mais do que mostra a média. Isso nos traz mais incerteza quando à magnitude do efeito a partir da comparação dos valores médios. Portanto, neste caso acredito que os dados não são suficientes para fechar a análise de relevância a partir do objetivo primário.

E se comparássemos entre os dois grupos a proporção de pacientes que tiveram uma melhora importante? Assim poderíamos calcular um NNT. De fato, isso foi feito como desfecho secundário: a comparação quanto à proporção de pacientes com recuperação funcional boa ou excelente após 90 dias. No grupo tenecteplase, 72% dos pacientes apresentaram este benefício, comparado a 44% do grupo alteplase (P = 0.02). Vejam 72% - 44% = 28%. Agora, 100 / 28 = 3.6 de NNT, um benefício impressionante. Bingo, tenecteplase é MUITO melhor que alteplase? Calma, não nos precipitemos.

Isto não está muito bom para ser verdade? NNT tão bom assim é raramente visto em trabalhos que comparam tratamento versus controle, quanto mais em trabalhos de eficácia comparativa, os quais comparam tratamento versus tratamento. 

Podemos acreditar neste NNT? Este é um estudo pequeno, apenas 75 pacientes randomizados. Desta forma, há menos precisão nas estimativas pontuais. Mesmo aceitando que a diferença de melhora entre os grupos seja verdadeira, o estudo pode não ser preciso para avaliar a magnitude da diferença. Os valores 72% e 44% podem ser estimativas imprecisas devido ao tamanho amostral do estudo. Por isso mesmo, este desfecho foi pré-definido como secundário.

Desta forma, em um estudo pequeno, o valor do NNT pode não ser preciso. Só para comprovar esta idéia, calculei o intervalo de confiança deste desfecho secundário nos dois grupos. No grupo tenecteplase, 72% dos pacientes melhoraram bastante, mas o intervalo de confiança no nível 95% de certeza variou de 58% a 83%. Ou seja, não podemos garantir que é 72%, pode ser tão baixo como 58% e tão alto como 83%. Já o intervalo de confiança da proporção de melhora do grupo alteplase variou de 25% a 64%.

Sendo assim, não podemos dizer de forma precisa que o NNT é 3.6. O NNT pode ser tão bom quando 1.7, mas tão ruim quando infinito. Este é o intervalo de confiança do NNT: varia de 1.7 a infinito. Desta forma, o NNT é muito impreciso, não dá para usá-lo a fim de avaliar magnitude da terapia. Veja abaixo explicação de como fiz para estimar o intervalo de confiança do NNT.

Parêntese 2: para este cálculo, peguei os extremos do intervalo de confiança da proporção de melhora em cada grupo. O NNT de melhor hipótese é 100 / (subtração do melhor resultado do tecneteplase pelo pior do alteplase, 83% - 25%); o NNT de pior hipótese é 100 / (subtração do pior do tecneteplase pelo melhor da alteplase). Neste caso, o pior da tecneteplase (58%) é pior do que o melhor da alteplase (64%). Nem daria para calcular o NNT, pois este ficaria negativo. Mas dá para interpretar que a imprecisão é tão grande quando o infinito. Isso partindo da premissa de que é tecneteplase é verdadeiramente melhor do que alteplase.

Portanto, este trabalho é insuficiente para concluir a respeito do quanto tenecteplase é melhor do que alteplase. 

Além disso, há a questão da veracidade desta superioridade. Veracidade deve ser analisada antes de relevância, mas nesta postagem fiz o contrário, pois o foco maior é relevância. Mas se formos analisar a veracidade deste estudo, ficaremos ainda mais preocupados. Primeiro, em estudos pequenos a randomização pode não ser suficiente para homogeneizar perfeitamente as amostras. Isto resultou em diferenças entre os dois grupos. Sendo assim, devemos nos perguntar se estas diferenças seriam responsáveis pelo resultado a favor do tenecteplase. O mais crítico seria uma diferença na condição basal do desfecho primário (NIHSS). Felizmente esta é igual. Também a área de penumbra isquêmica (aquela sujeita ao benefício da terapia) é semelhante nos dois grupos. Portanto, não há diferenças que nos façam suspeitar muito que o resultado seja decorrente de fatores de confusão. Ufa, o estudo passou nesta prova. Mas há outro problema: este é um estudo aberto e avalia um desfecho mensurado pelo médico (soft), que pode variar de 0 a 42. Assim, o saber da terapia utilizada pode influenciar a análise da Escala NIHSS. É a velha combinação de um estudo aberto com um desfecho soft. Terceiro, sendo um desfecho secundário, a veracidade da melhora excelente ou boa é menor. O valor de P (0.02) pode estar subestimando a real probabilidade do acaso. Em caso de dúvida na análise de veracidade, revisem a primeira postagem desta série.

Desta forma, o recente artigo nos traz dois importantes aprendizados na análise de relevância: (1) quando o desfecho primário é numérico, não podemos calcular o NNT. Temos que analisar subjetivamente se aqueles números nos garantem relevância e às vezes esta questão fica indefinida; (2) temos também que nos preocupar com a precisão da estimativa do NNT quando estamos com estudos pequenos. Geralmente estudos pequenos não são suficientes para dar precisão a esta análise.

Mas por que os autores escolheram um desfecho numérico como primário, ao invés de um desfecho categórico? Porque este era um estudo pequeno, não teria poder estatístico para avaliar um desfecho categórico. Exatamente por isso que este é um estudo de fase II. Estudos de fase II geram hipóteses que devem ser confirmadas por estudos de fase III.

E os autores reconhecem devidamente esta característica do estudo. Portanto, ainda não está na hora de trocar alteplase por tenecteplase.

terça-feira, 20 de março de 2012

Conselho Federal de Medicina, Indústria Farmacêutica e sua Espetacular Relação com os Médicos


Há algumas semanas o Conselho Federal de Medicina fechou um acordo com a Indústria Farmacêutica, aparentemente normatizando a relação com os médicos. Uma análise um pouco mais cuidadosa deste acordo, nos permite concluir que este se constitui em uma ratificação da questionável relação médicos-indústria. 

Reproduzo aqui textos que o colega Guilherme Brauner publicou em seu Blog Medicina Hospitalar.



Médico Não é Garoto Propaganda
Por Cid Velloso

O novo Código de Ética Médica, em vigor desde abril de 2010, foi unanimemente saudado como um documento atual, abordando temas polêmicos com coragem e lucidez.

Foi, portanto, com tristeza e decepção que a sociedade brasileira tomou conhecimento de uma emenda a um ponto importante do código, sobre a relação dos médicos com os laboratórios farmacêuticos.

No artigo 69 do código de 2010, foi vedado ao médico ``obter vantagem pelo encaminhamento de procedimentos, pela comercialização de medicamentos, órteses e próteses ou implantes, cuja compra decorra de influência direta em virtude de sua atividade profissional``. A intenção era coibir essa relação indigna que denigre a categoria médica.

Na emenda divulgada na semana passada, o Conselho Federal de Medicina corrigiu a norma, sob a alegação lamentável de que não conseguiu conter a pressão dos laboratórios e de determinado segmento de médicos.

Agora, permanece a velha relação indigna entre médicos e laboratórios, tornando alguns profissionais -felizmente a minoria- garotos-propaganda comerciais.

Sou radicalmente contra essa prática, pelos seguintes motivos:

1) Os médicos são profissionais que têm, em geral, uma remuneração digna e suficiente para manter uma vida de boa qualidade.

Não precisam desses subterfúgios de ética duvidosa e às vezes ilegais: viajar às custas de laboratórios, sonegar imposto de renda em conluio constrangedor com os pacientes (``com recibo ou sem recibo?``), cobrar ``por fora`` em convênios de planos de saúde, receber percentual para colocar próteses indicadas especificamente, entre outros. Tais práticas maculam a categoria.

2) Afirmar, como foi feito na argumentação para a referida emenda, que os médicos não direcionam suas prescrições em função da prática de receber viagens gratuitas é de uma ingenuidade e de uma desfaçatez inaceitáveis.

Além de pesquisas já feitas em outros países que demonstram que ocorre efetivamente esse receituário dirigido, é uma dedução óbvia: os laboratórios visam, com essa prática, a fidelidade comercial.

3) O dado mais importante é que, no final das contas, quem vai pagar as viagens dos médicos são os pacientes, em situação de sofrimento físico e psíquico, muitas vezes incapacitados e frequentemente hipossuficientes. É uma crueldade inominável, pois o custo das viagens obviamente será repassado para o preço dos medicamentos.

É aceitável que sejam financiadas viagens relacionadas a pesquisas dos laboratórios feitas por médicos, necessárias à própria pesquisa ou destinadas a relatar em eventos médicos os resultados obtidos. É importante, entretanto, fazer ainda as ressalvas nesses casos, destinadas a evitar a simples propaganda de um produto comercial específico.

O Conselho Federal de Medicina deveria rever a emenda anunciada agora, retornando ao texto original do código de 2010. Se houver polêmica, sugiro realizar uma pesquisa de opinião entre os médicos brasileiros, que certamente irão apontar para a decisão de manter a categoria fora do conflito de interesses e reafirmar a dignidade profissional.

________________________________________
* CID VELLOSO, 75, é médico. Foi reitor da UFMG (Universidade Federal de Minas Gerais) e presidente da Associação Médica de Minas Gerais.

Fonte: Folha de S.Paulo


Mais sobre o acordo do CFM com a Indústria Farmacêutica



Acordo opõe médicos (Folha de SP)





Um acordo que permite aos médicos viajar e receber brindes da indústria farmacêutica provocou um racha entre o CFM (Conselho Federal de Medicina) e o conselho médico paulista, o Cremesp.



Em 2010, o CFM havia anunciado que proibiria viagens de médicos a convite dos laboratórios. No mês passado, porém, o conselho recuou da ideia e acabou fechando um acordo com a Interfarma (Associação da Indústria Farmacêutica de Pesquisa) liberando as viagens.

Em sessão plenária do último dia 23, os conselheiros paulistas aprovaram um documento em que discordam do acordo por julgá-lo "um retrocesso". "Ele sedimenta práticas que são eticamente inaceitáveis", diz o documento, obtido com exclusividade pela Folha.



Entre as distorções apontadas pelo Cremesp estão a autorização de viagens e participações de médicos em congressos sem apontar os critérios para escolha dos beneficiados, além do registro de efeitos adversos de medicamentos - que passaria a ser fornecido pelo médico ao propagandista da indústria. "O médico deve informar a Vigilância Sanitária sobre efeitos colaterais, não o propagandista. Médico não vai trabalhar para a indústria", afirma Azevedo Júnior, do CREMESP.



Ele também critica o fato de o acordo autorizar que médicos recebam presentes e brindes oferecidos pelos laboratórios e estipular valores e periodicidade. "Além de ser difícil fiscalizar isso, não tem o menor efeito porque não é pelo valor que o médico ser influenciado".

No documento, o Cremesp recomenda ainda que o CFM reabra a discussão sobre a necessidade de revisão e aprimoramento das normas éticas que envolvam a relação entre médicos e indústria. O presidente do CFM, Roberto D'Ávila, rebateu ontem as críticas dos colegas paulistas. "São Paulo pode fazer o barulho que quiser. Federal é federal. O protocolo foi aprovado por unanimidade pelo nosso pleno. Acho desnecessária essa polêmica", afirmou.



D'Ávila diz que, durante as discussões sobre o acordo com a Interfarma, houve várias oportunidades para os conselhos regionais se manifestarem contra, o que não teria ocorrido. Já Azevedo Júnior afirma que, em janeiro de 2011, o Cremesp enviou várias críticas sobre o assunto, mas que não foram acolhidas pelo CFM.


sábado, 17 de março de 2012

A Magia do NNT

Da Série Análise Crítica de Evidências sobre Terapia - Terceira Postagem

Na postagem anterior iniciamos a avaliação da relevância terapêutica pela análise do tipo de desfecho testado no trabalho científico. Após análise do tipo de desfecho, devemos quantificar a magnitude do benefício da terapia quanto à redução do desfecho indesejado. Um benefício comprovado (veracidade), pode variar de mínima magnitude a uma enorme magnitude. Seria simplório afirmar “esta terapia é comprovadamente benéfica, devemos implementar.” Precisamos saber o grau de benefício para tomar a decisão clínica certa, ponderando em relação ao custos, inconvenientes e riscos da terapia.

Para isso, utiliza-se o NNT, que significa Número de pacientes Necessário a Tratar a fim de prevenir um desfecho indesejado (Number Needed to Treat). Esta medida quantifica o grau de benefício: quanto menor este número, maior o benefício. O ideal é um NNT de 1, que significa que todo paciente tratado se beneficia da terapia. Por exemplo, um NNT de 1 para o desfecho morte significa que se implementarmos a terapia o paciente vai sobreviver e se não implementarmos o paciente vai morrer. Um NNT de 100 significa que de 100 pacientes tratados, um vai ter sua vida salva pela terapia.

O NNT nos fornece uma importantíssima noção filosófica a respeito do alcance dos atos médicos, noção normalmente ausente no nosso inconsciente coletivo. Refiro-me à consciência de que nossas decisões são limitadas em termos de eficácia. O sistema biológico é complexo e um tratamento implementado não garante benefício. É impossível prever de forma acurada quem é o paciente que vai se beneficiar. Desta forma, o que fazemos é tratar um grande número de pacientes, na esperança de que alguns se beneficiem.

Observem a figura acima, que representa um tratamento hipotético cujo objetivo é prevenir apenas morte no infarto de risco alto. Neste caso, o tratamento só precisaria ser implementado nos 12% dos pacientes que morrem na fase aguda do infarto (as carinhas vermelhas do grupo controle). Porém, no momento da admissão não sabemos quem vai morrer (vermelho) e quem vai sobreviver (carinhas laranjas do grupo controle), pois o paciente não chega na emergência com a cara pintada de vermelho ou laranja. Desta forma, tratamos todos os pacientes, para que aqueles 12% que estão predestinados a morrer recebam o tratamento. Os outros 88% (laranjas) não precisariam receber o tratamento, pois não iriam morrer. Porém mas não sabemos quem é quem.

Agora vamos nos concentrar nestes 12% que vão (ou iriam) morrer. Quase nenhum tratamento consegue impedir a morte de todos os predestinados. Portanto apenas uma parcela dos pacientes terão sua morte prevenida. Na figura do grupo tratamento, apenas 4 dos 12 pacientes predestinados não morrem. Estas são as carinhas verdes, os que são salvos pelo tratamento.

Desta forma, tratamos 100 pacientes para prevenir 4 mortes: 100/4 = 25, ou seja, precisamos tratar 25 pacientes para prevenir 1 morte. Este é o NNT.

Embora o conceito de NNT tem sido bem difundido, minha percepção é que a noção filosófica não é muito prevalente no pensamento médico. Por exemplo, uso de stent farmacológico versus stent convencional. O primeiro reduz reestenose, é verdade. Porém percebemos que quando elegemos o stent farmacológico, o fazemos como se o este tipo de stent fosse prevenir a reestenose em todos e como se o stent convencional fosse provocar reestenose em todos. Ou seja, como se o NNT fosse de 1. Digo isso, pois vemos algumas vezes pacientes internados por 40 dias a espera da liberação de  um stent farmacológico pelo convênio. Ou pacientes instáveis que deixam de receber um tratamento imediato em artéria criticamente obstruída para esperar a liberação de stent farmacológico. Mas qual o NNT do stent farmacológico em comparação ao stent convencional? Para reestenose clínica é 16. Significa que, em média, precisamos implantar stents farmacológicos em 16 pacientes (no lugar do convencional), para prevenir reestenose em 1 destes 16 pacientes. Certas horas, o médico não lembra disso e toma decisões como se o NNT fosse 1.

A magia do NNT é nos dar exatamente esta percepção. 


De posse do NNT da estatina em prevenção primária em pacientes dislipidêmicos (conhecimento científico = NNT de 53 para infarto – não reduz morte), decidiremos se um paciente que se queixa de dor muscular deve ter sua estatina suspensa. Para isso precisamos também do julgamento clínico que avaliará subjetivamente o quanto aquele efeito colateral está reduzindo a qualidade de vida do paciente. Este é um dos momentos especiais, quando o conhecimento científico (NNT) se alia ao julgamento clínico (percepção subjetivo do médico) na decisão terapêutica. Cada um com sua função, se complementando na hora certa.

Percebam então que são dois os componentes que determinam o NNT. Primeiro, a quantidade de paciente que vai sofrer o desfecho indesejado (risco). Depois a eficácia do tratamento em prevenir este desfecho. Desta forma, uma mesma droga pode ter um NNT baixo (grande magnitude) quando aplicada em um paciente de alto risco, ou um NNT alto (pequena relevância) quando aplicada a um paciente de baixo risco.

Risco é a probabilidade do paciente apresentar um desfecho indesejado. Em trabalhos científicos isto é chamado de risco absoluto. Quando subtraímos o risco observado no grupo controle pelo risco observado no grupo tratamento, obtemos a redução absoluta do risco. Por exemplo, RA de morte no grupo droga é 12% e RA de morte do grupo placebo é 8% = RAR = 12% - 8% = 4%. Essa é a magnitude da redução absoluta do risco. Agora, NNT é 100 dividido pela RAR = 100/4 = 25.

RAR = RA do controle – RA do tratamento

NNT = 100 / RAR

A maioria dos artigos não trazem o cálculo do NNT, cabe a nós utilizar a RAR descrita no artigo e calcular o NNT. Ou seja, cabe a nós interpretar a magnitude do benefício do tratamento.

E como interpretar a magnitude, utilizando o valor no NNT? NNT abaixo de que número implica em tratamento relevante?  Não existe uma resposta única para esta pergunta, pois isto depende de algumas coisas. Primeiro, depende do tipo de desfecho, assunto da postagem passada. Um NNT de 40 para morte terá uma relevância maior do que um NNT de 40 para infarto não fatal ou para desfechos combinados que incluam situações não fatais. Outra variável é o tempo de tratamento necessário para obter o benefício. Trombólise no infarto tem NNT de 20 para prevenir morte na fase hospitalar, enquanto inibidor da ECA em ICC tem o mesmo NNT de 20, só que previne morte ao longo de um 1 ano. Trombólise é então mais relevante no IAM do que IECA na ICC.

Mesmo diante destas variáveis, precisamos de um número que nos sirva de guia. Este número é 50. NNT < 50 para morte é considerado tratamento de grande relevância e para desfechos não necessariamente fatais NNT < 50 é tratamento de moderada relevância. Abaixo, vejam um guia lógico para interpretação.



Ainda tem o NNT para causar prejuízo (harm) ao paciente. Este é chamado de NNH (Number Needed to Harm). E isso permite que comparemos o NNT com o NNH, ou seja, façamos um raciocínio de risco/benefício. Por exemplo, Clopidogrel em síndromes coronarianas agudas reduz eventos cardiovasculares não fatais (em 1 ano), porém aumenta a incidência de sangramento maior. O NNT é 48, enquanto do NNH é 100. Por isso que normalmente utilizamos Clopidogrel em SCA, pois em geral o benefício supera o risco.

Desta forma, o NNT é uma medida que oferece um valor filosófico e um valor prático. O valor filosófico é inserir no pensamento médico a noção não determinística do tratamento: tratar (ou não tratar) não é o único determinante do desfecho. O valor prático é quantificar o benefício e o malefício, aprimorando nossa capacidade de decisão clínica.

quarta-feira, 14 de março de 2012

Análise Crítica da Relevância Terapêutica


Da Série Análise Crítica de Evidências sobre Terapia - Segunda Postagem

Na primeira postagem desta série discutimos como avaliar a veracidade da informação científica sobre terapia. Uma vez definido um grau aceitável de veracidade, devemos instituir o tratamento? Não exatamente, pois para que se justifique um tratamento, o tipo de informação trazido pelo trabalho (mesmo que verdadeira) precisa ser relevante.

A relevância deve ser analisada de duas formas. Primeiro, aquela informação verdadeira realmente garante benefício clínico ao paciente? Segundo, o benefício clínico trazido é de magnitude suficiente que justifique os esforços (custo, risco, às vezes desconforto) para se instituir a terapia?

A primeira questão diz respeito ao tipo de desfecho analisado. E a segunda questão ao famoso número necessário a tratar (NNT), que melhor descreve a magnitude de um benefício.

Inicialmente devemos analisar qual é o tipo de desfecho que foi definido como primário. E aí entra a importante distinção entre desfecho clínico e desfecho substituto (surrogate, em inglês).

Desfecho clínico é o verdadeiro impacto da doença na vida do paciente. É o que paciente sente, é morbidade (qualidade de vida) ou mortalidade (tempo de sobrevida). Teoricamente, morte é o evento clínico mais importante na hierarquia de relevância. Abaixo de morte, estão AVC, infarto, angina, internamento por ICC, qualidade da visão em paciente com catarata, fratura em paciente com osteoporose. Para que uma evidência sobre terapia seja suficiente para recomendar a utilização da mesma, se faz necessário que o desfecho avaliado seja de caráter clínico.

Desfechos substitutos são variáveis laboratoriais ou fisiológicas que são utilizadas em estudos que não têm poder estatístico para avaliar desfechos clínicos. Por exemplo, no tratamento anti-hipertensivo, redução da pressão arterial é um desfecho substituto da redução de AVC (desfecho clínico). Melhora da densidade óssea na densitometria é um desfecho substituto, enquanto redução da incidência de fratura é um desfecho clínico. Desfecho substituto é apenas uma informação obtida em um exame complementar, a qual o paciente não sente. Ao fazer um Doppler de carótidas, podemos demonstrar aterosclerose. Se o paciente for assintomático, essa aterosclerose observada é um desfecho substituo de um futuro AVC que poderá acontecer. Mas não há garantia alguma que irá acontecer. Da mesma forma, não há garantia de que um tratamento que melhore esta aterosclerose reduza a probabilidade de AVC.

Como desfechos substitutos são em geral variáveis numéricas, se consegue poder estatístico para detectar mudança destes desfechos mesmo em estudos de porte modesto. Isso justifica a utilização de estudos com desfechos substitutos antes dos ensaios de desfechos clínicos.

Conceitualmente, espera-se que a influência do tratamento no desfecho substituto se reflita em benefício clínico. O problema é que a história da ciência médica está repleta de situações nas quais um aparente benefício em desfecho substituto não causa benefício clínico e às vezes causa até malefício: vernarinona é um inotrópico positivo que melhora fração de ejeção (desfecho substituto), mas aumenta mortalidade; flecainide é um anti-arrítmico que reduz extrassístoles (desfecho substituto), mas aumenta mortalidade; torcetrapib aumenta em 70% o HDL-colesterol (desfecho substituto), mas aumenta mortalidade; doxazozin, um anti-hipertensivo testado no estudo ALLHAT, aumentou eventos cardiovasculares; rosiglitazona reduz glicemia, porém há evidências de que aumenta eventos cardiovasculares; vitaminas podem ter demonstrado efeito anti-oxidante em partículas de LDL (desfecho substituto), mas não alteram risco de infarto. Isto ocorre porque os sistemas biológicos são do tipo complexo, o que torna impossível prever o verdadeiro efeito de uma intervenção, baseado na lógica. Por mais lógico que possa ser.

Há ainda alguns desfechos que podem ser interpretados como clínicos no que dizem respeito a qualidade de vida, porém são substitutos em relação à eventos que levam a risco de vida. Por exemplo, redução de peso é um desfecho clínico, pois melhora qualidade de vida em obesos. Por outro lado, a redução de peso não é garantia de redução das conseqüências clínicas da obesidade, tal como eventos cardiovasculares. De fato, sibutramina reduz peso (embora pouco – apenas 5 Kg em ensaios clínicos randomizados), porém aumenta risco de eventos cardiovasculares.

A indústria farmacêutica costuma tentar (e consegue) convencer médicos da utilização de substâncias de benefício clínico não comprovado, utilizando apenas argumentos de desfechos substitutos. Isso é muito com anti-hipertensivos, como o tal do Aliskireno, droga já comentada neste Blog. Observem:

Diuréticos, inibidores da ECA e antagonistas dos canais de cálcio possuem comprovação científica de que sua utilização promove redução do risco de eventos cardiovasculares, tipo infarto, AVC, óbito. Estas classes de drogas possuem efeito anti-AVC, anti-infarto, anti-morte. Quanto ao Aliskireno, por enquanto esta é apenas uma droga anti-hipertensiva. Mas estes são desfechos substitutos, sem garantia de benefício clínico. Portanto, o Aliskireno não pode ser usado como alternativa a drogas que possuem comprovação de proteção quanto a desfechos clínicos. Não podem ser colocadas como drogas de primeira linha, tal como sugerido na atual Diretriz de Hipertensão da Sociedade Brasileira de Cardiologia.

Para complicar, no final do ano passado o estudo ALTITUDE foi interrompido (ainda não publicado). Este era um ensaio clínico randomizado para Aliskireno ou placebo, em hipertensos diabéticos que já vinham em uso de IECA ou BRA. Houve aumento na incidência de AVC com o Aliskireno, o que motivou à interrupção do estudo. Vejam só, a droga reduz pressão (desfecho substituto), porém pode ser que aumente AVC (desfecho clínico). É o paradoxo dos desfechos, um fenômeno frequente.

Portanto, um estudo de desfecho substituto tem relevância limitada à geração da hipótese de benefício, servindo de degrau para a realização de ensaios cujos desfechos sejam clínicos. Estes sim tem o poder de modificar nossa conduta.

Mas os desfechos clínicos também devem ser analisados criticamente quanto a sua importância. Primeiro quanto a sua hierarquia. Eventos cardiovasculares, por exemplo, temos em ordem decrescente de valor: morte, AVC, infarto, internamento por angina...

Mas não é só isso. Precisamos avaliar a definição do desfecho. Vejamos o caso do infarto. Há estudos cuja definição de infarto garante que o evento é clinicamente importante (dor precordial, corrente de lesão do eletrocardiograma, ...), enquanto há estudos cuja definição de infarto se aproxima mais de um desfecho substituto: por exemplo, elevação de marcador de necrose após angioplastia. E AVC: temos variações de eventos transitórios até eventos com alto grau de seqüela.  Tudo isso deve ser considerado.

Portanto, em primeiro lugar, precisamos avaliar a qualidade do desfecho. Em segundo lugar, precisamos fazer uma avaliação quantitativa do grau de redução do desfecho. Esse é o assunto da próxima postagem: a magia do NNT.