Mostrando postagens classificadas por relevância para a consulta para-queda. Classificar por data Mostrar todas as postagens
Mostrando postagens classificadas por relevância para a consulta para-queda. Classificar por data Mostrar todas as postagens

quarta-feira, 16 de julho de 2014

O Programa de Saúde da Família no British Medical Journal



Nestes dias de baixa auto-estima para o brasileiro, nada como olhar para o que realmente importa e se deparar com algo a se orgulhar. Publicado no British Medical Journal um elegante artigo do Instituto de Saúde Coletiva da UFBA, mostrando associação entre o Programa de Saúde da Família e menor mortalidade cardiovascular no Brasil. Os autores assim concluem:

“Comprehensive and community based primary health care programmes, such as the FHP in Brazil, acting through cardiovascular disease prevention, care, and follow-up can contribute to decreased cardiovascular disease morbidity and mortality in a developing country such as Brazil.”

Estudando 30% dos municípios brasileiros, os autores demonstram 33% de redução de mortalidade (taxa de mortalidade padronizada para idade) por doenças cerebrovasculares e 45% de redução por doenças cardíacas entre os anos 2000 e 2009. Em paralelo, houve aumento de 227% da cobertura pelo Programa de Saúde da Família (PSF) nesses municípios.


Associação entre PSF e Mortalidade Cardiovascular

Embora no mesmo período tenha havido queda de mortalidade e aumento de PSF, de antemão, isto não é garantia de que foi o PSF que causou a redução de mortalidade. Duas coisas ocorrerem em paralelo não garante que uma esteja causando a outra. Por exemplo, observou-se também que houve melhoria das condições sociais neste período, com redução de 40% no número de indivíduos vivendo em condições sanitárias inadequadas e aumento de 37% da renda per capita. Será que não foi esta melhoria social que causou a redução de mortalidade?

Para testar a associação entre mortalidade e PSF, os autores compararam a mortalidade entre cidades com cobertura do PSF consolidada, intermediária, incipiente e ausência de PSF, sendo este último o grupo controle. Isto funcionou como um experimento, onde se compara o efeito de diferentes doses de PSF com um grupo controle sem PSF. Foi observado que quanto mais PSF, menor a mortalidade cardiovascular, com um padrão de relação dose-resposta, o que é sugestivo de causalidade.

Mesmo assim, podem existir fatores de confusão intermediando essa relação, pois as cidades com mais PSF poderiam ter melhores condições sociais. Para um ajuste pleno de variáveis de confusão, seria necessário um desenho que randomizasse cidades para diferentes doses de PSF,  o que faria com que as cidades com mais PSF fossem idênticas às cidades com menos PSF pelo efeito da randomização. Este desenho é denominado randomização em cluster, no sentido de que não é o indivíduo a ser randomizado, mas sim um conjunto de pessoas (cidades). No entanto, do ponto de vista político e social, isso se aproxima do impraticável. Desta forma, teremos que ficar com a evidência observacional, que compara cidades diferentes.

Sendo o dado não randomizado sujeito a fatores de confusão, os autores fizeram ajuste estatístico para variáveis relacionas ao aspecto social, como percentual da população abaixo da linha de pobreza, com condições sanitárias inadequadas, renda per capita, analfabetismo. Também ajustaram para a infra-estrutura de saúde oferecida pelo município, representado pelo número de leitos hospitalares na cidade, número de aparelhos de tomografia e ultrassom. Após ajuste para estes potenciais confundidores, permaneceu a significância estatística da associação de PSF com menor mortalidade cardiovascular!!! Agora assim, a evidência começa a sugerir que PSF e menor mortalidade possuem uma associação direta.

Embora a análise multivariada reforce a associação, devemos ter em mente que esta não é suficiente para garantir que não haja interferência de outros fatores confundidores na mortalidade. Mas considerando a plausibilidade da hipótese, me parece um nível de evidência razoável a favor do PSF. Digamos assim que o conceito teórico de que PSF predispõe a menor mortalidade é fortemente sugerido por esta evidência.


O SPF reduziu mortalidade cardiovascular no Brasil?

Observem que esta pergunta não é respondida pela evidência acima descrita. Uma coisa é demonstrar a propriedade do PSF de proteger pessoas contra mortalidade cardiovascular, outra coisa é garantir que o PSF de fato exerceu o efeito de reduzir mortalidade no Brasil. São perguntas diferentes. 

A mortalidade cardiovascular no Brasil tem caído progressivamente nas últimas décadas. Pode ser que o PSF tenha surgido em 2000 e apenas presenciou essa queda que já vinha ocorrendo, não sendo o verdadeiro responsável. 

O teste desta hipótese estaria em avaliar se a associação negativa entre mortalidade cardiovascular e tempo (queda de mortalidade com o tempo) foi modificada pela presença ou ausência do PSF. Seria uma análise de interação, avaliando o efeito modificador do PSF na associação entre mortalidade e tempo. Esta análise demonstraria que cidades com PSF apresentariam uma queda de mortalidade ao longo desses 10 anos mais importante do que cidades sem PSF. Diferente da análises apresentada, o desfecho seria a queda de mortalidade (curva) e não apenas a mortalidade em um dado período, como feito na análise que comparou as cidades com diferentes coberturas do PSF.

Melhor ainda se a análise se estendesse para antes de 2000. Neste caso, cidades seriam observadas antes e depois do PSF. Seria demonstrado um ponto de inflexão, onde a queda que já vinha ocorrendo na mortalidade ficaria mais vertiginosa após o advento do PSF. E isso não ocorreria nas cidades sem PSF. 

Estes tipos de análise não foram descritas no estudo, portanto não podemos considerar que o estudo mostra o efeito do PSF na progressiva queda de mortalidade cardiovascular no Brasil. Pode ser feita essa inferência na forma de discussão, mas não representa uma comprovação.

Por fim, devemos lembrar que apenas 30% das cidades brasileiras foram estudadas. E estas foram as cidades que ofereciam estatística suficiente para a análise. As demais não tinham os registros necessários. Isso pode ser um marcador de organização do sistema público na cidade. Ou seja, as cidades que ficaram de fora (70% do Brasil) podem ter uma realidade bem inferior às estudadas. Portanto o trabalho não é um retrato do Brasil, nem pretendeu ser. 

Este estudo testa e comprova o conceito teórico de que PSF tem propriedade de reduzir mortalidade, mas não traz as análises que comprovariam que a redução de mortalidade observada nestas cidades nos últimas 10 anos decorreu do PSF.


Atenção Primária ou PSF ?

O título do trabalho menciona "atenção primária” e não PSF. Acho que esta foi a melhor escolha, pois conhecendo as condições de assistência primária do serviço público, provavelmente este estudo está comparando ter atenção primária razoável (PSF) versus ter atenção primária precária. Se as cidades usadas como “controle" tivessem uma atenção primária razoável, o estudo estaria testando o PSF como uma forma inovadora e melhor de fazer atenção primária. Embora eu não tenha estes dados a respeito das cidades controle, acredito que não seja o caso. É possível que as cidades sem PSF  apresentem em média um sistema de atenção primária cuja precariedade se aproxima mais de um placebo.

Sendo assim, vejo este estudo como uma comprovação de que fazer atenção primária (o básico) faz grande diferença e não como uma apologia a um programa específico do Brasil.


Conclusões

Acho que a conclusão dos autores do trabalho foi bastante adequada, pois eles dizem que "adotar um programa de atenção primária pode contribuir para reduzir mortalidade cardiovascular”. O trabalho não testa, nem afirma que contribuiu. Não é um retrato fiel do que aconteceu no Brasil, é muito mais um teste da hipótese de que ter atenção primária é melhor do que não ter, do ponto de vista de saúde cardiovascular.

Interpretações que extrapolam estas conclusões devem ser evitadas: primeiro, o Brasil não descobriu a pólvora com um método especial de atenção primária; segundo, a partir desse estudo não podemos afirmar que a redução de mortalidade cardiovascular entre 2000 e 2009 decorreu do PSF.

Nessa época em que médicos falam tão mal do sistema público de saúde de nosso país, é de se orgulhar que nosso programa de atenção primária tenha seu benefício teórico demonstrado por um elegante estudo baiano e publicado na principal revista médica de um país cujo sistema de saúde pública é um padrão mundial.

Mesmo assim, devemos evitar o ufanismo. Na verdade, adotar um programa de atenção primária é o mínimo que um país deve fazer, é o básico, é a obrigação. Não sendo um mérito especial, espero que este trabalho não seja usado politicamente nesta época de eleição. Até porque o PSF foi criado por um governo e ampliado por outro. 

terça-feira, 19 de janeiro de 2010

O Paradigma do Para-queda

Medicina baseada em evidências é definida como a utilização da melhor evidência corrente na tomada de decisões médicas. Melhor evidência corrente às vezes não são estudos de alta qualidade científica, pois estes não estão presentes em várias circunstâncias clínicas. Muitas vezes não há um grandes ensaio clínico randomizado para uma certa decisão terapêutica, ou um grande estudo de coorte para resolver uma questão prognóstica. Desta forma, cabe à medicina baseada em evidências identificar circunstâncias onde se justifica tomar condutas clínicas mesmo sem a evidência ideal. Mas como saber que circunstâncias são estas?
Há duas circunstância gerais que se aplicam neste caso: plausibilidade extrema ou gravidade extrema. O primeiro caso ocorre quando a situação é tão plausível que se torna anti-ético exigir que a conduta seja condicionada à realização de um ensaio clínico. Não precisamos randomizar indivíduos que pulam de um avião para uso de para-queda ou placebo para saber que a terapia do para-queda reduz a mortalidade. Daí o paradigma do para-queda, que tem vários exemplos médicos: uso de diurético no edema agudo de pulmão, troca de valvas cardíacas defeituosas, correções de cardiopatia congênita grave, implante de marca-passo no bloqueio átrio-ventricular total. Estas são situação são de plausibilidade extrema, aplicadas corretamente, a despeito da inexistância de ensaios clínicos. Há outas situações, as de gravidade extrema. Por exemplo, choque cardiogênico decorrente de embolia pulmonar. A terapia trombolítica fica indicada, pela situação da gravidade extrema, ou seja, é tão alta a mortalidade, que se determina uma terapia mesmo sem um ensaio clínico randomizado.

O problema é que são inúmeras as situações onde se adota uma terapia na ausência de evidências e na ausência de situações que impliquem em gravidade extrema ou plausibilidade extrema: uso de ezetimibe para redução do colesterol; uso de terapia de reposição hormonal para redução de eventos cardiovasculares; uso de rimonabant para perda de peso; preferir novos anti-hipertensivos sem comprovação de benefício clínico, em detrimento de anti-hipertensivos mais antigos com benefício comprovado; e assim por diante. São múltiplos os exemplos. E aí entra a pressão da indústria farmacêutica, a qual convence grande parte da comunidade médica a adotar condutas sem evidências, porém lucrativas em vários sentidos.

Medicina baseada em evidências não é ser inflexível e só adotar condutas plenamente validadas. Cabe ao médico separar as situações onde é necessário mais flexibilidade e situações onde as evidência ideais devem ser aguardadas pacientemente. Aí entra a experiência clínica que não é a antítese da evidência, mas sim um requisito importante na tomada de decisão.

Por fim, medicina baseada em evidências não é um purismo científico feito para agradar acadêmicos. É a utilização do conhecimento médico em benefício do paciente em primeiro lugar.

sábado, 9 de julho de 2011

Análise de Aplicabilidade: Ticagrelor


Vejam só que coisa. A gente fica esperando 10 anos para baratear o preço do Clopidogrel. Quanto isso acontece com o genérico, aparece uma melhor opção, cujo preço está no patamar do Clopidogrel antes da queda de sua patente.

No final da última postagem, escrevi que “uma equação envolvendo magnitude de benefício, risco de sangramento e custo da nova terapia permitirá uma decisão individualizada a respeito de qual das duas drogas deverá ser usada.”

Vamos exercitar este pensamento, que corresponde à análise de aplicabilidade de uma evidência científica. Este tipo de análise deve ocorrer após a análise de veracidade da evidência. Ou seja, partiremos do pressuposto de que a veracidade do artigo já foi analisada.

Primeiro, do ponto de vista de saúde pública esta droga não se aplica. Considerando o modesto benefício do Ticagrelor e seu alto preço, uma boa relação de custo-efetividade precisaria ser muito bem demonstrada, principalmente em nosso meio. Ainda não temos esta definição e é provável que não seja uma droga custo-efetiva.

Então fica a decisão para o paciente que vai pagar pela droga, cuja duração do tratamento é de pelo menos um ano após a síndrome coronariana aguda. Normalmente estamos dispostos a pagar um alto preço quando o retorno é muito bom. Mas ninguém vai querer pagar o preço de uma Mercedes e levar um fusquinha modelo antigo. Considerando o NNT de 52, o Ticagrelor não é nenhuma Mercedes, como comentado na postagem anterior. Então precisamos escolher a população que vai se beneficiar mais da droga, transformando um fusquinha em um carro de nível pelo menos médio. Digamos, numa Brasília (essa analogia é para aqueles com mais de 30 anos).

Foi exatamente isso que o estudo PLATO fez, corretamente. Ou seja, selecionou uma população de alto risco. A amostra do estudo PLATO é de risco mais alto do que a amostra do lendário estudo CURE, aquele que validou o uso de Clopidogrel: a incidência do desfecho combinado (morte CV, infarto e AVC) no grupo Clopidogrel do estudo PLATO é 11.7%, comparados a apenas 9.3% no estudo CURE. Isso ocorreu porque no PLATO eram necessários dois de três critérios para o paciente fosse incluído no estudo (dentre eletrocardiograma, marcadores de necrose, idade, DAC prévia, diabetes) e no CURE apenas um de três critérios de inclusão.

Devemos observar que este NNT está otimizado pela correta seleção de uma população de alto risco. Digo correta seleção, pois quando temos uma droga de benefício modesto, devemos identificar uma população de maior risco, cuja redução absoluta de risco será também maior. O PLATO fez isso e obteve o NNT de 52. Caso o PLATO houvesse selecionado uma amostra semelhante à do CURE, o NNT seria 100.

Como calculei isso? De acordo com o PLATO, Ticagrelor (comparado a Clopidogrel) promove uma redução relativa de 19% na incidência de desfechos combinados. Aplicando 19% aos 9.3% do grupo Clopidogrel na população do CURE, haveria uma redução para 8.5%, ou seja, redução absoluta de risco de 1%. Isto dá um NNT de 100.

Isto nos indica que o Ticagrelor deve ser uma droga limitada aos pacientes de alto risco cardiovascular. Primeiro, porque estes são os que vão experimentar uma redução absoluta de risco aceitável. Segundo, porque estes são os que se prejudicariam em esperar cinco dias de suspensão do Clopidogrel caso fosse indicada cirurgia cardíaca. Lembrem-se que o Ticagrelor só precisa ser suspenso por 24 horas antes da cirurgia, pois seu efeito é de curta duração.

Desta forma, no cenário de síndromes coronarianas sem supradesnível do ST, o Ticagrelor teria indicação para os pacientes de alto risco (Escore GRACE > 140 ou sintomas recorrentes durante internamento). Nestes pacientes, o impacto absoluto da terapia provavelmente justifica a troca do tradicional Clopidogrel pelo Ticagrelor. Nos demais, eu ficaria com Clopidogrel.

Quanto ao infarto com supradesnível, o subgrupo de pacientes submetidos a angioplastia primária mostrou resultados consistentes com a amostra geral do PLATO. Considerando que angioplastia primária é um procedimento não planejado, o início de ação mais precoce do Ticagrelor pode ser uma vantagem.

Os pacientes tratados com trombólise não entraram no PLATO, portanto para estes o Clopidogrel continua a droga de eleição, adjunta à Aspirina.
Percebe-se assim que na análise da aplicabilidade de uma evidência, precisamos avaliar criteriosamente qual a amostra estudada e o quanto devemos extrapolar a indicação para além desta amostra. Neste caso, não há sentido em se extrapolar para pacientes de risco baixo. Para conhecer a amostra estudada, devemos prestar atenção aos critérios de inclusão, tabela de características da população e na incidência dos desfechos de interesse. Em segundo lugar, o NNT deve ser contextualizado para a gravidade do paciente, aplicando a redução relativa de risco nos diferentes tipos de população, obtendo as reduções absolutas específicas. Por fim, análises de subgrupo são úteis para mostrar se há consistência do resultado positivo nos diferentes subgrupos, como fizemos agora com o infarto com supradesnível.

Imagino assim que Clopidogrel continue a primeira opção para pacientes com síndromes coronarianas agudas, ficando o Ticagrelor para os subgrupos aqui especificados.

quarta-feira, 30 de dezembro de 2009

Terminou a Farsa do Ginkgo Biloba

Em situações de plausibilidade ou gravidade extrema se faz justificável adotar condutas médicas sem evidências científicas de seu benefício. Este é o Paradigma do Para-queda: não precisamos de um ensaio clínico randomizado para saber que o uso deste device reduz a mortalidade de indivíduos que pulam de um avião. Por outro lado, a prática médica está repleta de condutas que não se aplicam ao Paradigma do Para-queda, nem possuem evidência científica de eficácia/segurança. Após alguns anos de lucro da indústria farmacêutica, estas condutas são desbancadas por ensaios clínicos randomizados.
O mais recente exemplo é o Ginkgo Biloba. Nunca entendi porque esta droga ficou tão popular nas prescrições médicas. Segundo informação da CNN, o lucro da indústria farmacêutica com a venda desta substância nos Estados Unidos foi de 98 milhões de dólares em 2008. Hoje foi publicado no JAMA (302(24):2663-2670) o ensaio clínico randomizado Ginkgo Biloba for Preventing Cognitive Decline in Older Adults, onde 3.000 indivíduos > 72 anos (média 79 ± 3 anos) foram randomizados para Ginkgo Biloba ou placebo, não sendo observado nenhum benefício cognitivo em seguimento de 6 anos.
É assim mesmo, a história se repete. Foi assim com terapia de reposição hormonal para prevenir eventos cardiovasculares; Levosimedan em substituição a Dobutamina em pacientes com IC aguda; Rimonabant para perda de peso; e muitos outros exemplos onde a informação científica adequada mostrou que o uso sem evidência científica foi precipitado. Pelo menos, o estudo não mostrou que Ginkgo Biloba é prejudicial. Em breve surgirão as viúvas do Ginkgo Biloba, que inventarão uma sérias de críticas ao estudo do JAMA, na tentativa desesperada de preservar uma parcela dos 98 milhões anuais. Quando será que a comunidade médica vai aprender?

quinta-feira, 14 de outubro de 2010

A Morte da Sibutramina (Reductil)




Em janeiro deste ano escrevemos sobre a Sibutramina, droga inibidora do apetite que está no mercado brasileiro há mais uma década. Naquela oportunidade haviam sido anunciados os primeiros resultados do estudo SCOUT, que embora desenhado para testar a hipótese de benefício clínico da droga em pacientes de alto risco cardiovascular, mostrou justamente o contrário, ou seja, aumento de eventos cardiovasculares. Naquela oportunidade, a European Medicines Agency recomendou a suspensão da droga na Europa, enquanto o FDA e a ANVISA optaram por uma atitude mais conservadora, ou seja, recomendar a restrição da droga em pacientes de risco cardiovascular.

O ensaio clínico SCOUT foi publicado na íntegra no mês passado, no New England Journal of Medicine, confirmando a notícia anterior e demonstrando aumento do risco de infarto (hazard ratio = 1.28; 95% IC, 1.04 to 1.57) e de AVC (hazard ratio = 1.36; 95% CI, 1.04 to 1.77) com uso da Sibutramina comparado ao grupo placebo. Isso motivou o FDA a se reunir novamente, recomendando em 08 de outubro a suspensão desta droga. Em pesquisa no site da ANVISA não encontrei resolução recente, mas desconfio que em breve a mesma seguirá os passos do FDA, como de praxe.

O FDA e ANVISA resistiram inicialmente à suspensão da droga, utilizando um argumento inadequado, porém relativamente comum nestes casos: como o estudo SCOUT avaliou apenas pacientes de alto risco cardiovascular, a droga só precisaria ser proibida neste subgrupo. Vale a pena discutir um pouco sobre este raciocínio, pois está no cerne de um dos importantes conceitos em medicina baseada em evidências: a validade externa de um estudo.

Validade externa é quando o resultado de um estudo pode ser extrapolado para além da população-alvo do trabalho. Por exemplo, tratamos pacientes com miocardiopatia chagásica com inibidores da ECA e beta-bloqueadores porque julgamos que podemos extrapolar os resultados dos estudos de miocardiopatia isquêmica/dilatada. Isso é uma aplicação de validade externa, que envolve dentre outras coisas um raciocínio clínico e de plausibilidade. É quando utilizamos o paradima do para-queda em nossas decisões de extrapolar o resultado de um estudo. Observação a parte: alguns confundem validade externa com a avaliação do quanto o estudo selecionou corretamente os pacientes que se propôs. Isso é um raciocínio de viés de seleção, o que faz parte da validade interna.

No caso do estudo SCOUT, realmente a população-alvo do trabalho é formada de pacientes com critérios para alto risco cardiovascular (idade acima de 55 anos + doença cardiovascular pre-existente ou diabetes). O quanto isso se aplicaria a uma população de risco mais baixo? Provavelmente a magnitude do malefício da droga não se reproduzirá em pacientes de baixo risco cardiovascular, pois é mais difícil conseguir provocar um infarto nestes pacientes. Tudo bem, isso é verdade. Mas agora nos perguntamos, isso é suficiente para prescrever a droga em pacientes de baixo risco cardiovascular, como sugeriu a ANVISA no início do ano.

A questão é que esta decisão vai além do raciocínio de validade externa do estudo. O estudo SCOUT foi desenhado para testar o benefício da droga e justamente por isso escolheu uma população de risco elevado. Observem que a metodologia normal é essa, ou seja, os estudos que tentam demonstrar pela primeira vez benefício de uma droga, começam pelas populações de alto risco, pois nestas é mais fácil demonstrar um benefício estatístico. Você não vai conseguir demonstrar redução de risco cardiovascular com Sibutramina em uma população que não vai ter infarto, ou seja, em uma população de baixo risco. Portanto se precisa estudar os de alto risco, onde a droga teria um potencial de proteger o paciente de algo que estaria para ocorrer. Por exemplo, todos os estudos que mostram benefício de antihipertentivos selecionaram população de alto risco. Podem observar.

Então o raciocínio deve ser o seguinte: se você não conseguiu demonstrar benefício clínico da droga na população mais predisposta a se beneficiar, muito provavelmente não vai haver benefício clínico nos demais pacientes. Ponto. Droga suspensa, pois não tem porque usarmos alguma coisa que não traz benefício. 

Pior ainda quando a droga causa malefício, pois se você quiser usar em outros pacientes, agora ainda tem ônus de demonstrar segurança nestes pacientes, mesmo sendo eles de menor risco cardiovascular.

É engraçado o que a indústria faz. Seleciona pacientes de alto risco devido à maior probabilidade de mostrar benefício (isso é correto), mas quando o resultado é fora do esperado, diz que este se limita apenas aos pacientes de alto risco.

Devemos sempre nos lembrar que uma droga deve ser prescrita baseado no benefício que vai proporcionar e não baseado na ausência de malefício.

Ausência demonstração de malefício em uma população de baixo risco não justifica o uso de droga, pois não também não há demonstração de segurança, muito menos de eficácia.

Em conclusão,  o FDA proibiu e a Abott já suspendeu a droga no mercado americano. Vamos ver o que acontecerá no Brasil. Convido vocês a aproveitarem esta oportunidade para ler novamente nossas postagems de janeiro sobre a Sibutramina, onde criticávamos o FDA pela não suspensão desta droga naquela época (postagem 1 e postagem 2). É sempre interessante analisarmos retrospectivamente o que discutimos tempos atrás.

Mais uma droga que nunca deveria ter entrado no mercado, nunca deveria ter sido prescrita por médicos, pois estudos de desfechos clínicos são essencias para sabermos de fato as consequências de nossas ações neste complexo sistema que é o organismo biológico.

sábado, 4 de junho de 2011

A Futilidade da Niacina


De acordo com o dicionário Wikipédia, um dos significados da palavra futilidade é inutilidade, aquilo que não dá resultado. É o que está demonstrado na figura acima: tentar acertar a bolinha de golfe é quase o mesmo que não tentar, pois a probabilidade de acerto é mínima. Então essa tentativa pode ser considerada fútil. Em medicina baseada em evidências, o termo futilidade se aplica quando uma intervenção não produz resultados, ou no máximo produz um resultado desprezível.

É o que foi demonstrado pelo ensaio clínico AMI-HIGH, o qual testou a hipótese de que o uso de niacina (ácido nicotínico, vitamina B3) traz benefício em indivíduos que já fazem uso de estatina, mas têm HDL-colesterol baixo. Esse estudo pretendia randomizar 3.400 pacientes, mas foi interrompido com 1.700, pois não havia nenhum indício de benefício em análise interina. Em outras palavras, foi interrompido porque a Niacina preencheu critério de futilidade: mesmo se o estudo continuasse, iria mostrar ausência de benefício ou na melhor das hipóteses um benefício desprezível.

Já critiquei nesse Blog estudos truncados (interrompidos precocemente) que mostram benefício de uma terapia. Porém no caso presente a crítica não se aplica, pois a interrupção foi por critério de futilidade. Sabemos que o pensamento científico deve partir da premissa de que a hipótese nula é verdadeira. Interromper um estudo e continuar com a hipótese nula está dentro da ordem cientifica. Principalmente se a análise mostra que se houver benefício, este será irrelevante.

Por outro lado, é criticável rejeitar a hipótese nula (premissa básica) com base em estudo truncado. É exatamente devido à violação desse princípio científico da hipótese nula que muitos mitos são criados em medicina e depois precisam ser derrubados.

As pessoas acreditam nas coisas antes da hora. Por exemplo, acreditamos antes da hora que Robinho seria um novo Pelé. Até Pelé falou isso. Rejeitamos a hipótese nula de que Robinho era normal. O tempo mostrou que Robinho é apenas um bom jogador. Foi um entusiasmo precoce. Em futebol, tudo bem. Mas em medicina não podemos fazer isso (a exceção do paradigma do para-queda).

Vamos voltar à Niacina.

Ao longo da última década a indústria farmacêutica fez uma propaganda entusiástica do uso de niacina para paciente com HDL-baixo. Com isso ressuscitou a utilização de uma droga que após o advento das estatinas havia perdido espaço. O faturamento anual com a venda de Niacina nos Estados Unidos chega a $1 bilhão. O problema é que todo esse faturamento não é baseado em evidências. Os estudos que mostraram algum benefício clínico com Niacina datam mais de 30 anos, época em que estatinas não existiam. Agora com o uso de estatina, precisamos demonstrar benefício clínico nesse cenário.

Todos nos lembramos das visitas dos representantes, que argumentavam plausibilidade biológica, citavam estudos de Niacina em pacientes sem estatina ou citavam estudos de desfechos substitutos. Mas essas propagandas não eram cientificamente convincentes.

HDL-colesterol baixo tem associação independente com eventos cardiovasculares em estudos de coorte prospectiva, inclusive com uma relação dose-resposta. Estes dados epidemiológicos aliados à plausibilidade permitem a conclusão de que HDL-colesterol baixo representa um fator de risco para doença aterosclerótica. Isso é conclusão científica. A partir daí, pode-se criar a hipótese de que se aumentarmos farmacologicamente o HDL-colesterol, reduziremos eventos cardiovasculares. Isso é uma hipótese plausível. Por outro lado, considerar isso uma verdade suficiente para adotar a conduta é pura extrapolação.

Ao tempo em que critico a propaganda não embasada, devo reconhecer o mérito da indústria em ter co-financiado este estudo. Este não foi um estudo conduzido pela indústria, foi conduzido e parcialmente financiado pelo National Institute of Health (NIH), órgão governamental, isento. Mesmo assim, a Abbot aceitou financiar metade das despesas do estudo, sem influência nos resultados. É um mérito e um modelo que deveria ser mais freqüente: estudos financiados pela indústria, porém conduzidos por orgãos independentes.

O AMI-HIGH não está publicado, foi apenas anunciado em forma de conferência no NIH. Estes eram pacientes de alto risco cardiovascular, em uso de estatina, com LDL baixo, porém HDL baixo e triglicérides elevados. Apesar de a Niacina ter aumentado o HDL-colesterol, não houve benefício clínico: a incidência anual do desfecho primário composto foi 5.6% no grupo controle versus 5.8% no grupo niacina. Esse desfecho primário foi o composto de infarto fatal e não fatal, AVC, angina instável ou revascularização.

Precisamos entender que os sistemas biológicos são complexos, o que faz com que eventos sejam decorrentes de uma multiplicidade de fatores, que possuem uma multiplicidade de interações. Impossível prever o resultado de uma intervenção. Embora HDL-colesterol seja uma molécula anti-aterogênica, aumentar sua concentração pode não ter efeito anti-aterogênico, pois qualitativamente essas novas moléculas podem ser diferentes. Lembram do estudo Illuminate, que testou torcetrapib, uma droga muito mais potente do que Niacina para aumentar HDL-colesterol? Aumentou mortalidade! Justificaram pelo aumento dos níveis pressóricos com a droga, mas será que foi por isso mesmo? Recentemente, o estudo ACCORD não mostrou benefício de fibratos em diabéticos sob uso de estatina, que tinham HDL-colesterol médio de 38 mg/dl.

Ou seja, Niacina, torcetrapib, fibratos, todas estas são estratégias que aumentam HDL-colesterol, porém sem resultar em benefício clínico. Será que estamos com a hipótese certa? Será que HDL-colesterol é mesmo fator de risco? Sabemos que a validação final de um fator de risco é quando o controle do fator reduz a incidência de doença. Tratar LDL-colesterol reduz desfecho, tratar hipertensão reduz desfecho, parar de fumar reduz desfecho. Mas ainda não conseguimos provar o mesmo com HDL-colesterol. Os estudos de 30 anos atrás com Niacina aumentavam HDL-colesterol, mas também reduziam LDL-colesterol. De onde veio o benefício?

Essa é mais uma história que nos lembra do paradigma da medicina baseada em evidências. Mais um exemplo de que plausibilidade biológica não é suficiente para garantir benefício clínico. Mais um exemplo de que estudos de desfechos substitutos não garantem benefício clínico. E assim vamos evoluindo cientificamente.

quinta-feira, 23 de junho de 2011

O Extraordinário Fenômeno de Regressão à Média


O fenômeno de regressão à média é um dos processos menos compreendidos entre leigos e médicos e esta incompreensão provoca interpretações inadequadas de observações científicas. Esta falta de entendimento não decorre de complexidade, pois este é um fenômeno simples. Decorre da regressão à média ser dependente do acaso e da mente humana não estar condicionada a considerar o acaso como um importante componente dos eventos universais.

Por uma questão evolutiva, de sobrevivência, acostumamos a encontrar alguma relação de causa-efeito para qualquer fato com o qual nos deparamos. Nossos ancestrais, na tentativa de criar um ambiente favorável à sobrevivência, procuravam associar todo fato positivo e todo fato negativo a uma causa específica. É freqüente a observação “peguei uma gripe, pois tomei um vento forte ontem”. Na verdade adquirir ou não uma infecção viral é puraobra do acaso, ou azar de ter respirado um ar momentaneamente contaminado por um vírus. O azar ou a sorte diferencia pessoas que ficaram ou não doentes durante um surto de gripe. No entanto, nosso pensamento inato não funciona assim. Por isso que o fenômeno de regressão à média não é intuitivo.

A regressão à média define que em qualquer série de eventos aleatórios, há uma grande probabilidade de um acontecimento extraordinário ser seguido, em virtude puramente do acaso, por um acontecimento mais corriqueiro. Tentarei ilustrar isto com exemplos cotidianos, depois utilizarei o exemplo de um ensaio clínico para demonstrar a importância disto na prática científica.

Imaginem um aluno mediano, daquele que tira sempre a nota mínima para passar de ano, digamos 5,0. Um belo dia esse aluno chega em casa com uma nota 9,0 em matemática (sem ter colado na prova, ou seja, nota verídica). Os pais ficam felizes, elogiam e até lhes compram um belo presente, na intenção de que o incentivo perpetue aquele extraordinário desempenho do garoto. No entanto, na prova seguinte, o aluno volta a seu padrão mediano, recebendo uma nota 6,0. Os pais pensam: não se pode elogiar, temos que ser mais duros com ele. Mas não foi a moleza dos pais que provocou a queda do aproveitamento, foi o fenômeno de regressão à média. Na verdade, o normal do garoto é tirar notas medianas, a nota 9,0 foi obra meramente do acaso e o acaso tende a não se repetir. Por isso que no próximo teste o garoto vai regredir à média de suas notas ao longo do ano. 

Outro dia, o aluno top da turma por acaso tira uma nota 6,0 em matemática. Os pais, bastante rígidos, o colocam de castigo. Na prova seguinte, ele tira nota 10, como de costume. Raciocínio dos pais? Temos que ser duros com ele, assim dá resultado. Nada disso, a nota 6,0 foi um acaso, ele regrediria a sua nota 10 de qualquer jeito.

Assim surgiu o mito de que quanto mais rígida a escola, melhor o desempenho do aluno. A palmatória, usada na época de nossos avós, surgiu exatamente da falta de entendimento da regressão à média. O bom aluno, quando falhava, melhorava após a punição. O aluno medíocre, quando tinha um bom desempenho, não poderia ser premiado, pois após a premiação, seu rendimento cairia. Quanto sofrimento poderia ter sido evitado pelo conhecimento da regressão à média.

Às vezes um bom jogador de futebol (porém não espetacular), após boas temporadas pelo campeonato brasileiro, joga um campeonato extraordinário (artilheiro), se tornando um ídolo. Daí se cria um mito, um novo Pelé. O jogador é rapidamente vendido para um clube europeu por milhões de Euros. Lá não corresponde às expectativas. Daí surgem várias explicações: não se adaptou ao frio, tem saudade dos amigos, só quer saber de balada... Nada disso, simplesmente regressão à média. Claro, as baladas atrapalham, mas craque é craque, que diga Romário.

Lembro de Adriano, bom jogador, que se tornou um ídolo após ter feito um gol na final da Copa América contra a Argentina, aos 47 minutos do segundo tempo. Brasil campeão, por acaso. Adriano se tornou um mito depois daquele jogo, sendo inclusive comparado a Ronaldo Fenômeno. Foi para Europa e regrediu à sua média de bom jogador. Até concordo que houve outras causas, mais um grande fator foi a sua valorização excessiva após algo ocorrido pelo acaso. Com certeza, regressão à média foi um importante componente.

A figura acima ilustra porque pais muito baixos tendem a ter filhos mais altos que eles e pais extremamente altos tendem a ter filhos um pouco mais baixos que eles. Esse é um dos mais usados exemplos de regressão à média. Os pais eram tão baixos ou tão altos por acaso.

Entrando na ciência médica, o fenômeno de regressão à média explica porque é imprescindível a presença de um grupo controle para avaliar se uma intervenção é benéfica. Recentemente foi publicado no Journal of American College of Cardiology um ensaio clínico randomizado, avaliando o efeito do transplante de células-tronco na melhora da fração de ejeção em pacientes com miocardiopatia isquêmica. Metade dos pacientes recebeu células-tronco e a outra metade não, servindo de grupo controle. Interessante notar que a média da fração de ejeção no grupo controle apresentou um aumento de 7% em termos absolutos, sem que nada fosse feito. O grupo transplantado apresentou uma melhora maior, a qual foi estatisticamente superior ao grupo controle, concluindo-se que a terapia influenciou positivamente na função ventricular. Agora imaginem se o tratamento não servisse para nada e os autores fizessem um estudo sem grupo controle. A melhora de 7% entre antes e depois, estatisticamente significante, lhes faria concluir que a terapia teria funcionado. Mas essa melhora decorreu do fenômeno de regressão à média. Isso ocorre quando uma amostra é selecionada com base em uma característica anormal, no caso, fração de ejeção muito baixa. Alguns desses pacientes estão com valores tão baixos por acaso. Quando é feita uma segunda medida, eles tendem a regredir à média, elevando a média geral do grupo.

É por este mesmo motivo que ensaios clínicos de drogas anti-hipertensivas e anti-lipidêmicas precisam de grupo controle, não basta medir antes e depois, pois a segunda medida da pressão arterial e do colesterol sempre tenderá a ser menor, uma vez que a seleção da amostra foi feita com base na variável de interesse sendo anormal.

Como este fenômeno é mal compreendido, vemos com freqüência pessoas insistindo em avaliar efeito de uma estratégia terapêutica simplesmente medindo a variável de desfecho antes e depois. O paciente nunca pode ser seu próprio controle, pois a média do grupo tende sempre a melhorar. É um equívoco testar efeito terapêutico sem grupo controle.

Enfim, na vida cotidiana e científica devemos considerar o acaso com um dos componentes da realidade multifatorial responsável pelos fenômenos a nossa volta. Isso evitará interpretações equivocadas de nossa realidade e desenhos metodológicos incorretos. A noção do fenômeno de regressão à média é um dos componentes da maturidade científica.

* Esta é a primeira postagem da série Curiosidades Estatísticas de Utilidade Científica.

sábado, 13 de maio de 2017

A verdadeira magnitude do efeito de um tratamento



* Da série "Tamanhos de Efeito"

A mente humana é mais afetiva do que quantitativa. O psicólogo laureado com o Nobel Daniel Kahneman descreveu o viés de afeto (affect bias), que é uma das causas de confundirmos risco com dano (postagem prévia), superestimarmos riscos pequenos e subestimarmos riscos altos. Aspectos relacionados a emoção (afeto) interferem em nossa percepção da realidade, como já dizia Immanuel Kant. 

Temos mais medo de entrar em um avião do que de entrar no banheiro para tomar banho, apesar do risco de morte por queda no banheiro ser muito maior do que o risco de morte por queda do avião. Tememos mais febre amarela do que gripe, mesmo que o risco de morte por gripe seja muito maior do que morte por febre amarela. Eu mesmo já me vacinei contra febre amarela, mas contra gripe ainda não.

Ao descrevermos um tratamento, normalmente não quantificamos o benefício  intrínseco, apenas o qualificamos. Nos limitamos a dizer “este tratamento é benéfico” ou “este tratamento reduz mortalidade”.  Sim, mas quanto reduz? 

Ao faltarmos na quantificação, caímos no risco de supervalorizar tratamentos de moderado impacto ou subvalorizar tratamentos de alto impacto. E isso vem ligado à forma “afetiva” e não quantitativa de analisarmos as nossas condutas. 

Por este motivo, iniciaremos a série de postagens neste Blog denominada de “Tamanhos de Efeito”. Esta série trará exemplos de tratamentos e suas magnitudes de efeito. 

Nesta postagem darei dois exemplos cardiológicos. Mas em futuras postagens, tentarei não me limitar ao coração e incentivo os colegas trazerem seus exemplos sob a forma de comentários neste Blog. Acho que será divertido perceber como nossa percepção do tamanho do efeito de um tratamento muitas vezes se distancia do que é apresentado pelas evidências. Não só divertido, este é um exercício necessário.


Como medir o tamanho do efeito? 


A abordagem tradicional da medicina baseada em evidências enfatiza a redução absoluta do risco e o número necessário a tratar (NNT) como as principais medidas de tamanho de efeito, em detrimento da redução relativa do risco e do risco relativo. 

É comum dizermos, “o relativo engana, o que vale é o absoluto.” Eu mesmo costumo usar o exemplo da herança. Se ganhei 50% da fortuna de um tio (relativo), posso dizer que fiquei rico? Parece muito, mas se a fortuna for 1 real, ganhei apenas 50 centavos. O que vale é o absoluto. 

Porém isso é só uma parte da história. O relativo tem grande importância e é essencial para o pensamento médico. Na verdade, a redução absoluta do risco (com a qual calculamos o NNT) não é uma propriedade intrínseca do tratamento, é uma propriedade do paciente que recebe o tratamento. Para um mesmo tratamento, o NNT varia de paciente para paciente, a depender de seu risco basal. Podemos dizer assim, que um tratamento não tem NNT, quem tem NNT é aquele tipo de paciente que receberá aquele tratamento.

Na verdade, a propriedade intrínseca do tratamento é a redução relativa do risco, que tende a ser constante nos diferentes subgrupos de risco. Isto é demonstrado por análises de sensibilidade que usualmente não mostram interação entre risco basal e impacto relativo do tratamento.

Como já mencionamos neste Blog, um tratamento de pequeno efeito (redução relativa do risco) pode proporcionar uma grande redução absoluta (pequeno NNT) se aplicado a uma população de altíssimo risco. Da mesma forma, um tratamento de grande efeito, pode ter uma pequena redução absoluta se aplicado a uma população de baixo risco. 

Portanto, a redução relativa mostra o tamanho do efeito intrínseco do tratamento, enquanto a redução absoluta mostra o impacto do tratamento em um certo tipo de paciente, com um certo tipo de risco basal. 

RRR = tamanho de efeito
RAR = impacto do tratamento

Por isso, devemos mensurar o tamanho do efeito intrínseco do tratamento pela redução relativa do risco, enquanto o NNT é o impacto concreto em um dado paciente. 

Se tivéssemos a chance de saber apenas uma das informações a respeito de um tratamento, qual escolheríamos: a redução relativa ou redução absoluta? 

A relativa, é claro. Pois sabendo a redução relativa, a gente pode calcular a redução absoluta de cada paciente individualmente, desde que saibamos o risco absoluto do paciente. 

Por exemplo, digamos que a redução relativa do risco é 33%. Com base em um escore de risco, estimamos 10% como risco basal do paciente. Assim, a redução absoluta do risco deste paciente é 33% x 10% = 3.3% (NNT = 100/3.3 = 30).

Como referência para análise, os bons tratamentos apresentam uma redução relativa do risco em torno de 30%-40%. 

Inibidor da ECA na Insuficiência Cardíaca


É surpreendente notar que inibidor da ECA na insuficiência cardíaca é um tratamento de pequeno tamanho de efeito. De acordo com o ensaio clínico SOLVD, a redução relativa do risco do inibidor da ECA é apenas 16%, menor que a maioria dos tratamentos cardiológicos que funcionam. Quase ninguém se toca disso, porque a mortalidade da doença é alta, provocando um bom NNT. Este é um tratamento de pequeno efeito, mas de impacto razoável devido à gravidade dessa doença. 

Foi neste momento que um aluno inteligente retrucou: “então o que importa mesmo é a redução absoluta, professor”. Nem tanto. 

Observem que interessante. Se eu digo que a redução absoluta é no SOLVD foi 4.5%, isso parece muito bom. No entanto, a figura muda bastante se, ao invés de dizer a redução absoluta, mostramos os números de cada grupo: no grupo placebo, a mortalidade foi 39.7% e isso reduziu para 35.2%. Percebam que esses dois números não são tão diferentes. Muita gente sem enalapril morre (um pouco mais que 1/3 dos pacientes), mas muita gente continua morrendo com enalapril (um pouco mais que 1/3 dos pacientes). Não muda muita coisa. Quando olhamos sob esta ótica, vemos que o tamanho do efeito do tratamento é pequeno. 

Além disso, o intervalo de confiança da redução relativa do risco apresentado por este estudo de moderado tamanho (2.500 pacientes) é amplo, vai de 5% a 20%. Portanto, este tratamento pode oferecer uma redução relativa de risco tão baixa quanto 5%. E o extremo superior do intervalo de confiança (20%) não é tão diferente do que a medida pontual de 16%. Na medida do tamanho do efeito, é importante observarmos a precisão da estimativa descrita pelo intervalo de confiança. 

Não estou aqui querendo reduzir o valor deste importante tratamento na insuficiência cardíaca, até mesmo porque inibidor da ECA também ajuda no controle dos sintomas. Mas é importante termos a perspectiva do tamanho do efeito, ao lado da perspectiva do NNT. 

Esta perspectiva reduz o affect bias a favor do inibidor da ECA, nos tornando mais “pé no chão” e permitindo uma melhor análise do trade-off risco-benefício. Ficaremos mais parcimoniosos quando diante de certos pacientes, como hipotensos desmaiadores ou com certo grau de disfunção renal. Sem angústia, insistiremos menos nas altas doses sincopantes que procuramos alcançar quando pensamos na panaceia de um tratamento. 

É muito interessante revisitar estes dados do passado. Na mente cardiológica, inibidor de ECA é uma panacéia. Era 1988, quando eu estava no segundo ano de medicina, foi publicado o estudo CONSENSUS no New England Journal of Medicine, ensaio clínico seminal como teste dessa hipótese, sempre citado como respaldo da eficácia do inibidor da ECA na ICC. Mas na verdade, este é um minúsculo estudo (apenas 253 pacientes), que foi interrompido precocemente com apenas 118 desfechos (truncado com menos de 200 desfechos é risco de imprecisão). Aquele estudo mostrava uma redução relativa de risco de 40%. E isso que ficou na mente afetiva dos cardiologistas.

Uma das melhores formas de reter o aprendizado é fazer com que este ocorra acompanhado de emoção. Uma criança queimada por tocar em uma panela quente (trauma) vai aprender com certeza que panela pode queimar a mão. Quando o CONSENSUS foi publicado, a notícia da redução relativa do risco de 40% veio como tamanha novidade que, emocionados, retemos essa informação, que ficará para sempre impregnada em nossas mentes. Depois veio o SOLVD, estudo maior que mostrou um valor mais preciso de 16% de redução relativa do risco. Mas não foram os 16% (efeito pequeno) que ficaram em nossa memória afetiva, foram os 40% que emocionaram mais e emocionaram primeiro. 

Novos Anticoagulantes Orais


Há um equívoco do pensamento comum em relação a estas drogas. Consideramos que sua maior vantagem está na praticidade. Normalmente, pensamos que os novos anticoagulantes orais possuem eficácia equivalente à tradicional e barata warfarina. Por isso, usualmente discutimos as duas opções com o paciente: uma droga prática e cara versus uma menos prática e barata. 

Mas este pensamento comum desconsidera um fato importante. A maior vantagem destas drogas não está na praticidade, a maior vantagem está na superioridade de seu efeito em relação à warfarina. Na verdade, estas drogas, quando usadas em uma dose ótima são muito melhores do que warfarina. Superioridade esta que é mais importante do que a tão mencionada praticidade. 

Na verdade, é muito difícil mostrar superioridade de um tratamento novo em relação a um tratamento tradicional que é eficaz. E se o tratamento novo for melhor do que o tradicional, esta superioridade tende a ser de pequena monta. Diferentemente do habitual, os novos anticoagulantes são muito melhores do que warfarina. No estudo RELY, a dose de 150 mg de Dabigatran promoveu uma redução relativa do risco de eventos embólicos de 34% em pacientes com fibrilação atrial, algo que fica no mesmo nível dos bons tratamentos comparados a placebo. Isto é quase sem precedentes na comparação de tratamento versus tratamento. Da mesma forma, o estudo ARISTOTLE mostra que a apixabana promove uma redução relativa de 21% quando comparado a warfarina. 

(OBS: sem querer me aprofundar nestas comparações, a rivaroxabana deve ser tão boa quanto os outros, mas foi boicotada pelo injustificada posologia de uma vez ao dia, o que deve ter amputado parte de seu efeito. Por isso, a rivaroxabana se mostrou apenas não inferior à warfarina no estudo ROCKET. O que quero dizer é que provavelmente essas drogas todas são parecidas e se forem usadas em dose adequada terão superioridade em relação à warfarina de magnitude bem razoável. Mas o objetivo dessa postagem não é ficar nessa boba comparação entre os novos anticoagulantes orais).

O que quero dizer é que usar warfarina ao invés de um novo anticoagulante é o mesmo que optar por um tratamento pior. Portanto, colocar praticidade versus preço como o trade-off principal deste tipo de decisão compartilhada é um equívoco. O trade-off correto é eficácia versus preço, e de quebra essa eficácia ainda vem com mais praticidade. 

E fica fácil entender porque estas drogas são melhores que warfarina. A warfarina tem um efeito muito variável e imprevisível. No mundo ideal dos ensaios clínicos boa parte dos pacientes não está em faixa terapêutica. Imaginem no mundo real. Se os novos anticoagulantes são mais eficazes que warfarina, a diferença de efetividade (mundo real) tende a ser até maior.

O enfoque principal da praticidade, em detrimento de evidente superioridade, é um exemplo de erro pela falta de perspectiva da redução relativa do risco.

Tá vendo, não só falo mal das coisas. A propósito, ao falar bem, preciso declarar ausência de qualquer vinculação com as indústrias que produzem estas drogas. Apenas estou olhando os números e evitando o viés de afeição. 
_______________________________________________________________________

Conheça o nosso curso de MBE, clicando em Curso Online de Medicina Baseada em Evidências

domingo, 22 de abril de 2012

A História da Medicina Baseada em Evidências



Esta semana assisti ao filme Um Método Perigoso (A Dangerous Method) que retrata a relação entre Freud, o pai psicanálise, e seu discípulo Jung. Este filme me fez lembrar de quem considero um dos pais da Medicina Baseada em Evidências no Brasil, Dr. Carlos Alfredo Marcílio, e de sua influência em nosso pensamento médico-científico.

O filme de ontem me inspirou a relatar uma recente conversa de fim de tarde com Dr. Marcílio, quando ele me relatou sua experiência nos primórdios da medicina baseada em evidências.

Em dezembro do ano passado, Dr. Marcílio me telefona e fala de forma direta e objetiva: “impressionante como duas pessoas com tanto em comum não conseguem um tempo para sentar e conversar”. Entendi a mensagem e prontamente me agendei para ir à casa dele no dia seguinte, o que vinha prometendo há meses. Naquele final de tarde, na companhia de um vinho do porto, como uma linda vista para o mar de seu apartamento em São Lázaro, conversamos sobre a vida e sobre medicina baseada em evidências.

Esta postagem e suas reflexões refletem o conteúdo desta conversa.

Dr. Marcílio morava em Boston na década de 70, onde era residente de nefrologia em Harvard. Durante sua residência, ele presenciou um período histórico, quando os conceitos epidemiológicos se tornaram mais prevalentes no pensamento do médico clínico.

Epidemiologia é uma ciência que surgiu muito antes disso, no início do século XX, promovendo avanços significativos no campo da saúde pública, como controle de doenças infecciosas e, na segunda metade do século passado, o descobrimento dos fatores de risco cardiovascular. Esta última descoberta (Framingham Heart Study) é responsável pela progressiva queda da mortalidade cardiovascular que experimentam a maioria dos países do mundo, incluindo o Brasil.

No entanto, ao longo das décadas permanecia uma dicotomia entre epidemiologia e raciocínio clínico. O conhecimento de metodologia científica era de domínio dos epidemiologistas ou sanitaristas, enquanto o clínico não se preocupava com isso. Uma lacuna histórica.

Lentamente, os clínicos começaram a perceber que a decisão individual seria melhor embasada no conhecimento obtido por estudos da coletividade, ou seja, de amostras populacionais. Claro, estudando uma amostra de pacientes podemos chegar a uma conclusão mais confiável do que considerar apenas algumas experiências individuais. Isso foi aproximando a clínica da epidemiologia. O termo Epidemiologia Clínica começa a ser usado com mais frequência.

O termo Epidemiologia Clínica foi criado muito tempo antes, na década de 30, por John Paul, que sugeria que conhecimento a nortear nossas decisões deve ser proveniente de evidências epidemiológicas, em detrimento do achismo baseado em plausibilidade e da “minha experiência clínica” restrita aos poucos e enviesados pacientes que vivenciamos. Mas era um termo um tanto esquecido, ou pelo menos sua prática era esquecida. Dr. Marcílio vivenciou de perto este ponto de inflexão, o início da mudança de paradigma. Isto porque Harvard foi um dos principais locais onde a idéia floresceu. 

Apesar da ênfase na Epidemiologia Clínica, percebeu-se que a dicotomia permanecia com o passar dos anos, os clínicos em geral eram resistentes à mudança de paradigma, pois não tinham aprendido medicina desta forma. Conta Dr. Marcílio que foi na década de 80 que os estudiosos no assunto começaram a discutir um termo que tirasse o estigma da epidemiologia e aproximasse a ciência médica da prática clínica. Foi então que David Sackett e seu grupo da Universidade de McMaster no Canadá cunharam o termo medicina baseada em evidências. 

Percebam que medicina baseada em evidências não surgiu neste momento, foi apenas uma mudança de nome, uma estratégia de marketing, no intuito de promover um avanço na prática médica, avanço este que já deveria ter acontecido décadas atrás. Nesta época, já de volta ao Brasil e como diretor do CNPQ, Dr. Marcílio trouxe o grupo da McMaster ao Brasil para promoção de cursos nesta área e se deu o início da difusão deste conhecimento em nosso país.

No entanto, percebemos que a dicotomia ainda existe de forma bastante prevalente. Ainda hoje quem mais entende de metodologia científica são os epidemiologistas, que em sua maioria não praticam clínica. Isso gera uma lacuna entre conhecimento cientifico e prática clínica. Os clínicos, em sua maioria, se julgam distantes deste conhecimento. Esta sequela história é a maior barreira à medicina baseada em evidências.

Mas existem outras barreiras. Em paralelo com o “surgimento” da medicina baseada em evidências, os conflitos de interesse cresceram vertiginosamente nas últimas décadas. Antigamente, eram em menor número as opções de fármacos, os métodos diagnósticos sofisticados, assim como procedimentos de alto custo. Como desejável progresso tecnológico, surge o indesejável conflito de interesse na prática médica. São mais remédios a serem prescritos, mais exames a serem solicitados, mais material a ser usado em procedimentos. Mais propaganda a ser realizada. Mais lucro de procedimentos.

Esta coincidência cronológica entre surgimento do paradigma da medicina baseada em evidências com o ponto de inflexão do progresso tecnológico bloqueou de certa forma a aplicação do paradigma. E isto ocorreu por meio dos conflitos de interesse. Imagino que se o paradigma da epidemiologia clínica tivesse se estabelecido tempos antes, como na década de 50, hoje estaríamos em outra fase.

Dr. Marcílio tem sido uma das vozes mais ativas contra a influência maciça da indústria farmacêutica no pensamento médico. A despeito dele ser nefrologista, testemunhei sua presença eventual em congressos de cardiologia, geralmente “puxando a orelha” da comunidade cardiológica quando esta se deixa seduzir em demasia pela indústria. 

Outro mecanismo de inibição da medicina baseada em evidências é o fato de que todo progresso tecnológico ativa nossa mente cartesiana e a idéia de que a mera aplicação da tecnologia, do tratamento novo, do exame novo, do novo procedimento fará bem ao paciente (mentalidade do médico ativo). Neste caso, as pessoas se esquecem de procurar saber se a nova tecnologia de fato traz benefício clínico.

Mas Dr. Marcílio é otimista e acho que este otimismo vem de vivência de tempos mais remotos, quando menos se falava disso tudo. Começamos a ver nas escolas médicas alguns focos de pensamento baseado em evidências: a Sessão de Medicina Baseada em Evidência, criada e coordenada pelo Prof. Antônio Alberto Lopes (outro pioneiro da epidemiologia clínica em nosso meio) no Hospital das Clínicas; o surgimento da disciplina Raciocínio Clínico Baseado em Evidências no curso médico da Escola Bahiana de Medicina há cinco anos, a qual tenho o prazer de coordenar. Devo a idéia desta disciplina à mente constantemente criativa da Profa. Marta Menezes, coordenadora do curso. Outro aspecto positivo é o atual foco que a Associação Bahiana de Medicina está dando ao tema por meio de seu Diretor Científico Jorge Pereira e do presidente Antônio Carlos Vieira Lopes (ambos entusiastas da medicina baseada em evidências).

Porém ainda estamos engatinhando. Quando o pensamento baseado em evidências estiver de fato presente no curso médico, não será necessária uma disciplina específica para isso, pois todas as disciplinas abordarão seus assuntos sob esta ótica. Assim como todas as sessões clínicas enfatizarão este paradigma.

Este é um mero resumo de uma conversa de fim de tarde, no fim do ano passado, que perpassa questões individuais até chegar na medicina baseada em evidências, o motivo de nossas constantes conversas neste Blog.

O filme Um Método Perigoso mostra um Freud genial, que procura manter um pensamento científico, evitando os devaneios místicos de Jung. Porém o Freud do filme tem uma diferença de Dr. Marcílio. O primeiro prefere seguidores sem criatividade e se incomoda quando Jung propõe novos paradigmas. O segundo é um constante incentivador. Por exemplo, devo a idéia da criação deste Blog a Dr. Marcílio.

O título deste filme também nos remonta a uma reflexão final. Não praticar medicina baseada em evidência é um método perigoso de fazer medicina. 

segunda-feira, 21 de maio de 2012

Viés de Análise de Dados - Bahia vs. Vitória


Em resposta à nossa última postagem, Paulo Rocha, professor adjunto da Faculdade de Medicina da UFBA e que leciona bioestatística na pós-graduação, nos enviou o gráfico acima, com as estatística dos campeonatos baianos. Baseado nas curvas construídas, Paulo argumenta a favor da superioridade do Vitória, tentando rejeitar a hipótese nula de semelhança entre os times. 

No entanto, uma análise mais cuidadosa demonstra que as curvas que Paulo contruiu acima das barras não representam tendência alguma, pois são fortemente influenciadas pelo valor extremo (outlier) da última década. Valores extremos podem distorcer fortemente a análise dos dados. Percebam que o comportamento do Bahia é uma constante, exceto pela última década. A última década ocorreu por acaso e na década de 2010 veremos o fenômeno de regressão à média normalizar tudo a favor do Bahia. 

Percebam que ao analisar um trabalho científico, devemos estar atentos para o viés de análise dos dados, que compromete a veracidade do resultado. Neste caso, apesar de seu inquestionável conhecimento estatístico, a análise de Paulo foi prejudicada por seu conflito de interesse a favor do Vitória.

Réplica

Meu caro amigo Luís,

É um prazer bater essa bola com você aqui na bioestatística, uma vez que, de futebol mesmo, nós não entendemos nada! Acho que o meu gráfico atingiu em cheio o seu sofrido coração tricolor e turvou a sua mente porque, pela primeira vez desde que leio o seu blog, notei alguns comentários improcedentes! Vamos a eles?

Eu não avaliei uma AMOSTRA ALEATÓRIA de edições do Campeonato Baiano. O gráfico mostra TODOS os campeonatos Baianos desde o início da existência do Bahia (1931). Como a POPULAÇÃO inteira de campeonatos foi avaliada, cabe apenas o uso da estatística descritiva. Por isso, não há hipótese nula a ser rejeitada e não é necessário realizar inferência estatística. Os dados representam a verdade absoluta. Não há erro padrão. 

Neste período, o Bahia ganhou o campeonato 44 vezes e o Vitória apenas 24. Este fato é incontestável. A intenção do gráfico foi de descrever como essas conquistas se distribuíram ao longo das décadas. Esta distribuição também é incontestável! Nas últimas 3 décadas, houve uma queda progressiva no número de títulos do Bahia enquanto, no mesmo período, houve um aumento progressivo no número de títulos do Vitória. Estamos falando de um comportamento progressivo ao longo de 3 décadas. Acho que isto qualifica como uma tendência. E a tendência é de queda para o Bahia e ascensão para o Vitória! No entanto, estatística não é bolinha de cristal e não pode garantir que esta tendência vai continuar na próxima década... Infelizmente. 

Como um apaixonado (e enviesado!) torcedor do Bahia, você está querendo apagar a última década da sua mente, chamando-a de outlier! Pior: está atribuindo uma década inteira ao acaso!! Nesta década, o Bahia passou 7 anos na série B e só ganhou um título! Isto não aconteceu por acaso!! O time era muito ruim mesmo.

Enfim, ao ler o seu post, concordei com apenas uma afirmativa: “valores extremos podem distorcer fortemente a análise dos dados”. Com certeza! Mas não é o caso aqui.

Saudações rubro-negras! 



TRÉPLICA


Boa observação, inclusive de importante teor educativo. De fato, quando trabalhamos com populações, não se aplica estatística, não há hipótese, valores de P, erros-padrão, nem intervalos de confiança. 


Estamos discutindo que time é melhor. Veja que esta discussão já não tem lógica, pois a cada período o time é diferente, assim como os seus gestores. Não é como se fosse uma mesma pessoa ou um jogador de tênis. Mas já que esta discussão existe, me permitirei o seguinte argumento:


Imagine que estes times ainda terão muitas décadas de vida, digamos uns 300 anos. Seu gráfico representa uma amostra de todo tempo de vida deste times. É uma amostral temporal, pois não computa o que está por vir. E estamos discutindo que é melhor, como se Deus tivesse feito um time melhor que o outro. Portando uma década dentro de 40 décadas pode ser visto como um outlier.


Valeu pelo didáctico comentário.