domingo, 20 de janeiro de 2013

Postagem de Ano Novo: Perspectiva versus Realidade



A maioria de nós possui um apreço especial pela mudança de ano, a despeito da realidade permanecer a mesma após a meia-noite do dia 31 de dezembro. O que faz da passagem de ano um momento especial é um outro tipo de mudança: a que ocorre com nossa perspectiva.

Consciente ou inconscientemente, este é um momento reflexivo, avaliamos os acertos e erros no ano passado, imaginamos novos objetivos, assumimos novas perspectivas. Isso é suficiente para promover certa sensação de temporária de plenitude, mesmo que a realidade permaneça igual.

Perspectiva é diferente de realidade e a primeira tem maior impacto do que a segunda. Nossa satisfação depende mais da perspectiva do que da realidade. Isto está demonstrado cientificamente e o experimento que descreverei me permitirá fazer um link entre perspectiva e prática médica.

Cientistas analisaram experimentalmente o comportamento de dois macacos (vários experimentos seqüenciais com diferentes pares de macacos), confinados em jaulas diferentes. Em ambos os casos, o chão das jaulas disparava choques elétricos simultâneos e intermitentes. Na jaula esquerda havia um botão para o macaco desligar a descarga elétrica, interrompendo o choque. A jaula da direita não possuía esta botão, porém sempre que o macaco da esquerda apertava o botão, a eletricidade era também desligada na jaula da direita. Isso fazia com que os tempos de choque dos dois macacos fossem idênticos. A realidade dos choques era idêntica nos dois macacos. No entanto, o macaco da esquerda (o que apertava o botão) permaneceu saudável, ativo, feliz, enquanto o macaco da direita se tornou deprimido, emagreceu e adoeceu. Se os dois recebiam a mesma quantidade de agressão física, por que a resposta clínica foi diferente?

A diferença é que o macaco da esquerda tinha a impressão de controle sobre os choques, enquanto o macaco da direita ficava a mercê do choque ser desligado pela vontade de outrem. Nós humanos somos iguais a estes macacos. A perspectiva de falta de controle sobre nossa realidade incomoda bastante a mente humana. Por algum motivo, talvez instinto de sobrevivência, não aceitamos a perda de controle. Isto ocorre a despeito da realidade de que não temos controle absoluto sobre nosso destino, o qual  é regido prioritariamente pelo acaso social (encontros e desencontros) e acaso biológico (interações moleculares de um sistema complexo).  Ou, sob outra ótica, regido por uma “força maior” que se traduz com aparência de acaso.

E é exatamente esse fenômeno mental que nos distancia do paradigma da medicina baseada em evidências. Mesmo que não tenhamos controle, ter a perspectiva de controle é suficiente para nossa satisfação, tal como no caso do macaco que desligava o choque, mas não tinha controle sobre a quantidade de choques ou quando eles surgiam.

Em medicina, muitas condutas não mudam a realidade do indivíduo. Porém dão ao paciente e a seu médico a perspectiva de estar fazendo alguma coisa, a ilusão de controle sobre o desfecho. Por este motivo, tratamentos complexos, dolorosos e de alto custo são usados mesmo que não mudem o desfecho (realidade) do paciente; exames desnecessários são utilizados, promovendo o fenômeno do overdiagnosis, prejudicando o paciente. Tudo isso para que tenhamos uma perspectiva de controle sobre nossa realidade.

Nestes casos, estamos nos comportando como os macacos dos experimentos. Perdemos a racionalidade.

Tratamentos quimioterápicos são usados até o último momento em pacientes terminais, pois o maior sofrimento seria a sensação de perda de controle, de jogar a toalha. Assim como angioplastias coronárias (desprovidas de benefício clínico) são realizadas em pacientes assintomáticos, apenas para trazer ao paciente e seu médico  a falsa sensação de ter resolvido o problema.

Na esfera diagnóstica, nos traz uma reflexão neste sentido o recente artigo publicado no New England Journal of Medicine, intitulado Effect of Three Decades of Screening Mammography on Breast-Cancer Incidence. O trabalho descreveu as incidências de câncer de mama em estágio inicial e em estágio avançado ao longo dos últimos 30 anos nos Estados Unidos, demonstrando o impacto da introdução da triagem de câncer na população. De fato, houve uma aumento relativo de 100% no diagnóstico de “câncer” em estágio inicial, de 122 para 234 casos diagnosticados a cada 100.000 mulheres. Com tantos “cânceres” diagnosticados em estágio inicial, seria de se esperar uma redução substancial dos cânceres em estágio avançado, pois estes passariam a ser diagnosticados mais precocemente. Porém a incidência de câncer avançado sofreu mínima redução, de 102 para 94 casos a cada  100.000 mulheres. Por que isso? O fato é que vários desses “cânceres” diagnosticados precocemente são “lesões” que não irão evoluir para um verdadeiro câncer. Esses “cânceres” precoces não são os precursores dos cânceres verdadeiros, aqui denominados de avançados. Por isso, ao diagnosticar e tratar um “câncer” em estágio inicial, não houve impacto sobre os verdadeiros cânceres (avançados). Porém este tratamento deve ter promovido piora da qualidade de vida nas mulheres, agora rotuladas de portadoras de um câncer, sendo submetidas a terapias agressivas, quimioterapia, radioterapia, mastectomias. É brincadeira?

O screening do câncer de mama serve para nos dar uma perspectiva de controle sobre essa doença. Quase que apenas isso, pois na prática a realidade não muda. O risco de morte por câncer de mama permanece o mesmo. É baseado neste raciocínio que o US Prevention Task Force contra-indicou screening anual para câncer de mama entre os 40 e 50 anos de idade, gerando revolta por parte de médicos que realizam o procedimento de mamografia.

Na mesma linha de raciocínio está  a ilusão da pesquisa de doença coronária no indivíduo assintomático, comentada na última postagem deste Blog. Sabe-se que (salvo extremos de gravidade) encontrar doença subclínica não reduz risco, pois procedimentos invasivos não trazem benefício. Trariam controle dos sintomas, se necessário, mas controle de sintomas no assintomático não é necessário.

Na esfera prognóstica, propagamos a idéia de que precisamos encontrar uma forma de predizer exatamente quem terá e quem não terá um infarto. Julgamos que nossas ferramentas atuais são fracas porque erram algumas vezes e determinamos a necessidade de novos biomarcadores. Novos biomarcadores surgem e são incorporados na clínica a despeito de pouco valor incremental do ponto de vista científico: proteína C-reativa, microalbuminúria, espessura médio-intimal de carótidas. Na verdade, predizer o futuro é um grande desafio, é natural errar algumas vezes, e nunca teremos um modelo perfeito de predição. A utilização sem base em evidência de novos biomarcadores serve para nos dar a falsa perspectiva de controle sobre nosso destino. Se pensarmos que a realidade nunca será totalmente previsível, ficaremos mais satisfeitos com ferramentas clínicas como o escore de Framingham e seremos mais racionais na análise critica de novos biomarcadores.

A realidade é que não temos controle absoluto sobre desfechos clínicos e devemos evitar uma busca frenética por este controle, em detrimento da valorização de evidências científicas. Ao escrever isso, é meu hemisfério cerebral esquerdo (racional) que fala.

No entanto, o marketing do excesso de exames (check-up das revistas da TAM e GOL), da indústria farmacêutica e de materiais médicos não trabalha com o cérebro esquerdo. O marketing do consumismo trabalha com o nosso hemisfério cerebral direito, intuitivo, sentimental, mais facilmente seduzido.

O que é mais sedutor: “faça exames para diagnosticar sua doença antes que ela complique sua vida, melhor prevenir do que remediar” ou “check-up cardiovascular no indivíduo assintomático não muda desfecho. Se contente com a imprevisibilidade da vida (insustentável leveza do ser, segundo Milan Kundera), apenas adote medidas de controle dos seus fatores de risco e torça para não ser um azarado que terá morte súbita.” Claro que a primeira opção é mais sedutora.

Portanto, nossa necessidade de controle é um dos mecanismos mentais que nos leva a negligenciar princípios científicos, a procura da ilusão de que estamos tratando (mesmo sem tratar) e de que estamos prevenindo (mesmo sem prevenir).

Precisamos mudar de perspectiva. Podemos pensar na perspectiva da qualidade de vida. Com certeza, submeter pacientes assintomáticos a exames e tratamentos agressivos compromete qualidade de vida. E isso nem sempre é compensado por melhora de sobrevida.

Meus votos para 2013 é o de mudança de perspectiva. Refiro-me à idéia de que a eliminação de testes e tratamentos desnecessários pode melhorar nossa qualidade de vida, evitando efeitos adversos indesejados. Só precisamos separar o que é conduta médica benéfica e a que serve apenas de ilusão. Essa mudança de perspectiva será favorável ao raciocínio clínico científico.
_________________________________________________________________________________

Para conhecer no nosso Curso Online 2016/2017 de Medicina Baseada em Evidências, clique aqui🔼.

domingo, 30 de dezembro de 2012

Santa Claus Gets a Check-Up



Como resposta a nossa última postagem, nosso colega Mário Coutinho (MD, PhD) nos enviou este vídeo que utiliza o check-up de Papai Noel como tema de propaganda da indústria do check-up. Faz exatamente o raciocínio contrário ao nosso, utiliza o apelo do esforço que Papai Noel faria no Natal para promoter o idéia do check-up cardiovascular. Como disse Mário Coutinho, "a indústria do check-up não se importa em parecer ridícula."

terça-feira, 25 de dezembro de 2012

Papai Noel precisa de check-up antes do Natal?



Na noite passada, Papai Noel trabalhou 39 horas contínuas, entregando presentes a 700.000.000 de crianças, percorrendo uma distância de 342.510.000 Km ao redor do mundo, carregando um saco de 416.000 toneladas (assumindo que um presente médio pesa 660g) - segundo fonte recente.

Embora este velhinho tenha passado por todo este esforço, até então não ouvimos notícia de que Papai Noel infartou e está internado na UTI “de um hospital privado na cidade”. Talvez tudo tenha dado certo, pois Papai Noel seja precavido e tenha feito seu check-up cardiológico no início de dezembro, como muitos costumam fazer. Isso é o que pensaria o senso comum.

Entendam por check-up a série de exames realizados no intuito de detectar perigosas doenças ocultas. Daquele tipo que costumamos ver propagandas em revistas alocadas nas poltronas das principais linhas aéras brasileiras, usualmente encartes relacionados a hospitais paulistas.

Contrariando as expectativas, Papai Noel afirmou em entrevista recente de que não costuma fazer este check-up antes do Natal, o que soou como uma certa irresponsabilidade do bom velhinho.

Sendo assim, fica a questão: Papai Noel deveria ou não deveria ter feito um check-up cardiovascular em dezembro?

Considerando sua idade, 550 anos, é grande a probabilidade de doença coronária oculta. Desta forma, se Papai Noel resolvesse fazer uma pesquisa de doença coronária com testes não invasivos (teste ergométrico, cintilografia miocárdica, ressonância de perfusão ou tomografia de coronária) seria bem possível a detecção de aterosclerose obstrutiva. Qual seria o resultado disso?



Provavelmente o Natal das crianças seria adiado.

Sim, porque o screening seria positivo; normalmente este resultado positivo desemboca na realização de cateterismo cardíaco (principalmente em pacientes VIPS como Noel), cujo resultado automaticamente leva à indicação de um procedimento, seja angioplastia coronária ou cirurgia de revascularização.

Não daria tempo, não haveria condição de Papai Noel se recuperar para distribuir os presentes na madrugada de hoje.

Mas poderia ser que valesse a pena adiar este Natal, para garantir o Natal dos próximos anos. Não sejamos imediatistas, há males que bem para o bem.

Porém este não é o caso, este mal acontece de graça, pois não traz consigo um bem maior. Isso mesmo, o check-up cardiovascular em um indivíduo assintomático não traz benefício, mesmo que isto vá de encontro ao senso comum.

Sabemos que o screening da doença coronária não previne desfechos cardiovasculares maiores. Isso está demonstrado em trabalho que randomizou pacientes de risco cardiovascular elevado para realizar ou não realizar screening, mostrando semelhança na incidência destes desfechos. Além disso, estamos cansados de saber (ensaios clínicos) que angioplastia coronária não reduz infarto e não prolonga sobrevida, quando comparada ao tratamento clínico. Portanto, Papai Noel não teria seu infarto prevenido por um procedimento deste tipo que seria induzido por um diagnóstico de doença oculta.

Em casos de doença coronária severa (triarterial ou tronco), evidência recente do estudo FREEDOM nos sugere benefício da cirurgia de revascularização na redução de morte ou infarto. Porém em pacientes com a excelente classe funcional de Papai Noel é pouco provável uma doença coronária severa.

Neste tipo de discussão, entusiastas do excesso de exames normalmente usam algum exemplo de certo paciente assintomático, cujo teste não invasivo foi positivo, levando a um cateterismo que mostrou doença triarterial grave, se beneficiando de cirurgia de revascularização. Estou cansado de ouvir isso.

Este raciocínio mediano e equivocado desconsidera o pensamento epidemiológico, que deve ser probabilístico, baseado em dados coletivos. Ao pensarmos probabilisticamente, percebemos a outra face da moeda. Enquanto um paciente é beneficiado pela solicitação de exames, outro (ou outros) sofre do overdiagnosis.

No overdiagnosis, os casos anedóticos de benefício trazido pelo diagnóstico são anulados ou até mesmo superados pelo número de pacientes que se prejudicam pelo diagnóstico.

Seria o caso de Papai Noel fazer algum exame não invasivo, mostrando doença fora do alto espectro de gravidade do estudo FREEDOM (o mais comum), levando a uma angioplastia coronária que não prolongou sua vida, não reduziu probabilidade de infarto. Tudo isso na ausência de sintomas, que poderiam se melhorados se estivessem presentes, mas não estão presentes. Sem falar em complicações mais graves de procedimentos desnecessários. Desde óbito até sequelas importantes.

Perderíamos o Natal das crianças, em troca de nenhum benefício clínico para Papai Noel.

Esse é um equívoco comum no pensamento médico: justificar procedimentos com base na possibilidade de benefício em alguns pacientes, desconsiderando a possibilidade de malefício em outros. Como mencionamos previamente, somos mais movidos por resultados positivos e nossa mente tende a desconsiderar a possibilidade de desfechos negativos. Indicamos procedimentos porque alguns podem se beneficiar, mesmo que um número maior possa de prejudicar. Acontece porque fixamos em nossa memória desfechos favoráveis, nos esquecendo de desfechos desfavoráveis.

Em 2012, percebi uma crescente preocupação com esta questão, tendo surgido recomendações médicas voltadas para evitar o overdiagnosis. Neste ano, o US Prevention Task Force classificou como inadequada a realização de eletrocardiograma de esforço em pacientes assintomáticos. Seguindo essa conduta, como parte do programa Choosing Wisely, o American College of Cardiology aponta a realização de pesquisa de isquemia em assintomáticos como uma das cinco condutas a serem evitadas na prática cardiológica. 

Claro que este raciocínio não se aplica apenas a cardiologia. Universalmente se faz screening para câncer de próstata com PSA, porém neste ano esta conduta passou a ser contra-indicada pelo US Prevention TaskForce. Não tem utilidade. Deve-se também evitar mamografia de rotina em mulheres com menos de 50 anos, ressonância de coluna se a dor lombar tiver menos de 6 semanas, exames de imagem (tomografia ou ressonância de crânio) em pacientes com sincope sem sinais neurológicos.  Enfim, são inúmeras as condutas médicas que caracterizam o overdiagnosis.



No filme de Tim Burton, Nightmare Before Christmas (O Estranho Mundo de Jack), Papai Noel é raptado por Jack, um monstro do mundo do Halloween. Sem maldade e por inocência, Jack deseja substituir Papai Noel em sua função de alegrar as crianças. No entanto, Jack é um monstro e quando entra nas casas, não traz felicidade, mas sim horror às crianças. Isso é o que acontece com a postura médica do excesso de diagnóstico. Há intenção de fazer o bem, porém a visão equivocada provoca o fenômeno do overdiagnosis: diagnóstico correto, porém dispensável, com potencial de ser deletério ao paciente.

Vivemos hoje no estranho mundo do overdiagnosis, levando os nossos pacientes ao pesadelo de serem raptados da sua condição estável, para a criação de um problema (falso em sua magnitude) que será resolvido por uma solução (falsa em seu benefício).

Meus votos natalinos neste ano são de que Papai Noel nos traga a consciência de que vivemos neste estranho mundo.

quarta-feira, 28 de novembro de 2012

A Liberdade do Conhecimento (Estudo Freedom)



De forma impactante, foi apresentado no recente congresso do American Heart Association e simultaneamente publicado no New England Journal of Medicine o ensaio clínico FREEDOM, que demonstrou cirurgia de revascularização ser um tratamento mais eficaz do que tratamento com stent farmacológico, em diabéticos com doença coronária severa (80% triarteriais, a maioria com boa função sistólica).

Do ponto de vista metodológico, este é um estudo de resultado confiável, poder estatístico adequado, diferenças estatisticamente significantes e ausência de vieses comprometedores. Sendo assim, não desenvolverei nesta postagem uma discussão quanto à veracidade da informação, pois a considero verdadeira. 

O mais interessante neste caso é perceber quais as implicações dos resultados deste estudo, que me parecem ir além da mera escolha da estratégia de revascularização.

O desfecho primário do estudo foi o combinado de morte, infarto e AVC, apenas desfechos duros (hards). Como já estamos cansados de saber que cirurgia é melhor do que angioplastia no controle dos sintomas e prevenção de novos procedimentos de revascularização, estes não foram escolhidos como partes integrantes dos desfechos combinados, seria redundante.

A redução na incidência do desfecho combinado com a cirurgia se deu a custa de redução de morte e infarto. Este resultado é muito importante, pois este é o primeiro ensaio clínico que demonstra que revascularização miocárdica reduz mortalidade, quando comparado ao tratamento clínico contemporâneo. 

Muitos imaginam que este é um efeito comprovado há muito tempo, porém isto não é exatamente verdade. Voltando ao passado, é importante lembrar que os clássicos ensaios clínicos da década de 70 (CASS, VA) não demonstraram redução de mortalidade com a cirurgia, em relação ao tratamento clínico. Na verdade estes foram estudos negativos em suas análises primárias, sendo sugerido benefício em análise de subgrupo dos pacientes no extremo superior de gravidade. Como sabemos, análise de subgrupo apenas gera hipótese. Por outro lado, o estudo Europeu mostrou redução de mortalidade e, anos mais tarde, uma meta-análise de Salim Yusuf combinou estes estudos, sugerindo melhora da sobrevida no tratamento cirúrgico. Mesmo assim, uma meta-análise que sugere benefício tem ainda 30% de probabilidade de estar incorreta, segundo publicação antiga do New England Journal of Medicine. Desta forma, podemos dizer que até então não havia evidência definitiva de que cirurgia traz benefício de mortalidade. Além disso, o tratamento clínico aplicado àquela época não possuia estatinas e era limitado em relação a terapia antitrombótica. 

Desta forma, o FREEDOM é a primeira evidência contemporânea e de alto nível demostrando que a cirurgia de revascularização tem benefício que vai além do controle de sintomas. É o primeiro dado científico que nos induz a indicar cirurgia para um indivíduo assintomático, caso este seja triarterial. Isso não parece novidade, pois já é uma conduta adotada pela maioria, devido ao nosso ímpeto de heroísmo médico não embasado em evidências. Mas esta poderia ser uma conduta mal indicada, como muitos exemplos de tratamentos adotados na ausência de evidências que depois se comprovam deletérios ou sem efeito nenhum.

Portanto, a partir de agora, a indicação de cirurgia em um paciente assintomático, porém triarterial tem melhor validação. Vale salientar que o benefício apresentado foi de grande magnitude, NNT = 13 para eventos combinados, NNT = 20 para morte, NNT = 13 para infarto.

Importante lembrar que o benefício da cirurgia foi em comparação à angioplastia. Então quando digo que a cirurgia fica indicada para pacientes assintomáticos com DAC grave, parto da demonstração (estudos COURAGE e BARI-2D) de que angioplastia não é inferior ao tratamento clínico contemporâneo, mesmo em pacientes triarteriais. Sendo estes dois semelhantes, se cirurgia é melhor que angioplastia, podemos considerar que cirurgia é melhor que tratamento clínico também. Observem que isso é uma inferência lógica. Resta a possibilidade (não duvido nada) de que em certos pacientes angioplastia seja inferior a tratamento clínico.

Sempre que o tratamento clínico se mostra semelhante à angioplastia ou o tratamento cirúrgico se mostra superior à angioplastia, médicos intervencionistas entram com o argumento de que a angioplastia não foi realizada com o melhor tratamento atual (tipos de stents principalmente). Esse é o tipo de argumento que gera o fenômeno em inglês denominado catch-22. Essa expressão significa um dilema impossível de resolver: precisamos fazer um estudo com o mais novo tipo de tratamento, mas estes estudos duram 5 -10 anos do início do planejamento até a publicação, então quando o estudo terminar, o tratamento não é mais novo. Assim, nunca teremos um estudo que prove algo ser superior à angioplastia. Boa tática para não aceitar resultados que não queremos aceitar. Ótimo exemplo de catch-22.

Um segundo aspecto importante do FREEDOM é que a superioridade da cirurgia é consistente em pacientes com escore Syntax baixo, médio ou alto. Isto fica claro na análise de subgrupo, que mostra ausência de interação (P = 0.58) entre o escore Syntax e a superioridade da cirurgia. Ausência de interação significa ausência de modificação de efeito. Ou seja, o escore Syntax não modifica do efeito da cirurgia, não modifica o fato desta ser superior à angioplastia.

Este dado desfaz um erro histórico de interpretação do estudo Syntax. A primeira publicação do Syntax não conseguiu demonstrar não inferioridade da angioplastia em relação a cirurgia. Quando foram analisados os subgrupos de acordo com o escore Syntax, houve semelhança nos pacientes de Syntax baixo e a diferença era menor nos pacientes de Syntax intermediário. Os intervencionistas gostaram destes resultado e disseram que a cirurgia só é melhor em pacientes de Syntax alto. Esse é um erro grave: fazer prevalecer o resultado de análise de subgrupo em relação à análise geral. Subgrupo apenas gera hipótese. Mas agora sabemos, não importa o Syntax: cirurgia é melhor.

Diabéticos


A esta altura da postagem, muitos devem estar pensando porque eu estou generalizando estes achados e não me referindo apenas a pacientes diabéticos. A justificativa é o princípio da complacência na análise de aplicabilidade de uma terapia. De fato, o estudo foi feito apenas em pacientes diabéticos, com doença coronariana severa. O que mais contou para o resultado encontrado? Foi o fato dos pacientes serem em sua maioria triarteriais ou o fato de serem diabéticos? De fato, diabetes é um fator de risco para desenvolvimento de aterosclerose (terceiro em ordem importância) ou seja contribui para a existência de uma doença mais extensa. Porém, uma vez a doença aterosclerótica triarterial instalada, importa se o paciente é diabético ou não? Triarterial é triarterial. Alguns intervencionistas podem argumentar que o diabético terá mais reestenose. Aí me reporto a uma postagem recente sobre o pensamento multivariado. No mundo multivariado, diabetes é um dos fatores de menor peso importantes para a desenvolvimento de reestenose (quem achou estranho o que acabo de falar, leia postagem prévia). Na análise de aplicabilidade, devemos nos perguntar: se funciona do diabético triarterial, há alguma grande razão para nos fazer duvidar que não funciona no triarterial não diabético. Esse é o princípio da complacência, que sugere sermos menos rigorosos e estender a aplicabilidade de dados verdadeiros e relevantes (NNT = 13) para uma população além da estudada (triarteriais).

Além disso, criou-se erradamente um mito de que o diabético é muito diferente do não diabético. Na verdade tem muito diabético que nem diabético era antes da redução do ponto de corte da glicemia para 125 mg/dl.

Acredito que a importância  do achado deste estudo vai além dos diabéticos. Diabetes é apenas um dos mecanismos pelo qual um indivíduo desenvolve uma doença coronariana severa, mas uma vez essa doença desenvolvida, todo mundo é “igual”. Um indício é que não há nenhum tratamento cardiovascular que funcione diferente em diabéticos e não diabéticos: a eficácia de anti-hipertensivos, estatinas, aspirina, é tudo igual.

Mas para quem ainda está cético com o que estou falando, é só olhar os resultados do seguimento de 5 anos do estudo Syntax, que envolve pacientes com doença grave em geral, não só diabéticos. O estudo ainda não foi publicado, mas ficou claro que em seguimento de longo prazo, cirurgia reduz mortalidade e infarto, quando comparado a angioplastia. Aí está a demonstração de que a coisa vai além do diabético. E isso foi independente do escore Syntax.

FREEDOM (liberdade)

Na verdade, o estudo FREEDOM nos faz perder (não ganhar) algumas liberdades. De um lado, perde-se a liberdade de banalizar o tratamento da doença coronária severa com a supervalorização da angioplastia coronária, em detrimento da cirurgia. De outro lado, perde-se a liberdade de manter o tratamento clínico apenas em pacientes assintomáticos com doença coronária severa, que sejam de baixo risco cirúrgico. Agora (só agora) sabemos que cirurgia reduz mortalidade em pacientes triarteriais.

Importante salientar que nada disso justifica a pesquisa de doença coronária em pacientes assintomáticos. Isso continua inapropriado, como já comentado algumas vezes neste Blog. Em breve, abordaremos melhor este problema de overdiagnosis.

terça-feira, 20 de novembro de 2012

Terapia de Reposição Hormonal: previne eventos cardiovasculares?

Como fazer quando uma nova evidência vai de encontro com o conhecimento vigente? Neste caso, precisamos analisar criticamente a nova evidência, comparando-a com a evidência mais antiga que atualmente norteia a conduta. Ou seja, o novo não é necessariamente melhor, temos que analisar onde está a verdade.

Isso aconteceu há algumas semanas, quando foi publicado no prestigioso British Medical Journal um estudo dinamarquês intitulado Effect of hormone replacement therapy on cardiovascular events inrecently postmenopausal women: randomised trial. Trata-se de um ensaio clínico randomizado (1.000 mulheres), demonstrando que a terapia de reposição hormonal (TRH) traz benefício cardiovascular em mulheres menopausadas. No grupo tratamento a incidência de eventos cardiovasculares foi 3.2% versus 6.6% no grupo controle (P = 0.015). Além disso, não houve aumento de câncer de mama, nem de eventos tromboembólicos.

Essa informação é contrária ao conhecimento trazido pelo WHI, grande (16.000 mulheres) ensaio clínico randomizado, publicado em 2002, o qual demonstrou que este tratamento aumenta a incidência de eventos coronários, AVC, tromboembolismo pulmonar e câncer de mama. Baseado nisso, se considera que não há indicação do uso desta terapia para fins de prevenção cardiovascular. A justificativa para este tratamento é melhora da qualidade de vida, naquelas mulheres com sintomas de menopausa.

Mas e agora?? Com este novo ensaio clínico, devemos passar a prescrever TRH em menopausadas como estratégia de prevenção cardiovascular? Inclusive os autores argumentam que o benefício foi alcançado devido à introdução precoce da droga após a menopausa (timing hypothesis), diferente do WHI que randomizou as pacientes vários anos após a menopausa. Isso mesmo, se você introduzir na hora certa, traz benefício; se introduzir na hora errada, traz maléfico. Até parece história de feitiçaria. Existe algum tratamento assim, que a depender do momento do uso gera efeitos totalmente paradoxais?

Sendo assim, antes de aceitar essa explicação causal para o resultado favorável, devemos avaliar a possibilidade deste resultado ser causado por acaso ou viés.

Acaso

Em primeiro lugar, este estudo é subdimensionado, tendo poder estatístico reduzido. Possui apenas 1.000 mulheres, um número muito abaixo das 16.000 necessárias no WHI para avaliar benefício e segurança. Inclusive a descrição do tamanho amostral não especifica a incidência esperada do desfecho, tornando impossível de avaliarmos se o cálculo de 1.000 pacientes faz sentido. Provavelmente, não. A descrição serve apenas para fazer parecer que os autores se preocuparam com poder estatístico. E na ausência de poder estatístico, uma diferença encontrada (mesmo estatisticamente significante) tem veracidade duvidosa. Ou seja, a acurácia do valor de P (em estimar a probabilidade do resultado encontrado na vigência da hipótese nula) é reduzida. Portanto, não podemos afastar o acaso como explicação do resultado encontrado. 

A este respeito, foi recentemente publicado no JAMA o trabalho Empirical Evaluation of Very Large Treatment Effectsof Medical Interventions demonstrando que estudos pequenos geram resultados mais favoráveis do que estudos grandes. Da mesma forma, estudos pequenos trazem com mais frequência resultados positivos do que estudos grandes. Percebam que estudos negativos (que não mostraram benefício) publicados em revistas de impacto sempre se tratam de grandes ensaios clínicos. Nunca vemos um pequeno ensaio clínico negativo sendo publicado em revista de grande impacto. Pequenos ensaios clínicos só são publicados quando seus resultados são positivos. Só tendo resultados positivos estes estudos conseguem ser publicados em grandes revistas. Isto é denominado viés de publicação. O problema é que estes pequenos estudos positivos possuem veracidade questionável, pois para conseguirem significância estatística um estudo pequeno necessita de uma diferença de magnitude tão grande que se torna inverossímil. Além disso, o valor de P é a estimativa de um dado resultado ser encontrado apesar da hipótese nula ser verdadeira. Quando o estudo é subdimensionado esta estimativa perde precisão, o valor de P pode não refletir a realidade.   

Viéses

Em segundo lugar, devemos avaliar a possibilidade de viéses. Este é um estudo aberto, tanto o paciente como o médico sabiam se a mulher estava utilizando a TRH. Alguns mecanismos podem fazer com que o caráter aberto enviese os resultados. Neste caso, viés de desempenho (performance bias) pode ser um deles: ao saber que a mulher está em uso de TRH, esta pode receber mais cuidados médicos, melhor controle de fatores de risco, mais atenção quanto a eventuais eventos coronários. Isso pode reduzir o risco destas mulheres, não pela TRH, mas pelo que esta traz em termos de cuidados adicionais. Além disso, a aferição de eventos pode ser enviesada por uma crença do pesquisador (não cego) no benefício da terapia. Na verdade, fico a me perguntar o que faz um pesquisador planejar um estudo de 1000 pacientes, 10 anos de seguimento e não de dá ao trabalho de cegar o estudo com uso de placebo.

Em terceiro lugar, qualquer estudo de prevenção primária em cardiologia avalia eventos relacionados diretamente a doença aterosclerótica, ou seja, infarto e AVC. Sem uma lógica prévia, este estudo colocou insuficiência cardíaca como um dos componentes do desfecho primário e foi este desfecho que mais contribuiu com o resultado. Se tivesse feito como o WHI (morte ou infarto) não haveria benefício demonstrado. Da mesma forma, se tivesse considerado morte, infarto ou AVC, a diferença não seria estatisticamente significante.

Por todos estes motivos, não podemos considerar este estudo verdadeiro em afirmar que a TRH previne eventos cardiovasculares, pois o mesmo não passa na prova da análise crítica de evidências. Este estudo de 1.000 pacientes, aberto e com definição questionável do desfecho primário não é suficiente para modificar nossa crença do prejuízo cardiovascular desta terapia criada a partir de um estudo de 16.000 mulheres, cego, com definição adequada do desfecho primário.

Este é um bom exemplo de como a análise crítica de uma evidência nos ajuda a separar trabalhos que devem modificar paradigmas daqueles que servem apenas de provocação. Este é o valor deste artigo, apenas provocar nossa reflexão.

Visão Bayesiana

Outro aspecto que deve ser discutido é a visão bayesiana na análise de evidências. Neste tipo de análise, devemos considerar a probabilidade pré-estudo do tratamento ser benéfico. Neste caso, temos o WHI mostrando que o tratamento aumenta infarto, AVC, tromboembolismo venoso e câncer. Qual a probabilidade de iniciando o tratamento mais cedo, este provocar redução de infarto, AVC, tromboembolismo venoso e câncer? É pequena. Pode até ser que o prejuízo seja menor porque as mulheres são mais jovens (menos susceptíveis), mas sair de deletério para benéfico seria algo sem precedentes. Sim, sem precedentes, pois não existe interação paradoxal. Excluindo eventos adversos, se pensamos apenas no princípio ativo primário, não conheço nenhum tratamento que seja bom em um grupo de pessoas e ruim em outro grupo. Usualmente, as interações são quantitativas e não qualitativas: é comum ver algo melhor em um grupo do que em outro, mas inversão total do efeito, de maléfico para benéfico é algo muito raro ou até mesmo inexistente.

Sendo então a probabilidade pré-estudo de benefício muito baixa, para mudar nosso pensamento necessitaríamos de uma evidência muito forte, e não é o que temos aqui. 

Entusiasmo versus Evidência

Sei que há os entusiastas da TRH para prevenção cardiovascular. Ser entusiastas do ponto de vista científico tem sua validade, mas devemos ter o cuidado para que este entusiasmo não promova uma interpretação favorável de evidências de baixa qualidade. Temo que este artigo sirva de motivo para que se passe a recomendar TRH como prevenção cardiovascular. Em 2008, uma absurda diretriz da Sociedade Brasileira de Cardiologia e Sociedade do Climatério recomendou TRH com prevenção cardiovascular, grau de indicação IIa. Agora, imagine o que “entusiastas” poderão fazer com esta nova evidência.

Sob a ótica de uma interpretação responsável e científica, até que se prove o contrário, TRH não previne eventos cardiovasculares.

quarta-feira, 17 de outubro de 2012

Consumo de Chocolate e Conquista de Prêmios Nobel



Na semana passada Franz Messerli publicou New England Journal of Medicine um intrigante trabalho demonstrando que quanto maior o consumo de chocolate de uma nação, maior o número de prêmios Nobel conquistados pela nação.

A figura acima representa esta análise. Primeiro, vamos aproveitar para revisar como interpretar uma análise de correlação.

Associação

1)    Este é um gráfico de correlação, ou seja, mostra associação linear entre duas variáveis numéricas. A variável preditora (eixo x) é o consumo de chocolate anual per capita. A variável de desfecho (eixo y) é o número de prêmios Nobel a cada 10 milhões de pessoas no país.
2)    O coeficiente de regressão (b) do consumo de chocolate foi de 2.5, indicando que o cada 1.0 Kg de consumo per capita, a nação conquista 2.5 prêmios Nobel. Mostra o grau de influência do chocolate nos prêmios.
3)    O coeficiente de correlação (r) foi de 0.79. Este mostra a força de associação linear, quanto mais próximo de 1, mais forte é a associação. Neste caso, podemos interpretar como associação moderada a forte.
4)    Se elevarmos o r ao quadrado, obteremos o coeficiente de determinação (R2 = 0.62), que representa o quanto das conquistas de prêmios Nobel pode ser explicado pelo consumo de chocolate. Neste caso, 62% dos prêmios podem ser explicados pelo consumo de chocolate.
5)    O valor de P desta associação foi < 0.0001, indicando que é muito pequena a probabilidade destes achados serem devido ao acaso.

Observem que do ponto de vista estatístico, a análise é bastante convincente. De fato, há uma verdadeira associação linear entre chocolate per capita e prêmio Nobel a cada 10 milhões de pessoas.

Em segundo lugar, devemos nos perguntar se esta associação ocorre porque o consumo de chocolate provoca conquistas de prêmios Nobel.

Causalidade

Quando a análise chega neste ponto, o pensamento deixa de ser estatístico e passa a ser baseado na lógica da causalidade. Neste caso, devemos analisar os critérios de causalidade. Em 1965, Sir Austin Bradford Hill, professor Emérito de Bioestatística da Universidade de Londres publicou o artigo “The Environment and Disease: Association or Causation?” na revista Proceedings of the Royal Society of Medicine (58:295-30), onde ele explica 9 critérios que devem ser analisados para avaliar se uma associação é causal. Este se tornaram conhecidos como Critérios de Hill. Nesta postagem citarei os 5 critérios mais importantes.

1) Força e independência da associação: diz-se que quanto mais forte é uma associação, mas provável esta ser causal. Uma associação muito forte tem menos possibilidade de ser mediada por fator de confusão. Isto porque se uma associação forte é mediada por um fator de confusão, este fator ficará muito aparente.

Além da força da associação, esta deve ser independente de fatores de confusão.

Mas o que é mesmo fator de confusão? É uma terceira variável que intermedia a relação entre a exposição (chocolate) e o desfecho (prêmios Nobel), porém essa mediação não faz parte de uma seqüência causal, ou seja, não é o chocolate levando a alguma coisa que por sua vez provoca a conquista dos prêmios. Na verdade, essa variável (fator de confusão) seria associada a chocolate e associada aos prêmios, porém essas duas associações seriam desconectadas. Sendo assim, de maneira artificial, o fator de confusão promoveria uma associação não causal entre a exposição e o desfecho. 

Esse pode ser o caso em questão. Pode ser que o consumo de chocolate esteja associado ao nível sócio-econômico do país. Por sua vez, o nível sócio-econômico está associado a melhor educação e investimento em pesquisa, predispondo ao ganho de prêmios Nobel. Observem que esse link não é causal, pois não é o consumo de chocolate que melhora do nível sócio-econômico, para que este promova os prêmios. Neste caso, o nível sócio-econômico pode ser o fator de confusão desta análise.

Mas como podemos saber se a associação é ou não mediada por este fator de confusão? Precisaríamos fazer uma análise multivariada, onde colocamos chocolate, nível sócio-econômico e prêmios Nobel no mesmo modelo estatístico, e verificamos se a associação entre chocolate e prêmio independe do nível sócio-econômico. Se for independente, sugere causalidade (mas não garante). Essa análise não está presente no estudo, portanto está faltando um critério essencial para se demonstrar causalidade.

Portanto, força de associação fala a favor de causalidade, mas não é uma condição necessária. Já independência da associação é uma condição necessária para causalidade, porém não suficiente. Outros critérios devem ser obedecidos.

2) Plausibilidade: além de existir uma associação independente, deve haver uma razão lógica para que a variável preditora esteja causando o desfecho. Por exemplo, colesterol possui associação independente com infarto e há plausibilidade para se acreditar que esta relação é causal. Claro, é provavelmente o acúmulo do colesterol na parede do vaso que faz surgir a placa aterosclerótica, que será responsável pelo infarto.

Por outro lado, há muitas associações que carecem de lógica causal.

Acreditar que consumir chocolate promove um aumento da função cognitiva capaz de influenciar na produção de prêmios Nobel, com esta força de associação, é querer demais. Portanto, não há plausibilidade biológica para tal, até porque se isso fosse verdade chocólatras seriam evidentes gênios e podemos perceber exemplos contrários à nossa volta. Sendo assim, a conclusão do trabalho carece do segundo critério, o de plausibilidade.

3) Temporalidade: para que consideremos uma relação causal, o desenho do estudo deve nos garantir que a exposição veio antes do desfecho, pois a causa deve vir antes da conseqüência. Isso é o que ocorre em estudos de coorte prospectiva. Por exemplo, a coorte de Framingham demonstrou que níveis elevados de colesterol medidos no início do estudo (quando ninguém tinha tido o desfecho) se associaram à ocorrência do desfecho infarto ao longo do seguimento de longo prazo.

Porém isso não ocorre com nosso estudo do chocolate. As duas informações (consumo e Nobel) foram colhidas no mesmo momento. Pode ser até que o padrão de consumo maior de chocolate tenha surgido depois das conquistas de prêmios Nobel, se tornando impossível que aquele seja o causador dos Nobel. Na ausência dos critérios de temporalidade, pode existir o fenômeno de causalidade reversa: o ganho dos prêmios Nobel induzindo a uma maior consumo de chocolate – embora isso também careça de plausibilidade.

Portanto, este é mais um critério de causalidade que está ausente no trabalho.

4) Gradiente Dose-resposta: quanto maior o nível do preditor, maior a intensidade do desfecho. Esta é uma relação que se observa nesse estudo, visto que há demonstração de correlação positiva.

5) Reversibilidade Experimental: este é o critério que representa a validação final de uma relação causal, e deve ser proveniente de ensaios clínicos randomizados. Significa que ao controlar o preditor em um experimento controlado (ensaio clínico), o desfecho reduz. Isso ocorre no caso do colesterol. Ensaios clínicos randomizados indicam que na medida em que estatinas reduzem o colesterol, o risco de infarto diminui. Isso valida o colesterol como causador da doença coronária.

Se acreditamos que chocolate promove aumento da função cognitiva a ponto de gerar mais prêmios Nobels, ao reduzir o chocolate de uma nação, seus prêmios iriam reduzir ao longo do tempo. Não é esse tipo de evidência que se faz presente neste estudo, que é puramente observacional.

Há casos de variáveis que não fecham o ciclo de validação como fatores de risco, visto que seu controle não promove redução de risco. O caso mais recente é o do HDL-colesterol baixo, cujas drogas que promovem aumento em sua concentração não resultam em benefício clínico. É bem provável que este não seja um fator de risco, apenas seja uma marcador de risco.

Na recente década de 90 acreditava-se que infecção na placa aterosclerótica agravava a doença coronária. Porém, o uso de antibióticos em ensaios clínicos não modificou a incidência de desfechos coronários (versus placebo), fazendo cair por terra a hipótese infecciosa.

Sendo assim, uma breve análise dos critérios de causalidade nos sugerem que este trabalho está longe de provar uma associação causal entre consumo de chocolate e conquistas de um prêmio Nobel. Na verdade, o trabalho não passa de um brincadeira do autor que usou esta correlação para chamar a atenção de que associação e causalidade não são a mesma coisa. Uma brincadeira tão inteligente que resultou em um artigo no New England Journal of Medicine.

A Verdade

Por que o gráfico mostra que países como Noruega, Áustria, Dinamarca, Finlândia possuem um desempenho científico muito melhor do que os Estados Unidos? Tem algo errado, pois sabemos que os Estados Unidos são o país de maior produção científica do mundo. O erro está em ajustar o número de prêmios Nobel para cada 10 milhões de habitantes, pois a grande maioria destes habitantes não são cientistas e não estão contribuindo nada com isso. Os Estados Unidos são os que possuem a maior população e a maioria de qualquer população não é cientista. Como a população fica no denominador da fração, isso reduz o índice de prêmios Nobel dos Estados Unidos. O correto seria ajustar o número de prêmios para o número de cientistas do país e não para a população geral. Ao fazer errado, a medida de premiação beneficiou países pequenos da Europa, que coincidentemente consomem muito chocolate. Tudo não passa de um viés de análise de dados.

domingo, 30 de setembro de 2012

O que é Intervalo de Confiança?



Vemos com muita frequência o uso de intervalo de confiança nos resultados de diferentes tipos de estudos. Por exemplo, em estudos que avaliam eficácia terapêutica ou marcadores de risco, a descrição do risco relativo sempre é seguida do intervalo de confiança. Em estudos de acurácia, as medidas de sensibilidade e especificidade devem também ser seguidas do intervalo de confiança. Em estudos descritivos, de prevalência ou incidência, estas proporções devem ter seus intervalos de confiança.

Imaginem que um ensaio clínico randomizado afirma que “o risco relativo da droga em relação ao placebo foi 0.78 (95% IC = 0.68 – 0.88).

O que significa isso?

Se nossos estudos avaliassem toda a população-alvo do estudo, teríamos plena confiança nos resultados. Porém isso não é factível na maioria dos casos, fazendo com que estudemos amostras, ao invés da população. Ao estudar um parte da população (amostra) podemos dar o azar (acaso) de encontrar um resultado que difere da realidade. Por isso, devemos estimar a precisão estatística do resultado. Como fazer?

Poderíamos pensar, se não tenho certeza de que minha amostra está correta, farei um segundo estudo para checar. Neste segundo estudo, imaginem que o resultado do risco relativo foi 0.77, ao invés de 0.78. Puxa vida, então como saber onde está a verdade? Bem, façamos um terceiro estudo, cujo resultado foi 0.79. O jeito é fazer um quarto estudo, e assim sucessivamente ... Ao completar 100 estudos nesse processo de busca do verdadeiro risco relativo, vamos nos deparar com uma variação dos resultados destes estudos. Utilizando esta variabilidade dos resultado, calculamos o intervalo de confiança.

O intervalo de confiança no nível 95% (95% IC) significa que o resultado estará dentro daquele intervalo em 95 dos 100 estudos hipoteticamente realizados, ou seja, o risco relativo estará entre 0.68 e 0.88. O 5 estudos excluídos deste intervalo representam valores extremos que possuem maior possibilidade de terem ocorrido por acaso. Por isso são excluídos de um intervalo que deseja estimar onde está a verdade.

Desta forma, a leitura correta do intervalo de confiança é: podemos afirmar que em 95 de 100 amostras hipotéticas, o resultado estará dentro deste intervalo.

O valor de 0.78 é uma medida central, mais próxima da verdade, porém não há garantia de que seja exatamente isso. A garantia é de que o risco relativo não está acima de 0.88, nem abaixo de 0.68. Observem que quanto mais estreito o intervalo de confiança, mais precisa é a estimativa. E essa é exatamente a definição estatística de precisão, a capacidade de um resultado se repetir em diferentes medidas da mesma realidade.

Se a medida em questão possuir um valor que representa a hipótese nula do trabalho, podemos usar o intervalo de confiança para avaliar significância estatística. No caso do risco relativo (ou do hazard ratio), o valor 1 representa ausência de diferença entre grupo tratamento versus grupo controle; ou expostos ao fator de risco versus não expostos. Portanto, se o intervalo de confiança do risco relativo envolver o valor 1, o estudo não terá significância estatística para rejeitar a hipótese nula. Pode conferir, isso sempre coincide com um valor de P maior do que 0.05. No caso da redução absoluta de risco, o intervalo de confiança não deve envolver o zero para ter significância estatística.

Há situações em que o intervalo de confiança se refere a uma medida descritiva simplesmente, não há teste de hipótese (nem hipótese nula). Por exemplo quero descrever qual é a média do colesterol de uma população. Encontramos uma média  de 220 mg/dl e podemos usar o intervalo de confiança para estimar a precisão dessa afirmação. Também serve para variáveis categóricas, ou seja, intervalo de confiança de proporções, tipo: prevalência, incidência (risco), sensibilidade, especificidade.

Mas como se calcula o intervalo de confiança?

Claro que não precisamos fazer 100 estudos para calcular. Podemos obter este intervalo com apenas um estudo realizado, ainda bem. Estudando apenas uma amostra e utilizando fórmulas estatísticas que levam em consideração o tamanho amostral, a  variabilidade de uma variável contínua (a redundância foi proposital) ou a frequência do desfecho quando a variável é categórica. Essas fórmulas nos fornecem o erro-padrão, que é a medida de incerteza do estudo. Simplesmente, o resultado encontrado na amostra ± 1.96 erros-padrão = intervalo de confiança.

Curiosidade: Por que 1.96? Este é o valor de Z que delimita 95% de probabilidade de acordo com a curva de distribuição normal (mas não se preocupem em entender isso).

Quando a variável é numérica, fica fácil calcular o erro-padrão, pois este é o desvio-padrão dividido pela raiz quadrada do tamanho amostral. Quando a variável é uma proporção, utiliza-se uma fórmula um pouco mais complexa. Há calculadoras online (vejam aqui) que nos permitem calcular intervalo de confiança de uma proporção, digitando apenas o numerador e o denominador da fração.

O intervalo de confiança é uma medida pouco entendida, pois não estamos acostumados a pensar assim no cotidiano. Precisamos permitir que este conceito penetre em nossas mentes. Por exemplo, não existem pessoas 100% confiáveis, qualquer um mente de vez em quando. É só assistir ao filme de Liar Liar (1997, com Jim Carrey), que perceberemos o quanto caótica seria a vida sem pequenas mentiras. Por outro lado, mesmo reconhecendo que alguém mente, podemos identificar que esta pessoa tem um intervalo de confiança que nos deixa tranqüilos em saber que não seremos traídos por ela em assuntos relevantes. Ao invés de tratar pessoas de forma dicotômica (honestos ou desonestos), podemos classificá-las de acordo com a amplitude de seu intervalo de confiança

No julgamento do Mensalão, há réus com intervalos de confiança extremamente amplos, chegando próximo ao infinito. O que me parece é que quanto mais amplo o intervalo de confiança, mas cara de pau a pessoa é. Pena que aquele com intervalo de confiança mais amplo de todos não esteja oficialmente como réu do Mensalão.