quarta-feira, 13 de abril de 2011

O Sistema GRADE: Uma proposta que combina a força da recomendação e qualidade da evidência para orientar quais condutas devem ser adotadas ou evitadas na prática clínica

Artigo postado pelo Professor Antônio Alberto Lopes - Professor Associado, Livre-Docente de Nefrologia, Epidemiologia Clínica e Medicina Baseada em Evidências, Mestre em Saúde Pública e PhD em Ciência Epidemiológica pela Universidade de Michigan

No sentido de uniformizar os critérios usados para definir recomendações para condutas clínicas foi desenvolvido mais recentemente um sistema denominado “Grading of Recommendations, Assessment, Development and Evaluation” (GRADE) (1-5). Comparado com outros sistemas, o Sistema GRADE define de uma forma mais clara e objetiva o nível (qualidade) de evidência científica e força (ênfase) da recomendação para se adotar ou não adotar uma determinada conduta. O Sistema GRADE foi inicialmente idealizado para uso em diretrizes clinicas baseadas em evidências. O uso, no entanto, tem sido mais amplo passando a ser adotado por sistemas de informação eletrônica como o popular UPTODATE.

Força da Recomendação

No sistema GRADE a força recomendação para apoiar uma conduta é considerada forte quando as evidências disponíveis permitem concluir que os benefícios suplantam os malefícios (Quadro 1). Quando as evidências permitem concluir que a conduta é claramente maléfica, a força da recomendação para evitar a conduta é também considerado forte. Contrariamente, quando a relação entre benefícios e riscos não é muito clara o força da recomendação é considerado fraca. A recomendação forte é designada como “1” e a fraca como “2” no Sistema Grade.

 
1 – Forte: As vantagens de uma dada conduta claramente suplantam as desvantagens; ou então, as desvantagens claramente suplantam as vantagens.

2 – Fraco: Há um certo grau de incerteza sobre a relação entre vantagens e desvantagens de uma dada conduta.

Qualidade da Evidência

É importante observar a qualidade das fontes de evidência em que se baseia uma recomendação para adotar ou não adotar uma conduta, considerando que as fontes primárias de informação variam de forma muita ampla em sua qualidade científica. No sistema GRADE a qualidade da evidência tem sido classificada em quatro níveis2: alto, moderado, baixo, muito baixo, conforme mostrado na Quadro 2. É importante observar, no entanto, que tem sido verificada uma tendência para simplificar a classificação do nível ou qualidade da evidência combinando o nível baixo e o muito baixo em um único nível (6-8).

A - Alta - Este nível de evidência ocorre quando os resultados são provenientes de ensaios clínicos randomizados bem planejados e conduzidos, com grupos paralelos, com controles adequados, análise de dados adequada e achados consistentes tendo como alvo o desfecho clínico de interesse para o médico e o paciente. Em algumas situações estudos observacionais podem ser considerados de nível alto de qualidade para apoiar recomendações, inclusive terapêuticas. Este nível de evidência para estudo de tratamento é possível ocorrer com estudo observacional, particularmente com coorte prospectivo quando é bem planejado e conduzido utilizando métodos especiais de análise para controle de variáveis de confusão e mostrando efeitos muito fortes de intervenções terapêuticas que não podem ser explicados por potenciais vieses.

Quando a qualidade da evidência é considerada alta é muito improvável que trabalhos adicionais irão modificar a confiança na estimativa do efeito.

B - Moderada - Este nível de evidência ocorre quando os resultados são provenientes de ensaios clínicos randomizados com importantes problemas na condução, inconsistência nos resultados, avaliação de um desfecho substituto (surrogate endpoint) em lugar de um desfecho de maior interesse par ao médico e paciente, imprecisão nas estimativas e vieses de publicação. Os resultados podem ser também provenientes de estudos observacionais.

Quando a qualidade da evidência é considerada moderada trabalhos adicionais ainda não publicados poderão modificar a nossa confiança na estimativa de efeito podendo, inclusive, modificar a estimativa.

C - Baixa - Este nível de evidência ocorre quando os resultados são provenientes de estudos observacionais, mais especificamente estudos de coorte e caso-controle, considerados altamente susceptíveis a vieses. Pode ser também ensaios clínicos com importantes limitações.

Quando a qualidade da evidência é considerada baixa outros trabalhos ainda não publicados (particularmente ensaios clínicos com melhor qualidade metodológica) muito provavelmente terão um importante impacto na nossa confiança na estimativa de efeito.

D - Muito Baixa - Este nível de evidência ocorre quando os resultados são provenientes de estudos observacionais não controlados e observações clinicas não sistematizadas, exemplo relato de casos e série de casos.

Quando o qualidade da evidência é muito baixa qualquer estimativa de efeito deve ser vista como incerta.

• No UPTODATE as categorias C e D são combinadas em uma única categoria, ou seja categoria C.


Ao combinar força da recomendação e qualidade da evidência são obtidos os graus de recomendação, ou seja GRADE 1A, GRADE 1B, GRADE 1C, GRADE 1D, GRADE 2A e assim em diante.


REFERÊNCIAS

1. Guyatt GH, Oxman AD, Vist GE, et al. GRADE: an emerging consensus on rating quality of evidence and strength of recommendations. BMJ 2008;336:924-6.

2. Guyatt GH, Oxman AD, Kunz R, Vist GE, Falck-Ytter Y, Schunemann HJ. What is "quality of evidence" and why is it important to clinicians? BMJ 2008;336:995-8.

3. Guyatt GH, Oxman AD, Kunz R, et al. Going from evidence to recommendations. BMJ 2008;336:1049-51.

4. Schunemann HJ, Oxman AD, Brozek J, et al. Grading quality of evidence and strength of recommendations for diagnostic tests and strategies. BMJ 2008;336:1106-10.

5. Guyatt GH, Oxman AD, Kunz R, et al. Incorporating considerations of resources use into grading recommendations. BMJ 2008;336:1170-3.

6. UPTODATE: Acessado em 20/11/2010 no endereço http://www.uptodate.com/.

segunda-feira, 11 de abril de 2011

A Farsa da Pioglitazona para Não Diabéticos


Há duas semanas, foi publicado New England Journal of Medicine o ensaio clínico ACT NOW, o qual randomizou 600 pacientes não diabéticos para utilizar Pioglitazona ou placebo. A conclusão do artigo nos faz acreditar que é bom iniciar tratamento para diabetes em quem não é diabético: "As compared with placebo, pioglitazone reduced the risk of conversion of impaired glucose tolerance to type 2 diabetes mellitus by 72%".

Mas porque uma pessoa não diabética teria que usar um hipoglicemiante oral? Iniciar um tratamento para uma doença em pessoas que não são doentes? Colocado desta forma, a idéia parece questionável. Mas tem muita gente que acha isso uma boa idéia. Esse é um dos muitos exemplos da mentalidade do médico ativo, a qual nos induz a aceitar essa idéia, visto que a população-alvo do estudo envolve pacientes com predisposição a diabetes (indivíduos com intolerância à glicose).

Por outro lado, não podemos ter preconceito só porque a proposta é tratar pessoas não doentes. O que precisamos fazer é analisar criticamente a evidência do artigo, aceitar se for uma boa evidência e rejeitar se for uma evidência insuficiente. Costumo dizer que temos que nos render às boas evidências, só precisamos antes avaliar se a evidência é boa mesmo.

Um argumento a favor desta evidência seria sua publicação na mais importante revista médica, o New England Journal of Medicine. Mas não podemos nos enganar, isso não é garantia de qualidade. Mesmo os artigos do New England Journal of Medicine devem ser analisados criticamente. Então vamos lá.

No ACT NOW, durante seguimento de dois anos, a proporção de pessoas cuja avaliação periódica de glicemia apresentou critérios para diabetes foi menor no grupo Pioglitazona, em relação ao grupo placebo. Esse achado completa critérios de veracidade, visto que este foi o objetivo primário, o estudo tinha poder estatístico para este desfecho laboratorial, o estudo não foi truncado e a diferença foi estatisticamente significante. Ou seja, de fato não diabéticos que utilizam Pioglitazona terão glicemia mais baixa do que não diabéticos que não utilizam a droga. Nada mais óbvio do que isso.

Por outro lado, dizer que este achado laboratorial significa prevenção de desenvolvimento de diabetes é uma verdadeira farsa, pois a avaliação laboratorial foi realizada sob o uso da droga. Suponhamos que o grupo Pioglitazona na verdade tivesse apresentado maior conversão para diabetes. Esse resultado seria mascarado pelo fato de que a avaliação laboratorial foi realizada sob o uso de hipoglicemiante oral apenas nesse grupo. Para falar em redução do desenvolvimento de diabetes, a droga teria que ter sido suspenda dias antes da avaliação laboratorial, para que os grupos fossem comparados em condições iguais. Portanto, esse estudo apenas nos diz que a glicemia fica mais baixa se Pioglitazona está sendo utilizada. Na verdade, pode não ter havido nenhuma mudança metabólica intrínseca no grupo Pioglitazona, apenas o resultado é reflexo do uso da droga no dia da medida laboratorial da glicemia. Esse é um bom exemplo de viés de mensuração da variável desfecho.

Mas vamos supor que esse grosseiro viés não existisse e os autores houvessem de fato demonstrado redução na conversão para diabetes com uso de Pioglitazona. Isso nos autorizaria a utilizar a medicação em não diabéticos? Aí entra a questão dos desfechos substitutos.

Desfechos substitutos são variáveis laboratoriais ou fisiológicas que são utilizadas em estudos que não têm poder estatístico para avaliar desfechos clínicos. Por exemplo, redução da pressão arterial é um desfecho substituto, enquanto redução de AVC é um desfecho clínico. Melhora da densidade óssea da densitometria é um desfecho substituto, enquanto redução da incidência de fratura é um desfecho clínico. Desfecho clínico é o que o paciente sente, é morbidade ou mortalidade, é qualidade de vida ou tempo de sobrevida. Desfecho substituto é apenas uma medida de exame complementar.

Espera-se que a influência da droga no desfecho substituto se reflita em benefício clínico. O problema é que a história da ciência médica está repleta de situações nas quais um aparente benefício em desfecho substituto não causa benefício clínico e às vezes causa até malefício. Poderiamos citar vários destes exemplos, mas vou me limitar a apenas um que tem tudo a ver com a questão da Pioglitazona: o caso da Rosiglitazona.

Como já comentamos neste Blog, Rosiglitazona foi um hipoglicemiante oral utilizado apenas com base no conhecimento de que a droga reduzia glicemia (desfecho substituto). Virou um sucesso comercial. Anos depois, foi publicado o estudo RECORD, dimensionado para avaliar desfechos clínicos. Resultado, o estudo não demonstrou benefício clínico, sendo observado aumento da incidência de insuficiência cardíaca. Desta forma, no ano passado a droga foi teve seru uso restrito.

O desfecho primário do ACT NOW foi a dosagem de glicemia de jejum > 125 mg/dl. Para disfarçar isso de desfecho clínico, os autores denominaram “desenvolvimento de diabetes.” Como se fosse uma ocorrência clínica. Foi até calculado o NNT (número necessário a tratar) para prevenção de um caso de diabetes. Até uma curva de incidência cumulativa de diabetes for criada. Tudo isso um desfecho substituto parecer desfecho clínico.

Diabetes só seria desfecho clínico se fossem utilizados sintomas de diabetes como critérios. E mesmo assim, seria um desfecho clínico menor. O que interesse mesmo é se a terapia em questão é capaz de reduzir a incidência de desfechos cardiovasculares (morte, infarto, AVC), insuficiência renal, sintomas de retinopatia hipertensiva. E não temos garantia disso. Lembrem-se que a Rosiglitazona reduz glicemia e aumenta eventos cardiovasculares.

Neste contexto, é surreal a sugestão do uso de uma glitazona, com base em um pequeno estudo de desfecho substituto e em pessoas que nem diabéticas são.

Esse é um grande exemplo da tendência trazida pelos interesses comerciais. Em primeiro lugar, se rotula de doente uma população sem doença. Em segundo lugar, inventa-se que esse grupo de pessoas precisa ser medicada. Pronto, lucro certo.

A indústria farmacêutica costuma utilizar desfechos substitutos para convencer médicos ingênuos do uso de terapias de eficácia desconhecida. Um estudo de desfecho substituto tem valor científico para gerar uma hipótese de eficácia, mas está longe de ser suficiente para modificar conduta clínica.

sábado, 26 de março de 2011

Terceiro Transplante Cardíaco Pediátrico do Instituto do Coração - DF

O Instituto do Coração do Distrito Federal é hoje a referência no Centro-Oeste para transplante cardíaco. Vejam meus amigos Jorge e Cris Afiune conversando com o novo Ministro da Saúde, durante visita ao programa de transplante.

quinta-feira, 24 de março de 2011

O Paradigma Less is More


A comunidade médica costuma propor que terapias sejam aplicadas de forma mais agressiva do que o usual, sob a premissa de que o benefício é diretamente proporcional à intensidade do tratamento. Esse é o princípio do More is More, vulgo quanto mais, melhor. Esse fenômeno é provocado pela mentalidade do médico ativo, já comentada neste Blog.

O problema é que o benefício de uma terapia agressiva em relação à mesma terapia aplicada de forma moderada é uma premissa baseada em plausibilidade biológica, que é contraposta pela também plausibilidade de que tratar mais pode trazer mais efeitos adversos, mais incovenientes, maior custo. Portanto, nada é garantido.

Mesmo assim, com frequência surgem propostas de tratamentos agressivos sem evidências científicas definitivas, baseadas apenas em fisiopatologia ou em estudos de desfechos substitutos. Um dos grandes exemplos foi a recomendação do guideline americano de hipertensão (Joint National Committee) de que a pressão arterial deveria ser reduzida de forma agressiva em diabéticos, com uma meta de pressão menor do que indivíduos não diabéticos. Depois dessa recomendação, aceita quase universalmente pelos médicos (virou rotina), foi publicado o ensaios clínico ACCORD (NEJM 2010), que randomizou grande número de diabéticos para tratamento intenso ou tratamento usual da pressão arterial, resultando em ausência de diferença entre as duas estratégias. Essa falta de benefício da redução intensa da pressão esteve aliada à necessidade de maior número de drogas utilizadas, maior incidência de efeitos colaterais e maior custo.

A magnitude do benefício de uma terapia comparada a outra terapia é sempre muito menor do que o benefício da terapia comparada ao controle. Desta forma, se tratar agressivamente tiver benefício adicional, este tenderá a ser de pequena magnitude. Isso nos permite esperar com serenidade pelas evidências científicas que mostrem ser a estratégia agressiva segura e benéfica.

Neste tipo de discussão, devemos sempre chamar a atenção de que em situações especiais pode ser justificável adotar uma conduta médica sem evidências científicas. Para que isso ocorra, umas das três condições abaixo devem ser obedecidas:

1) Plausibilidade extrema (extrema mesmo): uso de para-quedas, marca-passo no BAVT, troca valvar em disfunção grave, diálise.

2) Potencial para benefício de grande magnitude (NNT < 10): trombólise no TEP com choque.

3) Plausibilidade moderada com estudo mostrando benefício população-alvo similar: qualquer terapia cardiovascular no muito idoso (pouco incluídos em ensaios clínicos), tratamento com inibidor da ECA e beta-bloqueador em crianças com insuficiência cardíaca (não tem ensaios clínicos em crianças) ou em pacientes com miocardiopatia chagásica (não fez parte dos grandes ensaios clínicos de ICC).

Por outro lado, situações de prevenção (primária ou secundária) raramente se adequam a estas condições. Portanto, devemos esperar evidências científicas do benefício de prevenções.

Se observarmos cuidadosamente, veremos que é muito pequena a probabilidade da terapia agressiva ser superior à terapia moderada. Quase todas as vezes em que a terapia agressiva foi testada, o resultado do estudo foi negativo. Vejam abaixo:
 
1) Tratar agressivamente a pressão arterial em diabéticos não traz benefício (ACCORD - NEJM 2010).
2) Tratar agressivamente a glicemia aumenta da mortalidade hospitalar de pacientes criticamente enfermos, comparado ao tratamento usual (NICE-SUGAR - NEJM 2009).

3) Tratar agressivamente a glicemia de diabéticos crônicos não reduz desfechos clínicos e aumenta incidência da desagradável hipoglicemia (ACCORD - NEJM 2011).

4) Transfusão sanguínea liberal aumenta da mortalidade hospitalar de pacientes criticamente enfermos, comparado à transfusão restritiva (NEJM 1999).

5) Em síndromes coronarianas agudas, clopoidogrel 150 mg não é superior à dose usual de 75 mg; nem AAS 300 mg é superior a AAS 100 mg (OASIS 7 - NEJM 2010)

6) Além de tratar dislipidemia com estatina, aumentar o HDL-colesterol em 70% com Torcetrapib aumenta a mortalidade, ao invés de reduzir (ILUMINATE - NEJM 2007).

7) Além de tratar a dislipidemia com estatina, usar fibrato em diabéticos não reduz desfechos cardiovasculares (ACCORD - NEJM 2010).

8) Em síndromes coronarianas agudas, anticoagulação com Clexane em duas doses diárias é farmacologicamente mais agressivo do que uma dose diária de Fondaparinux, porém o benefício das duas terapias é igual, enquanto o Fondaparinux causa menos sangramento (OASIS 5 - NEJM 2006).

9) Angioplastia coronária de todos os vasos com obstrução significativa apresenta maior incidência de desfechos cardiovasculares do que angioplastia apenas dos vasos com redução de reserva de fluxo (FAME - NEJM 2009).

E por aí vai .... Percebam que é sempre a mesma história.

O único exemplo de sucesso do More is More é a superioridade da redução intensa do colesterol com estatina em relação ao benefício obtido com moderada dose de estatina (PROVE-IT e TNT - NEJM).
Desta forma, devemos ser cautelosos e lembrar que tratar mais nem sempre é melhor opção. É justo que estas hipóteses sejam testadas em nossa procura incessante de melhores terapias. Mas uma hipótese é para ser testada, não implementada.

No princípio do Less is More, less não significa exatamente pouco, mas sim o usual, o que se faz habitualmente. Enquanto more significa o exagero.

Por tudo isso, o princípio do Less is More deve prevalecer em nosso raciocínio clínico. Até que se prove o contrário.

domingo, 6 de março de 2011

A Síndrome Metabólica e o Rei que Estava Nu

Conta a estória de Hans Christian Andersen (1937) que um rei muito vaidoso encomendou de dois alfaiates uma roupa sem precedentes, de qualidade tão especial que nunca alguém tivesse vestido igual. Na impossibilidade de concretizar tal desejo, os alfaiates idealizaram uma roupa maravilhosa, porém invisível aos olhos de pessoas estúpidas. O próprio rei, ao experimentar a roupa, não conseguiu visualizá-la no espelho, porém fingiu que estava vendo para não parecer estúpido. Da mesma forma, todas as pessoas percebiam que o rei estava nu, porém ninguém lhe chamava a atenção pelo receio de ser rotulado de estúpido. E assim o rei passou boa parte de seu reinado nu, exposto ao ridículo. Era o medo de parecer estúpido que fazia com que as pessoas aceitassem o inverossímil. De fato, muitos acreditavam que estavam vendo a roupa, pois queriam acreditar não ser estúpidos.

Essa estória retrata o mecanismo pelo qual alguns mitos perduram na medicina. Por exemplo, o mito da síndrome metabólica como uma entidade de grande valor clínico. Na verdade, essa entidade guarda uma enorme dissociação entre sua popularidade e seu real valor clínico.

Síndrome metabólica pode ser definida como a constelação de pelo menos três dos cinco critérios: aumento de circunferência abdominal, triglicérides elevados, HDL-colesterol baixo, pressão arterial elevada e glicemia ≥ 100 mg/dl. Antes de aprofundar a análise crítica que justifica esta postagem, preciso esclarecer que do ponto de vista do desenho de estudos específicos, vejo a seguinte utilidade em agrupar alterações metabólicas decorrentes da obesidade: servir de critérios de inclusão em trabalhos que desejam avaliar mecanismos de doença ou impacto de intervenções voltadas para desfechos substitutos relacionados à obesidade. Neste contexto, há artigos e teses de qualidade, cujos valores científicos não são questionados por esta postagem.

Nosso foco é no valor da utilização da síndrome metabólica no raciocínio médico. O argumento mais utilizado para justificar a existência da síndrome metabólica é sua importância na predição do risco de eventos cardiovasculares ou do risco de desenvolvimento de diabetes. Vamos analisar, sob a ótica de evidências científicas, se síndrome metabólica realmente merece esse crédito.

O método correto para criar um modelo preditor é (1) a identificação de variáveis associadas ao desfecho em estudos de coorte, as quais serão submetidas a (2) análise multivariada que define quais são os preditores independentes do desfecho e valor relativo de cada um deles. De posse destes dados, (3) esses preditores recebem uma pontuação proporcional à sua força de associação com o desfecho, gerando um escore de risco. Assim foi criado o clássico Escore de Framingham. Em contraste, a síndrome metabólica não foi criada a partir da associação independente de cada um de seus componentes com o desfecho. Simplesmente, especialistas resolveram combinar achados clínicos que podem ter relação com resistência a insulina. Isso tem pouco a ver com predição de risco. E por este motivo, vários estudos mostram que a acurácia prognóstica do escore Framingham é nitidamente superior à da síndrome metabólica na predição de eventos cardiovasculares (Diabetes Care 2004; Diabetes Care 2005; Arch Int Med 2005). Óbvio, o Escore de Framingham nasceu de um modelo preditor de risco, enquanto SM nasceu da combinação arbitrária de achados clínicos e laboratoriais.

O grande problema da excessiva valorização da síndrome metabólica é que isso provoca certa confusão no raciocínio médico. Um exemplo é o equívoco da Diretriz Brasileira de Dislipidemia em sugerir que a presença de síndrome metabólica deve reclassificar pacientes de risco intermediário pelo Framingham para alto risco cardiovascular. Percebam, o que se sugeriu é que a presença de síndrome metabólica corrija a classificação de Framingham. Como o melhor preditor pode ser corrigido pelo pior preditor? Não pode, até mesmo porque está cientificamente demonstrado que síndrome metabólica não agrega valor prognóstico ao Escore de Framingham (Diabetes Care 2004).

Outro argumento que se usa a favor da síndrome metabólica é a predição de quem vai se tornar diabético. De fato, síndrome metabólica prediz diabetes melhor do que o Escore de Framingham. É claro, pois o Escore de Framingham não foi feito para isso. No entanto, quando se compara síndrome metabólica com modelos criados para predição de diabetes, esses últimos apresentam melhor capacidade preditora do que a síndrome metabólica (Diabetes Care 2004). Mais uma vez, isso é o esperado, pois síndrome metabólica foi criada de forma arbitrária. Então se alguém deseja predizer diabetes, que utilize um modelo multivariado validado para tal e não uma arbitrária constelação de achados metabólicos.

Interessante mesmo é perceber que (pasmem) a simples glicemia de jejum é melhor preditor de diabetes do que a definição de síndrome metabólica. Por exemplo, na coorte do estudo PROSPER (Lancet 2008), o hazard ratio da síndrome metabólica para predição de diabetes foi 4.4, comparado a 18.4 da glicemia de jejum. Esse achado se reproduz em outros estudos (J Intern Med 2008; Circulation 2005).

Então porque tanta ênfase nessa tal de síndrome metabólica? A excessiva valorização dessa síndrome vem de nossa cultura em criar rótulos de doenças. A partir destes rótulos, exames complementares, medicações e procedimentos complexos são justificados. Por exemplo, a droga anorexígena Rimonabant (já suspensa do mercado) teve seu marketing principal embasado na “cura” da síndrome metabólica. Ao receber o rótulo de síndrome metabólica, um procedimento como cirurgia bariátrica em alguém sem obesidade mórbida pode parecer mais justificável a olhos pouco científicos. Exames de pesquisa de isquemia miocárdica podem parecer mais lógicos quanto aplicados a um paciente com síndrome metabólica, mesmo que assintomático. E assim por diante. É a medicalização da sociedade, induzida por rótulos de doenças.

Voltando à estória do rei. Um belo dia, durante um importante desfile em praça pública, ao ver o rei passar com a bela roupa, uma criança gritou: o rei está nu! Essa criança desmascarou a farsa criada pelos alfaiates, constrangeu o rei, e principalmente os súditos que acreditaram na mentira ou ficaram com vergonha de discordar. Alguns interpretam que foi a inocência da criança que permitiu sua observação. Na verdade, reza a lenda que essa era uma daquelas crianças meio maliciosas. Neste caso, a diferença entre criança e adulto que prevaleceu foi a coragem de reconhecer certas verdades.

quinta-feira, 24 de fevereiro de 2011

A Veja e o lobby a favor da Sibutramina


Leio a Veja, para mim é fonte razoável de informações sobre política, economia, cinema, arte em geral. Gosto da revista, porém quando leio uma reportagem médica (o único tipo de assunto que posso julgar de um patamar superior), fico a questionar se o que estou lendo nos outros tópicos tem tão pouca acurácia como o que leio sobre saúde. Será que o que leio sobre economia é tão limitado (ou enviesado) como o que observo nas reportagens sobre saúde? Isso é importante, pois estas reportagens modelam o pensamento coletivo e acabam influenciando a forma como a medicina é exercida. Principalmente quando a reportagem é de capa da Veja, a principal revista do país.


Nesta semana, a reportagem de capa é uma clara defesa das drogas anorexígenas, motivado pela potencial suspensão da Sibutramina pela ANVISA. Já escrevi três vezes neste Blog sobre a Sibutramina (1, 2, 3), mas sou obrigado a voltar ao assunto pela quarta vez. A eloqüente capa da Veja diz:

Remédios para emagrecer. Por que é ruim proibir a venda. Milhões de brasileiros em guerra com a balança dependem destes medicamentos para perder peso e garantir uma boa saúde. Vamos analisar cientificamente esses dois itens: saúde e perder peso.

Primeiro, o marcador mais importante de saúde é a incidência de eventos clínicos. O ensaio clínico que está motivando a suspensão da Sibutramina no mercado é o SCOUT, publicado no New England Journal of Medicine em 2010. Foi um ensaio clínico grande, desenhado para mostrar redução de eventos cardiovasculares com a droga redutora do peso. Para mostrar redução de eventos com mais facilidade, os investigadores selecionaram uma amostra de pessoas mais predispostas a eventos cardiovasculares. Pois bem, o resultado foi o contrário do esperado (como muitas vezes acontece em medicina): a droga aumenta a incidência de infarto e AVC. Isso é “garantir uma boa saúde”, como diz a capa da Veja?
Alguns argumentam (sem evidências consistentes) que não teria problema se a droga fosse usada em pacientes de menor risco cardiovascular. Mesmo se isso fosse verdade (não sabemos), não justifica o uso da droga, pois não há benefício clínico demonstrado nestes pacientes? O que justifica o uso de uma terapia é o benefício e não a simples ausência de malefício. Impressionante como esse tipo de argumento é recorrente, ou seja, se basear em uma eventual ausência de malefício para justificar o uso.

Quanto ao malefício, de fato não sabemos se existe risco em pacientes de menor risco. Porém, uma vez demonstrado malefício no SCOUT, só podemos negar o malefício em outro tipo de população se demonstrarmos segurança cientificamente. Não apenas supor. A segurança em pessoas de baixo risco é só uma hipótese. Além disso, obesos não são pessoas exatamente de baixo risco, pelo menos é o que dizem.

Falar que traz saúde é uma inverdade. O argumento certo a favor da droga seria qualidade de vida. Aí a gente deve considerar a segunda parte da frase trazida pela capa de Veja: “perder peso”. Quanto de peso as pessoas perdem ao usar Sibutramina? Essa é uma pergunta central nessa discussão, portanto nada como um ensaio clínico randomizado para responder essa pergunta. A resposta de acordo com o ensaio clínico SCOUT é 4.3 Kg perdidos em 3 anos de tratamento. Não parece ser exatamente um benefício de magnitude suficiente para justificar o uso frente a aumento de risco cardiovascular ou ausência de conhecimento a respeito da segurança.

De posse destas evidências científicas, não dá muito para entender o porquê de tanta controvérsia, se não pensarmos em conflitos de interesse. É sempre a mesma história, quando um ensaio clínico bem desenhado não dá o resultado que as pessoas querem, justificativas estapafúrdias são utilizadas com objetivo de rejeitar a evidência científica.

Há alguns anos o Rimonabant foi capa da Veja e Istoé ao mesmo tempo, quando do lançamento da droga. A droga foi lançada, médicos prescreveram, presentes foram distribuídos pelo laboratório responsável. Foi um oba oba, se falava em cura da obesidade, sem evidências científica a respeito de desfechos clínicos. A droga foi lançada no Brasil, nunca liberada pelo FDA. Meses depois, a ANVISA suspendeu a medicação, devido a efeitos colaterais na esfera do humor. Não precisava ter passado pelo constrangimento.

O que a ANVISA está fazendo agora nada mais é do que medicina baseada em evidências. A ANVISA não praticou medicina baseada em evidências quando aprovou a Sibutramina, agora está se corrigindo. Ainda não está decidido, mas tudo indica que a droga será suspensa.

Por fim, a pergunta que não quer calar é o que a Veja está ganhando com tamanho lobby a favor dessa droga? Gosto da Veja, principalmente das opiniões políticas que lia durante o governo Lula. Mas tenho que concordar com meus amigos petistas, a Veja parece mesmo tendenciosa.

sábado, 19 de fevereiro de 2011

Pra que alongar antes de correr ?



Quando vejo uma comunidade valorizar algo em demasia, desconfio, o grau de valorização pode ser desproporcional ao grau de evidências. Isso é comum. Uma ótima saída para quando não queremos fazer uma coisa, é nos perguntarmos: há benefício comprovado?

"Alongo em algum momento do dia, mas não necessariamente antes da corrida", já dizia o triatleta Júlio Neves em uma conversa informal. Gostei e me senti mais livre ainda para não alongar.

Gosto de correr, mas nunca fui submisso a esse negócio de alongar. Sempre achei essa recomendação um pouco exagerada. No dia em que estou meio malicioso até penso que é uma babaquice. Nunca aceitei essa tirania, pois sabia que não havia evidência. Bem, agora há evidência de ensaio clínico radomizado: alongar não traz benefício, ... nem malefício.

E tão bom quando vemos um ensaio clínico randomizado a respeito de um simples hábito de vida. É a vida cotidiana sendo avaliada por evidências probabilísticas. Filosófico. Reforça o paradigma da saúde beseada em evidências.

Foi o próprio Júlio Neves que publicou em seu facebook  a notícia do ensaio clínico The impact of a pre-run stretch on the risk of injury in runners, apresentado no congresso da Academia Americana de Ortopedistas, cujo abstract está disponível do site. Foram 1.398 pacientes randomizados para alongar ou não alongar antes de correr e ao final de 3 meses a incidência de lesões foi 16% em ambos os  grupos.

Mais um mito derrubado. Na vida, vemos muitas paradigmas sendo derrubados. Mas grande parte dos paradigmas precisam ser derrubados porque nunca deveriam ter sido criados. Essa mania de criar mitos, crenças não embasadas dá nisso. Parece que o conhecimento muda muito, mas em muitos casos não é exatamente uma mudança de idéia, pois não deveria ter existido idéia alguma.

Agora vou ficar observando se esta evidência científica vai ter algum impacto prático. Esse é outro problema. Primeiro, a falta de evidências. Depois, a penetração das evidência na prática. Há uma grande lacuna entre o conhecimento e a modificação de conduta baseada em conhecimento.

Será que vamos continuar vendo as grandes rodas nos grupos de corrida, com todos alongando simultaneamente, num rito quase religioso? Tomara que eu esteja errado, mas acho que tudo vai continuar do mesmo jeito. Pelo menos não faz mal.

O que não vai continuar do mesmo jeito sou eu quando meus amigos educadores físicos vierem me dar lição de moral quando me virem sem alongar. Agora tenho a resposta na ponta da língua.

O Colesterol, os Cardiologistas e o Ministério da Saúde


Uma recente controvérsia a respeitos dos valores ótimos do colesterol nos serve de estímulo para discutir como devemos nos posicionar quando pensamos em medidas preventivas em saúde pública. Uma medida preventiva populacional deve ser o mais abrangente possível e para isso precisa ser democratizada, descomplicada. Quando pensamos em prevenção de doença cardiovascular, devemos simplificar a identificação de candidatos e uniformizar a terapia. Assim mais pessoas se beneficiarão. Esta é uma idéia que começa a surgir no meio cardiológico, embora ainda pouco difundida (vide Yusuf, Circulation  2010).  Vamos à história que motivou nossa discussão:

A Sociedade Brasileira de Cardiologia (SBC) divulgou por e-mail aos associados e em seu site que enviou documento à Secretaria de Atenção à Saúde, solicitando alterações na Diretriz de Dislipidemia do Ministério da Saúde, colocada em consulta pública em dezembro de 2010.

Ao tempo em que mostra certa insatisfação por não ter sido consultada quando da preparação da Diretriz, a SBC expressa discordância quanto à concentração plasmática de LDL-colesterol que devemos considerar ótima. Do site da SBC:

“A entidade maior dos cardiologistas, que não foi consultada ou ouvida quando da redação da Diretriz, lembra ... que a recente "IV Diretriz Brasileira de Dislipidemias e Prevenção da Aterosclerose", da SBC, faz recomendações que podem levar à redução expressiva dos eventos cardiovasculares, ... mas essas recomendações não foram contempladas no documento gerado em Brasília.”

“Um dos argumentos dos cardiologistas é que na "Consulta Pública" o nível ótimo do LDL-colesterol (colesterol ruim) é apontado como inferior a 100 miligramas por decilitro de sangue, enquanto os cardiologistas consideram o nível ótimo muito mais baixo, inferior a 70 mg/dL.”

Procurei na notícia do site as referências que embasam as afirmações dos cardiologistas. Não há citações de quais evidências justificam a discordância em relação ao Ministério da Saúde. O documento enviado ao Ministério deve conter tais citações, mas não consegui achar o documento original no site.

Imagino que tenha sido principalmente o estudo JUPITER que instigou os cardiologistas ao posicionamento quanto ao valor ótimo do colesterol. Como já fizemos algumas vezes neste Blog, é sempre estimulante voltar a discutir o estudo JUPITER, pois ele é um bom exemplo para treinamento de análise crítica de  artigo científico.

O estudo JUPITER foi um ensaio clínico que avaliou indivíduos sem doença cardiovascular, de risco intermediário, com mediano do LDL-colesterol de 108 mg/dl, randomizados para usar estatina ou placebo. A concentração final de LDL-colesterol apresentou mediana de 55 mg/dl no grupo estatina, sendo observado redução de eventos cardiovasculares.

Provavelmente, esta evidência de benefício da estatina é verdadeira. Mas não basta que uma informação seja verdadeira, sua aplicabilidade deve depender também da relevância (magnitude do benefício). Principalmente quando a recomendação é populacional, feito pelo ministério da saúde de um país.

Os autores do estudo JUPITER argumentaram na época que a magnitude do benefício foi surpreendente. Porém o cálculo do número necessário para tratar (NNT) em cinco anos para prevenir um evento cardiovascular foi totalmente impreciso e extrapolado. Isto porque o JUPITER foi um estudo truncado (interrompido antes da hora) e apenas 300 dos 18.000 pacientes foram seguidos pelos cinco anos planejados. Apenas 7.000 dos 18.000 pacientes foram seguidos por pelo menos dois anos. Isso dá uma imprecisão enorme na estimativa da magnitude do efeito da intervenção durante cinco anos. Se utilizarmos os dados do hazard fornecido pelo estudo, podemos fazer nosso próprio cálculo do NNT para prevenir uma morte no período de um ano, o que dá 400 pacientes. Se compararmos com estudo 4S, por exemplo, este NNT é 160, bem menor.

Segunda coisa importante é que o cálculo do NNT do JUPITER foi para desfechos combinados. Dentre estes desfechos, está a necessidade de internação por angina e revascularização. Estes eventos são menos importantes do que infarto, AVC ou morte, e nunca haviam sido considerados nos estudos clássicos de estatina. Portanto, do ponto de vista qualitativo, o tipo de evento prevenido também foi menos importante em boa parte das vezes. Metade dos eventos do estudo foi representada por estes dois tipos de desfecho.

Analisando a seqüência histórica de ensaios clínicos sobre eficácia de estatinas, percebemos que o grande benefício é proveniente do simples uso de estatina. Ao passo que o benefício adicional de uma terapia mais agressiva em relação a uma terapia moderada é de menor magnitude, embora existente. O próprio estudo PROVE-IT que comparou terapia agressiva versus moderada em pacientes com síndromes coronarianas agudas (extremo superior de gravidade) mostrou um NNT para morte quatro vezes maior do que o observado no estudo 4S, que comparou estatina versus placebo. Imaginem isso em prevenção primária, o benefício seria menor ainda. Pena que não há estudo que compare terapia agressiva versus moderada em prevenção primária.

Ou seja, a grande diferença mesmo é obtida quando se introduz a estatina, independente de sua dose. O ganho adicional de uma dose alta ou de uma estatina mais potente é proporcionalmente bem menor.

Além disso, o JUPITER estudou pacientes de risco intermediário (selecionados a partir de um valor elevado de proteína C-reativa), enquanto a população geral tem risco menor do que a amostra deste estudo. Isso faria com que a magnitude do benefício fosse menor ainda na população geral.

Do ponto de vista de saúde pública, o importante é difundir o uso de estatina para quem precisa. Ou seja, uma estatina barata em dose moderada, oferecida de forma generalizada para pacientes com dislipidemia, mesmo que discreta. Ficar falando em terapia agressiva, em meta de colesterol em torno de 70 mg/dl, nos faz perder o foco populacional. Com o custo de 1 terapia agressiva para colesterol, seríamos capazes de tratar 4 pacientes da forma convencional. 

Além disso, como dito acima, a terapia agressiva nunca diretamente foi comparada à terapia moderada em prevenção primária. Assim, não podemos saber precisamente dados de custo-efetividade a este respeito.

Técnicos do Ministério da Saúde pensam com o foco da saúde pública, enquanto cardiologistas pensam de forma individualizada, pois tratamos pacientes e não populações. Isso é natural. Por este motivo que os cardiologistas não concordaram com a Diretriz. Por sinal, muito bem escrita, em forma de revisão sistemática. Deveríamos nos mirar nela ao escrever nossas Diretrizes.

Na verdade, alguém poderia argumentar que do ponto de vista estritamente cardiovascular, o colesterol ideal é provavelmente zero, quanto mais baixo melhor. A controvérsia em cima de um valor ideal (70 mg/dl vs. 100 mg/dl) é algo muito mais filosófico do que de ordem prática. Para ser de ordem prática, do ponto de vista populacional deveria existir evidência, a evidência deveria ser relevante e a relação de custo-efetividade deveria estar bem definida.

Enfim, o ótimo é inimigo do bom, principalmente em saúde pública. É natural que uma diretriz do governo seja diferente de uma diretriz de uma sociedade cardiológica. O enfoque é diferente.

quarta-feira, 5 de janeiro de 2011

A Farsa das Pulseiras Power Balance


Em agosto do ano passado, publicamos a postagem de título "Ensaio sobre o Efeito Placebo". Naquela época a pulseiras Power Balance encontravam-se no auge da fama, inclusive com depoimentos favoráveis de vários artistas brasileiros e internacionais. Percebendo o crescimento vertiginoso do uso da pulseira entre amigos, resolvi escrever aquela postagem, onde questionávamos a falta de evidência científica e sugeríamos a necessidade de ensaios clínicos randomizados para demonstrar os tantos efeitos benéficos deste produto. Hoje fomos premiados com o reconhecimento por parte do fabricante de que não há evidências a respeito da pulseira. Para esse início de ano, sugiro a fitinha do Bomfim. Valoriza nossa tradição local e é mais barata (20 centavos x 200 reais da Power Balance). Na verdade, a fitinha do Bomfim é priceless, não tem preço.

Vejam abaixo reprodução da reportagem de ontem da Folha de São Paulo, que nos foi lembrada por Júlio Neves via facebook.

04/01/2011 - 16h31


Fabricante da Pulseira Power Balance Admite não Funciona.

A empresa Power Balance foi obrigada, na Austrália, a desmentir publicamente os supostos efeitos terapêuticos de suas pulseiras e a garantir o reembolso a consumidores que se sentirem lesados pela propaganda enganosa.

Em 22 de dezembro, a empresa assinou um termo com o órgão de defesa do consumidor daquele país e se comprometeu a negar a existência de evidências científicas de seus benefícios.

A filial australiana da Power Balance, cuja sede é nos EUA, já postou essas informações no site oficial e prometeu que os clientes insatisfeitos têm até 30 de junho para pedir reembolso.

Em novembro, a empresa foi multada em 15 mil euros (R$ 33 mil) na Espanha por fazer propaganda enganosa. No mês seguinte, a Power Balance foi multada em 300 mil euros na Itália.

EFEITO PLACEBO

Os braceletes ganharam fama depois de serem vistos nos pulsos de jogadores de futebol como David Beckham e Cristiano Ronaldo, além dos atores Leonardo Di Caprio e Robert De Niro e do piloto Rubens Barrichello.

O tricampeão capixaba de surfe Diogo Leão, 29, diz que não tira a pulseira nem para dormir e que continua usando, mesmo com a polêmica.

"Quando faço algumas manobras de rotação, sinto que meu peso fica mais equilibrado na prancha", diz ele, que usa o bracelete há mais de um ano. "Não sei se o efeito é psicológico, mas para mim tem dado certo."

A fabricante diz que os hologramas da pulseira melhoram o fluxo de energia do corpo, aumentando a força, o equilíbrio e a flexibilidade.

Leandro Tessler, professor de física da Unicamp, desmente esses benefícios. "A interação de um holograma com corpo é só visual, mas não interfere na energia."

Segundo ele, as pulseiras podem ter efeito placebo. "Você se convence e pode até se sentir melhor, mas não há evidência científica comprovando o funcionamento."

NO BRASIL

O reembolso para consumidores lesados só vale para os australianos. No Brasil, a empresa não foi obrigada a adotar essa medida, mas a publicidade dos efeitos terapêuticos está proibida desde 3 de setembro por ordem da Anvisa (Agência Nacional de Vigilância Sanitária).

A suspensão foi determinada após reportagem da Folha ter alertado o órgão de que os revendedores brasileiros estavam fazendo publicidade irregular.

A multa para o caso de infração à norma pode variar de R$ 2.000 a R$ 1,5 milhão.

Segundo a Vigilância, a Power Balance e a fabricante da Life Extreme, sua cópia brasileira, não infringiram a regra depois de publicada.

A On the Beach, distribuidora das pulseiras americanas no Brasil, informou que "toda a publicidade está em conformidade com as leis vigentes" e que não divulga "falsas promessas de benefícios". A empresa estima que já vendeu 200 mil unidades no país desde 2009.