sexta-feira, 12 de dezembro de 2014

O Apelo Natureba


Artigo publicado no Jornal A Tarde de hoje, por Luis Correia.

Com frequência me pego questionando porque é tão comum a frase não gosto de tomar remédio, prefiro coisas naturais a artificiais. Fico pensando se existe a mesma relutância em aceitar o artificialismo tecnológico quando precisamos de um avião para viagens longas, ou de um celular para manter contato constante com  nossos filhos, ou do Google para obter qualquer informação.

Em parte, consigo entender o preconceito de alguns em usar as tais medicações alopáticas, pois muitas destas têm sido indicadas de forma inadequada, o que já chamamos neste espaço de overtreatment. E isso muitas vezes decorre de erros cognitivos do pensamento médico, ou pior, de conflito de interesses.

Por outro lado, percebo que o apelo natureba vai além dessa percepção. Talvez seja uma espécie de instinto de sobrevivência que nos faz evitar o artificial. Porém este instinto é incoerente, pois nossa própria duração já deixou de ser natural. Natural mesmo seria viver em torno de 30 anos, como era no passado. No início do século 20, apenas 10% das pessoas do mundo chegavam à minha idade, 45 anos. Viver até 80 anos não é natural, é artificial. Por isso é incoerência querer viver tanto assim e evitar tecnologias que trarão qualidade a essa vida tão prolongada.

Antigamente não precisávamos nos preocupar com infarto do miocárdio ou derrame. Não dava tempo da gordura se acumular nas artérias, pois antes disso éramos comidos por um leão ou interrompidos por uma pneumonia. Surgiram proteções contra animais maiores, saneamento básico, passamos a lavar mais as mãos, surgiram os antibióticos, e assim fomos nos tornando mais prolongados artificialmente. Agora que alcançamos isso temos duas opções: (1) utilizar tecnologias testadas em ensaios clínicos randomizados, de eficácia comprovada, segurança e tolerabilidade conhecidas; (2) ou preferir um chá de qualquer coisa, sem comprovação cientifica, apenas por ser mais natural. Ou um fitoterápico carente de estudos científicos de qualidade.

Nada contra fitoterápicos ou chás, se soubermos que eles funcionam. A questão é que ser natural não é garantia de ser eficaz (nem seguro). Meus pacientes perguntam se eu acredito nessas coisas. Respondo que não tenho o direito de acreditar por acreditar, não seria profissional. Os efeitos dessas propostas precisam ser observados pelas mesmas lentes utilizadas na avaliação dos efeitos das drogas tradicionais. Ou seja, as lentes do método científico, que servem para avaliar o mundo de forma imparcial, isenta de vieses ou erros aleatórios.

Não devemos ter preconceito com o natural, mas também não com o artificial. Ambos devem ser testados e comprovados por estudos científicos, antes de fazerem parte do nosso arsenal. O que chamo (ironicamente) de natureba é o natural que é aceito sem comprovação científica, apenas por ser natural.


Preferir digitar mensagens de texto ao celular a conversar com o amigo do seu lado é mau uso da tecnologia. Indicar tratamentos modernos, porém sem comprovação científica, é mau uso da tecnologia. Por outro lado, negar tecnologias de benefício comprovado, em prol do apelo natureba, é uma forma primária de pensamento.

quinta-feira, 4 de dezembro de 2014

Dupla anti-agregação pós-stent (Estudo DAPT): manter após 1 ano ?



Em novembro, o ensaio clínico DAPT foi apresentado no congresso do American Heart Association e simultaneamente publicado no New England Journal of Medicine, concluindo: o qual concluiu que a manutenção da dupla anti-agregação plaquetária além de 1 ano após o implante de stent farmacológico reduz risco de eventos cardiovasculares. 

Este é um estudo interessante para discutir, pois tem peculiaridades metodológicas e de aplicabilidade. 

Esta conclusão parece ir na contra-mão de ensaios clínicos que demonstram a não inferioridade do uso da dupla anti-agregação por apenas 6 meses (versus 1 ano), a exemplo dos SECURITY ou ISAR-SAFE, recentemente apresentados em congressos. Ou na contra-mão do princípio do less is more

Este estudo incluiu 10.000 pacientes que utilizaram a dupla anti-agregação durante 1 ano após o uso do stent farmacológico, e não apresentaram complicações neste período. Passada esta fase, os pacientes foram randomizados para manter durante mais 18 meses ou suspender o clopidogrel (em alguns casos Prasugrel).

Quanto à confiabilidade, o estudo possui baixo risco de viés (randomizado, placebo-controlado, intenção de tratar, pouca perda de follow-up, desfechos objetivos) e baixo risco de erros aleatório (estudo grande - preciso - e ausência das situações de baixa confiabilidade do valor de P, como valorização de desfechos secundários, subgrupos ou truncamento). Portanto, vamos confiar no resultado.

O Conceitos Demonstrados


O estudo tem dois desfechos primários: trombose de stent e eventos cardiovasculares (morte, IAM, AVC). Isto não é comum e desperta curiosidade: por que trombose de stent foi colocado em separado dos desfechos combinados? Porque não combinar tudo em um único desfecho composto? Há uma razão inteligente para isso: o fenômeno que media a trombose (problema no stent) é diferente do fenômeno que media os outros desfechos (instabilização do leito nativo). Como o primeiro desfecho é mais raro, caso apenas este fosse beneficiado pelo clopidogrel, seus números iriam se diluir no desfecho primário do combinado de desfechos. Por isso, trombose foi um desfecho separado, ficando dois desfechos primários. 

Como isso predispõe ao problema das múltiplas comparações (dois desfechos sendo analisados simultaneamente), o valor de P que define significância estatística foi reduzido para 0.025 caso apenas um dos desfechos fosse significativo (maior rigorosidade - ajuste de Bonferroni). 

O DAPT demonstrou um nítido surgimento de trombose de stent (1 em 100 pacientes) exatamente no ato da suspensão do clopidogrel (vide gráfico abaixo). Coisa que não ocorreu no grupo que manteve a droga. Portanto, fica demonstrado o conceito de que a proteção do clopidogrel não se limita a apenas um ano. Vai além ...


Um segundo conceito comprovado pelo estudo é da redução de eventos não relacionados a trombose do stent. Ou seja, nestes pacientes mais complexos (que necessitaram de intervenção percutânea), a manutenção do clopidogrel confere uma certa proteção (- 2%, NNT = 63) contra infarto do miocárdio não dependente de trombose do stent. 

Relevância (tamanho e qualidade do efeito)


Na análise qualitativa, percebemos que todos os desfechos avaliados são importantes (duros), o que dá relevância ao resultado do estudo. Houve benefício no desfecho trombose de stent (duro) e a redução do desfecho combinado ocorreu à custa do componente infarto (duro). Não chegou a haver redução do componente mais importante, morte, o que daria maior relevância ao achado.

E do ponto de vista quantitativo?

A redução absoluta do hazard da trombose de stent foi 1% e dos desfechos cardiovasculares 1.6%. No teste de hipótese estatística, estes desfechos foram analisados separados, mas agora que a hipótese nula foi rejeitada em ambos, a gente pode combinar em um único NNT do benefício. Sendo assim, a redução absoluta ficaria 2.6% (1% + 1.6%) e o NNT para benefício = 38 (100 / 2.6). Por outro lado, houve aumento de sangramento moderado a grande, com NNH = 100. 

Sendo assim, precisamos tratar 38 pacientes para prevenir um infarto e tratar 100 para causar um sangramento. A análise numérica mostra um benefício moderado versus um risco existente, porém mais baixo. Como decidir?

Como a maioria dos tratamentos, NNT = 38 não é nenhuma panacéia. Mas é assim que vários tratamentos adotados funcionam. Curioso perceber que o estudo CURE que consagrou o uso da dupla anti-agregação em síndromes coronarianas agudas teve um resultado risco/benefício muito parecido com o DAPT!! O CURE demonstrou NNT = 48 e NNH = 100. 

Portanto esse é um benefício relevante o suficiente para influenciar nossa conduta clínica.

Tendo o trabalho passado pelo crivo da confiabilidade (nível de evidência) e relevância (tamanho e qualidade do efeito), analisaremos aplicabilidade

Aplicando a Evidência


Devemos sempre lembrar que medicina baseada em evidências não é copiar a conduta testada como via de regra em todos os pacientes. Medicina baseada em evidências é tomar decisão individualizada, norteada pelo conceito científico apresentado no trabalho. Em outras palavras, este estudo não significa que a partir de agora existe uma regra universal que nos obriga a manter o Clopidogrel por mais de um ano em todos os pacientes. Temos que individualizar.

Primeiro, a pergunta e o desenho do estudo se referem a indivíduos que se mostraram tolerantes à medicação durante o primeiro ano. É nesta situação que ficamos na dúvida se devemos suspender o clopidogrel, pois há um certo desconforto quando decidimos por mudar o que está dando certo. E se o paciente não tiver tido trombose por um ano justamente porque estava usando a medicação? 

Imaginemos agora um paciente que colocou um stent farmacológico, usou AAS e Clopidogrel por um ano, evoluiu sem evento hemorrágico e não tem maiores riscos de sangramento. Por que suspender a droga? Por que mudar um time que está dando certo? Neste momento, a evidência do DAPT nos norteia. Pois agora sabemos que de fato há uma perda em suspender o Clopidogrel. 

Filosoficamente, devemos perceber que um ato médico se constitui em uma nova conduta aplicada. E o ônus da prova está no ato médico. Em pacientes que vêm dando certo com  clopidogrel, o ato médico é a suspensão da droga. Agora sabemos que a suspensão traz uma certa perda de benefício (ou malefício) ao paciente. Embora não seja panacéia, quase nada em medicina o é. Dentro desta perspectiva, este é não é um benefício irrelevante. Inclusive se assemelha ao benefício do clopidogrel no clássico estudo CURE.

Erradamente, depois do CURE, Clopidogrel virou receita de bolo em pacientes com síndromes coronarianas agudas sem supradesnível, independente de risco coronário (baixo, moderado ou alto) e independente do risco de sangramento. Diferente disso, por estarmos em um momento mais amadurecido, acho que a evidência do DAPT será melhor aplicada na prática. 

A tendência de manter a droga deve ser contextualizada com a preferência de nosso paciente. Há pacientes que preferem correr um pequeno risco (1/38) para tomar menos medicação e reduzir o risco de complicações. Há pacientes que desejam que todos os procedimentos sejam realizados para reduzir seu risco coronário.

Isto demonstra que evidência e julgamento clínico se complementam, porém cada parte desta tem uma função distinta. Um parte não deve antagonizar a outra.  

E onde ficam aquelas evidências que mostram a suspensão de Clopidogrel 6 meses após o stent farmacológico como algo não inferior em relação ao uso de um ano? Estas devem ser aplicadas para os pacientes com maior risco de sangramento ou aqueles que precisam fazer um procedimento cirúrgico ou aqueles que estão apresentando sangramento, mesmo que menores (incomodativos). 

DAPT parece ser contraditório em relação aos estudos de não inferioridade, mas não é, pois cada evidência deve ser aplicada da sua forma. Um estudo de superioridade (DAPT) existe para justificar uma conduta com base em seu benefício (usar clopidogrel mais prolongado reduz risco). Um estudo de não inferioridade existe para justificar uma conduta com base em uma vantagem adicional, que não está relacionada a sua eficácia. Neste caso a vantagem seria reduzir o risco de sangramento. 

Portanto, após um ano de clopidogrel, caso nosso paciente não tenha tido problema de sangramento e seja de baixo risco para o uso da droga, devemos avaliar a possibilidade de oferecer um benefício adicional mantendo a medicação. Mantenho um esquema que vem dando certo.

O caso do uso prolongado de clopidogrel é um bom exemplo de interação da arte médica (julgamento clínico) com evidência científica. No paradigma da medicina baseada em evidências, excelentes médicos são aqueles capazes de acoplar o conhecimento científico com o julgamento clínico (princípio da complementaridade); bons médicos olham apenas evidências, sem exercer o raciocínio de individualização; maus médicos fazem o que querem, baseados em suas crenças ou interesses, em detrimento de evidências. 

------------------------------------------------------------------------------------------------------------------------





Complementos

Questão complementar I: afinal, se não suspendermos após 1 ano, por quanto tempo devemos utilizar o Clopidogrel. Uma resposta frequente seria por mais 18 meses, para completar 30 meses do protocolo do DAPT. Mas não é exatamente isso, pois aí entra um conceito importante: fazer medicina baseada em evidências não significa exatamente copiar o protocolo do trabalho. Protocolo de estudo não é o mesmo que protocolo assistencial. Essa é uma confusão comum. O protocolo do estudo é algo usado para demonstrar um conceito científico. Por que 30 meses? Por que não 36 meses? Simplesmente porque este foi o tempo escolhido pelo estudo para causar um contraste entre o grupo prolongado versus o grupo controle. Causando um contraste, o conceito foi testado. Depois disso, usaremos o conceito na prática, individualizando para o paciente. O conceito aqui provado é que o uso além de 1 ano é benéfico, mas quanto tempo faremos, depende de particularidades de nossos paciente. Alguns usarão o resto da vida, outros menos de 30 meses. 


Questão complementar II: Como interpretar o aparente aumento de mortalidade no grupo de tratamento prolongado? Em primeiro lugar, isto é um desfecho secundário, que sofre de maior risco do erro aleatório tipo I (acaso), relacionado a sua maior imprecisão, devido ao menor número de mortes. Portanto, a primeira hipótese é que isto se trata de acaso, ou seja, não podemos rejeitar a hipótese nula. Conforme explicamos no vídeo acima referido, o valor de P a ser considerado significativo quando temos múltiplas comparações deve ser o P original dividido pelo N de comparações. Considerando três os componentes do desfecho primário, o valor de P significativo deveria ser 0.025 / 3 = 0.008. Portanto a diferença de morte com P = 0.05 está longe de ser estatisticamente significante. Além disso, como o clopidogrel aumentaria a mortalidade? Pela maior ocorrência de sangramento, claro. Como a mortalidade por sangramento foi igual nos dois grupos, não foi culpa do clopidogrel. Este resultado decorrem portanto de mortes casuais (câncer, etc), que ocorreram mais no grupo clopidogrel prolongado. FDA, nem precisa “investigar” o ocorrido como estão pretendendo. Gastem seu tempo em coisas mais úteis, por exemplo, não liberando drogas com nível de evidência inadequado.

domingo, 23 de novembro de 2014

O que é análise multivariada?


Predizer ou inferir sobre causalidade são as duas grandes razões científicas de testarmos associação estatística entre variáveis. Devemos iniciar nosso pensamento definindo em qual desses dois se encaixa o nosso objetivo científico.

O funcionário da imigração americana procura identificar indivíduos que tentam entrar no país para realizar atos terroristas. Este funcionário se utiliza da regra de que todo muçulmano deve ser tratado como tal até que se prove o contrário. Este é um exemplo de predição

Um dentista observa no cotidiano profissional que pessoas disciplinadas no uso de fio dental possuem menor carga de placa bacteriana. Isto faz com que a cada dia ele acredite mais na eficácia do fio dental em causar uma melhor condição dentária. Este é um exemplo de causa.

Estes são pensamentos univariados, que demonstram a tendência natural de funcionamento de nossa mente. No entanto, essa forma de pensamento não é bem adaptada à realidade do universo, o qual se apresenta de maneira mais complexa e interessante: o mundo é multivariado.

Na análise univariada, a força associação de uma variável com o desfecho representa seu efeito total. No entanto, esse efeito total resulta do efeito  direto e do efeito indireto da variável. O efeito indireto decorre de outras variáveis que estão associadas simultaneamente à variável preditora de interesse e ao desfecho, causando um link entre esses dois. 

Na análise multivariada, as variáveis preditoras são analisadas simultaneamente, de forma que o efeito de cada variável é ajustado para o efeito das demais. Assim, identificamos o efeito direto de cada variável na predição do desfecho, um efeito que independe de outras variáveis. A isso chamamos de associação independente.

Idealmente, o funcionário da imigração deveria utilizar um modelo multivariado, o qual considera várias características do indivíduo (sexo, país, nível educacional, aspecto físico, se é casado, se tem filhos, etc) para calcular a probabilidade de ser terrorista. Caso haja uma probabilidade acima de um ponto de corte, o indivíduo deve ser retido para investigação. Melhor do que prender todo muçulmano. Seria uma conduta baseada em uma estimativa de risco por um modelo multivariado. 

Neste modelo preditor, entrariam apenas variáveis que possuam associação independente (direta) com o desfecho. Além disso, o peso da presença de cada característica na probabilidade do desfecho é dado com base neste efeito direto da variável. Daí a importância de se utilizar análise multivariada na construção de modelos preditores.

Idealmente, o dentista deveria entender que o mundo a nossa volta é repleto de fatores de confusão, que geram ilusão de causalidade, quando na verdade estamos diante de associações indiretas. Fatores de confusão são aquelas variáveis associadas simultaneamente ao preditor e ao desfecho. Assim, elas conectam o preditor e o desfecho, porém esta conecção não representa um link de causalidade.

Neste caso, um modelo científico adequado precisaria avaliar se menor carga de placa bacteriana em pessoas que usam fio dental decorreria de uma melhor escovação (pessoas mais disciplinadas) ou diretamente do uso de fio dental. Um modelo que ajustasse para o efeito de confusão da escovação, que provavelmente é de melhor qualidade nas pessoas que usam fio dental. Percebam que escovação não é uma forma através da qual o fio dental funcionaria. Portanto, a ligação que escovação promove entre fio dental e desfecho não faz parte de um link de causalidade, é apenas um efeito de confusão.

Observem que tanto na criação de um modelo preditor quanto na avaliação da causalidade, é importante a identificação de associação independente entre variável preditora e desfecho. No caso do modelo preditor, essa associação direta deve ser independente de qualquer variável que possa estar intermediando a relação preditor-desfecho, pois queremos apenas colocar na fórmula preditora o efeito direto de cada variável. No caso da avaliação de causalidade, devemos ajustar apenas para variáveis de confusão, que são variáveis que intermediam a relação preditor-desfecho, porém sem um link de causalidade. 


Predição versus Causa 


Um modelo preditor deve ser criado pelo princípio da parcimônia, onde devemos alinhar acurácia e simplicidade. Ou seja, uma variável que pouco contribui não deve ficar no modelo final. Ela torna o modelo mais complexo, sem trazer muito valor. Por outro lado, todas as variáveis que incrementam o valor preditor, devem fazer parte deste modelo final. No caso de predição, os preditores no modelo final podem, mas não precisam ser a causa do problema (fator de risco), precisam apenas identificar o problema (marcador de risco). Assim se constrói um modelo com intuito preditor. 

O modelo construído para avaliar causalidade tem um princípio diferente. Como não é predição, este modelo deve ser construído com base na lógica da causalidade. Há fatores que são fortes preditores, mas não devem estar neste modelo. Por exemplo, calcificação coronária (escore de cálcio) é um preditor independente de infarto. Porém não é o cálcio que causa o infarto, este apenas marca uma doença mais grave. Desta forma, quando queremos saber se colesterol causa infarto, não devemos ajustar para o escore de cálcio, pois este modelo deve ter apenas aqueles fatores que possuem plausibilidade etiológica.

Percebem que o estatístico não conseguiria fazer isso sem o pensamento do pesquisador? Ou seja, a construção de um modelo estatístico deve ser guiada pela pergunta científica. 

Devo salientar que não basta associação independente para garantir causalidade. A associação independente é um critério necessário, mas não suficiente. É apenas o início de um processo de inferência a respeito de causalidade.

Confusão versus Interação


Sem querer evitar o trocadilho, há muita confusão entre os conceitos de confusão e interação. Mas são coisas bem diferentes. 

Revisando mais uma vez, confusão é quanto uma variável (ou mais) intermedia uma falsa associação entre duas outras variáveis. Ajustando para esta variável de confusão, saberemos se a relação é direta entre variável preditora e desfecho. Este conceito de necessidade de ajuste para confusão por análise multivariada se aplica à construção de um modelo preditor (para evitar redundância) e também se aplica à identificação de uma variável causal (um dos critérios de causalidade é predição independente). 

Interação é diferente, bem diferente. Interação pode ser entendida como modificação de efeito

Um jogador de futebol que parece até bonzinho no time do Bahia, mas quando vai para um time europeu, torna-se um jogador de seleção. Podemos interpretar que o ambiente europeu modifica para melhor efetividade do jogador em fazer seu time ganhar. Este é um exemplo de interação entre time e efetividade do jogador. 

Interação é avaliada por análise multivariada, pois há pelo menos três variáveis preditoras: (1) efeito do jogador no resultado do jogo, (2) efeito do time (bahiano ou europeu) e a (3) interação entre eles. 

No pensamento clínico, análise de interação é importante, pois posso querer saber se uma variável prediz o desfecho de forma similar entre homens e mulheres. Ou se um fator de risco causa uma doença de forma similar entre jovens e idosos. Ou se uma droga funciona com a mesma eficácia entre pacientes de diferentes tipos. 

Resumindo



Sendo assim, análise multivariada serve para (1) criar modelos preditores; (2) avaliar a possibilidade de uma variável ser causadora do desfecho; e (3) analisar de interação. 

Há diferentes testes para análise multivariada, que variam de acordo com o tipo de variável preditora ou tipo de variável desfecho. 

  1. Regressão logística: desfecho categórico e preditores categóricos/numéricos. 
  2. ANOVA multivariada: desfecho numérico e preditores categóricos.
  3. Regressão linear múltipla: desfecho e preditores numéricos.
  4. ANCOVA: desfecho numérico e preditores categóricos/numéricos.

Espero que esta postagem tenha dado um ideia geral de análise multivariada. Resumo abaixo, os principais conceitos que devem ficar em nossas mentes ….

  1. Análise multivariada serve para construir um modelo preditor ou participar da avaliação de causalidade de um determinado fator. E a forma de construção do modelo depende dessa definição.
  2. Análise multivariada faz ajuste para co-variáveis, determinando associação independente, condição necessária para que a variável faça parte de um modelo preditor ou que seja considerada uma das causas do desfecho. 
  3. No modelo preditor, a associação deve ser independente de qualquer variável que esteja intermediando, enquanto no modelo causal, a associação deve ser independente de variáveis de confusão (link não causal).
  4. Interação não é a mesma coisa que confusão. Enquanto confusão significa uma variável X mediando a relação indireta entre duas variáveis Y e Z, interação significa uma variável X modificando uma relação entre duas variáveis Y e Z. 
Caso a mente esteja confusa, fiquem pensando no assunto e depois de dois dias releiam essa postagem. O entendimento deve vir de dentro pra fora. 

sábado, 1 de novembro de 2014

O Mito do Fio Dental


Certa feita deixei o consultório de meu dentista refletindo se aquelas recomendações de utilização do fio dental eram efetivas. Naquele momento eu nem questionava eficácia, minha dúvida residia na efetividade de uma medida tão trabalhosa, que requer intensa disciplina. Além disso, eu me perguntava a respeito da eficiência (custo-efetividade), sendo que o maior custo aqui é o tempo investido diariamente na aplicação do fio dental.

No caminho de casa, minha curiosidade foi aumentando e cheguei ao ponto de questionar a eficácia daquele lucrativa medida: há ensaios clínicos randomizados comparando fio dental versus controle? 

Ainda no carro, tentei pesquisar no iPhone, quando parado no semáforo, mas não deu tempo. Ao chegar em casa, fui direto para o computador e pesquisei no Medline: "dental floss", filtrado por "Systematic Reviews". Nem especifiquei desfecho ou populacão de interesse, dada a curiosidade. Me surpreendi, pois o primeiro artigo que me aparece é uma revisão sistemática da Cochrane, que selecionou apenas ensaios clínicos randomizados. Estes trabalhos tiveram o cuidado de incentivar a escovação em ambos os grupos.

Resultado: fio dental não reduz a placa bacteriana!!! 

Observem abaixo que foram 6 estudos que avaliaram este desfecho após 1 mês de tratamento, 5 não mostraram efeito e apenas um mostrou efeito. O efeito sumário da meta-análise mostra uma diferença média padronizada de - 0.23, porém intervalo de confiança no nível 95% envolvendo ao zero (-0.52 a 0.06). 


Três trabalhos que avaliaram 6 meses de uso de fio dental, sendo todos negativos e a diferença média padronizada da placa bacteriana não foi estatisticamente significante = - 0.06 (95% IC = - 0.23 a 0.12).




OBS: Neste ponto, vale a pena explicar o que é diferença média padronizada. Observe que aqui estamos com uma meta-análise de trabalhos que avaliam o efeito de uma intervenção em um desfecho numérico, representado por alguma (s) escala (s) de placa bacteriana. O tamanho do efeito do fio dental seria representado pela diferença entre as medias da placa bacteriana nos dois grupos. No entanto, em meta-análises pode ser que diferentes trabalhos utilizaram diferentes escalas. Sendo assim, é necessário uniformizar as escalas, para que o efeito possa ser compilado. Essa uniformização é denominada padronização (standardization), sendo feita pela divisão do valor absoluto da diferença pelo desvio-padrão daquela medida no estudo. Agora não importa mais a medida absoluta, mas sim quantos desvios-padrão um grupo difere do outro. Esta técnica também é utilizada quando o valor absoluto da escala não tem grande significado, preferindo-se a medida de quantos desvios-padrão estas diferem. De fato, para mim que não sou dentista e não entendo muito dessas medidas de placa bacteriana, fica mais fácil olhar a diferença média padronizada. Quanto esta diferença é > 0.8, considera-se uma tamanho de efeito significativo; quanto < 0.5 considera-se algo de pequena relevância.

Os resultados relativos a gengivite foram um pouco melhores. A diferença média padronizada foi - 0.71 (95% IC = -1.09 a -0.35) nos estudos de 6 meses. Conforme enfatizado em nossa última postagem, é importante avaliar os limites do intervalo de confiança, considerando a pior hipótese. Observem que embora - 0.71 possa significar um efeito moderado, o limite superior do intervalo de confiança é - 0.35, o que representa um efeito pequeno. Além disso, deve-se considerar o que diz a revisão sistemática a respeito do risco de viés dos estudos. Foram 4 estudos que fizeram essa avaliação aos 6 meses, porém 3 classificados como qualidade unclear e um como alto risco de viés. Sendo assim, fica questionável a veracidade deste achado. Vejam abaixo o forrest plot da gengivite.



Quanto à incidência de cárie, que seria um desfecho mais duro, a revisão sistemática demonstrou que não existem estudos para este desfecho. 



Desta forma, fica evidente a dissociação entre a importância dada a esta recomendação e ao nível de evidência a este respeito.

Cada vez mais me impressiono como nossa percepção do universo é influenciada por fatores de confusão. No cotidiano, dentistas de fato percebem melhores condições dentárias nas pessoas disciplinadas no uso do fio dental. Porém a questão é se a melhor condição dentária é causada pelo fio dental ou se este hábito é apenas um marcador da qualidade da escovação dentária. Para saber isso, precisamos olhar o mundo sob o filtro da observação científica. Esse filtro ajusta para fatores de confusão. A randomização garante que as pessoas em uso de fio dental sejam iguais ao grupo controle. Anula-se portanto o efeito da escovação, fazendo desaparecer o benefício do grupo fio dental, que parecia ocorrer no mundo real, porém era mediado pelo efeito de confusão de uma melhor escovação.

Exemplos como este, que mostram importante dissociação entre o que observamos no cotidiano e o que se observa em ambiente controlado cientificamente, reforçam uma das funções da ciência: discriminar entre viés e causa (a outra é discriminar entre acaso e causa). 

O problema é que a gente já chega acreditando na causalidade e utilizamos estas associações para validar nossas crenças (viés de confirmação).

Importante lembrar que estes estudos não estão testando higiene bucal versus não higiene bucal. Lembro que os dois grupos escovaram os dentes, provavelmente de forma bastante adequada. O que está se avaliando é se o fio dental tem benefício incremental à boa escovação.

E como fazer agora? Deixar de lado o fio dental? 

Minhas sugestões:

Em primeiro lugar, na próxima vez que seu dentista enfatizar a necessidade de fio dental, pergunte ele: qual o nível de evidência de sua recomendação? Caso ele vacile, seja mais específico: há ensaios clínicos randomizados comprovando a eficácia do fio dental?

Em segundo lugar, se fio dental faz parte de uma prazerosa rotina em sua vida, continue, pois acho que este hábito tem valor como parte de um cortejo de cuidado pessoal. Por outro lado, se este é um hábito difícil para você manter, relaxe e se concentre em uma boa escovação dentária.

Percebam que estudos negativos posuem grande aplicabilidade prática, nos norteando quanto à possibilidade de uma escolha individualizada.

Mas se você é um dentista que acredita firmemente na hipótese do fio dental, continue investigando, faça ensaios clínicos randomizados maiores e melhores. Mas nunca se esqueça que o ônus da prova está na demonstração do benefício. Não podemos inverter essa lógica. Para adotarmos uma conduta, o que precisa ser demonstrado é o benefício. E não demonstrar ausência de benefício para que a conduta não seja adotada.   

Quanto a mim, manterei a qualidade de minha escovação e deixarei de perseguir a utópica utilização do fio dental. Usarei quando quiser, como quiser. E os minutos que me sobram, dedicarei a algo que seja relevante. 

Quanto ao meu dentista, este é meu amigo pessoal, deve estar lendo esta postagem agora e em poucos minutos devo receber sua ligação ...

sábado, 25 de outubro de 2014

Como calcular o intervalo de confiança do NNT


Na postagem sobre o estudo PARADIGM-HF, analisamos a medida pontual do número necessário a tratar (NNT) do LCZ696. Naquela oportunidade prometi que voltaria ao assunto a fim de discutir como avaliar a precisão da estimativa do NNT. Isto é importante, pois devemos nos condicionar a avaliar não apenas a medida pontual, mas também os limites do intervalo de confiança, os quais representam a estimativa na pior e na melhor hipótese. No contexto de um ensaio clínico, isso vale para as medidas do risco relativo, hazard ratio, risco absoluto e NNT.

Normalmente, o NNT não vem descrito pelos trabalhos, o que fazemos é calcular a redução absoluta do risco (subtraindo o risco de um grupo por outro) e fazendo 100/redução absoluta do risco = NNT. 

Mas como saber o intervalo de confiança do NNT ?

Em termos de precisão, o PARADIGM-HF nos forneceu apenas o intervalo de confiança do hazard ratio. Mas o bom é que podemos usar este para chegar ao intervalo de confiança do NNT. Sabemos que hazard é diferente de risco (postagem antiga - hazard leva em conta o tempo livre do evento e não apenas o evento), mas para simplificar usarei hazard ratio como se fosse um risco relativo para o cálculo que virá a seguir. 

O risco relativo foi de 0.80, com intervalo de confiança entre 0.73 e 0.87. Desta forma, podemos calcular o intervalo de confiança da redução relativa do risco (1 - risco relativo), que fica entre 13% (1 - 0.73) e 27% (1 - 0.87). 

O segredo para estimar o intervalo de confiança da redução absoluta de risco está em utilizar a incidência do desfecho no grupo controle, como representante do que seria esperado de risco sob o tratamento usual com enalapril (risco basal). Este risco no grupo controle foi 26.5%. 

Agora, para saber a redução absoluta de risco, devemos multiplicar a redução relativa de risco pelo risco basal. Por exemplo, se eu ganhar 50% de uma herança (relativo), para saber o valor que receberei, multiplico 50% pelo valor absoluto da herança (50% x 10.000.000 = me dei bem). 

No PARADIGM-HF, a pior hipótese da redução relativa do risco é 13%. Sendo assim, na pior das hipóteses, a redução absoluta do risco será de 3.4% (13% x 26.5%).
Na melhor das hipóteses, a redução relativa do risco é 27%. Sendo assim, na melhor das hipóteses, a redução absoluta do risco será de 7.2% (27% x 26.5%).

Portanto, o intervalo de confiança da redução absoluta do risco é 3.4% a 7.2%.

Agora vamos usar esse intervalo de confiança da redução absoluta do risco para saber o intervalo de confiança do NNT: 100/3.4% a 100/7.2%. Ou seja, enquanto a estimativa pontual do NNT é de 21 (tratamento de grande impacto) e seu intervalo de confiança fica entre 14 e 29. Observem que isso é preciso, pois na pior das hipóteses o NNT seria de 29, o que se considera um benefício relevante. Se fizermos essa análise para morte, o NNT seria de 30, com intervalo de confiança entre 21 e 55. Na pior das hipóteses a redução de mortalidade seria de magnitude moderada. 

Este estudo de grande tamanho amostral nos fornece uma satisfatória precisão do NNT. Lembro que embora o NNT sugira grande magnitude, este estudo tem problema sério de aplicabilidade pois não se definiu como um estudo de prova de conceito ou pragmático (vide postagem anterior).

Percebam que para realizar essa análise, pensamos se a pior hipótese do NNT ainda seria uma número razoável. Essa é a técnica, pensar sempre na pior hipótese.

De intervalo de confiança em intervalo de confiança (RR - RRR - RAR - NNT), terminamos por encontrar o intervalo de confiança do NNT. 

Agora vamos a outro exemplo, onde a medida pontual do NNT sugere grande impacto, porém o estudo não tem precisão. 

Em postagem antiga do Blog discutimos um ensaio clínico de apenas 76 pacientes com endocardite bacteriana e vegetação grande, que foram randomizados para cirurgia imediata ou tratamento conservador (cirurgia apenas se instabilidade). O trabalho mostra que a cirurgia precoce reduz o desfecho primário combinado de morte e embolia sistêmica de 23% (controle) para 3% (intervenção) - a custa apenas de redução de embolia. Observem que isso resulta em redução absoluta do risco de 20% (23% - 3%), o que dá um impressionante NNT = 5. 

Embora esta cirurgia seja de alto risco (paciente usualmente com quadro infeccioso ainda não controlado, muitas vezes instável clinicamente), um NNT de 5 nos motivaria a aventurar esta conduta. Porém devemos nos perguntar qual a precisão deste NNT = 5 ?

Observem que o hazard ratio do estudo é 0.10 (90% de redução do hazard), porém o intervalo de confiança deste hazard ratio vai de 0.01 a 0.82. Isto indica que a redução relativa do risco (hazard) é muito imprecisa, com intervalo de confiança de 18% a 99%. O risco basal (grupo controle) é 23%. Aplicando estas reduções relativas do risco ao risco basal, encontramos que a redução absoluta do risco pode ser tão grande quanto de 22.77% (99% x 23%) ou tão pequena quanto 4,14% (18% x 23%). 

Sendo assim, este NNT = 5 tem um intervalo de confiança variando de 4 (100/23) a 25 (100/4). Ou seja, é muito impreciso. E considerando a possibilidade de um NNT = 25 para prevenir um evento embólico (sem reduzir mortalidade), ficamos muito na dúvida se devemos arriscar complicações advindas de uma cirurgia em momento não ideal. Este é um exemplo de estudo pequeno não garantindo precisão suficiente do NNT.

Uma das utilidades de meta-análises é obter um intervalo de confiança do RR mais estreito e permitir melhor precisão do intervalo de confiança do NNT. Da mesma forma que os artigos, as meta-análises não trazem este dado, mas podemos calcular pelo intervalo de confiança do RR e pela medida basal do risco demonstrado da meta-análise.

Desta forma, fica a mensagem de que não devemos nos limitar à interpretação da medida pontual do NNT. Devemos ir além e interpretar o intervalo de confiança desta medida. Esta postagem teve o propósito de mostrar como fazer este cálculo (intervalo de confiança RR → RRR → RAR → NNT).



* Para análise de magnitude de efeito quando o desfecho é numérico, acesse esta postagem do Blog H1 Estatística

quarta-feira, 22 de outubro de 2014

Em que candidato a Medicina Baseada em Evidências votaria?


Se a medicina baseada em evidências fosse uma pessoa, ela procuraria para eleger um candidato que reconhecesse a incerteza de suas propostas. Isso mesmo, pois ciência é em primeiro lugar reconhecer as incertezas, fazer as perguntas certas e procurar responder estas questões com base em experimentação. 

A medicina baseada em evidências votaria no candidato que entendesse a complexidade dos problemas, considerasse que soluções criadas com base em lógica são incertas, e propusesse ensaios que comparassem estratégias. Por exemplo, o problema da saúde. Um candidato científico apresentaria três possíveis soluções, que seriam alocadas em diferentes cidades por processo de randomização em cluster. As estratégias seriam avaliadas quanto à melhora de um desfecho primário definido de forma objetiva o suficiente para evitar o viés político de aferição. Após identificada a estratégia de melhor eficácia, esta seria implementada nas demais regiões do país. Claro que neste processo o governo deveria avaliar aplicabilidade, ou seja, até que ponto aquela evidência aplicada a uma cidade terá o mesmo resultado em outra cidade. Avaliaria eficácia e efetividade. Seria um governo embasado em evidências. 

A medicina baseada em evidências também votaria em um candidato cuja equipe realizasse revisões sistemáticas de relatos bem e mal sucedidos, procurando gerar fontes secundárias de evidências que norteariam suas ações.

A medicina baseada em evidências votaria em um candidato que utilizasse o paradigma da racionalidade, do less is more, concentrando os recursos disponíveis em medidas de maior custo-efetividade e utilidade.

O problema é que parece não existir este candidato. Incertezas nunca são reconhecidas, propostas são feitas de forma presunçosa, promete-se tudo e mais um pouco de forma demagógica, nunca sendo mencionada a racionalidade das escolhas, a boa aplicação dos sempre finitos recursos.

Na ausência de preditores de um governo embasado em evidências, ficamos em território de incerteza de qual seria o candidato ideal. Reconhecendo esta incerteza, a solução seria randomizar uma amostra de Brasis para Dilma ou Aécio, verificando o resultado de cada um dos candidatos em desfechos duros, tais como os parâmetros relacionados à educação, saúde, corrupção, infraestrutura. Porém não temos uma amostra de vários Brasis. Temos apenas um Brasil. 

Daí me ocorreu a solução de realizar um ensaio clínico do tipo N = 1. Em certas circunstâncias, este é um desenho aceitável, aplicável quando precisamos de uma evidência para um paciente em particular, sendo este o mesmo paciente a ser testado no experimento. Em ensaios clínicos N = 1, uma primeira estratégia é implementada (estratégia A), depois trocada pela estratégia B, comparando-se o momento do paciente quando estava com a estratégia A versus B (desenho quasi-experimental - antes e depois). Imaginem dois analgésicos oferecidos desta forma a um paciente, sendo que o analgésico que melhor sedou a dor seria o escolhido par uso crônico.

Lembra alguma coisa? Sim, lembra o Brasil que tem problemas crônicos e já realizou a primeira etapa do ensaio N = 1. Caso julguemos que o país está indo bem, torna-se dispensável transitar para a estratégia B. Caso julguemos que o problema clínico persiste, devemos prosseguir o ensaio clínico e cruzar as estratégias. É uma questão de julgamento.

Assim faria a medicina baseada em evidências se ela fosse um eleitor.

A mente científica não vota com base em fanatismo ou crença. Não permite que vieses de confirmação nos façam cegos em relação a qualquer um dos lados. Evita um mundo de fantasia, reconhece a incerteza de nossas impressões, sabe que nossa percepção tende a ser enviesada por nossos preconceitos.