sexta-feira, 7 de outubro de 2016

A Ilusão de Interação: Estudo DANISH




Em termos epidemiológicos, interação significa modificação de efeito. Este conceito é muito usado para avaliar se o efeito de um tratamento muda quando mudamos o tipo de paciente. Por exemplo, um tratamento reduz mortalidade em homens, porém não funciona em mulheres. Seria a interação entre gênero e tratamento. O gênero modifica o efeito do tratamento na mortalidade.

Interação é um fenômeno estatístico que permeia nossa vida cotidiana. Messi joga bem no Barcelona, mas não tão bem na seleção argentina. Isso é interação entre time e Messi. O time em que ele está jogando modifica o efeito de Messi no desfecho do jogo.

Embora interação na vida comportamental seja bastante comum, aí vai uma novidade usualmente incompreendida: interação quanto ao efeito de condutas médicas é um fenômeno raro. Essa raridade está demonstrada por revisões sistemáticas e análises de subgrupo feitas em diversos tratamentos. Por exemplo, a interação entre gênero e tratamento que citei acima “nunca” acontece em análises de subgrupo de ensaios clínicos.

A percepção da raridade deste fenômeno não está suficientemente presente na mente médica, promovendo interpretações erradas de evidências científicas ou raciocínios incorretos quanto à sua aplicabilidade. É o que chamei no título desta postagem de “ilusão de interação”.

Este foi o caso da interpretação do recém publicado estudo DANISH (Congresso Europeu de Cardiologia e New England Journal of Medicine), que frustou expectativas quando não demonstrou menor mortalidade em pacientes submetidos ao desfibrilador implantável (CDI), achado considerado por muitos diferente de estudos mostraram eficácia em amostras que tinham pacientes com miocardiopatia isquêmica. Seria interação entre tipo de miocardiopatia e CDI. O tipo de miocardiopatia modificaria o efeito do CDI na mortalidade. 

Manchete no site do Medscape afirmou The DANISH Trial Delivers a Shock of Humility, conotando que fomos presunçosos ao pensar que poderíamos atribuir o benefício do CDI a pacientes com miocardiopatia não isquêmica. Já o site do TCC afirma categoricamente "CDI não reduz mortalidade em pacientes com miocardiopatia não isquêmica". Tudo equivocado.

O DANISH não passa de uma “ilusão de interação”. Explicarei em seguida e no final discutirei como essas ilusões prejudicam o raciocínio baseado em evidências. 



O Estudo Danish e a Ilusão de Interação 

O DANISH trial randomizou 1.116 pacientes para CDI ou controle, tendo como desfecho primário mortalidade total. A mortalidade no grupo CDI foi 21.6%, comparado a 23.4% no controle, sem diferença estatística (P = 0.28; HR = 0.87, 95% IC = 0.68 - 1.12). Desta forma, foi um estudo negativo. 

Estudos prévios que, diferente do DANISH, incluíram pacientes com miocardiopatia isquêmica mostraram benefício do CDI profilático, como o MADIT II (apenas miocardiopatia isquêmica), COMPANION e SDC-HeFT (misturam miocardiopatia isquêmica e não isquêmica). À primeira vista, se compararmos o resultado negativo do DANISH (só miocardiopatia não isquêmica) com estes outros estudos, poderíamos pensar que CDI tem benefício na miocardiopatia isquêmica e não na miocardiopatia não isquêmica (interação). Foi o que os diversos comentários a respeito do estudo sugerem que a maioria pensou.

Mas se temos em mente que o fenômeno de interação é raro, nos tornamos mais céticos em relação a esta interpretação e devemos avaliar se outros fenômenos (que não interação) seriam responsáveis por essa aparente heterogeneidade entre os estudos.

Que outros fenômenos? O que o desfibrilador faz é salvar pacientes de morte por arritmia, portanto a detecção de seu efeito depende do número das mortes por arritmia que ocorrem dentro do desfecho primário de morte geral. 

Vamos comparar o número de mortes por arritmia do DANISH com o número do SCD-HeFT, por exemplo. Enquanto no SCD-Heft 57% das mortes do grupo controle decorreram de arritmia (95 mortes), no DANISH apenas 35% das mortes do grupo controle foi decorrente de arritmia (46 mortes). Além disso, o desfecho primário de morte geral foi muito mais numeroso no SCD-Heft (no grupo controle, 244 mortes no SCD-HeFT x 131 mortes no DANISH), devido ao maior tamanho amostral, que deu um poder estatístico maior. 

Portanto, a diferença do DANISH para os demais estudos positivos pode estar no poder estatístico. Na verdade, o estudo não comprova que o CDI não funciona para pacientes sem miocardiopatia isquêmica. O CDI pode funcionar igual, porém esses pacientes precisam menos de CDI, o que implicaria em um estudo maior para demonstrar benefício.

Tenho dito que desfechos secundários não servem para comprovar eficácia, nem para contrariar um desfecho primário negativo, mas servem para explicar o resultado no desfecho primário. Observem que o desfecho secundário de morte por arritmia foi significativamente menor do grupo CDI, comparado ao controle (4.3% vs. 8.2%; P = 0.005), sugerindo que o CDI funciona para prevenir morte súbita. O problema é que esse tipo de morte é menos frequente em quem não tem tanta fibrose pós-infarto, portanto precisaríamos de um estudo maior para detectar diferenças com menor grau de incerteza.



Como Testamos Interação?

Interação é testada de duas formas: nas análises de subgrupos de ensaios clínicos ou nas análises de heterogeneidade e sensibilidade de meta-análises. 

Um importante dado que corrobora com meu raciocínio é a análise de subgrupo do SCD-HeFT, que mostrou “idêntica” redução de mortalidade total pelo CDI nos grupos de miocardiopatia isquêmica e não isquêmica. Não houve interação (P = 0.68) e o hazard ratio do tratamento foi bem parecido nos dois grupos. 

OBS: P < 0.05 significaria interação presente, portanto P = 0.68 indica ausência de interação.



O mesmo ocorreu no estudo COMPANION, cuja análise de subgrupo mostrou o mesmo efeito do CDI nos diferentes tipos de miocardiopatia. 

Considerando que os efeitos intrínsecos dos tratamentos tendem a ser reprodutíveis em diferentes populações e observando as análises de subgrupo do SCD-HeFT e COMPANION, podemos dizer que já sabíamos que o CDI funcionava em pacientes com miocardiopatia não isquêmica. O que o DANISH nos traz de novo é a informação de que estes pacientes morrem menos de arritmia, portanto precisam menos desse eficaz device contra morte arrítmica. O DANISH não nega o efeito do CDI neste tipo de paciente. 

Precisamos assim diferenciar entre o efeito do tratamento e o quanto uma população precisa do tratamento.

Na verdade, o DANISH é um estudo desnecessário para demonstrar o que ele não conseguiu demostrar. Mas porque fazer um estudo desnecessário? Em minha mente conspiradora, estudos desnecessários servem para que seu resultado previsivelmente positivo induza médicos a  prescrever o tratamento. Mesmo previsível, o DANISH falhou.

((Prometi em postagem prévia falar porque o HOPE-3 braço estatina foi um estudo desnecessário (muitos já haviam me cobrado por esta promessa não cumprida, agora vai). Este estudo mostrou que estatina em pacientes de risco intermediário e colesterol baixo tinham benefício. Mas isso já estava demonstrado em pacientes de risco alto com mesmo valor de colesterol. Pela regra de ausência de interação, já sabíamos que haveria efeito em pacientes de médio risco, só precisamos de um estudo gigante para demonstrar isso, como o HOPE-3. Mas se já sabemos, porque fazer um estudo gigante? Porque o efeito de marketing de um estudo positivo é grande, de acordo com minha mente conspiradora. Os médico ficam induzidos pela positividade do estudo a adotar a terapia, sem reconhecer que para um mesmo efeito intrínseco, o efeito concreto do tratamento é menor em pessoas de risco mais baixo. Explicarei melhor abaixo)).

Agora vamos explicar a outra forma de se testar interação: meta-análises. Estas avaliam heterogeneidade entre estudos, que representa o quanto os resultados de diferentes estudos se diferenciam além do acaso. Provavelmente uma meta-análise (acho que vou fazer isso, quem quiser pode se voluntariar como co-autor) não mostraria heterogeneidade entre estudos que incluíram miocardiopatia isquêmica e o DANISH. Como provavelmente o DANISH foi negativo por falta de poder estatístico (erro aleatório tipo II), a diferença entre este e os outros estudos não superariam o acaso. Outra coisa que meta-análises podem fazer é análise de sensibilidade, onde se usa o teste de interação. Seria a avaliação da interação entre o tipo de população do estudo e o efeito do tratamento. Esta seria negativa, tal como as análises de subgrupo dos estudos individuais mostraram neste caso (SCD-HeFT e COMPANION).



Interação de Risco Relativo versus Risco Absoluto

Importante notar que o teste de interação deve utilizar as medidas relativas de risco (risco relativo ou hazard ratio ou odds ratio) e não redução absoluta de risco. Isto porque a propriedade intrínseca do tratamento é representada pelas medidas relativas, que tendem a ser constantes nos diferentes estratos de risco absoluto. 

Quando falamos que interação um fenômeno raro, estamos nos referindo à propriedade intrínseca do tratamento (risco relativo), que graças a Deus tem sua estabilidade (constante em diferentes estratos de risco), pois nunca teremos um estudo para cada tipo de paciente.

Claro que se analisássemos interação utilizando redução absoluta de risco ou NNT, esta daria significativa quase sempre, pois estas medidas sempre variam com o risco basal do paciente. Ou seja, para uma mesma redução relativa (efeito intrínseco do tratamento), pacientes de alto risco terão um melhor NNT do que pacientes de baixo risco (efeito concreto do tratamento). 

Esse é o grande valor das medidas relativas. Embora as medidas absolutas (RAR e NNT) representem de forma mais concreta o benefício que um paciente recebe, estas são particulares do tipo de paciente. Por outro lado, as medidas relativas raramente têm interação, sendo constantes nos diferentes tipos de paciente. 

Portanto, enquanto o risco absoluto representa efeito concreto do tratamento em cada tipo de indivíduo (estrato de risco), o risco relativo representa a propriedade intrínseca do tratamento, que tende a se reproduzir em qualquer tipo de indivíduo.

Resumindo, as medidas relativas (RR, HR) descrevem o efeito tratamento, enquanto as medidas absolutas (RAR e NNT) descrevem o paciente que recebe o tratamento. 

(Isso se parece com o conceito de acurácia diagnóstica, em que sensibilidade e especificidade não variam com prevalência de doença, enquanto valores preditivos variam com prevalência de doença. Sensibilidade e especificidade estão para risco relativo, assim como valor preditivo está para risco absoluto).


Os Princípios da Medicina Baseada em Evidências

Este raciocínio de estabilidade do risco relativo dá suporte a dois de nossos “princípios da medicina baseada em evidências”. O Princípio da Prova do Conceito diz que MBE não é copiar artigo científico. É utilizar uma prova de conceito como norte para uma decisão individualizada. O norte é a redução relativa do risco. Utilizando deste norte, aplicamos esta redução no risco basal de nosso paciente, identificando qual a redução absoluta de risco proporcionaremos  a este paciente em particular (impacto concreto). Por exemplo, sei que anticoagulação oferece 60% de redução relativa do risco. Utilizo um escore CHADS, identifico que o risco de AVC de meu paciente é 3%. Reduzir 60% de 3% = 1.8% de redução absoluta de risco (NNT = 100/1.8 = 56).

O segundo princípio respaldado por nossa discussão é o Princípio da Complacência, o qual aponta que podemos aplicar evidências de boa qualidade em pacientes diferentes da amostra do estudo, desde que não haja uma grande razão para se acreditar que o efeito será outro. É o uso de uma evidência indireta quando usamos um tratamento em um indivíduo de 70 anos, mesmo que a média de idade do ensaio clínico tenha sido 55 anos. Isso é embasado na raridade do fenômeno de interação

A falta de percepção de que este fenômeno é raro leva a uma postura caricatural da medicina baseada em evidências, na qual não podemos aplicar o tratamento a quase ninguém, pois todo mundo é um pouco diferente da amostra do estudo, nem podemos calcular um NNT individual com base na propriedade intrínseca do estudo. 

Em que Situações Surge Interação ?

Embora interação seja um fenômeno raro, esta pode se fazer presente em duas situações. 

A primeira é quando estamos medindo um desfecho composto de benefício e malefício. O benefício representa a consequência intencional (benefício intrínseco, constante), mas o malefício representa um conjunto infinito de intercorrências que podem acontecer, cada uma com seu risco relativo particular. Sendo assim, diferentes populações podem ter predileções por diferentes complicações, o que faz com que risco  relativo de efeito adverso possa ser variável em diferentes tipos de paciente.

Vejam o exemplo de morte total em pacientes submetidos a cirurgia de revascularização miocárdica. Avaliando os componentes da morte total, o beneficio relativo na redução de morte cardiovascular é estável, porém o aumento relativo da morte por complicações pode variar. No lado do benefício, todos têm doença isquêmica, portanto a redução relativa de morte cardiovascular é constante. Mas no lado do malefício, digamos que apenas alguns têm DPOC. Claro que nestes o aumento relativo de morte por complicação respiratórias será maior. É um sistema mais vulnerável a esta complicação. Ao combinar os dois tipos de morte em morte total, esta vai variar de acordo com DPOC. Neste caso, a redução redução relativa do risco de morte total será variável, porém a culpa será da complicação e não do benefício (que é constante).

O segundo motivo pelo qual a redução relativa pode variar é quando a magnitude do problema que será combatido pelo tratamento varia. Por exemplo, o benefício intrínseco de uma sutura para reduzir sangramento será maior se a ferida for maior. Ou o benefício da limpeza de ouvido na melhoria da audição será maior na medida em que o paciente tem mais cera do ouvido. Ou uma cirurgia de revascularização pode ser mais benéfica em termos relativos no triarterial do que no uniarterial. Discutimos recentemente a evidência do estudo IMPROVE-IT, que estudou pacientes de colesterol bastante baixo e mostrou uma redução relativa de risco (verdadeira) pífia com uso de estatina. Portanto, o risco relativo pode variar com a magnitude do problema intermediário (ferida, cera, obstruções, colesterol) que será corrigido pelo tratamento para obter um ganho clínico (reduzir sangramento, melhorar audição, reduzir infarto). 

Mas não devemos generalizar essas situações e achar que a redução relativa do risco varia com o risco basal ou com o mecanismo básico do problema (miocardiopatia isquêmica ou dilatada).

Conclusões

O estudo DANISH não serve para negar o efeito do CDI em miocardiopatia não isquêmica. Serve para mostrar que estes pacientes morrem menos de arritmia, portanto terão um beneficio absoluto menor do que pacientes que morrem mais de arritmia. Este estudo não precisava ser realizado, mas serve para nos lembrar de ser mais seletivos na indicação de CDI para pacientes com miocardiopatia não isquêmica. Por outro lado, considerando a raridade do fenômeno de interação, se encontramos um paciente com miocardiopatia não isquêmica, porém com alto risco para morte súbita, o CDI deverá ter um benefício absoluto maior e a indicação deve ser considerada.

Importante valorizar medidas relativas de risco como representantes do efeito intrínseco dos tratamentos, propriedade generalizável para diferentes tipos de pacientes, devido à raridade do fenômeno de interação.

Tenho a impressão que nossa mente superstima a probabilidade de interação terapêutica, pois interações humanas, sociais ou comportamentais são comuns. A depender do ambiente em que estamos ou com quem estamos, modificamos nosso comportamento. Porém um tratamento não é assim, na verdade requer condições especiais para conseguir modificar seu efeito. Tratamentos tem propriedade mais estáveis do que comportamentos humanos. 

OBS: Vocês devem ter notado que fui bastante repetitivo e insistente em algumas frases. Não foi um estilo literário, apenas uma estratégia didática. 
_______________________________________________________________________

Objetivos Didáticos da Postagem

1. Conceito de interação
2. A propriedade constante do efeito intrínseco dos tratamentos
3. Como avaliar interação (subgrupos e meta-análises)
4. Excessões em que interação se faz presente.
4. Risco Relativo e Risco Absoluto




5 comentários:

  1. Professor, e no caso de estatinas e insuficiência renal?

    ResponderExcluir
  2. Como sempre..... excelente análise do DANISH com a devida interpretação da interação .
    Grande abc .

    ResponderExcluir
  3. Relendo a postagem ....
    Luis , como o cálculo do tamanho amostral pode ter causado esse erro Beta ( falta de poder estatístico por pouco desfecho ) , se tivesses incluído na análise de subgrupo % de fibrose por RNM , poderiam encontrar interação ?....
    Ou se aumentassem o tamanho amostral já seria suficiente para corrigir esse provável erro tipo II ? Evitando assim indicar como rotina RNM para toda MCP não isquemica .

    ResponderExcluir
  4. Parabéns pelo texto. Muito didático e objetivo. Seria muito bom todos os médicos aprenderem este tipo de interpretação.

    ResponderExcluir
  5. Parabéns professor. Muito bem escrito seus comentários. Compartilho da mesma idéia.

    ResponderExcluir