sábado, 1 de setembro de 2012

Devemos congelar pacientes? – O Mito da Hipotermia na Parada



Texto escrito por Luis Correia e Márcia Noya

Nos últimos anos, temos experimentado um crescente entusiasmo pela terapia de hipotermia após reanimação cardio-respiratória. Uns mencionam que esta conduta é recomendada pelo ACLS, outros lembram do impressionante número necessário ao tratar de 6 para prevenir uma morte, alguns consideram a adoção desta conduta um marcador de qualidade em unidades de tratamento intensivo.

Paradoxalmente, percebemos que este não é um tratamento implementado na maioria das UTIs do Brasil. Então, das duas uma: ou somos muito incompetentes ao ponto de deixar de implementar uma terapia com NNT de 6; ou na verdade a hipótese nula da ausência de benefício não foi rejeitada pelas evidências atuais.

Para esclarecer qual das duas alternativas é a verdadeira, precisamos fazer uma análise das evidências que testaram a hipótese de que “congelar” pacientes traz benefícios neurológicos e preservam vida.

Assim, temos que voltar no tempo até fevereiro de 2002, quando o New England Journal of Medicine publicou simultaneamente dois ensaios clínicos com resultados positivos a favor do benefício da hipotermia, um trabalho austríaco e outro australiano. O primeiro com (pasmem) apenas 77 pacientes e o segundo com (pasmem) apenas 275 pacientes pós-parada. Analisaremos estes trabalho de acordo com os critérios indicados na série de postagens sobre análise crítica de evidências sobre terapia. Há ainda dois trabalhos menores (2001 e 2012), os quais não mencionarei nesta postagem por questão de espaço e porque estes não mudariam nosso raciocínio.

Efeito de Confusão

Sabemos que o ideal é a randomização para os grupos tratamento ou controle, pois desta forma não há tendenciosidade da escolha da conduta, o que torna os grupos semelhantes em características clínicas, reduzindo a possibilidade de efeito de confusão como explicação do resultado. O estudo australiano (o menor deles) de fato randomizou (sorteou) pacientes para tratamento ou controle. A despeito do pequeno tamanho amostral, esta randomização foi suficiente para tornar os dois grupos semelhantes, tal como demonstrado na tabela de características clínicas do estudo.

Por outro lado ... embora o estudo austríaco tente nos induzir a achar o contrario, este não foi um estudo randomizado. Os autores descrevem patients were randomly assigned to hypothermia or normothermia according to the day of the month, with patients assigned to hypothermia on odd-numbered days”. Esta é na realidade uma frase paradoxal, pois este não se constitui em um método (aceitável) de randomização. Randomização pressupõe imprevisibilidade para qual grupo o paciente será alocado. Esta imprevisibilidade previne tendenciosidade na alocação de pacientes menos graves para o grupo tratamento. Percebam. Se hoje é dia ímpar, o paciente será alocado para o grupo “congelamento” caso este seja incluído no estudo. Sabendo disso, podemos não incluir no estudo pacientes de pior prognóstico em dias ímpares, sendo mais liberais na inclusão de pacientes em dias pares. Esse processo (mesmo que inconsciente) promove uma maior possibilidade de fatores de confusão explicando os resultados. E foi justamente este estudo que não mostrou uma tabela completa comparando características clínicas entre os dois grupos. A tabela se limitou basicamente a dados da reanimação.

Sendo assim, um dos dois estudos pode ter sofrido de um processo de alocação não randomizado. Fico a me perguntar o que custava sortear o paciente na chegada; por que a escolha desse questionável método de alocação? Será que nos dias pares uma equipe melhor preparada ficava de sobreaviso para implementar a hipotermia? Isso seria outro viés, um viés de qualidade da equipe.

Viés de Aferição

Embora ambos os estudos descrevem que avaliação do desfecho neurológico tenha sido realizada por um pesquisador cego em relação à alocação do tratamento, não podemos considerar este um estudo cego. Do ponto de vista do paciente, pode até ser cego, pois o mesmo estava em coma. No entanto, toda a UTI sabia que o paciente estava sendo resfriado. Mesmo que o médico que avaliou o desfecho não soubesse, pode ser que a alocação aberta para um tratamento complexo e experimental como hipotermia tenha promovido mais grau de atenção e cuidado para este paciente, em comparação ao paciente que recebeu o tratamento monótono e usual que todos sempre recebem. Mesmo que não seja possível cegar o tratamento neste caso, um esforço especial deveria ser feito para que o tratamento do grupo controle fosse tão bom quanto o grupo hipotermia. Em ambos os trabalhos parece que isto pode não ter ocorrido. Na verdade, a média de temperatura do grupo controle foi acima de 37oC em ambos os estudos. É como se houvessem comparado “febre” versus hipotermia, e não normotermia versus hipotermia. Mesmo que esta "febre" não tenha influenciado diretamente no desfecho, esta representa um marcador de que este grupo não foi tratado com excelência. Por outro lado, toda a atenção necessariamente dispensada aos pacientes “congelados” possivelmente promoveu um tratamento excelente qualidade.

Observe que isto gera um viés de aferição. Devidos a estes mecanismos, o que pode ter sido aferido não foi o efeito da hipotermia, mas sim a excelência de tratamento recebido por estes pacientes. Não podemos garantir que isto não ocorreu.

Acaso

Quando identificamos um valor de P estatisticamente significante, consideramos que a probabilidade da diferença observada ocorrer se a hipótese nula for verdadeira é muito pequena. Por isso rejeitamos a hipótese nula e passamos acreditar na diferença encontrada. No entanto, a validade do valor de P depende também do poder estatístico do estudo. Ou seja, em um estudo positivo a despeito de reduzido poder estatístico, o valor de P pode ter aparecido estatisticamente significante por acaso.

A explicação disto está no fato de que quando o tamanho amostral é muito pequeno, uma diferença muito grande entre os dois grupos é necessária para que se consiga significância estatística. Diferença tão grande que se torna inverossímil. Diferença tão grande que mais provavelmente decorreu do acaso. Por isto que quando o poder estatístico é insuficiente, o valor de P tende a subestimar o acaso. Ou seja, o acaso pode ter ocorrido, apesar do valor de P < 0.05.

Não é que o cálculo do valor de P esteja errado. É porque do ponto de vista de uma análise qualitativa, a observação tem mais proximidade com a possibilidade do acaso. Por exemplo, se uma coisa absurda acontecer, com um valor de P = 0.01, é mais provável que a coisa caiu exatamente no 1% dos resultados extremos com a hipótese nula verdadeira, do que se a coisa não fosse absurda. Este é um pensamento sutil, mas muito verdadeiro.

Desta forma, se faz necessário que o estudo tenha um poder estatístico para detectar uma diferença predeterminada entre os grupos e que esta diferença seja razoável.  Em nenhum dos dois trabalhos isso ocorreu. Enquanto o estudo austríaco não descreveu cálculo do tamanho amostral, o estudo australiano calculou um tamanho amostral que dá um poder de 80% para detectar uma diferença sem precedentes em nenhum estudo sobre terapia, ou seja, uma diferença absoluta de 36%. É muito otimismo, isso é irreal.

Viés de Publicação

O fato de que o resultado positivo ocorreu simultaneamente em dois estudos independentes, feitos em diferente locais do mundo, nos induz a pensar que de fato o efeito benéfico observado deve ser verdadeiro. Isso seria verdade se apenas estes dois estudos fossem os que tivessem sido realizados em todo o universo. E nesse momento entra o viés de publicação.

Sabemos que isso não é verdade, ou seja, outros estudos devem ter sido realizados. Imaginem 30 estudos, em diferentes locais do mundo, todos de pequeno tamanho amostral, tal como os que estamos discutindo. Agora imaginem que a hipótese nula é verdadeira, ou seja, que na verdade hipotermia não serve para nada. Neste contexto, consideremos que 28 destes estudos mostram o resultado correto, ou seja, semelhança entre os grupos. E dois destes estudos mostram resultado positivo, meramente por acaso. Neste contexto, os dois estudos positivos possuem maior probabilidade de serem aceitos para publicação em revistas de impacto do que os 28 que mostram resultados negativos. Além disso, muitos dos estudos de resultados negativos nem mesmo são escritos ou submetidos para publicação pelos autores. Isso promove um viés de publicação a favor de estudos positivos.

O viés de publicação é um fenômeno inerente de estudos pequenos, geralmente unicêntricos. Grandes estudos multicêntricos são publicados, mesmo quando negativos. Mas os estudos pequenos ficam mais vulneráveis a este fenômeno. Isso ocorre devido à dificuldade de publicar um estudo pequeno. Assim, estes estudos precisam ser pelo menos positivos, para atrair a atenção de revisores e editores para a aceitação do artigo.

O viés de publicação vem de nossa inadequada tendência a valorizar mais dados positivos do que dados negativos, como retratado na frase de Francis Bacon: "It is peculiar and perceptual error of the human understanding to be more moved and excited by affirmatives than negatives."


Crendice versus Ciência

Já comentei previamente neste Blog o problema da mente crente. Por questões evolutivas, nossa mente tende a acreditar mais em dados positivos do que em dados negativos. Corroborando com a mente crente, temos a mentalidade do médico ativo, onde nos sentimos mais úteis, melhores médicos, se adotarmos condutas novas e interessantes, em detrimento do pensamento científico.

São muitos os que argumentam insistentemente de que precisamos fazer coisas sem evidências, pois não há evidência para todo tipo de conduta. Chegam a estragar a inteligente frase “ausência de evidência não é evidência de ausência”, quando a utilizam para sofismar a favor da adoção de terapias sem base científica. Aplicar esta frase como justificativa para adotar uma terapia é inadequado. Esta frase foi criada no contexto de que certos estudos negativos podem não ser definitivos. Neste caso, a frase está estimulando estudos futuros, com maior poder estatístico, por exemplo. Mas a idéia da frase não deve ser usada na tomada de decisão clínica, permitindo a adoção de condutas incertas.

Esta  discussão está no cerne dos princípios da medicina baseada evidências, já colocados inúmeras vezes em postagens deste Blog. Primeiro, devemos avaliar se o caso corresponde a uma situação de plausibilidade extrema, o princípio dopára-quedas. São situação óbvias, que não devem requerer um ensaio clínico para confirmar a idéia. É a efetividade do pára-quedas na prevenção de morte durante salto livre de uma avião em pleno vôo; o caso do diurético no edema agudo de pulmão; insulina no diabético tipo I; laparotomia em indivíduo baseado no abdômen. Se estamos diante de plausibilidade extrema, devemos adotar a conduta, pois nunca existirá um estudo para testar esta hipótese, porque estes estudos seriam desnecessário e anti-éticos.

As demais situações, que correspondem à maioria da terapias em medicina, partem do princípio da equipoise, ou seja, quando há uma dúvida suficiente para justificar um estudo controlado, onde parte dos pacientes não adotem a terapia. Nestas situações devemos partir do princípio da hipótese nula, onde a premissa é de ausência de benefício, e quando surgem evidências suficientes, rejeitamos a hipótese nula e ficamos com a hipótese alternativa de que a conduta deve ser adotada.

Mas qual seria o prejuízo de preferir preferir o princípio da crendice, em detrimento da hipótese nula?

Primeiro, muitas terapias cuja expectativa é de serem benéficas, podem na verdade ser maléficas. Muitos são os exemplos na literatura em que o princípio da crendice foi utilizado, a terapia foi adotada e depois descobriu-se que a coisa era maléfica, sendo a conduta suspensa: a adoção de terapia de reposição hormonal para prevenção vascular, otimização do nível de hemoglobina em pacientes críticos pela conduta de transfusão liberal, terapia agressiva com insulina em paciente críticos, para citar apenas uns dos múltiplos exemplos históricos.

No caso particular do “congelamento”, pensemos. Essa terapia foi testada em pacientes que apresentaram morte súbita presenciada, cuja etiologia principal é a doença aterosclerótica coronariana. Estes paciente podem estar com alguma lesão coronária instável, tipo uma artéria subocluída. Qual será o efeito do “congelamento” nesta coronária. Será que causaria vasoespasmo, piorando o status isquêmico do paciente? Não sabemos, mas esta idéia mostra que há plausibilidade para o malefício também . Outro potencial prejuízo seria o enfoque na terapia de “congelamento”, em detrimento de condutas mais voltadas para a etiologia do problema, como a realização de cateterismo cardíaco de urgência em alguns casos.

O segundo grande prejuízo do princípio da crendice é o fenômeno denominado reversão médica. Este fenômeno é caracterizado pelo vai e vem dos paradigmas. Ou seja, paradigmas que são criados sem base científica, sendo depois derrubados por evidências. O prejuízo da reversão médica é mais coletivo do que individual. É o prejuízo de uma cultura precipitada em criar idéias, fazendo do que deveria ser conhecimento científico, um processo caótico e pouco criterioso de acúmulo de pensamentos. Além disso, quando ocorre reversão médica, alguns dos falsos paradigmas podem estar tão enraizados no inconsciente coletivo, que fica difícil derrubá-los.

Em terceiro lugar, a dúvida de se um tratamento é benéfico, maléfico ou neutro muitas vezes vem junto com a certeza de que o tratamento gera gastos significativos (Xigris), prolongamento do internamento para realização de procedimentos desnecessários (tipo uma fechamento de FOP) e muitas vezes sofrimento ao paciente e sua família.


Expectativa

Em minha opinião, a evolução da medicina no próximo século dependerá muito mais da evolução do pensamento médico, do que do surgimento de novos tratamentos. Se por algum motivo (não estou propondo isso) descobertas de novos tratamentos fossem congeladas por um século e o enfoque passasse a ser no estudo do raciocínio médico e de como melhor aplicar o conhecimento que já temos, esta seria uma era de renascimento. Uma era de muito mais evolução e benefício para os pacientes do que observamos hoje.

Torço para que estudos futuros de boa qualidade testem corretamente a hipótese do “congelamento” e tomara que esta conduta seja benéfica. Porém minha torcida maior, com otimismo, é para que este venha a ser um século de iluminismo do pensamento médico.

13 comentários:

  1. Luiz, tantos vieses já desmontam a credibilidade dos artigos, tanto assim, que como você mesmo disse, não se vê criogenia nas UTIs. Seria muito produtivo se os médicos conseguissem repensar à luz dos conhecimentos já existentes, mas muitos querem fazer dos trabalhos científicos a descoberta do fogo ou a invenção da roda.

    ResponderExcluir
  2. Excelente abordagem como sempre,
    Parabéns Luis e Márcia!

    ResponderExcluir
  3. Caro Luiz. Ótimos argumentos.
    Algumas revistas famosas vem cada vez mais me preocupando com estudos duvidosos. Muitas revistas científicas estão incorporando a cultura pop do sensacionalismo, onde quem primeiro estampar uma notícia nova (mesmo que sem credibilidade)será o mais acessado, conhecido e será reproduzido milhares e milhares de vezes.
    Recentemente, vi um estudo no NEJM sobre da cirurgia bariátrica com pouco mais de 100 pacientes ser objeto de sensacionalismo da imprensa comum.
    Me responda: Como uma revista como NEJM publica estudos assim?

    ResponderExcluir
  4. Bom texto, parabens.

    ResponderExcluir
  5. Parabéns dr. Luís, como sempre acendendo nossas labaredas da inquietude.
    Abraços

    ResponderExcluir
  6. Como sempre "10 anos depois".

    ResponderExcluir
  7. Uma aula de bioestatística e medicina baseada em evidências.

    Continue a nos esclarecer, por favor.

    Rafael Andrade.

    ResponderExcluir
  8. Luis, cheguei aqui via e-mail do Paulo Toscano. Curiosamente vivo em meio a este dilema, sempre achei estes estudos vagabundinhos, como destacaste, mas colegas da UTI que trabalho em plantão a noite e médicos da UTI que mando, de dia, no HCPA, estão usando, meio conra minha vontade. Além disso, tem dificuldade de implementar o protocolo a pleno. Enfim, esta é outra proposta mágica de UTI que dificilmente será derrubada não ser que o NIH bote baita grana para fazer um estudo. Para consolo, ouvimos todos o estouro do balão intra-aórtico, agora só útil para festas de aniverário de filhos de intensivistas.

    Flávio Fuchs

    ResponderExcluir
  9. Parabéns, sempre ótimos textos, abrindo a "caixa preta" dos artigos e temas polêmicos.

    ResponderExcluir
  10. Se o século do iluminismo não vier, que o blog continue iluminando nosso senso crítico! Grande abraço.

    ResponderExcluir
  11. Diante das limitações citadas algumas inevitáveis (como cegar uma terapia destas?) e do convencimento quase de toda comunidade médica desta área acho complicadíssimo ou praticamente improvável um novo estudo sobre este assunto - qual comitê de ética aprovaria um novo grupo placebo?

    abc

    andré

    ResponderExcluir
  12. Bela explanaçao. Conseguiste escrever e organizar bem o raciocinio sobre este polemico assunto. Agora tu me deu um dilema: se a hipotermia faz com que a equipe se preocupe mais com o paciente, acabo simpatizando com o método. Meu pai sempre diz que o que pode diminuir a mortalidade de um paciente crítico é um banquinho. Um banquinho com o médico ao lado do doente.

    ResponderExcluir