Nos últimos anos, temos experimentado um
crescente entusiasmo pela terapia de hipotermia após reanimação cardio-respiratória.
Uns mencionam que esta conduta é recomendada pelo ACLS, outros lembram do
impressionante número necessário ao tratar de 6 para prevenir uma morte, alguns
consideram a adoção desta conduta um marcador de qualidade em unidades de tratamento
intensivo.
Paradoxalmente, percebemos que este
não é um tratamento implementado na maioria das UTIs do Brasil. Então, das
duas uma: ou somos muito incompetentes ao ponto de deixar de implementar uma
terapia com NNT de 6; ou na verdade a hipótese nula da ausência de benefício
não foi rejeitada pelas evidências atuais.
Para esclarecer qual das duas
alternativas é a verdadeira, precisamos fazer uma análise das evidências que
testaram a hipótese de que “congelar” pacientes traz benefícios neurológicos e
preservam vida.
Assim, temos que voltar no tempo até
fevereiro de 2002, quando o New England
Journal of Medicine publicou simultaneamente dois ensaios clínicos com
resultados positivos a favor do benefício da hipotermia, um trabalho austríaco
e outro australiano. O primeiro com (pasmem) apenas 77 pacientes e o segundo com
(pasmem) apenas 275 pacientes pós-parada. Analisaremos estes trabalho de acordo
com os critérios indicados na série de
postagens sobre análise crítica de evidências sobre terapia. Há ainda dois
trabalhos menores (2001 e 2012), os quais não
mencionarei nesta postagem por questão de espaço e porque estes não mudariam nosso raciocínio.
Efeito de
Confusão
Sabemos que o ideal é a randomização para
os grupos tratamento ou controle, pois desta forma não há tendenciosidade da
escolha da conduta, o que torna os grupos semelhantes em características
clínicas, reduzindo a possibilidade de efeito de confusão como explicação do
resultado. O estudo australiano (o menor deles) de fato randomizou (sorteou) pacientes para
tratamento ou controle. A despeito do pequeno tamanho amostral, esta
randomização foi suficiente para tornar os dois grupos semelhantes, tal como
demonstrado na tabela de características clínicas do estudo.
Por
outro lado ... embora o estudo austríaco tente nos induzir a achar o contrario,
este não foi um estudo randomizado. Os autores descrevem “patients were randomly assigned to
hypothermia or normothermia according to the day of the month, with patients
assigned to hypothermia on odd-numbered days”. Esta
é na realidade uma frase paradoxal, pois este não se constitui em um
método (aceitável) de randomização. Randomização
pressupõe imprevisibilidade para qual grupo o paciente será alocado. Esta
imprevisibilidade previne tendenciosidade na alocação de pacientes menos graves
para o grupo tratamento. Percebam. Se hoje é dia ímpar, o paciente será alocado
para o grupo “congelamento” caso este seja incluído no estudo. Sabendo disso,
podemos não incluir no estudo pacientes de pior prognóstico em dias ímpares,
sendo mais liberais na inclusão de pacientes em dias pares. Esse processo
(mesmo que inconsciente) promove uma maior possibilidade de fatores de confusão
explicando os resultados. E foi justamente este estudo que não mostrou uma
tabela completa comparando características clínicas entre os dois grupos. A
tabela se limitou basicamente a dados da reanimação.
Sendo
assim, um dos dois estudos pode ter sofrido de um processo de alocação não randomizado.
Fico a me perguntar o que custava sortear o paciente na chegada; por que a
escolha desse questionável método de alocação? Será que nos dias pares uma equipe melhor
preparada ficava de sobreaviso para implementar a hipotermia? Isso seria outro
viés, um viés de qualidade da equipe.
Viés de Aferição
Embora
ambos os estudos descrevem que avaliação do desfecho neurológico tenha sido
realizada por um pesquisador cego em relação à alocação do tratamento, não
podemos considerar este um estudo cego. Do ponto de vista do paciente, pode até
ser cego, pois o mesmo estava em coma. No entanto, toda a UTI sabia que o
paciente estava sendo resfriado. Mesmo que o médico que avaliou o desfecho não
soubesse, pode ser que a alocação aberta para um tratamento complexo e
experimental como hipotermia tenha promovido mais grau de atenção e cuidado
para este paciente, em comparação ao paciente que recebeu o tratamento monótono
e usual que todos sempre recebem. Mesmo que não seja possível cegar o tratamento neste
caso, um esforço especial deveria ser feito para que o tratamento do grupo
controle fosse tão bom quanto o grupo hipotermia. Em ambos os trabalhos parece
que isto pode não ter ocorrido. Na verdade, a média de temperatura do grupo
controle foi acima de 37oC em ambos os estudos. É como se houvessem
comparado “febre” versus hipotermia,
e não normotermia versus hipotermia.
Mesmo que esta "febre" não tenha influenciado diretamente no desfecho, esta representa um marcador de que este grupo não foi tratado com excelência. Por outro lado,
toda a atenção necessariamente dispensada aos pacientes “congelados”
possivelmente promoveu um tratamento excelente qualidade.
Observe
que isto gera um viés de aferição. Devidos a estes mecanismos, o que pode ter sido aferido não foi o efeito da hipotermia, mas sim a excelência de
tratamento recebido por estes pacientes. Não podemos garantir que isto não ocorreu.
Acaso
Quando
identificamos um valor de P estatisticamente significante, consideramos que a
probabilidade da diferença observada ocorrer se a hipótese nula for verdadeira
é muito pequena. Por isso rejeitamos a hipótese nula e passamos acreditar na
diferença encontrada. No entanto, a validade do valor de P depende também do
poder estatístico do estudo. Ou seja, em um estudo positivo a despeito de
reduzido poder estatístico, o valor de P pode ter aparecido estatisticamente
significante por acaso.
A explicação disto
está no fato de que quando o tamanho amostral é muito pequeno, uma diferença
muito grande entre os dois grupos é necessária para que se consiga
significância estatística. Diferença tão grande que se torna inverossímil.
Diferença tão grande que mais provavelmente decorreu do acaso. Por isto que
quando o poder estatístico é insuficiente, o valor de P tende a subestimar o
acaso. Ou seja, o acaso pode ter ocorrido, apesar do valor de P < 0.05.
Não é que o cálculo
do valor de P esteja errado. É porque do ponto de vista de uma análise
qualitativa, a observação tem mais proximidade com a possibilidade do acaso.
Por exemplo, se uma coisa absurda acontecer, com um valor de P = 0.01, é mais
provável que a coisa caiu exatamente no 1% dos resultados extremos com a
hipótese nula verdadeira, do que se a coisa não fosse absurda. Este é um pensamento
sutil, mas muito verdadeiro.
Desta forma, se faz
necessário que o estudo tenha um poder estatístico para detectar uma diferença
predeterminada entre os grupos e que esta diferença seja razoável. Em nenhum dos dois trabalhos isso
ocorreu. Enquanto o estudo austríaco não descreveu cálculo do tamanho amostral,
o estudo australiano calculou um tamanho amostral que dá um poder de
80% para detectar uma diferença sem precedentes em nenhum estudo sobre terapia, ou seja, uma
diferença absoluta de 36%. É muito otimismo, isso é irreal.
Viés de Publicação
O fato de que o
resultado positivo ocorreu simultaneamente em dois estudos independentes,
feitos em diferente locais do mundo, nos induz a pensar que de fato o efeito
benéfico observado deve ser verdadeiro. Isso seria verdade se apenas estes dois
estudos fossem os que tivessem sido realizados em todo o universo. E nesse
momento entra o viés de publicação.
Sabemos que isso
não é verdade, ou seja, outros estudos devem ter sido realizados. Imaginem 30
estudos, em diferentes locais do mundo, todos de pequeno tamanho amostral, tal
como os que estamos discutindo. Agora imaginem que a hipótese nula é verdadeira, ou seja, que na
verdade hipotermia não serve para nada. Neste contexto, consideremos que 28
destes estudos mostram o resultado correto, ou seja, semelhança entre os
grupos. E dois destes estudos mostram resultado positivo, meramente por acaso.
Neste contexto, os dois estudos positivos possuem maior probabilidade de serem
aceitos para publicação em revistas de impacto do que os 28 que mostram resultados
negativos. Além disso, muitos dos estudos de resultados negativos nem mesmo são
escritos ou submetidos para publicação pelos autores. Isso promove um viés de
publicação a favor de estudos positivos.
O viés de
publicação é um fenômeno inerente de estudos pequenos, geralmente unicêntricos.
Grandes estudos multicêntricos são publicados, mesmo quando negativos. Mas os
estudos pequenos ficam mais vulneráveis a este fenômeno. Isso ocorre devido à dificuldade de publicar um estudo pequeno. Assim, estes estudos
precisam ser pelo menos positivos, para atrair a atenção de revisores e
editores para a aceitação do artigo.
O viés de
publicação vem de nossa inadequada tendência a valorizar mais dados positivos
do que dados negativos, como retratado na frase de Francis Bacon: "It is peculiar and perceptual error of the human understanding to be more moved and excited by affirmatives than negatives."
Crendice versus Ciência
Já comentei
previamente neste Blog o problema da mente
crente. Por questões evolutivas, nossa mente tende a acreditar mais em dados
positivos do que em dados negativos. Corroborando com a mente crente, temos a mentalidade
do médico ativo, onde nos sentimos mais úteis, melhores médicos, se
adotarmos condutas novas e interessantes, em detrimento do pensamento
científico.
São muitos os que
argumentam insistentemente de que precisamos fazer coisas sem evidências, pois
não há evidência para todo tipo de conduta. Chegam a estragar a inteligente
frase “ausência de evidência não é
evidência de ausência”, quando a utilizam para sofismar a favor da adoção de
terapias sem base científica. Aplicar esta frase como justificativa para adotar
uma terapia é inadequado. Esta frase foi criada no contexto de que certos
estudos negativos podem não ser definitivos. Neste caso, a frase está estimulando estudos futuros,
com maior poder estatístico, por exemplo. Mas a idéia da frase não deve ser
usada na tomada de decisão clínica, permitindo a adoção de condutas incertas.
Esta discussão está no cerne dos princípios da medicina baseada evidências,
já colocados inúmeras vezes em postagens deste Blog. Primeiro, devemos avaliar
se o caso corresponde a uma situação de plausibilidade extrema, o princípio dopára-quedas. São situação óbvias, que não devem requerer um ensaio clínico para
confirmar a idéia. É a efetividade do pára-quedas na prevenção de morte durante
salto livre de uma avião em pleno vôo; o caso do diurético no edema agudo de
pulmão; insulina no diabético tipo I; laparotomia em indivíduo baseado no
abdômen. Se estamos diante de plausibilidade extrema, devemos adotar a conduta,
pois nunca existirá um estudo para testar esta hipótese, porque estes estudos
seriam desnecessário e anti-éticos.
As demais
situações, que correspondem à maioria da terapias em medicina, partem do
princípio da equipoise, ou seja,
quando há uma dúvida suficiente para justificar um estudo controlado, onde
parte dos pacientes não adotem a terapia. Nestas situações devemos partir do princípio da hipótese nula, onde
a premissa é de ausência de benefício, e quando surgem evidências
suficientes, rejeitamos a hipótese nula e ficamos com a hipótese alternativa de
que a conduta deve ser adotada.
Mas qual seria o
prejuízo de preferir preferir o princípio
da crendice, em detrimento da hipótese nula?
Primeiro, muitas
terapias cuja expectativa é de serem benéficas, podem na verdade ser maléficas.
Muitos são os exemplos na literatura em que o princípio da crendice foi
utilizado, a terapia foi adotada e depois descobriu-se que a coisa era
maléfica, sendo a conduta suspensa: a adoção de terapia de reposição hormonal
para prevenção vascular, otimização do nível de hemoglobina em pacientes críticos
pela conduta de transfusão liberal, terapia agressiva com insulina em paciente
críticos, para citar apenas uns dos múltiplos exemplos históricos.
No caso particular
do “congelamento”, pensemos. Essa terapia foi testada em pacientes que
apresentaram morte súbita presenciada, cuja etiologia principal é a doença
aterosclerótica coronariana. Estes paciente podem estar com alguma lesão
coronária instável, tipo uma artéria subocluída. Qual será o efeito do
“congelamento” nesta coronária. Será que causaria vasoespasmo, piorando o
status isquêmico do paciente? Não sabemos, mas esta idéia mostra que há
plausibilidade para o malefício também . Outro potencial prejuízo seria o
enfoque na terapia de “congelamento”, em detrimento de condutas mais voltadas
para a etiologia do problema, como a realização de cateterismo cardíaco de
urgência em alguns casos.
O segundo grande
prejuízo do princípio da crendice é o
fenômeno denominado reversão médica.
Este fenômeno é caracterizado pelo vai e vem dos paradigmas. Ou seja, paradigmas
que são criados sem base científica, sendo depois derrubados por evidências. O
prejuízo da reversão médica é mais coletivo do que individual. É o prejuízo de
uma cultura precipitada em criar idéias, fazendo do que deveria ser
conhecimento científico, um processo caótico e pouco criterioso de acúmulo de pensamentos.
Além disso, quando ocorre reversão médica,
alguns dos falsos paradigmas podem estar tão enraizados no inconsciente
coletivo, que fica difícil derrubá-los.
Em terceiro lugar,
a dúvida de se um tratamento é benéfico, maléfico ou neutro muitas vezes vem
junto com a certeza de que o tratamento gera gastos significativos (Xigris),
prolongamento do internamento para realização de procedimentos desnecessários
(tipo uma fechamento de FOP) e muitas vezes sofrimento ao paciente e sua
família.
Expectativa
Em minha opinião, a
evolução da medicina no próximo século dependerá muito mais da evolução do
pensamento médico, do que do surgimento de novos tratamentos. Se por algum
motivo (não estou propondo isso) descobertas de novos tratamentos fossem congeladas
por um século e o enfoque passasse a ser no estudo do raciocínio médico e de como melhor aplicar o conhecimento
que já temos, esta seria uma era de renascimento. Uma era de muito mais
evolução e benefício para os pacientes do que observamos hoje.
Torço para que
estudos futuros de boa qualidade testem corretamente a hipótese do
“congelamento” e tomara que esta conduta seja benéfica. Porém minha torcida
maior, com otimismo, é para que este venha a ser um século de iluminismo do
pensamento médico.
Luiz, tantos vieses já desmontam a credibilidade dos artigos, tanto assim, que como você mesmo disse, não se vê criogenia nas UTIs. Seria muito produtivo se os médicos conseguissem repensar à luz dos conhecimentos já existentes, mas muitos querem fazer dos trabalhos científicos a descoberta do fogo ou a invenção da roda.
ResponderExcluirExcelente abordagem como sempre,
ResponderExcluirParabéns Luis e Márcia!
Caro Luiz. Ótimos argumentos.
ResponderExcluirAlgumas revistas famosas vem cada vez mais me preocupando com estudos duvidosos. Muitas revistas científicas estão incorporando a cultura pop do sensacionalismo, onde quem primeiro estampar uma notícia nova (mesmo que sem credibilidade)será o mais acessado, conhecido e será reproduzido milhares e milhares de vezes.
Recentemente, vi um estudo no NEJM sobre da cirurgia bariátrica com pouco mais de 100 pacientes ser objeto de sensacionalismo da imprensa comum.
Me responda: Como uma revista como NEJM publica estudos assim?
Bom texto, parabens.
ResponderExcluirParabéns dr. Luís, como sempre acendendo nossas labaredas da inquietude.
ResponderExcluirAbraços
Como sempre "10 anos depois".
ResponderExcluirUma aula de bioestatística e medicina baseada em evidências.
ResponderExcluirContinue a nos esclarecer, por favor.
Rafael Andrade.
Luis, cheguei aqui via e-mail do Paulo Toscano. Curiosamente vivo em meio a este dilema, sempre achei estes estudos vagabundinhos, como destacaste, mas colegas da UTI que trabalho em plantão a noite e médicos da UTI que mando, de dia, no HCPA, estão usando, meio conra minha vontade. Além disso, tem dificuldade de implementar o protocolo a pleno. Enfim, esta é outra proposta mágica de UTI que dificilmente será derrubada não ser que o NIH bote baita grana para fazer um estudo. Para consolo, ouvimos todos o estouro do balão intra-aórtico, agora só útil para festas de aniverário de filhos de intensivistas.
ResponderExcluirFlávio Fuchs
Parabéns, sempre ótimos textos, abrindo a "caixa preta" dos artigos e temas polêmicos.
ResponderExcluirSe o século do iluminismo não vier, que o blog continue iluminando nosso senso crítico! Grande abraço.
ResponderExcluirDiante das limitações citadas algumas inevitáveis (como cegar uma terapia destas?) e do convencimento quase de toda comunidade médica desta área acho complicadíssimo ou praticamente improvável um novo estudo sobre este assunto - qual comitê de ética aprovaria um novo grupo placebo?
ResponderExcluirabc
andré
Bela explanaçao. Conseguiste escrever e organizar bem o raciocinio sobre este polemico assunto. Agora tu me deu um dilema: se a hipotermia faz com que a equipe se preocupe mais com o paciente, acabo simpatizando com o método. Meu pai sempre diz que o que pode diminuir a mortalidade de um paciente crítico é um banquinho. Um banquinho com o médico ao lado do doente.
ResponderExcluirMuito interessante. Parabéns.
ResponderExcluir