Desde que me formei cardiologista, aprendi que o paciente coronariano que mais se beneficia da revascularização miocárdica é aquele com disfunção ventricular esquerda. Mas nunca busquei o nível de evidência que suportava esse conhecimento, considerava isso uma verdade absoluta e guiei minhas condutas a partir deste paradigma. Eu achava que essa verdade vinha do estudo
CASS, que mostrou ser o subgrupo de pacientes com disfunção ventricular esquerda o único com tendência a benefício da cirurgia.
Mas nunca parei para perceber que o estudo CASS excluía pacientes com fração de ejeção menor que 35% (
severe dysfunction, como se fala em inglês). Ou seja, a idéia de que pacientes com disfunção
severa se beneficiavam da cirurgia era uma extrapolação.
Já comentei nesse Blog que às vezes ampliamos a validade externa de alguns estudos para além da amostra estudada. Isso pode ser aceitável se for uma decisão cuidadosa e pautada em plausibilidade clínica. No entanto, neste caso também há plausibilidade clínica para que a cirurgia em pacientes com disfunção não seja benéfica: o elevado risco cirúrgico.
Foi então que em 2002 se iniciou o
STICH Trial, um ensaio clínico randomizado para testar a hipótese de que cirurgia traz benefício adicional ao tratamento clínico em pacientes com disfunção sistólica do ventrículo esquerdo de grau
severo. Este estudo, financiado pelo
National Institute of Health (NIH), randomizou 1200 pacientes para cirurgia de revascularização + tratamento clínico
versus tratamento clínico. Nove anos depois de seu início, o resultado desse estudo foi apresentado no congresso do
American Heart Association e publicado simultaneamente no
New England Journal of Medicine.
Ficou demonstrado que a mortalidade geral, objetivo primário do estudo, foi semelhante entre os dois grupos. Ou seja, a cirurgia não oferece benefício adicional.
Mas antes de aceitar a veracidade dessa informação, temos que fazer nossa análise metodológica. Vamos lá.
Quando um estudo mostra diferença entre grupos, nos preocupamos com a probabilidade da diferença ser por acaso (erro tipo I). Aí verificamos o valor de P, que representa exatamente essa probabilidade.
Mas neste caso é diferente. Quando nos deparamos com um estudo “negativo” (ausência de diferença entre grupos), devemos nos questionar se aquele achado representa um erro tipo II. Erro tipo II significa não encontrar uma diferença que na realidade existe; ou como dizem os estatísticos, aceitar uma falsa hipótese nula. Esse erro decorre de baixo poder estatístico. Portanto, sempre que temos um estudo negativo, devemos ler na metodologia do trabalho se há poder estatístico adequado. Para se considerar adequado, o poder estatístico deve ser de pelo menos 80%, resultando em probabilidade do erro tipo II (100% – poder) menor que 20%. Em ciência, 20% é a máxima probabilidade aceitável do erro tipo II.
Os autores calcularam que precisariam de 400 mortes para ter um poder estatístico de 90% na detecção de uma diferença relativa de 25% na mortalidade entre os grupos. Olhando os resultados do estudo, percebemos que houve 462 mortes no seguimento de cinco anos, portanto o poder estatístico foi maior que 90%. Se o poder é maior que 90%, consideramos que a probabilidade do erro tipo II é menor que 10% - excelente, podemos aceitar o resultado, pois há baixa probabilidade desse tipo de erro.
Outros critérios reafirmam a veracidade da informação: mortalidade foi o desfecho pré-estabelecido como primário, a randomização resultou em dois grupos homogêneos (ausência de variáveis de confusão), a análise foi por intenção de tratar (ausência de viés na análise de dados), não houve cross-over excessivo que invalidasse a análise dos resultados, os cirurgiões foram de boa qualidade (ausência de viés de aplicação da técnica de tratamento), o estudo não foi truncado. Enfim, a essa pode ser considerada uma evidência de boa qualidade.
Mas podem esperar. Logo surgirão as viúvas do estudo STICH (todo estudo tem viúvas, aquelas que se sentem desamparados pelo resultado do estudo), que vão arranjar críticas para invalidar o trabalho. Algumas dessas críticas serão esdrúxulas, outras um pouco mais sérias, porém insuficientes para invalidar a informação científica.
Grande esforço foi aplicado para nos oferecer a informação científica que precisávamos, 1200 pacientes foram voluntários, nove anos de estudo, milhões de dólares, várias cabeças pensantes. Tudo isso para a evidência ser rejeitada? Não, temos que valorizar o que há de bom, mesmo que a informação vá de encontro com nossas crenças iniciais.
Mas porque a cirurgia não reduziu mortalidade? A análise de curvas de sobrevida nos fornece vários insights sobre como as coisas acontecem. Estes tipos de gráficos parecem mágicos em retratarem fenômenos ao longo do tempo, temos que prestar muita atenção neles. Percebam na curva de sobrevida que no primeiro ano o grupo cirúrgico tem maior tendência a morte e só a partir do terceiro ano que a cirurgia começa a proteger os pacientes. De uma forma prática: no início a cirurgia mata mais, porém quem não morre vai desfrutar de benefício no futuro, após vários anos. Dentre os que morrem, os pacientes do grupo cirúrgico morrem antes, pois o mecanismo de sua morte é a cirurgia propriamente dita. Se o poder estatístico fosse ainda maior ou o seguimento fosse de 10 anos, poderia se encontrar uma pequena redução na freqüência de morte no grupo cirúrgico, mas esse raciocínio de temporalidade faz com que esse benefício modesto não compense (se existir). Tempo de vida é uma coisa importante.
Claro, isso não quer dizer que um paciente com disfunção
severa nunca será operado. Paciente com angina de difícil controle (classe canadense III ou IV), lesão de tronco de coronária esquerda ou até mesmo com insuficiência cardíaca refratária devem ser operados. Aí entra o
paradigma do paraqueda, da plausibilidade extrema. Por isso que estes pacientes foram excluídos do estudo.
O estudo foi apresentado no congresso do AHA com um viés de positividade, focado em desfechos secundários. Mas nunca devemos colocar desfechos secundários como hierarquicamente mais importantes do que o desfecho primário, pois os primeiros têm maior probabilidade do erro tipo II. Além disso, não importa ter redução de mortalidade cardiovascular (desfecho secundário – P = 0.05) sem redução de mortalidade geral. O que imposta é não morrer. Morrer é morrer, independente do mecanismo. Pior ainda quando esse morrer acontece mais precocemente no grupo cirúrgico. Por isso que o Gregg Stone, coordenador da sessão, precisou intervir e lembrar do básico: este foi um estudo negativo.
Fica aqui a pergunta. Quantos pacientes de alto risco cirúrgico, com disfunção sistólica severa tiveram suas cirurgias indicadas com base em um falso paradigma e se prejudicaram com essa conduta? Devemos sempre lembrar que condutas não embasadas podem ser prejudiciais. Essa evidência não necessariamente proibe a cirurgia, mas nos dá a possibilidade de decidir com base em indicações mais concretas do que simplesmente na presença de doença coronária com disfunção ventricular severa.
E assim mais um paradigma é derrubado. Costumo dizer que muitos paradigmas são derrubados pois nunca deveriam ter sido criados. Não adianta um porquinho construir uma casa de palha, pois o lobo sopra e derruba com facilidade. Aqui o sopro do lobo é a evidência científica. Na verdade, nunca houve esse paradigma.