No último número do New England Journal of Medicine foi publicado o primeiro ensaio
clínico randomizado que testou a hipótese de que cirurgia precoce reduz o risco
do desfecho combinado de morte ou embolia sistêmica em pacientes com endocardite e
grande vegetação em valva nativa. Este trabalho randomizou 76 pacientes para
cirurgia em 48 horas da randomização ou tratamento convencional,
demonstrando que o grupo cirúrgico reduziu significativamente o risco deste
desfecho combinado (3% vs. 23%; P =
0.03), à custa de prevenção de evento embólico (mortalidade foi igual).
Mesmo tendo alcançado significância
estatística, ensaios clínicos pequenos como este merecem uma análise crítica
mais cuidadosa. Seguindo nosso roteiro de análise critica (1, 2, 3, 4, 5), vamos avaliar veracidade, relevância e aplicabilidade
destes resultados.
Veracidade
O valor de P < 0.05 indica que é pouco
provável que este resultado tenha decorrido do acaso. Ou seja, se a hipótese nula
fosse verdadeira, a probabilidade de um resultado tão diferente entre os dois
grupos (3% vs. 23%) ter aparecido aleatoriamente é de apenas 3%. Isso rejeita a hipótese nula e ficamos com a hipótese
alternativa de que a cirurgia é melhor do que o tratamento convencional.
Porém seria simplório parar por aqui.
Quando um estudo pequeno assim alcança significância estatística para desfechos
duros ficamos a nos questionar se este valor de P representa a realidade.
Revisando, o que poderia gerar um valor de P inacurado?
Primeiro, um resultado proveniente de
desfecho secundário. Neste caso há o problemas das múltiplas comparações (muitos
desfechos testados simultaneamente), fazendo com que haja uma maior
probabilidade de significância estatística na ausência de diferença real.
Não é o caso deste estudo, pois a
conclusão é baseada no desfecho primário, que foi pré-definido e o tamanho
amostral dimensionado para oferecer um poder de 80%.
Segunda preocupação, um estudo truncado pode
gerar um valor de P significativo, por acaso. Também não á o caso deste estudo,
pois o tamanho amostral planejado de 74 pacientes foi alcançado e o seguimento
hospitalar foi completado.
Sendo assim,
acreditamos que o valor de P de 0.03 é representativo da realidade.
Mas ainda há um problema capcioso, mas que é real: para um estudo pequeno ter um resultado estatisticamente
significante (P < 0.05) em relação a um desfecho categórico (evento ou não
evento), é necessário que haja uma diferença absoluta tão grande que esta pode se
tornar inverossímil. A
diferença pode ser tão inverossímil que passamos a acreditar mais na
possibilidade de que o estudo caiu naqueles 3% de probabilidade desta diferença
aparecer na presença da ausência de benefício real (hipótese nula verdadeira). Ou
seja, aqui não estamos questionando o valor de P de 3%, este deve está certo.
Mas a questão é se o estudo caiu exatamente nestes 3% de probabilidade do
resultado ter aparecido aleatoriamente.
Lembram-se do estudo de Poderman, do beta-bloqueador em pré-operatório de
cirurgia não cardíaca? Tinha apenas 112 pacientes e mostrou redução de mortalidade
(3.4% vs. 17%, P = 0.02). Este enorme benefício é
inverossímil, pois nenhuma droga cardiovascular provocou tal redução de
mortalidade (nem trombólise no IAM, cuja redução de mortalidade é 1/3 desta),
quanto mais beta-bloqueador em cirurgia não cardíaca. Como sabemos, estudos posteriores
mostraram que esse benefício não é verdadeiro.
Portanto, devemos nos perguntar se uma diferença absoluta
de 20% neste estudo é plausível. Primeiro, 23% de eventos é o que se espera de
embolia sem a cirurgia? Parece que sim, de acordo com registros prévios citados
pelo próprio autor. Segundo, faz sentido praticamente eliminar o risco de
embolia com a cirurgia? Também parece fazer sentido, pois se a vegetação é
retirada, não vai embolizar.
Portanto, este resultado não parece ter sido devido ao
acaso, devemos acreditar no valor de P e acreditar que um valor de P < 0.05
sugere benefício, pois neste caso a diferença é clinicamente plausível.
Ainda resta a possibilidade dos resultados serem decorrentes de efeito
de confusão ou vieses. Efeito de confusão não parece existir, pois a
randomização foi suficiente para que as amostras fossem homogêneas. Quanto a
vieses, nos preocupamos com o fato do estudo ser aberto poder gerar erro na aferição dos eventos embólicos (tendenciosidade). Porém estes desfechos foram definidos de forma bastante objetiva: embolia teria que ser um evento muito bem caracterizado clinicamente e demonstrado por
exame de imagem. Sendo assim, é pouco provável que o resultado seja decorrente
deste viés. Quanto ao tratamento, todos os pacientes do grupo cirúrgico foram
operados; e apesar de que 70% do grupo convencional foram operados também, estas
cirurgias foram bem tardias e todos os eventos registrados nesse grupo
ocorreram antes da cirurgia. Portanto, o estudo é adequado para avaliar o benefício da cirurgia precocemente indicada.
Sendo assim, concluímos que o benefício é
verdadeiro, de fato a cirurgia previne embolia sistêmica.
Relevância
Se formos calcular, ficaremos
impressionados com um NNT de 5. Muito baixo, benefício de magnitude quase nunca
observado. É verdade? Tal como mencionamos na postagem do estudo da
tenecteplase no AVC, estudos pequenos não possuem precisão na medida do NNT.
Só de olhar o intervalo de confiança do hazard ratio percebemos a imprecisão na
magnitude do benefício. Vejam, os autores descrevem um hazard ratio de 0.10, mas com intervalo de confiança que varia de
0.01 a 0.82. Vejam que imprecisão, a redução relativa do risco pode ser tão
grande quando 99% a tão pequena quando 16%. Mas a medida do hazard
ratio é relativa, precisamos ir para a redução absoluta e calcular o NNT. O
autor não faz isso, porém podemos calcular os intervalos de confiança com um simples software estatístico (WINPEPI, por exemplo):
Risco de embolia/morte no grupo cirúrgico
= 3% (95% IC = 0.1% a 13% - que imprecisão!)
Risco de embolia/morte no grupo
convencional = 23% (95% IC = 12% a 38% - que imprecisão!)
Sendo assim, a redução absoluta do risco
(risco cirúrgico - risco convencional) tem o intervalo de confiança variando de
1% a 38%. Portanto, o NNT (100/RAR) pode variar de 100 (pequeno impacto) a 2.6 (impacto enorme).
Portanto, este estudo não é suficiente
para nos garantir que o benefício é de grande magnitude. Isto seria importante,
pois se soubéssemos que a magnitude é enorme, insistiríamos em cirurgia mesmo para pacientes de
muito alto risco ou instáveis clinicamente. Mas diante da
incerteza na magnitude do benefício, a escolha deve ser mais ponderada, caso a
caso.
Aplicabilidade
Conhecendo os pacientes pela tabela de
características clínicas, 3 aspectos julgo dignos de nota.
Primeiro, o mais óbvio: todos tinham
vegetação > 10 mm, tal como definido pelo critério de inclusão. Portanto
aqui nos referimos a pacientes com vegetação grande, não qualquer vegetação.
Seguindo o raciocínio da postagem anterior (aplicabilidade), há razão para acreditarmos que se a vegetação for pequena, o benefício
pode não existir. Como estamos falando de cirurgia cardíaca, um
procedimento agressivo, os resultados não devem ser extrapolados para vegetação
muito menores que isso.
Segundo, aqui não se tratam de
pacientes com infecção descontrolada, sépticos, daqueles que os cirurgiões não
gostam de colocar na sala. Digo isso pois os tempo sem febre teve uma mediana
de 2 dias, com 75% dos pacientes com mais de um dia sem febre (intervalo
interquartil = 1 – 3). Há razão para o
resultado cirúrgico ser pior em pacientes sem controle da infecção? Acho que sim. Portanto,
não devemos extrapolar estes resultados para pacientes com infecção
descontrolada, pois o resultado cirúrgico pode não ser o mesmo.
Corroborando com esta observação, a
grande maioria dos casos era por infecção estreptocócica, a mais branda de
todas, sendo apenas 10% dos pacientes com infecção por estafilococos.
Conclusão
Embora o resultado seja visualmente
impressionante (vide gráfico acima), nossa conclusão deve ser mais ponderada,
em se considerando as características deste estudo.
Devemos indicar cirurgia precoce de
rotina na endocardite de valva nativa na presença de grandes vegetações e quadro
infeccioso parcialmente ou plenamente controlado (em sépticos há incerteza). Mesmo
assim, considerando a imprecisão da magnitude do benefício, devemos ponderar a
decisão quando nos deparamos com risco cirúrgico muito alto, desconforto do
cirurgião quanto às condições do paciente ou desejo do paciente em evitar
cirurgia.
Seríamos mais enfáticos na indicação se
a mesma magnitude de benefício fosse demonstrada em estudo de grande porte, de maior precisão.
Mas este provavelmente nunca existirá ...
Nenhum comentário:
Postar um comentário