Este tipo de estudo tem se tornado frequente entre importantes trabalhos publicados em
revistas de alto impacto. No entanto, a razão da escolha por este desenho de
estudo e a metodologia por trás dele é pouco compreendida.
Esta pouca
compreensão leva alguns a pensarem que este desenho de estudo é um subterfúgio
da indústria farmacêutica para demonstrar o valor de coisas que não têm tanto
valor. Apesar de minha usual visão crítica em relação à indústria, devo afirmar
que não é bem assim. Estudos de não inferioridade representam uma metodologia
adequada e útil, quando corretamente aplicada.
Então, quando se usa e para que servem estes estudos?
Estes estudos fazem parte de um grupo classificado como estudos de eficácia comparativa, os
quais são usados quando um tratamento
novo é comparado a um tratamento tradicional. Neste caso, os estudos podem
ser de superioridade ou de não inferioridade.
Os estudos de superioridade
representam o modelo tradicional, com o qual estamos acostumados a lidar.
Se aplicam tanto para eficácia comparativa (tratamento novo vs. tratamento tradicional), como para eficácia
(tratamento vs. placebo/controle). No
caso da eficácia comparativa, este tipo de desenho parte da premissa de que o tratamento
novo tem motivos para ser superior ao tratamento tradicional. A possível
superioridade justifica a troca do tradicional pelo novo. Por exemplo, stent
farmacológico (novo) tem motivos para ser melhor do que stent convencional na
prevenção de reestenose (um pouco).
Desta forma, os estudos que comparam estes dois tipos de stent são de
superioridade, pois a hipótese é de que o farmacológico é melhor do que o
convencional.
A segunda situação é quando o tratamento novo não tem vantagem
teórica que suporte uma hipótese de maior eficácia. Porém mesmo que não seja mais
eficaz, o novo pode ser preferido devido a outras vantagens: ter maior
praticidade na administração do tratamento, ser menos agressivo (traumático),
ter menos efeitos adversos.
Alguns exemplos: heparina de baixo peso molecular (novo na década de
90) no tratamento de embolia pulmonar, comparada a heparina não fracionada
(tradicional) . Ambos vão anticoagular o paciente, portanto não há grandes
motivos para se acreditar que o novo será melhor. Porém a HPBM tem administração subcutânea, não precisa de
acesso venoso, não necessita de controle do nível de anticoagulação, eliminando
a necessidade de exames laboratoriais frequentes e permitindo alta da UTI mais
precoce. É grande a vantagem prática.
Dabigatran é um anticoagulante oral que
não necessita de controle do tempo de protrombina. Mesmo que não fosse superior
aos cumarínicos, possuiria uma enorme vantagem prática.
Trombolítico de administração em bolus (TNK-tPA)
são mais práticos do que rt-PA cuja administração requer infusão de 90 minutos. Mesmo que não sejam superiores, podem ser preferidos.
Angioplastia coronária é um tratamento menos
agressivo e mais confortável para o paciente, quando comparado a cirurgia de
revascularização. Angioplastia pode ser menos eficaz que cirurgia no controle
de angina, porém a vantagem da menor agressividade pode justificar a opção por
este tratamento.
Nestas situações, o tratamento novo pode ser
justificado se ele não for muito pior do que o tratamento tradicional. Digo
muito pior, pois nos estudos de não inferioridade se tolera uma certa margem de
inferioridade, uma margem que pode ser compensada por outras vantagens. Isto
que dizer que não inferioridade não é sinônimo de equivalência. Não
inferioridade significa que não é suficientemente inferior para anular a
vantagem prática no novo tratamento.
A margem aceitável de inferioridade nunca deve
ultrapassar o razoável, nunca deve haver perda de mais de 50% de eficácia do
tradicional em relação ao controle (preferencialmente bem menos que isso). Os
autores determinam previamente a margem que definirá não inferioridade. Por
exemplo, se vamos tolerar apenas uma perda de 20% da eficácia, o limite
superior do intervalo de confiança do risco relativo não deve ultrapassar 1.2.
Imaginem, RR = 1.1 (95% IC = 1.03 – 1.19) não ultrapassou o 1.2, então
consideramos isto não inferior. Isto pode ser feito tanto com risco relativo, como com risco absoluto.
Com base nisso, calcula-se o valor de P, cuja
interpretação é o contrário de estudos de superioridade. Ou seja, P < 0.05
indica não inferioridade, mostrando que significância estatística neste caso
mostra uma ausência de diferença grande (nos estudos de superioridade P <
0.05 indicam diferença).
Parece confuso, mas é só entender que o estudo
de não inferioridade testa a hipótese nula de que o tratamento novo é inferior.
Caso P < 0.05 rejeita-se a hipótese nula e ficamos com a hipótese
alternativa de que o tratamento novo é não inferior. Estatisticamente, hipótese
nula e alternativas estão trocadas em relação aos estudos de superioridade.
Em suma, se o intervalo de confiança não
ultrapassar o limite de pouco pior, consideramos não inferior. Ou, se o valor
de P estiver abaixo de 0.05, consideramos não inferior.
Vamos agora à situação prática que nos
motivou a escrever esta postagem, o estudo PRECOMBAT, recentemente publicado no
NEJM.
Tradicionalmente, lesões de tronco de coronária
esquerda possuem indicação cirúrgica quase inquestionável. Porém, o tratamento
de angioplastia com stent tem evoluído, se tornando factível o procedimento em
tronco. Não podemos partir de premissa de que angioplastia é superior a
cirurgia, mas poderíamos imaginar que se não fosse muito pior, a vantagem de
evitar uma cirurgia de risco poderia compensar. Desta forma, o estudo PRECOMBAT
é um estudo de não inferioridade da angioplastia versus cirurgia de tronco. Faz
sentido, não?
Assim, os autores definiram que 7% seria a
margem de não inferioridade, ou seja, o limite superior do intervalo de
confiança do aumento absoluto de
risco de morte, infarto, AVC ou necessidade de revascularização. Sem dúvida, esta margem está ampla demais, 7% aumento de risco absoluto representaria um
NNT de 19 (100/7) para provocar um evento indesejado se angioplastia fosse
realizada ao invés de cirurgia. Mas mesmo assim, poderíamos considerar isso
aceitável em pacientes de altíssimo risco cirúrgico ou que se recusem a fazer
cirurgia.
Bem,
no seguimento de um ano, o aumento absoluto de risco não ultrapassou essa
margem (absolute risk difference, 2.0 percentage points;
95% confidence interval −1.6 to 5.6; P=0.01 for non- inferiority), porém a incidência de
eventos foi menor do que o esperado, fazendo com que esta análise tivesse baixo
poder estatístico. Assim os autores prolongaram a análise para o seguimento de
2 anos. Só que neste momento (espertamente), eles modificaram a regra do jogo e
fizeram uma análise de superioridade (ilógica), na qual não mostraram diferença
significante. Caso tivessem mantido a estratégia, o estudo não teria comprovado
não inferioridade da angioplastia.
Desta
forma, terminamos esta postagem
com duas mensagens principais: (1) estudos de não inferioridade representam uma
metodologia útil e necessária para muitos casos; (2) devemos estar atentos para
a esperteza de autores que burlam regras metodológicas no intuito de comprovar
suas hipóteses.
Esta esperteza foi tão
evidente que nos motivou enviar uma carta ao editor, aceita para publicação no NEJM no dia seguinte à sua submissão. Terminamos
esta postagem com o teor de nosso texto:
To the Editor: In
their report on a noninferiority trial involving patients with left main
coronary artery disease, Park et al. (May 5 issue) conclude that
percutaneous coronary intervention (PCI) was noninferior to coronary-artery
bypass grafting (CABG). However, the authors recognize that a
lower-than-expected incidence of the primary end point at 1 year provided
insufficient statistical power. Therefore, a 2-year analysis was reported, with
a cumulative incidence of the primary end point of 12.2% for PCI and 8.1% for
CABG. At this point, the authors shifted the statistical approach to a
superiority analysis and reported a P value of 0.12, indicating no
significant difference between the two groups.
Taking the number
of events listed in Table 2 of the article, we calculated the 95% confidence
interval for the 2-year incidence of events as 9 to 16% for PCI and 5 to 12%
for CABG. Considering these limits, we estimated the 95% confidence interval
for the difference between the treatments as −3 to 11%, which
encompasses the predefined noninferiority margin of 7%. Therefore, if the
authors had used the initial approach of nonineriority analysis in analyzing
the 2-year data, the conclusion would be that PCI did not meet the
noninferiority criterion, as compared with CABG.


