Medicina Baseada em Evidências: setembro 2011

sexta-feira, 30 de setembro de 2011

Queremos realmente transformar troponina em D-dímero?

Há 1 semana foi publicado no Jounal of American College of Cardiology o artigo intitulado Rapid Exclusion of Acute Myocardial Infarction in Patients with Undetectable Troponin using a High-sensitivity Assay. A análise e interpretação dos dados por parte dos autores provoca uma interessante discussão sobre a interpretação dos componentes da acurácia e utilidade de certas propostas diagnósticas.

Nos últimos anos, a indústria tem aprimorado a capacidade dos ensaios de troponina em detectar mínimas concentrações desta proteína plasmática e com maior precisão (reprodutibilidade). Estas são as chamadas troponinas de alta sensibilidade.

Nesta coorte de 703 indivíduos com dor torácica aguda, Body R. et al demonstraram que o uso de um ensaio de troponina alta sensibilidade associado a um ponto de corte mais baixo que o habitual (qualquer nível detectável seria definido como troponina positiva) produz 100% de sensibilidade para o reconhecimento de infarto do miocárdio, levando a um valor preditivo negativo perfeito. Assim, os autores concluíram que "esta estratégia pode ser usada para reduzir as internações desnecessárias".

É exatamente esta frase que pretendo analisar sob a ótica da metodologia de avaliação de métodos diagnósticos.

Em primeiro lugar, a fim de reduzir o número de pacientes desnecessariamente internados no hospital, um teste deve ter uma melhor capacidade de reconhecer indivíduos saudáveis que podem receber alta. A capacidade de reconhecer as pessoas saudáveis é definida como especificidade. Ao reduzir o ponto de corte de qualquer teste diagnóstico, ocorre um aumento de sensibilidade, à custa de redução na especificidade.

E foi exatamente isso que aconteceu quando os autores compararam o desempenho da troponina de alta sensibilidade associada ao mínimo ponto de corte, com a referência da troponina tradicional. Houve um aumento da sensibilidade de 85% para 100%. No entanto, ocorreu também diminuição na especificidade de 82% para 34%. E uma vez que um número menor de pessoas saudáveis serão identificados, é altamente questionável se esta abordagem realmente reduz internações desnecessárias. Mesmo que diferentes pontos de corte sejam adotadas para diagnosticar e afastar infarto, uma zona cinzenta de confusão será criada, levando a uma dúvida considerável se realmente esta abordagem seria útil na prática clínica.

Desta forma, apenas 28% dos pacientes apresentaram troponina negativa. O problema é que o estudo não relatou quantos destes 28% realmente receberem alta hospitalar logo após o resultado da troponina. Destes pacientes, alguns poderiam ter dor no peito muito típica, caracterizando angina instável; alguns poderiam ter alterações isquêmicas do ECG; e outros poderiam ter outra causa grave de dor torácica que impediria a alta. Portanto, uma troponina negativa não significa necessariamente alta hospitalar. E o número real de pacientes em que o resultado ajudou na decisão de alta não está claro no artigo.

Segundo a Definição Universal de Infarto, devemos considerar o percentil 99 da troponina como o ponto de corte para este diagnóstico, o que proporciona boa acurácia diagnóstica (sensibilidade 85% e especificidade 82%, segundo o artigo de Body et al). Antes de trocar esta boa acurácia da definição universal de infarto, por uma maior sensibilidade à custa de bem menor especificidade (semelhante ao D-dímero para embolia pulmonar), evidências científicas convincentes devem ser apresentadas. Por enquanto, não está demonstrado, nem é plausível, que uma significativa redução de especificidade (detecção de saudáveis) proporcione maior liberação precoce de pacientes com dor torácica. Pelo contrário, isso poderá provocar maior número de internamentos desnecessários.

O D-dímero é um teste que intrinsecamente não tem especificidade. Não há outra alternativa, ele só pode nos oferecer sensibilidade. Mas a troponina é diferente. Este teste tem tanto sensibilidade como especificidade. Não parece fazer tanto sentido transformar a troponina em D-dímero.

Talvez faça sentido para a indústria da troponina de alta sensibilidade. É a briga intensa pelo mercado de dosagens bioquímicas.

Cuidado com algo muito sensível, pode ser pouco específico. Cuidado com algo muito específico, pode ser pouco sensível. Nem sempre vale a pena trocar o equilíbrio da sensibilidade e especificidade (crossover no gráfico acima), pela priorização de alguma destas propriedades.

* Esta é mais uma postagem da séria Análise Crítica de Evidências Diagnósticas.
* Uma versão modificada destes artigo foi aceita para publicação no Journal of the American College of Cardiology (in press).

quinta-feira, 22 de setembro de 2011

Ensaio sobre Conflitos de Interesse

De acordo com a enciclopédia Wikipedia, conflito de interesse é um termo que se aplica quando um indivíduo (ou organização) tem envolvimento com múltiplos interesses, de forma que um interesse pode corromper a motivação pelo outro interesse.

Conflito de interesse é um fenômeno intrínseco na natureza, todos nós lidamos com isso, a toda hora. Alguém pode ter interesse em perder peso, porém ao mesmo tempo tem interesse em se divertir tomando um sorvete. Claro que o interesse na diversão vai prejudicar a meta de perda de peso.

O conflito de interesse começa a se tornar algo mais sério quando envolve situações profissionais. Recentemente Palocci perdeu seu cargo de Ministro da Casa Civil, pois seu forte envolvimento prévio (no sentido monetário) com empresas privadas poderia influenciar suas ações públicas em prol destas empresas. Um advogado não pode representar a pessoa A contra a pessoa B, se em outro processo o mesmo advogado representa a pessoa B contra outra pessoa C. Se o segundo processo for maior que o primeiro, a pessoa A pode ser mal representada para que B seja favorecido.

Em ciência não poderia ser diferente, conflitos de interesse permeiam diversas relações. Aqui o primeiro interessado é a verdade científica. O problema é que diversas vezes a verdade científica é enviesada devido a outros interesses dos cientistas ou dos formadores de opinião. É o conflito da verdade científica versus interesses pessoais.

Há diversos níveis de conflitos de interesse, vamos analisar de um extremo a outro.

No extremo superior, estão aqueles formadores de opinião que recebem verba para dar palestas em eventos organizados pela indústria farmacêutica (ou de equipamentos) ou escrever boletins informativos em nome da indústria. Nesta situação, é grande a probabilidade de viés (consciente ou inconsciente) na forma como as coisas são colocadas. Por outro lado, não vejo grande problema, pois a intenção do evento ou boletim está explícita, é fazer propaganda. E fazer propaganda não é pecado, principalmente no mundo capitalista. Nesta situação, cabe aos ouvintes ou leitores julgar criticamente as informações, separando o que concordamos ou discordamos. Ou simplesmente fazer o mesmo que fazemos com propaganda política: desligamos a televisão ou mudamos para o canal da TV fechada. Na prática, significa não se vender por um jantarzinho da indústria. Ficar em casa estudando pode ser uma idéia bem melhor. Ou, automaticamente jogar fora aqueles encartes que os representantes distribuem. Melhor ainda jogar em lixo reciclável.

Assim, resolvemos esta situação. Inclusive, devo salientar que este tipo de conflito de interesse de formadores de opinião não pode ser considerado um problema ético, pois o conflito é declarado. É algo que faz parte do nosso mundo capitalista. Simplesmente é assim.

O problema é quando vamos nos distanciando deste extremo e as coisas começam a ficar menos claras. Por exemplo, o mesmo palestrante do evento da indústria pode ser convidado por um evento de sociedade médica para falar de um assunto semelhante. Nestas situações, os palestrantes devem declarar conflitos antes da aula. Porém, mesmo que o façam, é difícil definir o grau de influência que o conflito pode estar tendo no palestrante.

Pior é quando se trata de editoriais escritos por indivíduos de referência em revistas científicas de respeito. Há alguns anos, foi publicado o ensaio clínico POISE no Lancet, demonstrando que o uso de beta-bloqueador iniciado em pré-operatório de cirurgia não cardíaca aumenta mortalidade. No entanto, o editorial que acompanhou o artigo, escrito por Poldermans D, defendia a manutenção da prática do beta-bloqueador. Isso mesmo, sem nem mesmo propor um outro estudo que utilizasse uma abordagem diferente de uso de beta-bloqueador, o editorialista sugere que se continue usando, desde que de forma mais cuidadosa. Dias depois fui ao Congresso Mundial de Cardiologia em Buenos Aires. Estava sem alternativa para almoçar e aí resolvi pegar uma daquelas caixinhas de comida de simpósio satélite. Quando entrei na sala para pegar o lanche (reconheço, foi um conflito de interesse, mas eu estava com fome), percebi que ali estava ele, o mesmo Polderman D, falando em um simpósio satélite sobre uso de beta-bloqueador em cirurgia não cardíaca. Não resisti, fiz uma pergunta bastante provocativa, o que o irritou bastante. Percebo que a irritação do speaker é um sinal de que ele não está plenamente confortável naquele papel.

Há alguns anos foi publicado um editorial favorável ao uso de Levosimedan nos Arquivos Brasileiros de Cardiologia, por um autor suíço. Naquela época o ensaio clínico Survive já havia sido publicado, demonstrando ausência de benefício desta droga em pacientes com insuficiência cardíaca descompensada. Como reação a este editorial fora de contexto, Flávio Fuchs enviou carta ao editor, chamando atenção sobre as afirmações não embasadas em evidências e mostrando que o autor do editorial havia omitido seus conflitos de interesse na publicação do estudo.

Sem querer dar uma de puritano, devemos reconhecer que conflitos de interesse fazem parte de todas as facetas da vida. Cabe a nós sabermos nos proteger. Mas como? Desenvolvendo um senso crítico e aprimorando nossa capacidade de julgamento da literatura médica, pelas técnicas da medicina baseada em evidências.

Finalmente, lhes convido a assistir a brilhante conferência (5 minutos) do psicólogo americano Dan Airely sobre conflitos de interesse, apresentada durante o evento anual TED, na Califórnia.

terça-feira, 20 de setembro de 2011

Menopausa e Doença Cardiovascular: a queda de um paradigma?

Um pensamento coletivo bem consolidado é o da menopausa como fator de risco para doenças cardiovasculares. Teoricamente, as mulheres passam a apresentar maior risco cardiovascular após a menopausa, pois perdem o efeito protetor do estrógeno. Seria neste momento que o risco das mulheres se aproxima do risco dos homens.

Na semama passada, foi publicado no British Medical Journal um sofisticado estudo, que traz forte questionamento à idéia corrente a respeito do assunto. Mas antes de discutir esta nova evidência, vamos revisar quais evidências prévias sugerem que o status pós-menopáusico representa um fator de risco cardiovascular.

A idéia faz sentido e todos nós aprendemos desta forma. No entanto, devemos reconhecer que este conceito é embasado em um raciocínio fisiopatológico, sem comprovação epidemiológica. Pelo contrário: desde a década de 60, estudos compararam mortalidade por doença cardiovascular entre diferentes populações separadas por faixa etária e demonstraram que quanto maior a idade da população, maior o risco cardiovascular. Porém, na idade típica da menopausa (50 anos), não se observou um aumento adicional no risco além da influência do "envelhecimento". Ou seja, os estudos não demonstravam um ponto de inflexão que indicasse algo mudar no momento da menopausa.

No entanto, estes estudos eram limitados por seu desenho. Eram estudos transversais, realizados em diferentes amostras de pacientes, de faixas etárias diferentes. Estas amostras de faixas etárias diferentes eram comparadas, mostrando maior mortalidade por doença cardiovascular nas amostras de idade mais avançada. Porém o ideal seria acompanhar prospectivamente os mesmos pacientes, demonstrando o efeito do tempo na ocorrências dos desfechos. Isto ainda não havia sido publicado, até a semana passada.

Desta forma, no último número do British Medical Journal, foi publicado o trabalho Ageing, menopause, and ischaemic heart disease mortality in England, Wales, and the United States, pelo grupo da Universidade de Johns Hopkins. Estas análises foram realizadas em bases de dados censitárias destes países, as quais acompanham a mesma população ao longo do tempo. Utilizando estes dados, a mortalidade por doença isquêmica do coração foi registrada ao longo do tempo, na mesma população. De fato, esta mortalidade vai aumentando com o progredir do tempo, ou seja, com o envelhecimento da população. Porém não houve nenhum incremento desta mortalidade na faixa etária típica da menopausa. Ou seja, o aumento de risco ao longo do tempo é constante, aparentemente o efeito é apenas da idade. Não há ponto de inflexão.

Isto é importante, pois a principal diferença entre mulheres menopausadas e não menopausadas é exatamente a idade. Desta forma, as primeiras podem ter risco cardiovascular aumentado somente (ou principalmente) por isso, sem grande influência dos hormônios propriamente ditos. Neste caso, idade seria uma variável de confusão na associação entre menopausa e risco.

Faz sentido, não?

Em contraste, quando mortalidade por câncer de mama foi analisada, observou-se uma queda específica do risco após a menopausa. Ou seja, no caso do câncer de mama, o estudo detectou o efeito de fatores além da idade, provavelmente fatores hormonais.

Mas se não há associação entre menopausa e risco, por que o risco da mulher tende a se igualar ao do homem em torno deste momento? O estudo também responde isto. Enquanto a mulher cresce de forma uniforme o risco de infarto com o passar da idade, o homem tem uma aceleração inicial e na quinta década há uma certa desaceleração no crescimento de seu risco, o que os aproxima das mulheres.

Esta evidência vai ao encontro dos ensaios clínicos que mostram que terapia de reposição hormonal não reduz risco cardiovascular. Dentre os critérios de causalidade, este seria um dos principais: reversibilidade. Ou seja, ao retirar (ou tratar) o fator, a consequência desaparece. Por exemplo, ao tratar colesterol, infarto reduz sua incidência. Ao tratar hipertensão, AVC reduz. Por outro lado, ao tratar a queda de hormônio típica da menopausa, o risco não diminui. Por que? Provavelmente porque não é a menopausa que aumenta o risco da paciente. É a sua idade e os fatores de risco clássicos que acompanham o envelhecimento. Agora fica melhor explicado porque terapia de reposição hormonal não tem benefício cardiovascular.

A idéia aqui discutida parece nova, mas na verdade não é. Em 1997, em artigo de revisão publicado no Circulation (Sex Differences in Coronary Heart Disease), Elizabeth Barrett-Connor afirmava “the universal excess risk of CHD in men noted above, coupled with the apparent loss of the female advantage in women who had an early menopause, led to the hypothesis that endogenous estrogen is cardioprotective. Proof of this hypothesis has been surprisingly elusive.”

Dizem que paradigmas ou verdades científicas mudam a toda hora. Penso diferente. Mudam aquelas idéias que na realidade nunca foram paradigmas, pois eram só idéias sem comprovação científica.

Quando vejo estas idéias sendo derrubadas, lembro-me da história dos Três Porquinhos. O porquinho que construía rapidamente sua casa, de forma precipitada, sem muita base (casa de palha), sempre se dava mal. Nossos argumentos, nossas idéias, nossas verdades devem se construir com base em fortes alicerces, ou seja, evidências de alta qualidade. Senão, algum dia, mais cedo ou mais tarde, o sopro do lobo será capaz de derrubar o idéia, que nunca foi um paradigma verdadeiro.

segunda-feira, 12 de setembro de 2011

Curso de Medicina Baseada em Evidências no Núcleo de Oncologia da Bahia

domingo, 11 de setembro de 2011

Estudos de Não Inferioridade II (por Adriana Latado)

Existem dois aspectos críticos na hipótese na não inferioridade. O primeiro é a definição da margem de não inferioridade. A idéia é que se defina qual o limite máximo de diferença entre o tratamento novo e o controle ativo considerado clinicamente irrelevante, quando o efeito for a favor do controle ativo. Ou melhor, o tratamento teste pode ter resultado melhor, aparentemente igual ou até “um pouco” pior do que o controle ativo para ser considerado não inferior. Para isso, esse “pouco pior” deve cair dentro da margem de não inferioridade. A definição desse limite pode levar em consideração critérios clínicos e estatísticos, sendo muito interessante a união de ambos os conhecimentos. Do ponto de vista estatístico, comumente utilizá-se o intervalo de confiança para se definir a margem de não inferioridade. A estratégia é usar o limite inferior do intervalo de confiança da medida de associação obtida em ensaio clínico que testou o controle ativo versus placebo, cujo resultado demonstrou efeito benéfico estatisticamente significante a favor do controle ativo. Ou seja, admite-se que o limite inferior desse intervalo de confiança é o mínimo efeito clinicamente relevante que se espera ter de um tratamento específico de modo reduzir o risco de um desfecho (quando comparado a não fazer intervenção). Se, no estudo de não inferioridade, o efeito do tratamento novo ou teste, comparado ao controle ativo, é menor do que esse limite (significa que está dentro da margem de não inferioridade), conclui-se que a nova intervenção é não inferior ao tratamento habitual com o que foi comparada. Na verdade, é comum o uso de uma fração de correção (f) sobre o limite inferior do intervalo de confiança, com objetivo de corrigir inconsistências entre a comparação atual e aquela entre controle ativo e placebo.

Outro aspecto crucial é o planejamento do estudo de não inferioridade, especialmente no que diz respeito à seleção da amostra, definição de desfechos e estratégia de análise estatística. Os indivíduos selecionados para o estudo de não inferioridade entre tratamento teste e controle ativo devem ter características demográficas, clínicas) muito semelhantes às pessoas estudadas no ensaio clínico de qualidade que serviu de base para a definição da margem de não inferioridade. Deve-se ter em mente que ‘tratamento novo não inferior ao controle ativo’ significa admitir que o tratamento novo tem efeito em relação ao placebo não inferior ao que o controle ativo apresentou sobre placebo em estudo prévio.

Sobre a definição de desfechos de interesse, a mesma questão se impõe. O estudo de não inferioridade deve medir evento similar ao que foi avaliado no ensaio clínico entre controle ativo e placebo que lhe serviu de base. Caso contrário, a extensão do conceito de não inferioridade fica prejudicada.

Finalmente, a escolha da estratégia de análise de dados tem se mostrado um ponto importante de discussão, e, recentemente, tem-se sugerido que a análise por intenção de tratamento seja complementada pela análise por protocolo nos estudos de não inferioridade. Aspectos que envolvem a análise por intenção de tratamento (intention to treat analysis) tendem a favorecer a não inferioridade, na medida em que caminham em direção à ausência da diferença entre os grupos, o que, no estudo de não inferioridade, está contemplada pela hipótese alternativa do investigador. Apesar dos vieses conhecidos e implícitos da análise por protocolo (ou seja, avaliam-se apenas os integrantes dos grupos que efetivamente utilizaram a intervenção), tem-se defendido que a premissa da não inferioridade deverá ser aceita apenas se o tratamento teste demonstrar-se não inferior ao controle ativo nas análises por intenção de tratamento e por protocolo.

domingo, 4 de setembro de 2011

O que são Ensaios Clínicos de Não Inferioridade?

Este tipo de estudo tem se tornado frequente entre importantes trabalhos publicados em revistas de alto impacto. No entanto, a razão da escolha por este desenho de estudo e a metodologia por trás dele é pouco compreendida.

Esta pouca compreensão leva alguns a pensarem que este desenho de estudo é um subterfúgio da indústria farmacêutica para demonstrar o valor de coisas que não têm tanto valor. Apesar de minha usual visão crítica em relação à indústria, devo afirmar que não é bem assim. Estudos de não inferioridade representam uma metodologia adequada e útil, quando corretamente aplicada.

Então, quando se usa e para que servem estes estudos?

Estes estudos fazem parte de um grupo classificado como estudos de eficácia comparativa, os quais são usados quando um tratamento novo é comparado a um tratamento tradicional. Neste caso, os estudos podem ser de superioridade ou de não inferioridade.

Os estudos de superioridade representam o modelo tradicional, com o qual estamos acostumados a lidar. Se aplicam tanto para eficácia comparativa (tratamento novo vs. tratamento tradicional), como para eficácia (tratamento vs. placebo/controle). No caso da eficácia comparativa, este tipo de desenho parte da premissa de que o tratamento novo tem motivos para ser superior ao tratamento tradicional. A possível superioridade justifica a troca do tradicional pelo novo. Por exemplo, stent farmacológico (novo) tem motivos para ser melhor do que stent convencional na prevenção de reestenose (um pouco). Desta forma, os estudos que comparam estes dois tipos de stent são de superioridade, pois a hipótese é de que o farmacológico é melhor do que o convencional.

A segunda situação é quando o tratamento novo não tem vantagem teórica que suporte uma hipótese de maior eficácia. Porém mesmo que não seja mais eficaz, o novo pode ser preferido devido a outras vantagens: ter maior praticidade na administração do tratamento, ser menos agressivo (traumático), ter menos efeitos adversos.

Alguns exemplos: heparina de baixo peso molecular (novo na década de 90) no tratamento de embolia pulmonar, comparada a heparina não fracionada (tradicional) . Ambos vão anticoagular o paciente, portanto não há grandes motivos para se acreditar que o novo será melhor. Porém a HPBM tem administração subcutânea, não precisa de acesso venoso, não necessita de controle do nível de anticoagulação, eliminando a necessidade de exames laboratoriais frequentes e permitindo alta da UTI mais precoce. É grande a vantagem prática.

Dabigatran é um anticoagulante oral que não necessita de controle do tempo de protrombina. Mesmo que não fosse superior aos cumarínicos, possuiria uma enorme vantagem prática.

Trombolítico de administração em bolus (TNK-tPA) são mais práticos do que rt-PA cuja administração requer infusão de 90 minutos. Mesmo que não sejam superiores, podem ser preferidos.

Angioplastia coronária é um tratamento menos agressivo e mais confortável para o paciente, quando comparado a cirurgia de revascularização. Angioplastia pode ser menos eficaz que cirurgia no controle de angina, porém a vantagem da menor agressividade pode justificar a opção por este tratamento.

Nestas situações, o tratamento novo pode ser justificado se ele não for muito pior do que o tratamento tradicional. Digo muito pior, pois nos estudos de não inferioridade se tolera uma certa margem de inferioridade, uma margem que pode ser compensada por outras vantagens. Isto que dizer que não inferioridade não é sinônimo de equivalência. Não inferioridade significa que não é suficientemente inferior para anular a vantagem prática no novo tratamento.

A margem aceitável de inferioridade nunca deve ultrapassar o razoável, nunca deve haver perda de mais de 50% de eficácia do tradicional em relação ao controle (preferencialmente bem menos que isso). Os autores determinam previamente a margem que definirá não inferioridade. Por exemplo, se vamos tolerar apenas uma perda de 20% da eficácia, o limite superior do intervalo de confiança do risco relativo não deve ultrapassar 1.2. Imaginem, RR = 1.1 (95% IC = 1.03 – 1.19) não ultrapassou o 1.2, então consideramos isto não inferior. Isto pode ser feito tanto com risco relativo, como com risco absoluto.

Com base nisso, calcula-se o valor de P, cuja interpretação é o contrário de estudos de superioridade. Ou seja, P < 0.05 indica não inferioridade, mostrando que significância estatística neste caso mostra uma ausência de diferença grande (nos estudos de superioridade P < 0.05 indicam diferença).

Parece confuso, mas é só entender que o estudo de não inferioridade testa a hipótese nula de que o tratamento novo é inferior. Caso P < 0.05 rejeita-se a hipótese nula e ficamos com a hipótese alternativa de que o tratamento novo é não inferior. Estatisticamente, hipótese nula e alternativas estão trocadas em relação aos estudos de superioridade.

Em suma, se o intervalo de confiança não ultrapassar o limite de pouco pior, consideramos não inferior. Ou, se o valor de P estiver abaixo de 0.05, consideramos não inferior.

Vamos agora à situação prática que nos motivou a escrever esta postagem, o estudo PRECOMBAT, recentemente publicado no NEJM.

Tradicionalmente, lesões de tronco de coronária esquerda possuem indicação cirúrgica quase inquestionável. Porém, o tratamento de angioplastia com stent tem evoluído, se tornando factível o procedimento em tronco. Não podemos partir de premissa de que angioplastia é superior a cirurgia, mas poderíamos imaginar que se não fosse muito pior, a vantagem de evitar uma cirurgia de risco poderia compensar. Desta forma, o estudo PRECOMBAT é um estudo de não inferioridade da angioplastia versus cirurgia de tronco. Faz sentido, não?

Assim, os autores definiram que 7% seria a margem de não inferioridade, ou seja, o limite superior do intervalo de confiança do aumento absoluto de risco de morte, infarto, AVC ou necessidade de revascularização. Sem dúvida, esta margem está ampla demais, 7% aumento de risco absoluto representaria um NNT de 19 (100/7) para provocar um evento indesejado se angioplastia fosse realizada ao invés de cirurgia. Mas mesmo assim, poderíamos considerar isso aceitável em pacientes de altíssimo risco cirúrgico ou que se recusem a fazer cirurgia.

Bem, no seguimento de um ano, o aumento absoluto de risco não ultrapassou essa margem (absolute risk difference, 2.0 percentage points; 95% confidence interval −1.6 to 5.6; P=0.01 for non- inferiority), porém a incidência de eventos foi menor do que o esperado, fazendo com que esta análise tivesse baixo poder estatístico. Assim os autores prolongaram a análise para o seguimento de 2 anos. Só que neste momento (espertamente), eles modificaram a regra do jogo e fizeram uma análise de superioridade (ilógica), na qual não mostraram diferença significante. Caso tivessem mantido a estratégia, o estudo não teria comprovado não inferioridade da angioplastia.

Desta forma, terminamos esta postagem com duas mensagens principais: (1) estudos de não inferioridade representam uma metodologia útil e necessária para muitos casos; (2) devemos estar atentos para a esperteza de autores que burlam regras metodológicas no intuito de comprovar suas hipóteses.

Esta esperteza foi tão evidente que nos motivou enviar uma carta ao editor, aceita para publicação no NEJM no dia seguinte à sua submissão. Terminamos esta postagem com o teor de nosso texto:

Stents versus CABG for Left Main Coronary Artery Disease

To the Editor: In their report on a noninferiority trial involving patients with left main coronary artery disease, Park et al. (May 5 issue) conclude that percutaneous coronary intervention (PCI) was noninferior to coronary-artery bypass grafting (CABG). However, the authors recognize that a lower-than-expected incidence of the primary end point at 1 year provided insufficient statistical power. Therefore, a 2-year analysis was reported, with a cumulative incidence of the primary end point of 12.2% for PCI and 8.1% for CABG. At this point, the authors shifted the statistical approach to a superiority analysis and reported a P value of 0.12, indicating no significant difference between the two groups.

Taking the number of events listed in Table 2 of the article, we calculated the 95% confidence interval for the 2-year incidence of events as 9 to 16% for PCI and 5 to 12% for CABG. Considering these limits, we estimated the 95% confidence interval for the difference between the treatments as −3 to 11%, which encompasses the predefined noninferiority margin of 7%. Therefore, if the authors had used the initial approach of nonineriority analysis in analyzing the 2-year data, the conclusion would be that PCI did not meet the noninferiority criterion, as compared with CABG.