domingo, 25 de junho de 2023

Não-inferioridade é Deslocamento da Hipótese Nula

 

O ensaio clínico TRASVERSE, recentemente publicado no NEJM, foi um estudo de “não inferioridade a placebo”, com objetivo de “explorar os efeitos da reposição de testosterona em eventos cardiovasculares”. 

Aproveitei esse estudo para gerar a discussão da semana passada no Fórum de nosso Curso Online de MBE, no intuito de elaborar sobre (1) o deslocamento da hipótese nula, (2) porque esta é a análise mais adequada para explorar segurança, (3) e como exercitar generalização e transportabilidade de evidências sobre segurança. As seguintes perguntas foram feitas aos participantes do Curso, o que gerou uma ótima discussão, dando origem a este texto. Agradeço aos colegas a participação nestas reflexões. 

NEJM: Cardiovascular Safety of Testosterone-Replacement Therapy

Hipótese: não inferioridade a placebo (limite superior do IC do HR < 1.5)

Resultado: A primary cardiovascular end-point event occurred in 7.0% in the testosterone group and in 7.3% in the placebo group (hazard ratio, 0.96; 95% confidence interval, 0.78 to 1.17; P<0.001 for noninferiority).

Conclusão: In men with hypogonadism and preexisting or a high risk of cardiovascular disease, testosterone-replacement therapy was noninferior to placebo with respect to the incidence of major adverse cardiac events.





1. Como você interpreta o planejamento do estudo de demonstrar não inferioridade da testosterona em relação ao placebo?

Na análise tradicional (eficácia de tratamento ou fator causador de doença), a hipótese nula é ZERO, e a rejeição da hipótese nula nega ausência de efeito. O resultado é que ficamos com a hipótese alternativa de que há influência da exposição no desfecho. A direção da influência mostra se o efeito é benéfico ou maléfico. 

Mas como fazemos para testar segurança? Neste caso, a hipótese nula não pode ser zero, pois insegurança não é zero de diferença entre exposto e não exposto. Pelo contrário, insegurança é uma diferença maior que zero na incidência de complicação nos expostos versus incidência nos não expostos: IE - Inão E. Portanto, usamos a análise de não inferioridade, onde simplesmente deslocamos a hipótese nula para um valor maior que zero. Por exemplo, uma hipótese nula de 2% de aumento de complicações. Neste caso, ao rejeitar 2% na análise unicaudal, estamos dizendo que a exposição não provoca 2% ou mais de complicações se comparado a não exposição. 

A análise é unicaudal, pois o construto de insegurança diz respeito ao resultado à esquerda dessa hipótese nula. Além disso, às vezes, a própria definição de insegurança é inerente à intervenção, sendo impossível um resultado em outro sentido: sangramento por anticoagulação (impossível que a droga reduza sangramento), complicação típica de cirurgia (impossível que complicação cirúrgica seja mais frequente em tratamento clínico).

OBS: Embora eficácia também seja um construto apenas à esquerda da hipótese zero, faz-se análise bicaudal, pois a omissão de um efeito contrário ao desejado é grave e não pode ser perdida. 

OBS: nesta explicação utilizei medida de associação aditiva (diferença absoluta de risco), pois fica mais intuitivo explicar a hipótese nula de zero. Mas podemos fazer o mesmo com medidas de associação multiplicativas (risco relativo, hazard ratio, odds ratio), sendo que a hipótese nula tradicional é 1, e o deslocamento de não inferioridade é para valores maiores que 1. 


2. Esta estratégia PROVA segurança da droga na população do estudo?

Inferência Causal Tradicional: Quando rejeitamos a hipótese nula zero, não estamos comprovando um valor específico diferente de zero, estamos apenas dizendo que não é zero. Não zero é causalidade.  

Inferência Causal por Não Inferioridade: Quando rejeitamos de forma unicaudal a hipótese nula 2%, não estamos comprovando zero, estamos apenas dizendo que não é tão ruim quando 2%. Isto permite concluir que não há causalidade de 2% ou mais.  

PROVA de segurança não existe, pois segurança é ausência, e ausência é invisível. No máximo, podemos afirmar que o estudo rejeita a hipótese de que o aumento de risco supere o valor pré-determinado. 

Por isso que o framework do descolamento da hipótese nula é o mais adequado para avaliar segurança, pois de uma forma conservadora estamos tendo o cuidado de apenas dizer que não causa um prejuízo maior que o valor da hipótese nula. Esse cuidado não acontece quando concluímos que algo é seguro baseado na não rejeição da hipótese nula de zero. Pois não rejeitar o zero não quer dizer que comprovamos o zero. E essa não rejeição pode ter ocorrido por falta de poder estatístico. Assim, o mais adequado para testar segurança é a análise de não inferioridade comparada a placebo. Ou seja, uma análise de não insegurança acima de um certo limite. 

3. Sendo um estudo de não-inferioridade, a análise primária deveria ter sido por protocolo, ao invés de intenção de tratar?

A análise por protocolo tem a vantagem de prevenir a subestimava de efeito que ocorre na análise por intenção de tratar, na qual o contraste entre os grupos quanto à exposição é menor, pois oz tratamentos se misturam pela falta de aderência. Por outro lado, a análise por protocolo equivale à de um estudo não experimental (observacional), pois perde-se o efeito da randomização. Por este motivo, não podemos afirmar que a análise por protocolo é superior à análise por intenção de tratar. Estas passam a ser análises complementares, na medida em que uma cobre a deficiência da outra. 

Há um outro complicador na análise por protocolo neste caso. Como definir não aderência em um tratamento contínuo? Quem usou a droga por 1/3 do período do estudo, e depois parou, será analisado em que grupo? É uma decisão arbitrária também. 

Por isso, a meu ver, os autores optaram por descrever uma análise de sensibilidade, ajustando para não compliance. Partindo-se da incidência observado do desfecho (compliance < 100%), faz-se uma estimativa do quanto seria a incidência se houvesse 100% de compliance. 

Julgo que o melhor caminho para estudos de não inferioridade seja manter a randomização (ITT), e complementar com análises por protocolo ou ajuste de compliance. Embora menos usados, estes ajustes me parecem fazer mais sentido, pois não desfazem a randomização.

4. Que outro viés típico de ensaios clínicos randomizados pode ter ocorrido?

Viés de seleção emigratório. 

Data were available for 82.7% of the possible follow-up time (observed person-time divided by
total person-time, on the assumption of no withdrawals) in the testosterone group and 81.7% of the possible follow-up time in the placebo group.”

A perda de seguimento reduz a validade interna, na medida em que pode causar viés de seleção emigratório. Viés de seleção ocorre quando a seleção (de quem entra ou sai) é motivada simultaneamente pela exposição e por mais predisposição ao desfecho. Mesmo que o número de pacientes perdidos seja igual nos dois grupos, não sabemos se quem saiu no grupo exposto teria mais desfecho do que quem saiu no grupo não exposto. 

Por outro lado, observe que isso é diferente de ausência de seguimento. Em estudos de incidência de eventos clínicos (diferente de medida antes e depois), quando um seguimento é interrompido, a análise de sobrevida computa o valor do paciente proporcional ao tempo em que este foi seguido. Isso não elimina viés de seleção, mas ameniza diferenças entre tempo de seguimento. 

5. Se considerarmos que a conclusão do estudo possui validade interna, partiremos para a validade externa: podemos generalizar este resultado? E podemos transportar este achado para pessoas de baixo risco cardiovascular, sem hipogonadismo, que desejam utilizar o tratamento para fins de qualidade de vida.  

Generalização é um construto de pensamento que se refere à população-alvo (paciente com hipogonadismo e sintomas). O que foi observado na amostra do estudo é generalizável para a população-alvo (hipogonadismo, sintomas e alto risco cardiovascular)? Esta pergunta é necessária pois, em estudos de seleção não probabilística, há sempre diferença entre a população do estudo (observada) e a população alvo (pretendida). Julgo que nas doses testadas, o estudo é generalizável. Não vejo variável com alto potencial de modificação de efeito. Sigo o princípio da complacência.

6. Por que usei o termo transportar?

Transportabilidade se refere a aplicação do resultado para fora da população-alvo: pacientes sem hipogonadismo ou pacientes de baixo risco. Para os de baixo risco cardiovascular com hipogonadismo, julgo transportável. Para os que tem testosterona mais alta, e o nível plasmático pode ficar supra fisiológico, não arriscarei transportabilidade. Observem que o princípio da complacência é mais variável quando falamos em transportabilidade. 

Após essa discussão, pedirei aos participantes de nosso programa online para responder a seguinte pergunta: após essa discussão, você julga que a evidência apresentada a respeito da segurança da testosterona tem suficiente validade interna, aplicabilidade e utilidade para o raciocínio clínico?

Na próxima semana, publicarei a votação e um breve comentário a respeito do processo de decisão clínica a este respeito. 

-----------------------------------------------------------------------------------------------------------------------------

Clique aqui para acessar a página do Curso Online de MBE













Um comentário: