sexta-feira, 1 de abril de 2016

Estudo SPRINT e a Definição de Hipertensão: certezas e incertezas



Dentre os grandes ensaios clínicos publicados em 2015, sem dúvida o SPRINT foi dos mais impactantes. Para este Blog, um estudo de grande importância, pois reacende o debate que tive com o mestre Flávio Fuchs em novembro de 2013Aquele debate se fez espontaneamente, por troca de emails na madrugada de uma terça-feira comum, ganhando notoriedade quando publiquei sob a forma de postagem no Blog. Flávio conta essa história em seu livro de memórias acadêmicas, eternizando nossa troca de ideias.

Naquela época questionei de forma provocativa a falta de evidência para o tratamento da hipertensão leve, levando Flávio a responder com argumentos epidemiológicos a favor da ideia de que valores ideais de pressão arterial são menores que 120 mmHg. 

Dois anos se passaram e no final de 2015 foi publicado no New England Journal of Medicine o ensaio clínico SPRINT, o qual comparou um tratamento intensivo da pressão arterial (meta de pressão sistólica < 120 mmHg) versus tratamento padrão (meta < 140 mmHg). O tratamento intensivo, pela primeira vez, se mostrou superior ao usual. Seria uma das exceções ao princípio do less is more

Ora, se baixar a pressão para níveis abaixo de 120 mmHg traz benefício, Flávio está certo ao argumentar que pressão arterial normal é algo menor do que a definição tradicional. Esta conclusão é baseada no princípio da reversibilidade: quando tratamos um fator (pressão > 120 mmHg) e o desfecho reduz (eventos cardiovasculares), confirmamos que este é fator causal. Assim, Flávio fica recompensado com a comprovação da hipótese que defendeu por tantos anos.

Minha proposta aqui é aprofundar a análise do SPRINT, avaliando o grau de incerteza em relação a este parágrafo que acabo de escrever. Nesta discussão, aproveitaremos para revisar conceitos estatísticos e princípios do pensamento baseado em evidências.

Discutirei o conceito testado neste ensaio clínico sob dois pontos de vista: o pragmático e o mecanicista. Como já comentamos em outras oportunidades, o aspecto pragmático se refere à influência do estudo na conduta médica, enquanto o mecanicista se refere à mensagem tirada do estudo quanto ao conhecimento etiológico das doenças. 

O SPRINT é um ensaio clínico randomizado de metodologia adequada (baixo risco de viés) e de grande tamanho amostral (baixo risco de erro aleatório). Sendo assim, deve ser considerado verdadeiro o resultado pragmático de que estabelecer uma meta mais exigente (< 120 mmHg) traz benefícios, quando comparado à conduta usual. 

E qual a magnitude do benefício da estratégia intensiva? O grupo padrão apresentou 6.8% de eventos versus 5.2% no grupo intensivo, uma redução absoluta de 1.6%, resultando em NNT = 68. Ou seja, é uma conduta que oferece um benefício de modesto impacto (NNT > 50), visto que de 68 pacientes tratados intensivamente, 1 se beneficia e 67 ficam no mesmo. Por outro lado, estes 67 que ficam no mesmo podem sofrer de sintomas decorrentes dos tratamento mais intenso da pressão arterial. Portanto, esta conduta pragmática deve ser individualizada com muito cuidado.

Agora, vamos evoluir a discussão para o aspecto mecanicista ou etiológico: este estudo demonstra que valores de pressão entre 120 e 140 mmHg implicam em maior risco cardiovascular, quando comparado a valores < 120 mmHg?


A Importância do Desvio-padrão 


A preocupação com aspecto mecanicista me fez procurar no artigo os valores médios obtidos de pressão arterial em cada grupo randomizado. Nesta procura, meu intuito foi de observar se os tratamentos de fato colocaram os pacientes nos valores pretendidos de pressão arterial. 

Observei que a média no grupo de tratamento padrão foi 136 mmHg, enquanto a média no grupo de tratamento intensivo foi 121 mmHg, o que estaria de acordo com o protocolo. Até aí, tudo bem. 

No entanto, uma coisa atípica me chamou atenção neste momento! Os autores escreveram a média sem o desvio-padrão, violando um princípio básico da estatística: sempre relatar a medida de dispersão (desvio-padrão) acompanhando a medida de tendência central (média). Isto porque a média sozinha fala pouco a respeito da distribuição dos valores de uma variável. A ausência do desvio-padrão é muito estranho para um artigo publicado no New England. Aliás, seria estranho em qualquer que fosse a revista.

Comecei a ficar meio ansioso e fui procurar o desvio-padrão no gráfico (abaixo) que mostra os valores obtidos de pressão arterial ao longo do estudo. É adequado que um gráfico de médias (pontos) tenha barras de erro (um T para cima e outro para baixo) que indiquem o tamanho do desvio-padrão para cada média. Fiquei feliz, pois observei que as barras de erro estavam presente e eram bem pequenas, mostrando valores individuais concentrados bem perto da média. 

Mas minha satisfação durou pouco, pois notei no rodapé do gráfico, em letras pequenas, que aquelas barras não representavam o desvio-padrão, mas sim o intervalo de confiança da média.


Vamos revisar estes conceitos. 

Lembrem que desvio-padrão (colocado de forma simplória) é a média dos desvios que cada paciente tem em relação à média geral. O valor de cada paciente sempre se distancia um tanto da média geral. A média desses distanciamentos é o desvio-padrão. Portanto, para uma mesma média, podemos ter um desvio-padrão pequeno (indicando que está tudo bem perto da média - pequena dispersão) ou um desvio-padrão grande (indicando que a média é resultado de valores bem maiores e menores do que esta mesma média - grande dispersão). 

Precisaríamos ver o desvio-padrão, para saber se a média representa bem os valores da maioria dos pacientes. Mas os autores não nos forneceram este dados. Como fazer? 

Há uma solução:

O intervalo de confiança é a média ± 2 erros-padrão (na verdade, 1.96 erros-padrão). Já o erro-padrão é o desvio-padrão dividido pela raiz quadrada do tamanho amostral. A partir de uma medida visual das barras de erro, podemos saber o que seria a amplitude para mais e para menos do intervalo de confiança. Metade dessa amplitude seria o erro-padrão. Se ficou confuso, leiam de novo, com calma, pois é simples!

Sabendo o erro-padrão, podemos multiplicar pela raiz quadrada do N e deduzir o desvio-padrão.

Vamos lá. 

Observem que as barras de erro são bem estreitas, visualmente algo como 1 mmHg para mais e para menos da média. Sendo assim, o erro-padrão seria metade disso, em torno de 0.5 mmHg. Isso multiplicado pela raiz quadrada de 4.678 (tamanho amostral) daria em torno de 34. Portanto, o desvio-padrão destas medidas está em torno de 34. No gráfico abaixo, desenhei o que seria uma verdadeira barra de erros que deveria estar no gráfico, representando a dispersão dos valores (desvio-padrão).


Assim, no grupo tratamento padrão (meta < 140 mmHg), o valor médio da pressão foi 136 com desvio-padrão de ± 34 mmHg. Agora usaremos a curva de Gauss para calcular, com base nesse desvio-padrão, quantos pacientes deste grupo ficaram com pressão > 140 mmHg. 

É assim: o valor de 140 mmHg se distancia 4 mmHg da média de 136 mmHg. Fazendo uma regra de três, 4 mmHg é o tamanho de 0.11 desvios-padrão. Esse 0.11 é o escore Z, aquele valor que representa quantos desvios-padrão algo se distancia da média. Olhando na tabela Z, um dado paciente tem 45% de probabilidade de estar além deste valor 140 mmHg. Portanto, quase metade dos pacientes do grupo cuja meta < 140 mmHg ficaram com pressão > 140 mmHg. 

Para ver a tabela Z e a curva de Gauss, acesse esse link.

Daí vem a dúvida: será que o benefício observado no grupo do tratamento intensivo decorre da prevenção de eventos em pacientes que no tratamento padrão estariam com pressão entre 120 e 140 mmHg ou o benefício advém mais dos pacientes em que o tratamento padrão resultou em pressões > 140 mmHg. 

É essa incerteza, decorrente do oculto desvio-padrão do estudo, que limita nossas inferências etiológicas. 


O Tipo de Desfecho


Uma segunda questão que acentua a incerteza mecanicista do estudo é a análise dos componentes do desfecho primário: o desfecho primário foi composto do combinado de morte cardiovascular, infarto, AVC e “internamento por insuficiência cardíaca”, sendo que o benefício decorreu principalmente da redução de “internamento por insuficiência cardíaca”. 

No desfecho morte cardiovascular, não está descrito o mecanismo específico, mas podemos avaliar qual o principal mecanismo do benefício pela análise dos desfechos não fatais. De 76 desfechos não fatais prevenidos pelo tratamento intensivo da pressão arterial, 38 foram “internamento por insuficiência cardíaca”, 19 infartos, apenas 8 AVCs. 

Soa estranho, pois é pouco esperado que um tratamento anti-hipertensivo tenha no AVC o desfecho de menor impacto. Digo isso, pois este é o desfecho mais associado ao benefício do tratamento anti-hipertensivo em ensaios clínicos. Por exemplo, no ensaio ALLHATo tratamento com diurético obteve melhores resultados na pressão arterial, resultando em menos eventos. Dos desfechos, o único em que a clortalidona foi superior ao inibidor da ECA foi AVC. 

Sendo o desfecho mais sensível ao tratamento, por que foi este desfecho que praticamente não sofreu impacto no estudo SPRINT? Paira a incerteza …

Por outro lado, o desfecho que mais contribuiu (“internamento por insuficiência cardíaca”) tem na crise hipertensiva uma das principais casusas. Isso sugere que o benefício obtido pode decorrer do aprimoramento do tratamento nos 45% dos pacientes que ficam com pressão > 140 mmHg. Este benefício provavelmente não reside nos pacientes que estavam com pressão entre 120 e 140 mmHg. Porque uma pressão de 130 mmHg causaria “internamento por insuficiência cardíaca”. É provável que benefício esteja no melhor controle pressórico de pacientes que estavam com valores bem mais acima. 

Prova de Conceito Pragmático


Então qual seriam a implicações do SPRINT?

Primeiro, devemos ficar com o conceito pragmático de almejar uma maior rigidez no controle pressórico. 

Mas o que seria essa maior rigidez? Alguém poderia dizer, “devemos perseguir uma pressão sistólica < 120 mmHg.” Este tipo de cópia do método usado no trabalho é um equívoco, já discutido na postagem “O Princípio da Prova do Conceito”. 

Esclarecendo mais uma vez, o método de um ensaio clínico é uma forma de testar um conceito. O estudo usou o método de induzir os médicos a tentar uma pressão < 120 mmHg ou < 140 mmHg, para que houvesse um gradiente de nível pressórico final entre os dois grupos. É deste gradiente, representado pelas diferença dos valores médios do estudo, que surge o efeito clínico do tratamento.

Método do trabalho serve para provar um conceito, que servirá de norte para a decisão médica. Na prática, devemos utilizar o conceito, individualizando a conduta caso a caso. Isso é medicina baseada em evidências. 

Um erro semelhante é quando copiamos critério de inclusão de estudos, sob a forma de recomendação. Por exemplo, estudos com desfibrilador implantável tiveram como critérios de inclusão pacientes com FE < 35%, provando o conceito de que este device é benéfico em pacientes com disfunção importante. Erradamente, certos guidelines colocam que a indicação de CDI é FE < 35%. E o coitado do paciente que tem FE = 36%, fica de fora? FE < 35% foi apenas uma forma de selecionar pessoas com disfunção importante, porém os estudos não compararam FE < 35% versus FE 35% - 40% versus FE > 40%, para avaliar o ponto de corte ideal. O que devemos pensar é que há benefício em pacientes com disfunção. Na medida em que a FE for aumentando, o benefício se tornará mais incerto, até um limite de incerteza que não mais aplicaremos o conceito do estudo. Limite este que deve ser julgado caso a caso. Isso é o Princípio da Prova do Conceito, que tem entrelace com o Princípio da Complacência.

Da mesma forma, a meta < 120 mmHg não foi comparada a 115 mmHg ou a 125 mmHg. Não são números mágicos, são apenas metas a perseguir para obter uma diferença de pressão entre os dois grupos. 

Não devemos confundir medicina baseada em evidências, com medicina copiada de evidências. 

O conceito do SPRINT é ser menos tolerante com valores semi-controlados de pressão. Esse é a implicação pragmática. Não necessariamente, pressão < 120 mmHg.


Prova de Conceito Etiológico


Na prova do conceito etiológico de que a pressão arterial normal é algo menor do que 120 mmHg,  precisamos nos preocupar mais com valores específicos obtidos da pressão arterial. O conceito que discuto aqui é se pressão > 120 mmHg e < 140 mmHg (um nível não definido tradicionalmente como hipertensão) é mecanismo de doença. Desta forma, idealmente, a maioria dos pacientes do grupo padrão deveriam estar com pressão neste intervalo. Na medida em que muita gente do grupo padrão permanece com pressão > 140 mmHg (hipertensão clássica), o estudo perde confiabilidade quanto à sugestão de modificar os critérios do que deve ser considerado pressão arterial adequada.

Pensamento Científico Bayesiano


Toda hipótese científica tem uma probabilidade de estar correta antes do estudo. Cada novo estudo influencia positiva ou negativamente esta probabilidade, de acordo com seu resultado.  O grau de influência de um estudo tem relação com a sua qualidade metodológica, seu nível de evidência. Dizemos que um estudo comprova um conceito quando seu resultado elevou a probabilidade pré-estudo para níveis acima de um certo limite de incerteza. Por outro lado, há estudos cujo nível de evidência não consegue elevar a hipótese para níveis de incerteza desprezíveis. 

Acredito que o estudo SPRINT elevou a probabilidade da hipótese de Flávio estar correta, ou seja, que pressão sistólica normal deva ser < 120 mmHg. Porém, baseado nos argumentos apresentados, provavelmente esta hipótese ainda guarda um nível razoável de incerteza.

Acordei com Flávio Fuchs que, após ler minha postagem, ele escreveria um contra-ponto científico. Desta forma, aguardem os argumentos dele, que devem trazer causar uma saudável abrasão criativa.

_________________________________________________________________________________

Objetivos Didáticos da Postagem:
  • Estudos pragmáticos versus mecanicistas.
  • Desvio-padrão da média, intervalo de confiança e erro-padrão
  • A importância da análise dos componentes de um desfecho composto
  • O Princípio da prova do conceito
  • Pensamento científico Bayesiano

Para acesso ao nosso curso online de Medicina Baseada em Evidências, clique aqui.

9 comentários:

  1. Alguns pontos do SPRINT particularmente não me agradam, além dos citados:
    - excluíram diabéticos
    - excluíram fração de ejeção <35%
    - estudo truncado, o SPRINT foi interrompido por suposto benefício do grupo com tratamento intenso, essa interrupção costuma favorecer a intervenção
    - idade muito elevada dos pacientes nos grupos, não seria aplicável aos grupos que tratam em idades menos avançadas
    - exclusão de PAS >180 mmHg
    Bom, de fato um estudo famoso que já ouvi dizer ser extremamente ovacionado em alguns serviços. No entanto, não devemos deixar a opinião de "especialistas" nos deixar levar sem ler o estudo na íntegra. Sendo um acadêmico, não consigo confiar no resultado do SPRINT como algo que deva alterar conduta. Muitos fatores "estranhos" na metodologia que ficam obscurecidos pelo "peso" da revista em que foi publicado (NEJM), infelizmente.

    ResponderExcluir
  2. Tenho curtido tuas matérias. Tem algo no blog sobre estatinas em prevenção primária?
    Obrigado!

    ResponderExcluir
  3. Excelente texto, como sempre, Prof Luis! Hoje saiu no NEJM alguns estudos interessantes q valem sua análise! Segue os links:
    http://www.nejm.org/doi/pdf/10.1056/NEJMoa1600175
    http://www.nejm.org/doi/pdf/10.1056/NEJMoa1600176
    http://www.nejm.org/doi/pdf/10.1056/NEJMoa1600177

    ResponderExcluir
  4. Excelente como sempre !!!! Como seu aluno da turma 1 do curso on-line já estava aguardando essa discussão do SPRINT. Realmente uma discussão de vanguarda .
    Agora aguardo , se possível , uma discussão sobre o EMPA-REG outcomes trial ( NEJM ) .
    Grande abc !

    ResponderExcluir
  5. Estava com saudades dos seus posts e as discussões propostas por esse espaço, e pelo visto vieram em dose dupla.
    Sobre o Sprint Trial, quanto a validade interna concordo que seja um estudo com baixo risco de viéses e como aprendemos aqui, embora este tenha sido um estudo truncado o trucamento aparentemente não superestimou os resultados da intervenção porque quando o estudo foi interrompido ele foi interrompido com mais de 500 desfechos, já haviam ocorrido 562 desfechos, 243 no grupo tratamento (1,65% ao ano) e 319 (2,19% ao ano) no grupo padrão.
    Quanto a ter excluído diabéticos e pacientes com AVC prévio, na minha visão não faria sentido testar (incluir) esses pacientes, pois já haviam sido testados no ACCORD-trial e no SPS-3.
    Achei interessante, que incluíram outros tipos de pacientes com alto risco cardiovascular, utilizando os critérios de Framingham (> 15%), indivíduos com idade superior a 75 anos, e utilizaram equivalentes ateroscleróticos de alto risco cardiovascular como Doença cardiovascular manifesta e alteração da TFG - MDRD entre 20 e 60. Acho que uma das virtudes do estudo além do tamanho amostral foi representar melhor os idosos ( que são sub-representados nos ECRs tornando as nossas evidências mais indiretas quanto a essa população.)
    Quanto análise do Desvio-padrão ( muito precisa e irretocável) por sinal, obrigado por introduzir mais este conceito, tinha desconhecimento de como fazer essa análise e vou prestar mais atenção nesse fato ao analisar os estudos, sem dúvida isso da mais incerteza aos resultados.

    Quanto a magnitude do benefício da intervenção e aplicabilidade - acho que o SPRINT Trial peca nesse aspecto.

    1 - Você já havia alertado aqui que as interevenções agressivas ( More is More) quando benéficas tendem a ter um benefício pequeno ou modesto e amparado pela plausibilidade biológica tendem a prover mais efeitos colaterais a medida que a intensidade do tratamento aumenta. E foi isso que ocorreu. Embora os NNTs tenham sido menores que os NNHs, muitos pacientes experimentaram efeitos colaterais. Hipotensão NNH de 72, Síncope NNH de 91, e Veja só, IRA com necessidade de diálise NNH de 56.

    Aplicabilidade

    1 - Vejo que o conceito deste estudo é pouco aplicável a pacientes Hipertensos e sem demais nuances - outros fatores de risco - um eventual paciente de baixo risco, teria um benefício estatístico muito baixo ( visto os modestos resultados ). O paciente de baixo risco, por exemplo, se fossemos extrapolar, além disso, estaria sujeito a intolerar o tratamento também com pouco benefício.
    2 - A agressividade do tratamento muitas vezes é diretamente proporcional ao número de medicações que usa-se. No grupo tratado a média de medicamentos utilizados foi maior - Polifarmácia é um grande problema em idosos, por exemplo. Além disso o aumento do numero de medicações, diminui a adesão, o maior problema de se tratar HAS - é adesão ao tratamento. Incrementar 2 Anti-hipertensivos em média aparentemente pode ser pouco, mas muitos já usam estatinas, AAS, IBPS e outras sortes de medicações.Sei que muitos pacientes com HAS vão evoluir a terapia combinada (40%) segundo algumas fontes, mas para que fazer isso se você com medicações em meia-dose ou mesmo com uma unica medicação podmanter a Pressão controlada de acordo com os objetivos do JOINT 8 , abaixo de 140 ou até abaixo de 150, se for idoso sem mais nuances.
    Esse paciente do Sprint-trial, acredito que deve ter de ser muito mais assistido na prática clínica para atingir essas metas pressóricas e pelos efeitos colaterais.
    3 - No final, a tão falada individualização torna-se o principal baluarte de nossas condutas amparadas por evidências, e acho que essa é a mensagem oculta do Sprint-trial. Individualizar!



    ResponderExcluir
  6. Lucas, obrigado pela ótima complementação de minha análise. Ícaro, veja a colocação de Lucas sobre o truncamento que você mencionou.

    ResponderExcluir
  7. Obrigado Professor. Graças a este espaço pude encontrar um espelho para seguir dentro da área de Epidemiologia-bioestatística-Cardiologia, são especialidades que pretendo seguir. Esse lugar é especial, fico vasculhando os tópicos constantemente, sempre aprendendo algo.
    Um abraço

    ResponderExcluir
  8. Boa noite! O prof. Flavio falou quando poderia responder? Sua análise foi muito bem colocada, e espero ver a resposta do prof. Fuchs o quanto antes, esperando algo aplicado a prática, da qual ele tem vasta experiência. Abraço!

    ResponderExcluir
  9. Luiz Brilhante seu raciocínio crítico !!! muito bem colocadas as analises do grupo padrão onde existe cerca 45 % dos pctes estão acima 140mmHg esse e o grande X da questão. Fantastico !!!!

    ResponderExcluir