terça-feira, 16 de maio de 2017

Curso Avançado de Medicina Baseada em Evidências e Economia Clínica (Franz Porzsolt e Luis Correia)

Prezados colegas,

como parte da parceria em ensino e pesquisa entre a Escola Bahiana de Medicina e a Universidade de Ulm (Alemanha), promoveremos o Curso Avançado de Medicina Baseada em Evidências, no campus da Bahiana.

O curso tem o título de "avançado" pois aborda tópicos além do enfoque tradicional da medicina baseada em evidências. Observem programa abaixo que entenderão o que menciono.

As aulas serão proferidas por Prof. Franz Porszolt e por mim, sempre seguidas de discussão interativa com os participantes. Esperamos que sejam dois dias de intensa produção intelectual, pois mais do que transmissão de conhecimento, acreditamos no amadurecimento de todas as partes durante os processos interativos deste tipo.

O curso ocorrerá durante duas sexta-feiras consecutivas, a última de maio e primeira de junho. Na primeira sexta-feira (26/05) o curso será no campus da Bahiana no Cabula e na segunda sexta-feira será no campus de Brotas.

Vejam abaixo detalhes da programação.

Clique aqui para ser direcionado para o site de inscrição da Escola Bahiana de Medicina.


I Simpósio Avançado de Medicina Baseada em Evidências e Economia Clínica

Franz Porzsolt, Ulm University
Luis Correia, Escola Bahiana de Medicina e Saúde Pública

Datas: 26 de maio (campus do Cabula) e 2 de junho, 2017 (campus de Brotas)


Dia I (Sexta-feira, 26 de maio)

Etapa Matutina: Entrelace entre o paradigma científico e o conhecimento médico
(sessões de 30 minutos - palestra/discussão - 15/15)

9:00 - 10:30
- Por que a mente humana não é suficientemente sensível a evidências científicas? - Luis
- Considerando evidências internas na análise crítica de evidências externas - Franz
- As bases do Princípio da Hipótese Nula no pensamento médico - Luis

10:30 - Intervalo e networking (30')

11:00 - 12:30
- Princípio da Plausibilidade Extrema e suas variantes - Franz
- Princípio da Prova do Conceito - Luis
- O primeiro passo na análise crítica: "vale a pena testar esta hipótese?" - Franz



Etapa Vespertina: Análise da validade de evidências experimentais
(sessões de 20 minutos - palestra/discussão - 10/10)


14:00 - 16:00
- Por que a maioria dos estudos são falsos? - Luis
- O grave fenômeno do viés de publicação - Franz
- Identificando resultados "muito bons para serem verdades" ("smelling" studies) - Franz

- Definições boas e ruins de desfechos primários em estudos clínicos - Franz
- Profecias auto-realizáveis como desfechos primários em estudos clínicos - Luis
- Armadilhas comuns em desfechos compostos - Luis

16:00 - Intervalo e networking (30')

16:30 - 18:30

- É possível avaliar eficácia a partir de um estudo observacional? - Luis
- A inevitável falha da randomização: diferença da combinação preferência-tratamento - Franz
- A contra-intuitiva (porém correta) análise por intenção de tratar - Franz

- Como fazer P-hacking (mineração de dados) - Luis
- Meta-análises não se refletem necessariamente em alto nível de evidências - Franz
- A meta-análise ideal é aquela realizada quando já se sabe previamente seu resultado - Luis



Dia II (Sexta-feira, 01 de junho)

Etapa Matutina: o quanto relevante é o resultado do estudo?
(sessões de 30 minutos - palestra/discussão - 15/15)


9:00 - 10:30
- O que é mais relevante, vida ou qualidade de vida? - Franz
- Por que o risco relativo é tão importante quando o risco absoluto e o NNT? - Luis
- O valor científico de desfechos substitutos - Luis

10:30 - Intervalo e networking (30')

11:00 - 12:30
- Eficácia e efetividade (paradigmas complementares, não concorrentes) - Franz
- Quando a efetividade pode ser até maior que a eficácia - Luis
- Como medir efetividade (o modelo do ensaio clínico pragmático) - Franz


Etapa Vespertina: como aplicar ciência em decisões médicas
(sessões de 30 minutos - palestra/discussão - 15/15)

14:00 - 16:00

- Nível de evidência tem pouco a ver com força de recomendação - Luis
- Inconsistência entre guidelines - Franz
- O pensamento de economia clínica - Franz
- Decisão compartilhada não é o mesmo que decisão consentida - Luis

16:00 - 18:00
Como avaliar preferência do paciente no processo de decisão compartilhada? - Franz
Choosing Wisely: qual o próximo passo? - Franz
Vieses cognitivos no processo de decisão médica - Luis

sábado, 13 de maio de 2017

A verdadeira magnitude do efeito de um tratamento



* Da série "Tamanhos de Efeito"

A mente humana é mais afetiva do que quantitativa. O psicólogo laureado com o Nobel Daniel Kahneman descreveu o viés de afeto (affect bias), que é uma das causas de confundirmos risco com dano (postagem prévia), superestimarmos riscos pequenos e subestimarmos riscos altos. Aspectos relacionados a emoção (afeto) interferem em nossa percepção da realidade, como já dizia Immanuel Kant. 

Temos mais medo de entrar em um avião do que de entrar no banheiro para tomar banho, apesar do risco de morte por queda no banheiro ser muito maior do que o risco de morte por queda do avião. Tememos mais febre amarela do que gripe, mesmo que o risco de morte por gripe seja muito maior do que morte por febre amarela. Eu mesmo já me vacinei contra febre amarela, mas contra gripe ainda não.

Ao descrevermos um tratamento, normalmente não quantificamos o benefício  intrínseco, apenas o qualificamos. Nos limitamos a dizer “este tratamento é benéfico” ou “este tratamento reduz mortalidade”.  Sim, mas quanto reduz? 

Ao faltarmos na quantificação, caímos no risco de supervalorizar tratamentos de moderado impacto ou subvalorizar tratamentos de alto impacto. E isso vem ligado à forma “afetiva” e não quantitativa de analisarmos as nossas condutas. 

Por este motivo, iniciaremos a série de postagens neste Blog denominada de “Tamanhos de Efeito”. Esta série trará exemplos de tratamentos e suas magnitudes de efeito. 

Nesta postagem darei dois exemplos cardiológicos. Mas em futuras postagens, tentarei não me limitar ao coração e incentivo os colegas trazerem seus exemplos sob a forma de comentários neste Blog. Acho que será divertido perceber como nossa percepção do tamanho do efeito de um tratamento muitas vezes se distancia do que é apresentado pelas evidências. Não só divertido, este é um exercício necessário.


Como medir o tamanho do efeito? 


A abordagem tradicional da medicina baseada em evidências enfatiza a redução absoluta do risco e o número necessário a tratar (NNT) como as principais medidas de tamanho de efeito, em detrimento da redução relativa do risco e do risco relativo. 

É comum dizermos, “o relativo engana, o que vale é o absoluto.” Eu mesmo costumo usar o exemplo da herança. Se ganhei 50% da fortuna de um tio (relativo), posso dizer que fiquei rico? Parece muito, mas se a fortuna for 1 real, ganhei apenas 50 centavos. O que vale é o absoluto. 

Porém isso é só uma parte da história. O relativo tem grande importância e é essencial para o pensamento médico. Na verdade, a redução absoluta do risco (com a qual calculamos o NNT) não é uma propriedade intrínseca do tratamento, é uma propriedade do paciente que recebe o tratamento. Para um mesmo tratamento, o NNT varia de paciente para paciente, a depender de seu risco basal. Podemos dizer assim, que um tratamento não tem NNT, quem tem NNT é aquele tipo de paciente que receberá aquele tratamento.

Na verdade, a propriedade intrínseca do tratamento é a redução relativa do risco, que tende a ser constante nos diferentes subgrupos de risco. Isto é demonstrado por análises de sensibilidade que usualmente não mostram interação entre risco basal e impacto relativo do tratamento.

Como já mencionamos neste Blog, um tratamento de pequeno efeito (redução relativa do risco) pode proporcionar uma grande redução absoluta (pequeno NNT) se aplicado a uma população de altíssimo risco. Da mesma forma, um tratamento de grande efeito, pode ter uma pequena redução absoluta se aplicado a uma população de baixo risco. 

Portanto, a redução relativa mostra o tamanho do efeito intrínseco do tratamento, enquanto a redução absoluta mostra o impacto do tratamento em um certo tipo de paciente, com um certo tipo de risco basal. 

RRR = tamanho de efeito
RAR = impacto do tratamento

Por isso, devemos mensurar o tamanho do efeito intrínseco do tratamento pela redução relativa do risco, enquanto o NNT é o impacto concreto em um dado paciente. 

Se tivéssemos a chance de saber apenas uma das informações a respeito de um tratamento, qual escolheríamos: a redução relativa ou redução absoluta? 

A relativa, é claro. Pois sabendo a redução relativa, a gente pode calcular a redução absoluta de cada paciente individualmente, desde que saibamos o risco absoluto do paciente. 

Por exemplo, digamos que a redução relativa do risco é 33%. Com base em um escore de risco, estimamos 10% como risco basal do paciente. Assim, a redução absoluta do risco deste paciente é 33% x 10% = 3.3% (NNT = 100/3.3 = 30).

Como referência para análise, os bons tratamentos apresentam uma redução relativa do risco em torno de 30%-40%. 

Inibidor da ECA na Insuficiência Cardíaca


É surpreendente notar que inibidor da ECA na insuficiência cardíaca é um tratamento de pequeno tamanho de efeito. De acordo com o ensaio clínico SOLVD, a redução relativa do risco do inibidor da ECA é apenas 16%, menor que a maioria dos tratamentos cardiológicos que funcionam. Quase ninguém se toca disso, porque a mortalidade da doença é alta, provocando um bom NNT. Este é um tratamento de pequeno efeito, mas de impacto razoável devido à gravidade dessa doença. 

Foi neste momento que um aluno inteligente retrucou: “então o que importa mesmo é a redução absoluta, professor”. Nem tanto. 

Observem que interessante. Se eu digo que a redução absoluta é no SOLVD foi 4.5%, isso parece muito bom. No entanto, a figura muda bastante se, ao invés de dizer a redução absoluta, mostramos os números de cada grupo: no grupo placebo, a mortalidade foi 39.7% e isso reduziu para 35.2%. Percebam que esses dois números não são tão diferentes. Muita gente sem enalapril morre (um pouco mais que 1/3 dos pacientes), mas muita gente continua morrendo com enalapril (um pouco mais que 1/3 dos pacientes). Não muda muita coisa. Quando olhamos sob esta ótica, vemos que o tamanho do efeito do tratamento é pequeno. 

Além disso, o intervalo de confiança da redução relativa do risco apresentado por este estudo de moderado tamanho (2.500 pacientes) é amplo, vai de 5% a 20%. Portanto, este tratamento pode oferecer uma redução relativa de risco tão baixa quanto 5%. E o extremo superior do intervalo de confiança (20%) não é tão diferente do que a medida pontual de 16%. Na medida do tamanho do efeito, é importante observarmos a precisão da estimativa descrita pelo intervalo de confiança. 

Não estou aqui querendo reduzir o valor deste importante tratamento na insuficiência cardíaca, até mesmo porque inibidor da ECA também ajuda no controle dos sintomas. Mas é importante termos a perspectiva do tamanho do efeito, ao lado da perspectiva do NNT. 

Esta perspectiva reduz o affect bias a favor do inibidor da ECA, nos tornando mais “pé no chão” e permitindo uma melhor análise do trade-off risco-benefício. Ficaremos mais parcimoniosos quando diante de certos pacientes, como hipotensos desmaiadores ou com certo grau de disfunção renal. Sem angústia, insistiremos menos nas altas doses sincopantes que procuramos alcançar quando pensamos na panaceia de um tratamento. 

É muito interessante revisitar estes dados do passado. Na mente cardiológica, inibidor de ECA é uma panacéia. Era 1988, quando eu estava no segundo ano de medicina, foi publicado o estudo CONSENSUS no New England Journal of Medicine, ensaio clínico seminal como teste dessa hipótese, sempre citado como respaldo da eficácia do inibidor da ECA na ICC. Mas na verdade, este é um minúsculo estudo (apenas 253 pacientes), que foi interrompido precocemente com apenas 118 desfechos (truncado com menos de 200 desfechos é risco de imprecisão). Aquele estudo mostrava uma redução relativa de risco de 40%. E isso que ficou na mente afetiva dos cardiologistas.

Uma das melhores formas de reter o aprendizado é fazer com que este ocorra acompanhado de emoção. Uma criança queimada por tocar em uma panela quente (trauma) vai aprender com certeza que panela pode queimar a mão. Quando o CONSENSUS foi publicado, a notícia da redução relativa do risco de 40% veio como tamanha novidade que, emocionados, retemos essa informação, que ficará para sempre impregnada em nossas mentes. Depois veio o SOLVD, estudo maior que mostrou um valor mais preciso de 16% de redução relativa do risco. Mas não foram os 16% (efeito pequeno) que ficaram em nossa memória afetiva, foram os 40% que emocionaram mais e emocionaram primeiro. 

Novos Anticoagulantes Orais


Há um equívoco do pensamento comum em relação a estas drogas. Consideramos que sua maior vantagem está na praticidade. Normalmente, pensamos que os novos anticoagulantes orais possuem eficácia equivalente à tradicional e barata warfarina. Por isso, usualmente discutimos as duas opções com o paciente: uma droga prática e cara versus uma menos prática e barata. 

Mas este pensamento comum desconsidera um fato importante. A maior vantagem destas drogas não está na praticidade, a maior vantagem está na superioridade de seu efeito em relação à warfarina. Na verdade, estas drogas, quando usadas em uma dose ótima são muito melhores do que warfarina. Superioridade esta que é mais importante do que a tão mencionada praticidade. 

Na verdade, é muito difícil mostrar superioridade de um tratamento novo em relação a um tratamento tradicional que é eficaz. E se o tratamento novo for melhor do que o tradicional, esta superioridade tende a ser de pequena monta. Diferentemente do habitual, os novos anticoagulantes são muito melhores do que warfarina. No estudo RELY, a dose de 150 mg de Dabigatran promoveu uma redução relativa do risco de eventos embólicos de 34% em pacientes com fibrilação atrial, algo que fica no mesmo nível dos bons tratamentos comparados a placebo. Isto é quase sem precedentes na comparação de tratamento versus tratamento. Da mesma forma, o estudo ARISTOTLE mostra que a apixabana promove uma redução relativa de 21% quando comparado a warfarina. 

(OBS: sem querer me aprofundar nestas comparações, a rivaroxabana deve ser tão boa quanto os outros, mas foi boicotada pelo injustificada posologia de uma vez ao dia, o que deve ter amputado parte de seu efeito. Por isso, a rivaroxabana se mostrou apenas não inferior à warfarina no estudo ROCKET. O que quero dizer é que provavelmente essas drogas todas são parecidas e se forem usadas em dose adequada terão superioridade em relação à warfarina de magnitude bem razoável. Mas o objetivo dessa postagem não é ficar nessa boba comparação entre os novos anticoagulantes orais).

O que quero dizer é que usar warfarina ao invés de um novo anticoagulante é o mesmo que optar por um tratamento pior. Portanto, colocar praticidade versus preço como o trade-off principal deste tipo de decisão compartilhada é um equívoco. O trade-off correto é eficácia versus preço, e de quebra essa eficácia ainda vem com mais praticidade. 

E fica fácil entender porque estas drogas são melhores que warfarina. A warfarina tem um efeito muito variável e imprevisível. No mundo ideal dos ensaios clínicos boa parte dos pacientes não está em faixa terapêutica. Imaginem no mundo real. Se os novos anticoagulantes são mais eficazes que warfarina, a diferença de efetividade (mundo real) tende a ser até maior.

O enfoque principal da praticidade, em detrimento de evidente superioridade, é um exemplo de erro pela falta de perspectiva da redução relativa do risco.

Tá vendo, não só falo mal das coisas. A propósito, ao falar bem, preciso declarar ausência de qualquer vinculação com as indústrias que produzem estas drogas. Apenas estou olhando os números e evitando o viés de afeição. 
_______________________________________________________________________

Conheça o nosso curso de MBE, clicando em Curso Online de Medicina Baseada em Evidências

segunda-feira, 1 de maio de 2017

Quando o estudo é uma profecia auto-realizável (Compare-Acute)


Imaginem que sorteamos 500 cortes de cabelo para uma população de 1.000 mulheres. Depois acompanhamos estas mulheres por um certo período e observamos que as que não foram sorteadas para cortes cabelo têm maior probabilidade de irem no salão de beleza para cortar cabelo quando comparadas às mulheres que já tinham cortado o cabelo inicialmente. Em conclusão, corte de cabelo previne corte de cabelo subsequente. 

Nada mais óbvio do que isso, não haveria sentido em fazer este estudo, pois seria uma profecia auto-realizável (tradução de self-fulfilling prophecy, termo comum na língua inglesa).

Chamo de profecia auto-realizável pois o próprio experimento para testar a hipótese faz da hipótese verdadeira. 

Agora imaginem que sorteamos 885 pacientes com obstrução coronária para fazer angioplastia ou não fazer angioplastia. Depois acompanhamos estes pacientes por um certo período e observamos que os que não foram sorteados para angioplastia tinham maior probabilidade de irem no hospital para fazer uma angioplastia quando comparados aos pacientes que já tinham feito angioplastia inicialmente. Em conclusão, angioplastia previne angioplastia subsequente. 

Nada mais óbvio do que isso, não haveria sentido em fazer este estudo, pois seria uma profecia auto-realizável. 

Mas fizeram e este é o ensaio clínico Compare-Acute, apresentado como late-breaking clinical trial no recente congresso do American College of Cardiology e publicado no New England Journal of Medicine. 

A chave para identificar este tipo de viés está na análise do desfecho: quando o desfecho é o mesmo da intervenção, ocorre a profecia auto-realizável. Neste estudo a intervenção é angioplastia e o desfecho é angioplastia.

Mas porque percebemos a obviedade da primeira hipótese testada (corte de cabelo) e não percebemos o mesmo na segunda hipótese (angioplastia)? Isto ocorre pois o segundo caso se travestiu de um estudo científico, testando uma hipótese clínica que vem sendo tema de debate intenso. Temos o hábito de analisar criticamente a qualidade metodológica do estudo, mas não temos o hábito de analisar criticamente a qualidade da hipótese do estudo. 

Isso não está nem mesmo no algoritmo de critical appraisal típico da medicina baseada em evidências. Mas deveria estar: a primeira coisa a fazer é identificar a hipótese e analisar se esta merecia ter sido testada. A hipótese pode não merecer ser testada quando estamos nos extremos de plausibilidade (obviamente verdadeira ou obviamente falsa). 

Quando é obviamente falsa, o resultado negativo não acrescenta  nada (pois já sabemos) e o resultado positivo também não, pois a valor preditivo positivo do estudo será pequeno (probabilidade condicional (vejam última postagem).

Quando é obviamente verdadeira (o caso desta postagem), o resultado positivo do estudo (que não precisava ter sido realizado) cria uma falsa impressão de que descobrimos algo novo e isto induz médicos a adotarem o tratamento com base no resultado do estudo (medicina copiada de artigo) e não com base no conhecimento (que já se tinha) alinhado ao julgamento clínico. Um estudo positivo (mesmo que óbvio) funciona como um motivador para a adoção de uma conduta. Resultado do estudo garantido, impacto do resultado garantido. 

Ensaio Clínico Compare-Acute

Vamos descrever este ensaio clínico randomizado utilizando o acrônimo PICO:

População: multi-arteriais submetidos a angioplastia primária da artéria culpada pelo infarto.
Intervenção: angioplastia das artérias não culpadas, mas que tinham obstruções hemodinamicamente importantes (testadas por FFR).
Controle: não realizar angioplastia das outras artérias. 
Outcome (desfecho primário): Combinados de morte, infarto, qualquer revascularização e AVC em seguimento de 12 meses.

Ora, já sabemos de forma reprodutível (mesmo resultado em vários estudos) que angioplastia de placa não envolvida com síndrome coronariana aguda não reduz morte, não reduz infarto e não tem porque reduzir (nem causar, muito raro) AVC. O estudo FAME-2, publicado há alguns anos e que também usou fractional flow reserve (FFR) para escolher as obstruções significativas, não mostrou impacto algum na redução destes desfechos maiores. 

Sim, sei que estes estudos prévios não foram feitos no cenário de infarto com supradesnível de ST, mas lembro que experimentos (ensaios clínicos) servem para testar conceitos (princípio da prova do conceito) e não testar cenários (princípio da complacência). Um placa não culpada em um paciente infartado está muito mais para uma placa de um paciente estável do que para a placa culpada do paciente infartado.

Desta forma, já era bastante previsível que o estudo seria negativo quanto aos desfechos maiores e óbvio que seria positivo quanto ao desfecho revascularização. Esta é uma demonstração que podemos, se quisermos, desenhar estudos com garantia de resultado positivo. É só usar profecias auto-realizáveis. 

Resultado: o grupo intervenção apresentou menor incidência do desfecho primário, basicamente à custa do desfecho angioplastia, que é o mesmo da intervenção.
Conclusão: este é um estudo do tipo “salão de beleza”.

Imaginem que um grupo de pacientes teve infarto de parede anterior e foram submetidos a angioplastia primária da artéria DA, porém também tinham lesão de 70% na CD. Um grupo desses pacientes fazem angioplastia da CD no mesmo dia da angioplastia primária e o outro grupo não faz angioplastia da CD. Todos recebem alta. É claro que o grupo que não fez angioplastia da CD terá maior frequência de angioplastia da CD do que grupo que já fez angioplastia da CD, simplesmente porque o primeiro grupo terá mais artérias CD com lesão para serem angioplastadas do que o primeiro grupo. A disponibilidade de artérias para serem angioplastadas é maior em um grupo do que no outro grupo. 

Desfecho do Tipo Criado pelo Médico

Mas há outra razão para a profecia se realizar. É importante entender que “revascularização” é um tipo de desfecho que é “criado pelo médico”. Diferente de morte, infarto e AVC, que são coisas que ocorrem espontaneamente, como consequência da doença do paciente, o desfecho revascularização passa pela cognição do médico para que ocorra. 

Em um ensaio clínico randomizado, a decisão é tirada do domínio do médico. Quem decide é o sorteio. Isso gera uma inevitável sensação de impotência, um desconforto em não poder fazer o que o médico acha melhor para seu paciente. Naturalmente, este estudo é aberto, pois seria difícil e questionável deixar o médico sem saber se seu paciente fez ou não fez angioplastia. 

Desta forma, a decisão é tirada do médico e o médico sabe qual foi a decisão do sorteio. Se a decisão do sorteio foi contrária à preferência do médico, ao longo dos 12 meses de seguimento, o médico terá uma tendência a corrigir essa “distorção”.  Como ele ou ela corrigiria esta distorção (de forma muitas vezes inconsciente)?

Sintomas discretos e subjetivos (que normalmente seriam relevados) passam a ser supervalorizados como forma de justificar a intervenção; testes isquêmicos são solicitados e quando positivos promovem a intervenção, mesmo no paciente assintomático (reflexo óculo-isquêmico.); ou simplesmente o médico reinterna o paciente para fazer o procedimento.

Este último mecanismo parece uma violação, mas correspondeu a 1/3 das revascularizações realizadas no grupo randomizado para não fazer a angioplastia das artérias não culpadas pelo infarto. Isto está descrito no suplemento do artigo, onde há uma tabela que descreve os motivos das revascularizações.  Eles chamaram de “angiography (no angina ou ischemia)”, denotando que o médico pediu uma angiografia coronária no paciente sem angina ou teste isquêmico e isso foi motivo de 33% das revascularizações. 

Em estudo abertos, devemos evitar desfechos “criados pelo médico”, pois eles são enviesados pelo mecanismo de correção da distorção preferência-sorteio.

Quando entramos no mundo real, a decisão não é por sorteio. Sendo assim, o médico estará mais confortável com uma eventual decisão de não abordar as demais artérias. E quando preferência coincide com a decisão, o curso clínico tende a ser melhor.  Sendo assim, podemos imaginar que a efetividade (mundo real) da conduta conservadora é melhor do que sua a eficácia (mundo dos ensaios clínicos). Artérias escolhidas pelo médico para não serem abordadas tendem a ser menos abordadas no futuro do que artérias escolhidas pelo sorteio para não serem abordadas. 


A Decisão Clínica

Saliento que este trabalho não testou a eficácia da realização do FFR na escolha das artérias para serem abordadas. Todos os pacientes do grupo intervenção fizeram FFR, portanto o estudo não compara intervenção guiada por FFR versus intervenção guiada pela angiografia. Ou seja, o estudo não indica necessariamente o uso de FFR na rotina para testar placas não culpadas.

Outra questão é que o FFR não obrigatoriamente torna o grupo intervenção mais parcimonioso. Como parte do protocolo, um paciente com lesão não culpada de 50% faria um FFR, que se positivo implicaria em abordagem dessa artéria. Uma típica situação de reflexo óculo-isquêmico (uso inadequado de um falso paradigma isquêmico para induzir procedimentos - veja postagem prévia). 

A análise da profecia auto-realizável não quer dizer que não devemos abordar as artérias não culpadas. Também não quer dizer que devemos abordar. Mais uma vez, se aplica o jargão da individualização, norteada por evidências já bastante conhecidas de que (1) angioplastia reduz sintomas e (2) angioplastia de placa estável não reduz infarto ou morte.

Devemos considerar a abordagem das demais artérias (no mesmo internamento ou no mesmo procedimento) em duas situações principais: (1) se o paciente tem angina crônica que culminou no infarto, temos tendência a fazer revascularização completa, pois o procedimento tende a ser benéfico no controle deste sintoma crônico; (2) quando o grau de obstrução da artéria não culpada é crítico demais fica evidente que não deixaremos a lesão sem ser abordada, pois o dado anatômico é fortemente sugestivo de um curso clínico indesejado (aqui me refiro a apenas a lesões extremas, sub-oclusivas, tipo 99%, um fio de cabelo ou ponta de lápis).

Na ausência destas circunstâncias e observando que a abordagem mais agressiva não reduz infarto ou morte, não há justificativa em sair desentupindo tudo, pois se não traz benefício, resta apenas o custo do procedimento, representado pelos eventos adversos que podem advir. 

O conceito de consequência não intencional está no cerne da atitude parcimoniosa quando há incerteza do benefício de uma conduta. Para cada consequência intencional (benefício esperado) de um ato médico há uma infinidade de potenciais consequências não intencionais (eventos adversos inesperados). É 1 consequência concorrendo com uma infinidade de consequências imprevisíveis, fazendo com que a probabilidade de um evento adverso seja maior do que a probabilidade do benefício. 

Por este motivo, deve haver uma probabilidade (evidência) razoável do benefício para compensar o maior número de consequências não intencionais concorrendo com 1 consequência intencional. Este é o pensamento que baseia não realizar atos fúteis, mesmo que estes não aumentem o risco do desfecho principal.


Conclusão

A discussão aqui apresentada mostra um resultado positivo no desfecho que tem dois componentes: um componente verdadeiro e um componente falso. O primeiro componente, o verdadeiro, depende do fenômeno de maior disponibilidade de artérias entupidas a serem angioplastias (óbvio, portanto não traz uma informação nova para mudar conduta). O segundo componente é falso, pois é mediado pelo viés correção da distorção preferência-sorteio, que ocorre em um ensaio clínico aberto, mas não ocorrerá na prática do mundo real.

Devemos estar atentos quando a profecias auto-realizáveis pois elas podem parecer como uma novidade a influenciar nossa conduta. E a chave para identificar esse problema é procurar por situações onde o desfecho é o mesmo da intervenção.
_______________________________________________________________________

Objetivos Didáticos desta Postagem:

- Desfechos de resultado garantido.
- Mecanismo de correção da distorção preferência-sorteio.

_______________________________________________________________________

Conheça o nosso curso de MBE, clicando em Curso Online de Medicina Baseada em Evidências

sábado, 15 de abril de 2017

Por que os resultados da maioria dos estudos publicados são falsos?



Em 2005, o grego John Ioannidis, professor da Universidade de Stanford, publicou um artigo na PLOS Medicine intitulado Why Most Published Research Findings Are False. Desde então, este trabalho recebeu 2 milhões de acessos e 2.500 citações em periódicos científicos, servindo de inspiração para a discussão que desenvolveremos nesta postagem. 

Embora este título soe pessimista, representa uma mera constatação da realidade. Uma constatação que no final nos remeterá a uma visão otimista, voltada para a evolução do pensamento científico. Discussões como esta elevam pesquisadores (produtores de artigos) ao nível de cientistas (pensadores).

Do ponto de vista técnico, esta postagem seria intitulada: por que a maioria dos estudos têm baixo valor preditivo positivo?

Esta pergunta nos remete ao conceito bayesiano de valor preditivo positivo de um estudo, que é a probabilidade de um resultado positivo predizer um fenômeno verdadeiro. 


Um prevalente equívoco é a interpretação do valor de P como “a probabilidade do resultado do estudo ser falso”. Neste caso, o valor de P seria o valor preditivo negativo, então o complemento de P (100% - P) seria o valor preditivo positivo. Por exemplo, valor de P = 0.05 indicaria uma probabilidade de 5% do resultado ser falso. O que corresponderia a 95% de valor preditivo positivo. Errado !

O valor preditivo positivo do estudo é de fato influenciado pelo valor de P, mas também por outras três variáveis que abordaremos neste texto: probabilidade pré-teste, poder estatístico e qualidade metodológica do trabalho. 

Probabilidade Pré-teste


No século XVIII, o reverendo Bayes descreveu o conceito de probabilidade condicional. A interpretação contemporânea do resultado de um estudo deve se embasar neste pensamento bayesiano.



Probabilidade pré-teste → Teste → Probabilidade pós-teste

Probabilidade da Hipótese → Estudo → Valor preditivo positivo




Significa que antes de avaliar a veracidade do estudo, temos que avaliar a probabilidade pré-estudo (pré-teste) da hipótese ser verdadeira, pois esta influencia o valor preditivo positivo. 

No pensamento bayesiano (probabilidade condicional), um estudo é um teste que serve para moldar uma probabilidade antes existente (pré-teste). Se positivo, o estudo aumenta a probabilidade pré-teste, resultando na probabilidade pós-teste maior do que a pré-teste

Mas se esta probabilidade pré-teste for originalmente muito baixa, mesmo que o estudo positivo aumente a probabilidade, esta poderá terminar ainda baixa (aumentar um coisa muito pequena pode resultar em uma coisa "menos pequena", porém ainda pequena). Daí a importância da probabilidade pré-teste na interpretação do estudo.

A probabilidade pré-teste de uma hipótese estar correta depende de sua plausibilidade e das evidências intermediárias que respaldam a ideia como mais ou menos promissora. 

De todas as hipóteses criadas no universo científico, apenas 10% são finalmente confirmadas como verdadeiras. Isso ocorre porque o mundo é multicausal, difícil de prever. Mas também ocorre porque grande parte das hipóteses testadas são pouco promissoras, para não dizer esdrúxulas. Por isso que um componente importante do pensamento científico é a criação da ideia. 

Testes de hipóteses pouco prováveis são prevalentes no mundo científico, comumente realizados por pesquisadores (não exatamente cientistas) entusiasmados com sua corrida pela produção científica. Mais entusiasmados com isso do que com o propósito de “tomar ciência” do universo. 

Semana passada li na Folha de São Paulo que um ensaio clínico preliminar não conseguiu demonstrar que fosfoetanolamina teria benefício em pacientes com câncer. Esse é um exemplo de estudo que já começa com um probabilidade pré-teste quase nula. Não há plausibilidade, nem mesmo estudos preliminares promissores. Não nos serve a criação de hipóteses fantasiosas, pois um resultado negativo é óbvio e um resultado positivo terá baixo valor preditivo positivo (pois já começamos com uma probabilidade pré-teste baixa). 

Imagine que eu queira demonstrar que pintar o cabelo de azul em novembro reduz o risco de câncer de próstata. Daí faço um ensaio clínico. Se o resultado do trabalho for negativo, não acrescentará nada, pois é óbvio que isso não funciona (ensaios clínicos negativos apenas tem valor quando negam algo que faz sentido, quando rejeitam uma ideia antes promissora). Por outro lado, se o resultado é positivo, seu valor preditivo positivo será baixo, pois a probabilidade pré-teste desta ideia é baixa. Ou seja, não há utilidade em se testar hipóteses esdrúxulas (entendam aqui exdrúxulas como pouco prováveis).

Este parece ser um raciocínio preconceituoso. Sim, é preconceituoso, mas é um preconceito probabilístico, é a probabilidade pré-teste do pensamento de probabilidade condicional. 

Uma pesquisa não existe no vácuo, mas sim dentro de um meio científico. Por exemplo, antes do teste de eficácia clínica (melhora de prognóstico), há estudos experimentais, seguido de estudos clínicos testando desfechos intermediários. Assim, a probabilidade pré-teste é composta da lógica da hipótese + o conjunto de informações (de qualidade) já comprovadas que falam a favor daquela hipótese. 

Por exemplo, temos percebido uma crescente preferência pela custosa vasopressina ao invés da tradicional/barata noradrenalina em pacientes com choque. Ao questionar o uso de vasopressina, um de meus residentes recebeu do plantonista um recente trabalho da revista Anesthesiology como respaldo da ideia. Este trabalho testou a hipótese de que vasopressina é superior à noradrenalina na redução de desfechos clínicos em pacientes com choque vasoplégico pós cirurgia cardíaca. 

Vamos analisar a probabilidade pré-teste desta hipótese. Qual a plausibilidade de um vasopressor potente ser superior ao outro vasopressor potente em um paciente vasodilatado? O intuito principal destas drogas é o de promover vasoconstricção e aumentar a pressão. Se ambas o fazem de forma intensa e semelhante, porque uma seria melhor que a outra? Pouco provável. 

Devemos notar que as hipóteses pouco prováveis também possuem justificativas mecanicistas apresentadas em boa semântica. São fantasiadas de prováveis. O racional apresentado é que a vasoconstricção obtida pela vasopressina seria mais eficaz, pois ocorreria pela estimulação de  uma família de diferentes receptores, enquanto noradrenalina só estimula um tipo de receptor. Desta forma, uma razoável probabilidade pré-teste de que vasopressina é clinicamente superior teria que ser embasada em estudos mostrando melhores resultados hemodinâmicos. Isto não consta na justificativa do trabalho. Na verdade são dois vasoconstrictores potentes e é pouco provável que um venha a ser clinicamente superior ao outro.

Vejam o caso das estatinas. Uma vez demonstrado que estatinas reduzem colesterol, torna-se plausível que previnam risco de infarto. Assim, os grandes ensaios clínicos que testaram eficácia clínica de estatinas começaram com probabilidade pré-teste alta, pois já estava comprovado seu efeito hipolipemiante. 

Por outro lado, a ideia de que estatinas possuem muitos outros benefícios (previnem câncer de próstata, Alzheimer, tratam esclerose múltipla, Parkinson, osteoartrite) tem baixa probabilidade. Há estudos observacionais ou análises secundárias de ensaios clínicos sugerindo estes efeitos. No entanto, todas estas probabilidades pré-teste são pífias. Não faz sentido que estas coisas sejam verdades, mesmo que os autores “expliquem” as vias pelas quais estes efeitos se fariam presentes. A princípio, a probabilidade é pequena de que uma droga desenvolvida para um efeito, tenha tantos outros efeitos positivos.  Não existe panaceia que serve para quase tudo.

Portanto, antes de ler um artigo original devemos sempre questionar: essa hipótese é plausível? Este estudo deveria ter sido realizado? Este é o primeiro passo na análise de uma evidência. O passo do preconceito evolutivo. Ciência não é exatamente justa, igualitária com as ideias. Ciência não é politicamente correta. 

O Poder Estatístico


Agora vamos migrar para a análise do estudo, abordando um importante componente: o poder estatístico, que determina a probabilidade do erro aleatório tipo II (não detectar uma associação verdadeira). Quanto menor o poder estatístico do estudo, maior a possibilidade dele não encontrar uma associação que existe. Quanto menor o poder, menor a sensibilidade do estudo.

Mas há outro impacto do poder que muitos desconhecem: quanto menor o poder, maior também a probabilidade do erro tipo I (afirmar algo falso). 

É inadequado pensar: “mesmo sem poder estatístico, o estudo encontrou valor de P estatisticamente significante. Então podemos afirmar que a associação é verdadeira.” Esse pensamento é falso, pois um estudo de baixo poder estatístico terá baixo valor preditivo positivo, mesmo com valor de P significativo. Em outras palavras, a significância estatística perde sua veracidade quando encontrada em um estudo subdimensionado, com poder estatístico insuficiente. O valor de P é menos confiável em um ambiente sem poder estatístico. 

Se quiser entender matematicamente o porquê, veja a simulação abaixo. Outra alternativa é pular  esta explicação, não fará grande falta para o entendimento do todo.  

o   Digamos que 1000 hipóteses diferentes são testadas em 1000 estudos diferentes.
o   Partindo da premissa que apenas 10% das hipóteses são verdadeiras, no mundo científico perfeito 900 estudos serão negativos e 100 estudos serão positivos. 
o   A definição de significância estatística é alfa de 5%, que significa que nós aceitamos até 5% de probabilidade do erro tipo I (afirmar algo falso). 
o   Portanto, das 900 hipóteses falsas, 45 delas (5%) terão resultado do estudo positivo (falso-positivo).
o   Desta forma, não teremos apenas 100 estudos positivos, mas sim 145 estudos positivos: 100 verdadeiro positivos e 45 falso positivos. 
o   Baseado nisso, o valor preditivo positivo de um estudo que define alfa de 5% é 69%, ou seja, 31% dos estudos (45/145) são falso positivos apenas por aceitarmos 5% de probabilidade tipo I (alfa).

Agora vem a influência do poder estatístico:

o   Aceita-se como satisfatório um poder estatístico de pelo menos 80%, o que significa uma sensibilidade para detectar uma associação verdadeira de 80%, levando a 20% de probabilidade do erro tipo II. 
o   Se o poder de todos os estudos for 80%, daquelas 100 hipóteses verdadeiras, serão 80 estudos positivos (e não 100).
o   Reduzimos então para 125 estudos positivos (80 verdadeiros e 45 falsos).
o   Desta forma, em se considerando a influência do poder estatístico de 80%, na verdade, 36% dos estudos são falsos (45/125). 

Percebam como o poder estatístico de 80% (e não de 100%) aumentou a probabilidade do erro tipo I de 31% para 36%. Isso mostra como o poder influencia também no erro tipo I.

Este esquema é bem representado por esta figura:




Agora vem o grande problema: considerando a totalidade dos estudos científicos, apenas a minoria tem poder estatístico de 80%. Por exemplo, um artigo publicado na Nature demonstrou que no campo da neurociência a média de poder estatístico dos estudos é de 20%. Se considerarmos 20% como a regra, seriam apenas 20 estudos verdadeiros positivos e 45 estudos falso positivos. Isso daria 45/65 = 69% de probabilidade de falso positivo (apenas 31% de valor preditivo positivo).

Pode parecer estranho dizer que a média do poder estatístico dos estudos é apenas 20%. Mas é isso mesmo, se considerarmos todas as publicações científicas, em todas as revistas científicas. Além disso, há cálculos de poder estatístico fantasiosos, que fazem parecer (falsamente) que estudos tenham poder de 80%. 

Como fantasiar um cálculo de poder em estudos pequenos? Vejam que interessante:

É só calcular o poder para encontrar uma diferença (tamanho de efeito) gigante. Para uma diferença enorme, qualquer estudo pequeno consegue poder de 80%. O problema é que diferenças enormes são inverossímeis, o que praticamente elimina qualquer probabilidade pré-teste de aquilo ser verdadeiro. 

Voltando ao estudo da vasopressina: os autores planejaram incluir 300 pacientes para obter 80% de poder. Mas este poder de 80% é calculado para a detecção de uma diferença muito grande de eventos entre os dois grupos: 30% de redução absoluta de risco! Sim, estou falando absoluta e não relativa. Isto daria um NNT < 4. É quase fantasioso, principalmente em se tratando da comparação de tratamentos versus tratamento. Nem tratamento versus ausência de tratamento alcança tamanha redução de risco, quando mais tratamento versus tratamento. E principalmente quando se trata de dois potentes vasoconstrictores. Se eu tinha dito no tópico anterior que essa hipótese era pouco plausível, para esta magnitude de redução, não temo dizer que esta hipótese é quase impossível. A probabilidade pré-teste se aproxima do zero absoluto. Na realidade, aproximando a probabilidade pré-teste do zero absoluto podemos chagar ao desejado poder de 80%. 

Portanto, para acreditar em um estudo positivo, devemos ficar atentos para seu poder estatístico, não apenas para o valor de P. E devemos analisar criticamente se o cálculo do poder foi fantasioso ou realista. 

Os gráficos abaixo, tirados do artigo de Ioannidis, mostram o cálculo do valor preditivo positivo (eixo vertical) de acordo com diferentes níveis de poder estatístico e de chance pré-teste (eixo horizontal). São quatro curvas, pois cada uma representa diferentes riscos de viés. Observem que no cenário usual (10% de probabilidade pré-teste, poder de 20% e risco de viés alto), o valor preditivo positivo de um estudo é apenas 20%.




Mas isso ocorre com as boas publicações nas boas revistas? Sim, a maioria dos artigos que comentamos neste Blog são de boas revistas e sofrem disso também. 

O New England Journal of Medicine publicou um estudo de apenas 77 pacientes que demonstrou eficácia clínica da hipotermia pós-parada. Em postagem antiga deste Blog, antes mesmo do surgimento dos bons estudos, eu concluía que isso não passava de uma fantasia. Não era difícil de prever. Hoje temos os trabalhos de qualidade, todos negativos em relação a este benefício. 

Primeiro, a hipótese é esdrúxula, não sei como acreditaram nisso. Achar que baixar a temperatura  a posteriori vai reverter a grave consequência da anóxia cerebral é querer demais. O dano já está feito com a parada cardíaca prolongada. Será que teria um efeito relevante? Claro que não. Segundo, os estudos que falsamente confirmaram a fantasia eram pequenos, sem poder estatístico, repletos de vieses.

Importante salientar que quando uso o adjetivo “pequeno” me refiro a um estudo subdimensionado para uma dada hipótese e não a um tamanho amostral específico. Para certas hipóteses, estudos de N = 300 podem ser grandes, para outras o mesmo N é pequeno. Se o estudo da vasopressina fosse para testar a hipótese de que esta aumenta mais a pressão arterial do que noradrenalina (desfecho intermediário), este teria dimensão adequada. Mas não para desfechos clínicos. 

Nas grandes revistas este tipo de estudo é menos frequente do que nas pequenas revistas. Mas quando eles se fazem presentes nas grandes revistas, o “estrago” no mundo científico é muito maior. 

Risco de Viés


Aliado a tudo isso, há o risco de viés dos estudos. Sabemos que as possibilidades de vieses são inúmeras e este é um dos assuntos que predominam em nosso Blog. Uma forma interessante de falar de viés é se perguntar: para que serve o método científico? 

Muito pensam que o método científico serve para comprovar nossas hipóteses. Na verdade, é o contrário: o método científico serve para tentar refutar nossa hipótese. Assim que se faz ciência. Como Karl Popper propôs no século passado, primeiro tentamos refutar a hipótese de forma empírica (experimental) e se não conseguirmos, aceitaremos a ideia. 

Por exemplo, ao dar um placebo ao grupo controle, estamos tentando refutar a ideia de que a droga funciona. Pois esse método cria um efeito terapêutico no grupo controle e aproxima o resultado dos dois grupos. Se a droga for apenas placebo, refutamos a ideia de eficácia ao oferecer o placebo também ao grupo controle. Quando randomizamos a alocação para tratamento ou controle, também tentamos refutar um efeito terapêutico, pois ao homogeneizar as amostras, um aparente benefício intermediado por efeito de confusão desaparecerá. 

Vieses são erros metodológicos que impedem o estudo de refutar uma hipótese falsa. Um ensaio clínico para um desfecho como dor é enviesado se não tiver o efeito placebo. Como diz o próprio nome, estes erros enviesam um estudo na direção de um determinado resultado. São erros tendenciosos.

Agora vem de novo a questão dos estudos “pequenos” (estatisticamente subdimensionados). Estudos pequenos não são apenas pequenos. Estudos pequenos também tendem a ser de pior qualidade metodológica.

Um estudo grande tende a ter um melhor método científico, pois seria desperdiçar muito recurso em um grande esforço. Estudos grandes multicêntricos representam um projeto coletivo, no qual o método do estudo passa pelo crivo de muitas pessoas. Um estudo pequeno é um esforço menor, de menor custo, que pode ser realizado por um pequeno grupo local de enviesados. 

Viés de Análise de Dados


O principal viés de análise de dados é a análise a posteriori ou post-hoc. Estas são análises que não estavam planejadas no desenho do estudo, são criadas depois e por este motivo têm grande probabilidade de gerar resultados decorrentes do acaso. Isto ocorre pelo problema das múltiplas comparações (tema de postagem prévia neste Blog), pois são tantas as formas de análise que podemos inventar depois do estudo realizado, que uma delas nos dará o resultado desejado. É o que se chama de statistical fishing ou p-hacking ou data massage

Para evitar este tipo de falácia, o plano de análise de dados dos estudos deve ser pré-definido e tudo que for criado depois deve ser visto como potencialmente falso. 

Em 2004, o CDC publicou um estudo caso-controle, concluindo que não havia associação entre vacina MMR e autismo. Dez anos mais tarde, Brian Hooker publicou um outro artigo indicando que crianças masculinas, negras, vacinadas antes de 36 meses de idade tinham maior chance (odds) de autismo quando comparadas às vacinadas depois de 36 meses. Esse trabalho virou notícia, alardeando muitos pais, que decidiram não vacinar os filhos. No entanto, o trabalho era resultado de várias análises a posteriori dos mesmos dados do CDC. Observem que masculino-negro é um subgrupo do subgrupo, representando uma típica forma de fazer múltiplas análises a posteriori. Acontece que Brian Hooker é um engenheiro químico, pai de uma criança autista e membro da organização Focus Autism, que prega este efeito adverso das vacinas. 

Portanto, análises a posteriori tem alto risco de erro aleatório. O problema é que estas análises são muito frequentes em estudos pequenos. A propósito, o estudo da vasopressina modificou a posteriori o desfecho primário que havia sido pré-definido para o teste de hipótese. Uma violação deste princípio aqui discutido.

O Universo Científico


O universo científico é composto majoritariamente de estudos pequenos. Estudos pequenos têm menor poder estatístico, falseando resultados positivos. Estudos pequenos têm pior qualidade metodológica, enviesando o resultado a favor de uma falsa hipótese. Estudos pequenos apresentam mais análises a posteriori. E estudos pequenos testam hipóteses mais esdrúxulas, partindo de uma baixa probabilidade pré-teste. 

Imaginem uma ideia que parece interessante: Zika causa microcefalia. Esta ideia, permeada pelo medo (que reduz nossa racionalidade), passou a ser convincente mesmo antes de qualquer evidência de associação. Podemos dizer que esta é uma ideia “quente”, muitos grupos estão perseguindo esta confirmação. Os campos de ideias quentes possuem vários grupos científicos na corrida para serem os primeiros a demonstrar um resultado positivo. Nessa desenfreada corrida, estes grupos trocam a veracidade pelo pioneirismo. Em nome do pioneirismo, os grupos passam a publicar estudos pequenos, subdimensionados e de pior qualidade metodológica, justamente em um momento em que a hipótese ainda é pouco provável (toda hipótese é pouco provável no início). O entusiasmo pela ideia faz das pessoas menos céticas e estas aceitam prontamente os falsos resultados positivos de estudos preliminares. 

Isto explica porque campos científicos “quentes” paradoxalmente apresentam estudos de menor valor preditivo positivo, quando comparados a campos científicos mais mornos. 

As ideias quentes têm estudos iniciais sempre positivos, que precipitam “verdades”, muitas vezes negadas anos mais tarde por grandes estudos negativos. Não deveríamos nos surpreender quando surgem estes estudos negativos. São incontáveis os exemplos. 

E para agravar ainda mais toda essa situação, o universo científico tem seu próprio viés, o viés de publicação: a probabilidade de um estudo pequeno positivo ser publicado é maior do que a probabilidade de um estudo pequeno negativo. No universo de estudos pequenos, os falso positivos têm maior probabilidade de serem publicados do que os verdadeiros negativos. 

Evolução do Processo Científico




Recentemente, um grupo de cientistas liderados por Ioannidis publicou na Nature um manifesto a favor de maior reprodutibilidade entre os estudos. É um exemplo de que esta é uma preocupação crescente e que o mundo científico discute formas de evoluir. 

Não vejo o problema discutido aqui como uma crise, apenas acredito que temos o que evoluir e chegará o momento em que essa evolução tomará a forma de revolução do processo científico. 

Como diria Martin Luther King, I have a dream:

No mundo científico evoluído, estaremos cientes do problema do valor preditivo positivo dos trabalhos, desenvolvendo maior senso crítico a respeito das evidências. Mas a evolução também ocorrerá no processo de geração das evidências. E isso começa pela criação da hipótese, pois a verdadeiros cientistas são os que fazem perguntas corretas, não os que obtém rápidas respostas. 

Não julgo testes de hipóteses inadequadas necessariamente como um comportamento indevido de pesquisadores. Eu mesmo sou autor de trabalhos que hoje repenso se deveriam ter sido feitos. Precisamos mudar nosso modelo mental científico. 

Ciência se faz juntando pequenos tijolos informativos até chegar a um conclusão. O padrão fast science faz com que autores desejem chegar à resposta final de forma precipitada. É uma corrida pela evidência mais impactante, em detrimento da veracidade. Isso faz com que autores se proponham a testar hipóteses com estudos subdimensionados. 

No padrão slow science, não haverá uma corrida desenfreada pela descoberta, pois uma noção predominante será que “descoberta” é feita por um esforço coletivo e progressivo de evidências cumulativas. 

O padrão slow science seguirá também o paradigma do menos é mais. Publicaremos menos artigos, porém de mais qualidade. Os critérios para um bom cientista não estará na quantidade de trabalhos, mas sim na qualidade. No slow science, numerosas publicações de qualidade questionável reduzirá o índice científico dos autores, principalmente se estas publicações estiverem em grandes revistas. Um artigo ruim publicado no New England Journal of Medicine terá maior impacto negativo no índice científico do autor do que o mesmo artigo publicado em uma revista menor. O fator de impacto de uma revista será negativo ou positivo a depender da qualidade de trabalhos. 

Autores definirão de antemão seus trabalhos como intuito exploratório (geradores de hipóteses) ou intuito confirmatório. Desde um momento inicial, os autores reconhecerão o status de seu estudos com base no nível de evidência. Os estudos exploratórios serão publicados em revistas menores, que servirão de repositório de ideias com probabilidade pré-teste razoáveis.  A maioria das revistas terão esse objetivo. E as grandes revistas serão dedicadas a estudos confirmatórios. Isso dará mais transparência ao processo e ao valor de cada estudo.

E por aí vai … Assim vamos fazendo um exercício criativo de visualização do que será o mundo do slow science. Assim como uma comida artesanal é mais saborosa do que fast food, fazer slow science será muito mais saboroso do que o atual fast science

_________________________________________________________________________________

Conheça o nosso curso de MBE, clicando em Curso Online de Medicina Baseada em Evidências