domingo, 4 de agosto de 2013

O sucesso do Bahia é estatisticamente significante?



Sou Bahia e vibro com a terceira posição do tricolor no Brasileirão. Poderia deixar meu cérebro direito (emoção, paixão) prevalecer, argumentar que nosso time atualmente é um dos melhores e que corremos o risco de sermos campeões mais uma vez. Esse argumento não estaria errado, pois futebol é paixão. Por outro lado, este Blog é científico e serve para exercitarmos o cérebro esquerdo, racional, matemático, realista. Portanto, farei uma abordagem de torcedor estatístico.

Neste contexto, surge a seguinte questão. O Bahia está bem mesmo? Observem que o que temos neste momento não é o campeonato brasileiro inteiro, é apenas uma amostra (uma parte) do campeonato, representado pelas primeiras 10 de um total de 38 rodadas. Isso se assemelha às evidências científicas, que em geral são observação obtidas em amostras populacionais e depois extrapoladas para a população. Quando utilizamos amostras para obter informações a cerca da população, devemos fazer uso da estatística, que serve para quantificar a incerteza a respeito de nossas conclusões amostrais. 

Formulando esse problema sob a forma científica, precisamos testar a hipótese de que o Bahia de 2013 é melhor do que o Bahia de 2012. Ao comparar a posição do Bahia após a décima rodada do campeonato, percebemos que hoje estamos na 3o posição, muito melhor do que no ano passado, que nesta altura estávamos na (pasmem) 19o posição. Que diferença gritante!


No entanto, o que percebemos nessa amostra pode ou não ser representativa da realidade do campeonato por inteiro. Quando estamos com uma amostra, existe a possibilidade da diferença entre os campeonatos ter sido obra do acaso e não uma concreta melhora de qualidade do time. Foi apenas sorte do Bahia?


Teste de Hipótese

Vou aproveitar este exemplo futebolístico para explicar como funciona teste de hipótese em estatística. Primeiro, começamos a premissa da hipótese nula, que prima pela inexistência do fenômeno (Bahia está melhor). Daí nos perguntamos: se a hipótese nula for verdadeira (Bahia não está melhor), qual a probabilidade desta diferença entre os dois campeonatos se fazer presente?

Se na presença da hipótese nula, for alta a probabilidade da diferença observada, pode ser que tudo não passe do acaso. Daí não vamos acreditar no fenômeno, vamos ficar com a hipótese nula. Estatisticamente falando, não podemos rejeitar a hipótese nula.

O que a estatística faz é calcular a probabilidade do resultado observado aparecer na vigência da hipótese nula. Essa probabilidade é o valor de P.

Sendo assim, calculei o valor de P da diferença da proporção de vitórias do Bahia nas primeiras 10 rodadas de 2013 versus 2012. Sendo uma diferença de proporção, usei o teste de Fisher, que se adéqua melhor a pequenas amostras (N = 10 jogos). Encontramos o seguinte: o Bahia ganhou 40% dos primeiros 10 jogos em 2013, comparado a 10% de vitórias em 2012, sendo o valor de P = 0.30. Isso significa que há 30% de probabilidade dessa diferença aparecer, mesmo na vigência da hipótese nula. Se o time for tão ruim quanto 2012, há ainda 30% de probabilidade da campanha destas primeiras rodadas se fazer presente. Ou seja, essa campanha não é suficientemente diferente de 2012 para rejeitar mos a hipótese nula.

Como todos sabem, para rejeitar a hipótese nula, é necessário valor de P < 0.05. O que significa isso? Se aparecer um resultado que seja muito improvável na vigência da hipótese nula, a gente começa a duvidar da hipótese nula, que era nossa premissa inicial. Se essa probabilidade ficar abaixo do limite de 5%, a gente para de insistir na hipótese nula, rejeita esta hipótese e fica com a hipótese alternativa de que o fenômeno é verdadeiro. Neste caso, seria a hipótese alternativa de que o Bahia está de fato melhor.

Assim funciona teste de hipótese. Partindo do ceticismo científico, nossa tendência é proteger a hipótese nula. Porém só até um certo ponto. Na presença de um resultado muito improvável (uma diferença muito grande, com P < 0.05), faz mais sentido achar que a hipótese nula é falsa, achar que de fato o Bahia está melhor.

O porquê de 5% ser o limite para rejeição da hipótese nula será tema de futura postagem. Mas adianto que este valor específico é uma convenção do que se considera matematicamente muito improvável.

Podemos também fazer uma comparação dos pontos obtidos pelo Bahia a cada rodada. Em 2012, o Bahia obtinha uma média de 0.90 pontos por jogo, com desvio-padrão de 0.88. Em 2013, a média de pontos por jogo subiu para 1.6, com desvio-padrão de 1.27. A diferença de 0.90 ± 0.88 versus 1.6 ± 1.27 resulta em valor de P = 0.28. Ou seja, 28% de probabilidade dessa diferença aparecer mesmo a hipótese nula sendo verdadeira.

O Fenômeno de Regressão à Média

Sendo assim, o que vimos até então pode ser mera obra do acaso e não garante que o Bahia esteja melhor. Se isso for por acaso, a tendência será o desempenho do Bahia regredir à média. Ou seja, com o passar das rodadas o Bahia vai caindo de posição, terminando em uma posição abaixo do que a atual. Este é o fenômeno estatístico de regressão à média, já comentado em detalhes nesse Blog (vale a pena rever esta e esta postagens). Em resumo, este fenômeno indica que na presença de resultados extremos (Bahia muito bom ou muito ruim), na medida em que se aumenta o tamanho amostral, a observação vai tomando uma forma mais próxima do usual. Vai regredindo à média.

Observem o progredir do campeonato. Pode ser um grande exemplo de regressão à média.


Poder Estatístico

Quando diante de um estudo negativo (ausência de diferença estatística entre os grupos), devemos considerar duas possíveis explicações: (1) de fato não há diferença ou (2) o estudo sofreu o erro tipo II, aquele no qual uma diferença verdadeira não foi encontrada por falta de poder estatístico (estudo pequeno).

De fato, este é um estudo pequeno e para a diferença observada no percentual de vitórias, o poder estatístico é de apenas 15%. Como comentado na última postagem, um estudo deve ter pelo menos 80% de poder estatístico.

Desta forma, é possível que o Bahia esteja melhor e o estudo não foi capaz de encontrar significância pois ainda tem muito pouco jogo. Mas percebam que esta análise não nos permite concluir que quando aumentar os jogos, vai se comprovar que o Bahia está melhor. O baixo poder estatístico nos permite apenas concluir que o resultado negativo não é definitivo e que estudos maiores podem (ou não) mostrar um resultado positivo. Mas por enquanto devemos ficar com a hipótese nula, a qual não foi rejeitada neste estudo.

O que ocorre muitas vezes em medicina é a utilização inadequada do argumento de que um estudo não tem poder estatístico para rejeitar a hipótese nula. Por exemplo, alguém é a favor de um tratamento. Este tratamento foi semelhante ao placebo em um estudo pequeno, que não tinha poder estatístico ideal. Daí a pessoa diz que foi erro tipo II e com isso considera que o tratamento deva ser utilizado. Isso é errado! A interpretação certa é que este estudo não demonstrou benefício, portanto o tratamento não deve ser utilizado. Em segundo lugar, por este estudo ser pequeno, a questão ainda não está fechada. Estudos maiores podem (ou não) mostram resultados favoráveis. Devemos esperar estes estudos.

Portanto, devemos analisar o progredir do campeonato para avaliar se a diferença regride à média ou se torna estatisticamente significante com o aumento do tamanho amostral.

Viés de Comparação

Falamos até então da possibilidade de que tudo seja decorrente do acaso, de erro aleatório. Porém, estudos podem também sofrer de outro tipo de erro, o sistemático, denominado vieses. Estes vieses representam erros no métodos dos trabalho. Na questão desta postagem, podemos estar sofrendo do viés do grupo de comparação. Ou seja, o melhor resultado do Bahia em 2013 pode decorrer dos times que lhe servem de comparação (adversários em campo) estarem piores do que em 2012, e não do Bahia estar melhor. Que diga o Fluminense, campeão no ano passado que acaba de demitir o técnico devido a  5 derrotas consecutivas; ou o São Paulo, atualmente na zona de rebaixamento. 


Plausibilidade versus Realidade

Como já vimos, plausibilidade é um dos critérios de causalidade propostos por Bradford Hill. Devo reconhecer que existe certa plausibilidade do Bahia estar melhor. Uma delas é o aspecto motivacional. Observem que esta melhora coincide com o afastamento de um presidente acusado de "irregularidades". Imagine a situação (hipotética) de uma empresa cujo suposto líder é corrupto. Isso torna o grupo de trabalho desmotivado, sendo motivação algo essencial para ganhar competições. Agora imaginem que esse líder é afastado. Isso pode ter um impacto enorme sobre a motivação dos funcionários. Uma esperança de melhora no ambiente de trabalho.

Sendo assim, me parece plausível que o Bahia esteja de fato melhor. Porém devemos lembrar que, cientificamente, plausibilidade não garante realidade. Não basta que um tratamento tenha plausibilidade de benefício, para que seja adotado. Sua eficácia deve ser demonstrada. Portanto, não é porque faz sentido que já podemos ir achando que o Bahia está ótimo. Vamos esperar...

Ainda dentro da plausibilidade, podemos ouvir muitos comentários de especialistas em futebol (os comentaristas), mostrando os porquês do Bahia estar tão bom. Caímos na mesma situação, onde plausibilidade não representa realidade. Até porque estas explicações vem depois dos resultados. Observem (que diga Milton Neves) como os comentaristas erram as previsões dos resultados dos jogos. Aliás se fossem bons preditores, estariam todos ricos com a loteria esportiva. Isso é muito bem retratado no filme Moneyball, em que o personagem de Brad Pitt, manager de um time de baseball, dispensa os velhos especialistas na contratação de jogadores e traz um jovem estatístico, capaz de indicar contratações muito mais efetivas do que as escolhidas pelos entendidos no assunto. A mente do especialista não funciona estatisticamente, funciona de acordo com suas crenças e emoções, ficando sujeitas a vieses de pensamento e fatores de confusão. Isso ocorre muito com especialistas médicos, tema de postagem futura.

Considerações Finais

A vida baseada em evidências (assim como a medicina baseada em evidências) evita de toda forma o dogmatismo. Dogma é quando a gente acredita em uma coisa porque quer acreditar e pronto. Se embasar em evidência é estar de mente aberta e olhar para os dados de maneira fria, estatística, a procura da melhor conclusão. Dizer que o Bahia tem chance de ser campeão é algo que se aproxima mais de fé ou fantasia. É o cérebro direito funcionando mais do que o esquerdo. No esporte, não tem nada de errado nisso, pois esporte é paixão, emoção, sangue, suor e lágrimas. Mas em medicina, tem que ser diferente. Não podemos ser dogmáticos e (por exemplo) propor congelar cérebros de pacientes pós-parada (hipotermia) antes de que surjam evidências melhores do que as primeiras 10 rodadas do brasileirão.

A foto abaixo retrata a última vez que meu cérebro direito me guiou no caso do Bahia. Estava eu ali, entusiasmado com meus sobrinhos, entrando na nova Arena. Para que? Para ver o Bahia perder de 7 x 3 do Vitória. Depois dessa, ficarei com a hipótese nula, até que se prove o contrário (P < 0.05).

Agora, fazendo uma previsão realista. Vai haver uma regressão à média, o Bahia vai cair da 3o posição. Talvez não termine na 15o como no ano passado, terminará algo como na 10o posição. Veremos ...

OBS: Percebam que não sou do tipo de torcedor do Bahia que fico pensando no Vitória. Desta forma, nem mencionei este time em minha postagem. Prefiro convidar o professor de estatística da pós-graduação de medicina da UFBA, meu amigo Paulo Rocha, a escrever sobre seu Vitória. Espero que ele utilize o cérebro esquerdo em sua análise.

* Agradeço ao acadêmico de medicina Marcos Correia, pela assessoria esportiva neste postagem.




domingo, 21 de julho de 2013

LOOK AHEAD



Recentemente, foi publicado no New England Journal of Medicine o estudo LOOK-AHEAD, o qual demonstrou ausência de benefício clínico de intervenção intensa com  exercício físico e dieta para perda de peso em pacientes diabéticos. Será que é verdade?

Citamos este estudo na polêmica postagem O Politicamente Correto e as Recomendações de Hábitos de Vida. Naquele momento, o resultado do LOOK-AHEAD estava anunciado, porém o artigo não havia sido publicado na íntegra. Agora podemos fazer a avaliação deste trabalho, sendo uma boa oportunidade para discutir como analisar veracidade de estudos negativos.

O resultado do LOOK-AHEAD vai de encontro a uma forte crença: intervenção com exercício e dieta para perda de peso trazem benefício clínico. Esta crença é tão forte que a comunidade médica nem mesmo achava que este trabalho seria necessário, tal a “certeza” do benefício destas intervenções. Agora com o artigo publicado, devemos dissecar a evidência. Neste caso, faremos uma análise ainda mais detalhada do que o habitual, devido à surpresa do resultado negativo. Quem achar cansativo, simplesmente acredite na veracidade do trabalho, pule as próximas três partes e leia a parte final, que fala do conforto cognitivo.  Mas quem quiser aproveitar para revisar como se avalia um estudo negativo, leia tudo.

Um estudo pode ser negativo por dois motivos: de fato pode não haver benefício da conduta testada; ou pode ser negativo devido a erros: sistemáticos (vieses) ou aleatórios (acaso). Temos que diferenciar as duas circunstâncias. O resultado de qualquer estudo deve ser visto com ceticismo até que se aplique a análise sistemática da veracidade da evidência. Ceticismo é bom, pois nos deixa mais atentos. 

Erros Sistemáticos (vieses)

Que falhas metodológicas poderiam fazer deste um estudo falso negativo? Observem na equação de um ensaio clínico que de um lado há a intervenção, do outro lado há o desfecho.

INTERVENÇÃO  => DESFECHO

Erros podem acontecer na aplicação da intervenção ou aferição do desfecho.

A intervenção foi descrita pelo protocolo do estudo como “intensa”, caracterizada por reuniões de aconselhamento toda semana, durante os 6 primeiros meses. A dieta recomendada tinha 1.200 a 1.800 calorias/dia e o exercício 175 minutos de atividade moderada-intensa por semana. Parece um bom planejamento, mas o que temos que questionar é se a intervenção promoveu as alterações antropométricas e fisiológicas que teoricamente resultariam em benefício clínico. Esta análise mostra que de fato os pacientes perderam 8.6% de peso no primeiro ano, tal como havia sido planejado pelo estudo. Mais do que isso, sustentaram boa parte dessa perda de peso aos longos dos 13 anos de estudo, terminando com 6% de peso a menos do que no início do estudo. Isso parece pouco, 6-8% de redução em população de 100 Kg em média. De fato, não é uma perda de peso que deixa ninguém esbelto, mas é o que se consegue com dieta; e é dieta que está sendo aqui testada. Inclusive, essa perda de peso supera o que se verifica em estudos de droga para obesidade. Por exemplo, a “aclamada” Sibutramina reduziu 4.5% do peso no estudo SCOUT. Desta forma, o estudo conseguiu testar uma intervenção que de fato reduziu peso; ou melhor reduziu o peso que dieta consegue reduzir. Portanto, não houve viés de aplicação da intervenção.

E quanto ao exercício? Este também foi eficaz em promover mudanças fisiológicas, tendo gerado ganho de capacidade funcional, medido em METS.

Ainda dentro da análise da intervenção, é importante verificar se o grupo controle de fato fez o papel de controle. Um bom controle tem que ser diferente da intervenção, gerando um contraste que provoque diferença de desfecho entre os grupos. Por questões éticas, o grupo controle também recebeu aconselhamento, em menor intensidade. Isso promoveu perda de peso progressiva ao longo dos anos, reduzindo um pouco o contraste entre os grupos. Mas isso não foi suficiente para fazer o contraste desaparecer: em média, ao longo dos anos de estudo, a diferença de peso entre os grupos foi 4 Kg, o que se considera significativo em estudos que avaliam perda de peso com dieta. Na verdade, em estudos de hábitos de vida, é esperado que o grupo controle tenha algum tipo de melhora simplesmente pela motivação de estarem no estudo. O que temos que avaliar é se essa melhora foi grande o suficiente para invalidar o estudo. Aqui não parece ter sido o caso.

Desta forma, quando à intervenção não identificamos vieses preocupantes.

E quanto ao desfecho? Este foi um desfecho composto apenas de eventos duros, objetivos e de importância clínica: morte, infarto e AVC. Isto torna improvável a possibilidade de viés de aferição dos desfechos. Mesmo em estudos abertos como o LOOK-AHEAD (não poderia deixar de ser, por questões óbvias), estes tipos de desfechos raramente sofrem erros de aferição, pois são muito objetivos. Além disso, os autores tiveram o cuidado de tornar cega a adjudicação (auditoria) destes desfechos, evitando que estes pesquisadores soubessem da alocação dos pacientes. Mesmo assim, um eventual viés de aferição, se ocorresse, possivelmente seria a favor do grupo intervenção, visto que a noção de que um paciente experimentou perda de peso e praticou atividade física nos deixa mais propícios a acreditar em melhora prognóstica para estes indivíduos.

Uma virtude deste estudo é o tempo de follow-up, cuja mediana foi de 10 anos. Usualmente os estudos de prevenção primária têm em torno de 5 anos de segmento (vide estatinas, anti-hipertensivos). Por se tratar de intervenções relacionadas a hábitos de vida, poderia ser que os resultados demorassem mais a aparecer. Portanto, os autores tiveram o cuidado de realizar um longo follow-up, quase sem precedentes em estudos de intervenção. Isso dá mais consistência ao resultado negativo, que não pode ser atribuído a tempo insuficiente para se detectar benefício clínico.

Portanto, aqui temos um estudo confiável quanto à intervenção e quanto à aferição dos desfechos.

Mas ainda analisando erros sistemáticos, resta outra possibilidade: o viés de confusão, que ocorre quando os dois grupos são diferentes e essas diferenças podem provocar heterogeneidade de desfechos. Isso pode explicar o resultado consistente dos estudos observacionais, que demonstram associação entre exercício físico e menor risco cardiovascular. Quem faz exercício é diferente de quem não faz (menos doentes, mais cuidadosos com a saúde) e essas diferenças podem ser as verdadeiras causas do melhor prognóstico destes pacientes. Como solucionar? Fazendo ensaios clínicos randomizados, pois a “mágica da randomização” garante que os grupos sejam semelhantes.

Paradoxalmente, as pessoas não atentam muito para a grande necessidade de ensaios clínicos randomizados e insistem em citar estudos observacionais como evidências definitivas do benefício de hábitos de vida, como é o caso do exercício. São exatamente os hábitos de vida que mais precisam de estudos randomizados, pois estes hábitos trazem consigo várias características demográficas, clínicas, antropométricas, sociais, econômicas de seus praticantes. Portanto, às viúvas do exercício ou perda de peso, por favor, não critiquem o LOOK-AHEAD citando estudos observacionais positivos. O potencial viés do desenho observacional é maior do que qualquer outro.

O LOOK-AHEAD é um estudo randomizado e como podemos perceber na tabela de características clínicas, as duas amostras (intervenção e controle) são idênticas.

Porém ainda há um detalhe que normalmente não se percebe e não é considerado na análise de fatores de confusão. Às vezes, os pacientes são semelhantes no momento basal, mas ao longo do estudo se tornam diferentes.  É o que resolvi denominar de fator de confusão prospectivo. Será que o grupo controle foi melhor tratado com drogas por uma reação compensatória dos médicos para com os pacientes que não foram randomizados para a intervenção? Seria um viés de desempenho, típico de um estudo aberto. De fato, houve maior freqüência do uso de estatinas e anti-hipertensivos. Isso foi o que mais me preocupou como potencial viés. Isto poderia ter feito o grupo controle menos predisposto a desfechos, anulando uma eventual superioridade do grupo intervenção. Fui atrás dos detalhes e o material suplementar do artigo traz as informações. Na verdade, a diferença de uso de estatina foi mínina (74% versus 71%), o mesmo com anti-hipertensivos (88% versus 87%).

Erros Aleatórios

Quando um estudo é negativo (não encontra associação), devemos nos questionar se isto ocorreu devido ao que se chama de erro tipo II: não encontrar uma associação que na verdade existe, devido a falta de poder estatístico. Assim, devemos começar por ler o cálculo do tamanho amostral (usualmente no final dos métodos, no item de análise estatística), observando quatro questões:

Primeiro: qual poder estatístico o autor propõe para seu estudo? Este poder deve ser de pelo menos 80%, pois a maior probabilidade de erro tipo II aceitável é 20%. Observem que a probabilidade do erro tipo II é o complemento do poder estatístico (100% - 80% = 20%). Neste quesito, nunca um autor vai propor ter um poder estatístico menor que 80% (seria um tiro no pé). Assim, geralmente o planejado é um poder de 80%, 85% ou 90%. O que pode acontecer é o autor omitir o cálculo do tamanho amostral, justamente por não ter um poder de pelo menos 80%. Isso levantaria suspeita, mas não foi o caso aqui. No LOOK-AHEAD, o poder proposto foi 80%.

Segundo: qual a diferença de desfecho entre os grupos que o autor se propõe detectar? Esse item é muito importante. Na verdade, não existe um único tamanho amostral necessário para cada estudo, pois este depende da diferença que o autor faz questão de encontrar. Quanto menor essa diferença, maior o tamanho amostral necessário, pois para detectar coisas pequenas, precisamos de uma lente grande. Aqui a lente do estudo é seu tamanho amostral. Se o autor faz questão de encontrar uma diferença pequena, seu tamanho amostral necessário grande. Se a diferença que ele faz questão de encontrar é grande, seu tamanho amostral pode ser menor. Quando digo “encontrar diferença” significo obter um valor de P < 0.05.

O que devemos analisar é se faz sentido o grau de diferença que o autor faz questão de encontrar. Ou colocado de outra forma, qual a diferença que ele tolera não encontrar. Devemos avaliar se nesta proposta o autor está aceitando não encontrar algo que seja clinicamente relevante. Idealmente, o estudo deve ter tamanho amostral para detectar as diferenças que sejam relevantes em magnitude, não necessitando demonstrar diferenças sem importância.

Neste estudo, o autor parte das premissas de que a incidência do desfecho no grupo controle seria de 2% ao ano e de que o tratamento traria um redução relativa de 18% no desfecho. Uma redução relativa de 18% em cima de uma incidência de 2% resulta em 0.4% de redução absoluta ao ano. Parece algo razoável, ou seja, ele não está tolerando que grandes reduções não sejam detectadas, pois tem capacidade de detectar 0.4% de redução absoluta. 

Terceiro: devemos agora olhar nos resultados se realmente a incidência de 2% ao ano ocorreu no estudo, do contrário o estudo não teria um numero de desfechos necessários para oferecer tal poder estatístico. Vejam nos resultados que a incidência do desfecho foi 1.9% ao ano, ficando bem próximo ao que o autor se propôs.

Observem então que a análise do poder não se resume à leitura do planejamento do estudo, mas também à leitura de se o resultado do estudo correspondeu à premissa de incidência do desfecho. Se o autor imaginou que a incidência do desfecho seria X e sua incidência foi menor, o estudo terá um poder menor do que ele planejou.

No LOOK-AHEAD a incidência ficou bem próximo no planejado. Sendo assim, podemos afirmar que o autor tinha um poder de 80% para detectar uma redução relativa de 18%, o que julgamos ser adequado.  Ou seja, o erro tipo II deixa de ser uma preocupação maior.

Quarto: por fim, devemos olhar as diferença de desfecho entre os dois grupos. Observem abaixo a curva de incidência cumulativa. É muito próxima, não há diferença alguma. A suspeita de erro tipo II faz mais sentido quando há alguma diferença que não alcançou significância estatística, o que não é o caso aqui.



Aplicabilidade e Diabetes

O resultado deste trabalho se aplica apenas a diabéticos? Já comentamos várias vezes neste Blog sobre o Princípio da Complacência. Ensaios clínicos são experimentos intensamente controlados, que utilizam de uma população-alvo restrita para prova de conceito. Uma vez este conceito demonstrado, devemos (até certo limite) permitir sua extrapolação para que uma população abrangente se beneficie. Esta conduta é respaldada, pois uma vez demonstrado um conceito, é raro que o conceito mude com a mudança do tipo de paciente. Isto porque interação é um fenômeno raro, é só verificar na análise de subgrupo dos ensaios clínicos em geral. A definição de diabetes como critério de inclusão tem sido usada em ensaios clínicos para identificar uma amostra de risco elevado, o que favorece o poder estatístico do estudo. E não porque o interesse da pergunta diz respeito apenas em diabéticos. Isso tem sido um engano, assim como o não entendimento do Princípio da Complacência tem sido talvez o mais importante equívoco de raciocínio em medicina baseada em evidências.

Desta forma, o presente estudo mostra que a intervenção não é benéfica em diabético. Quanto ao não diabético, o estudo pelo menos reduz a probabilidade de que a intervenção seja benéfica. Há alguma aplicabilidade. Pode não fechar a questão em não diabéticos, mas coloca um forte ponto de interrogação, reforçando a necessidade de que isso seja testado, antes de ficarmos afirmando benéficos não demonstrados.

Conforto Cognitivo

Embora bem desenhado e a despeito de nossa criteriosa análise, não faltarão críticas ao LOOK-AHEAD. Estas críticas serão de múltiplas ordens, e ocorrerão devido ao fenômeno de leitura seletiva, quando rejeitarmos evidências que vão de encontro às nossas crenças e abraçamos as evidências que vão ao encontro de nossas crenças.

Os psicólogos dão algumas explicações para isto e uma delas é o interessante fenômeno de conforto cognitivo. Acreditamos no que é mais confortável, pois é desconfortável ter seus valores questionados, dá trabalho de pensamento. Mudança de paradigma é sempre uma ruptura com a tradição. É mais confortável ouvir alguém falar o que já pensamos, dá menos trabalho mental, por mais monótono que isso possa ser. É interessante perceber a feição das pessoas quando falamos em público. Dá para perceber nitidamente o sorriso, a satisfação de alguém quando estamos falando algo com que a pessoa concorda, enquanto percebemos nítida mudança de expressão quando algo controverso entre em conflito com o pensamento vigente. Uma mentira repetida várias vezes vira verdade, pois se torna confortável ouvir uma idéia comum. Conforto cognitivo é um fenômeno psicológico demonstrado cientificamente. É confortável ouvir falar que intervenção intensa com exercício e dieta são condutas benéficas, é desconfortável ouvir falar o contrário.

Pode ser que uma intervenção que promova perda mais substancial de peso (dieta não consegue de forma sustentada, isso é um fato) ofereça benefícios clínicos. Nesta questão, necessitamos de ensaios clínicos randomizados a respeito do impacto de longo prazo da cirurgia bariátrica em desfechos duros, tais como os avaliados no LOOH-AHEAD. 

Na construção do conhecimento científico, devemos fazer um esforço para nos livrar do conforto cognitivo, estando abertos a novos paradigmas, mesmo que estes sejam transgressores da tradição. O rabino Nilson Bonder nos traz em seu livro “A Alma Imoral” a idéia de que transgressão promove evolução, tradição promove estagnação. E quando a transgressão é baseada em evidências (como é o caso da conclusão do estudo em questão), melhor ainda.

Neste aspecto, este trabalho tem um nome perfeito, até visionário em relação ao resultado aqui apresentado: LOOK-AHEAD. Precisamos olhar para frente, sair na zona de conforto cognitivo e nos permitir transgressões de velhos paradigmas, desde que estas sejam baseadas em evidências científicas. Assim, evoluiremos científica, filosófica e clinicamente.

OBS: Este texto é um complemento da antiga postagem O Politicamente Correto e as Recomendações de Hábitos de Vida, onde o estudo LOOK-AHEAD foi pela primeira vez mencionado. Naquela postagem se encontra nossa opinião em relação ao papel do exercício e perda de peso na recomendação médica.

quinta-feira, 4 de julho de 2013

O Movimento da Ruas e a Medicina Baseada em Evidências



Nessa época de indignação que vinha adormecida há muito tempo, foi bonito ver a manifestação dos médicos ontem pelo país a fora. Cobramos melhores condições de trabalho e mostramos que não é com soluções fictícias que se resolverá o problema da saúde no Brasil. As soluções apresentadas pela presidente deste país evidenciam claramente a desordem que habita a mente presidencial, as virtuais propostas representam mais coisa de marqueteiro do que de estadista. De fato, Dilma está longe de ser um estadista e esse momento requer um desses. De médicos cubanos a “20.000 unidades de atendimento médico” essas são as soluções até então apresentadas.

Qual a relação da medicina baseada em evidências com esse momento que o país está vivendo? Além de ir às ruas para exigir condições melhores de trabalho, talvez os médicos possam usar esse momento para refletir se a responsabilidade está toda nos governantes ou se tem alguma que seja nossa também. Ou somos apenas vítimas?

É aí que entra a medicina baseada em evidências, pois além de propor que decisões médicas sejam baseadas em análise científica voltada para eficácia e segurança, o pensamento vai ao encontro da racionalização dos gastos médicos. Deveríamos pensar de forma sistemática em eficácia, efetividade e eficiência (custo-efetividade). Perceberíamos que a melhoria não depende apenas do governo, mas também de como nós, médicos, “administramos” os recursos oferecidos. Senti falta de alguns cartazes com esse tom de amadurecimento em relação a nossas próprias responsabilidades. Desta forma, seguindo o estilo presidencial, apresentarei cinco propostas baseadas em evidências, que representam um pouco que podemos fazer por um sistema de saúde mais eficiente.

1.  Utilizar do princípio mais básico da medicina baseada em evidências: uma conduta terapêutica deve ser instituída como rotina quando houver comprovação científica de seu benefício (exceção às situações de plausibilidade extrema). Neste quesito, devemos evitar o fanatismo por condutas nãodemonstradas e, de forma responsável, implementar rotinas com base no demonstrado. Assim, economizaríamos bilhões na medida em que coisas como Xigris não seriam implementadas antes da hora. Cada especialista pode rapidamente identificar os inúmeros exemplos de procedimentos de alto custo que foram utilizados por muito tempo apenas para depois entendermos que aquilo de nada valia. Isso é rotina na prática médica, trazendo prejuízos financeiros, clínicos (quando a conduta na verdade é maléfica) e científicos (criação de falsos paradigmas, difíceis de derrubar retroativamente).

2.  Evitar a cultura de exames inapropriados. Grande parte dos exames que solicitamos não vão ajudar o raciocínio diagnóstico (atrapalham), nem muito menos melhoram o desfecho do paciente. No entanto, vivemos e propagamos a cultura dos exames, a cultura do check-up. Vejam o caso do teste ergométrico, em que os médicos reclamam tanto o pagamento de míseros 50 reais pelos planos de saúde. Estudo realizado por nosso grupo (tese de Antônio Marconi, de Petrolina) mostrou que 85% das solicitações de testes ergométricos para pesquisa de doença coronária em sua região são inapropriadas, ou seja, testes realizados em pacientes assintomáticos ou com baixa probabilidade pré-teste. Essa amostra tinha tanto pacientes do SUS, como de convênio. Ora, se a gente banaliza tanto um exame, nossa remuneração fica banalizada também, claro. Um exame que praticamente todo adulto faz anualmente, precisa ser muito barato mesmo. Por que não sentamos na mesa e negociamos? “Vou pedir menos exame desnecessário e você aumenta o valor do exame.” Isso sem falar na peregrinação que um paciente do SUS tem que fazer quando um médico “caneta” a solicitação inapropriada de um teste ergométrico. Peregrinação esta que muitas vezes termina em uma clínica popular, com o paciente pagando (desnecessariamente) pelo exame, pois o SUS não tem (nem nunca terá) condição de fazer tanto teste, em tanta gente. Vai até de encontro ao Ato Médico, pois não tem médico para fazer teste em 100% dos adultos brasileiros. Vai acabar tendo que importar médico de cuba mesmo. Estão vendo a incoerência?

3.  Evitar overdiagnosis e overtreatment: muitos dos exames desnecessários acabam sendo positivos (verdadeiramente), mas isso não significa que haja necessidade de tratamento. Angioplastia está indicada em paciente assintomático com entupimento de 75% de uma de suas artérias? Depois de um PSA (contra-indicado como exame de triagem), vem a biópsia, que muitas vezes dá positiva para uma adenocarcinoma localizado, em paciente assintomático. Quase sempre resulta em prostatectomia. Estamos no caminho certo ao diagnosticar e tratar pseudo-doenças? Isso merece uma reflexão.

4.   Pensar em custo-efetividade: mesmo terapias de comprovada eficácia, devem ser analisados sob o crivo da magnitude de seu benefício. Utilizemos o paradigma do NNT. Benefícios verdadeiros, porém de baixo impacto, pouco mudam a vida do paciente. E às vezes são de alto custo. Mesuremos o benefício e avaliemos o custo deste benefício. Há terapias de alto custo (novidades), cujo impacto devem ser analisado na razão de seu benefício. Sejamos responsáveis ao propor que o SUS passe a oferecer stents farmacológicos. Vela a pena mesmo? Onde chegaremos? Precisamos entender melhor o pensamento de custo-efetividade.

5. Propagar o desenvolvimento do pensamento científico: esta deve ser ferramenta crucial para o médico. Nos livra do lobby da indústria farmacêutica, de interesses pessoais, da excessiva hierarquia de conhecimento, a qual inibe o desenvolvimento de nossa forma de pensar. Ciência se desenvolve com base no debate informal, troca de idéias. Em nossos congressos, pouco discutimos ideias, pouco reavaliamos nossos paradigmas. Nos limitamos a repetir o que é dito tradicionalmente, repetir o texto de guidelines. Assim não há risco de discordância, porém corremos o risco de estagnação. Ciência é democracia.

Temos poder de modificar e melhorar a qualidade da saúde pública. E também da saúde  complementar, por que não? Embora nosso aprimoramento não seja suficiente para resolver as questões, este é necessário. Sem a racionalização da medicina, as mudanças reivindicadas não serão resolutivas. Há exemplos de países desenvolvidos com medicina socializada, que aplicam os recursos de forma muito mais racional do que nosso pobre país. Precisamos mudar nossa cultura. Devemos exigir desse governo mediano, como fizemos ontem. Mas podemos também oferecer nossa contra-partida. 

segunda-feira, 17 de junho de 2013

Ensaio sobre a Cegueira



Embora a visão seja um atributo essencial à percepção da realidade, a cegueira exerce importante função científica e clínica. Função científica, como parte da metodologia de trabalhos científicos. Função clínica, na medida em que o pensamento diagnóstico deve levar em conta certas variáveis, porém deve fazê-lo de forma cega em relação a outras variáveis confundidoras. Explicaremos nesta postagem o valor clínico da cegueira, o qual é em geral pouco compreendido.

Um dos mais influentes pensadores, Immanuel Kant (século XVIII), nos trouxe a perspectiva de que a imagem que construímos do mundo a nossa volta não se baseia apenas no que existe, mas também do que nós criamos mentalmente. Ou seja, nossa percepção da realidade resulta da interação entre visão e mente. E quando falo em visão, me refiro aos sentidos em geral.

Realidade = sentidos + mente.

A neurociência confirma a visão de Kant, demonstrando cientificamente que os sentidos não são suficientes para construir uma noção completa da realidade. Portanto, faz-se necessário que ações mentais completem as lacunas deixadas pelos sentidos. Este é um processo mental necessário, porém esta dependência da mente na construção da realidade torna subjetiva a percepção desta mesma realidade, nos sujeitando a armadilhas de nosso inconsciente. Estas armadilhas surgem quando interpretamos nossos sentidos com base em pré-conceitos da realidade.


O Raciocínio Clínico

Analisemos o raciocínio diagnóstico. Este é feito com base em um conjunto de informações que devem se somar, nos convencendo de que o paciente é portador de uma dada condição clínica. Neste caso, para que uma nova informação tenha valor incremental à informação prévia, estas duas devem ter caráter independente.

Por exemplo, eu posso desconfiar (suspeita diagnóstica) que um indivíduo está com um quadro de insuficiência cardíaca com base da história clínica (primeira informação). Em seguida, este paciente é examinado e ausculta-se uma terceira bulha (segunda informação). A informação da presença da terceira bulha deve incrementar nossa desconfiança de que o paciente tem insuficiência cardíaca. No entanto, percebam que a terceira bulha só vai incrementar a suspeita de insuficiência cardíaca, se esta segunda informação for obtida de forma independente da primeira. Do contrario, ela é redundante, não incrementa.

Informações obtidas de forma independente possuem caráter incremental muito mais forte do que informação obtidas de forma dependente. Se a ausculta da terceira bulha é realizada com o conhecimento de uma forte suspeita de insuficiência cardíaca, a dependência das duas informações fazem da terceira bulha um informação redundante à primeira. Ou seja, corremos o risco de não estar confirmando a suspeita, apenas repetindo o mesmo conceito prévio, de forma não incremental. 

Esta é a diferença entre informação redundante e informação incremental.

Faz sentido, não?

Mas por que auscultar o paciente sob conhecimento da suspeita de insuficiência cardíaca torna a terceira bulha redundante? A resposta está em nosso inconsciente. Observem que ausculta é algo muito subjetivo, mais ainda no paciente taquicárdico. Ao crer que um paciente tem insuficiência cardíaca, nossa percepção da presença da terceira bulha fica fortemente influenciada. E é impossível controlar a ação do inconsciente. 

O exemplo da terceira bulha é uma forma de mostrar a influência de uma informação prévia na leitura de uma nova informação. No entanto, na prática clínica é difícil dissociar a história do exame físico, pois ambas são feitas pela mesma pessoa. Nos resta fazer um esforço consciente para auscultar tentando não se impressionar pela história clínica.

Uma provocação reflexiva é se não deveríamos fazer o exame físico antes da história clínica (se isso for socialmente possível). Pois o exame provém dos nossos sentidos, enquanto a história é o relato do paciente. Portanto o exame físico é mais influenciado por nosso inconsciente do que a história clínica. 

Por outro lado, o que aqui discutimos tem bastante aplicação na leitura de exames complementares, pois estes são usualmente realizados por médico diferente do clínico do paciente, sendo possível que a leitura do exame seja cega. Quando o exame complementar é lido sem o preconceito gerado pela noção do quadro clínico, seu valor incremental se torna otimizado.


O Erro Histórico

A despeito da lógica apresentada no raciocínio acima, historicamente os médicos foram treinados a considerar o quadro clínico na leitura dos exames. É isso que chamo de erro histórico do treinamento médico, o qual provoca heurísticas na interpretação clínica, tornando-a menos acurada.

Erradamente, os médicos pensam que devem saber o quadro clínico do paciente antes de ler um exame de imagem, por exemplo. Pensam que isso aumenta a probabilidade de acerto. Mas o que aumenta é a probabilidade do exame concordar com a suspeita clínica, o tornando redundante. Assim, o exame fica mais como um algo confirmatório de uma suspeita, que pode estar certa ou errada.

Com isso não estou dizendo que a clínica não é importante, nem muito menos negando a tradicional frase “a clínica é soberana”. Mas a clínica deve ter uma função diferente da situação descrita acima. A falta desta percepção provoca o tal erro histórico. Vamos então esclarecer como a clínica deve ser utilizada.

Em primeiro lugar, o valor da clínica está em apresentar ao médico realizador do exame o conhecimento do motivo de sua realização. Ao ler uma tomografia de abdômen, é útil que o radiologista saiba que o objetivo do exame é pesquisar dor abdominal aguda, pois ele vai olhar o apêndice e vesícula de forma atenta, em meio a todas as estruturas abdominais. No entanto, ele não deve saber a probabilidade clínica de apendicite: baixa, média ou alta. Pois se ele souber que é uma alta probabilidade, tenderá a descrever como espessado apêndices que em outras circunstâncias nem chamariam a atenção.

Percebam a diferença entre saber o motivo do exame versus saber a probabilidade pré-teste do diagnóstico. Não podemos confundir os dois.

Um bom exemplo são os exames não invasivos de pesquisa de isquemia miocárdica. Digamos, cintilografia miocárdica. Ao receber um paciente para estudo da perfusão miocárdica, já está implícito o motivo do exame, claro que é pesquisa de doença coronária. Daí o médico não precisa saber mais nada, do contrário ele tenderá a ver isquemia nas subjetivas imagens cintilográficas de pacientes cuja suspeita é forte ou desconsiderar certos achados em pacientes com fraca suspeita. Percebam que neste caso o exame perde valor incremental, se aproximando de uma postura redundante em relação ao quadro clínico. No entanto, é comum que o médico, antes de interpretar a imagem, procure saber se o paciente tem dor típica e observe cuidadosamente o eletrocardiograma de esforço do paciente. Este equívoco mutila em grande parte o valor da imagem, cuja interpretação passa ser influenciada por informações de menor acurácia, como sintomas e teste ergométrico. Principalmente quando as imagens tem caráter intermediário, o que é muito comum.

Correto é o médico interpretar a imagem evitando informações prévias que gerem preconceito mental. Evitando a influência do inconsciente.

E onde fica o quadro clínico então, desprezado? De jeito nenhum, pois no raciocínio probabilístico (já muito comentado neste Blog), o médico do paciente fará o cálculo da probabilidade de doença, com base na probabilidade pré-teste e no resultado do teste. Isso é o raciocínio Bayesiano, o qual pressupõe que as duas informações tenham caráter independente.

Desta forma, a segunda utilidade do quadro clínico está no cálculo da probabilidade pré-teste, que cabe ao médico do paciente.  De fato, a clínica é muito importante.

Assim, há duas funções do quadro clínico. 

Em primeiro lugar, o médico operador deve saber o objetivo da solicitação, quando se trata de um exame que avalia múltiplas variáveis, como o ecocardiograma, por exemplo. Neste caso, a técnica correta é realizar o exame inicialmente cego e após ter criado sua imagem mental da realidade do paciente, procurar saber o motivo do exame. Isto para confirmar se ele deu devida atenção às valvas quando a suspeita for endocardite; ou se ele olhou direito o septo interventricular quando a suspeita for CIV. 

Em segundo lugar, o médico que receber o resultado do exame deve fazer o raciocínio probabilístico, o qual considera do quadro clínico (probabilidade pré-teste). 

Desta forma, fica clara a importância da clínica, a qual não deve ser confundida com permissividade da influência do inconsciente na leitura de uma informação. Para evitar a força do inconsciente, devemos utilizar da cegueira.


Por que Pensamos Errado ?

Devemos analisar os motivos que distanciam o pensamento médico do valor da cegueira. Estes motivos também residem em nosso inconsciente.

Como já comentado em nossa última postagem, nossa mente tem um tropismo especial por informações positivas. Nos sentimos melhores médicos quando damos um laudo positivo. Este tropismo ocorre em detrimento da importância de laudos negativos. Lembremos que um exame acurado deve ter duas propriedades, sensibilidade (encontrar os doentes) e especificidade (encontrar os saudáveis). Em nossa mente, prevalece o valor da sensibilidade sobre a especificidade. Não queremos que nenhum achado passe desapercebido por nossos experientes olhos, enquanto nos preocupamos menos com as consequências de uma falsa afirmação. Desta forma, o ecocardiografista quer saber se o paciente tem alta probabilidade clínica de TEP, pois assim seu exame será mais capaz de encontrar uma mínima dilatação do ventrículo direito (verdadeira?); o ecocardiografista quer saber se o paciente teve um infarto, para que nenhuma alteração segmentar deixe de ser descrita, mesmo hipocinesias discretas (verdadeiras?). Aqui uso exemplos de ecocardiografia, não por achar que esta especialidade é mais equivocada do que as demais, mas porque faço este exame em minha prática clínica, tornando mais fácil achar exemplos. Porém enfatizo que isso não é um fenômeno limitado à ecocardiografia. É geral.

Além do tropismo pelo positivo, quando o laudo de um exame concorda com a pensamento do clínico, ficamos todos de acordo e isto é agradável. A hipótese diagnóstica foi confirmada, parece que tudo faz sentido. O médico que realiza o exame fica como um ótimo médico aos olhos do clínico que suspeitou da doença, pois é agradável ter sua inteligente hipótese confirmada. Sinto nitidamente a decepção na expressão do intensivista quando digo que não há sinais de embolia pulmonar no ecocardiograma. 

É muito interessante e peculiar como o pensamento médico é influenciado por nossas emoções. Neste momento entra um novo fator, a paixão pelo diagnóstico.


A Paixão pela Hipótese Diagnóstica

Nós médicos, intrinsecamente vaidosos, nos apaixonamos por nossas hipóteses diagnósticas. Isto provoca o fenômeno de ancoragem, predispondo a mais heurísticas. 

Ocorre da seguinte forma: ao fazer uma hipótese diagnóstica, buscarei de forma apaixonada (paixão carece de razão) fatos que confirmem minha hipótese e inconscientemente darei menos importância a fatos que falem contra esta hipótese. Mais uma vez, a valorização do positivo em detrimento do negativo.

Vejam como acontece. De forma aparentemente perspicaz, faço a suspeita original de que a dispnéia é por embolia pulmonar. A partir daí vou procurar dados que confirmem minha ideia. Vejo uma subjetiva oligoemia no Rx de tórax. Embora este seja um dado de baixa acurácia, supervalorizo a informação, desconsidero os dados negativos e passo a considerar o caso como provável embolia pulmonar. Chamo o ecocardiografista e digo a ele o que estou pensando. Este não encontra hipertensão pulmonar, nem disfunção de ventrículo direito, mas fica na dúvida se este ventrículo está discretamente dilatado. Considerando minha forte suspeita, ele prefere relatar a leve dilatação, praticamente confirmando minha inteligente hipótese de embolia pulmonar. Fico feliz em estar no caminho certo e solicito uma angiotomografia, que vem negativa. O paciente idoso terminou em uso de contraste, desnecessário, pois caso todos os dados (positivos e negativos) fossem considerados (escore de Wells, por exemplo) veríamos que seria baixa a probabilidade de embolia. 

Observem que a falta de cegamento, nos fez encontrar certos dados (oligoemia, dilatação discreta do ventrículo direito) que provavelmente não seriam descritos na ausência de um pensamento preconceituoso. A paixão pelo diagnóstico nos torna tendenciosos, a cegueira nos torna isentos.

Repito assim a frase acima: é muito interessante e peculiar como o pensamento médico é influenciado por nossas emoções. 

Desta forma, o fenômeno de ancoragem ocorre quando nós procuramos dados para ancorar nossa crença diagnóstica. Isto é muito comum. Mesmo quando é impossível a cegueira completa, devemos tentar evitar esse fenômeno.



O Pensamento Estatístico

Estatisticamente, informações para serem complementares precisam ser independentes. Por este motivo, um escore diagnóstico ou prognóstico deve ser criado apenas por variáveis que tenham associação com o desfecho, independente das outras co-variáveis. Apenas os preditores independentes na análise multivariada devem fazer parte de um modelo probabilístico (escore), do contrário as variáveis do modelo serão redundantes e não incrementais. Percebam como a estatística nos ajuda a entender a importância da cegueira na avaliação de dados diagnósticos incrementais.

Erro Tipo I versus Erro Tipo II

O equívoco de priorizar sensibilidade ao invés de especificidade se torna mais claro quando percebemos que o erro de afirmar algo falso (“mentir”) tende a ser pior do que deixar de afirmar uma verdade (“omitir”). Ao afirmar algo falso, umas cascata de consequências toma parte da realidade; por outro lado, omitir uma verdade não gera grandes consequências, as condutas permanecem como estão. Salvo em situações de extrema gravidade onde a omissão é grave (nessas situações o quadro clínico é geralmente exuberante), na maioria das vezes o falso positivo é pior do que um falso negativo. Além disso, na presença de uma alta probabilidade pré-teste, um exame negativo não afastaria a doença, pois o médico de raciocínio Bayesiano pediria um segundo teste.

Estatisticamente, o parágrafo acima guarda relação com os erros aleatórios. Voltando à estatística, toleramos muito menos o erro tipo I, do que o erro tipo II. Em ciência, aceitamos um probabilidade de apenas 5% em afirmar uma falsa associação devido ao acaso (erro tipo I), enquanto aceitamos um probabilidade de 20% em não encontrar uma associação verdadeira pela falta de poder estatístico (erro tipo II). Essa diferença de tolerância reforça o quando mais grave é o falso positivo em relação ao falso negativo.


O Pensamento Médico

Esta apologia à cegueira pode causar estranheza a alguns. Isso decorre de omissões históricas na formação do médico, o qual não é treinado para evitar heurísticas e vieses em seu pensamento. Medicina parece ser interpretada como uma profissão cujo talento é suficiente, nos deixando a mercê de nossa intuição no aprendizado da maneira de pensar. Devemos discutir e aprimorar as técnicas de pensamento, isso vai muito além do talento. Dizem que um músico de técnica refinada e muitas horas de treinamento é melhor do que um músico talentoso com poucas horas de treinamento. Precisamos aprender e treinar a correta forma de pensamento médico.

O estudo do pensamento médico é parte essencial da medicina baseada em evidências, pois sem saber pensar é impossível aplicar corretamente as evidências científicas. Os exemplos clínicos discutidos nessa postagem devem ser norteados pelo pensamento diagnóstico Bayesiano, que requer evidências científicas de acurácia dos métodos, modelos de probabilidade pré-teste validados por artigos científicos e finalmente a noção de que as partes integrantes desse raciocínio devem ser adquiridas de forma independente. Sem o correto pensamento médico é impossível aplicar estas evidências científicas da forma certa, o que faria desaparecer a medicina baseada em evidências.

Portanto não basta interpretar criticamente evidências científicas de forma crítica. É necessário saber aplicar as evidências de qualidade, nessa hora entra o julgamento clínico. Porém o julgamento clínico deve ser feito de forma científica, correta, pensada. Por este motivo, o estudo do pensamento médico é parte integrante da medicina baseada em evidências.

A importância da cegueira tem sido negligenciada na prática clínica. Este é apenas um dos exemplos de necessidade de evolução do pensamento médico. A evolução da medicina no presente século não dependerá tanto de tecnologia, dependerá muito mais do aprimoramento da forma de pensar.

Saber olhar quando devemos ver ou desviar o olhar quando devemos nos cegar faz parte da vida cotidiana e deve ser parte integrante da técnica do pensar médico. O bom olho clínico é o que sabe se fechar ou se abrir nos momentos certos.