domingo, 30 de setembro de 2012

O que é Intervalo de Confiança?



Vemos com muita frequência o uso de intervalo de confiança nos resultados de diferentes tipos de estudos. Por exemplo, em estudos que avaliam eficácia terapêutica ou marcadores de risco, a descrição do risco relativo sempre é seguida do intervalo de confiança. Em estudos de acurácia, as medidas de sensibilidade e especificidade devem também ser seguidas do intervalo de confiança. Em estudos descritivos, de prevalência ou incidência, estas proporções devem ter seus intervalos de confiança.

Imaginem que um ensaio clínico randomizado afirma que “o risco relativo da droga em relação ao placebo foi 0.78 (95% IC = 0.68 – 0.88).

O que significa isso?

Se nossos estudos avaliassem toda a população-alvo do estudo, teríamos plena confiança nos resultados. Porém isso não é factível na maioria dos casos, fazendo com que estudemos amostras, ao invés da população. Ao estudar um parte da população (amostra) podemos dar o azar (acaso) de encontrar um resultado que difere da realidade. Por isso, devemos estimar a precisão estatística do resultado. Como fazer?

Poderíamos pensar, se não tenho certeza de que minha amostra está correta, farei um segundo estudo para checar. Neste segundo estudo, imaginem que o resultado do risco relativo foi 0.77, ao invés de 0.78. Puxa vida, então como saber onde está a verdade? Bem, façamos um terceiro estudo, cujo resultado foi 0.79. O jeito é fazer um quarto estudo, e assim sucessivamente ... Ao completar 100 estudos nesse processo de busca do verdadeiro risco relativo, vamos nos deparar com uma variação dos resultados destes estudos. Utilizando esta variabilidade dos resultado, calculamos o intervalo de confiança.

O intervalo de confiança no nível 95% (95% IC) significa que o resultado estará dentro daquele intervalo em 95 dos 100 estudos hipoteticamente realizados, ou seja, o risco relativo estará entre 0.68 e 0.88. O 5 estudos excluídos deste intervalo representam valores extremos que possuem maior possibilidade de terem ocorrido por acaso. Por isso são excluídos de um intervalo que deseja estimar onde está a verdade.

Desta forma, a leitura correta do intervalo de confiança é: podemos afirmar que em 95 de 100 amostras hipotéticas, o resultado estará dentro deste intervalo.

O valor de 0.78 é uma medida central, mais próxima da verdade, porém não há garantia de que seja exatamente isso. A garantia é de que o risco relativo não está acima de 0.88, nem abaixo de 0.68. Observem que quanto mais estreito o intervalo de confiança, mais precisa é a estimativa. E essa é exatamente a definição estatística de precisão, a capacidade de um resultado se repetir em diferentes medidas da mesma realidade.

Se a medida em questão possuir um valor que representa a hipótese nula do trabalho, podemos usar o intervalo de confiança para avaliar significância estatística. No caso do risco relativo (ou do hazard ratio), o valor 1 representa ausência de diferença entre grupo tratamento versus grupo controle; ou expostos ao fator de risco versus não expostos. Portanto, se o intervalo de confiança do risco relativo envolver o valor 1, o estudo não terá significância estatística para rejeitar a hipótese nula. Pode conferir, isso sempre coincide com um valor de P maior do que 0.05. No caso da redução absoluta de risco, o intervalo de confiança não deve envolver o zero para ter significância estatística.

Há situações em que o intervalo de confiança se refere a uma medida descritiva simplesmente, não há teste de hipótese (nem hipótese nula). Por exemplo quero descrever qual é a média do colesterol de uma população. Encontramos uma média  de 220 mg/dl e podemos usar o intervalo de confiança para estimar a precisão dessa afirmação. Também serve para variáveis categóricas, ou seja, intervalo de confiança de proporções, tipo: prevalência, incidência (risco), sensibilidade, especificidade.

Mas como se calcula o intervalo de confiança?

Claro que não precisamos fazer 100 estudos para calcular. Podemos obter este intervalo com apenas um estudo realizado, ainda bem. Estudando apenas uma amostra e utilizando fórmulas estatísticas que levam em consideração o tamanho amostral, a  variabilidade de uma variável contínua (a redundância foi proposital) ou a frequência do desfecho quando a variável é categórica. Essas fórmulas nos fornecem o erro-padrão, que é a medida de incerteza do estudo. Simplesmente, o resultado encontrado na amostra ± 1.96 erros-padrão = intervalo de confiança.

Curiosidade: Por que 1.96? Este é o valor de Z que delimita 95% de probabilidade de acordo com a curva de distribuição normal (mas não se preocupem em entender isso).

Quando a variável é numérica, fica fácil calcular o erro-padrão, pois este é o desvio-padrão dividido pela raiz quadrada do tamanho amostral. Quando a variável é uma proporção, utiliza-se uma fórmula um pouco mais complexa. Há calculadoras online (vejam aqui) que nos permitem calcular intervalo de confiança de uma proporção, digitando apenas o numerador e o denominador da fração.

O intervalo de confiança é uma medida pouco entendida, pois não estamos acostumados a pensar assim no cotidiano. Precisamos permitir que este conceito penetre em nossas mentes. Por exemplo, não existem pessoas 100% confiáveis, qualquer um mente de vez em quando. É só assistir ao filme de Liar Liar (1997, com Jim Carrey), que perceberemos o quanto caótica seria a vida sem pequenas mentiras. Por outro lado, mesmo reconhecendo que alguém mente, podemos identificar que esta pessoa tem um intervalo de confiança que nos deixa tranqüilos em saber que não seremos traídos por ela em assuntos relevantes. Ao invés de tratar pessoas de forma dicotômica (honestos ou desonestos), podemos classificá-las de acordo com a amplitude de seu intervalo de confiança

No julgamento do Mensalão, há réus com intervalos de confiança extremamente amplos, chegando próximo ao infinito. O que me parece é que quanto mais amplo o intervalo de confiança, mas cara de pau a pessoa é. Pena que aquele com intervalo de confiança mais amplo de todos não esteja oficialmente como réu do Mensalão.

27 comentários:

  1. Luis, suas duas últimas postagens foram demais. Trago aqui a ideia de alguns que têm lido o blog e são iniciantes como eu: teria como ordenar as postagens não cronologicamente, mas de uma forma lógica? De a organizar pouco a pouco o pensamento?

    A sugestão que dei: fazer seu curso e ler TODAS AS POSTAGENS...

    Parabéns...

    Marcia Cristina
    Recife

    ResponderExcluir
  2. Marcia. Obrigado por compartilhar. Excelente.

    ResponderExcluir
  3. Seguindo o raciocínio acima seria possível um curso on line de MBE?
    As postagens estão excelentes como sempre
    Wálmore Siqueira

    ResponderExcluir
  4. Professor! Muito bom!Quando vai vir em Rondônia fazer uma palestra de Medicina Baseada em Evidência? Vou mobilizar a liga de Cardiologia aqui ano que vem! Abço

    ResponderExcluir
  5. Bom texto! Recomendo como leitura complementar o texto -> Paes AT. Por Dentro da Estatística. einstein 2008;6(3 Pt 2):107-8. Disponível em: http://apps.einstein.br/revista/arquivos/PDF/971-EC%20v6n3%20p107-8.pdf

    ResponderExcluir
  6. Para alguns o grande problema no IC está no cálculo do erro-padrão. E deste no cálculo da amostra. Se errar na amostra se erra em tudo mais....

    ResponderExcluir
  7. Gostei de seu blog!
    Muito caprichado!
    Indiquei para os leitores de meu blog!

    http://dicasemclinicamedica.blogspot.com.br/

    ResponderExcluir
  8. Comecei a ler o blog por indicação de Dra. Nevinha, do Procape. Muito bons os comentários e a permanente revisão de conceitos relacionados a MBE. Também apoio um curso online!

    ResponderExcluir
  9. Muito bom o texto e o blog. Todavia, Como usar o intervalo de confiança para classificar o grau de confiabilidade de uma pessoa, ou seja, a dicotomia honestidade ou desonestidade, haja visto que, o comportamento humano é muito complexo, e se sub-divide em inúmeros tipos de mentira com incidências diferentes, mentiras bobas do dia-a-dia tipo: P:"Estou bonita hoje?" R:"Está" quando na realidade não está, há mentiras sérias. Como classificar e estatizar os padrões comportamentais.

    ResponderExcluir
  10. Jorge Peregrino Braga26 de janeiro de 2013 às 10:51

    Em respeito ao seu comentário sobre os novos anticoagulantes, concordo que o uso indiscriminado por parte de muitos profissionais, aumentou as complicações, coisa que não aconteceria se o uso fosse mais bem analisado. Pois bem. No entanto, a eterna espera por uma droga anticoagulante ou que diminuisse eventos e que não fosse considerada, "uma outra doença", como é o caso dos cumarinicos, foi "contemplada", pela chegada triunfal, destas novas drogas. Faço este comentário, para em parte defender os colegas que foram induzidos pela industria farmacêutica, a pensar que estes novos medicamentos eram, "a salvação da lavoura", e que poderiam ser usados quase como "AAS", ou seja dê ao seu paciente e esqueça. Acho que o Ministério da Saúde deveria ter mais cuidado com estes novos medicamentos que entram no mercado e quando se nota, todo mundo já esta usando. Os stents farmacológicos da primeira geração, quando foram lançados, apresentaram nitidamente, aumento dos casos de trombose aguda e como você se lembra, todas as sociedades diziam que era, "impressão" dos médicos, e que os trabalhos mostravam que não havia diferença estatística, até que, depois de muito barulho, reconheceram que era a pura verdade. Agora, depois de tudo sedimentado com o uso do Clopidogrel, eu que sou hemodinamicista, e que nunca mais tinha tido ou visto falar em casos de trombose aguda. De repente, o clopidogrel já não é tão bom e precisamos de novos antiagregantes, pois bem, ai começam a surgir trabalhos, nem sempre muito convincentes, da superioridade dos novos antiagregantes, e paralelamente começo a observar o ressurgimento dos casos de trombose aguda. Recentemente ouvi de um paciente o seguinte comentário, "logo agora que o clopidogrel ficou barato, me receitaram um novo remédio, que eu tenho que tomar 2 vezes por dia, é mais caro, e nem sempre acho nas farmácias".
    Eu continuo usando clopidogrel.

    ResponderExcluir
  11. Achei excelente. Entendi algo em cinco minutos que durante todo o período não entrou na cabeça.
    Você é ótimo!

    ResponderExcluir
  12. Excelente!! Quem sabe aquele com o maior intervalo de confiança um dia não esteja no banco dos réus...

    ResponderExcluir
  13. Parabéns, pela explicação, simples, direta e verdadeira!

    Elis

    ResponderExcluir
  14. Alexandre Kowalczuck8 de outubro de 2014 às 09:37

    Muito obrigado pela explicação. Excelente!!

    ResponderExcluir
  15. Ótimo texto. Apenas totalmente desnecessário o juízo de valor no final...

    ResponderExcluir
  16. Muito legal o texto. Ja tinha estudado estatistica no MBA e agora mudei de area e estou tendo que ler varios papers na area medica. Consegui resgatar os conceitos que ja nem lembrava mais que sabia. Um abraço.

    ResponderExcluir
  17. Postagem excelente, professor Luis Correia. Muito bem explicada a interpretação de um intervalo de confiança.

    ResponderExcluir
  18. "O intervalo de confiança no nível 95% (95% IC) significa que o resultado estará dentro daquele intervalo em 95 dos 100 estudos hipoteticamente realizados, ou seja, o risco relativo estará entre 0.68 e 0.88."

    Há um pequeno problema na definição do IC. O IC é um estatística e, portanto, depende da amostra. Se fizermos diversos estudos com o mesmo tamanho de amostra a partir da população alvo, obteremos intervalos de confiança com pontos extremos diferentes. Isso é ainda mais verdadeiro quando utilizamos o erro padrão amostral e a distribuição t para determinar o intervalo.
    P.e., vaja como o IC difere na estimativa da média de uma mesma população com média 0 e dp 1, em cinco amostras de tamanho 100:
    1) M=-0.05; CI95% = [-0.27, 0.13]
    2) M=-0.03, CI95% = [-0.24, 0.18]
    3) M=-0.026, CI95% = [-0.24, 0.19]
    4) M = -0.03, CI95% = [-0.23, 0.17]
    5) M = -0.31, CI95% = [-0.5, -0.12]

    Veja: pela definição dada, se tomamos o primeiro estudo, o valor verdadeiro deveria estar entre -0.27 e 0.13. Mas o segundo estudo dá um intervalo maior, com extremidades diferentes. No primeiro, achávamos que não poderia ser maior que 0.13; pelo segundo estudo, poderíamos afirmar que o valor verdadeiro poderia incluir valores até 0.18!

    Portanto, a garantia de um intervalo de 95% não é que o valor verdadeiro estará entre os extremos de um intervalo calculado, pois os extremos e a tamanho do intervalo variam com amostra, tanto quanto o tamanho do efeito. O correto é afirmar que o procedimento de cálculo do IC gerará intervalos que contém o valor verdadeiro 95% do tempo.

    ResponderExcluir
  19. Muito claro, uma ótima revisão para mim.

    ResponderExcluir
  20. Excelente texto ! Assistir as aulas e ler o blog depois, faz toda a diferença na sedimentação do conhecimento e no entendimento do que foi visto no Curso.

    ResponderExcluir