Canais de Luis Correia

segunda-feira, 21 de maio de 2012

Viés de Análise de Dados - Bahia vs. Vitória


Em resposta à nossa última postagem, Paulo Rocha, professor adjunto da Faculdade de Medicina da UFBA e que leciona bioestatística na pós-graduação, nos enviou o gráfico acima, com as estatística dos campeonatos baianos. Baseado nas curvas construídas, Paulo argumenta a favor da superioridade do Vitória, tentando rejeitar a hipótese nula de semelhança entre os times. 

No entanto, uma análise mais cuidadosa demonstra que as curvas que Paulo contruiu acima das barras não representam tendência alguma, pois são fortemente influenciadas pelo valor extremo (outlier) da última década. Valores extremos podem distorcer fortemente a análise dos dados. Percebam que o comportamento do Bahia é uma constante, exceto pela última década. A última década ocorreu por acaso e na década de 2010 veremos o fenômeno de regressão à média normalizar tudo a favor do Bahia. 

Percebam que ao analisar um trabalho científico, devemos estar atentos para o viés de análise dos dados, que compromete a veracidade do resultado. Neste caso, apesar de seu inquestionável conhecimento estatístico, a análise de Paulo foi prejudicada por seu conflito de interesse a favor do Vitória.

Réplica

Meu caro amigo Luís,

É um prazer bater essa bola com você aqui na bioestatística, uma vez que, de futebol mesmo, nós não entendemos nada! Acho que o meu gráfico atingiu em cheio o seu sofrido coração tricolor e turvou a sua mente porque, pela primeira vez desde que leio o seu blog, notei alguns comentários improcedentes! Vamos a eles?

Eu não avaliei uma AMOSTRA ALEATÓRIA de edições do Campeonato Baiano. O gráfico mostra TODOS os campeonatos Baianos desde o início da existência do Bahia (1931). Como a POPULAÇÃO inteira de campeonatos foi avaliada, cabe apenas o uso da estatística descritiva. Por isso, não há hipótese nula a ser rejeitada e não é necessário realizar inferência estatística. Os dados representam a verdade absoluta. Não há erro padrão. 

Neste período, o Bahia ganhou o campeonato 44 vezes e o Vitória apenas 24. Este fato é incontestável. A intenção do gráfico foi de descrever como essas conquistas se distribuíram ao longo das décadas. Esta distribuição também é incontestável! Nas últimas 3 décadas, houve uma queda progressiva no número de títulos do Bahia enquanto, no mesmo período, houve um aumento progressivo no número de títulos do Vitória. Estamos falando de um comportamento progressivo ao longo de 3 décadas. Acho que isto qualifica como uma tendência. E a tendência é de queda para o Bahia e ascensão para o Vitória! No entanto, estatística não é bolinha de cristal e não pode garantir que esta tendência vai continuar na próxima década... Infelizmente. 

Como um apaixonado (e enviesado!) torcedor do Bahia, você está querendo apagar a última década da sua mente, chamando-a de outlier! Pior: está atribuindo uma década inteira ao acaso!! Nesta década, o Bahia passou 7 anos na série B e só ganhou um título! Isto não aconteceu por acaso!! O time era muito ruim mesmo.

Enfim, ao ler o seu post, concordei com apenas uma afirmativa: “valores extremos podem distorcer fortemente a análise dos dados”. Com certeza! Mas não é o caso aqui.

Saudações rubro-negras! 



TRÉPLICA


Boa observação, inclusive de importante teor educativo. De fato, quando trabalhamos com populações, não se aplica estatística, não há hipótese, valores de P, erros-padrão, nem intervalos de confiança. 


Estamos discutindo que time é melhor. Veja que esta discussão já não tem lógica, pois a cada período o time é diferente, assim como os seus gestores. Não é como se fosse uma mesma pessoa ou um jogador de tênis. Mas já que esta discussão existe, me permitirei o seguinte argumento:


Imagine que estes times ainda terão muitas décadas de vida, digamos uns 300 anos. Seu gráfico representa uma amostra de todo tempo de vida deste times. É uma amostral temporal, pois não computa o que está por vir. E estamos discutindo que é melhor, como se Deus tivesse feito um time melhor que o outro. Portando uma década dentro de 40 décadas pode ser visto como um outlier.


Valeu pelo didáctico comentário. 

12 comentários:

  1. Luis, neste caso não seria melhor o cegamento no momento da análise dos dados?Futebol tem muitas variáveis de confundimento, amor a camisa é uma delas.

    ResponderExcluir
  2. Uma curiosidade de um leitor de outro estado: como pode, nos anos 90, haver 6 títulos para o Vitoria e 5 para o Bahia?

    ResponderExcluir
    Respostas
    1. em 99 o titulo foi dividido pq o jahia correu da final, msm tendo vantagem rsrs

      Excluir
  3. Fantástico, mestre! A minha paixão nunca me enganou!

    ResponderExcluir
  4. O Campeonato de 1999, após disputa jurídica (o popular "Tapetão"), foi dividido entre os 02 times.

    ResponderExcluir
  5. Ah, se todas as discussões na Medicina fossem assim... Parabéns aos dois! Expor que até mesmo o "dono" do Blog está sujeito a influências externas é abordar com maturidade o fato de que somos humanos, todos nós. E o tom das respostas demonstra como é possível tratar do assunto de forma saudável. Se agíssemos assim em nossas associações médicas, e tivéssemos o mesmo tipo de resposta de nossas lideranças, muitos dos problemas decorrentes de conflitos de interesse (inexoráveis ou não) seriam minimizados. Parabéns!

    ResponderExcluir
  6. E vejam como a questão não é nada simples: sequer é correto comparar Bahia e Vitória descontextualizado do todo. Fosse a final do Baiano depois do jogo de hoje, talvez o resultado fosse outro, e independente dos times em si (efetividade). Era sabido que o Falcão iria tremer contra o Grêmio. Não teve sorte o Vitória em relação o momento em que decidiu. Pegaria um Bahia menos efetivo, abalado, apesar de intrinsicamente o mesmo.

    ResponderExcluir
  7. Meu tio,
    Sensacional a análise e discussão acerca do tema! Muito bom mesmo! Enviei pra meus amigos, espero que nao se importe!
    beijos

    ResponderExcluir
  8. O bate bola sobre Vitória x Bahia está muito interessante e informativo. Penso que, muito acima da discussão quantitativa dos dados, está a pesquisa qualitativa sobre o assunto FUTEBOL. Copiando trecho de um pesquisador paulistano, digo:
    "...a expressão "pesquisa qualitativa" ... compreende um conjunto de diferentes técnicas interpretativas que visam a descrever e a decodificar os
    componentes de um sistema complexo de significados. ... O vínculo entre signo e significado, conhecimento e fenômeno, sempre depende do arcabouço de
    interpretação empregado pelo pesquisador, que lhe serve de visão de mundo e de referencial....Devem-se [entretanto] evitar ilusões, quando nos deparamos
    com estudos qualitativos."

    Dito isso, digo que torço pelo melhor: o VITÓRIA!

    Saudações aos amigos

    ResponderExcluir
  9. Adorei o texto e a repercussão que teve!! Precisa incluir aí o resultado do campeonato deste ano. rsrs.

    ResponderExcluir
  10. Muito bom o texto e a discussão desenvolvida. Entretanto no ultimo comentário, o professor Luis, por não ter argumentos sólidos, apelou para metafísica (rss). Evidentemente, o Vitória vem tendo melhor desempenho também na atualidade de 2015.

    ResponderExcluir
  11. hahahahaha não entendo nada de futebol, mas achei fantástica essa discussão!
    "O que diferencia as pessoas extraordinárias das comuns: Amor, Humor e Inteligência".
    Definitivamente isso não falta por aqui... =D

    ResponderExcluir