terça-feira, 11 de junho de 2019

Disparidade de gênero não é um problema científico



Em série especial de artigos publicados em 30 de maio, o Lancet traz extensa discussão sobre disparidade de gênero, abordando o impacto dessa desigualdade social na saúde de indivíduos, no funcionamento do sistema de saúde e no ecossistema científico. De acordo com o UN Educational, Scientific and Cultural Organization’s Women in Science menos de 30% dos cientistas do mundo são mulheres, as quais publicam menos artigos e possuem menos colaborações internacionais do que homens.

Recente artigo original publicado no Journal of American College of Cardiology demonstrou que mulheres correspondem a 36% dos indivíduos de amostras em ensaios clínicos, uma subrepresentação em se considerando que no mundo há igual número de homens e mulheres. 

Se por um lado, disparidade de gênero na população (descrita no Lancet) tem importância social, por outro lado, disparidade em amostras científicas (descrita no JACCnão impacta negativamente a confiabilidade de um teste de conceito biológico.

Disparidade não é um problema científico no que diz respeito a conceitos biológico. 

A percepção da forma equivocada com que especialistas interpretam disparidades em amostras, questionando erroneamente a validade externa de conceitos científicos me provocou a escrever este texto, a fim de reforçar um conceito já abordado previamente nesse Blog: o princípio da raridade da interação. 

Precisamos distinguir quando representatividade de subgrupos em amostras é necessária para a confiabilidade do resultado da pesquisa e quando isto não é um problema. 

Representatividade é importante para estudos descritivos, que retratam o mundo real, o qual é influenciado também por circunstâncias sociais. Por exemplo, a prevalência de doenças, letalidade ou efetividade de condutas (funcionamento do mundo real) pode variar com a realidade local. 

Por outro lado, representatividade não é necessária para testar a “existência” de conceitos científicos (leis da natureza), pois um conceito demonstrado em um subgrupo se reproduzirá em outro subgrupo. É o caso de ensaios clínicos randomizados que testam o conceito de eficácia (propriedade intrínseca). Se a conduta for eficaz, isso será verdade em homens e mulheres, brancos e negros, jovens e idosos, latinos e caucasianos. 

Parece surpreendente essa minha afirmação, até mesmo politicamente incorreta. Se a sensação de surpresa ocorreu, precisamos relembrar um princípio científico universal.


O Princípio da Raridade do Fenômeno de Interação


Antes de falar das evidências a respeito desse princípio, peço que pensem sobre qualquer conduta médica estabelecida. Por exemplo, vacinas, antibióticos, anti-hipertensivos, cirurgias para qualquer coisa, marca-passo, diálise, anticogulantes em diversas situações, tratamento de reperfusão no infarto …  Exceto questões diretamente relacionadas ao sexo biológico (contraceptivos, tratamentos de puberdade, terapia de reposição hormonal, tratamentos na gravidez ou coisas assim), não há coisa alguma que seja indicada para um sexo e não indicada para outro sexo. Se alguém encontrar, me mande pelos comentários do Blog para eu colocar em minha lista de exceções que até agora não tem nenhum item.

Denomino este princípio de “raridade da interação”. Interação deve ser entendida como "modificação de efeito”. Por exemplo, testar interação entre sexo e uso de droga X na prevenção cardiovascular significa testar “modificação de efeito” da droga X de acordo com sexo do paciente: benefício em homem, não benefício em mulher, ou vice-versa. Ou magnitude diferente de benefício. Interação é testada estatisticamente na análise de subgrupo. Se o valor de P da interação for estatisticamente significante, há interação. 

Um equívoco comum ocorre quando um estudo é positivo no tipo de paciente A e negativo no tipo de paciente B. Nestes caso, muitos acham que o conceito é verdadeiro no paciente A e falso no paciente B. Porém, estas diferenças usualmente decorrem de heterogeneidade dos estudos quanto a risco de viés ou acaso. Na verdade, para afirmar que uma coisa acontece no tipo de paciente A e não acontece no tipo de paciente B, ambos os tipos devem estar presentes no mesmo estudo para que se teste interação. É inadequado concluir por diferenças entre populações não comparadas no mesmo estudo.

Diferentes do que muitos clamam, se estudos de amostras diferentes mostram resultados diferentes, a causa da diferença não está na população estudada. Quase invariavelmente a heterogeneidade decorrerá de diferença na metodologia da pesquisa. Conceitos demonstrados por trabalhos de alta qualidade tendem a ser reprodutíveis em diferentes tipos de pessoas. 

Agora vamos às evidências que suportam o princípio da raridade da interação. O gráfico abaixo, tirado do trabalho de disparidade de gênero publicado no JACC, compara o hazard ratio de diferentes tratamentos entre os dois sexos. Observem que em todos os casos, a medida pontual do hazard ratio está do mesmo lado da linha da nulidade. Observem que na maioria dos casos o hazard ratio dos dois grupos está quase na mesma posição. Interessante notar que quando eles diferem um pouco mais para esquerda ou direita, é porque pelo menos um dos grupos tem um N pequeno e um intervalo de confiança menos preciso. Isso reforça duas afirmações que fiz neste postagem: interação é um fenômeno raro e eventuais diferenças resultam mais da falta de confiabilidade dos trabalhos. Lembro que em análise de subgrupo não importa se o intervalo de confiança cruzou a linha da nulidade. O que importa não é significância dentro de um grupo, mas sim a significância da análise de interação. 



A evidência sobre ausência de interação está em qualquer ensaio clínico randomizado de qualidade. Sugiro que escolham aleatoriamente um grande ensaio clínico randomizado que foi positivo. Vejam o forrest plot. Percebam que as medidas de associação em diferentes subgrupos estarão todas no mesmo lado do efeito. Um bom estudo positivo tem resultado consistente em diferentes subgrupos. Vejam também do lado direito do forrest plot o valor de P da interação para cada análise de subgrupo. Percebam que este valor de P quase nunca é significativo. Se algum for significativo, ainda tem a possibilidade do acaso pelo problema da multiplicidade de testes. Nenhum passa pela correção de Bonferroni (P x número de subgrupos).




O que está por trás da raridade da interação? Neste momento, entramos em uma discussão típica de filosofia da ciência. A explicação está no entendimento de que a natureza tem regras de funcionamento. E estas regras são universais. Por que chove? Em qualquer cidade do mundo, em qualquer país, os mecanismos são os mesmos. A explicação mecanicista é a mesma. Uma lei da natureza é universal. 

Embora eu esteja sendo bastante assertivo, devo reconhecer que o processo de generalização de um conceito tem exceções. A física de newton é generalizável, funciona em qualquer local do planeta. No entanto, no nível de partículas subatômicas, prevalece a física quântica. Portanto, havendo uma grande razão para o conceito não se reproduzir, devemos manter o ceticismo. Do contrário, o conceito é generalizável.

Certeza Conceitual versus Incerteza Individual


Não devemos confundir lei da natureza com certeza individual. Uso o exemplo da chuva para lembrar que a universalidade do conceito científico não é o mesmo que previsibilidade. Sabemos o mecanismo das chuvas, mas não podemos prever com perfeita acurácia se vai chover. 

Aplicando isso ao conceito de interação biológica, não existe interação entre sexos, porém isso não quer dizer que garantimos o resultado de uma conduta em mulheres. Mas também não garantimos nos homens, a incerteza é igual. 

O conceito é garantido, mas a probabilidade de um desfecho varia individualmente. O conceito de interação avalia se a variabilidade entre os sexos vai além da variabilidade individual. Não havendo interação, a dúvida se o tratamento funcionará em uma mulher é a mesma dúvida que funcionará em um homem. 

Portanto, quando asseguro que o tratamento funcionará em mulheres assim como em homens  (baixa incerteza conceitual) não quero dizer que funcionará igual em todas as mulheres (incerteza individual). A incerteza individual permanece.

Imprevisibilidade dos Conceitos


Não devemos pensar que conceitos científicos (leis da natureza) são previsíveis. Pelo contrário, um conceito científico (tal droga tem tal efeito?) é imprevisível antes de ser empiricamente demonstrado. Mas depois de demonstrado por estudos de boa qualidade, este conceito se estenderá a diferentes tipos de pacientes. 

Denomino isso de “princípio da rigidez” versus “princípio da complacência”. No primeiro, devemos ser rígidos e céticos, e só afirmar quando houver verdadeira comprovação científica do conceito. Uma vez comprovado, usaremos o “princípio da complacência”, aplicando o conceito a diferentes tipos de pessoas desde que não haja forte razão biológica contrária. Boa parte das boas condutas médicas são embasadas em evidências indiretas utilizando o racional do “princípio da complacência”.

Utilidade desta Discussão


Qual a utilidade em entender o “princípio da complacência” baseado na “raridade da interação”?

Primeiro, perseguir ótima representatividade da amostra (proporção de subgrupos da amostra = proporção na população) paradoxalmente pode eduzir a validade interna do estudo de prova de conceito. Por exemplo, ensaios clínicos usualmente selecionam indivíduos de alto risco para desfechos. Essa proporção de alto risco é diferente do que ocorre no mundo real, mas é importante para aumentar o número de desfechos, aumentar o poder estatístico, reduzindo o risco de erros aleatórios. Se colocamos uma proporção de subgrupos de risco semelhante à população, teremos menos desfechos e menos precisão. Isso é só um dos exemplos pelos quais representatividade por não ser uma boa ideia em estudos que testam hipóteses. 

Conceitos devem ser testados em um ambiente artificial a fim de reduzir vies e acaso. O mundo real não é um bom ambiente para se testar conceitos. 

Segundo, o conhecimento do que discutimos previne a caricatura da medicina baseada em evidências, quando se exige que evidências existam para cada tipo de pessoa. Isto não é necessário, pois conceitos científicos são generalizáveis.  

Terceiro, previne que acreditemos simultaneamente em estudos contraditórios. Muitas vezes se dá crédito a um estudo ruim positivo, apesar de um bom estudo ter nisso negativo, com base no argumento de que as amostras tinham características diferentes, como se isso permitisse acreditar nos dois estudos simultaneamente. Como se isso interferisse nos resultados … não interfere.

Em conclusão, desigualdades populacionais têm implicações sociais. Por outro lado, disparidades em amostras não comprometem validade científica na prova de conceitos. Ciência é apolítica, politicamente incorreta. Não devemos confundir política com ciência.

---------------------------------------------------------------------------------


Conheça nosso novo Curso Online de MBE, clicando aqui.

3 comentários:

  1. interação é um fenômeno raro! depois que entendi este conveito minha visao de mbe mudou completamente. basta pensar q os veterinários usam basicamente os mesmos remédios que aplicamos em humanos, e os usam em diferentes especies com resultados semelhantes, o que também pode ser extrapolado para substâncias tóxicas. se quase nao há diferenças entre especies diferentes quiçá entre entre individuos da mesma especie! de acordo com a evolução nós não estamos separados tempo suficiente para isso! parabéns pelo texto professor!

    ResponderExcluir
  2. Olá professor. Ao ler o texto me surgiu uma dúvida que não consegui identificar se é válida como "exceção" ou se não é aplicável ao contexto descrito. De fato, o conceito abordado me parece no limbo entre a subjetividade e a objetividade científicas, e portanto difícil de ser totalmente compreendido. Pensei no exemplo da conduta trazida nas novas diretrizes de 2019 para anticoagulação ambulatorial de pacientes com Fibrilação Atrial: o CHADS2VASC2 requer uma pontuação diferente para homens e mulheres para se indicar ou não a decisão de anticoagular. Isso conta como um exemplo de exceção ou não se aplica? Pensei nele pois apesar de ser uma disparidade diminuta ela de certa forma demonstra condutas diferentes baseadas em gênero em uma contexto não específico.
    Aguardo sua resposta! Abraço!

    ResponderExcluir
  3. A disparidade de gênero é um problema sociopolítico. Mas pode intrferir direta ou indiretamente em fatos biológicos.


    Em se tratando da execução de exames diagnósticos e avakliação de desfechos, temos que compreender que a variação biológica pode (em certos casos) ser dependente da variação biológica "Gênero" (sexo). Ninguém faz um screening de próstata em mulheres, nem um Papanicolau periódico em homens.

    O Hemograma apresenta Valores de Refrência nitidamente diferentes entre os sexos: mormente a dosagem de Hemoglobina (vaiável também em função de idade)

    Mas, para certos casos: Quem sabe?...

    Será que alguma variação hormonal ou mesmo de órgãos como pele e mucosas pode fazer das mulheres mais susceptíveis, por exemplo, à penetração por larvas de helmintos como Strongyloides sp, Ancilostomídeo, schistosoma mansoni? Nem sei se isso já foi estudado (não creio).

    Vamos comparar a um outro exemplo: A partir de um certo tempo em nossa história científica, alguns pesquisadores passaram a dificultar a própria vida por razão de "preconceito social"; as etnias humanas passaram a ser descritas como: "branco" e "não branco".

    Ora, entre os "não brancos" estão diversas etnias de origem indígena, que por serem originalmente "populações naïve" quanto ao hemilnto Schistosoma, apresentam como desfecho uma maior probabilidade de infestação aguda com manifestações sistêmicas; Já os de origem negra, com uma história racial de contacto secular com esse helminto, têm uma constituição genética que os predispõe à infecções crônicas.

    Os valores de PSA (em que pese o fato de que, sozinho, este exame não é determinante de desfechos) são considerados com Valor de Referência superiores em relação à raça branca; igual não ocorre necesarianente em populações indígenas, que também são consideradas "não brancos". Qual o VR atribuível a estes? p dos "brancos" ou o dos "não brancos"? Um indivíduo pode ser "não branco" para um determinado desfecho, e "branco" para outro (acredito que, no nosso ambiente multirracial, sim...)

    Até mesmo a estimativa matemática da Taxa de Filtração Glomerular pode ter variantes diferentes em função de etnias.

    Então, se progride essa tendência quanto ao gênero, acabaremos tendo de declarar os nossos clientes em função disso: seriam os "heterossexuais" os "não-hereossexuais"? "homens" e "não homens?" "mulheres" e "não mulheres"? Ou deveríamos especificar com maior distinção??

    A EBM precisa se pautar por critérios objetivos - não emocionais ou ideológicos - em suas definições. Nem todos os desfechos dependem e necessitam m estudo em função de sexo, gênero e etnia, mas essas questões devem ser abordadas metodologicamente. Esses valores precisam ser declarados, e tratados cientificamente, em estudos científicos. Não interessam valores políticos, de preconceitos, de ideologias. Se um estudo Randomizado Com Controle é feito sem definições quanto a isto, O fato deve ser declarado e os autores, abertos (também) a criticas quanto a esses fatos básicos.

    ResponderExcluir