O que é o teorema de Bayes, regra essencial da informática criada para ‘provar milagres’

17/12/2021

P(A|B) = (P(B|A)P(A))/P(B)

Certamente a frase acima não é a maneira mais comum nem a mais clara de iniciar uma reportagem. É disso, no entanto, que vamos falar aqui. Algo que, como diz o título deste texto, está ligado à informática e a milagres.

Trata-se do teorema de Bayes. Ainda que muitos de nós não tenhamos ouvido falar dele, as estatísticas bayesianas permearam tudo, da física – com interpretações bayesianas da mecânica quântica e defesas bayesianas das teorias de cordas e do multiverso – às pesquisas sobre câncer e covid, passando por ecologia, filosofia, neurologia, psicologia, além da informática.

Há até cientistas cognitivos que consideraram que nossos cérebros incorporam algoritmos bayesianos ao perceber, deliberar e tomar decisões. Apaixonados pelo teorema dizem que, se adotarmos o raciocínio bayesiano consciente (mais além do processamento bayesiano inconsciente, que nosso cérebro supostamente emprega), o mundo seria melhor.

Diante disso tudo, vale a pena saber um pouco sobre essa fórmula com que começamos este texto e seu autor.

“Thomas Bayes foi um ministro presbiteriano no século 18”, disse à BBC Bertsch McGrayne, autora do livro A Teoria que Nunca Morreu.

“Ele foi parte de uma geração que não pôde frequentar as universidades de Oxford ou Cambridge, as principais universidades inglesas da época, porque ele não era da Igreja da Inglaterra.”

“Isso foi uma sorte para Bayes, porque ele foi para o norte da Escócia, que era presbiteriana e tinha uma universidade muito melhor em Edimburgo na época. Ali, ele estudou teologia, como seu padre, e matemática, que era seu verdadeiro interesse, e se tornou um matemático aficionado.”

Bayes conseguiu mesclar seus dois interesses, escreveu ao menos um livro sobre matemática e passou grande parte de seu tempo estudando as obras de outros matemáticos e teólogos. E, assim, começou a desenvolver uma ideia.

Como nasceu a ideia

“Foi durante uma grande polêmica religiosa sobre se era possível usar a evidência do mundo natural para demonstrar que Deus existe”, explica McGrayne.

Um dos que participaram no debate foi o filósofo David Hume, que publicou, em 1748, o até hoje influente livro Investigação sobre o Conhecimento Humano, questionando, entre outras coisas, a existência de milagres.

Segundo Hume, a probabilidade de que as pessoas tivessem afirmado incorretamente que haviam visto a ressurreição de Jesus superava em muito a probabilidade de que o fato tivesse ocorrido.

“Um milagre é uma violação das leis da natureza; e, como uma experiência firme e inalterável estabeleceu essas leis, a prova contra um milagre, pela mesma natureza do fato, é tão completa como se pode imaginar que qualquer argumento baseado na experiência o seja”, escreveu o filósofo.

Isso não caiu bem ao reverendo e, querendo demonstrar que Hume estava equivocado, começou a tratar de quantificar a probabilidade de um evento imaginando-se situações como a seguinte:

Imagine que esteja em uma casa e atrás de você esteja uma mesa. Alguém lança uma bola que cai sobre essa mesa. Mas, sem olhar, você não tem como saber exatamente onde.

Então, você pede a essa pessoa que jogue outra bola e lhe diga se ela caiu à direita ou à esquerda da primeira. Se caiu à direita, é mais provável que a primeira tenha sido no lado esquerdo da mesa, pois você supõe que haja mais espaço nesse lado para a segunda bola ter caído.

A cada nova bola que é lançada, você pode atualizar sua conjectura e ir precisando a localização da original. De maneira semelhante, pensou Bayes, os diversos testemunhos da ressurreição de Cristo indicavam que o acontecimento não podia ser descartado da forma com que Hume afirmara.

“Ocorreu a ele um teorema de uma linha realmente simples, que serve para trabalhar com dados incompletos e disse que tudo bem começar com uma ideia pela metade sobre uma situação, contanto que você modifique implacavelmente suas ideias iniciais cada vez que apareça uma nova informação”, assinalou McGrayne. “Ele nos deu um raciocínio matemático para situações altamente incertas.”

A rejeição

Bayes não publicou seu teorema, mas um amigo seu, Richard Price, um matemático aficionado, o desenvolveu e, em 1767, publicou Sobre a Importância do Cristianismo, suas Evidências e as Objeções que lhe Foram Feitas, em que usou as ideias de Bayes para desafiar o argumento de Hume.

“O ponto probabilístico básico” de Price, diz o historiador e estatístico Stephen Stigler em seu artigo O Verdadeiro Título do Ensaio de Bayes, “foi que Hume subestimou o impacto de que havia vários testemunhos independentes de um milagre, e os resultados de Bayes mostraram como a multiplicação de evidências, inclusive as falíveis, poderia fortalecer a grande improbabilidade de um acontecimento e estabelecê-lo como um fato”.

Não foi suficiente para Price provar a existência dos milagres, mas ele deu visibilidade a algo que de outra forma teria ficado oculto entre os papeis de Bayes, que nessa época já havia morrido.

O teorema caiu no esquecimento até que o ilustre matemático francês Pierre Simon Laplace formalizou a visão de Bayes e mostrou claramente como se podia aplicá-la no início do século 19.

A partir de então, entrou e saiu de moda. Foi aplicado em uma ciência atrás da outra apenas para logo ser condenado por ser vago, subjetivo e pouco científico. Converteu-se, então, no pomo da discórdia entre campos rivais de matemáticos antes de desfrutar de um renascimento nos últimos anos.

Por que o teorema voltou?

Lembre-se que o enfoque bayesiano diz que você pode começar com uma estimativa subjetiva de uma probabilidade, qualquer probabilidade, independentemente de haver algum dado.

Qual a probabilidade de que Deus exista? O novo coronavírus sofrerá alguma mutação que inutilize as vacinas? Qual é a possibilidade de uma guerra nuclear antes de 1º de janeiro de 2030?

Tendo começado com aquilo que é pouco mais que uma suposição, usamos a regra de Bayes para revisar nossa opinião à medida que chegam novos dados. John Stuart Mill, o filósofo e economista político britânico do século 19, chamou o teorema de “a ignorância cunhada na ciência”.

Durante muito tempo, o enfoque bayesiano foi tabu nas estatísticas convencionais, mas não morreu. Ao longo das décadas, pessoas inteligentes encontraram maneiras inteligentes de aplicá-lo.

Um caso surpreendente: o teorema de Bayes foi utilizado por Alan Turing enquanto ele trabalhava com sua equipe decifrando o código Enigma usado pelos submarinos alemães, os U-Boot, durante a Segunda Guerra Mundial.

“Nesse momento, os submarinos saíam da França e recebiam ordens por rádio sobre aonde ir e o que fazer, e essas ordens eram em uma linguagem codificada chamada Enigma. E a frota alemã fez esse código tão complicado que ninguém no Reino Unido nem na Alemanha acreditavam que os britânicos pudessem decifrá-lo”, lembra McGrayne.

Turing, porém, estava determinado a fazê-lo, aproveitando tudo que pudesse. “Eles conheciam a organização geral de uma oração em alemão. Perceberam que usavam a palavra ein (1 em alemão) em quase todas as mensagens, assim que houvesse três letras. Essa foi uma pista. Assim continuaram, adicionando mais e mais dados.”

Turing e seus colegas criaram um sistema bayesiano para adivinhar um conjunto de letras em uma mensagem do Enigma, medir sua confiança na validade dessas conjecturas usando métodos bayesianos para avaliar as probabilidades e agregar mais pistas à medida que chegavam. Com o tempo, puderam ler as mensagens.”

Quando os fatos mudam…

Assim, o teorema foi utilizado por muitas outras pessoas. Uma vez que chegaram os computadores, seu uso disparou.

Para dar uma ideia de como ele funciona, responda a esta pergunta: se você obtiver um resultado positivo em um teste de covid-19 que só resulta em falso positivo uma vez em cada 1 mil, qual é a probabilidade de que realmente tenha o coronavírus?

Pensou em 99,9%? Na verdade, a resposta correta é que você não tem informação suficiente para saber. É aí que entra o teorema de Bayes.

A notação matemática do teorema, reproduzida no início desta reportagem, parece complicada. Mas é mais fácil de entendê-la com um exemplo do que decifrando o significado de todos aqueles símbolos.

Imagine que você se submete a um exame para detectar uma possível enfermidade. O exame é incrivelmente preciso: se a pessoa tem a doença, ele dará a resposta correta em 99% dos casos. Se não tiver, também. Mas a enfermidade em questão é muito rara; somente uma pessoa em cada 10 mil sofre dessa doença. Isso é conhecido como sua “probabilidade prévia”: o índice na população.

Agora imagine que façam o exame em 1 milhão de pessoas. Cem pessoas têm a enfermidade, e o teste identifica corretamente 99 delas. Existem 999.900 pessoas sem a doença, e a prova identifica corretamente 989.901 delas.

Isso significa, no entanto, que o exame, apesar de dar a resposta correta em 99% dos casos, informou a 9.999 pessoas que elas têm a doença, quando na realidade elas não têm.

Então, se você obtém um resultado positivo, neste caso, sua probabilidade de ter a enfermidade é de 99 em 10.098, ou seja, pouco menos de 1%. Sem o enfoque bayesiano, o resultado inicial assustaria muitas pessoas e as levaria a procedimentos médicos intrusivos e potencialmente perigosos devido a um diagnóstico equivocado.

Sem se conhecer a probabilidade prévia, não se sabe quão provável um resultado é falso ou verdadeiro.

Esse não é um problema hipotético. Na medicina, por exemplo, uma revisão de casos realizada em 2016 identificou que 60% das mulheres que haviam feito mamografias anualmente durante dez anos tiveram ao menos um resultado falso positivo.

Nos tribunais de justiça, uma falha conhecida como a “falácia do fiscal”, que pode condenar inocentes, também depende do teorema. E essa é somente a ponta do iceberg. Pesquisadores utilizam a estatística bayesiana para lidar com problemas de incrível complexidade.

O raciocínio bayesiano, combinado com a potência computacional avançada, revolucionou a busca de planetas que orbitam estrelas distantes. As estatísticas bayesianas contribuíram para reduzir a idade do Universo, que no final da década de 1990 era calculado como tendo entre 8 bilhões e 15 bilhões de anos. Agora foi concluído com certa confiança que ele tem 13,8 bilhões de anos.

“Hoje em dia, ele é utilizado na genética, para detectar diferenças sutis no DNA e nas proteínas, assim como para proteger a vida silvestre, fazer estudos cerebrais, traduzir idiomas estrangeiros…”, enumera a autora de A Teoria que Nunca Morreu. “Ele foi embutido na informática, no aprendizado automático, na inteligência artificial.”

“Pode ser que não seja exatamente como o fez Bayes, mas ele foi modernizado e é incrivelmente útil, está em toda parte”, afirmou McGrayne na entrevista com a BBC. Ela concluiu com uma citação já atribuída aos economistas John Maynard Keynes e Paul Samuelson, assim como ao premiê britânico Winston Churchill e outros, para resumir a essência do teorema de Bayes: “Quando os fatos mudam, eu mudo de opinião. Você faz o quê?”

BY ALEXSANDER QUEIROZ SILVA
Fonte: BBC Brasil