Más sobre el Teorema de Bayes

julio 29, 2020 · Imprimir este artículo

Un teorema para el Siglo XXI

Por Anabel Forte Deltell.

Estimado señor, 

Le adjunto un escrito hallado entre los papeles de nuestro fallecido amigo Mr Bayes que, en mi opinión, tiene gran mérito y debería ser preservado:

EL TEOREMA DE BAYES

hilo en twitter por @AnaBayes y @Juliomulero para el concurso #ENEMDivulga de @ENEM_mat

Así empezaba la carta que Richard Price envió a John Cantón el 23 de diciembre de 1673 y a la que acompañaba el documento que dio origen al conocido como Teorema de Bayes, un teorema que está llamado a ser clave, por ejemplo, en las resoluciones judiciales y que da lugar a la visión Bayesiana de la estadística. 

Foto extraída de : https://www.manhattanrarebooks.com/

Thomas Bayes, era un reverendo presbiteriano cuyo teorema simboliza la formalización matemática del aprendizaje humano. En el fondo, el Teorema de Bayes explica cómo actualizamos nuestra visión de un proceso a medida que conocemos nueva información. 

Tenemos dos cajas de tornillos: la caja A (los culpables) contiene 40 tornillos de los cuales un 30% son defectuosos y la caja B (los inocentes) contiene 60 de los cuales 10% son defectuosos.

De pronto… ¡mala suerte! Se nos caen al suelo las dos cajas y se mezclan todos los tornillos. La catástrofe es que ya no sabemos cuáles son de cada caja.  Cogemos uno del suelo al azar y estamos interesados en conocer qué probabilidad hay de que sea culpable o inocente. 

Antes incluso de mirarlo pensamos: ¡ajá! Como 40 de los 100 tornillos eran de la caja A, la probabilidad de que nuestro tornillo sea “culpable” es 0.4 mientras que, la de que sea inocente (de la caja B) es 0.6. 

El tornillo tiene, por tanto, una mayor probabilidad de ser inocente:

Ahora bien, lo observamos con cuidado y vemos que es defectuoso.

¡Bravo! ¡Tenemos una pista! Como en un juicio, pero ¿cómo la usamos? ¿Cambia esto el estado de las cosas?

Tenemos que pensar que ahora nuestro “universo” se ha reducido a los tornillos defectuosos. ¿Y esos cuántos son?

En la caja A había un 30% (12) de tornillos defectuosos. En la caja B, un 10% (6). Por tanto, el tornillo que “hemos rescatado” sólo puede ser uno de los 18 tornillos defectuosos.

Entonces, si tenemos en cuenta que el tornillo es defectuoso (la pista), ahora la probabilidad de que el tornillo pertenezca a la caja A (sea culpable) ha pasado a ser 12/18=0.66 

Siguiendo el mismo razonamiento, la probabilidad de que sea inocente es  6/18=0.33.

Lectura recomendada:  MatBaires! El Festival de Matemáticas

Antes, la probabilidad de ser de la caja A era 0.4 y la de ser de la caja B, 0.6.

Ahora, con una mayor información, la probabilidad de ser de la caja A es 0.66 y la de pertenecer a la caja B, 0.33. 

¿Cómo cambia la perspectiva, no crees?

El Teorema de Bayes formaliza esta idea para que la podamos aplicar a cualquier situación en la que nuestra información se actualiza gracias a nueva información. 

En concreto, si llamamos D a la pista o información nueva y A al hecho de ser culpable: 

Imagina ahora que te llaman a un juicio de verdad, uno sin tornillos. 

En principio no tienes ningún prejuicio y piensas que es muy poco probable que una persona haya cometido un crimen así que asignas una probabilidad inicial de 0.01 a que la persona acusada sea culpable, esto es P(A).

Durante el juicio nos muestran una colilla encontrada en la escena del crimen. 

Se trata de una marca de tabaco muy rara y sabemos que la probabilidad de haber encontrado esa colilla en la escena del crimen es de 0.015, esto es P(D) 

Sabemos, además, que la persona acusada fuma ese tabaco y, por tanto, si esa persona fuese culpable la probabilidad de que hubiésemos hallado la colilla es muy alta, digamos P(D|A)= 0.9 (porque habrá ratos que no fume, vaya).

Aplicando la fórmula de Bayes, se obtiene que 0.9*0.01/0.015= 0.6

¡¡¡La probabilidad de que sea culpable ha pasado de 0.01 a 0.6 tras observar la pista!!!! 

Uno de los juicios en los que esta aplicación del Teorema de Bayes tuvo un gran impacto fue el de Diana Quer https://www.elprogreso.es/articulo/galicia/teorema-nunca-utilizado-espana-trata-probar-diana-fue-violada/201911211650041408557.html

A grandes rasgos, en el juicio se partía de una probabilidad muy baja de que el móvil del crimen fuese la violación, pero, a la vista de las pistas, la probabilidad habría aumentado a un 0.99. 

OJO: La probabilidad de ser culpable tras obtener la pista P(A|D) no es la misma que la de obtener la pista sabiendo que esa persona es culpable P(D|A) y es posible que conozcamos la segunda, pero no la primera que es la que buscamos.  

En definitiva, el Teorema de Bayes se convierte en una herramienta determinante en control de calidad o en justicia, pero también en diagnóstico clínico incluso en la detección del Spam en nuestros correos electrónicos y conforma la base de la Estadística Bayesiana 

Gracias por leer hasta aquí!

Fuente: http://anabelforte.com/2020/07/23/un-teorema-para-el-siglo-xxi/

Bayes

Más información:

El Teorema de Bayes en el Análisis de Inteligencia

.

.

Comentarios

Algo para decir?

Usted debe estar logueado para escribir un comentario.