Ajedrez, inteligencia artificial y aprendizaje

diciembre 18, 2017

Anatoly Karpov y una lección sobre cómo aprendemos

La velocidad con que las máquinas «aprenden» a jugar al ajedrez hace pensar sobreel ritmo en el que la inteligencia artificial puede desarrollarse e influir en la economía.

Por Sebastián Campanario.

A mediados de 2010, Anatoly Karpov, ex campeón mundial de ajedrez, visitó Buenos Aires invitado por la Fundación Najdorf. Además de su fama como gran maestro, Karpov es economista -tiene un doctorado por la Universidad de Moscú- y encabeza un exitoso grupo inversor, con foco en el sector hotelero de Europa del Este. En su viaje a la Argentina participó en distintas exhibiciones y brindó una entrevista, en la que se le preguntó quién consideraba que había sido el mejor jugador de la historia. Puntualmente, si se juntaban en un torneo todos los ex campeones mundiales (él, Garry Kasparov, Bobby Fischer, Raúl Capablanca, etcétera), cada uno en su mejor momento o pico de juego, quién ganaría.

Karpov meditó la respuesta por un momento, como si estuviera pensando una jugada. Es una persona modesta, de un perfil mucho más bajo que su rival histórico, Kasparov, con quien durante años protagonizó lo que Harvard Business Review calificó como «la rivalidad más enconada de la historia de los deportes en el siglo XX». Su primera respuesta fue que el Fischer de 1972 -cuando derrotó en el match del siglo al ruso Boris Spassky, en Islandia- probablemente haya sido el ajedrecista que más lejos estuvo del pelotón que lo seguía. «Ganó algunos de los matchs clasificatorios por 6-0, aplastando a sus rivales -me dijo en una entrevista-. En términos estadísticos fue un outlier total, una proeza equivalente a ganar un torneo de grand slam sin ceder un solo game«.

Pero luego precisó su respuesta: el vencedor sería sin duda el último campeón (el indio Viswanathan Anand al momento de la charla, el noruego Magnus Carlsen hoy). «En ajedrez hay aprendizaje, y muchas aperturas que se jugaban hace algunas décadas fueron descartadas porque se les encontraron puntos débiles. Así que hay una ventaja grande para el último campeón», explicó.

La respuesta de Karpov resuena a partir de un nuevo hito de la inteligencia artificial logrado en forma reciente. El programa Alpha Zero logró aplastar a otro software fuerte en un match a cien partidas sin perder ninguna. Pero lo revolucionario no fue el resultado, sino cómo se logró: Alpha Zero no necesitó aprender de millones de partidas anteriores, sino que simplemente se le enseñaron las reglas y en 24 horas se convirtió en el jugador más potente del planeta. Las décadas que a los humanos nos llevaron desechar aperturas se transformaron en horas en al caso del algoritmo: en las primeras dos horas, el programa parecía entusiasta probando la apertura francesa, pero luego la descartó. Su enamoramiento de la Caro-Kahn duró mucho menos.

«Lo interesante aquí es que no se necesitó big data para superar la performancehumana: sólo las reglas y tiempo para aprender (un día)», dice a LA NACION Marcelo Rinesi, experto en ciencia de datos e investigador del Instituto Baikal. «La observación inevitable, creo, es que la experiencia y el conocimiento acumulados por la especie humana son realmente pocos: no sabíamos nada de ajedrez, y seguramente no sabemos nada de matemáticas, programación, medicina, diseño industrial ni arquitectura», agrega.

Tres años atrás, la empresa DeepMind, que pertenece a Google, se puso como objetivo desarrollar un algoritmo que pudiera competir contra los mejores jugadores de Go del mundo, un juego tremendamente complejo, con trillones de jugadas probables, que no puede abordarse con la «fuerza bruta» computacional como la que IBM usó con Deep Blue 20 años atrás para derrotar a Kasparov. En marzo de 2016, cuando el programa Alpha Go se enfrentó a Lee Sedol, el mejor jugador del mundo, las apuestas estaban diez a uno a favor del humano. El resultado fue un 4-1 para el algoritmo. El programa aprendía, a velocidad supersónica, de millones de partidas previas, y un año después derrotó con un inapelable 3-0 al chino Ke Jie, un joven prodigio cuyo talento en Go es comparable al de Carlsen en ajedrez.

El salto cuántico se produjo luego, cuando la firma logró una versión más potente sin necesidad de acudir a partidas previas y pudo, en muy pocas semanas, traducir esa expertise del Go al ajedrez. Demis Hassabis, el fundador de DeepMind, fue a los 13 años un genio del juego ciencia, segundo a nivel mundial en esa categoría detrás de la húngara Judit Polgar.

Para Axel Rivas, experto en educación y profesor de la Udesa, la experiencia de Alpha Zero implica una lección relevante para la forma en que adquirimos conocimientos en el siglo XXI: «Tenemos que ser capaces de enseñar una serie de reglas y métodos fundamentales a nuestros alumnos. Pero también tenemos que enseñarles a cuestionar esos principios y reconstruirlos de maneras alternativas. Durante siglos enseñamos reglas (quizá como las primeras máquinas fueron programadas paso a paso), pero para enseñar metacognición tenemos que enseñar a vulnerarlas, o al menos a intentarlo«.

Según Rinesi, este tipo de eventos dan la pauta de que «se acelerarán los tiempos de avances esperados para biología, medicina e ingeniería. La única diferencia entre una partida de ajedrez y diseñar un nuevo dispositivo es que las reglas son más imperfectas y la partida, más complicada, pero ambas cuestiones implican sólo el desafío de acumular datos para refinar modelos y aumentar la escala de procesamiento».

En el último mes aparecieron varios estudios que buscan mapear los últimos avances de la inteligencia artificial y buscan responder la pregunta de cuán rápido, y en qué intensidad, esta tecnología exponencial transformará la economía. Uno de estos trabajos es un «AI Index» del MIT. Según un artículo de Steve Lohr en The New York Times, todos estos trabajos coinciden en que la inteligencia artificial en su estado actual sirve para menos cosas de las que creemos, pero que avanzará más rápido de lo que estimamos y tendrá un impacto mucho mayor que el que se pronostica.

La historia de Alpha Zero no está exenta de críticas. La semana pasada, José Camacho Collado, matemático, investigador en IA y gran maestro de ajedrez, publicó un análisis en Medium donde señaló una decena de razones para tomar con cautela el logro de DeepMind, entre ellas que sólo se publicaron algunas partidas y que no se eligió como contrincante la versión de software más poderosa.

La respuesta de Karpov, con la humildad de no mencionarse a sí mismo como probable ganador del hipotético torneo con los mejores del mundo, viene con una reivindicación: la forma de juego de Alpha Zero, resaltó Albert Silver, el sitio de ajedrez Chess News, es mucho más «humana»: su dinámica se basa en «filtrar» los caminos que parecen más promisorios y enfocar la profundidad y esfuerzo de análisis por ahí, como hacen los jugadores de carne y hueso.

Al contrario de los programas anteriores, mucho más agresivos, que van «a todo o nada», Alpha Zero no escapa de posiciones cerradas, en las cuales se trata de sacar una mínima ventaja y luego exprimirla con paciencia al máximo, ahogando al contrincante en forma lenta. Esta estrategia de boa constrictor fue refinada en su momento por el ex campeón Tigran Petrosian y llevada a su máximo nivel de brillantez por el propio Karpov. Por eso, destacó el artículo de Chess News, si Alpha Zero tuviera que emparentar su juego con alguno de los humanos conocidos, sería sin duda con el de Anatoly Karpov.

Fuente: La Nación, 15/12/17.

Vincúlese a nuestras Redes Sociales:

Google+ LinkedIn YouTube Facebook Twitter

Participe gratuitamente en nuestro seminario online de Finanzas Personales

Archivo bajo Artículos · Dejar un comentario

Richard Thaler, la economía del comportamiento y el Nobel de Economía

octubre 15, 2017

Nobel 2017: aire renovado para la «Palermo» de la economía

Richard Thaler, galardonado por la Academia Sueca, le hizo ganar protagonismo a la economía del comportamiento; esa rama de estudios, en la que interviene la psicología, es aspiracional.

Por Sebastián Campanario.

¿Cuál es la mejor manera de medir qué tan cool y sólida a nivel académico es una persona? Una posibilidad es el «número de Erdos-Bacon», que mide cuál es el grado de separación de cualquier mortal con el prolífico matemático húngaro Paul Erdos (a cuántos papers de distancia se encuentra uno cuando se van relacionando coautores) y del también muy prolífico actor Kevin Bacon. Richard Thaler, el flamante premio Nobel de Economía, tiene un bajísimo número de Erdos-Bacon: la suma da 5. Escribió un paper con Peter Waker (que tiene un Erdos 2) y actuó en The Big Short con Ryan Gosling, que compartió cartel en otra película con el protagonista de Footloose.

Esta buena combinación de solidez teórica e histrionismo y dotes de divulgación no es trivial en el aporte de Thaler a la discusión económica por el que fue reconocido días atrás por la Academia Sueca. Fundada por los psicólogos israelíes Daniel Kahneman y Amos Tversky a mediados de los 70, la economía del comportamiento -la rama que toma enseñanzas de la psicología- permaneció casi una década y media en lugares muy marginales de la academia, casi como una excentricidad. Colin Camerer, uno de los teóricos más respetados en esta disciplina, que combina en sus trabajos sesgos cognitivos con teoría de los juegos, solía decir que en los 80, cuando salían a navegar los asistentes a un seminario de economía comportamental, si se hundía el bote desaparecía el campo emergente por completo.

Thaler y sus colaboradores en la Universidad de Chicago fueron los encargados de hacer el upgrade que llevó a la economía del comportamiento a ponerse de moda y vivir, en la última década, un boom sin precedentes, con centros de estudio, best sellers, journals propios, miles de tesis de posgrado y espacio creciente en la agenda de los gobiernos.

Richard Thaler Nobel de Economía 2017.
.

La «chispa» que encendió Thaler se activó en 1987, cuando empezó a publicar una muy popular columna, «Anomalies», en el prestigioso Journal of Economics Perspectives. «La columna de anomalías fue muy importante para poner sobre la mesa problemas de la teoría de decisión usual y la variedad de patrones de conducta observables que están ahí para ser sistematizados», explica a LA NACION Daniel Heymann, profesor de la UBA y uno de los primeros en traer a la Argentina, a sus clases, las ideas de Thaler para discutir con sus alumnos, entre ellos Eduardo Levy Yeyati, Javier Finkman o Walter Sosa Escudero. «Los sesgos de cuentas mentales, statu quo y aversión a las pérdidas son ideas elegantes y relevantes, que su trabajo ayudó a incorporar al debate», completa Heymann.

La economía del comportamiento comenzó una etapa de crecimiento empinado, a tal punto que la consultora de tendencias tecnológicas Gartner, que elabora anualmente su Hype Cycle (curva de exageración de distintas tecnologías, modas y tendencias) la puso años atrás en su zona de «sobrecalentamiento», ya cerca de que explote la burbuja.

En 2002, el Nobel a Kahneman y Tversky hizo que la rama subiera un escalón importante. Y los reproches por los mercados imperfectos que arreciaron con la crisis subprime de 2007 y 2008 trajeron más agua para el molino conductual. De hecho, la película The Big Short trata sobre esta cuestión, y allí se lo ve a Thaler junto a la estrella pop Selena Gómez explicando la «falacia de la mano caliente»: la ilusión por la cual creemos que la distribución de probabilidades de un evento nuevo está relacionado con los anteriores (se piensa que un basquetbolista que viene encestando tiene más chances de volver a hacerlo), cuando no es así.

¿Qué tienen en común Palermo, la inteligencia artificial y la economía del comportamiento?

Que todos son etiquetas aspiracionales que hacen que se coloquen bajo su paraguas superficies fronterizas, para tratar de captar su «efecto halo». Si fuera por las inmobiliarias, Palermo tendría la superficie del imperio mongol de Gengis Kahn; cualquier programa de software hoy se hace llamar inteligencia artificial para atraer inversores y atención mediática. Lo mismo ocurre con la economía del comportamiento: estudios de psicología experimental (sin nada de economía), de neuroeconomía, de economía de la felicidad o de cualquier tópico «raro» (penales de futbol, etcétera) son etiquetados erróneamente bajo este rótulo de moda.

El propio Kahneman alertó el año pasado sobre los riesgos reputacionales de esta burbuja. Las promesas desmedidas suelen derivar en fracasos más sonoros, y esto fue lo que sucedió para la economista Allison Schrager, quien en un informe para la OCDE informó sobre un estado más bien decepcionante de las políticas públicas basadas en aportes de la economía del comportamiento. Las más de 30 oficinas que existen en el mundo con esta tarea (behavioral units) no vienen mostrando resultados agregados importantes, según Schrager, para quien «la mayor parte de las acciones relevadas tienen que ver con obligar a empresas y a organismos a dar más información y a ser más trasparentes, y no está claro que ésos sean aportes de la economía conductual o simplemente el sentido común de que estas comunicaciones deberían ser más honestas».

El contraargumento es que tal vez sea demasiado pronto para exigir resultados robustos, y que de todas formas se trata de políticas en general muy baratas de implementar, por lo que vale la pena seguir intentando.

En este panorama algo amesetado, el Nobel a Thaler fue un espaldarazo para que la rama fundada en los 70 siga evolucionando o tal vez logre reinventarse. Thaler es un académico muy querido entre sus colegas, afable y amigo de las discusiones abiertas: solía jugar el tenis en Chicago con Eugene Fama, uno de sus enemigos más acérrimos, defensor de la hipótesis de los mercados racionales y ganador del Nobel en 2013.

Su último libro, Misbehaving, fue reseñado meses atrás en este espacio por Javier Finkman, bajo el título de Vamos a portarnos mal. En otra reseña más larga, que se puede leer en la página de la Facultad de Ciencias Económicas de la UBA, Pablo Mira, autor de Economía al diván, recuerda el genial y muy divertido relato que hizo Thaler de una mudanza de oficinas del Departamento de Economía de la Universidad de Chicago, donde el esquema diseñado para repartir los nuevos espacios contradecía todas las teorías que se propagan desde el faro ideológico neoclásico: el sistema era poco trasparente (insuficiente información), repleto de arbitrariedades (intervencionista) y dejó como saldo peleas interminables entre profesores (ineficiencia paretiana).

En The Undoing Project, el último libro de Michael Lewis, que cuenta la historia de la colaboración entre Kahneman y Tversky, hay un primer capítulo que narra cómo en la década pasada la NBA cambió por completo su forma de juego, gracias a una combinación de insights de las ciencias cognitivas y análisis de big data. El juego se volvió mucho más cooperativo, menos especulativo, subió la visibilidad de las ventajas del trabajo en equipo y del sacrificio en defensa. El resultado: una liga en la que todos ganaron, los espectadores, los clubes y los jugadores. ¿Podrá la economía del comportamiento, con el motor del big data, lograr una reinvención similar, con tanta eficiencia paretiana como el basquet?

Fuente: La Nación, 15/10/17.

Vincúlese a nuestras Redes Sociales:

Google+LinkedIn YouTube Facebook Twitter