Gran avance de Google DeepMind hacia una inteligencia artificial general

Nuevo hito logrado por DeepMind en el camino hacia una inteligencia artificial general. En esta ocasión han logrado entrenar una red neuronal capaz de vencer a los mejores jugadores humanos en un juego de compleja estrategia y de información imperfecta: StarCraft 2.

Y que nadie se engañe porque estemos hablando de un "juego": el hecho de que una red neuronal haya sido capaz de idear (literalmente) en tiempo real estrategias en un juego donde existen miles de billones de variantes, y donde además no se sabe qué es lo que el contrincante está planeando contra ti (sus unidades están ocultas gran parte del tiempo), ni se conocen todos los detalles del terreno de juego (donde hay recursos y donde no), indican que la red neuronal de Google DeepMind sencillamente tiene una gran "intuición", grandes dotes "imaginativas", y una capacidad "cognitiva" estratégica que sencillamente es (casi) indistinguible de la humana (sería totalmente indistinguible si no fuera porque, paradójicamente, juega "humanamente" mejor que cualquier humano).

Esta red neuronal es capaz literalmente de generalizar en situaciones donde hay información imperfecta, incompleta (con "ruido"), y tareas complejas y complicadas que hacer; donde hay que prever qué piensa hacer el enemigo, imaginar la mejor forma de jugar midiendo las consecuencias al medio-largo plazo de las acciones actuales, y todo en igualdad de condiciones que el jugador humano. Esto significa que la red neuronal tiene acceso a la misma información visual que el contrincante, y de hecho, está capada para que no pueda realizar más "clicks" (acciones por segundo) de lo que humanamente a nosotros nos permiten nuestros dedos y nuestra mente...y aún así ha logrado vencer a los mejores jugadores del mundo en el 100% de las ocasiones en dos torneos realizados.

Y es importante enfatizar que este hito supone algo mucho mayor que lo que supuso AlphaZero (donde esta red neuronal derrotaba sin fuerza bruta y usando una "intuición" casi humana a los mejores humanos en juegos de información perfecta: Go, ajedrez, etc.), ahora se trata de que hemos logrado "imitar" habilidades humanas que van mucho más allá de esta limitada "intuición" de AlphaZero: ahora se ha logrado generalizar no sólo situaciones donde basta algo de "intuición", sino situaciones donde es necesario "imaginar" qué está pensando hacer el oponente (teoría de la mente), "idear" estrategias complejas a medio-largo plazo, "entender y comprender" cómo manejar planos imprecisos e incompletos y cómo ordenar el uso de cientos de unidades distintas ("piezas") de manera cooperativa para lograr llevar a cabo esas metas previamente "planeadas", lo cual indica que también se ha logrado simular algo así como "memoria" a corto y largo plazo.

Pero lo más importante es que el modo en que se ha logrado entrenar esta complejísima red neuronal es aplicable a una enorme variedad de otras situaciones (que van más allá de los juegos de ordenador); algo que sin embargo no ocurría con AlphaZero debido a que sólo aplicaba a situaciones de información perfecta (las cuales son raras en el mundo real) y que no requería actuar en tiempo real. Con AlphaStar, sin embargo, DeepMind está en posesión de un "ente cognitivo" que puede hacer frente a situaciones muy similares a las de nuestro día a día, y posiblemente pasará a ser conocido históricamente como el verdadero primer paso logrado hacia la deseada inteligencia artificial general (la cual visto lo visto probablemente llegará en dos o tres décadas lo más tardar).

Referencia principal del artículo: deepmind.com/blog/alphastar-mastering-real-time-strategy-game-starcraf