La inteligencia artificial de Google ha alcanzado un nuevo hito en el mundo de los videojuegos. Gemini 2.5 Pro, el modelo de IA más avanzado de la compañía, ha logrado completar el clásico juego Pokémon Blue, un título lanzado originalmente hace 29 años para Game Boy.
Un logro celebrado por Google
El CEO de Google, Sundar Pichai, anunció con entusiasmo en X (anteriormente Twitter): «¡Qué final! ¡Gemini 2.5 Pro acaba de completar Pokémon Blue!». La noticia marca un avance significativo en la capacidad de los sistemas de inteligencia artificial para interactuar con entornos de juego complejos que requieren toma de decisiones estratégicas y comprensión del contexto.
Sin embargo, hay un detalle importante: el experimento no fue creado directamente por Google. El streaming «Gemini Plays Pokemon» que mostró esta hazaña fue desarrollado por Joel Z, quien se describe a sí mismo como «un ingeniero de software de 30 años sin afiliación con Google», según informa TechCrunch.
Apoyo oficial de Google al experimento
A pesar de no ser una iniciativa oficial, varios ejecutivos de Google han respaldado públicamente el proyecto. Logan Kilpatrick, líder de producto para Google AI Studio, publicó el mes pasado que Gemini estaba «haciendo grandes progresos para completar Pokémon» y que había «conseguido su quinta medalla (el siguiente mejor modelo solo tiene 3 hasta ahora, aunque con un arnés de agente diferente)».
El propio Pichai respondió a este mensaje bromeando: «Estamos trabajando en API, ¡Inteligencia Pokémon Artificial! :)». Estas interacciones muestran el interés de la compañía en destacar las capacidades de su modelo Gemini en comparación con sus competidores.
Una competencia no oficial entre modelos de IA
El interés por ver a las IAs jugar a Pokémon no es nuevo. En febrero, Anthropic destacó los progresos que su modelo Claude estaba haciendo en «Pokémon Red», escribiendo que el «pensamiento extendido y entrenamiento de agente» de Claude le proporciona «un impulso importante» en tareas «más inesperadas», como jugar a un juego clásico.
Pokémon Red y Blue son versiones diferentes del mismo título para Game Boy lanzado en 1996 y vinculado a la longeva franquicia Pokémon. Existe incluso un canal de Twitch llamado «Claude Plays Pokemon» que Joel Z mencionó como inspiración para su experimento.
A pesar del progreso, Claude parece no haber completado «Pokémon Red» todavía. ¿Significa esto que Gemini es objetivamente mejor en el juego? En su página de Twitch, Joel Z advierte: «Por favor, no consideren esto como una referencia para medir qué tan bien puede un modelo de lenguaje jugar Pokémon. No se pueden hacer comparaciones directas: Gemini y Claude tienen diferentes herramientas y reciben información diferente».
¿Cómo logra una IA jugar a Pokémon?
Para entender mejor este logro, es importante explicar cómo funcionan estos sistemas. Tanto Gemini como Claude necesitan ayuda para jugar, y aquí es donde entran los llamados «arneses de agente» (agent harnesses).
Estos arneses proporcionan a los modelos capturas de pantalla del juego con información adicional superpuesta, permiten que el modelo decida cómo responder (lo que puede implicar llamar a agentes especializados), y luego presionan el botón que corresponde a la instrucción de la IA.
Las intervenciones humanas detrás del éxito
Joel Z reconoció que hubo otras «intervenciones de desarrollo» para ayudar a Gemini a completar el juego, pero insistió en que no se trata de hacer trampas.
«Mis intervenciones mejoran las capacidades generales de toma de decisiones y razonamiento de Gemini», explica en su canal. «No doy pistas específicas: no hay guías paso a paso ni instrucciones directas para desafíos particulares como Mt. Moon. Lo único que se acerca es hacerle saber a Gemini que necesita hablar con un Rocket Grunt dos veces para obtener la Lift Key, que era un error que luego se corrigió en Pokémon Yellow».
Además, Joel Z aclaró que «Gemini Plays Pokémon sigue desarrollándose activamente, y el framework continúa evolucionando».
Significado y contexto del logro
Este hito representa un paso interesante en el desarrollo de la inteligencia artificial aplicada a entornos interactivos complejos. Completar Pokémon Blue requiere comprender reglas, desarrollar estrategias a largo plazo, gestionar recursos y tomar decisiones basadas en el contexto del juego.
Los videojuegos clásicos se están convirtiendo en un campo de pruebas popular para los sistemas de IA, ya que ofrecen entornos controlados pero complejos donde se pueden evaluar diferentes capacidades de razonamiento y toma de decisiones.
Sin embargo, como señalan tanto Joel Z como los expertos, estos experimentos no deben interpretarse como comparaciones directas entre diferentes modelos de IA. Cada sistema utiliza herramientas específicas y recibe información de formas distintas, lo que hace difícil establecer comparaciones justas.
Lo que sí queda claro es que Google está interesado en mostrar las capacidades de Gemini en diversos escenarios, mientras continúa la competencia con otros modelos de IA como Claude de Anthropic en un mercado cada vez más competitivo.
El desarrollo de estas capacidades va más allá del simple entretenimiento o la novedad de ver a una IA jugar a un videojuego. Las habilidades de planificación, razonamiento y adaptación que se demuestran en estos experimentos podrían aplicarse a problemas más complejos y de mayor impacto en el futuro.