Anthropic ha lanzado un peculiar experimento que está captando la atención de la comunidad tecnológica y los amantes de los videojuegos: su último modelo de inteligencia artificial, Claude 3.7 Sonnet, está jugando Pokémon Red en directo a través de Twitch, aunque con una lentitud que está poniendo a prueba la paciencia de los espectadores.
El nuevo experimento de Anthropic
La transmisión "Claude Plays Pokémon" comenzó el martes por la tarde, mostrando cómo la IA intenta navegar por el clásico juego de Nintendo. A diferencia de un jugador humano, Claude analiza meticulosamente cada movimiento, mostrando su "proceso de pensamiento" en la parte izquierda de la pantalla mientras ejecuta las acciones en el juego a la derecha.
El experimento no es solo por diversión. Como informa TechCrunch, Pokémon ha resultado ser una herramienta útil para evaluar las capacidades de razonamiento del nuevo modelo Claude 3.7 Sonnet, especialmente en la resolución de puzles y toma de decisiones.
Desafíos y logros de Claude
Hasta ahora, la IA ha demostrado avances significativos respecto a su predecesor. Mientras que la versión anterior, Claude 3.5 Sonnet, ni siquiera podía salir de la casa inicial en Pueblo Paleta, el nuevo modelo ha conseguido obtener tres medallas de gimnasio.
Sin embargo, el camino no ha estado exento de obstáculos. En un momento memorable de la transmisión, Claude se encontró paralizado ante una pared de roca, intentando atravesarla repetidamente sin éxito. Como comentó irónicamente un espectador en el chat: "¿Quién ganaría, una IA con miles de horas de programación o una simple pared de roca?"
De Twitch Plays Pokémon a Claude Plays Pokémon
Este experimento evoca recuerdos del histórico "Twitch Plays Pokémon", un fenómeno viral que hace más de una década permitió a millones de usuarios jugar simultáneamente Pokémon Red a través del chat de Twitch. La diferencia fundamental es que ahora los espectadores son observadores pasivos del proceso de la IA.
El experimento ha inspirado a otros investigadores en el campo. Por ejemplo, el ingeniero de software Peter Whidden desarrolló un algoritmo de aprendizaje por refuerzo que necesitó más de 50.000 horas de juego para dominar Pokémon Red, aunque curiosamente, su IA tenía la peculiar tendencia de quedarse admirando los escenarios pixelados en lugar de avanzar en la historia.
Más allá del juego
La transmisión de Claude jugando Pokémon representa un interesante punto de inflexión en la evolución de las experiencias en línea. Mientras que Twitch Plays Pokémon fue un ejercicio de colaboración masiva que unió a la comunidad, este nuevo experimento refleja una tendencia hacia experiencias más individualizadas mediadas por la tecnología.
Con más de mil espectadores siguiendo constantemente la transmisión, las reacciones varían entre la frustración por la lentitud del progreso y la fascinación por observar el proceso de "pensamiento" de la IA. La transmisión muestra tanto las capacidades como las limitaciones actuales de la inteligencia artificial, ofreciendo una ventana única a cómo estos sistemas procesan y resuelven problemas.
El experimento de Anthropic se une a una creciente tendencia de usar videojuegos para probar y mostrar las capacidades de la IA, desde Street Fighter hasta Pictionary, aunque más por entretenimiento que por utilidad práctica. Sin embargo, la forma en que Claude aborda los desafíos de Pokémon Red proporciona información valiosa sobre el funcionamiento de los sistemas de IA actuales y sus capacidades de razonamiento.