Claude 3.7 jugando Pokémon Red en Twitch: Un Experimento de IA y Nostalgia

Una IA jugando Pokémon en vivo
En febrero de 2025, la inteligencia artificial Claude 3.7 jugando Pokémon Red, desarrollada por Anthropic, protagonizó un evento inesperado: jugar Pokémon Red en Twitch. La transmisión, organizada en el canal ClaudePlaysPokemon, atrajo a miles de espectadores curiosos que querían ver si una IA podía convertirse en Maestro Pokémon.
Aunque se presentó como un «proyecto de pasión de un fan de Claude y Pokémon», el evento fue en realidad una iniciativa oficial de Anthropic. Su objetivo era probar el «pensamiento extendido» del modelo, permitiendo que razonara cada acción antes de ejecutarla. La transmisión sigue disponible en Twitch para quienes deseen revivir la experiencia.
¿Cómo lograron que la IA jugara?
Para que Claude 3.7 jugando Pokémon Red pudiera interactuar con el juego, los desarrolladores diseñaron una interfaz especial que le proporcionaba:
- Entrada visual del juego, mediante capturas de pantalla periódicas de la Game Boy.
- Acceso a datos clave de la memoria del juego, como coordenadas del jugador.
- Simulación de pulsaciones en los botones del control.
- Pathfinding para ayudarle a navegar el mapa.
- Base de conocimientos para recordar ubicaciones y estrategias.
A pesar de estos avances, no fue un juego completamente autónomo. En algunos momentos, otro modelo de IA actuaba como «consejero» cuando Claude se quedaba atascado. Esto generó críticas de la comunidad, que señalaron que la partida estaba «trucada» con ayudas estratégicas.
Desempeño y progreso en el juego
El progreso de Claude 3.7 jugando Pokémon Red superó ampliamente a sus predecesores. Mientras que Claude 3.5 no logró salir del pueblo inicial, la versión 3.7 alcanzó hitos importantes:
- Tres medallas de gimnasio (Brock, Misty y Lt. Surge).
- Superó 11 niveles del juego.
- Ejecutó más de 35,000 comandos de botón para avanzar.
La IA mostró patrones de juego peculiares: interactuaba con todos los NPCs, leía cada cartel con curiosidad y ponía apodos a sus Pokémon, como «Shell» para su Squirtle. Sin embargo, su estilo era extremadamente lento y torpe en comparación con un humano. Por ejemplo, tardó 18 horas en vencer al primer entrenador del Gimnasio de Brock.
Claude también enfrentó dificultades en la navegación. Se reportó que quedó «desconcertado» ante una pared de roca, intentando atravesarla en lugar de rodearla. No obstante, demostró capacidad de aprendizaje: cuando quedó atrapado en un bucle, usó una Cuerda Huida para salir de una cueva, una decisión sorprendentemente inteligente.
Reacciones de la comunidad
El evento atrajo una audiencia considerable, con picos de 1,500 espectadores simultáneos. El chat en vivo estallaba en ánimo cada vez que la IA lograba un avance significativo. En redes sociales, la reacción fue mixta:
- Fascinación por ver a una IA intentando jugar como un humano.
- Frustración por la lentitud y torpeza del modelo.
- Debate técnico sobre la validez del experimento y sus implicaciones para la IA general.
Algunos lo compararon con Twitch Plays Pokémon, mientras que otros argumentaban que Claude tuvo ventajas injustas. A pesar de las críticas, la mayoría coincidió en que fue un experimento entretenido y revelador.
Un experimento peculiar y significativo
Claude 3.7 jugando Pokémon Red no fue solo un evento curioso; también sirvió como una ventana al estado actual de la IA. Anthropic destacó que usar videojuegos para evaluar modelos es una métrica intuitiva y ética, permitiendo que la IA «aprenda» sin depender de datos textuales de internet.
El evento también reafirmó las limitaciones actuales de la IA. Aunque Claude 3.7 logró un progreso real, su desempeño estuvo lejos del de un jugador humano. Sin embargo, su capacidad de planificación y adaptación muestran un avance significativo en la evolución de los modelos de lenguaje.
Para aquellos interesados, la partida completa sigue disponible en el canal de Twitch ClaudePlaysPokemon, y clips destacados pueden encontrarse en YouTube y redes sociales. También puedes leer más sobre otros eventos similares en nuestra sección de noticias.
Pingback: POKÉMON COMO BANCO DE PRUEBAS PARA LA EVALUACIÓN DE LA INTELIGENCIA ARTIFICIAL: EL AUGE DE UNA NUEVA FORMA DE "TEST" COGNITIVO