Gemini 2.5 Pro I/O Edition: El nuevo rey generando código supera a Claude 3.7 Sonnet

Droids

Updated on:

Gemini 2.5 Pro I/O Edition: El nuevo rey de la codificación con IA supera a Claude 3.7 Sonnet

Google ha dado un paso decisivo en la carrera de la inteligencia artificial generativa con el lanzamiento de Gemini 2.5 Pro "I/O" Edition, una versión especializada en codificación que ha logrado desbancar a Claude 3.7 Sonnet de Anthropic como el modelo más capaz para el desarrollo de aplicaciones web. Esta nueva versión destaca por su capacidad para crear aplicaciones web interactivas completas a partir de una única instrucción textual.

Google lanza una versión mejorada de Gemini especializada en código

DeepMind, la división de investigación de IA de Google, ha presentado esta actualización de su modelo de lenguaje multimodal Gemini 2.5 Pro, original de marzo. Según declaró en X el CEO de DeepMind, Demis Hassabis, se trata de "¡el mejor modelo de codificación que hemos construido nunca!".

La nueva versión, etiquetada como "gemini-2.5-pro-preview-05-06", reemplaza a la anterior "03-25" y está disponible para desarrolladores independientes en Google AI Studio y para empresas en la plataforma Vertex AI. Los usuarios individuales también pueden acceder a través de la aplicación Gemini.

Este lanzamiento precede a la conferencia anual de desarrolladores Google I/O, que tendrá lugar del 20 al 21 de mayo en Mountain View y online, y responde a la fuerte demanda de la comunidad para mejorar las capacidades prácticas de generación de código.

Logan Kilpatrick, Senior Product Manager para Gemini API y Google AI Studio, confirmó en un post del blog para desarrolladores que la actualización también aborda comentarios clave sobre las llamadas a funciones, con mejoras en la reducción de errores y la fiabilidad.

Un nuevo líder en el desarrollo de aplicaciones web

Por primera vez desde que comenzó la carrera de la IA generativa con el lanzamiento de ChatGPT a finales de 2022, Google ha tomado la delantera en un importante punto de referencia de codificación. En el WebDev Arena Leaderboard, una métrica de terceros que clasifica los modelos según la preferencia humana basada en su capacidad para generar aplicaciones web funcionales y visualmente atractivas, Gemini 2.5 Pro Preview (05-06) ha superado a Claude 3.7 Sonnet de Anthropic.

El nuevo modelo obtuvo una puntuación de 1499,95 en la clasificación, situándose muy por delante de los 1377,10 de Sonnet 3.7. El anterior Gemini 2.5 Pro (03-25) ocupaba el tercer lugar con una puntuación de 1278,96, lo que significa que la edición I/O representa un salto de 221 puntos.

Como señaló en X el usuario experto en IA "Lisan al Gaib", ni siquiera GPT-4o ("o3") de OpenAI pudo desplazar a Sonnet 3.7, lo que destaca la importancia del avance de Gemini.

Aplicaciones completas con una sola instrucción

Una de las características más destacadas de esta actualización es su capacidad para construir aplicaciones web completas e interactivas o simulaciones a partir de una única instrucción textual.

La nueva versión impulsa el desarrollo de características en aplicaciones como Gemini 95, donde el modelo ayuda a hacer coincidir estilos visuales en todos los componentes automáticamente. También permite flujos de trabajo como convertir vídeos de YouTube en aplicaciones de aprendizaje completas y crear componentes altamente estilizados, como reproductores de vídeo receptivos o interfaces de dictado animadas, con poca o ninguna edición manual de CSS.

Pietro Schirano, CEO de la herramienta de arte con IA EverArt, mostró en X cómo el nuevo Gemini 2.5 Pro I/O Edition pudo generar una simulación interactiva del meme "1 gorila contra 100 hombres" que ha estado circulando en redes sociales, todo a partir de una única instrucción.

Otro usuario, "RameshR" (@rezmeram), compartió un juego de rompecabezas estilo Tetris con efectos de sonido funcionales creado en menos de un minuto, exclamando que "¡la industria de los juegos casuales está muerta!".

Recepción entre los desarrolladores

Varios desarrolladores y líderes de plataformas han destacado la mayor fiabilidad del modelo y su aplicación en escenarios de producción real.

Silas Alberti, de Cognition, señaló que Gemini 2.5 Pro fue el primer modelo en completar con éxito una refactorización compleja de un sistema de enrutamiento backend, demostrando el tipo de toma de decisiones que se esperaría de un desarrollador senior.

Michael Truell, CEO de la herramienta de codificación con IA Cursor, afirmó que las pruebas internas muestran una marcada disminución en los fallos de llamadas a herramientas, un problema previamente señalado. Cursor ya ha integrado Gemini 2.5 Pro en su propio agente de código.

Michele Catasta, Presidente de Replit, describió a Gemini 2.5 Pro como el mejor modelo de vanguardia para equilibrar capacidad con latencia, sugiriendo que Replit está considerando la integración del modelo en sus propias herramientas.

De manera similar, Paul Couvert, educador de IA y fundador del chatbot privado de IA BlueShell, comentó en X que "sus capacidades de generación de código e interfaz de usuario son impresionantes".

Precios y disponibilidad

El modelo es propietario, lo que significa que las empresas tendrán que pagar a Google para usarlo y acceder a él únicamente a través de los servicios web de Google. Sin embargo, no altera los precios ni los límites de tasa; los usuarios actuales de Gemini 2.5 Pro serán automáticamente redirigidos al modelo actualizado.

Gemini 2.5 Pro cuesta $1,25/$10 por millón de tokens de entrada/salida (aproximadamente 1,15€/9,20€) para longitudes de contexto de 200.000 tokens, en comparación con los $3/$15 (aproximadamente 2,76€/13,80€) de Claude 3.7 Sonnet, lo que lo convierte en una opción más económica.

La actualización está disponible para desarrolladores independientes en Google AI Studio y para empresas en la plataforma Vertex AI, así como para usuarios individuales en la aplicación Gemini. Según el post del blog de Google, también impulsa la función Canvas de la aplicación móvil Gemini y otras características.

Lo que representa para el futuro del desarrollo

Aunque Google no ha detallado la arquitectura y los cambios internos de Gemini 2.5 Pro, el énfasis sigue estando en permitir experiencias de desarrollo más rápidas e intuitivas.

Al aprovechar sus puntos fuertes en la generación de código y las entradas multimodales, Gemini 2.5 Pro se posiciona menos como una novedad de investigación y más como una herramienta práctica para desafíos de codificación del mundo real.

El lanzamiento anticipado refleja una clara intención de Google DeepMind de satisfacer la demanda de los desarrolladores y mantener el impulso antes de los grandes anuncios de su conferencia.

Con estas mejoras, Google parece haber dado un paso significativo en la carrera por la IA generativa, especialmente en el campo del desarrollo de software, donde la capacidad para generar código funcional y estéticamente agradable es cada vez más valorada por los desarrolladores y las empresas.