Google presenta Gemini 2.5, su nueva generación de modelos de IA con capacidad de razonamiento

Droids

Updated on:

Google presenta Gemini 2.5, su nueva generación de modelos de IA con capacidad de razonamiento

Google acaba de desvelar Gemini 2.5, una nueva familia de modelos de inteligencia artificial que se caracteriza por su capacidad de "pensar" antes de responder a las preguntas. Esta innovadora tecnología marca un paso significativo en el desarrollo de sistemas de IA más reflexivos y precisos, situando a Google en primera línea de la carrera por desarrollar modelos de razonamiento avanzados.

Un modelo que "piensa" antes de responder

La principal característica diferenciadora de Gemini 2.5 es su capacidad para hacer pausas y procesar la información antes de ofrecer una respuesta. A diferencia de los modelos tradicionales que generan respuestas de forma inmediata, estos nuevos sistemas de IA dedican tiempo adicional a verificar hechos y razonar sobre problemas complejos, lo que resulta en respuestas más precisas y fundamentadas.

Google ha anunciado que, a partir de ahora, todos sus nuevos modelos de IA incorporarán estas capacidades de razonamiento, lo que sugiere un cambio de paradigma en la estrategia de desarrollo de inteligencia artificial de la compañía.

Gemini 2.5 Pro Experimental: el primero de la familia

Para inaugurar esta nueva familia de modelos, Google ha lanzado Gemini 2.5 Pro Experimental, un modelo multimodal con capacidades de razonamiento que la empresa califica como "su modelo más inteligente hasta la fecha".

Este primer modelo ya está disponible desde este martes en la plataforma para desarrolladores Google AI Studio, así como en la aplicación Gemini para los suscriptores del plan Gemini Advanced, que tiene un coste de 20 dólares mensuales (aproximadamente 18 euros).

La naturaleza multimodal de Gemini 2.5 Pro le permite procesar y generar contenido en diferentes formatos, como texto e imágenes, ampliando significativamente su versatilidad y utilidad en aplicaciones prácticas.

Rendimiento frente a la competencia

Según Google, Gemini 2.5 Pro supera a sus modelos anteriores y a algunos de los principales modelos competidores en varias pruebas de referencia. La compañía afirma que ha diseñado Gemini 2.5 específicamente para destacar en la creación de aplicaciones web visualmente atractivas y aplicaciones de codificación autónomas.

En una evaluación centrada en la edición de código llamada Aider Polyglot, Google afirma que Gemini 2.5 Pro obtiene una puntuación del 68,6%, superando a los principales modelos de IA de OpenAI, Anthropic y el laboratorio chino de IA DeepSeek.

Sin embargo, en otra prueba que mide las capacidades de desarrollo de software, SWE-bench Verified, Gemini 2.5 Pro obtiene un 63,8%, superando a o3-mini de OpenAI y R1 de DeepSeek, pero quedando por debajo del Claude 3.7 Sonnet de Anthropic, que alcanzó un 70,3%.

En Humanity's Last Exam, una prueba multimodal que consiste en miles de preguntas relacionadas con matemáticas, humanidades y ciencias naturales, Google indica que Gemini 2.5 Pro logra un 18,8%, un rendimiento superior al de la mayoría de los modelos insignia rivales.

La carrera por el razonamiento en IA

Desde que OpenAI lanzó el primer modelo de razonamiento de IA, denominado o1, en septiembre de 2024, la industria tecnológica ha iniciado una intensa competición por igualar o superar esas capacidades. Actualmente, empresas como Anthropic, DeepSeek, Google y xAI cuentan con modelos de razonamiento de IA, que utilizan potencia de cálculo y tiempo adicionales para verificar hechos y razonar a través de problemas antes de ofrecer una respuesta.

Esta técnica de razonamiento ha permitido a los modelos de IA alcanzar nuevos hitos en tareas relacionadas con matemáticas y programación. Muchos expertos del sector tecnológico consideran que los modelos de razonamiento serán un componente fundamental de los agentes de IA, sistemas autónomos capaces de realizar tareas con mínima intervención humana.

Google ya había experimentado anteriormente con modelos de razonamiento de IA, lanzando una versión "pensante" de Gemini en diciembre. Sin embargo, Gemini 2.5 representa el intento más serio de la compañía por superar a la serie de modelos "o" de OpenAI.

Especificaciones técnicas y disponibilidad

Una de las características más destacadas de Gemini 2.5 Pro es su ventana de contexto de 1 millón de tokens, lo que significa que el modelo puede procesar aproximadamente 750.000 palabras de una sola vez. Para poner esto en perspectiva, esta capacidad es superior a la extensión completa de la saga de libros "El Señor de los Anillos".

Google ha anunciado que próximamente Gemini 2.5 Pro admitirá el doble de longitud de entrada (2 millones de tokens), ampliando aún más sus capacidades de procesamiento de información.

En cuanto a la disponibilidad y precios, Google ha señalado que compartirá más información sobre los precios de la API de Gemini 2.5 Pro en las próximas semanas. Por el momento, los usuarios pueden acceder al modelo a través de Google AI Studio o mediante la suscripción a Gemini Advanced.

El futuro de la IA de razonamiento

El lanzamiento de Gemini 2.5 refleja la creciente importancia que las grandes tecnológicas están dando a la capacidad de razonamiento en sus sistemas de IA. Más allá de simplemente generar respuestas basadas en patrones aprendidos, estos nuevos modelos pretenden simular procesos de pensamiento más profundos y estructurados.

Este avance no solo representa una mejora en la calidad de las respuestas, sino que también podría tener implicaciones significativas para el desarrollo de sistemas autónomos capaces de tomar decisiones complejas con menor supervisión humana.

Con este lanzamiento, Google refuerza su posición en la carrera tecnológica por desarrollar la inteligencia artificial más avanzada, un campo que se ha convertido en uno de los principales frentes de competición entre las grandes empresas tecnológicas globales.

Deja un comentario