Google Potencia su Modelo Gemini con 'Deep Think' y Actualizaciones Adicionales

Droids

Updated on:

Google Potencia su Modelo Gemini con 'Deep Think' y Actualizaciones Adicionales

Google ha anunciado importantes mejoras en su modelo de inteligencia artificial Gemini, incluyendo un nuevo modo de razonamiento llamado 'Deep Think' para su modelo insignia Gemini 2.5 Pro, una actualización para Gemini 2.5 Flash y la introducción de un nuevo modelo de difusión llamado Gemini Diffusion. Estos avances, según la compañía, buscan mejorar el rendimiento, la eficiencia y la velocidad de sus modelos de IA.

'Deep Think': El Nuevo Modo de Razonamiento de Gemini 2.5 Pro

La principal novedad es 'Deep Think', un modo de razonamiento "mejorado" diseñado para el modelo Gemini 2.5 Pro. Según un artículo publicado por Kyle Wiggers en TechCrunch, este modo permite al modelo considerar múltiples respuestas a las preguntas antes de dar una respuesta final, lo que impulsa su rendimiento en diferentes pruebas de referencia.

Cómo funciona 'Deep Think'

Aunque Google no ha revelado todos los detalles técnicos sobre el funcionamiento interno de 'Deep Think', la compañía ha insinuado que la tecnología podría ser similar a la de los modelos o1-pro y o3-pro de OpenAI. Estos modelos utilizan un motor para buscar y sintetizar la mejor solución a un problema dado.

Durante una rueda de prensa, Demis Hassabis, jefe de Google DeepMind, afirmó que "[Deep Think] lleva el rendimiento del modelo a sus límites". Añadió que utiliza "nuestra última investigación de vanguardia en pensamiento y razonamiento, incluyendo técnicas paralelas".

Rendimiento y Benchmarks

Google afirma que 'Deep Think' ha permitido a Gemini 2.5 Pro superar LiveCodeBench, una evaluación de codificación considerada muy desafiante. Además, Gemini 2.5 Pro con 'Deep Think' también superó al modelo o3 de OpenAI en MMMU, una prueba diseñada para evaluar habilidades como la percepción y el razonamiento. Estos resultados sugieren que 'Deep Think' representa un avance significativo en las capacidades de Gemini.

Disponibilidad

Por el momento, 'Deep Think' está disponible para un grupo selecto de "probadores de confianza" a través de la API de Gemini. Google ha indicado que necesita tiempo adicional para llevar a cabo evaluaciones de seguridad antes de lanzar 'Deep Think' a un público más amplio.

Mejoras en Gemini 2.5 Flash

Además de 'Deep Think', Google también ha anunciado una actualización para su modelo Gemini 2.5 Flash, enfocado a tareas que no requieren tanta potencia de cálculo. Esta actualización permitirá al modelo desempeñarse mejor en tareas que involucran codificación, multimodalidad (procesamiento de diferentes tipos de datos, como texto e imágenes), razonamiento y contexto largo (comprensión de textos extensos).

Nuevas Capacidades

El nuevo Gemini 2.5 Flash no solo es más potente, sino también más eficiente que la versión anterior. Esto significa que puede realizar tareas más complejas utilizando menos recursos, lo que lo hace ideal para aplicaciones que se ejecutan en dispositivos con limitaciones de hardware.

Disponibilidad

Según TechCrunch, el nuevo 2.5 Flash está disponible para previsualización en Google’s AI Studio y Vertex AI platforms, así como en las aplicaciones Gemini de la compañía. Google planea que el Gemini 2.5 Flash mejorado esté disponible de forma general para los desarrolladores en junio.

Gemini Diffusion: Un Modelo de Difusión Ultrarrápido

Por último, Google ha presentado Gemini Diffusion, un nuevo modelo que, según la compañía, es "muy rápido". Gemini Diffusion, según el artículo de TechCrunch, ofrece resultados entre 4 y 5 veces más rápido que modelos comparables y rivaliza con el rendimiento de modelos que duplican su tamaño. Los modelos de difusión se utilizan a menudo para la generación de imágenes a partir de texto.

Velocidad y Rendimiento

La velocidad de Gemini Diffusion podría suponer un avance importante para las aplicaciones que requieren la generación de contenido en tiempo real. Aunque Google no ha proporcionado detalles específicos sobre la arquitectura del modelo, su rendimiento sugiere que se han implementado técnicas innovadoras para optimizar la velocidad de procesamiento.

Disponibilidad

Al igual que 'Deep Think', Gemini Diffusion está disponible, a partir de hoy, para "probadores de confianza". Google no ha anunciado una fecha de lanzamiento general para este modelo.

Impacto de las actualizaciones de Google en el campo de la IA

Con estas nuevas mejoras, Google busca consolidar su posición en la vanguardia de la inteligencia artificial. La introducción de 'Deep Think', la actualización de Gemini 2.5 Flash y el lanzamiento de Gemini Diffusion demuestran el compromiso de la compañía con la innovación y la mejora continua de sus modelos de IA. Estas actualizaciones podrían tener un impacto significativo en una amplia gama de aplicaciones, desde la codificación y la generación de contenido hasta la investigación científica y el desarrollo de nuevas tecnologías.

En un contexto relacionado, vale la pena mencionar que la startup Y Combinator, Firecrawl, está dispuesta a pagar $1 millón (aproximadamente 920.000€) para contratar a tres agentes de IA como empleados. Este hecho subraya la creciente importancia y el valor que se le está dando a la inteligencia artificial en el mundo laboral.