Google añade capacidad visual a su Modo IA: ahora puede "ver" y buscar con imágenes

Droids

Updated on:

Google añade capacidad visual a su Modo IA: ahora puede "ver" y buscar con imágenes

Google ha dado un paso significativo en la evolución de su búsqueda inteligente al añadir capacidades multimodales a su Modo IA. Esta actualización permite al asistente de búsqueda "ver" y responder preguntas sobre imágenes, combinando una versión personalizada de Gemini AI con la tecnología de reconocimiento de imágenes Lens de la compañía.

La nueva función está disponible desde hoy y puede ser utilizada en la aplicación de Google para dispositivos Android e iOS. Además, la compañía ha anunciado que está ampliando el acceso al Modo IA a "millones más" de usuarios en Estados Unidos.

Nueva integración de visión artificial en la búsqueda de Google

El Modo IA de Google ahora permite a los usuarios tomar o subir una imagen y recibir "una respuesta rica y completa con enlaces" sobre su contenido. Esta función representa una evolución natural de las capacidades de búsqueda visual que Google ha venido desarrollando durante años.

"El Modo IA se basa en nuestros años de trabajo en búsqueda visual y lo lleva un paso más allá", explica Robby Stein, Vicepresidente de producto para Google Search. "Con las capacidades multimodales de Gemini, el Modo IA puede entender toda la escena en una imagen, incluyendo el contexto de cómo los objetos se relacionan entre sí y sus materiales, colores, formas y disposiciones únicas", añade.

Esta integración representa un avance significativo en cómo interactuamos con los motores de búsqueda, permitiendo consultas más naturales y contextuales basadas en elementos visuales.

Cómo funciona la nueva búsqueda con imágenes

Según informa The Verge, la actualización utiliza lo que Google denomina una "técnica de ramificación" que emite múltiples consultas sobre la imagen que ve y los objetos contenidos en ella. Esto permite proporcionar respuestas "increíblemente matizadas y contextualmente relevantes".

Esta capacidad le permite realizar tareas complejas como:

  • Identificar libros que aparecen en una imagen
  • Sugerir títulos similares con valoraciones positivas
  • Responder preguntas para organizar mejor las recomendaciones

Por ejemplo, si un usuario muestra al sistema una estantería con varios libros, el Modo IA no solo identificará los títulos, sino que podrá recomendar lecturas similares basándose en los géneros detectados, e incluso responder a preguntas adicionales para refinar estas recomendaciones.

La tecnología va más allá del simple reconocimiento de objetos, ya que comprende relaciones espaciales y contextuales entre elementos, ofreciendo una experiencia de búsqueda mucho más natural y humana.

Expansión del servicio a más usuarios

El Modo IA para búsqueda se lanzó inicialmente de forma exclusiva para los suscriptores de Google One AI Premium el mes pasado, aunque solo dentro de Labs, el entorno de Google para probar funciones experimentales.

Ahora, Google ha comenzado a ampliar el acceso a "millones más" de usuarios de Labs en Estados Unidos, más allá de los suscriptores que pagan por AI Premium. Esta estrategia de despliegue gradual permite a Google perfeccionar la tecnología antes de un lanzamiento más amplio.

La empresa no ha especificado cuándo estará disponible esta función para usuarios en España u otros países fuera de Estados Unidos, siguiendo el patrón habitual de Google de lanzar primero sus novedades en el mercado estadounidense antes de expandirlas globalmente.

La respuesta de Google a la competencia en IA

El Modo IA de búsqueda funciona como la respuesta de Google a competidores emergentes en el espacio de la inteligencia artificial conversacional, particularmente Perplexity y ChatGPT Search.

A diferencia de la búsqueda tradicional de Google, que presenta una lista de enlaces, el Modo IA ofrece una experiencia similar a un chatbot, respondiendo a las consultas con resúmenes generados por IA extraídos del índice de búsqueda completo de Google.

Con la adición de capacidades multimodales, Google eleva el nivel de la competencia, ofreciendo una ventaja significativa sobre rivales que aún no han integrado completamente el análisis visual en sus sistemas de búsqueda conversacional.

Una evolución natural de la búsqueda

Esta actualización representa una evolución lógica en cómo interactuamos con los sistemas de búsqueda. Durante años, Google ha ido incorporando gradualmente capacidades de reconocimiento visual a sus servicios, desde Google Lens hasta la búsqueda por imágenes, pero la integración con modelos de IA generativa marca un salto cualitativo importante.

La capacidad de "ver" y comprender imágenes de manera contextual, combinada con la habilidad de mantener una conversación sobre lo observado, acerca la experiencia de búsqueda a un asistente inteligente capaz de entender el mundo como lo hacemos los humanos.

Con esta actualización, Google refuerza su posición en la carrera por desarrollar asistentes de IA cada vez más capaces y naturales, mientras intenta mantener su dominio en el mercado de búsqueda frente a nuevos competidores centrados en la inteligencia artificial.

Aunque la función está actualmente limitada a usuarios seleccionados en Estados Unidos, es probable que esta capacidad se expanda globalmente en los próximos meses, transformando fundamentalmente cómo interactuamos con el motor de búsqueda más utilizado del mundo.

Deja un comentario