Open Deep Search: el nuevo competidor de código abierto que desafía a Perplexity y ChatGPT Search

Droids

Updated on:

Open Deep Search: el nuevo competidor de código abierto que desafía a Perplexity y ChatGPT Search

La búsqueda potenciada por inteligencia artificial acaba de dar un importante paso hacia la democratización. Investigadores de Sentient Foundation han lanzado Open Deep Search (ODS), un nuevo marco de trabajo de código abierto que promete igualar —e incluso superar— a las soluciones propietarias de búsqueda con IA como Perplexity y ChatGPT Search.

Esta nueva herramienta equipa a los modelos de lenguaje grande (LLMs) con agentes de razonamiento avanzados capaces de utilizar la búsqueda web y otras herramientas para responder preguntas complejas. Para las empresas que buscan soluciones de búsqueda con IA personalizables, ODS representa una alternativa de alto rendimiento frente a las soluciones comerciales cerradas.

El panorama actual de la búsqueda con IA

Las herramientas modernas de búsqueda con IA como Perplexity y ChatGPT Search han revolucionado la forma en que obtenemos información, combinando las capacidades de razonamiento de los LLMs con la búsqueda web para proporcionar respuestas actualizadas. Sin embargo, estas soluciones suelen ser propietarias y de código cerrado, lo que dificulta su personalización y adaptación para aplicaciones especiales.

"La mayoría de la innovación en búsqueda con IA ha ocurrido a puerta cerrada. Los esfuerzos de código abierto históricamente han quedado rezagados en usabilidad y rendimiento", explicó Himanshu Tyagi, cofundador de Sentient, a VentureBeat. "ODS pretende cerrar esa brecha, demostrando que los sistemas abiertos pueden competir, e incluso superar, a sus homólogos cerrados en calidad, velocidad y flexibilidad".

Open Deep Search está diseñado como un sistema "plug-and-play" que puede integrarse tanto con modelos de código abierto como DeepSeek-R1 como con modelos cerrados como GPT-4o y Claude.

ODS consta de dos componentes principales, ambos aprovechando el LLM base elegido:

Open Search Tool

Este componente toma una consulta y recupera información de la web que puede ser proporcionada al LLM como contexto. Para mejorar los resultados de búsqueda, realiza varias acciones clave:

  • Reformula la consulta original de diferentes maneras para ampliar la cobertura de búsqueda
  • Obtiene resultados de un motor de búsqueda
  • Extrae contexto de los principales resultados
  • Aplica técnicas de fragmentación y reclasificación para filtrar el contenido más relevante
  • Incluye manejo personalizado para fuentes específicas como Wikipedia, ArXiv y PubMed
  • Puede ser configurado para priorizar fuentes confiables cuando encuentra información contradictoria

Open Reasoning Agent

Este agente recibe la consulta del usuario y utiliza el LLM base junto con varias herramientas (incluida la Open Search Tool) para formular una respuesta final. Sentient proporciona dos arquitecturas de agente distintas:

ODS-v1: Emplea un marco de agente ReAct combinado con razonamiento Chain-of-Thought (CoT). Los agentes ReAct intercalan pasos de razonamiento ("pensamientos") con acciones (como usar la herramienta de búsqueda) y observaciones (los resultados de las herramientas).

ODS-v2: Aprovecha Chain-of-Code (CoC) y un agente CodeAct, implementado utilizando la biblioteca Hugging Face SmolAgents. CoC utiliza la capacidad del LLM para generar y ejecutar fragmentos de código para resolver problemas, mientras que CodeAct usa la generación de código para planificar acciones.

"Mientras herramientas como ChatGPT o Grok ofrecen 'investigación profunda' a través de agentes conversacionales, ODS opera en una capa diferente, más parecida a la infraestructura detrás de Perplexity AI, proporcionando la arquitectura subyacente que impulsa la recuperación inteligente, no solo resúmenes", señaló Tyagi a VentureBeat.

Rendimiento y resultados prácticos

Sentient evaluó ODS combinándolo con el modelo de código abierto DeepSeek-R1 y comparándolo con competidores populares de código cerrado como Perplexity AI y OpenAI's GPT-4o Search Preview, así como con LLMs independientes como GPT-4o y Llama-3.1-70B. Utilizaron los benchmarks de respuesta a preguntas FRAMES y SimpleQA, adaptándolos para evaluar la precisión de los sistemas de IA habilitados para búsqueda.

Los resultados demuestran la competitividad de ODS:

  • Tanto ODS-v1 como ODS-v2, cuando se combinan con DeepSeek-R1, superaron a los productos insignia de Perplexity
  • Notablemente, ODS-v2 emparejado con DeepSeek-R1 superó al GPT-4o Search Preview en el complejo benchmark FRAMES y casi lo igualó en SimpleQA

Una observación interesante fue la eficiencia del marco. Los agentes de razonamiento en ambas versiones de ODS aprendieron a utilizar la herramienta de búsqueda juiciosamente, a menudo decidiendo si era necesaria una búsqueda adicional en función de la calidad de los resultados iniciales. Por ejemplo, ODS-v2 utilizó menos búsquedas web en las tareas más simples de SimpleQA en comparación con las consultas más complejas de múltiples pasos en FRAMES, optimizando el consumo de recursos.

Implicaciones para las empresas

Para las empresas que buscan potentes capacidades de razonamiento de IA basadas en información en tiempo real, ODS presenta una solución prometedora que ofrece una alternativa transparente, personalizable y de alto rendimiento a los sistemas de búsqueda de IA propietarios. La capacidad de integrar LLMs de código abierto preferidos y herramientas proporciona a las organizaciones un mayor control sobre su infraestructura de IA y evita la dependencia de un solo proveedor.

"ODS fue construido pensando en la modularidad", explicó Tyagi. "Selecciona dinámicamente qué herramientas usar, basándose en descripciones proporcionadas en el prompt. Esto significa que puede interactuar con herramientas desconocidas con fluidez —siempre que estén bien descritas— sin requerir exposición previa".

Sin embargo, reconoció que el rendimiento de ODS puede degradarse cuando el conjunto de herramientas se vuelve demasiado grande, "por lo que un diseño cuidadoso es importante".

Sentient ha publicado el código de ODS en GitHub, permitiendo a desarrolladores y empresas explorar y contribuir al proyecto.

"Inicialmente, la fortaleza de Perplexity y ChatGPT era su tecnología avanzada, pero con ODS, hemos nivelado este campo tecnológico", afirmó Tyagi. "Ahora aspiramos a superar sus capacidades a través de nuestra estrategia de 'entradas abiertas y salidas abiertas', permitiendo a los usuarios integrar perfectamente agentes personalizados en Sentient Chat".

Un paso adelante para las soluciones de IA de código abierto

El lanzamiento de Open Deep Search representa un importante paso adelante para la comunidad de IA de código abierto. Al proporcionar un marco que puede competir con las soluciones propietarias líderes, ODS demuestra que los sistemas abiertos pueden ofrecer rendimiento de primer nivel mientras brindan libertad para la personalización y adaptación.

Para empresas y desarrolladores que valoran la transparencia, el control y la flexibilidad, ODS ofrece una oportunidad interesante para implementar capacidades de búsqueda avanzada con IA sin las limitaciones de las soluciones propietarias. El tiempo dirá si este enfoque de código abierto puede seguir el ritmo de sus competidores comerciales, pero el rendimiento inicial de ODS sugiere un futuro prometedor para las soluciones de búsqueda inteligente de código abierto.

Deja un comentario