OpenAI Potencia su Responses API con Soporte MCP, Generación de Imágenes Nativas y Nuevas Funciones para Empresas

Droids

Updated on:

OpenAI Potencia su Responses API con Soporte MCP, Generación de Imágenes Nativas y Nuevas Funciones para Empresas

OpenAI ha anunciado una serie de actualizaciones significativas para su Responses API, una interfaz relativamente nueva, con el objetivo de simplificar a desarrolladores y empresas la creación de aplicaciones "agénticas" inteligentes y orientadas a la acción. Estas mejoras, disponibles desde este 21 de mayo de 2025, según informa VentureBeat, incluyen soporte para servidores remotos del Protocolo de Contexto de Modelo (MCP), la integración de herramientas de generación de imágenes nativas con GPT-4o y el Code Interpreter, además de actualizaciones en las capacidades de búsqueda de archivos y nuevas características enfocadas en el entorno empresarial.

La Evolución de la Responses API para Desarrolladores

Lanzada por primera vez en marzo de 2025, la Responses API se presentó como la caja de herramientas de OpenAI para que desarrolladores externos pudieran construir aplicaciones agénticas sobre algunas de las funcionalidades centrales de sus populares servicios como ChatGPT y sus agentes de IA propios, Deep Research y Operator.

El propósito de esta API, desde su concepción junto con el Agents SDK de código abierto de OpenAI, ha sido proporcionar a terceros acceso a las mismas tecnologías que impulsan los agentes de IA de OpenAI. De esta forma, startups y compañías ajenas a OpenAI pueden integrar la misma tecnología que se ofrece a través de ChatGPT en sus propios productos y servicios, ya sea para uso interno de empleados o externo para clientes y socios.

En los meses transcurridos desde su debut, la API ha procesado billones de tokens y ha soportado una amplia gama de casos de uso, desde la investigación de mercado y la educación hasta el desarrollo de software y el análisis financiero. Entre las aplicaciones populares construidas con la API se encuentran el agente de codificación de Zencoder, el asistente de inteligencia de mercado de Revi y la plataforma educativa de MagicSchool.

Inicialmente, la API combinaba elementos de Chat Completions y la Assistants API, ofreciendo herramientas integradas para búsqueda web y de archivos, así como uso de computadoras, permitiendo a los desarrolladores construir flujos de trabajo autónomos sin una lógica de orquestación compleja. OpenAI indicó en su momento que la API de Chat Completions sería deprecada para mediados de 2026. La Responses API proporciona visibilidad sobre las decisiones del modelo, acceso a datos en tiempo real y capacidades de integración que permiten a los agentes recuperar, razonar y actuar sobre la información, marcando un cambio hacia un kit de herramientas unificado para crear agentes de IA específicos de dominio y listos para producción con mínima fricción.

Novedades Destacadas en la Última Actualización

Las recientes mejoras introducidas por OpenAI expanden significativamente las capacidades de la Responses API, haciéndola aún más versátil y potente.

Conectividad Ampliada con el Soporte para Servidores MCP Remotos

Una adición clave en esta actualización es el soporte para servidores remotos del Protocolo de Contexto de Modelo (MCP). MCP es un estándar emergente que busca facilitar la interoperabilidad entre diferentes modelos y herramientas de IA. Ahora, los desarrolladores pueden conectar los modelos de OpenAI a herramientas y servicios externos como Stripe, Shopify y Twilio utilizando solo unas pocas líneas de código. Esta capacidad permite la creación de agentes que pueden realizar acciones e interactuar con sistemas de los que los usuarios ya dependen. Para respaldar este ecosistema en evolución, OpenAI ha anunciado que se ha unido al comité directivo de MCP.

Potenciando la Creatividad y el Análisis: Generación de Imágenes y Code Interpreter

La actualización trae nuevas herramientas integradas a la Responses API que mejoran lo que los agentes pueden hacer dentro de una única llamada a la API.

Por un lado, una variante del exitoso modelo de generación de imágenes nativas GPT-4o de OpenAI está ahora disponible a través de la API bajo el nombre de modelo "gpt-image-1". Este modelo, que inspiró una ola de memes de anime al estilo "Studio Ghibli" y llegó a saturar los servidores de OpenAI por su popularidad, puede crear muchos otros estilos de imagen e incluye nuevas características como previsualizaciones en tiempo real por streaming y refinamiento multiturno. Esto permite a los desarrolladores construir aplicaciones que pueden producir y editar imágenes dinámicamente en respuesta a la entrada del usuario.

Adicionalmente, la herramienta Code Interpreter está ahora integrada en la Responses API. Esta herramienta permite a los modelos manejar análisis de datos, matemáticas complejas y tareas basadas en lógica dentro de sus procesos de razonamiento. El Code Interpreter ayuda a mejorar el rendimiento del modelo en varios benchmarks técnicos y permite un comportamiento más sofisticado del agente.

Búsqueda de Archivos Más Precisa e Inteligente

La funcionalidad de búsqueda de archivos también ha sido mejorada. Los desarrolladores ahora pueden realizar búsquedas a través de múltiples almacenes vectoriales (bases de datos especializadas para búsquedas semánticas) y aplicar filtrado basado en atributos para recuperar solo el contenido más relevante. Esto mejora la precisión de la información que utilizan los agentes, potenciando su capacidad para responder preguntas complejas y operar dentro de grandes dominios de conocimiento.

Funcionalidades Diseñadas para el Entorno Corporativo

Varias de las nuevas características están diseñadas específicamente para satisfacer las necesidades de las empresas, enfocándose en la fiabilidad, transparencia y seguridad.

El modo de fondo (Background mode) permite tareas asíncronas de larga duración, abordando problemas de tiempos de espera o interrupciones de red durante procesos de razonamiento intensivos.

Los resúmenes de razonamiento (Reasoning summaries), una nueva adición, ofrecen explicaciones en lenguaje natural del proceso de pensamiento interno del modelo. Esto es crucial para la depuración de errores y para aumentar la transparencia sobre cómo el modelo llega a sus conclusiones.

Para una mayor privacidad, los elementos de razonamiento cifrados (Encrypted reasoning items) proporcionan una capa adicional para los clientes que utilizan la opción de Retención Cero de Datos (Zero Data Retention). Estos permiten a los modelos reutilizar pasos de razonamiento previos sin almacenar ningún dato en los servidores de OpenAI, mejorando tanto la seguridad como la eficiencia.

Estas últimas capacidades son compatibles con las series GPT-4o y GPT-4.1 de OpenAI, así como con los modelos de la serie o, incluyendo o3 y o4-mini. Estos modelos ahora mantienen el estado de razonamiento a través de múltiples llamadas y solicitudes de herramientas, lo que conduce a respuestas más precisas a un menor coste y latencia.

Estructura de Precios: Más Funciones, Mismo Coste

A pesar del ampliado conjunto de características, OpenAI ha confirmado que los precios de las nuevas herramientas y capacidades dentro de la Responses API se mantendrán consistentes con las tarifas existentes. La empresa busca así fomentar la adopción sin imponer barreras económicas adicionales.

Por ejemplo, la herramienta Code Interpreter tiene un precio de 0,03 dólares (aproximadamente 0,028 euros) por sesión. El uso de la búsqueda de archivos se factura a 2,50 dólares (unos 2,30 euros) por cada 1.000 llamadas, con costes de almacenamiento de 0,10 dólares (alrededor de 0,092 euros) por GB al día después del primer gigabyte gratuito.

Los precios de la búsqueda web varían según el modelo y el tamaño del contexto de búsqueda, oscilando entre 25 y 50 dólares (entre 23 y 46 euros, aproximadamente) por cada 1.000 llamadas. La generación de imágenes a través de la herramienta "gpt-image-1" también se cobra según la resolución y el nivel de calidad, comenzando en 0,011 dólares (cerca de 0,01 euros) por imagen.

Todo el uso de herramientas se factura según las tarifas por token del modelo elegido, sin ningún recargo adicional por las capacidades recién añadidas.

Próximos Pasos para la Responses API

Con estas actualizaciones, OpenAI continúa expandiendo las posibilidades de la Responses API. Los desarrolladores obtienen acceso a un conjunto más rico de herramientas y características listas para el entorno empresarial, mientras que las empresas ahora pueden construir aplicaciones impulsadas por IA más integradas, capaces y seguras.

Todas las características están activas desde el 21 de mayo de 2025, con detalles de precios e implementación disponibles a través de la documentación de OpenAI, según la información publicada por VentureBeat. Este movimiento subraya el compromiso de OpenAI de democratizar el acceso a tecnologías de IA avanzadas y fomentar la innovación en el ecosistema de desarrolladores.