OpenAI lanza «Actions», la función que convierte a ChatGPT en un agente autónomo para ejecutar tareas en otras apps

Droids

Updated on:

OpenAI, la compañía detrás del popular modelo de lenguaje ChatGPT, ha anunciado una de sus actualizaciones más ambiciosas hasta la fecha. Se trata de «Actions», una nueva capacidad que permite al chatbot ir más allá de la conversación para realizar tareas concretas en nombre del usuario a través de diferentes aplicaciones y sitios web. Este movimiento transforma a ChatGPT en un agente de inteligencia artificial de propósito general, un paso significativo hacia un futuro donde los asistentes de IA gestionen de forma autónoma nuestras actividades digitales.

La nueva funcionalidad, anunciada este lunes, se está implementando de manera gradual, comenzando con un grupo reducido de suscriptores de ChatGPT Plus en Estados Unidos. Con «Actions», un usuario podría pedirle a ChatGPT que organice un viaje, diseñe una presentación o gestione una campaña de marketing, y la IA se encargaría de ejecutar las operaciones necesarias en las aplicaciones correspondientes.

Un asistente que va más allá de la conversación

Hasta ahora, ChatGPT ha destacado por su capacidad para generar texto, traducir idiomas y responder preguntas de forma coherente. Sin embargo, su interacción se limitaba principalmente a su propia interfaz. «Actions» rompe esta barrera, permitiendo que la IA actúe como un asistente proactivo capaz de ejecutar tareas complejas de varios pasos en el mundo digital.

«Nuestro objetivo es que puedas pedirle a ChatGPT que gestione cualquier tarea en tu ordenador o teléfono, y que lo haga de forma fiable. El lanzamiento de hoy es un paso temprano pero importante en esa dirección», afirmó OpenAI en su anuncio oficial.

Para ilustrar su potencial, la compañía mostró una demostración en la que un usuario pedía: «planifica un viaje de fin de semana a Nueva York para mí y mi pareja». Tras hacer algunas preguntas para aclarar las fechas y el presupuesto, ChatGPT procedió a buscar vuelos en Kayak, encontrar opciones de alojamiento en Airbnb e incluso sugerir restaurantes. Todo el proceso se gestiona desde la conversación con ChatGPT, que coordina las acciones en las aplicaciones de terceros una vez que el usuario le concede los permisos necesarios.

¿Cómo funciona y qué puede hacer?

La tecnología que impulsa «Actions» se basa en las APIs (Interfaces de Programación de Aplicaciones). Una API es, en esencia, un conjunto de reglas y herramientas que permite que diferentes programas de software se comuniquen entre sí. Al conectar ChatGPT con las APIs de otros servicios, OpenAI le da la capacidad de «hablar» y «dar órdenes» a otras aplicaciones.

El proceso está diseñado para mantener al usuario siempre en control. Funciona de la siguiente manera:

  1. El usuario realiza una petición en lenguaje natural (por ejemplo, «crea una invitación para mi fiesta de cumpleaños en Canva»).
  2. ChatGPT analiza la petición, determina qué «Actions» necesita ejecutar y presenta un plan detallado al usuario.
  3. El usuario revisa el plan y debe aprobarlo explícitamente en un paso de confirmación.
  4. Una vez aprobado, ChatGPT ejecuta las acciones en las aplicaciones conectadas.

Los primeros socios de integración incluyen servicios populares como Canva, Kayak y Zapier. Esto abre un abanico de posibilidades: desde pedirle que «cree una presentación con los resultados de ventas del tercer trimestre» usando Canva, hasta automatizar flujos de trabajo complejos como «añade a todos los participantes de este hilo de correo a mi campaña de marketing en Mailchimp» a través de Zapier. La compañía planea expandir el número de integraciones con el tiempo.

Seguridad y control: los pilares de la nueva funcionalidad

Otorgar a una inteligencia artificial acceso a cuentas personales y la capacidad de realizar acciones como compras o reservas conlleva riesgos de seguridad evidentes. Consciente de ello, OpenAI ha puesto un fuerte énfasis en que el control final recae siempre en el usuario.

«Tú tienes el control«, subraya la compañía. «Debes conectar explícitamente cada Acción, ves un paso de confirmación antes de que se ejecute y puedes ver exactamente lo que el modelo hizo en tu nombre», se detalla en su blog.

Para reforzar la seguridad, los usuarios deben autorizar cada conexión con una aplicación de terceros de forma individual. Además, se requiere autenticación para tareas sensibles y se han implementado salvaguardas para limitar el tipo de acciones que la IA puede realizar por su cuenta. La transparencia sobre las acciones ejecutadas es otro de los compromisos de la compañía para generar confianza.

La carrera por el agente de IA definitivo

El lanzamiento de «Actions» sitúa a OpenAI en competencia directa con otros gigantes tecnológicos que también trabajan en el desarrollo de agentes de IA. Google, por ejemplo, ha estado integrando capacidades similares en su Asistente y en sus modelos de IA Gemini, buscando que sus herramientas puedan anticiparse a las necesidades del usuario y actuar en consecuencia.

El campo también está poblado por startups especializadas y muy bien financiadas. Un ejemplo notable es Adept AI, una empresa que está construyendo modelos de IA diseñados específicamente para utilizar herramientas de software existentes de la misma manera que lo haría un humano. Adept AI recaudó 350 millones de dólares (aproximadamente 322 millones de euros) en una ronda de financiación liderada por General Catalyst y Spark Capital. Curiosamente, su cofundador y CEO, David Luan, es un antiguo director de ingeniería de OpenAI.

«Pensamos en esto como un nuevo tipo de ordenador, uno con el que puedes hablar en lenguaje natural y que puede hacer cosas por ti», explicó Luan al New York Times. Esta visión encapsula la ambición de toda una industria: transformar la interacción con la tecnología, pasando de manejar interfaces complejas a simplemente delegar tareas en un único asistente conversacional.

Disponibilidad y próximos pasos

Por el momento, «Actions» no está disponible para el público general. OpenAI ha optado por un lanzamiento lento y controlado, comenzando con un pequeño grupo de suscriptores de ChatGPT Plus en Estados Unidos. El objetivo es recopilar comentarios y refinar la funcionalidad antes de una implementación más amplia.

La compañía no ha proporcionado un calendario específico para su disponibilidad internacional ni para los usuarios de la versión gratuita de ChatGPT. Sin embargo, sí ha abierto una lista de espera para los desarrolladores que deseen integrar sus propios servicios con las «Actions» de ChatGPT, lo que sugiere que el ecosistema de aplicaciones conectadas crecerá en el futuro. Este lanzamiento, aunque limitado, marca un antes y un después en la evolución de los asistentes de inteligencia artificial.