ElevenLabs Lanza IA Conversacional 2.0: Asistentes de Voz Más Naturales e Inteligentes para Empresas

Droids

Updated on:

ElevenLabs Lanza IA Conversacional 2.0: Asistentes de Voz Más Naturales e Inteligentes para Empresas

La startup de tecnología de voz ElevenLabs ha anunciado hoy el lanzamiento de Conversational AI 2.0, una importante actualización de su plataforma diseñada para la creación de agentes de voz avanzados. Esta nueva versión promete interacciones más fluidas y naturales, capaces de comprender cuándo pausar, hablar y ceder el turno en una conversación, abriendo nuevas posibilidades para su aplicación en el ámbito empresarial, como en el soporte al cliente, los centros de llamadas y las estrategias de ventas y marketing.

El anuncio, detallado en un artículo de VentureBeat, llega en un momento de rápida evolución en el campo de la inteligencia artificial aplicada a la voz y el habla. ElevenLabs, fundada por antiguos ingenieros de Palantir y con una sólida financiación, busca consolidar su posición en un mercado cada vez más competitivo.

ElevenLabs Redefine la Interacción por Voz con IA Conversacional 2.0

La nueva plataforma Conversational AI 2.0 de ElevenLabs introduce una serie de mejoras y nuevas funcionalidades destinadas a crear interacciones de voz más naturales, inteligentes y seguras, adaptadas específicamente para las exigencias del entorno empresarial. Este lanzamiento se produce tan solo cuatro meses después de la presentación de la plataforma original, lo que, según VentureBeat, refleja el compromiso de ElevenLabs con el desarrollo ágil y la innovación continua.

La presentación de esta tecnología también se enmarca en un contexto competitivo, ocurriendo un día después de que Hume AI, una startup rival en el campo de la IA de voz, lanzara su nuevo modelo EVI 3, basado en turnos. Además, el lanzamiento se percibe como una respuesta a la aparición de nuevos modelos de IA de voz de código abierto, que habían llevado a algunos influyentes del sector a especular prematuramente sobre la pérdida de relevancia de ElevenLabs. Según Jozef Marko, del equipo de ingeniería de ElevenLabs, citado por VentureBeat, "Conversational AI 2.0 es sustancialmente mejor que su predecesor, estableciendo un nuevo estándar para las experiencias impulsadas por voz".

Claves de la Nueva Generación: Naturalidad y Comprensión Avanzada

Una de las características más destacadas de Conversational AI 2.0 es su modelo de toma de turnos de última generación. Esta tecnología está diseñada para gestionar las sutilezas de la conversación humana, eliminando las pausas incómodas o las interrupciones abruptas que a menudo se producen en los sistemas de voz tradicionales. Al analizar en tiempo real señales conversacionales como las vacilaciones y las palabras de relleno, el agente puede comprender instintivamente cuándo es su momento de hablar y cuándo debe escuchar. Esta capacidad es especialmente relevante para aplicaciones como el servicio al cliente, donde los agentes deben equilibrar respuestas rápidas con los ritmos naturales de una conversación.

Soporte Multilingüe Integrado

Otra mejora significativa es la detección de idioma integrada, que permite mantener conversaciones multilingües fluidas sin necesidad de configuración manual. El agente es capaz de reconocer el idioma hablado por el usuario y responder en consecuencia dentro de la misma interacción. Esta funcionalidad está pensada para empresas globales que buscan ofrecer un servicio consistente a bases de clientes diversas, eliminando barreras lingüísticas y fomentando experiencias más inclusivas.

Potencia Empresarial: Acceso al Conocimiento y Versatilidad

Para satisfacer las necesidades de las empresas, Conversational AI 2.0 incorpora un potente sistema de Generación Aumentada por Recuperación (RAG, por sus siglas en inglés). Esta característica permite a la IA acceder a bases de conocimiento externas y recuperar información relevante de forma instantánea, manteniendo una latencia mínima y sólidas protecciones de privacidad.

Por ejemplo, en entornos sanitarios, un agente asistente médico podría consultar directrices de tratamiento directamente desde la base de datos de una institución sin demora. En el ámbito del soporte al cliente, los agentes pueden acceder a detalles actualizados de productos desde la documentación interna para asistir a los usuarios de manera más eficaz.

Multimodalidad y Personas Alternas

La nueva plataforma de ElevenLabs también soporta la multimodalidad, lo que significa que los agentes pueden comunicarse a través de voz, texto o una combinación de ambos. Esta flexibilidad reduce la carga de ingeniería para los desarrolladores, ya que los agentes solo necesitan ser definidos una vez para operar a través de diferentes canales de comunicación.

Para mejorar aún más la expresividad del agente, Conversational AI 2.0 permite el modo multi-personaje, lo que posibilita que un único agente cambie entre diferentes personalidades o roles. Esta capacidad podría ser valiosa en escenarios como el desarrollo de contenido creativo, simulaciones de formación o campañas de interacción con el cliente.

Eficiencia a Escala y Compromiso con la Seguridad

Pensando en las empresas que buscan automatizar la comunicación a gran escala, la plataforma ahora soporta llamadas salientes masivas (batch calls). Las organizaciones pueden iniciar múltiples llamadas salientes simultáneamente utilizando agentes de IA conversacional, un enfoque adecuado para encuestas, alertas y mensajes personalizados. Esta función tiene como objetivo aumentar tanto el alcance como la eficiencia operativa, ofreciendo una alternativa más escalable a los esfuerzos manuales de llamadas salientes.

Cumplimiento Normativo y Estándares Empresariales

Más allá de las características que mejoran la comunicación, Conversational AI 2.0 pone un fuerte énfasis en la confianza y el cumplimiento normativo. La plataforma es totalmente compatible con HIPAA (Ley de Portabilidad y Responsabilidad del Seguro Médico de EE. UU.), un requisito crítico para aplicaciones sanitarias que exigen una estricta privacidad y protección de datos. También soporta la residencia de datos opcional en la UE, alineándose con los requisitos de soberanía de datos en Europa.

ElevenLabs refuerza estas características con seguridad y fiabilidad de grado empresarial. Diseñada para alta disponibilidad e integración con sistemas de terceros, la plataforma se posiciona como una opción segura y fiable para empresas que operan en entornos sensibles o regulados.

Planes de Precios y Disponibilidad

ElevenLabs ofrece varios planes de suscripción que incluyen acceso a Conversational AI, según se detalla en su página web de precios de API:

  • Gratuito: 0 $/mes, incluye 15 minutos, límite de 4 concurrencias, requiere atribución y no permite licencia comercial.
  • Starter: 5 $/mes (aproximadamente 4,60 €/mes), incluye 50 minutos, límite de 6 concurrencias.
  • Creator: 11 $/mes (aproximadamente 10,12 €/mes, con descuento desde 22 $/mes, unos 20,24 €/mes), incluye 250 minutos, límite de 6 concurrencias, ~0,12 $ por minuto adicional.
  • Pro: 99 $/mes (aproximadamente 91,08 €/mes), incluye 1.100 minutos, límite de 10 concurrencias, ~0,11 $ por minuto adicional.
  • Scale: 330 $/mes (aproximadamente 303,60 €/mes), incluye 3.600 minutos, límite de 20 concurrencias, ~0,10 $ por minuto adicional.
  • Business: 1.320 $/mes (aproximadamente 1.214,40 €/mes), incluye 13.750 minutos, límite de 30 concurrencias, ~0,096 $ por minuto adicional.

Una Nueva Era para las Interacciones de Voz Inteligentes

Como se afirma en el vídeo de presentación de la compañía, "El potencial de la IA conversacional nunca ha sido mayor. El momento de construir es ahora". Con Conversational AI 2.0, ElevenLabs tiene como objetivo proporcionar las herramientas y la infraestructura para que las empresas creen agentes de voz verdaderamente inteligentes y conscientes del contexto que eleven el estándar de las interacciones digitales.

Desde ElevenLabs animan a desarrolladores y organizaciones interesados en conocer más detalles a explorar su documentación, visitar el portal de desarrolladores o contactar con su equipo de ventas para descubrir cómo Conversational AI 2.0 puede mejorar sus experiencias de cliente. Este avance subraya la continua transformación que la inteligencia artificial está aportando a la forma en que interactuamos con la tecnología y entre nosotros.