Stability AI ha lanzado "Stable Audio Open Small", un nuevo modelo de inteligencia artificial capaz de generar audio en dispositivos móviles sin necesidad de conexión a internet. Este modelo, que la empresa describe como "estéreo", se presenta como el más rápido del mercado y destaca por su eficiencia para funcionar directamente en teléfonos inteligentes.
Un modelo optimizado para dispositivos móviles
El nuevo producto es fruto de la colaboración entre Stability AI y Arm, el fabricante de chips que produce gran parte de los procesadores utilizados en tablets, teléfonos y otros dispositivos móviles. Con un tamaño de 341 millones de parámetros y optimizado específicamente para CPUs Arm, Stable Audio Open Small está diseñado para generar rápidamente muestras cortas de audio y efectos sonoros, como fragmentos de batería y riffs de instrumentos.
Según afirma la compañía, el modelo puede producir hasta 11 segundos de audio en menos de 8 segundos ejecutándose directamente en un smartphone. Esta capacidad marca una diferencia importante respecto a otras aplicaciones de generación de audio mediante IA, como Suno y Udio, que dependen del procesamiento en la nube y no pueden utilizarse sin conexión a internet.
Una diferencia legal significativa
Uno de los aspectos más destacables del nuevo modelo es su conjunto de entrenamiento. Stability AI asegura que Stable Audio Open Small ha sido entrenado exclusivamente con canciones provenientes de bibliotecas de audio libres de regalías, específicamente Free Music Archive y Freesound.
Este punto resulta particularmente relevante en comparación con competidores como Suno y Udio, cuyos conjuntos de entrenamiento supuestamente contienen contenido con derechos de autor, lo que plantea riesgos legales relacionados con la propiedad intelectual.
Limitaciones y restricciones
A pesar de sus ventajas, Stable Audio Open Small presenta algunas limitaciones importantes. El modelo solo admite comandos en inglés y, según reconoce la propia Stability en su documentación, no puede generar voces realistas ni canciones de alta calidad. Además, no funciona con la misma eficacia en todos los estilos musicales, una consecuencia del sesgo occidental de sus datos de entrenamiento.
En cuanto a las condiciones de uso, el modelo es gratuito para investigadores, aficionados y empresas con ingresos anuales inferiores a 1 millón de dólares (aproximadamente 920.000 euros). Sin embargo, los desarrolladores y organizaciones que superen esa cifra de ingresos deberán adquirir la licencia empresarial de Stability.
Cambios recientes en Stability AI
Este lanzamiento se produce en un momento de transformación para Stability AI, la empresa conocida por desarrollar el popular modelo de generación de imágenes Stable Diffusion. Tras atravesar dificultades financieras, la compañía recibió nueva financiación el año pasado de inversores como Eric Schmidt y Sean Parker, fundador de Napster, quienes buscaban dar un nuevo rumbo al negocio.
Según informes, Emad Mostaque, cofundador y ex-CEO de Stability, habría llevado a la empresa a una situación financiera crítica, provocando la dimisión de personal, el fracaso de una asociación con Canva y la preocupación de los inversores sobre el futuro de la compañía.
Renovación empresarial
En los últimos meses, Stability AI ha emprendido diversas acciones para reorientarse. Entre ellas destacan la contratación de un nuevo CEO, el nombramiento del cineasta James Cameron como miembro de su consejo de administración y el lanzamiento de varios modelos nuevos de generación de imágenes.
La presentación de Stable Audio Open Small supone un paso más en esta estrategia de renovación, ampliando su oferta hacia el terreno de la generación de audio y aprovechando las ventajas del procesamiento local en dispositivos móviles.
Un mercado en evolución
Este lanzamiento refleja una tendencia creciente en el sector de la IA: la migración de modelos complejos desde los servidores en la nube hacia los dispositivos del usuario final. Esta evolución permite mayor privacidad, funcionamiento sin conexión y respuestas más rápidas, aspectos cada vez más valorados por los usuarios.
Al mismo tiempo, la preocupación por los derechos de autor en el entrenamiento de modelos de IA se ha convertido en un tema central para la industria. La decisión de Stability AI de utilizar exclusivamente contenido libre de derechos podría representar una ventaja competitiva significativa en un momento en que varias empresas del sector enfrentan demandas por violación de propiedad intelectual.
Stable Audio Open Small representa un avance interesante en la democratización de las herramientas de IA generativa, permitiendo que más usuarios puedan crear contenido de audio sin depender de conexiones a internet o potentes ordenadores. Sin embargo, sus limitaciones actuales sugieren que todavía queda camino por recorrer antes de que estos modelos puedan igualar la calidad y versatilidad de las soluciones basadas en la nube.