Amazon Web Services (AWS) ha presentado Nova, una nueva familia de modelos de inteligencia artificial generativa que abarca capacidades de texto, imagen y video. El anuncio se realizó durante la conferencia re:Invent, donde la compañía reveló sus planes para competir en el creciente mercado de la IA generativa.
Una familia completa de modelos de IA
La nueva línea Nova incluye cuatro modelos principales para procesamiento de texto: Micro, Lite, Pro y Premier. Según anunció TechCrunch, tres de estos modelos (Micro, Lite y Pro) ya están disponibles para los clientes de AWS, mientras que Premier llegará a principios de 2025.
"Hemos continuado trabajando en nuestros propios modelos de frontera", explicó Andy Jassy, CEO de Amazon, durante la presentación. "Y esos modelos han logrado un progreso tremendo en los últimos cuatro o cinco meses. Pensamos que si nosotros encontrábamos valor en ellos, probablemente ustedes también lo encontrarían".
Características y capacidades
Cada modelo de la familia Nova tiene características específicas:
- Micro: Especializado en procesamiento rápido de texto, con la menor latencia del grupo
- Lite: Procesa texto, imagen y video con velocidad moderada
- Pro: Ofrece un equilibrio entre precisión, velocidad y coste
- Premier: El más avanzado, diseñado para tareas complejas
Los modelos están optimizados para 15 idiomas, con especial énfasis en inglés. En cuanto a su capacidad de procesamiento, Micro puede manejar hasta 128.000 tokens (aproximadamente 100.000 palabras), mientras que Lite y Pro alcanzan los 300.000 tokens (equivalente a 225.000 palabras o 30 minutos de metraje).
Nova Canvas y Nova Reel: La apuesta por los medios visuales
Además de los modelos de texto, AWS ha presentado dos herramientas especializadas:
- Nova Canvas: Permite generar y editar imágenes mediante instrucciones de texto, incluyendo funciones como eliminación de fondos y control sobre esquemas de color
- Nova Reel: Genera videos de hasta seis segundos a partir de texto o imágenes de referencia, con capacidad para añadir movimientos de cámara y efectos
Según AWS, una versión futura de Reel podrá crear videos de hasta dos minutos de duración.
Seguridad y responsabilidad
La compañía ha puesto especial énfasis en la seguridad y el uso responsable de estos modelos. Jassy destacó que tanto Canvas como Reel incluyen "controles integrados" para un uso responsable, incluyendo marcas de agua y moderación de contenido.
AWS ha explicado en su blog oficial que Nova incorpora medidas de seguridad para combatir la desinformación y otros riesgos potenciales, aunque los detalles específicos de estas medidas no han sido revelados.
Planes futuros
Amazon ya tiene la vista puesta en el futuro de Nova. Para el primer trimestre de 2025, la compañía planea lanzar un modelo de voz a voz que podrá interpretar señales verbales y no verbales. Además, para mediados de 2025, prevén presentar un modelo "any-to-any" capaz de transformar cualquier tipo de entrada (texto, voz, imagen o video) en cualquier otro formato.
"Este es el futuro de cómo se construirán y consumirán los modelos de frontera", afirmó Jassy sobre el próximo modelo any-to-any, señalando el ambicioso camino que Amazon planea seguir en el desarrollo de la IA generativa.