Google DeepMind ha dado un paso significativo en la carrera por el dominio de la generación de vídeos con inteligencia artificial al anunciar Veo 2, un modelo que promete superar las capacidades de Sora, el reciente lanzamiento de OpenAI, según informa TechCrunch.
Características revolucionarias
La nueva herramienta de Google destaca por su capacidad para crear vídeos de más de dos minutos de duración en resolución 4K (4096 x 2160 píxeles), superando teóricamente las especificaciones de Sora. Sin embargo, en su implementación inicial a través de VideoFX, la plataforma experimental de Google, los vídeos están limitados a 720p y ocho segundos de duración.
Eli Collins, vicepresidente de producto en DeepMind, explicó a TechCrunch que "continuaremos iterando según los comentarios de los usuarios" y adelantó que Veo 2 estará disponible próximamente en la plataforma Vertex AI de Google para desarrolladores.
Mejoras técnicas significativas
Veo 2 introduce importantes avances en varios aspectos:
- Mejor comprensión de la física y controles de cámara
- Mayor nitidez en las texturas e imágenes
- Representación más realista de movimientos y dinámicas de fluidos
- Capacidad mejorada para efectos cinematográficos
- Mayor precisión en expresiones humanas
Retos y limitaciones
A pesar de los avances, el sistema aún enfrenta desafíos importantes. Collins reconoció que "la coherencia y consistencia son áreas de mejora", especialmente en la adherencia a instrucciones complejas durante períodos prolongados y en la consistencia de los personajes.
Seguridad y aspectos legales
DeepMind ha implementado medidas de seguridad importantes:
- Filtros a nivel de instrucciones para contenido violento, gráfico y explícito
- Tecnología de marca de agua SynthID
- Herramientas para que los administradores web bloqueen la extracción de datos de entrenamiento
Sin embargo, la empresa enfrenta debates sobre derechos de autor, ya que mantiene que el entrenamiento con datos públicos constituye "uso justo", una posición que ha generado controversia en la comunidad creativa.
Colaboración con artistas
La empresa ha trabajado con creadores reconocidos como Donald Glover, The Weeknd y d4vd desde el inicio del desarrollo de Veo, buscando comprender mejor el proceso creativo y cómo la tecnología puede potenciar la visión artística.
Actualización simultánea de Imagen 3
Junto con Veo 2, Google DeepMind ha anunciado mejoras en Imagen 3, su modelo de generación de imágenes. La actualización incluye mejor composición, mayor fidelidad a las instrucciones y capacidad para crear imágenes en diversos estilos artísticos.
Disponibilidad
VideoFX, la herramienta que incorpora Veo 2, está actualmente disponible mediante lista de espera, aunque Google ha anunciado que ampliará el acceso esta semana. La empresa planea integrar gradualmente las capacidades de Veo 2 en diferentes productos del ecosistema Google durante el próximo año.
Este lanzamiento representa un avance significativo en la generación de vídeo mediante IA, aunque el impacto real de estas tecnologías en la industria creativa está aún por verse, especialmente considerando las preocupaciones sobre derechos de autor y el potencial desplazamiento de trabajos en la industria del entretenimiento.