Google ha anunciado importantes actualizaciones para su modelo de IA de generación de video Veo 2, que ahora permite a los usuarios dar instrucciones de dirección de cámara para crear secuencias con aspecto cinematográfico y editar metraje real. Estas nuevas capacidades, disponibles como vista previa a través de la plataforma Google Cloud's Vertex AI, forman parte de un conjunto más amplio de mejoras en las herramientas de IA generativa de la compañía.
Nuevas capacidades cinematográficas para Veo 2
Entre las funcionalidades más destacadas que se han añadido a Veo 2 se encuentra el "inpainting", que permite eliminar automáticamente "imágenes de fondo no deseadas, logotipos o distracciones de los videos", según explica la compañía. También se ha incorporado "outpainting", una función que extiende el marco del video original a un formato diferente, rellenando el nuevo espacio con metraje generado por IA que se fusiona con el clip original, de manera similar a la función Generative Expand de Adobe para imágenes.
La actualización también permite a los usuarios de Veo 2 seleccionar presets de técnicas cinematográficas para incluir junto con sus descripciones de texto al generar metraje. Estos ajustes preestablecidos pueden utilizarse para guiar la composición de planos, los ángulos de cámara y el ritmo en los resultados finales. Entre los ejemplos de presets se incluyen efectos de time-lapse, estilo de vista de dron y simulación de movimientos panorámicos de cámara en diferentes direcciones.
Otra novedad es una función de interpolación que puede crear una transición de video entre dos imágenes estáticas, completando las secuencias de principio y fin con nuevos fotogramas generados.
Cuando Veo 2 estira un video más allá de sus límites originales, el espacio vacío se rellena con metraje generado para que coincida con el original.
Competencia en el mercado de IA para video
El modelo de video Firefly de Adobe, competidor directo de Veo 2, cuenta con capacidades similares. De hecho, la semana pasada Adobe lanzó una función de extensión de video generativa en Premiere Pro.
Aunque ambas empresas utilizan sistemas de marcas de agua digitales para sus generaciones de IA (Google con SynthID y Adobe con su sistema Content Credentials), Adobe da un paso más allá al garantizar que sus herramientas son completamente seguras para uso comercial, ya que están entrenadas con contenido con licencia y de dominio público. Google, que ha "ingerido la web" para entrenar sus modelos de IA, no puede ofrecer la misma garantía.
Mejoras en otros modelos de IA de Google
Las capacidades de edición del modelo de texto a imagen Imagen 3 de Google también han sido actualizadas para "mejorar significativamente" la eliminación automática de objetos, según la compañía, proporcionando resultados más naturales al eliminar distracciones.
La eliminación de objetos en Imagen 3 ahora es menos propensa a distorsionar las características circundantes.
En el ámbito del audio, Google ha lanzado Lyria, su modelo de texto a música, en una vista previa privada, y ha implementado una función de "Voz Personalizada Instantánea" para su modelo de voz sintética, Chirp 3. Google afirma que Chirp 3 ahora puede generar "voces personalizadas realistas a partir de 10 segundos de entrada de audio". Además, se está lanzando una nueva función de transcripción que puede identificar y separar a hablantes individuales para proporcionar transcripciones más claras de llamadas con múltiples participantes.
Aplicaciones empresariales de las herramientas de IA
Tanto Veo 2 como Imagen 3 ya están siendo utilizados por empresas como L'Oreal y Kraft Heinz para la producción de contenido de marketing. Justin Thomas, líder de experiencia digital de Kraft Heinz, comentó que el tipo de tarea que "antes nos llevaba ocho semanas ahora solo toma ocho horas".
Esta dramática reducción en el tiempo de producción ilustra el potencial transformador que estas herramientas de IA tienen para los flujos de trabajo creativos y de marketing.
Otras actualizaciones de IA de Google
Estas mejoras son solo algunas de las múltiples novedades relacionadas con la IA que Google ha anunciado. Gemini 2.5 Flash, la última versión del modelo Flash optimizado para eficiencia de la compañía, pronto estará disponible en Vertex AI. Google afirma que Gemini 2.5 Flash "ajusta automáticamente el tiempo de procesamiento" según la complejidad de la tarea para proporcionar resultados más rápidos en solicitudes simples.
Google también está actualizando sus herramientas de IA centradas en empresas para permitir que los agentes de IA se comuniquen entre sí y realicen tareas en plataformas como PayPal y Salesforce. Paralelamente, se está lanzando una nueva sección en Google Cloud Marketplace para que las empresas examinen y compren agentes de IA creados por socios externos de Google.
Un ecosistema de IA en expansión
Con estas actualizaciones, Google continúa ampliando su ecosistema de herramientas de IA generativa, abarcando video, imagen, audio y texto. La competencia con Adobe y otros desarrolladores de herramientas creativas basadas en IA está impulsando innovaciones que permiten a los usuarios ejercer un control cada vez mayor sobre las generaciones de IA.
Mientras que las preocupaciones sobre la procedencia del material de entrenamiento y los derechos de autor siguen siendo relevantes, estas herramientas están encontrando rápidamente aplicaciones prácticas en entornos empresariales, donde pueden reducir significativamente los tiempos de producción y potencialmente transformar los flujos de trabajo creativos.
La capacidad de dar instrucciones de cámara a un modelo de IA representa un paso más hacia un futuro donde la producción audiovisual podría ser accesible a cualquiera con una idea clara, independientemente de sus habilidades técnicas o recursos disponibles.