Sorpresa: ¡Google supera a OpenAI en la generación de video con su IA Veo 2!

La IA de video de Google, Veo 2, deja atrás a Sora de OpenAI

DeepMind, la división de IA de Google, ha lanzado Veo 2, un nuevo modelo de generación de video por IA que está superando las expectativas y dejando atrás a su competidor directo, Sora de OpenAI. Veo 2 ofrece clips de vídeo de hasta dos minutos con una resolución de hasta 4K DCI (4.096 x 2.160), cuatro veces superior a la resolución de Sora y seis veces superior en duración. Esta significativa mejora en la calidad y duración del video generado marca un hito importante en el campo de la inteligencia artificial generativa.

Características destacadas de Veo 2

Veo 2 no solo destaca por su resolución y duración, sino también por su capacidad de generar videos a partir de prompts de texto e imágenes de referencia. Pero lo más innovador es su comprensión mejorada de la física y los controles de cámara, lo que resulta en videos más realistas y definidos, especialmente en escenas con mucho movimiento. El control de la cámara permite capturar objetos y personas desde diversos ángulos, añadiendo una mayor versatilidad a la herramienta.

Acceso y limitaciones

Por el momento, Veo 2 está disponible exclusivamente a través de Vertex AI en VideoFX, una herramienta experimental de Google. Su acceso se realiza mediante una lista de espera, y en esta fase inicial, la duración de los videos está limitada a ocho segundos en resolución 720p. En contraste, Sora genera videos de hasta 20 segundos en 1080p.

¿Una ventaja de YouTube?

El acceso a la inmensa base de datos de videos de YouTube podría haber sido clave en el entrenamiento de Veo 2. Google ha insinuado previamente el uso de datos de YouTube en modelos anteriores, y esta ventaja podría explicar el superior desempeño de Veo 2 en comparación con Sora.

Retos y futuro

A pesar de sus impresionantes capacidades, Veo 2 aún enfrenta desafíos en la coherencia y consistencia de los videos generados, especialmente en la preservación de las características faciales de los personajes a lo largo del video. Sin embargo, las demostraciones presentadas indican un progreso significativo en comparación con Sora. La mejor comprensión de la física, en particular en la representación de fluidos y efectos de luz y sombra, hace que los videos generados por Veo 2 sean notablemente más realistas.

Conclusión

Con sus capacidades superiores en resolución, duración y realismo, Veo 2 representa un salto cualitativo en la generación de video por IA. Si bien aún existen áreas de mejora, la tecnología de DeepMind está marcando un nuevo estándar en este campo. La fácil integración con Vertex AI y la potencial ventaja del acceso a la enorme biblioteca de videos de YouTube posicionan a Google como un líder en el desarrollo de IA generativa de video.

Fuente: Xataka