DeepMind, la división de inteligencia artificial de Google, ha lanzado Veo2, un modelo de IA generativa de video que está causando sensación. Su capacidad para generar videos de hasta dos minutos de duración y con una resolución de hasta 4K DCI (4.096 x 2.160) lo coloca muy por encima de su competidor, Sora de OpenAI.

Un salto cualitativo en la generación de videos

Veo2 no solo supera a Sora en resolución y duración, sino que también muestra una notable mejora en la comprensión de la física y el control de la cámara. Esto se traduce en videos con texturas e imágenes más definidas, incluso en escenas con mucho movimiento. La capacidad de controlar el punto de vista de la cámara permite capturar objetos y personas desde diferentes ángulos, añadiendo una nueva dimensión a la experiencia visual.

Acceso y funcionalidades

Por el momento, Veo2 está disponible a través de Vertex AI en VideoFX, una herramienta experimental de Google. El acceso se realiza mediante lista de espera y, aunque la versión inicial ofrece videos de ocho segundos a 720p, la promesa de videos más largos y en mayor resolución es innegable.

Más allá del texto: imágenes como punto de partida

Veo2 permite generar videos a partir de prompts de texto, pero también es capaz de usar una imagen de referencia como punto de partida, añadiendo una capa extra de control creativo. La capacidad de integrar información visual en el proceso generativo amplia considerablemente las posibilidades de creación.

El realismo como objetivo

Si bien la coherencia y la consistencia siguen siendo un desafío, la comprensión mejorada de la física por parte de Veo2 se refleja en la generación de videos con fluidos, luz y sombras más realistas. Ejemplos como videos de personas comiendo espaguetis o cortando tomates demuestran el avance en el realismo y la fluidez de los movimientos generados.

La ventaja de YouTube

El acceso a la inmensa base de datos de videos de YouTube ha sido una ventaja clave para el entrenamiento de Veo2. Esta enorme cantidad de información visual ha contribuido significativamente al desarrollo de un modelo más potente y preciso.

Conclusión

Veo2 representa un gran avance en la generación de videos por IA, superando notablemente a Sora en varios aspectos. Si bien aún existen áreas de mejora, su potencial para revolucionar la creación de videos es evidente. El futuro de la generación de videos con IA se ve cada vez más prometedor.

Fuente: Xataka