Probé Gemini Omni, la nueva IA de videos de Google (reseña honesta + prompt que usé)

Tabla de contenidos
Probé Gemini Omni, la nueva IA de videos de Google, y esta es mi honesta opinión

Tabla de contenidos

¿Qué pasaría si pudieras editar un video simplemente describiendo con palabras lo que quieres cambiar, paso a paso, sin romper la escena? Eso es exactamente lo que promete Gemini Omni, la nueva IA de videos de Google que acaba de salir, y en este artículo te explico todo lo que trae, cómo funciona y si realmente vale la pena.

¿Qué es Gemini Omni?

Google lo describió muy bien en su blog oficial: Gemini Omni es el modelo donde la capacidad de razonamiento de Gemini se fusiona con su capacidad de crear. No es solo un generador de clips desde cero. Es un sistema que entiende contexto, física, historia y cultura para producir videos coherentes y creíbles.

La primera versión que ya está disponible se llama Gemini Omni Flash, y es el punto de arranque de toda una familia de modelos Omni que Google planea expandir próximamente con soporte para imágenes y audio como salidas adicionales. Piénsalo como el iPhone 1 de la generación de video con IA de Google: impresionante por sí solo, pero apenas el comienzo.

El Nano Banana para video

¿Te suena Nano Banana? Ese generador de imágenes de Google que en agosto de 2025 sumó 13 millones de usuarios en apenas cuatro días y llegó a generar más de 5,000 millones de imágenes. Google DeepMind pide que pienses en Gemini Omni exactamente así, pero para video.

Y tiene mucho sentido. Nano Banana democratizó la creación de imágenes con IA a gran escala. Omni quiere hacer lo mismo con el video, que históricamente ha sido mucho más difícil de generar porque involucra movimiento, tiempo, física y continuidad de personajes.

¿Qué lo diferencia de Veo 3.1 y otros modelos de video de Google?

Aquí es donde se pone interesante. Google ya tenía Veo 3.1, su modelo de generación de video que permite, por ejemplo, convertir fotos en clips verticales listos para TikTok o Instagram Shorts. Entonces, ¿por qué necesitamos Omni?

La diferencia clave está en el enfoque:

CaracterísticaVeo 3.1Gemini Omni Flash
Generación desde cero✅ Sí✅ Sí
Edición conversacional encadenada❌ No✅ Sí
Razonamiento contextual integradoLimitado✅ Nativo con Gemini
Consistencia de personajes entre ediciones❌ No✅ Sí
Física y continuidad de escenaBásico✅ Mejorado
Soporte multimodal de entrada (imagen + audio + video + texto)Parcial✅ Completo

Dicho de forma simple: Veo 3.1 es excelente para generar un clip rápido. Omni es para cuando quieres tener una conversación con la IA sobre tu video, refinarlo en múltiples pasos y mantener todo coherente de principio a fin.

Las 4 funciones que más me llamaron la atención de Omni

1. Edición por conversación encadenada

Esta es, sin duda, la función estrella. Puedes darle instrucciones una tras otra y cada nueva instrucción se construye sobre la anterior sin romper la escena: los personajes siguen siendo los mismos, las leyes físicas se respetan y la escena «recuerda» lo que pasó antes. Ideal también para editar videos ya existentes.

2. Física mucho más realista

Omni tiene una comprensión mejorada de fuerzas como la gravedad, la energía cinética y la dinámica de fluidos. Esto no suena glamoroso, pero en la práctica hace una diferencia enorme: los objetos se caen como deben caerse, el agua fluye con sentido, y las escenas no se ven «raras» de esa forma típica que delata a los videos generados con IA.

3. Entradas combinadas: imagen + audio + video + texto

Puedes alimentar a Omni con una foto tuya, un clip de referencia de movimiento, un audio y un prompt de texto, y él construye algo coherente con todo eso. Por ejemplo: tomar el movimiento de una ballena nadando y aplicarlo sobre una imagen de material reflectante, sin mostrar la ballena. ¿

4. Tu propio avatar digital

Una de las funciones más llamativas (y que Google está manejando con cuidado): puedes crear una versión digital de ti mismo para generar videos que se vean y suenen como tú. Por ahora solo funciona con voz propia, y las funciones de cambio de audio de terceros aún están en revisión por razones de uso responsable.

¿Dónde y cómo puedo usarlo?

Aquí va la información práctica que sé que te interesa:

  • Suscriptores de Google AI Pro y Ultra: ya tienen acceso desde el 20 de mayo de 2026 a través de la app de Gemini y Google Flow
  • YouTube Shorts y YouTube Create App: disponible gratis esta misma semana
  • Desarrolladores y empresas: acceso vía API en las próximas semanas

Aunque los límites de generación son bastante ajustados en esta primera fase. No me sorprende, crear video con IA consume muchísimos recursos de cómputo, pero es algo que debes tener en cuenta si piensas usarlo intensamente desde el principio.

El contexto que lo hace más relevante: Sora se fue

No puedo cerrar este artículo sin mencionar el elefante en la sala: Sora, el generador de videos de OpenAI, dejó de estar disponible como web y app a finales de abril de 2026. Su API sigue activa hasta septiembre, pero el producto de cara al usuario ya no existe.

Esto deja un espacio enorme que Google, con Gemini Omni, claramente está apuntando a ocupar. Y con la ventaja de que Omni no es solo un generador aislado, sino que vive dentro del ecosistema de Gemini, Google Flow y YouTube, plataformas que ya usas todos los días.

Ahora sí, a lo que viniste: Cómo crear un video con Gemini Omni + mi honesta opinión

Usar Omni es bastante simple, así que vamos al grano. Lo primero, debes contar con una cuenta Pro o Ultra para poder acceder a esta nueva funcionalidad dentro de Gemini.

Si ya tienes una cuenta de pago, el siguiente paso es ir a Gemini, como haces de costumbre para conversar con la IA. En el menú, selecciona la opción «Crear video». Gemini cargará una variedad de opciones de modelo de video. Elige la que quieras usar o simplemente escribe el prompt para tu video y listo.

Para esta prueba, usé una imagen referencial y un prompt que ya había usado para generar un video hiperrealista con Seedance y este fue el resultado:

No elegí ninguna de las opciones creativas que ofrece Omni, simplemente subí la foto de referencia, que también fue creada con IA y aquí puedes ver cómo lo hice, escribí el prompt y esperé el resultado.

Algo que noté, es que aunque es bastante rápido y práctico, no permite ajustar manualmente el tiempo del video. Si no lo especificas en el prompt, lo hará tan corto como quiera.

Un gran punto a favor, es que agregó voz y un diálogo acorde al contexto, aunque no se lo indiqué en el prompt, lo que hace el video más realista.

Ciertamente, hay cosas que pueden mejorar, pero ten en cuenta que este es un ejemplo rápido. No usé un prompt muy producido ni para una escena cinematográfica, simplemente describí la acción que quería que animara y listo.

El prompt que usé para generar este clip lo encuentras al final de este artículo.

Mi honesta opinión

Gemini Omni Flash es impresionante para ser una primera versión.

¿Tiene limitaciones? Sí: los límites de uso son estrictos por ahora y la edición de voces de terceros aún no está disponible. Pero como punto de partida para lo que Google promete construir con esta familia de modelos Omni, el debut es muy sólido.

Si creas contenido para YouTube Shorts, si eres creador de reels, si haces presentaciones en video o simplemente quieres experimentar con la IA de videos de Google más avanzada hasta la fecha, este es el momento de entrar.

¿Te gusta este contenido? Hemos creado una guía de las mejores IAs para crear videos que te puede interesar. Síguenos en @SimplificaConIA para más.

Simplifica con IA

En Simplifica con IA no solo escribimos, experimentamos. Aquí encontrarás bibliotecas de prompts, herramientas de IA pensadas y creadas para ti, y soluciones reales para sacar el máximo provecho a la inteligencia artificial.

Prompts Listos para Usar

Copia estos prompts y úsalos directamente en tu herramienta de IA favorita

Crear video con Gemini Omni

A fit young woman performing
a barbell back squat in a modern gym with dumbbells racks in the
background. She descends slowly into a deep squat and comes back up
with controlled movement. Shot handheld by a person standing a few
feet away at a slight angle, slightly shaky and casual, as if a friend
is recording her. Natural gym lighting with overhead fluorescent lights.
Realistic skin texture, subtle sweat on skin. Cinematic but raw,
documentary-style. 5 seconds, 24fps. No camera cuts, single continuous shot.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Otros artículos interesantes