Gemini Omni: la filtración que revela la nueva IA de Google para crear videos hiperrealistas con texto

Una filtración en Gemini anticipa la llegada de Omni, el nuevo modelo de inteligencia artificial de Google enfocado en la generación y edición de video hiperrealista. La herramienta promete crear escenas complejas a partir de texto y reaviva el debate sobre el impacto de la IA en la industria audiovisual y los derechos de autor.

Por: Redacción de ITSitio
19 de mayo 2026

Inteligencia Artificial

Compartir nota:

Una nueva filtración volvió a poner a Google en el centro de la conversación sobre inteligencia artificial generativa. En las últimas horas comenzaron a circular reportes sobre Gemini Omni, un supuesto modelo de IA enfocado en la creación y edición avanzada de video que podría integrarse directamente en la plataforma Gemini.

De acuerdo con la información publicada por medios especializados, Omni sería una evolución de Veo, el sistema de generación de video presentado anteriormente por Google. Sin embargo, las primeras pruebas filtradas indican que la compañía buscaría dar un salto importante en realismo, edición multimedia y comprensión de instrucciones complejas.

La filtración fue detectada inicialmente por un usuario de Reddit identificado como “Zacatac_391”, quien aseguró haber recibido una notificación dentro de la aplicación de Gemini invitándolo a probar una nueva herramienta de video basada en IA. Las capturas compartidas muestran funciones que permitirían editar clips mediante texto, remezclar contenido existente y generar escenas completas desde cero utilizando plantillas sugeridas por el sistema.

Gemini Omni: videos hiperrealistas creados con texto

Los primeros reportes indican que Gemini Omni estaría diseñado para producir videos hiperrealistas con audio integrado a partir de simples descripciones escritas o incluso mediante conjuntos de imágenes estáticas. La propuesta recuerda a otras herramientas del mercado, aunque con mejoras que apuntarían a resolver algunos de los principales problemas de los modelos actuales.

Entre las capacidades mencionadas aparecen una mejor continuidad entre escenas, reflejos más precisos, iluminación natural y la posibilidad de generar texto legible dentro de los videos, un desafío técnico que todavía afecta a muchos sistemas de IA generativa.

Las pruebas compartidas por el usuario que filtró la herramienta sorprendieron especialmente por el nivel de detalle interpretado por el modelo. En uno de los ejemplos, Omni habría generado un video de un profesor resolviendo identidades trigonométricas en una pizarra mientras explicaba cada paso de la ecuación.

Google buscaría mejorar aspectos clave como iluminación, continuidad entre escenas y generación de texto dentro de los videos.

El segundo caso mostró una escena mucho más compleja: dos hombres sentados en la terraza de un restaurante elegante frente al mar, conversando mientras comían un plato de espaguetis. La descripción incluía detalles específicos sobre la apariencia de los personajes, la ambientación, la vestimenta y los movimientos durante la conversación. Según las publicaciones, el resultado respetó con gran precisión las instrucciones enviadas al chatbot.

Este tipo de demostraciones refleja cómo la industria de IA avanza hacia modelos capaces de comprender prompts cada vez más extensos y cinematográficos, acercándose a producciones audiovisuales de alta calidad generadas automáticamente.

Google acelera la competencia en IA generativa

La posible llegada de Gemini Omni también refuerza la competencia entre las grandes tecnológicas por liderar el mercado de generación de contenido multimedia mediante inteligencia artificial.

En los últimos meses, compañías como OpenAI, Meta y Adobe aceleraron el desarrollo de herramientas capaces de producir imágenes, audio y video con un alto grado de realismo.

En ese contexto, Google parece decidido a convertir Gemini en un ecosistema integral de productividad y creación multimedia. La integración de Omni dentro de Gemini permitiría que los usuarios trabajen directamente desde el chatbot para generar contenido audiovisual sin recurrir a plataformas externas.

Además, la filtración llega en un momento clave para la compañía, ya que distintos reportes especulan con que Omni podría ser presentado oficialmente durante la próxima edición de Google I/O 2026, el evento anual para desarrolladores de Google programado para el 19 y 20 de mayo.

El debate sobre derechos de autor y trabajo creativo

El avance de herramientas como Gemini Omni también vuelve a encender la discusión sobre el impacto de la inteligencia artificial en la industria audiovisual y el trabajo creativo.

Empresas como Disney y Netflix ya utilizan tecnologías de IA para optimizar procesos internos, personalizar recomendaciones y fortalecer estrategias de marketing. Sin embargo, actores, guionistas y profesionales del sector advierten que estas herramientas podrían reducir oportunidades laborales y transformar radicalmente la producción de contenidos.

La tensión aumentó aún más tras varias disputas judiciales vinculadas al entrenamiento de modelos generativos. En 2025, Disney y Universal Pictures iniciaron acciones legales contra Midjourney, acusando a la plataforma de generar copias derivadas de obras protegidas por derechos de autor. Más recientemente, Warner Bros. Discovery también presentó reclamos similares.

En paralelo, surgieron cuestionamientos sobre el uso de contenido de YouTube para entrenar modelos de IA de Google. Un informe reciente reveló que la compañía habría utilizado parte de la enorme biblioteca de videos de la plataforma para mejorar sistemas como Gemini y Veo 3.

Desde Google sostienen que solo se utiliza “una parte” del contenido disponible y que existen acuerdos específicos con creadores y medios para proteger la propiedad intelectual. Sin embargo, distintos creadores digitales afirmaron no haber sido informados sobre estas prácticas ni sobre los convenios mencionados por la empresa.

Qué se sabe hasta ahora sobre Gemini Omni

Por el momento, Google no confirmó oficialmente la existencia de Gemini Omni ni brindó detalles técnicos sobre sus capacidades, fecha de lanzamiento o mecanismos de seguridad. Aun así, la filtración alimentó las expectativas alrededor de una tecnología que podría marcar un nuevo paso en la evolución de la generación de video con inteligencia artificial.

De concretarse su lanzamiento, Omni podría convertirse en una de las herramientas más avanzadas del mercado para creación audiovisual automatizada, consolidando a Google como uno de los principales actores de la nueva carrera por dominar la IA generativa multimedia.

Preguntas frecuentes

1. ¿Qué diferencia habría entre Gemini Omni y otros generadores de video con IA?

A diferencia de otras plataformas que se enfocan únicamente en crear clips cortos, Gemini Omni apuntaría a integrar generación, edición y remezcla de video dentro de un mismo entorno. Además, podría aprovechar el ecosistema de herramientas de Google para combinar texto, imágenes, audio y automatización en tiempo real.

2. ¿Qué industrias podrían beneficiarse con una tecnología como Gemini Omni?

La generación avanzada de video con IA podría impactar en sectores como publicidad, educación, cine, videojuegos, e-commerce y marketing digital. También permitiría a pequeñas empresas producir contenido audiovisual profesional con costos mucho más bajos.

3. ¿Qué es un video hiperrealista generado por inteligencia artificial?

Se trata de contenido audiovisual creado por modelos de IA capaces de simular movimientos humanos, iluminación, voces y escenarios con un nivel de detalle muy cercano al de una grabación real. Estas tecnologías utilizan redes neuronales entrenadas con grandes volúmenes de datos multimedia.

4. ¿Qué riesgos genera el avance de este tipo de IA?

Uno de los principales riesgos es la creación de deepfakes o videos falsos extremadamente realistas. Esto podría facilitar campañas de desinformación, fraudes digitales o suplantación de identidad, especialmente en redes sociales y plataformas de video.

5. ¿Cómo podrían detectarse videos creados con IA?

Las empresas tecnológicas trabajan en sistemas de marcas de agua digitales, metadatos invisibles y herramientas de autenticación para identificar contenido generado artificialmente. Sin embargo, expertos advierten que detectar videos creados con IA será cada vez más difícil.

Leer más

Compartir nota:

Redacción de ITSitio

Ver Publicaciones

Gemini

Gemini Omni: la filtración que revela la nueva IA de Google para crear videos hiperrealistas con texto

Gemini Omni: videos hiperrealistas creados con texto

Google acelera la competencia en IA generativa

El debate sobre derechos de autor y trabajo creativo

Qué se sabe hasta ahora sobre Gemini Omni

Preguntas frecuentes

Leer más

Redacción de ITSitio

Publicaciones Relacionadas

Meta transforma su asistente de IA: ahora puede planificar, investigar y ejecutar tareas de forma autónoma

Claude renueva su modo de voz: Anthropic suma más inteligencia e integraciones con Gmail y Slack

OpenAI investiga cómo dos modelos de inteligencia artificial accedieron a Hugging Face

Suscríbete a nuestro newsletter

Lo más leído de Inteligencia Artificial

Publicaciones Relacionadas

Meta transforma su asistente de IA: ahora puede planificar, investigar y ejecutar tareas de forma autónoma

Claude renueva su modo de voz: Anthropic suma más inteligencia e integraciones con Gmail y Slack

OpenAI investiga cómo dos modelos de inteligencia artificial accedieron a Hugging Face

AMD apuesta a fortalecer al ecosistema como la clave de la próxima etapa de la inteligencia artificial

AMD apuesta por la IA física: presenta una plataforma abierta para acelerar la próxima generación de robots inteligentes

AMD presenta ROCm.ai: la apuesta para que la IA también programe, optimice y despliegue inteligencia artificial

AMD desafía a Nvidia con Helios: promete hasta un 30% más tokens por dólar para impulsar la próxima generación de IA

La inteligencia artificial ya domina los estrenos en Deezer

La inversión en Inteligencia Artificial crece, pero pocos proyectos llegan a producción