Una nueva filtración volvió a poner a Google en el centro de la conversación sobre inteligencia artificial generativa. En las últimas horas comenzaron a circular reportes sobre Gemini Omni, un supuesto modelo de IA enfocado en la creación y edición avanzada de video que podría integrarse directamente en la plataforma Gemini.
De acuerdo con la información publicada por medios especializados, Omni sería una evolución de Veo, el sistema de generación de video presentado anteriormente por Google. Sin embargo, las primeras pruebas filtradas indican que la compañía buscaría dar un salto importante en realismo, edición multimedia y comprensión de instrucciones complejas.
La filtración fue detectada inicialmente por un usuario de Reddit identificado como “Zacatac_391”, quien aseguró haber recibido una notificación dentro de la aplicación de Gemini invitándolo a probar una nueva herramienta de video basada en IA. Las capturas compartidas muestran funciones que permitirían editar clips mediante texto, remezclar contenido existente y generar escenas completas desde cero utilizando plantillas sugeridas por el sistema.
Gemini Omni: videos hiperrealistas creados con texto
Los primeros reportes indican que Gemini Omni estaría diseñado para producir videos hiperrealistas con audio integrado a partir de simples descripciones escritas o incluso mediante conjuntos de imágenes estáticas. La propuesta recuerda a otras herramientas del mercado, aunque con mejoras que apuntarían a resolver algunos de los principales problemas de los modelos actuales.
Entre las capacidades mencionadas aparecen una mejor continuidad entre escenas, reflejos más precisos, iluminación natural y la posibilidad de generar texto legible dentro de los videos, un desafío técnico que todavía afecta a muchos sistemas de IA generativa.
Las pruebas compartidas por el usuario que filtró la herramienta sorprendieron especialmente por el nivel de detalle interpretado por el modelo. En uno de los ejemplos, Omni habría generado un video de un profesor resolviendo identidades trigonométricas en una pizarra mientras explicaba cada paso de la ecuación.
El segundo caso mostró una escena mucho más compleja: dos hombres sentados en la terraza de un restaurante elegante frente al mar, conversando mientras comían un plato de espaguetis. La descripción incluía detalles específicos sobre la apariencia de los personajes, la ambientación, la vestimenta y los movimientos durante la conversación. Según las publicaciones, el resultado respetó con gran precisión las instrucciones enviadas al chatbot.
Este tipo de demostraciones refleja cómo la industria de IA avanza hacia modelos capaces de comprender prompts cada vez más extensos y cinematográficos, acercándose a producciones audiovisuales de alta calidad generadas automáticamente.
Google acelera la competencia en IA generativa
La posible llegada de Gemini Omni también refuerza la competencia entre las grandes tecnológicas por liderar el mercado de generación de contenido multimedia mediante inteligencia artificial.
En los últimos meses, compañías como OpenAI, Meta y Adobe aceleraron el desarrollo de herramientas capaces de producir imágenes, audio y video con un alto grado de realismo.
En ese contexto, Google parece decidido a convertir Gemini en un ecosistema integral de productividad y creación multimedia. La integración de Omni dentro de Gemini permitiría que los usuarios trabajen directamente desde el chatbot para generar contenido audiovisual sin recurrir a plataformas externas.
Además, la filtración llega en un momento clave para la compañía, ya que distintos reportes especulan con que Omni podría ser presentado oficialmente durante la próxima edición de Google I/O 2026, el evento anual para desarrolladores de Google programado para el 19 y 20 de mayo.
El debate sobre derechos de autor y trabajo creativo
El avance de herramientas como Gemini Omni también vuelve a encender la discusión sobre el impacto de la inteligencia artificial en la industria audiovisual y el trabajo creativo.
Empresas como Disney y Netflix ya utilizan tecnologías de IA para optimizar procesos internos, personalizar recomendaciones y fortalecer estrategias de marketing. Sin embargo, actores, guionistas y profesionales del sector advierten que estas herramientas podrían reducir oportunidades laborales y transformar radicalmente la producción de contenidos.
La tensión aumentó aún más tras varias disputas judiciales vinculadas al entrenamiento de modelos generativos. En 2025, Disney y Universal Pictures iniciaron acciones legales contra Midjourney, acusando a la plataforma de generar copias derivadas de obras protegidas por derechos de autor. Más recientemente, Warner Bros. Discovery también presentó reclamos similares.
En paralelo, surgieron cuestionamientos sobre el uso de contenido de YouTube para entrenar modelos de IA de Google. Un informe reciente reveló que la compañía habría utilizado parte de la enorme biblioteca de videos de la plataforma para mejorar sistemas como Gemini y Veo 3.
Desde Google sostienen que solo se utiliza “una parte” del contenido disponible y que existen acuerdos específicos con creadores y medios para proteger la propiedad intelectual. Sin embargo, distintos creadores digitales afirmaron no haber sido informados sobre estas prácticas ni sobre los convenios mencionados por la empresa.
Qué se sabe hasta ahora sobre Gemini Omni
Por el momento, Google no confirmó oficialmente la existencia de Gemini Omni ni brindó detalles técnicos sobre sus capacidades, fecha de lanzamiento o mecanismos de seguridad. Aun así, la filtración alimentó las expectativas alrededor de una tecnología que podría marcar un nuevo paso en la evolución de la generación de video con inteligencia artificial.
De concretarse su lanzamiento, Omni podría convertirse en una de las herramientas más avanzadas del mercado para creación audiovisual automatizada, consolidando a Google como uno de los principales actores de la nueva carrera por dominar la IA generativa multimedia.
Preguntas frecuentes
1. ¿Qué diferencia habría entre Gemini Omni y otros generadores de video con IA?
A diferencia de otras plataformas que se enfocan únicamente en crear clips cortos, Gemini Omni apuntaría a integrar generación, edición y remezcla de video dentro de un mismo entorno. Además, podría aprovechar el ecosistema de herramientas de Google para combinar texto, imágenes, audio y automatización en tiempo real.
2. ¿Qué industrias podrían beneficiarse con una tecnología como Gemini Omni?
La generación avanzada de video con IA podría impactar en sectores como publicidad, educación, cine, videojuegos, e-commerce y marketing digital. También permitiría a pequeñas empresas producir contenido audiovisual profesional con costos mucho más bajos.
3. ¿Qué es un video hiperrealista generado por inteligencia artificial?
Se trata de contenido audiovisual creado por modelos de IA capaces de simular movimientos humanos, iluminación, voces y escenarios con un nivel de detalle muy cercano al de una grabación real. Estas tecnologías utilizan redes neuronales entrenadas con grandes volúmenes de datos multimedia.
4. ¿Qué riesgos genera el avance de este tipo de IA?
Uno de los principales riesgos es la creación de deepfakes o videos falsos extremadamente realistas. Esto podría facilitar campañas de desinformación, fraudes digitales o suplantación de identidad, especialmente en redes sociales y plataformas de video.
5. ¿Cómo podrían detectarse videos creados con IA?
Las empresas tecnológicas trabajan en sistemas de marcas de agua digitales, metadatos invisibles y herramientas de autenticación para identificar contenido generado artificialmente. Sin embargo, expertos advierten que detectar videos creados con IA será cada vez más difícil.
Leer más
- Gemini Intelligence llega a Android: qué celulares tendrán primero la nueva IA de Google
- Googlebook: el nuevo portátil de Google con Gemini que reemplaza al Chromebook
- Google Cloud Next 2026: Gemini Enterprise Agentic impulsa la nueva era de empresas con IA autónoma