Inteligencia Artificial

Agentes de IA en video: Synthesia 3.0 transforma el video en conversaciones interactivas con avatares realistas

La compañía británica Synthesia presentó su nueva plataforma Synthesia 3.0, que introduce los Video Agents, una tecnología capaz de crear avatares realistas que interactúan con los usuarios en tiempo real. Estos agentes prometen revolucionar la comunicación empresarial al automatizar tareas, mejorar la capacitación y transformar el video en una experiencia conversacional.

La inteligencia artificial avanza a un ritmo vertiginoso, y lo que ayer parecía ciencia ficción hoy se convierte en una herramienta cotidiana. Tras el auge de los chatbots y los asistentes de voz, llega una nueva generación de interfaces inteligentes: los agentes de IA en video. La británica Synthesia, una de las compañías líderes en inteligencia artificial generativa, ha presentado Synthesia 3.0, una versión que promete transformar por completo la manera en que interactuamos con los contenidos audiovisuales.

Hasta ahora, la mayoría de los videos creados con IA se limitaban a ser un monólogo digital, donde un avatar explicaba o presentaba información pregrabada. Con la nueva actualización, eso cambia radicalmente. Los llamados Video Agents permiten mantener conversaciones bidireccionales con personajes virtuales que no solo hablan, sino que también escuchan, responden, interpretan emociones y actúan en tiempo real.

De los avatares al diálogo inteligente

Synthesia, fundada en 2017 y valorada en 2.100 millones de dólares, ha desarrollado una tecnología capaz de crear “humanos digitales” que superan las barreras del texto y la voz sintética. Con Video Agents, la interacción deja de ser pasiva: el usuario puede dialogar directamente con un avatar que comprende el contexto y reacciona con naturalidad.

La clave está en los nuevos avatares Express-2, que incorporan gestos realistas, sincronización labial precisa y personalización completa. Estos modelos pueden replicar el tono, ritmo y acento del humano en el que se basan, expresarse en más de cien idiomas y adaptarse a la identidad visual o corporativa de cada empresa.

Según la compañía, estos agentes no están pensados solo para entretener o sorprender, sino para automatizar tareas repetitivas dentro de las organizaciones. Desde entrevistas laborales hasta capacitaciones, evaluaciones de desempeño o demostraciones de productos, los agentes de video prometen liberar tiempo y recursos, al tiempo que mejoran la experiencia de los usuarios y empleados.

Además, los nuevos modelos pueden capturar datos en tiempo real y enviarlos directamente a los sistemas internos de la empresa, integrándose con flujos de trabajo ya existentes. En un contexto donde la eficiencia y la personalización son clave, esta tecnología puede marcar un antes y un después en la relación entre humanos y máquinas.

Agentes de IA en video: Synthesia 3.0 transforma el video en conversaciones interactivas con avatares realistas

Un futuro corporativo conversacional

La visión de Synthesia es clara: llevar el poder de la comunicación audiovisual inteligente a las empresas. “Queremos competir en el área específica de los videos hechos con inteligencia artificial para empresas”, explicó Alexandru Voica, responsable de asuntos institucionales de la compañía, en declaraciones a WIRED.

Más de la mitad de las empresas de la lista Fortune 100 ya utilizan su software, incluyendo nombres como Zoom, Heineken y Microsoft. Su modelo de negocio se orienta al mercado corporativo, un segmento donde el video es una herramienta cada vez más importante para el entrenamiento, el marketing y la atención al cliente.

Entre sus competidores se encuentran plataformas como HeyGen y Touchcast, además de gigantes como Alphabet, Meta y OpenAI, que también experimentan con tecnologías de video generativo. Sin embargo, Synthesia busca diferenciarse al centrarse en el uso responsable y ético de la IA.

Regulación, ética y reputación

A diferencia de muchas startups tecnológicas, Synthesia ha construido su reputación sobre la base de la responsabilidad. Fue la primera empresa de su sector en obtener la certificación ISO/IEC 42001, el estándar internacional que regula la gestión responsable de sistemas de inteligencia artificial. Esta decisión se alinea con el marco legal propuesto por la Ley de IA de la Unión Europea, que busca garantizar la transparencia y seguridad en el uso de estas tecnologías.

Desde sus inicios, la compañía decidió no permitir la creación de avatares basados en la imagen de personas sin su consentimiento explícito. “No recreamos actores ni celebridades fallecidas, aunque eso haya implicado renunciar a ingresos a corto plazo”, señaló Steffen Tjerrild, cofundador y COO de Synthesia.

Sin embargo, los desafíos persisten. En 2023, un canal de YouTube llamado House of News utilizó avatares generados con tecnología de Synthesia para difundir desinformación política en Venezuela. Tras el incidente, la empresa prohibió al cliente el uso de su plataforma. Este episodio ilustra tanto el potencial como los riesgos de una tecnología que, en manos equivocadas, puede ser usada para manipular información.

Europa frente a Estados Unidos y China

Mientras que en Estados Unidos y China las grandes tecnológicas dominan el panorama de la IA con presupuestos multimillonarios, las startups europeas se enfrentan a un entorno más regulado, pero también más consciente de los impactos éticos y sociales.

“Europa cuenta con una increíble reserva de talento. Lo que nos falta probablemente es ambición”, reflexionó Tjerrild. Y aunque el 90% de las inversiones de Synthesia provienen de fondos estadounidenses, la compañía mantiene su sede y su enfoque de desarrollo en Londres, apostando por una IA segura, transparente y útil para los negocios.

Un nuevo lenguaje audiovisual

Los agentes de video impulsados por IA representan un salto evolutivo en la forma en que las personas interactúan con la tecnología. Si los chatbots transformaron el texto en conversación, y los asistentes de voz dieron un paso hacia la naturalidad, ahora los avatares digitales dan rostro y emociones a la inteligencia artificial.

El video deja de ser un formato unidireccional para convertirse en un canal interactivo, donde cada diálogo puede adaptarse en tiempo real al usuario. Es, en definitiva, el comienzo de una nueva era: la de las conversaciones visuales inteligentes.

Leer mas

Autor

[mdx-adserve-bstreet region="MED"]

Publicaciones relacionadas

Botón volver arriba