Inteligencia Artificial

Microsoft actualiza Copilot Vision para interactuar con cualquier ventana de Windows

Con esta mejora, Copilot Vision puede responder preguntas y ofrecer sugerencias basadas en cualquier contenido visible en el escritorio, llevando la asistencia de IA a un nuevo nivel de integración.

La inteligencia artificial de Microsoft continúa evolucionando y, con su última actualización, Copilot Vision da un paso clave hacia una integración más profunda con el entorno del usuario. A partir de la versión 1.25071.125, el asistente de IA de Microsoft ahora puede acceder a todo lo que se muestra en pantalla: desde el escritorio completo hasta cualquier aplicación o ventana activa. Esta funcionalidad, que se está desplegando inicialmente entre los usuarios del programa Windows Insider, marca un nuevo hito en la forma en que la IA puede asistir en tareas diarias.

Lanzado originalmente en octubre de 2023 como parte de Copilot Labs, Copilot Vision fue concebido para comprender y procesar elementos visuales del escritorio del usuario. Su capacidad para analizar imágenes, leer texto y responder preguntas en tiempo real ya lo convertía en una herramienta potente. Sin embargo, hasta ahora, su alcance estaba limitado. Con esta actualización, Microsoft amplía significativamente el rango de acción de su asistente, que ahora puede “ver” todo lo que ve el usuario, ofreciendo respuestas contextuales más precisas y acciones guiadas sin necesidad de cambiar de ventana o interrumpir el flujo de trabajo.

¿Cómo funciona Copilot Vision?

El funcionamiento es sencillo. El usuario debe hacer clic en el ícono de las gafas dentro del editor, elegir si desea compartir el escritorio completo o una ventana específica, y luego comenzar a interactuar con el asistente. Si en algún momento se quiere finalizar la sesión, basta con pulsar “Detener” o hacer clic en la “X”.

Una de las novedades destacadas es que Copilot Vision puede activarse incluso en medio de una conversación por voz con el asistente, lo que permite mantener una interacción fluida sin necesidad de usar el teclado o el mouse. Además, si bien la funcionalidad está pensada para ejecutarse bajo demanda —es decir, el usuario decide cuándo compartir su escritorio—, la asistencia ofrecida se adapta al contenido visible, ya sea una imagen, un documento o una interfaz de software.

En el caso de su integración con el navegador Microsoft Edge, esta herramienta se había incorporado desde abril. No obstante, allí se encuentra una limitación: solo se pueden analizar dos aplicaciones activas a la vez. Esto impone un tope útil para proteger el rendimiento y gestionar el consumo de recursos, al tiempo que mantiene un enfoque centrado en el contexto.

Copilot Vision ahora puede acceder y analizar en tiempo real todo lo que se muestra en el escritorio de Windows, facilitando una asistencia más precisa y contextualizada para el usuario.
Copilot Vision ahora puede acceder y analizar en tiempo real todo lo que se muestra en el escritorio de Windows, facilitando una asistencia más precisa y contextualizada para el usuario.

¿Copilot Vision o Recall?

La actualización de Copilot Vision ha generado ciertas comparaciones con Recall, otra herramienta basada en inteligencia artificial presentada por Microsoft. Aunque ambas tecnologías apuntan a enriquecer la experiencia de uso a través del reconocimiento de contenido visual, lo hacen desde enfoques diferentes.

Recall funciona de forma constante y automática: captura pantallas de manera continua y construye un historial visual al que el usuario puede acceder para buscar información pasada. En cambio, Copilot Vision actúa por demanda: solo accede a la pantalla cuando el usuario lo activa manualmente. Esto significa que el usuario tiene un mayor control sobre qué se comparte y cuándo.

Además, la compatibilidad también las diferencia. Recall está restringido a los nuevos dispositivos Copilot+PC, una línea de hardware específica desarrollada por Microsoft. Copilot Vision, en cambio, puede ejecutarse en cualquier equipo con Windows 10 o Windows 11, lo que facilita su adopción sin necesidad de renovar el equipo.

Disponibilidad e implicancias de privacidad

El despliegue de esta función ya comenzó en Estados Unidos, pero su expansión a otros mercados será paulatina. Microsoft ha aclarado que los usuarios de España y otros países del Espacio Económico Europeo no podrán acceder a la función en esta etapa debido a las normativas vigentes en materia de protección de datos. Esta limitación responde a las exigencias del Reglamento General de Protección de Datos (GDPR), que impone restricciones más estrictas sobre la recopilación y el procesamiento de información personal.

El hecho de que Copilot Vision funcione solo cuando el usuario lo decide mitiga, en parte, las preocupaciones sobre privacidad. Sin embargo, no deja de abrir un debate sobre el equilibrio entre asistencia inteligente y control del entorno digital, especialmente en contextos laborales o de uso compartido del equipo.

Cómo activarlo en Edge

Para quienes deseen aprovechar esta funcionalidad desde el navegador, Microsoft ha simplificado el proceso. Una vez abierto Edge, basta con acceder al menú de tres puntos (Alt+F), ingresar a Configuración, y luego a la sección Apariencia. Desde allí, el usuario puede activar opciones como “Circle para Copilot en la página web” o “Copilot Vision en páginas web en Edge”.

Estas funciones permiten que Copilot no solo interactúe con sitios web, sino que también tenga la posibilidad —según lo configure el usuario— de extender su alcance a todo el escritorio, incluyendo aplicaciones que se ejecuten por fuera del navegador.

¿Un paso hacia la omnipresencia de la IA?

Con esta actualización, Microsoft refuerza su apuesta por una inteligencia artificial más integrada, proactiva y contextual. Copilot Vision se perfila como un verdadero copiloto digital que acompaña al usuario en sus tareas, brindando ayuda en tiempo real sin necesidad de cambiar de aplicación ni recurrir a búsquedas externas.

Aunque aún se encuentra en etapa de despliegue limitado, esta funcionalidad adelanta lo que podría ser el futuro inmediato del uso cotidiano de la IA: asistentes visuales que no solo responden a comandos, sino que entienden el entorno visual del usuario, se adaptan a sus necesidades y mejoran su productividad sin fricción.

La evolución de Copilot Vision demuestra que la integración profunda entre la IA y el sistema operativo ya no es una promesa a largo plazo. Es una realidad que avanza con cada nueva versión, empujando los límites de lo que las herramientas digitales pueden hacer por nosotros —y también, de cómo nosotros debemos repensar nuestra interacción con ellas.

Leer mas

Autor

[mdx-adserve-bstreet region="MED"]

Publicaciones relacionadas

Botón volver arriba