Se largó la carrera por el seguimiento ocular

Un nuevo frente de batalla se abrió en el negocio de la realidad virtual y la realidad aumentada (RV/RA): las tecnologías de seguimiento ocular. Las empresas dedicadas a este negocio están siendo adquiridas por grandes nombres, como Intel, Oculus y Apple. Los vectores de la competencia son la miniaturización, la eficiencia en el consumo energético y el costo. El negocio todavía está en pañales, pero está creciendo rápidamente aún más allá de la realidad virtual, en ámbitos tales como la biometría y las nuevas generaciones de interfaces de usuario.

La tecnología de seguimiento ocular promete mejorar sustancialmente las experiencias de realidad virtual haciendo que el control de las escenas no esté guiado únicamente por el movimiento de la cabeza del usuario, sino también por los movimientos de sus ojos. La importancia de esta tecnología se puso en evidencia cuando Intel tomó cartas en el asunto y adquirió a la empresa AdHawk Microsystems, creadora de un mecanismo de seguimiento sin cámaras. Otros nombres importantes también demostraron interés con acciones concretas: Facebook compró a Eye Tribe a fines del año pasado; Google adquirió una compañía llamada Eyefluence, mientras que Apple se adueñó de SMI hace unos pocos meses. Hay más compañías de seguimiento ocular que todavía mantienen su independencia, como por ejemplo Fove, QiVARI y Tobii. La variedad de players y la avidez de las grandes compañías por adquirirlos demuestra que se trata de un negocio muy atractivo.

SIN CAMARA

La gente de AdHawk (ahora parte de Intel) señala que su tecnología se diferencia de la de sus competidoras por el hecho de que no usa cámaras. El seguimiento ocular mediante cámaras opera tomando cientos de fotos por segundo del ojo y usando algoritmos para interpretarlas y determinar la posición del globo ocular. También pueden requerir LEDs con un nivel de brillo especial para iluminar a los ojos ante las cámaras. Todo ello genera latencias y consume energía.

En cambio, AdHawk describe su tecnología de la siguiente forma: “El seguimiento ocular de AdHawk reemplaza a las cámaras con sistemas micro-electromecánicos ultra compactos, llamados MEMS (micro electromechanical systems) que son tan pequeños que no pueden ser visto por el ojo desnudo. Estos MEMS eliminan por completo el pesado procesamiento de imágenes, resultando en mejoras de varios órdenes de magnitud en velocidad, formato y eficiencia energética para las unidades de RV/RA que los utilizan, a la vez que ofrecen niveles de resolución a la par de sistemas mucho más costosos”.

Al igual que otras soluciones de seguimiento ocular, la tecnología de AdHawk predice (según dicen sus voceros) hacia dónde dirigirá la vista el usuario con una anticipación de 50 milisegundos. El sistema MEMS utiliza un rayo LED que escanea el ojo, y mediante un diodo fotosensible, puede detectar la posición del globo ocular. Todo esto funciona en CMOS, si bien no emplea el CMOS para construir una imagen.

El minúsculo sensor de seguimiento ocular de AdHawk
El minúsculo sensor de seguimiento ocular de AdHawk

 

AdHawk asegura que su solución requiere muy poca energía, afirmando que podría funcionar todo un día con apenas una batería de tipo moneda. Además, el diseño consta de sólo dos chips y un protocolo serie (una interfaz de tres cables). Todo el sistema es extremadamente liviano en todo sentido, haciéndolo ideal para cualquier casco de RV/RA, ya sea móvil o con cables.

No se conoce por el momento el costo que sumará la tecnología AdHawk en la ecuación de los cascos o anteojos de RV/RA, pero la empresa señala que apuestan al volumen, por lo que la incidencia en el costo de la solución final debería ser mínima.

PUNTOS FOCALES Y OTRAS PARTICULARIDADES

Las soluciones de seguimiento ocular más tradicionales utilizan cámaras y LEDs, como en el caso de Eye Tribe, la compañía adquirida por Facebook para los cascos Oculus. Eye Tribe desarrolló un dispositivo de seguimiento ocular, kits de desarrollo y software con la finalidad de aportar interfaces basadas en miradas a los teléfonos móviles y, potencialmente, a los cascos de realidad virtual.

Además, la compañía creó una tecnología de renderización selectiva, la cual permite que los sistemas de realidad virtual ahorren poder de cómputo generando gráficos con alto nivel de detalle sólo en los sectores de la imagen hacia donde mira el ojo; en otras palabras, se crea un punto focal que se mueve a la par de los globos oculares. Esto permitiría a los próximos cascos inalámbricos de Oculus generar escenas de mayor complejidad a mayores índices de cuadros, a pesar de que el formato inalámbrico imponga límites a su capacidad de procesamiento de imágenes.

La renderización selectiva permite crear puntos focales que acompañan al movimiento de los ojos
La renderización selectiva permite crear puntos focales que acompañan al movimiento de los ojos

 

El renderizado selectivo es un aspecto clave en las nuevas generaciones de cascos que emplean tecnologías de seguimiento ocular, junto con otras funcionalidades derivadas, como por ejemplo la replicación en la cara de un avatar del movimiento de los ojos del usuario, de forma tal de aumentar el realismo de los personajes animados.

Además de los juegos de realidad virtual, otras aplicaciones pueden obtener beneficios de las tecnologías de seguimiento ocular. Algunos ejemplos: scrolling automático de páginas mientras se lee un libro electrónico o se interpreta la música de una partitura; pausar o controlar con la vista la reproducción de un video si se tienen las manos ocupadas; brindar asistencia al conductor de un automóvil de acuerdo a la dirección en la que mira. La detección de miradas podría incluso brindar información analítica a anunciantes en páginas web, detectando cuáles son los elementos hacia los que los usuarios miran en mayor medida.

EL DILEMA DE LA INTEROPERABILIDAD

El problema con la avidez de las grandes compañías por adueñarse de los “pequeños” vendors de dispositivos de seguimiento ocular es que esos pequeños vendors tienen una cartera de clientes que queda huérfana a partir de la adquisición. Es el caso de los clientes de SMI luego de su adquisición por parte de Apple. Si estos clientes deciden trabajar con alguna de las compañías que mantienen su independencia, corren el riesgo de volver a caer en el mismo problema si estas compañías resultan ser adquiridas.

La empresa de software iMotions decidió salir al rescate de los clientes huérfanos, ofreciendo un middleware independiente del hardware, que permite el soporte y la integración de múltiples dispositivos. iMotions ofrece integración nativa con los dispositivos de SMI y prometen mantener el soporte hacia el futuro, brindando como valor agregado una guía práctica del seguimiento ocular. “Con el torrente de recientes adquisiciones de compañías involucradas en el seguimiento ocular, parece ser sólo cuestión de tiempo antes de que la próxima sea adquirida”, comenta Peter Hartzbech, CEO de iMotions. “Esto provocará inevitablemente los mismos problemas que algunos de los clientes de SMI están enfrentando hoy en día: una incertidumbre con respecto al futuro por el trabajo que han hecho y que harán. Como proveedores de software independiente, somos capaces de brindar una solución que asegura el soporte a largo plazo”.

Entre las compañías que aún no han sido adquiridas se destaca Tobii, enfocada en el seguimiento ocular para dispositivos móviles. “Un casco de RV sin seguimiento ocular asumirá que le estoy hablando a la persona que está delante de mi frente”, explica Oscar Werner, vicepresidente de Tobii. “Nuestro interés es hacia dónde estoy mirando, puesto que usualmente hay una diferencia entre hacia dónde miro y la dirección hacia la que apunta mi cabeza. Los casos de RV necesitan tener en cuenta la dirección de la mirada para brindar una experiencia auténticamente inmersiva”.

El Eye Tracker 4C de Tobii pasa prácticamente desapercibido cuando se lo coloca en el borde del monitor
El Eye Tracker 4C de Tobii pasa prácticamente desapercibido cuando se lo coloca en el borde del monitor

 

Dado que la mirada es probablemente el sentido humano más utilizado, la posibilidad de transformarla en una forma de interacción hombre-máquina puede tener enormes implicaciones en el futuro de la computación. Werner indica que un nuevo paradigma de uso de la PC aflorará, en el cual el seguimiento ocular será una quinta modalidad, la cual, en combinación con pantallas táctiles, mouses/touchpads, voz y teclados, harán a las computadoras más productivas e intuitivas. “La mirada siempre precede a cualquier acción que se lleva a cabo con el mouse, el teclado o la voz, por lo que se diseñarán interacciones con el usuario mucho más inteligentes utilizando estas tecnologías”, concluye el directivo de Tobii.

Mostrar más
Gustavo Dumortier

Gustavo Dumortier

Analista en Computación y periodista especializado en informática. Trabajó en diversas publicaciones de tecnología y negocios y es autor de libros sobre algoritmos y programación. Actualmente es socio de la consultora argentina MasterSoft, en la que se desempeña como analista funcional.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Close