
Escaneo 3D e Inteligencia artificial: El próximo desafío de Microsoft
El hecho, es que Investigadores de Microsoft están acelerando la precisión en la visión de cómputo y mejorando los modelos de escaneo en 3D. El último avance incluye mejoras de velocidad, las cuales aceleran la visión de cómputo para el reconocimiento de imágenes y nuevos algoritmos que mejoran la claridad de las imágenes escaneadas en 3D con ayuda de Kinect o sensores de Kinect.
Es probable que ya hayan escuchado acerca de la tecnología de Microsoft que puede identificar de manera automática objetos en una imagen y escribir un encabezado preciso para ellos, aunque este tipo de avances de investigación no ocurren de la nada.
Es cierto, la investigación interdisciplinaria que combina la visión de cómputo, aprendizaje de máquinas, inteligencia artificial, sistemas de cómputo y redes, son solo algunas de las áreas de investigación de Microsoft en el núcleo del campo floreciente, referido comúnmente como “aprendizaje profundo”. Los avances en la tecnología de aprendizaje profundo son fundamentales en la misión de Microsoft para impulsar a cada persona y organización del planeta para lograr más.
[youtube_sc url=https://youtu.be/S4ZgfYoeyCo]El aprendizaje profundo también es fundamental para un grupo de investigación que se presentará esta semana en la 28° Conferencia IEEE sobre Visión de Cómputo y Patrones de Reconocimiento (CVPR) en Boston.
El último avance incluye mejoras dramáticas de velocidad, las cuales aceleran la visión de cómputo para el reconocimiento de imágenes y nuevos algoritmos que mejoran la claridad de las imágenes escaneadas en 3D con ayuda de Kinect o sensores de Kinect.
En Redes Neuronales Convulsionales en Costo de Tiempo Restringido, Kaiming He, director de investigación y Jian Sun, investigador principal, comentan sobre el problema del consumo de tiempo de cómputo requerido por los continuos avances en la visión de cómputo para la precisión en la clasificación de imágenes. Los modelos propuestos por ellos son más rápidos y precisos que los modelos rápidos que ya existen, además de ser prácticos para el uso común.
Sun y He también colaboraron con los investigadores de la Universidad de Xi’an Jiaotong en Aproximaciones de Eficiencia y Precisión de las Redes Convulsiónales No lineales, el cual propone un método que acelera dichas redes hasta cuatro veces, con un margen de error de menos del uno por ciento.
En CVPR, los investigadores de Microsoft también presentarán avances en la digitalización y escaneo en 3D con ayuda de Kinect y de los sensores de Kinect.
En Reconstrucción de Superficies Libres a Gran Escala, el investigador Jonathan Taylor junto con los investigadores principales Andrew Fitzgibbon y Shahram Izadi, colaboraron con los investigadores de la Universidad de Bologna para introducir un método de escaneo en 3D a gran escala que estime en minutos y no horas, y que trabaje incluso en condiciones con poca luz, u otras condiciones desafiantes, tales como completa oscuridad.
“Como se muestra en el cuerpo de trabajo del CVPR, Kinect ha acelerado la investigación en el escaneo en 3D hasta el punto donde hoy, incluso capturar modelos de escenas de movimiento, o escenas a gran escala es posible”, dijo Izadi.
Los investigadores de Microsoft también presentan nuevas investigaciones que mejoran de manera significativa el escaneo de objetos en movimiento. En Escaneo de Objetos Deformables con un Sensor RGBD Sencillo, Taylor, Fitzgibbon e Izadi colaboraron con investigadores de la Universidad de Carolina del Norte en Chapel Hill para desarrollar un método de escaneo que solo utiliza un sencillo sensor de Kinect sin el brusco movimiento de la cámara del usuario.
“El siguiente paso lógico es usar estos modelos para el reconocimiento, y juntar el mundo del aprendizaje profundo con el de la reconstrucción” añadió Izadi. “Esto nos acerca un poco más a las computadoras que entienden al usuario y a su ambiente, en formas mucho más ricas”.