
(NC&T) "El algoritmo se vale de diversos indicios visuales que los humanos utilizamos para estimar las características 3-D de una escena. Si miramos a un campo de hierba, podemos ver que la textura cambia de una manera específica a medida que se hace más distante", explica Ashutosh Saxena, quien junto a Andrew Ng desarrolló el sitio web Make3d, cuya dirección es:
http://make3d.stanford.edu
En la investigación también colaboró Min Sun.
Las aplicaciones prácticas para la extracción de modelos 3-D de imágenes 2-D podrían variar desde un servicio de imágenes enriquecidas de viviendas y demás inmuebles para compradores potenciales en webs de agencias inmobiliarias, hasta la creación rápida de entornos para videojuegos, pasando por la mejora de la visión y la pericia de robots que deben moverse a través de un entorno real e interactuar con él.
La extracción de información 3-D de imágenes estáticas es una tecnología emergente. Anteriormente, algunos investigadores habían sintetizado modelos 3-D a partir del análisis de múltiples imágenes de una escena. Otros, incluyendo a Ng y Saxena en el año 2005, desarrollaron algoritmos que deducen la profundidad de imágenes individuales gracias a combinar suposiciones acerca de qué debe ser tierra o cielo, con indicios simples como líneas verticales en la imagen que representan paredes o árboles. Pero Make3d crea modelos precisos y uniformes con una velocidad de trabajo de alrededor del doble de la conseguida por otros métodos, gracias a abandonar las suposiciones limitativas en favor de un análisis nuevo y más profundo de cada imagen y de la poderosa técnica de inteligencia artificial denominada "aprendizaje automático".
Para "adiestrar" al algoritmo en los conceptos de profundidad, orientación y posición en imágenes 2-D, los investigadores le suministraron imágenes estáticas de diversos lugares del campus junto con datos 3-D de las mismas escenas obtenidos con escáneres láser. El algoritmo correlacionó los dos conjuntos de datos, adquiriendo al final una buena idea de las tendencias y patrones asociados con estar cerca o lejos. Por ejemplo, aprendió que cambios abruptos a lo largo de los bordes se correlacionan bien con la superposición de un objeto sobre otro, y comprendió que las cosas que están lejos pueden estar un poco más neblinosas y azuladas que las cosas que están cerca.
En la web Make3d, el algoritmo atiende por orden de recepción las imágenes suministradas por los usuarios, y cuando termina de generar un modelo envía un correo electrónico de aviso al usuario que aportó la imagen 2-D.