Cookies y Privacidad
Usamos cookies propias y de terceros para mejorar la experiencia de nuestros usuarios, analizar el tráfico del sitio y personalizar contenido. Si continúas navegando, asumimos que aceptas su uso. Para más información, consulta nuestra Política de Cookies

Imagen. / MIT
2021-03-12
Uso de la inteligencia artificial para generar hologramas 3D en tiempo real
A pesar de los años de publicidad, los cascos de realidad virtual todavía no han desbancado a las pantallas de televisión o de ordenador como dispositivos para ver vídeos. Una de las razones: La RV puede hacer que los usuarios se sientan mal. Las náuseas y el cansancio ocular pueden deberse a que la RV crea una ilusión de visión en 3D, aunque el usuario esté mirando una pantalla 2D de distancia fija. La solución para una mejor visualización en 3D podría residir en una tecnología de hace 60 años, reconvertida al mundo digital: los hologramas.
Los hologramas ofrecen una representación excepcional del mundo 3D que nos rodea. Además, son hermosos. Los hologramas ofrecen una perspectiva cambiante en función de la posición del espectador y permiten al ojo ajustar la profundidad focal para enfocar alternativamente el primer plano y el fondo.
Los investigadores llevan mucho tiempo intentando crear hologramas generados por ordenador, pero el proceso ha requerido tradicionalmente un superordenador para realizar simulaciones físicas, lo que lleva mucho tiempo y puede dar resultados poco realistas. Ahora, los investigadores del MIT han desarrollado una nueva forma de producir hologramas casi al instante, y el método basado en el aprendizaje profundo es tan eficiente que puede ejecutarse en un ordenador portátil en un abrir y cerrar de ojos, dicen los investigadores.
"Antes se pensaba que con el hardware de consumo existente era imposible realizar cálculos de holografía 3D en tiempo real", afirma Liang Shi, autor principal del estudio y estudiante de doctorado del Departamento de Ingeniería Eléctrica e Informática (EECS) del MIT. "A menudo se ha dicho que las pantallas holográficas disponibles en el mercado existirán dentro de 10 años, pero esta afirmación lleva décadas vigente".
Shi cree que el nuevo enfoque, que el equipo denomina "holografía tensorial", pondrá por fin a su alcance ese esquivo objetivo de 10 años. El avance podría impulsar la extensión de la holografía a campos como la RV y la impresión en 3D.
Shi ha trabajado en el estudio, publicado hoy en Nature, con su asesor y coautor Wojciech Matusik. Otros coautores son Beichen Li, del EECS y del Laboratorio de Ciencias de la Computación e Inteligencia Artificial del MIT, así como los antiguos investigadores del MIT Changil Kim (ahora en Facebook) y Petr Kellnhofer (ahora en la Universidad de Stanford).
La búsqueda de un mejor 3D
Una fotografía típica basada en una lente codifica el brillo de cada onda de luz: una foto puede reproducir fielmente los colores de una escena, pero al final produce una imagen plana.
En cambio, un holograma codifica tanto el brillo como la fase de cada onda luminosa. Esta combinación proporciona una representación más fiel del paralaje y la profundidad de una escena. Así, mientras que una fotografía de los "Nenúfares" de Monet puede resaltar la paleta de colores de la pintura, un holograma puede dar vida a la obra, reproduciendo la textura tridimensional única de cada pincelada. Pero, a pesar de su realismo, los hologramas son un reto a la hora de fabricarlos y compartirlos.
Desarrollados por primera vez a mediados del siglo XX, los primeros hologramas se grababan ópticamente. Para ello era necesario dividir un rayo láser, utilizando la mitad del rayo para iluminar al sujeto y la otra mitad como referencia para la fase de las ondas de luz. Esta referencia genera la sensación única de profundidad del holograma. Las imágenes resultantes eran estáticas, por lo que no podían captar el movimiento. Además, sólo se podían copiar en papel, lo que dificultaba su reproducción y distribución.
La holografía generada por ordenador evita estos problemas al simular la configuración óptica. Pero el proceso puede suponer un gran esfuerzo informático. "Como cada punto de la escena tiene una profundidad diferente, no se pueden aplicar las mismas operaciones para todos ellos", dice Shi. "Eso aumenta la complejidad de forma significativa". Dirigir un superordenador agrupado para ejecutar estas simulaciones basadas en la física podría llevar segundos o minutos para una sola imagen holográfica. Además, los algoritmos existentes no modelan la oclusión con una precisión fotorrealista. Así que el equipo de Shi adoptó un enfoque diferente: dejar que el ordenador se enseñe a sí mismo la física.
Utilizaron el aprendizaje profundo para acelerar la holografía generada por ordenador, permitiendo la generación de hologramas en tiempo real. El equipo diseñó una red neuronal convolucional, una técnica de procesamiento que utiliza una cadena de tensores entrenables para imitar aproximadamente el modo en que los humanos procesan la información visual. El entrenamiento de una red neuronal suele requerir un gran conjunto de datos de alta calidad, que antes no existía para los hologramas 3D.
El equipo creó una base de datos personalizada con 4.000 pares de imágenes generadas por ordenador. Cada par emparejaba una imagen -incluyendo la información de color y profundidad de cada píxel- con su correspondiente holograma. Para crear los hologramas de la nueva base de datos, los investigadores utilizaron escenas con formas y colores complejos y variables, con la profundidad de los píxeles distribuida uniformemente desde el fondo hasta el primer plano, y con un nuevo conjunto de cálculos basados en la física para manejar la oclusión. Este enfoque dio lugar a datos de entrenamiento fotorrealistas. A continuación, el algoritmo se puso a trabajar.
Al aprender de cada par de imágenes, la red tensorial ajustó los parámetros de sus propios cálculos, mejorando sucesivamente su capacidad para crear hologramas. La red totalmente optimizada funcionaba órdenes de magnitud más rápido que los cálculos basados en la física. Esa eficacia sorprendió al propio equipo.
"Estamos sorprendidos de lo bien que funciona", dice Matusik. En apenas milisegundos, la holografía tensorial puede elaborar hologramas a partir de imágenes con información de profundidad, que es la que proporcionan las típicas imágenes generadas por ordenador y puede calcularse a partir de una configuración multicámara o un sensor LiDAR (ambos son estándar en algunos de los nuevos smartphones). Este avance allana el camino hacia la holografía 3D en tiempo real. Además, la red tensorial compacta requiere menos de 1 MB de memoria. "Es insignificante, teniendo en cuenta las decenas y cientos de gigabytes disponibles en los últimos teléfonos móviles", afirma.
La investigación "demuestra que las verdaderas pantallas holográficas en 3D son prácticas con sólo unos requisitos computacionales moderados", afirma Joel Kollin, arquitecto óptico principal de Microsoft que no participó en la investigación. Añade que "este trabajo muestra una notable mejora en la calidad de la imagen con respecto a trabajos anteriores", lo que "añadirá realismo y comodidad para el espectador". Kollin también insinúa la posibilidad de que pantallas holográficas como ésta puedan incluso personalizarse según la prescripción oftálmica del espectador. "Las pantallas holográficas pueden corregir las aberraciones del ojo. Esto hace posible una imagen de pantalla más nítida que la que el usuario podría ver con lentes de contacto o gafas, que sólo corrigen las aberraciones de bajo orden como el enfoque y el astigmatismo."
"Un salto considerable"
La holografía 3D en tiempo real mejoraría una serie de sistemas, desde la RV hasta la impresión 3D. El equipo afirma que el nuevo sistema podría ayudar a sumergir a los espectadores de RV en escenarios más realistas, al tiempo que eliminaría la fatiga ocular y otros efectos secundarios del uso de la RV a largo plazo. La tecnología podría implantarse fácilmente en pantallas que modulan la fase de las ondas de luz. En la actualidad, las pantallas más asequibles para el consumidor sólo modulan el brillo, aunque el coste de las pantallas con modulación de fase se reduciría si se adoptaran de forma generalizada.
Según los investigadores, la holografía tridimensional también podría impulsar el desarrollo de la impresión volumétrica en 3D. Esta tecnología podría resultar más rápida y precisa que la tradicional impresión 3D por capas, ya que la impresión 3D volumétrica permite la proyección simultánea de todo el patrón 3D. Otras aplicaciones son la microscopía, la visualización de datos médicos y el diseño de superficies con propiedades ópticas únicas.
"Es un salto considerable que podría cambiar por completo la actitud de la gente hacia la holografía", dice Matusik. "Creemos que las redes neuronales han nacido para esta tarea".
El trabajo fue apoyado, en parte, por Sony

MIT
Promover la investigación, las innovaciones, la enseñanza y los eventos y las personas de interés periodístico del MIT a la comunidad del campus, los medios de comunicación y el público en general, Comunicar anuncios del Instituto, Publicar noticias de la comunidad para profesores, estudiantes, personal y ex alumnos del MIT. Proporcionar servicios de medios a los miembros de la comunidad, incluido el asesoramiento sobre cómo trabajar con periodistas, Responder a consultas de los medios y solicitudes de entrevistas...