Noticias Actualidad en procesos industriales

Dele visibilidad a su trayectoria académica

Participe en la convocatoria de trabajos inéditos de Virtual Pro.

Publicar Ahora

2022-10-21Aprendizaje profundo con luz

MIT |Un nuevo método utiliza la óptica para acelerar los cálculos de aprendizaje automático en altavoces inteligentes y otros dispositivos conectados de bajo consumo.

Pida a un dispositivo doméstico inteligente el pronóstico del tiempo y el dispositivo tardará varios segundos en responder. Una de las razones por las que ocurre esta latencia es porque los dispositivos conectados no tienen suficiente memoria o energía para almacenar y ejecutar los enormes modelos de aprendizaje automático necesarios para que el dispositivo comprenda lo que el usuario le pide. El modelo se almacena en un centro de datos que puede estar a cientos de kilómetros de distancia, donde se calcula la respuesta y se envía al dispositivo.

Investigadores del MIT han creado un nuevo método para computar directamente en estos dispositivos, lo que reduce drásticamente esta latencia. Su técnica cambia los pasos intensivos en memoria de ejecutar un modelo de aprendizaje automático a un servidor central donde los componentes del modelo se codifican en ondas de luz.

Las ondas se transmiten a un dispositivo conectado mediante fibra óptica, lo que permite enviar toneladas de datos a la velocidad del rayo a través de una red. Luego, el receptor emplea un dispositivo óptico simple que realiza cálculos rápidamente utilizando las partes de un modelo transportado por esas ondas de luz.

Esta técnica conduce a una mejora de más de cien veces en la eficiencia energética en comparación con otros métodos. También podría mejorar la seguridad, ya que no es necesario transferir los datos de un usuario a una ubicación central para su cómputo.

Este método podría permitir que un automóvil autónomo tome decisiones en tiempo real mientras usa solo un pequeño porcentaje de la energía que actualmente requieren las computadoras que consumen mucha energía. También podría permitir a un usuario tener una conversación sin latencia con su dispositivo doméstico inteligente, ser utilizado para el procesamiento de video en vivo a través de redes celulares o incluso habilitar la clasificación de imágenes de alta velocidad en una nave espacial a millones de millas de la Tierra.

“Cada vez que desea ejecutar una red neuronal, debe ejecutar el programa, y ​​la rapidez con la que puede ejecutar el programa depende de la rapidez con la que puede canalizar el programa desde la memoria. Nuestra tubería es enorme: corresponde a enviar una película completa a través de Internet cada milisegundo más o menos. Así de rápido entran los datos en nuestro sistema. Y puede computar tan rápido como eso”, dice el autor principal Dirk Englund, profesor asociado en el Departamento de Ingeniería Eléctrica y Ciencias de la Computación (EECS) y miembro del Laboratorio de Investigación de Electrónica del MIT.

Junto a Englund en el artículo está el autor principal y estudiante graduado de EECS, Alexander Sludds; El estudiante graduado de EECS Saumil Bandyopadhyay, el científico investigador Ryan Hamerly, así como otros del MIT, el Laboratorio Lincoln del MIT y Nokia Corporation. La investigación se publica hoy en Science .

Aligerando la carga

Las redes neuronales son modelos de aprendizaje automático que utilizan capas de nodos conectados, o neuronas, para reconocer patrones en conjuntos de datos y realizar tareas, como clasificar imágenes o reconocer el habla. Pero estos modelos pueden contener miles de millones de parámetros de peso, que son valores numéricos que transforman los datos de entrada a medida que se procesan. Estos pesos deben almacenarse en la memoria. Al mismo tiempo, el proceso de transformación de datos implica miles de millones de cálculos algebraicos, que requieren una gran cantidad de energía para realizarlos.

El proceso de obtener datos (los pesos de la red neuronal, en este caso) de la memoria y moverlos a las partes de una computadora que realizan el cálculo real es uno de los mayores factores limitantes de la velocidad y la eficiencia energética, dice Sludds.

“Así que pensamos, ¿por qué no tomamos todo ese trabajo pesado, el proceso de obtener miles de millones de pesos de la memoria, lo alejamos del dispositivo de borde y lo colocamos en un lugar donde tengamos abundante acceso a la energía y la memoria, lo que da nosotros la capacidad de buscar esos pesos rápidamente? él dice.

La arquitectura de red neuronal que desarrollaron, Netcast, consiste en almacenar pesos en un servidor central que está conectado a una nueva pieza de hardware llamada transceptor inteligente. Este transceptor inteligente, un chip del tamaño de un pulgar que puede recibir y transmitir datos, utiliza tecnología conocida como fotónica de silicio para recuperar billones de pesos de la memoria cada segundo.

Recibe pesos como señales eléctricas y las imprime en ondas de luz. Dado que los datos de peso están codificados como bits (1 y 0), el transceptor los convierte cambiando los láseres; un láser se enciende para un 1 y se apaga para un 0. Combina estas ondas de luz y luego las transfiere periódicamente a través de una red de fibra óptica para que un dispositivo cliente no necesite consultar al servidor para recibirlas.

“La óptica es excelente porque hay muchas formas de transportar datos dentro de la óptica. Por ejemplo, puede poner datos en diferentes colores de luz, y eso permite un rendimiento de datos mucho mayor y un mayor ancho de banda que con la electrónica”, explica Bandyopadhyay.

Billones por segundo

Una vez que las ondas de luz llegan al dispositivo del cliente, un componente óptico simple conocido como modulador de banda ancha "Mach-Zehnder" las usa para realizar cálculos analógicos súper rápidos. Esto implica codificar los datos de entrada del dispositivo, como la información del sensor, en las pesas. Luego envía cada longitud de onda individual a un receptor que detecta la luz y mide el resultado del cálculo.

Los investigadores idearon una forma de usar este modulador para hacer trillones de multiplicaciones por segundo, lo que aumenta enormemente la velocidad de cálculo en el dispositivo mientras usa solo una pequeña cantidad de energía.   

“Para hacer algo más rápido, necesitas hacerlo más eficiente energéticamente. Pero hay una compensación. Hemos construido un sistema que puede operar con alrededor de un milivatio de potencia pero aún así hacer trillones de multiplicaciones por segundo. En términos de velocidad y eficiencia energética, es una ganancia de varios órdenes de magnitud”, dice Sludds.

Probaron esta arquitectura enviando pesos a través de una fibra de 86 kilómetros que conecta su laboratorio con el Laboratorio Lincoln del MIT. Netcast permitió el aprendizaje automático con alta precisión (98,7% para la clasificación de imágenes y 98,8% para el reconocimiento de dígitos) a velocidades rápidas.

“Tuvimos que hacer algo de calibración, pero me sorprendió el poco trabajo que tuvimos que hacer para lograr una precisión tan alta desde el primer momento. Pudimos obtener una precisión comercialmente relevante”, agrega Hamerly.

En el futuro, los investigadores quieren iterar en el chip transceptor inteligente para lograr un rendimiento aún mejor. También quieren miniaturizar el receptor, que actualmente tiene el tamaño de una caja de zapatos, hasta el tamaño de un solo chip para que pueda caber en un dispositivo inteligente como un teléfono celular.

"El uso de la fotónica y la luz como plataforma para la computación es un área de investigación realmente emocionante con implicaciones potencialmente enormes en la velocidad y la eficiencia de nuestro panorama de tecnología de la información", dice Euan Allen, miembro de investigación de la Royal Academy of Engineering en la Universidad de Bath. que no participó en este trabajo. “El trabajo de Sludds et al. es un paso emocionante para ver implementaciones en el mundo real de tales dispositivos, introduciendo un nuevo y práctico esquema de computación de borde mientras explora algunas de las limitaciones fundamentales de la computación a niveles de luz muy bajos (de un solo fotón)”.

La investigación está financiada, en parte, por NTT Research, la Fundación Nacional de Ciencias, la Oficina de Investigación Científica de la Fuerza Aérea, el Laboratorio de Investigación de la Fuerza Aérea y la Oficina de Investigación del Ejército.

MIT
Autor
MIT

Promover la investigación, las innovaciones, la enseñanza y los eventos y las personas de interés periodístico del MIT a la comunidad del campus, los medios de comunicación y el público en general, Comunicar anuncios del Instituto, Publicar noticias de la comunidad para profesores, estudiantes, personal y ex alumnos del MIT. Proporcionar servicios de medios a los miembros de la comunidad, incluido el asesoramiento sobre cómo trabajar con periodistas, Responder a consultas de los medios y solicitudes de entrevistas...


2023-02-02
Debate científico sobre las causas del cambio climático

En 1974, los científicos Frank Sherwood Rowland y Mario Molina dieron a conocer que los gases clorofluorcarbonados utilizados en refrigeradores, aires acondicionados, aerosoles y spray de laca, entre otros productos, se dispersan en la estratosfera expulsando una alta condensación de átomos de cloro que degradan la capa de ozono que nos protege de los rayos ultravioleta emitidos por el sol. Posterior a esto, un alto representante de DuPont, una de las más reconocidas industrias químicas a nivel mundial, estimó que la investigación era un “cuento de ciencia ficción”, un “montón de basura” y una “absoluta idiotez”. Sin embargo, en 1987, bajo el Protocolo de Montreal, se establecieron las medidas necesarias para controlar y disminuir poco a poco hasta eliminar el uso de cerca de 100 componentes químicos que afectan sustancialmente la capa de ozono.

2023-02-02
Un nuevo sistema de reciclaje de carbono permitiría reducir las emisiones de la industria siderúrgica en un 90 %

Investigadores de la Universidad de Birmingham proponen un método para adaptar los hornos actuales que permitiría sustituir el 90 % del coque utilizado habitualmente por este sector.

2023-02-02
El Instituto de Óptica del CSIC convoca la sexta edición de los Premios FOTÓN, dirigidos a comunicadores y docentes

Los galardones reconocen la divulgación de la óptica y la fotónica en medios de comunicación y centros educativos.

2023-02-02
Las empresas derivadas de la NASA refuerzan la resiliencia climática, mejoran la atención médica y más

Cuando se trata de la NASA, la mayoría de las personas miran hacia el cielo mientras los cohetes, los rovers y los astronautas superan los límites de la exploración espacial. Pero los beneficios de ir más allá se pueden encontrar aquí en la Tierra a través de productos y servicios nacidos de la innovación de la NASA.

2023-02-02
ChatGPT apuesta solo por esta criptomoneda para revolucionar la economía

La inteligencia artificial ChatGPT sin duda está marcando un antes y un después en nuestro día a día, ya que se han descubierto numerosos usos para la vida cotidiana como por ejemplo ganar dinero. Es tal, que importantes empresas han decidido apostar por ella con inversiones multimillonarias. Ahora un experto en criptomonedas ha querido poner a ChatGPT en una encrucijada al preguntarle si los bancos centrales podrían acabar con las criptomonedas.

2023-02-02
Resuelven un viejo problema de teoría de la computación a partir del estudio de la covid

Al inicio de la pandemia, un matemático de la Universidad Autónoma de Barcelona empezó a experimentar con modelos epidemiológicos. No logró mejorar las predicciones, pero resolvió una cuestión abierta desde la década de 1980 en informática teórica sobre las redes de Petri.