Noticias Actualidad en procesos industriales

Dele visibilidad a su trayectoria académica

Participe en la convocatoria de trabajos inéditos de Virtual Pro.

Publicar Ahora

2022-11-30Rompiendo los límites de escala de la computación analógica

MIT |La nueva técnica podría disminuir los errores que obstaculizan el rendimiento de las redes neuronales ópticas analógicas súper rápidas.

A medida que los modelos de aprendizaje automático se vuelven más grandes y complejos, requieren hardware más rápido y con mayor eficiencia energética para realizar los cálculos. Las computadoras digitales convencionales luchan por mantenerse al día.

Una red neuronal óptica analógica podría realizar las mismas tareas que una digital, como la clasificación de imágenes o el reconocimiento de voz, pero debido a que los cálculos se realizan utilizando luz en lugar de señales eléctricas, las redes neuronales ópticas pueden funcionar muchas veces más rápido y consumir menos energía.

Sin embargo, estos dispositivos analógicos son propensos a errores de hardware que pueden hacer que los cálculos sean menos precisos. Las imperfecciones microscópicas en los componentes de hardware son una de las causas de estos errores. En una red neuronal óptica que tiene muchos componentes conectados, los errores pueden acumularse rápidamente.

Incluso con técnicas de corrección de errores, debido a las propiedades fundamentales de los dispositivos que componen una red neuronal óptica, es inevitable cierta cantidad de error. Una red lo suficientemente grande como para implementarla en el mundo real sería demasiado imprecisa para ser efectiva.

Los investigadores del MIT superaron este obstáculo y encontraron una manera de escalar de manera efectiva una red neuronal óptica. Al agregar un pequeño componente de hardware a los conmutadores ópticos que forman la arquitectura de la red, pueden reducir incluso los errores incorregibles que de otro modo se acumularían en el dispositivo.

Su trabajo podría habilitar una red neuronal analógica súper rápida y eficiente en energía que puede funcionar con la misma precisión que una digital. Con esta técnica, a medida que un circuito óptico se vuelve más grande, la cantidad de error en sus cálculos en realidad disminuye.  

“Esto es notable, ya que va en contra de la intuición de los sistemas analógicos, donde se supone que los circuitos más grandes tienen mayores errores, por lo que los errores establecen un límite en la escalabilidad. Este artículo nos permite abordar la cuestión de la escalabilidad de estos sistemas con un inequívoco”, dice el autor principal Ryan Hamerly, científico visitante en el Laboratorio de Investigación de Electrónica (RLE) y el Laboratorio de Fotónica Cuántica del MIT y científico principal de NTT Research.

Los coautores de Hamerly son el estudiante graduado Saumil Bandyopadhyay y el autor principal Dirk Englund, profesor asociado en el Departamento de Ingeniería Eléctrica y Ciencias de la Computación (EECS) del MIT, líder del Laboratorio de Fotónica Cuántica y miembro de la RLE. La investigación se publica hoy en Nature Communications.

Multiplicando con luz

Una red neuronal óptica se compone de muchos componentes conectados que funcionan como espejos sintonizables y reprogramables. Estos espejos sintonizables se denominan inferómetros Mach-Zehnder (MZI). Los datos de la red neuronal se codifican en luz, que se dispara a la red neuronal óptica desde un láser.

Un MZI típico contiene dos espejos y dos divisores de haz. La luz ingresa por la parte superior de un MZI, donde se divide en dos partes que interfieren entre sí antes de ser recombinada por el segundo divisor de haz y luego reflejada por la parte inferior hacia el siguiente MZI en la matriz. Los investigadores pueden aprovechar la interferencia de estas señales ópticas para realizar operaciones de álgebra lineal complejas, conocidas como multiplicación de matrices, que es la forma en que las redes neuronales procesan los datos.

Pero los errores que pueden ocurrir en cada MZI se acumulan rápidamente a medida que la luz se mueve de un dispositivo al siguiente. Uno puede evitar algunos errores identificándolos con anticipación y ajustando los MZI para que los errores anteriores sean cancelados por dispositivos posteriores en la matriz.

“Es un algoritmo muy simple si sabes cuáles son los errores. Pero estos errores son notoriamente difíciles de determinar porque solo tiene acceso a las entradas y salidas de su chip”, dice Hamerly. “Esto nos motivó a ver si es posible crear una corrección de errores sin calibración”.

Hamerly y sus colaboradores demostraron previamente una técnica matemática que fue un paso más allá. Pudieron inferir con éxito los errores y ajustar correctamente los MZI en consecuencia, pero incluso esto no eliminó todo el error.

Debido a la naturaleza fundamental de un MZI, hay casos en los que es imposible ajustar un dispositivo para que toda la luz fluya por el puerto inferior al siguiente MZI. Si el dispositivo pierde una fracción de luz en cada paso y la matriz es muy grande, al final solo quedará una pequeña cantidad de energía.

“Incluso con la corrección de errores, existe un límite fundamental en lo bueno que puede ser un chip. Los MZI son físicamente incapaces de realizar ciertas configuraciones para las que deben configurarse”, dice.

Entonces, el equipo desarrolló un nuevo tipo de MZI. Los investigadores agregaron un divisor de haz adicional al final del dispositivo, llamándolo 3-MZI porque tiene tres divisores de haz en lugar de dos. Debido a la forma en que este divisor de haz adicional mezcla la luz, se vuelve mucho más fácil para un MZI alcanzar la configuración que necesita para enviar toda la luz a través de su puerto inferior.

Es importante destacar que el divisor de haz adicional tiene un tamaño de solo unos pocos micrómetros y es un componente pasivo, por lo que no requiere ningún cableado adicional. Agregar divisores de haz adicionales no cambia significativamente el tamaño del chip.

Chip más grande, menos errores

Cuando los investigadores realizaron simulaciones para probar su arquitectura, descubrieron que puede eliminar gran parte del error incorregible que dificulta la precisión. Y a medida que la red neuronal óptica se vuelve más grande, la cantidad de error en el dispositivo en realidad disminuye, lo contrario de lo que sucede en un dispositivo con MZI estándar.

Usando 3-MZI, podrían crear un dispositivo lo suficientemente grande para usos comerciales con un error que se ha reducido en un factor de 20, dice Hamerly.

Los investigadores también desarrollaron una variante del diseño MZI específicamente para errores correlacionados. Estos ocurren debido a imperfecciones de fabricación: si el grosor de un chip es ligeramente incorrecto, es posible que todos los MZI estén desviados en aproximadamente la misma cantidad, por lo que los errores son todos similares. Encontraron una manera de cambiar la configuración de un MZI para hacerlo resistente a este tipo de errores. Esta técnica también aumentó el ancho de banda de la red neuronal óptica para que pueda funcionar tres veces más rápido.

Ahora que han mostrado estas técnicas mediante simulaciones, Hamerly y sus colaboradores planean probar estos enfoques en hardware físico y continuar avanzando hacia una red neuronal óptica que puedan implementar de manera efectiva en el mundo real.

Esta investigación está financiada, en parte, por una beca de investigación de posgrado de la Fundación Nacional de Ciencias y la Oficina de Investigación Científica de la Fuerza Aérea de EE. UU.

MIT
Autor
MIT

Promover la investigación, las innovaciones, la enseñanza y los eventos y las personas de interés periodístico del MIT a la comunidad del campus, los medios de comunicación y el público en general, Comunicar anuncios del Instituto, Publicar noticias de la comunidad para profesores, estudiantes, personal y ex alumnos del MIT. Proporcionar servicios de medios a los miembros de la comunidad, incluido el asesoramiento sobre cómo trabajar con periodistas, Responder a consultas de los medios y solicitudes de entrevistas...


2023-02-07
Resolviendo un misterio de aprendizaje automático

Un nuevo estudio muestra cómo los modelos de lenguaje grandes como GPT-3 pueden aprender una nueva tarea con solo unos pocos ejemplos, sin necesidad de nuevos datos de entrenamiento.

2023-02-07
El CSIC se une a la celebración del Día Internacional de la Mujer y la Niña en la Ciencia con multitud de acciones

Obras de teatro, encuentros con científicas y talleres forman parte de la programación del CSIC en torno al 11 de febrero, que reúne más de 180 actividades.

2023-02-07
¿Por qué la nueva herramienta de inteligencia artificial ChatGPT está causando tanto revuelo?

Desde los centros educativos al mundo laboral, la nueva herramienta de inteligencia artificial ChatGPT preocupa a mucha gente.

2023-02-07
Avances en marcha en los cohetes lunares para las misiones Artemis tripuladas de la NASA

La NASA y sus socios en todo el país continúan avanzando en las misiones Artemis tripuladas con hardware para los cohetes del Sistema de lanzamiento espacial (SLS) de la NASA para Artemis II, III y IV que ya se encuentran en varias fases de producción, ensamblaje y prueba.

2023-02-07
Alianza para promover el crecimiento verde y la bioeconomía en Colombia

El ministro de Ciencia, Tecnología e Innovación, Arturo Luna, y la directora general adjunta del Instituto Global para el Crecimiento Verde (GGGI por sus siglas en inglés), Helena McLeod, firmaron un Memorando de Entendimiento que consolida su alianza en temas de bioeconomía y crecimiento verde para las regiones del país.

2023-02-07
Proyectos de Exploración: las propuestas disruptivas de la investigación en Chile

Cómo impactan el estrés y la psicoterapia en la salud mental, el arte rupestre, síntesis eficiente de amoniaco, detectores de virus, los efectos del juego en la creatividad, matemáticas para entender la dinámica de los seres vivos, agricultura industrial en el desierto costero y oxigenación de tejidos, son los temas de los proyectos que, con nuevas metodologías, enfoques y objetos de estudio, llegan a romper con el status quo de la investigación, tras ser adjudicados en el concurso Exploración 2022. En esta novedosa propuesta de la ANID, que premia los elementos disruptivos en las distintas áreas de estudio, investigadores de la Universidad Católica lograron ocho proyectos, siete dirigidos por un investigador UC y uno con director adjunto de nuestra casa de estudios.