Noticias Actualidad en procesos industriales

Dele visibilidad a su trayectoria académica

Participe en la convocatoria de trabajos inéditos de Virtual Pro.

Publicar Ahora

2022-11-30Rompiendo los límites de escala de la computación analógica

MIT |La nueva técnica podría disminuir los errores que obstaculizan el rendimiento de las redes neuronales ópticas analógicas súper rápidas.

A medida que los modelos de aprendizaje automático se vuelven más grandes y complejos, requieren hardware más rápido y con mayor eficiencia energética para realizar los cálculos. Las computadoras digitales convencionales luchan por mantenerse al día.

Una red neuronal óptica analógica podría realizar las mismas tareas que una digital, como la clasificación de imágenes o el reconocimiento de voz, pero debido a que los cálculos se realizan utilizando luz en lugar de señales eléctricas, las redes neuronales ópticas pueden funcionar muchas veces más rápido y consumir menos energía.

Sin embargo, estos dispositivos analógicos son propensos a errores de hardware que pueden hacer que los cálculos sean menos precisos. Las imperfecciones microscópicas en los componentes de hardware son una de las causas de estos errores. En una red neuronal óptica que tiene muchos componentes conectados, los errores pueden acumularse rápidamente.

Incluso con técnicas de corrección de errores, debido a las propiedades fundamentales de los dispositivos que componen una red neuronal óptica, es inevitable cierta cantidad de error. Una red lo suficientemente grande como para implementarla en el mundo real sería demasiado imprecisa para ser efectiva.

Los investigadores del MIT superaron este obstáculo y encontraron una manera de escalar de manera efectiva una red neuronal óptica. Al agregar un pequeño componente de hardware a los conmutadores ópticos que forman la arquitectura de la red, pueden reducir incluso los errores incorregibles que de otro modo se acumularían en el dispositivo.

Su trabajo podría habilitar una red neuronal analógica súper rápida y eficiente en energía que puede funcionar con la misma precisión que una digital. Con esta técnica, a medida que un circuito óptico se vuelve más grande, la cantidad de error en sus cálculos en realidad disminuye.  

“Esto es notable, ya que va en contra de la intuición de los sistemas analógicos, donde se supone que los circuitos más grandes tienen mayores errores, por lo que los errores establecen un límite en la escalabilidad. Este artículo nos permite abordar la cuestión de la escalabilidad de estos sistemas con un inequívoco”, dice el autor principal Ryan Hamerly, científico visitante en el Laboratorio de Investigación de Electrónica (RLE) y el Laboratorio de Fotónica Cuántica del MIT y científico principal de NTT Research.

Los coautores de Hamerly son el estudiante graduado Saumil Bandyopadhyay y el autor principal Dirk Englund, profesor asociado en el Departamento de Ingeniería Eléctrica y Ciencias de la Computación (EECS) del MIT, líder del Laboratorio de Fotónica Cuántica y miembro de la RLE. La investigación se publica hoy en Nature Communications.

Multiplicando con luz

Una red neuronal óptica se compone de muchos componentes conectados que funcionan como espejos sintonizables y reprogramables. Estos espejos sintonizables se denominan inferómetros Mach-Zehnder (MZI). Los datos de la red neuronal se codifican en luz, que se dispara a la red neuronal óptica desde un láser.

Un MZI típico contiene dos espejos y dos divisores de haz. La luz ingresa por la parte superior de un MZI, donde se divide en dos partes que interfieren entre sí antes de ser recombinada por el segundo divisor de haz y luego reflejada por la parte inferior hacia el siguiente MZI en la matriz. Los investigadores pueden aprovechar la interferencia de estas señales ópticas para realizar operaciones de álgebra lineal complejas, conocidas como multiplicación de matrices, que es la forma en que las redes neuronales procesan los datos.

Pero los errores que pueden ocurrir en cada MZI se acumulan rápidamente a medida que la luz se mueve de un dispositivo al siguiente. Uno puede evitar algunos errores identificándolos con anticipación y ajustando los MZI para que los errores anteriores sean cancelados por dispositivos posteriores en la matriz.

“Es un algoritmo muy simple si sabes cuáles son los errores. Pero estos errores son notoriamente difíciles de determinar porque solo tiene acceso a las entradas y salidas de su chip”, dice Hamerly. “Esto nos motivó a ver si es posible crear una corrección de errores sin calibración”.

Hamerly y sus colaboradores demostraron previamente una técnica matemática que fue un paso más allá. Pudieron inferir con éxito los errores y ajustar correctamente los MZI en consecuencia, pero incluso esto no eliminó todo el error.

Debido a la naturaleza fundamental de un MZI, hay casos en los que es imposible ajustar un dispositivo para que toda la luz fluya por el puerto inferior al siguiente MZI. Si el dispositivo pierde una fracción de luz en cada paso y la matriz es muy grande, al final solo quedará una pequeña cantidad de energía.

“Incluso con la corrección de errores, existe un límite fundamental en lo bueno que puede ser un chip. Los MZI son físicamente incapaces de realizar ciertas configuraciones para las que deben configurarse”, dice.

Entonces, el equipo desarrolló un nuevo tipo de MZI. Los investigadores agregaron un divisor de haz adicional al final del dispositivo, llamándolo 3-MZI porque tiene tres divisores de haz en lugar de dos. Debido a la forma en que este divisor de haz adicional mezcla la luz, se vuelve mucho más fácil para un MZI alcanzar la configuración que necesita para enviar toda la luz a través de su puerto inferior.

Es importante destacar que el divisor de haz adicional tiene un tamaño de solo unos pocos micrómetros y es un componente pasivo, por lo que no requiere ningún cableado adicional. Agregar divisores de haz adicionales no cambia significativamente el tamaño del chip.

Chip más grande, menos errores

Cuando los investigadores realizaron simulaciones para probar su arquitectura, descubrieron que puede eliminar gran parte del error incorregible que dificulta la precisión. Y a medida que la red neuronal óptica se vuelve más grande, la cantidad de error en el dispositivo en realidad disminuye, lo contrario de lo que sucede en un dispositivo con MZI estándar.

Usando 3-MZI, podrían crear un dispositivo lo suficientemente grande para usos comerciales con un error que se ha reducido en un factor de 20, dice Hamerly.

Los investigadores también desarrollaron una variante del diseño MZI específicamente para errores correlacionados. Estos ocurren debido a imperfecciones de fabricación: si el grosor de un chip es ligeramente incorrecto, es posible que todos los MZI estén desviados en aproximadamente la misma cantidad, por lo que los errores son todos similares. Encontraron una manera de cambiar la configuración de un MZI para hacerlo resistente a este tipo de errores. Esta técnica también aumentó el ancho de banda de la red neuronal óptica para que pueda funcionar tres veces más rápido.

Ahora que han mostrado estas técnicas mediante simulaciones, Hamerly y sus colaboradores planean probar estos enfoques en hardware físico y continuar avanzando hacia una red neuronal óptica que puedan implementar de manera efectiva en el mundo real.

Esta investigación está financiada, en parte, por una beca de investigación de posgrado de la Fundación Nacional de Ciencias y la Oficina de Investigación Científica de la Fuerza Aérea de EE. UU.

MIT
Autor
MIT

Promover la investigación, las innovaciones, la enseñanza y los eventos y las personas de interés periodístico del MIT a la comunidad del campus, los medios de comunicación y el público en general, Comunicar anuncios del Instituto, Publicar noticias de la comunidad para profesores, estudiantes, personal y ex alumnos del MIT. Proporcionar servicios de medios a los miembros de la comunidad, incluido el asesoramiento sobre cómo trabajar con periodistas, Responder a consultas de los medios y solicitudes de entrevistas...


2024-04-25
El CSIC presenta un catálogo con sus 100 tecnologías con mayor potencial comercial

La presidenta de la institución, Eloísa del Pino, ha presentado el catálogo, accesible en abierto, que recoge tecnologías disruptivas en distintas áreas del conocimiento para contribuir al desarrollo de la sociedad.

2024-04-25
De epidemias, civilizaciones y la narrativa de Jonathan Kennedy

El libro "Patogénesis: una historia del mundo en ocho plagas" de Jonathan Kennedy explora la idea de que los gérmenes han tenido un papel fundamental en la historia de la humanidad, desde el Neolítico hasta el siglo XXI. Kennedy plantea que nuestra relación con bacterias y virus ha sido determinante en nuestra supervivencia, incluso más que nuestro ingenio o creatividad.

2024-04-24
Emprendedores universitarios recuperan tuberías dañadas

El problema de las fugas hídricas en el país no es un tema nuevo. Un estudio realizado por la UNAM (Agua Capital, Fondo de Agua de la Ciudad de México y el Centro Regional de Seguridad Hídrica) afirma que “las pérdidas de agua en las redes de distribución del Valle de México se estiman entre el 40 y 50 por ciento, aunque no se cuenta con información precisa sobre los volúmenes que no llegan a su destino”.

2024-04-24
Arc Search llega y reta a Chrome con su mejor experiencia de usuario

Arc Search es un navegador que está dando mucho de qué hablar en el mundo de la tecnología. Enfocado en la experiencia de usuario, es una alternativa que integra inteligencia artificial para mejorar la búsqueda y navegación web.

2024-04-23
Nadie puede trabajar solo en ingeniería civil

Para Mikayla Britsch, senior, la ingeniería civil y ambiental es una vocación que requiere habilidades tanto técnicas como humanas.

2024-04-22
Rompiendo paradigmas para descarbonizar el transporte de carga en América Latina y el Caribe

El transporte de carga terrestre es el más importante para la movilización de bienes en la región de América Latina y el Caribe (ALC), llevando más del 70 % de las cargas nacionales de la región. Se estima que el transporte de carga tiene una participación entre el 3-4 % del PIB nacional de los países de la región (Barbero & Guerrero, 2017).