Noticias Actualidad en procesos industriales

Dele visibilidad a su trayectoria académica

Participe en la convocatoria de trabajos inéditos de Virtual Pro.

Publicar Ahora

2021-10-083 preguntas: Kalyan Veeramachaneni sobre los obstáculos que impiden el aprendizaje automático total

MIT |Los investigadores esperan que los sistemas de aprendizaje automático más fáciles de usar permitan a los no expertos analizar los grandes datos, pero ¿podrán estos sistemas ser alguna vez completamente autónomos?

La proliferación de big data en diversos ámbitos, desde la banca hasta la atención sanitaria o la vigilancia del medio ambiente, ha impulsado una creciente demanda de herramientas de aprendizaje automático que ayuden a las organizaciones a tomar decisiones basadas en los datos que recopilan.

Esta creciente demanda del sector ha llevado a los investigadores a explorar las posibilidades del aprendizaje automático (AutoML), que pretende automatizar el desarrollo de soluciones de aprendizaje automático para hacerlas accesibles a los no expertos, mejorar su eficiencia y acelerar la investigación en este campo. Por ejemplo, un sistema AutoML podría permitir a los médicos utilizar su experiencia en la interpretación de los resultados de la electroencefalografía (EEG) para construir un modelo que pueda predecir qué pacientes tienen mayor riesgo de sufrir epilepsia, sin necesidad de que los médicos tengan conocimientos de ciencia de datos.

Sin embargo, a pesar de más de una década de trabajo, los investigadores no han podido automatizar completamente todos los pasos del proceso de desarrollo del aprendizaje automático. Incluso los sistemas comerciales más eficaces de AutoML siguen requiriendo un prolongado intercambio de información entre un experto en la materia, como un director de marketing o un ingeniero mecánico, y un científico de datos, lo que hace que el proceso sea ineficiente.

Kalyan Veeramachaneni, investigador principal del Laboratorio de Sistemas de Información y Decisión del MIT que lleva estudiando el AutoML desde 2010, es coautor de un artículo en la revista ACM Computing Surveys que detalla un esquema de siete niveles para evaluar las herramientas de AutoML en función de su nivel de autonomía.

Un sistema en el nivel cero no tiene automatización y requiere que un científico de datos empiece desde cero y construya modelos a mano, mientras que una herramienta en el nivel seis está completamente automatizada y puede ser utilizada fácil y eficazmente por un no experto. La mayoría de los sistemas comerciales se sitúan en un punto intermedio.

Veeramachaneni habló con MIT News sobre el estado actual de AutoML, los obstáculos que impiden los sistemas de aprendizaje automático y el camino que tienen por delante los investigadores de AutoML.

P: ¿Cómo ha evolucionado el aprendizaje automático de máquinas en la última década y cuál es el estado actual de los sistemas AutoML?

R: En 2010, empezamos a ver un cambio, con empresas que querían invertir en obtener valor de sus datos más allá de la inteligencia empresarial. Entonces surgió la pregunta: ¿quizás haya ciertas cosas en el desarrollo de soluciones basadas en el aprendizaje automático que podamos automatizar? La primera iteración de AutoML fue para hacer más eficiente nuestro propio trabajo como científicos de datos. ¿Podemos eliminar el trabajo sucio que hacemos en el día a día y automatizarlo mediante un sistema de software? Esa área de investigación siguió su curso hasta aproximadamente 2015, cuando nos dimos cuenta de que todavía no éramos capaces de acelerar este proceso de desarrollo.

Entonces surgió otro hilo conductor. Hay muchos problemas que podrían resolverse con datos, y provienen de expertos que conocen esos problemas, que conviven con ellos a diario. Estas personas tienen muy poco que ver con el aprendizaje automático o la ingeniería de software. ¿Cómo los incorporamos al redil? Esa es realmente la siguiente frontera.

Hay tres áreas en las que estos expertos en la materia tienen una gran influencia en un sistema de aprendizaje automático. La primera es la definición del problema en sí y la ayuda para formularlo como una tarea de predicción que debe resolver un modelo de aprendizaje automático. En segundo lugar, conocen cómo se han recogido los datos, por lo que también saben intuitivamente cómo procesarlos. Y en tercer lugar, al final, los modelos de aprendizaje automático sólo te dan una parte muy pequeña de la solución: sólo te dan una predicción. El resultado de un modelo de aprendizaje automático es sólo una entrada para ayudar a un experto en la materia a tomar una decisión o una acción.

P: ¿Qué pasos del proceso de aprendizaje automático son los más difíciles de automatizar y por qué ha sido tan complicado hacerlo?

R: La parte de formulación del problema es extremadamente difícil de automatizar. Por ejemplo, si soy un investigador que quiere conseguir más financiación gubernamental, y tengo muchos datos sobre el contenido de las propuestas de investigación que escribo y si recibo o no financiación, ¿puede el aprendizaje automático ayudar en ese aspecto? Todavía no lo sabemos. En la formulación de problemas, utilizo mi experiencia en el dominio para traducir el problema en algo que sea más tangible de predecir, y eso requiere a alguien que conozca muy bien el dominio. Y también sabe cómo utilizar esa información después de la predicción. Ese problema se niega a ser automatizado.

Hay una parte de la formulación del problema que podría automatizarse. Resulta que podemos observar los datos y expresar matemáticamente varias tareas de predicción posibles de forma automática. A continuación, podemos compartir esas tareas de predicción con el experto en el dominio para ver si alguna de ellas podría ayudar en el problema más amplio que están tratando de abordar. Una vez elegida la tarea de predicción, hay muchos pasos intermedios, como la ingeniería de características, el modelado, etc., que son pasos muy mecánicos y fáciles de automatizar.

Pero la definición de las tareas de predicción ha sido normalmente un esfuerzo de colaboración entre los científicos de datos y los expertos en el dominio porque, a menos que se conozca el dominio, no se puede traducir el problema del dominio en una tarea de predicción. Y, además, a veces los expertos del dominio no saben qué se entiende por "predicción". Eso da lugar a las grandes e importantes idas y venidas del proceso. Si se automatiza ese paso, la penetración del aprendizaje automático y el uso de los datos para crear predicciones significativas aumentarán enormemente.

Entonces, ¿qué ocurre después de que el modelo de aprendizaje automático dé una predicción? Podemos automatizar la parte del software y la tecnología, pero al final se trata del análisis de la causa raíz y de la intuición y la toma de decisiones humanas. Podemos aumentarlas con muchas herramientas, pero no podemos automatizarlas por completo.

P: ¿Qué espera conseguir con el marco de siete niveles para evaluar los sistemas AutoML que describe en su documento?

R: Mi esperanza es que la gente empiece a reconocer que ya se han alcanzado algunos niveles de automatización y que otros aún deben ser abordados. En la comunidad investigadora, tendemos a centrarnos en lo que nos resulta cómodo. Nos hemos acostumbrado a automatizar ciertos pasos y nos limitamos a ello. Automatizar estas otras partes del desarrollo de soluciones de aprendizaje automático es muy importante, y ahí es donde siguen los mayores cuellos de botella.

Mi segunda esperanza es que los investigadores entiendan muy claramente lo que significa la experiencia en el dominio. Gran parte de este trabajo de AutoML sigue siendo realizado por académicos, y el problema es que a menudo no hacemos trabajo aplicado. No existe una definición clara de lo que es un experto en un dominio y, en sí mismo, "experto en un dominio" es una frase muy nebulosa. Lo que queremos decir con experto en el dominio es el experto en el problema que estás tratando de resolver con el aprendizaje automático. Y espero que todo el mundo se unifique en torno a eso porque eso haría las cosas mucho más claras.

Sigo creyendo que no somos capaces de construir tantos modelos para tantos problemas, pero incluso para los que estamos construyendo, la mayoría de ellos no se están desplegando y utilizando en el día a día. El resultado del aprendizaje automático solo va a ser otro punto de datos, un punto de datos aumentado, en la toma de decisiones de alguien. La forma en que toman esas decisiones, basadas en esos datos, cómo cambiarán su comportamiento y cómo adaptarán su estilo de trabajo, sigue siendo una gran pregunta abierta. Una vez que hayamos automatizado todo, eso es lo que sigue.

Tenemos que determinar lo que tiene que cambiar fundamentalmente en el flujo de trabajo diario de alguien que concede préstamos en un banco, o de un educador que intenta decidir si debe cambiar las tareas en una clase online. ¿Cómo van a utilizar los resultados del aprendizaje automático? Tenemos que centrarnos en las cosas fundamentales que tenemos que construir para que el aprendizaje automático sea más utilizable.


MIT
Autor
MIT

Promover la investigación, las innovaciones, la enseñanza y los eventos y las personas de interés periodístico del MIT a la comunidad del campus, los medios de comunicación y el público en general, Comunicar anuncios del Instituto, Publicar noticias de la comunidad para profesores, estudiantes, personal y ex alumnos del MIT. Proporcionar servicios de medios a los miembros de la comunidad, incluido el asesoramiento sobre cómo trabajar con periodistas, Responder a consultas de los medios y solicitudes de entrevistas...


2024-04-17
Este robot puede saber cuándo estás a punto de sonreír y devolverte la sonrisa

Los emo pueden predecir una sonrisa humana 839 milisegundos antes de que suceda.

2024-04-16
Tokyo Electron: la futurista ASML nipona con la que Japón quiere convertirse en una potencia de los chips

"Estamos trabajando con nuestros clientes para desarrollar tecnologías que se adentran cuatro generaciones en el futuro". Esta declaración de Nobuto Doi, vicepresidente de Tokyo Electron, es toda una declaración de intenciones. Cuando hablamos de la industria de los equipos de fotolitografía la compañía neerlandesa ASML acapara todo el protagonismo. Y lo merece si tenemos presente que actualmente es la única que ha desarrollado máquinas de litografía de ultravioleta extremo (UVE) y su más reciente y avanzada iteración, los equipos UVE de alta apertura.

2024-04-15
Experiencias de gaming en plataformas de Metaverso

Existen multitud de plataformas de Metaverso a las que podemos acceder con nuestro avatar y experimentar diferentes mundos virtuales. Entre las plataformas más destacadas se encuentran Horizon Worlds, Microsoft Mesh, Spatial, Decentraland y VRChat, en las que podemos acceder a ellas desde distintos dispositivos. En algunas de ellas solo podremos disfrutar de la experiencia mediante gafas de realidad virtual (VR) y en otras, que son multidispositivo, es posible acceder desde dispositivos móviles y desktop.

2024-04-11
Una forma mejor y más rápida de evitar que un chatbot de IA dé respuestas tóxicas

Los investigadores crean un curioso modelo de aprendizaje automático que encuentra una variedad más amplia de indicaciones para entrenar un chatbot para evitar resultados odiosos o dañinos.

2024-04-11
Dominar el arte de la formación en robótica para las fábricas del mañana

El equipo del proyecto MASTER, financiado con fondos europeos, lanza su primera convocatoria abierta para desarrolladores de tecnologías de realidad extendida. El objetivo es crear innovaciones digitales de aprendizaje que se utilicen en una plataforma abierta para la formación basada en la realidad extendida en el sector manufacturero.

2024-04-08
Inteligencia Artificial (IA) para la optimización de los procesos industriales

Desde los adelantos tecnológicos con energías generadas por carbón y gas en los siglos XVIII y XIX, los procesos industriales han venido evolucionando hasta llegar a la cuarta revolución industrial.