
Imagen. / ThisIsEngineering en Pexels
2025-11-21
Un nuevo agente de IA aprende a usar CAD para crear objetos 3D a partir de bocetos.
El diseño asistido por computadora (CAD) es el método predilecto para diseñar la mayoría de los productos físicos actuales. Los ingenieros utilizan CAD para convertir bocetos 2D en modelos 3D que luego pueden probar y perfeccionar antes de enviar la versión final a la línea de producción. Sin embargo, el software es notoriamente complejo de aprender, con miles de comandos entre los que elegir. Dominarlo por completo requiere muchísimo tiempo y práctica.
Ingenieros del MIT buscan simplificar el aprendizaje del diseño asistido por computadora (CAD) con un modelo de IA que utiliza el software de forma similar a como lo haría una persona. A partir de un boceto 2D de un objeto, el modelo crea rápidamente una versión 3D haciendo clic en botones y opciones de archivo, de manera parecida a como un ingeniero usaría el software.
El equipo del MIT ha creado un nuevo conjunto de datos llamado VideoCAD, que contiene más de 41 000 ejemplos de cómo se construyen modelos 3D en software CAD. Al aprender de estos vídeos, que ilustran cómo se construyen diferentes formas y objetos paso a paso, el nuevo sistema de IA ahora puede operar software CAD de forma muy similar a como lo haría un usuario humano.
Con VideoCAD, el equipo está trabajando en un "copiloto CAD" con inteligencia artificial. Prevén que esta herramienta no solo pueda crear versiones 3D de un diseño, sino también trabajar con un usuario humano para sugerir los siguientes pasos o llevar a cabo automáticamente secuencias de construcción que, de otro modo, serían tediosas y consumirían mucho tiempo si se realizaran manualmente.
“La IA ofrece la oportunidad de aumentar la productividad de los ingenieros y, al mismo tiempo, hacer que el diseño asistido por computadora (CAD) sea más accesible para más personas”, afirma Ghadi Nehme, estudiante de posgrado del Departamento de Ingeniería Mecánica del MIT.
“Esto es significativo porque reduce la barrera de entrada al diseño, ayudando a personas sin años de formación en CAD a crear modelos 3D más fácilmente y a dar rienda suelta a su creatividad”, añade Faez Ahmed, profesor asociado de ingeniería mecánica en el MIT.
Ahmed y Nehme, junto con el estudiante de posgrado Brandon Man y el investigador postdoctoral Ferdous Alam, presentarán su trabajo en la Conferencia sobre Sistemas de Procesamiento de Información Neuronal (NeurIPS) en diciembre.
clic a clic
El nuevo trabajo del equipo amplía los recientes avances en agentes de interfaz de usuario (IU) impulsados por IA: herramientas entrenadas para usar programas informáticos y realizar tareas, como recopilar información en línea automáticamente y organizarla en una hoja de cálculo de Excel. El grupo de Ahmed se preguntó si dichos agentes de IU podrían diseñarse para usar CAD, que abarca muchas más características y funciones, e implica tareas mucho más complejas de las que un agente de IU promedio puede manejar.
En su nuevo trabajo, el equipo se propuso diseñar un agente de interfaz de usuario impulsado por IA que tomara el control del programa CAD para crear una versión 3D de un boceto 2D, paso a paso. Para ello, el equipo analizó primero un conjunto de datos existente de objetos diseñados en CAD por personas. Cada objeto del conjunto de datos incluye la secuencia de comandos de diseño de alto nivel, como «línea de boceto», «círculo» y «extruir», que se utilizaron para construir el objeto final.
Sin embargo, el equipo se percató de que estos comandos de alto nivel por sí solos no bastaban para entrenar a un agente de IA en el uso real de software CAD. Un agente real también debe comprender los detalles de cada acción. Por ejemplo: ¿Qué región del boceto debe seleccionar? ¿Cuándo debe hacer zoom? ¿Y qué parte del boceto debe extruir? Para superar esta limitación, los investigadores desarrollaron un sistema que traduce los comandos de alto nivel en interacciones con la interfaz de usuario.
“Por ejemplo, supongamos que dibujamos un boceto trazando una línea del punto 1 al punto 2”, explica Nehme. “Tradujimos esas acciones de alto nivel a acciones de interfaz de usuario, es decir, decimos: ve desde esta ubicación de píxeles, haz clic, y luego muévete a una segunda ubicación de píxeles y haz clic, mientras tienes seleccionada la operación 'línea'”.
Al final, el equipo generó más de 41 000 vídeos de objetos CAD diseñados por usuarios, cada uno descrito en tiempo real en función de los clics, arrastres del ratón y otras acciones de teclado específicas que el usuario realizó originalmente. Posteriormente, introdujeron todos estos datos en un modelo que desarrollaron para aprender las conexiones entre las acciones de la interfaz de usuario y la generación de objetos CAD.
Una vez entrenado con este conjunto de datos, al que denominan VideoCAD, el nuevo modelo de IA podría tomar un boceto 2D como entrada y controlar directamente el software CAD, haciendo clic, arrastrando y seleccionando herramientas para construir la forma 3D completa. Los objetos variaban en complejidad, desde simples soportes hasta diseños de casas más complejos. El equipo está entrenando el modelo con formas más complejas y prevé que tanto el modelo como el conjunto de datos podrían algún día permitir la creación de asistentes CAD para diseñadores en una amplia gama de campos.
«VideoCAD es un valioso primer paso hacia los asistentes de IA que facilitan la incorporación de nuevos usuarios y automatizan el trabajo de modelado repetitivo que sigue patrones conocidos», afirma Mehdi Ataei, quien no participó en el estudio y es investigador científico sénior en Autodesk Research, empresa que desarrolla nuevas herramientas de software de diseño. «Esta es una base inicial, y me entusiasmaría ver sucesores que abarquen múltiples sistemas CAD, operaciones más complejas como ensamblajes y restricciones, y flujos de trabajo humanos más realistas y con mayor complejidad».
Autor

MIT
Promover la investigación, las innovaciones, la enseñanza y los eventos y las personas de interés periodístico del MIT a la comunidad del campus, los medios de comunicación y el público en general, Comunicar anuncios del Instituto, Publicar noticias de la comunidad para profesores, estudiantes, personal y ex alumnos del MIT. Proporcionar servicios de medios a los miembros de la comunidad, incluido el asesoramiento sobre cómo trabajar con periodistas, Responder a consultas de los medios y solicitudes de entrevistas...