Investigadores del MIT desarrollaron una técnica de Inteligencia Artificial (IA) que permite a un robot desarrollar planes complejos para manipular un objeto utilizando toda su mano

Investigadores del MIT desarrollaron una técnica de IA que permite a un robot manipular objetos de manera compleja con toda su mano.

La manipulación de cuerpo completo es una fortaleza de los humanos pero una debilidad de los robots. El robot interpreta cada posible punto de contacto entre la caja y los dedos, brazos o torso del portador como un evento de contacto separado. Esta tarea se vuelve difícil de preparar tan pronto como se consideran las miles de millones de posibles eventos de contacto. Ahora, los investigadores del MIT pueden simplificar esta técnica, llamada planificación de manipulación con muchos contactos. Se utiliza un enfoque de inteligencia artificial llamado suavizado para reducir el número de juicios necesarios para encontrar un buen plan de manipulación para el robot a partir de la gran cantidad de eventos de contacto.

Los nuevos avances en RL han demostrado resultados asombrosos en la manipulación a través de dinámicas ricas en contacto, algo que anteriormente era difícil de lograr utilizando técnicas basadas en modelos. Si bien estas técnicas fueron efectivas, aún no se sabe por qué tuvieron éxito mientras que los enfoques basados en modelos fracasaron. El objetivo principal es comprender y dar sentido a estos factores desde un punto de vista basado en modelos. En base a estas comprensiones, los científicos trabajan para fusionar el éxito empírico de RL con la generalidad y eficacia de los modelos.

La naturaleza híbrida de las dinámicas de contacto representa el mayor desafío para la planificación a través del tacto desde una perspectiva basada en modelos. Dado que las dinámicas resultantes no son suaves, la aproximación de Taylor ya no es válida localmente, y el modelo lineal construido utilizando el gradiente se descompone rápidamente. Dado que tanto la optimización basada en gradientes iterativos como la planificación basada en muestreo utilizan métricas de distancia locales, la invalidez del modelo local plantea dificultades graves para ambos. En respuesta a estos problemas, numerosas publicaciones han intentado tener en cuenta los modos de contacto, ya sea enumerándolos o proporcionando ejemplos de ellos. Estos planificadores, que tienen una comprensión basada en modelos de los modos dinámicos, a menudo alternan entre la planificación de estado continuo en el modo de contacto actual y una búsqueda discreta para el siguiente modo, lo que lleva a trayectorias con algunos cambios de modo aquí y allá.

Lo primero que los investigadores han agregado es la prueba de que las dos estrategias de suavizado son teóricamente equivalentes para sistemas básicos bajo el marco. Además, utilizando este marco, los autores demuestran cómo calcular eficientemente los modelos localmente lineales (es decir, los gradientes) de las dinámicas suavizadas en tiempo real, y demuestran que las características cualitativas y el rendimiento empírico de los dos esquemas de suavizado son comparables en diversos ejemplos complejos.

¿Cuál es el mejor modelo para la planificación de manipulación basada en gradientes y rica en contactos? Es el centro del enfoque de planificación basado en modelos adoptado por los investigadores. Para calcular eficientemente las linealizaciones locales para la planificación, creen que este modelo debe ser (i) numéricamente robusto y (ii) diferenciable. Para que el planificador pueda ver lejos en el futuro con un esfuerzo mínimo, el modelo debe ser capaz de (iii) predecir el comportamiento a largo plazo. Por último, el modelo necesita (iv) ser suave para proporcionar gradientes de información adicionales en los modos de contacto.

La segunda mejora es un modelo completo de las dinámicas de contacto. En particular, sugieren un modelo de contacto con paso de tiempo implícito que es convexo. La relajación de Anitescu del límite de contacto con fricción conduce a la convexidad. Sin embargo, sí introduce algún comportamiento ligeramente no físico en la realidad. En comparación con la formulación estándar del Problema de Complementariedad Lineal (LCP), la convexidad ofrece beneficios numéricos significativos.

La suposición cuasi-dinámica se emplea comúnmente en la manipulación robótica porque permite la previsibilidad a largo plazo. No es necesario tener variables que representen la velocidad o el amortiguamiento en los modelos cuasi-dinámicos porque la energía cinética se pierde en cada paso de tiempo. Verifican y prueban el modelo de contacto cuasi-dinámico mediante la simulación y ejecución de las mismas trayectorias de entrada en Drake, un simulador de segundo orden de alta fidelidad en hardware. Si el sistema en cuestión está altamente amortiguado y dominado por fuerzas de fricción, los resultados sugieren que el modelo puede aproximar mejor las dinámicas de segundo orden.

Además, se puede utilizar una relajación de barrera logarítmica para suavizar el modelo de contacto de manera analítica. En esta estrategia de relajación, se utiliza una función de barrera logarítmica para imponer las restricciones de contacto duro de manera flexible, como es típico en el método del punto interior para sistemas convexos. Trabajos posteriores demuestran que el teorema de la función implícita proporciona un método sencillo para calcular los gradientes del modelo de contacto suavizado. Por último, los expertos creen que el objetivo de RL de realizar una optimización global con estocasticidad es otro elemento importante detrás de su éxito empírico. La planificación dinámica no lineal utilizando modelos deterministas generalmente produce problemas de optimización no convexos, donde la calidad de muchos mínimos locales puede ser decisiva.

La última contribución aborda esta deficiencia al integrar las capacidades de búsqueda global de RRT con las de abstracción de modo de contacto basada en suavizado. Utilizando una medida de distancia novedosa derivada de los modelos suavizados locales, los investigadores han logrado que RRT pueda buscar a través de los límites impuestos por las dinámicas de contacto.

Contribuciones Generales

Los científicos determinan la equivalencia cualitativa y empírica de las técnicas de suavizado aleatorias y analíticas en sistemas sencillos.

Muestran que la planificación de manipulación rica en contacto puede beneficiarse enormemente de una formulación convexa y diferenciable de la dinámica de contacto cuasi-dinámico y del suavizado analítico asociado.

Los investigadores integran el suavizado del modo de contacto con la planificación de movimiento basada en muestreo para lograr una planificación global efectiva a través de dinámicas de contacto altamente ricas, llenando una brecha en el espectro de enfoques existentes.

Los investigadores aclaran el significado matemático de suavizar una función y varias estrategias para calcular sus aproximaciones locales antes de discutir el contacto en sistemas complicados. Su objetivo es presentar una imagen unificada de las técnicas de suavizado y las relaciones entre ellas.

Los investigadores se inspiraron para hacer esto debido a la diferencia sorprendente entre el éxito del RL en situaciones empíricas con mucho contacto humano y el fracaso de los enfoques basados en modelos. Han demostrado que los enfoques tradicionales basados en modelos pueden abordar eficazmente la planificación para la manipulación rica en contacto identificando las trampas en los métodos basados en modelos existentes para la planificación, comprendiendo cómo el RL pudo aliviar tales trampas y resolviéndolas con técnicas basadas en modelos. Al permitir una planificación en línea eficiente en el orden de un minuto y ser generalizable con respecto a entornos y tareas, la contribución ofrece una alternativa poderosa a las herramientas existentes en RL que dependen de una computación fuera de línea pesada en el orden de horas o días. Revisan algunos de los factores que hicieron esto posible.

En pocas palabras, se inspiraron para realizar este estudio después de darse cuenta de la brecha dramática entre el éxito del RL en contextos empíricos y la lucha de los enfoques basados en modelos para este problema. Han demostrado que los enfoques tradicionales basados en modelos pueden abordar eficazmente la planificación para la manipulación rica en contacto identificando las trampas en los métodos basados en modelos existentes para la planificación, comprendiendo cómo el RL pudo aliviar tales trampas y resolviéndolas con técnicas basadas en modelos. Al permitir una planificación en línea eficiente en el orden de un minuto y ser generalizable con respecto a entornos y tareas, la contribución ofrece una alternativa poderosa a las herramientas existentes en RL que dependen de una computación fuera de línea pesada en el orden de horas o días. Revisan algunos de los factores que hicieron esto posible.

Inicialmente identificada como una falla en los enfoques basados en modelos, la necesidad de enumerar y evaluar explícitamente los modos ha sido mitigada por el suavizado estocástico del RL. A continuación, se ha planteado otra falla en las técnicas basadas en modelos: los transitorios de segundo orden pueden causar linearizaciones de corto alcance que no ayudan con la estrategia a largo plazo. Han propuesto el modelo de Contacto Cuasi-Dinámico Convexo Diferenciable (CQDC) para abordar esta deficiencia. Han demostrado la utilidad del modelo de contacto a través de numerosos argumentos teóricos y experimentos. También demostraron que la dinámica de contacto se puede relajar analíticamente con una barrera logarítmica evaluando primero la estructura del modelo. Realizaron estudios que demostraron las ventajas computacionales del suavizado analítico sobre el suavizado aleatorio.

En conclusión, encontraron que las estrategias basadas en el suavizado se han relacionado con la optimización de trayectorias locales. En comparación con las técnicas basadas en RL que intentan realizar una búsqueda global, han demostrado ser menos exitosas en problemas desafiantes debido a su susceptibilidad a mínimos locales. Sin embargo, las técnicas SBMP para sistemas ricos en contacto han evitado la trampa de la enumeración de modos al tener en cuenta explícitamente los modos de contacto. El trabajo contribuye cerrando una brecha en los enfoques preexistentes al fusionar el suavizado de modos con RRT, donde la fase de exploración de RRT fue guiada por una aproximación local al sustituto suave basada en la métrica de Mahalanobis local. Al combinar estos tres avances, han logrado que los enfoques basados en modelos y basados en RL logren una planificación de movimiento global eficiente para sistemas muy ricos en contacto y de alta dimensionalidad. En el futuro, utilizarán una versión altamente optimizada del planificador para guiar búsquedas de políticas o realizar planificación de movimiento en tiempo real. Anticipan que esta mejora permitirá que los robots localicen diseños ricos en contacto en línea en áreas previamente inexploradas en cuestión de segundos de tiempo de planificación.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Ciencias de la Computación

Impulsado hacia lo autónomo

El camino de Cindy Alejandra Heredia desde Laredo, Texas, la llevó a liderar el equipo de vehículos autónomos del MIT...

Inteligencia Artificial

Primera parte del cuerpo humano derivada 3D impresa en el espacio

La empresa aeroespacial estadounidense Redwire dijo que ha impreso en tres dimensiones una parte del cuerpo humano en...

Inteligencia Artificial

Meta presenta Emu Video y Emu Edit Avances pioneros en la generación de videos a partir de texto y en la edición precisa de imágenes.

“`html En el campo en constante evolución de la IA generativa, persisten desafíos para lograr modelos eficiente...

Inteligencia Artificial

Los modelos de IA son poderosos, pero ¿son biológicamente plausibles?

Un nuevo estudio que une la neurociencia y el aprendizaje automático ofrece información sobre el posible papel de los...