Revolutionizando la Navegación Investigadores del MIT Presentan un Nuevo Enfoque de Aprendizaje Automático para la Estabilización y Evitación de Obstáculos en Vehículos Autónomos.
Nuevo enfoque de aprendizaje automático para estabilización y evitación de obstáculos en vehículos autónomos presentado por investigadores del MIT.
Investigadores del MIT han desarrollado una técnica innovadora que permite a las máquinas resolver problemas de estabilización y evitación complejos de manera más efectiva que los métodos anteriores. El nuevo enfoque de aprendizaje automático, presentado en un artículo por el autor principal Oswin So y el autor senior Chuchu Fan, permite que los aviones autónomos naveguen por terrenos peligrosos con un aumento de diez veces en la estabilidad y logren sus objetivos mientras garantizan la seguridad.
El problema de estabilización y evitación se refiere al conflicto que enfrentan los aviones autónomos al intentar alcanzar sus objetivos mientras evitan colisiones con obstáculos o la detección por radar. Muchos de los métodos de IA existentes no pueden superar este desafío, lo que dificulta su capacidad para cumplir la misión de manera segura.
Para abordar este problema, los investigadores del MIT idearon una solución de dos pasos. Primero, reformularon el problema de estabilización y evitación como un problema de optimización restringida, lo que permitió al agente llegar y estabilizarse dentro de una región objetivo designada. Al incorporar restricciones, aseguraron que el agente evitara efectivamente los obstáculos.
- NVIDIA Research gana el desafío de conducción autónoma y el premio a la innovación en CVPR.
- Generación de columnas en programación lineal y el problema de corte de stock.
- Sensor de alcohol móvil para la muñeca podría impulsar la investigación sobre el consumo de alcohol.
El segundo paso consistió en reformular el problema de optimización restringida en la forma epígrafe, una representación matemática que podría resolverse utilizando un algoritmo de aprendizaje por refuerzo profundo. Al superar las limitaciones de los enfoques de aprendizaje por refuerzo existentes, los investigadores pudieron derivar expresiones matemáticas específicas para el sistema y combinarlas con técnicas de ingeniería existentes.
Los investigadores realizaron experimentos de control con varias condiciones iniciales para probar su enfoque. Su método estabilizó todas las trayectorias mientras mantenía la seguridad, superando varios métodos de línea base. En un escenario inspirado en una película de “Top Gun”, los investigadores simularon un avión a reacción volando por un corredor estrecho cerca del suelo. Su controlador estabilizó efectivamente el avión a reacción, evitando choques o estancamientos y superando otros métodos de línea base.
Esta técnica innovadora tiene aplicaciones prometedoras en el diseño de controladores para robots altamente dinámicos que requieren garantías de seguridad y estabilidad, como drones de entrega autónomos. También podría implementarse como parte de sistemas más grandes, ayudando a los conductores a navegar por condiciones peligrosas, por ejemplo, restableciendo la estabilidad cuando un automóvil se desliza en una carretera nevada.
Los investigadores prevén proporcionar al aprendizaje por refuerzo las garantías de seguridad y estabilidad necesarias para implementar controladores en sistemas críticos para las misiones. Este enfoque representa un paso significativo hacia la consecución de ese objetivo. En el futuro, el equipo planea mejorar la técnica para tener en cuenta la incertidumbre al resolver la optimización y evaluar su rendimiento cuando se implementa en hardware, considerando las dinámicas de escenarios del mundo real.
Expertos no involucrados en la investigación han elogiado al equipo del MIT por mejorar el rendimiento del aprendizaje por refuerzo en sistemas donde la seguridad es primordial. La capacidad de generar controladores seguros para escenarios complejos, incluido un modelo de avión a reacción no lineal, tiene implicaciones de gran alcance para el campo.
We will continue to update Zepes; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- Una forma más efectiva de entrenar máquinas para situaciones inciertas del mundo real.
- NYU y NVIDIA colaboran en un gran modelo de lenguaje para predecir la readmisión de pacientes.
- Imágenes detalladas desde el espacio ofrecen una imagen más clara de los efectos de la sequía en las plantas.
- Sistema de inyección bacteriano entrega proteínas en ratones y células humanas.
- Un sistema robótico de cuatro patas para jugar al fútbol en diversos terrenos.
- Investigadores de MIT CSAIL discuten las fronteras del AI generativo.
- El sistema de IA puede generar proteínas novedosas que cumplan con los objetivos de diseño estructural.