¿Podemos mapear escenas a gran escala en tiempo real sin aceleración de GPU? Este artículo de IA presenta ‘ImMesh’ para la localización y mapeo avanzado basado en LiDAR.
¿Es posible mapear escenas a gran escala en tiempo real sin aceleración de GPU? Este artículo de IA presenta 'ImMesh' para la localización y mapeo avanzado basado en LiDAR.
Proporcionando un entorno virtual que coincide con el mundo real, el reciente aumento generalizado de aplicaciones en 3D, incluyendo el metaverso, realidad virtual/aumentada, videojuegos y simuladores físicos, ha mejorado el estilo de vida humano y aumentado la eficiencia productiva. Estos programas se basan en mallas triangulares, que representan la geometría intrincada de los entornos reales. La mayoría de las aplicaciones en 3D actuales dependen de mallas triangulares, que son colecciones de vértices y caras de triángulos, como una herramienta básica para modelar objetos. Reckless, en su capacidad para agilizar y acelerar el renderizado y el trazado de rayos, también es útil en la simulación de sensores, mapeo denso y topografía, dinámica de cuerpos rígidos, detección de colisiones y más. Sin embargo, la malla actual es en su mayoría el resultado de talentosos modeladores en 3D que utilizan software de diseño asistido por computadora (CAD), lo que dificulta la capacidad de producir en masa la malla de escenas grandes. Por lo tanto, un tema prominente en la comunidad de reconstrucción en 3D es el desarrollo de un enfoque de malla eficiente capaz de una reconstrucción de escenas en tiempo real, especialmente para escenas grandes.
Uno de los desafíos más difíciles en computación, robótica y visión en 3D es la reconstrucción de mallas en tiempo real de escenas grandes a partir de mediciones de sensores. Esto implica recrear superficies de escenas con caras triangulares cercanas entre sí y conectadas por bordes. La construcción del marco geométrico con gran precisión es esencial para este desafío difícil, al igual que la reconstrucción de la cara triangular en superficies del mundo real.
Para lograr el objetivo de reconstrucción de mallas en tiempo real y localización simultánea, un estudio reciente realizado por la Universidad de Hong Kong y la Universidad del Sur de Ciencia y Tecnología presenta un marco SLAM llamado ImMesh. ImMesh es un sistema meticulosamente desarrollado que se basa en cuatro módulos interdependientes que trabajan juntos para proporcionar resultados precisos y eficientes. ImMesh utiliza un sensor LiDAR para lograr tanto la reconstrucción de mallas como la localización al mismo tiempo. ImMesh contiene un novedoso algoritmo de reconstrucción de mallas basado en su trabajo anterior, VoxelMap. Más específicamente, el módulo de mallas propuesto utiliza voxelización para dividir el espacio tridimensional y permite la rápida identificación de voxels que contienen puntos de nuevas exploraciones. El siguiente paso en la malla eficiente es reducir la dimensión, lo que convierte el problema de mallas 3D voxel-wise en un problema 2D. La última etapa utiliza los procedimientos de extracción, compromiso y empuje de mallas voxel-wise para recrear incrementalmente las caras triangulares. El equipo afirma que este es el esfuerzo publicado inicial para recrear mallas triangulares de escala grande en línea utilizando una CPU convencional.
- 20 Mejores Comandos de ChatGPT para Escribir en un Blog
- Manteniendo los costos de infraestructura de IA bajos con gobernanza de API
- Observabilidad de Datos Confiabilidad en la Era de la IA
Los investigadores probaron a fondo el rendimiento en tiempo de ejecución de ImMesh y la precisión de las mallas utilizando datos sintéticos y del mundo real, comparando sus resultados con baselines conocidos para evaluar cuán bien funcionó. Comenzaron mostrando demos de video en vivo de la reconstrucción rápida de la malla durante la recolección de datos para asegurar un rendimiento general. Después de eso, validaron la capacidad en tiempo real del sistema probando exhaustivamente ImMesh utilizando cuatro conjuntos de datos públicos adquiridos por cuatro sensores LiDAR diferentes en escenarios distintos. Finalmente, compararon el rendimiento de mallas de ImMesh en el Experimento 3 con mallas preexistentes para establecer un punto de referencia. Según los resultados, ImMesh mantiene el mejor rendimiento en tiempo de ejecución de todos los enfoques al tiempo que logra una alta precisión de mallas.
También demuestran cómo utilizar ImMesh para el refuerzo de la nube de puntos LiDAR; este método produce puntos reforzados en un patrón regular, que son más densos y tienen un campo de visión (FoV) más amplio que las exploraciones LiDAR sin procesar. En la Aplicación 2, lograron el objetivo de la reconstrucción de texturas de escena sin pérdidas combinando su propio trabajo con R3LIVE++ e ImMesh.
El equipo destaca que su trabajo no es muy escalable en términos de resolución espacial, lo que representa una gran desventaja. Debido a la densidad de vértices fija, ImMesh tiende a reconstruir la malla de manera ineficiente con muchas caras pequeñas cuando se trata de superficies grandes y planas. El sistema propuesto aún no tiene un mecanismo de corrección de bucle, que es la segunda limitación. Esto significa que existe la posibilidad de un desplazamiento gradual debido a errores de localización acumulativos en áreas revisitadas. Si se produce esta situación de revisita, los resultados de la reconstrucción pueden no ser consistentes. Agregar este trabajo reciente sobre la identificación de bucles utilizando nubes de puntos LiDAR ayudará a los investigadores a superar este problema. Al utilizar este enfoque de detección de bucles, sería posible identificar bucles en tiempo real e implementar correcciones de bucles para reducir el impacto del desplazamiento y mejorar la confiabilidad de los resultados de reconstrucción.
We will continue to update Zepes; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- Navegando el liderazgo en software en una era dinámica
- 3 Poderosas Bibliotecas de Python para (Parcialmente) Automatizar EDA Y Ayudarte a Comenzar con tu Proyecto de Datos
- Introducción a la Optimización Matemática en Python
- 15 Proyectos Guiados para Reforzar tus Habilidades en Ciencia de Datos
- Control de versiones en la práctica datos, modelo de ML y código
- Investigadores de Microsoft presentan el Marco de Consorcio Confidencial (CCF) un marco de inteligencia artificial de propósito general para el desarrollo de aplicaciones de la CIA seguras y con estado.
- Investigadores de Google DeepMind presentan DiLoCo un novedoso algoritmo de aprendizaje automático distribuido y de baja comunicación para un entrenamiento efectivo y resistente de modelos de lenguaje grandes.