¿Podemos mapear escenas a gran escala en tiempo real sin aceleración de GPU? Este artículo de IA presenta ‘ImMesh’ para la localización y mapeo avanzado basado en LiDAR.

¿Es posible mapear escenas a gran escala en tiempo real sin aceleración de GPU? Este artículo de IA presenta 'ImMesh' para la localización y mapeo avanzado basado en LiDAR.

Proporcionando un entorno virtual que coincide con el mundo real, el reciente aumento generalizado de aplicaciones en 3D, incluyendo el metaverso, realidad virtual/aumentada, videojuegos y simuladores físicos, ha mejorado el estilo de vida humano y aumentado la eficiencia productiva. Estos programas se basan en mallas triangulares, que representan la geometría intrincada de los entornos reales. La mayoría de las aplicaciones en 3D actuales dependen de mallas triangulares, que son colecciones de vértices y caras de triángulos, como una herramienta básica para modelar objetos. Reckless, en su capacidad para agilizar y acelerar el renderizado y el trazado de rayos, también es útil en la simulación de sensores, mapeo denso y topografía, dinámica de cuerpos rígidos, detección de colisiones y más. Sin embargo, la malla actual es en su mayoría el resultado de talentosos modeladores en 3D que utilizan software de diseño asistido por computadora (CAD), lo que dificulta la capacidad de producir en masa la malla de escenas grandes. Por lo tanto, un tema prominente en la comunidad de reconstrucción en 3D es el desarrollo de un enfoque de malla eficiente capaz de una reconstrucción de escenas en tiempo real, especialmente para escenas grandes.

Uno de los desafíos más difíciles en computación, robótica y visión en 3D es la reconstrucción de mallas en tiempo real de escenas grandes a partir de mediciones de sensores. Esto implica recrear superficies de escenas con caras triangulares cercanas entre sí y conectadas por bordes. La construcción del marco geométrico con gran precisión es esencial para este desafío difícil, al igual que la reconstrucción de la cara triangular en superficies del mundo real.

Para lograr el objetivo de reconstrucción de mallas en tiempo real y localización simultánea, un estudio reciente realizado por la Universidad de Hong Kong y la Universidad del Sur de Ciencia y Tecnología presenta un marco SLAM llamado ImMesh. ImMesh es un sistema meticulosamente desarrollado que se basa en cuatro módulos interdependientes que trabajan juntos para proporcionar resultados precisos y eficientes. ImMesh utiliza un sensor LiDAR para lograr tanto la reconstrucción de mallas como la localización al mismo tiempo. ImMesh contiene un novedoso algoritmo de reconstrucción de mallas basado en su trabajo anterior, VoxelMap. Más específicamente, el módulo de mallas propuesto utiliza voxelización para dividir el espacio tridimensional y permite la rápida identificación de voxels que contienen puntos de nuevas exploraciones. El siguiente paso en la malla eficiente es reducir la dimensión, lo que convierte el problema de mallas 3D voxel-wise en un problema 2D. La última etapa utiliza los procedimientos de extracción, compromiso y empuje de mallas voxel-wise para recrear incrementalmente las caras triangulares. El equipo afirma que este es el esfuerzo publicado inicial para recrear mallas triangulares de escala grande en línea utilizando una CPU convencional.

Los investigadores probaron a fondo el rendimiento en tiempo de ejecución de ImMesh y la precisión de las mallas utilizando datos sintéticos y del mundo real, comparando sus resultados con baselines conocidos para evaluar cuán bien funcionó. Comenzaron mostrando demos de video en vivo de la reconstrucción rápida de la malla durante la recolección de datos para asegurar un rendimiento general. Después de eso, validaron la capacidad en tiempo real del sistema probando exhaustivamente ImMesh utilizando cuatro conjuntos de datos públicos adquiridos por cuatro sensores LiDAR diferentes en escenarios distintos. Finalmente, compararon el rendimiento de mallas de ImMesh en el Experimento 3 con mallas preexistentes para establecer un punto de referencia. Según los resultados, ImMesh mantiene el mejor rendimiento en tiempo de ejecución de todos los enfoques al tiempo que logra una alta precisión de mallas.

También demuestran cómo utilizar ImMesh para el refuerzo de la nube de puntos LiDAR; este método produce puntos reforzados en un patrón regular, que son más densos y tienen un campo de visión (FoV) más amplio que las exploraciones LiDAR sin procesar. En la Aplicación 2, lograron el objetivo de la reconstrucción de texturas de escena sin pérdidas combinando su propio trabajo con R3LIVE++ e ImMesh.

El equipo destaca que su trabajo no es muy escalable en términos de resolución espacial, lo que representa una gran desventaja. Debido a la densidad de vértices fija, ImMesh tiende a reconstruir la malla de manera ineficiente con muchas caras pequeñas cuando se trata de superficies grandes y planas. El sistema propuesto aún no tiene un mecanismo de corrección de bucle, que es la segunda limitación. Esto significa que existe la posibilidad de un desplazamiento gradual debido a errores de localización acumulativos en áreas revisitadas. Si se produce esta situación de revisita, los resultados de la reconstrucción pueden no ser consistentes. Agregar este trabajo reciente sobre la identificación de bucles utilizando nubes de puntos LiDAR ayudará a los investigadores a superar este problema. Al utilizar este enfoque de detección de bucles, sería posible identificar bucles en tiempo real e implementar correcciones de bucles para reducir el impacto del desplazamiento y mejorar la confiabilidad de los resultados de reconstrucción.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

artificial intelligenceComputer VisionEditors PickStaffTech NewsTechnology

Was this article helpful?

93 out of 132 found this helpful

¿Podemos mapear escenas a gran escala en tiempo real sin aceleración de GPU? Este artículo de IA presenta ‘ImMesh’ para la localización y mapeo avanzado basado en LiDAR.

Was this article helpful?

20 Mejores Comandos de ChatGPT para Escribir en un Blog

Investigadores de Microsoft y Georgia Tech presentan TongueTap reconocimiento multimodal de gestos de lengua con dispositivos usados en la cabeza.

Inteligencia Artificial

Por qué Bankrate renunció a los artículos generados por IA

Conoce a Skill-it un marco de habilidades impulsado por datos para comprender y entrenar modelos de lenguaje

Haz que cada dólar de marketing cuente con la ciencia de datos.

Aquí están las herramientas de IA que uso junto con mis habilidades para ganar $10,000 al mes - Sin tonterías

Esta revisión de investigación de IA explora la integración de imágenes satelitales y aprendizaje profundo para medir la pobreza basada en activos.

Investigadores de Stanford aprovechan el aprendizaje profundo con GLOW e IVES para transformar el acoplamiento molecular y la predicción de la posición de unión del ligando