NVIDIA Research gana el desafío de conducción autónoma y el premio a la innovación en CVPR.

NVIDIA Research wins autonomous driving challenge and innovation award at CVPR.

La próxima semana, NVIDIA será presentada como la ganadora del ferozmente disputado Desafío de Predicción de Ocupación 3D para el desarrollo de conducción autónoma en la Conferencia de Visión por Computadora y Reconocimiento de Patrones (CVPR), en Vancouver, Canadá.

La competencia recibió más de 400 presentaciones de casi 150 equipos en 10 regiones.

La predicción de ocupación 3D es el proceso de prever el estado de cada voxel en una escena, es decir, cada punto de datos en una cuadrícula de vista aérea en 3D. Los voxels pueden identificarse como libres, ocupados o desconocidos.

Crítica para el desarrollo de sistemas de conducción autónoma seguros y robustos, la predicción de cuadrícula de ocupación 3D proporciona información a las pilas de planificación y control de vehículos autónomos (VA) utilizando redes neuronales convolucionales y modelos transformadores de última generación, los cuales son habilitados por la plataforma NVIDIA DRIVE.

“La solución ganadora de NVIDIA presenta dos importantes avances de VA”, dijo Zhiding Yu, científico investigador senior en aprendizaje y percepción en NVIDIA. “Demuestra un diseño de modelo de última generación que proporciona una excelente percepción de vista aérea. También muestra la efectividad de los modelos de fundación visual con hasta 1 billón de parámetros y preentrenamiento a gran escala en predicción de ocupación 3D”.

La percepción para la conducción autónoma ha evolucionado en los últimos años desde el manejo de tareas 2D, como la detección de objetos o espacios libres en imágenes, hasta el razonamiento sobre el mundo en 3D con múltiples imágenes de entrada.

Esto proporciona ahora una representación flexible y precisa de objetos en escenas de tráfico complejas, lo que es “crítico para lograr los requisitos de percepción de seguridad para la conducción autónoma”, según Jose Alvarez, director de investigación aplicada de VA y científico distinguido en NVIDIA.

Yu presentará el trabajo galardonado del equipo de investigación de NVIDIA en el taller de conducción autónoma de extremo a extremo de CVPR el domingo 18 de junio a las 10:20 a.m. PT, así como en el taller de conducción autónoma centrado en la visión el lunes 19 de junio a las 4:00 p.m. PT.

Además de ganar el primer lugar en el desafío, NVIDIA recibirá en el evento un Premio a la Innovación, reconociendo sus “nuevas ideas sobre el desarrollo de módulos de transformación de vista”, con un “rendimiento sustancialmente mejorado” en comparación con enfoques anteriores, según el comité del taller de CVPR.

Lea el informe técnico de NVIDIA sobre la presentación.

Vehículos más seguros con la predicción de ocupación 3D

Mientras que la detección de objetos 3D tradicional, que consiste en detectar y representar objetos en una escena, a menudo usando cajas delimitadoras 3D, es una tarea básica en la percepción de VA, tiene sus limitaciones. Por ejemplo, carece de expresividad, lo que significa que las cajas delimitadoras podrían no representar suficiente información del mundo real. También requiere definir taxonomías y verdades fundamentales para todos los objetos posibles, incluso aquellos que rara vez se ven en el mundo real, como los peligros en la carretera que pueden haber caído de un camión.

En contraste, la predicción de ocupación 3D proporciona información detallada sobre el mundo a la pila de planificación de un vehículo autónomo, que es necesaria para la conducción autónoma de extremo a extremo.

Los vehículos definidos por software pueden actualizarse continuamente con nuevos desarrollos que se comprueban y validan con el tiempo. Las actualizaciones de software de última generación que evolucionan a partir de iniciativas de investigación, como las reconocidas en CVPR, están permitiendo nuevas funciones y capacidades de conducción más seguras.

La plataforma NVIDIA DRIVE ofrece un camino hacia la producción para los fabricantes de automóviles, proporcionando hardware y software de pila completa para el desarrollo seguro y protegido de VA, desde el automóvil hasta el centro de datos.

Más sobre el Desafío CVPR

El Desafío de Predicción de Ocupación 3D en CVPR requería que los participantes desarrollaran algoritmos que solo usaran entrada de cámara durante la inferencia. Los participantes podían utilizar conjuntos de datos y modelos de código abierto, lo que facilitaba la exploración de algoritmos controlados por datos y modelos a gran escala. Los organizadores proporcionaron un sandbox de referencia para los últimos algoritmos de predicción de ocupación 3D de última generación en escenarios del mundo real.

NVIDIA en CVPR

NVIDIA presenta casi 30 artículos y presentaciones en CVPR. Los expertos que hablarán sobre la conducción autónoma incluyen:

  • Jose Alvarez sobre los desafíos emergentes para la percepción 3D en VA durante el taller de conducción autónoma de extremo a extremo: Taller de tareas y desafíos emergentes; y sobre la optimización de modelos profundos grandes para la inferencia en tiempo real en el Taller de visión integrada.
  • Nikolai Smolyanskiy, director de aprendizaje profundo en NVIDIA, sobre la predicción de tráfico en tiempo real para VA durante el taller de conducción autónoma de extremo a extremo: Percepción, Predicción, Planificación y Simulación.
  • Robin Jenkin, ingeniero distinguido en NVIDIA, sobre la calidad de imagen en cámaras de ojo de pez en el taller OmniCV, celebrado en conjunto con CVPR.
  • Xinshuo Weng, científico investigador en investigación de VA en NVIDIA, sobre soluciones de visión para la conducción autónoma durante el taller de conducción autónoma centrado en la visión.

Ve otras charlas en la agenda y aprende más sobre NVIDIA en CVPR, que se lleva a cabo del 18 al 22 de junio.

Imagen destacada cortesía de OccNet y Occ3D.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Clave maestra para la separación de fuentes de audio Presentamos AudioSep para separar cualquier cosa que describas

La Análisis de Escena Auditiva Computacional (CASA, por sus siglas en inglés) es un campo dentro del procesamiento de...

Aprendizaje Automático

FastAPI y Streamlit El dúo de Python que debes conocer.

Buckets de GCP/GCS. Backend de FastAPI que carga las predicciones. Construir un panel de predicciones y monitoreo uti...

Inteligencia Artificial

Conoce al Omnívoro Diseñador Industrial combina el Arte y el OpenUSD para crear Activos 3D para el Entrenamiento de IA

Nota del editor: esta publicación es parte de nuestra serie Conoce al Omnivore, que presenta a creadores y desarrolla...

Noticias de Inteligencia Artificial

La IA Generativa Puede Contribuir con $4.4 Billones Anualmente McKinsey

La Inteligencia Artificial Generativa, una tecnología innovadora que permite a las máquinas crear contenido de forma ...

Inteligencia Artificial

Superpotencia el entrenamiento de tus modelos de aprendizaje profundo

¿Te has encontrado con situaciones en las que es fácil obtener un impulso inicial en precisión pero una vez que llega...

Inteligencia Artificial

Inteligencia Artificial y Cambio Climático

Muchas veces, vemos, escuchamos y leemos episodios climáticos en revistas y noticias que automáticamente se vinculan ...