DeepMind de Google está revolucionando la robótica
DeepMind de Google está revolucionando el campo de la robótica
Gracias a un esfuerzo colaborativo entre Google’s Deepmind y 33 laboratorios académicos, el mundo de la robótica podría dar un giro de 180 grados. El objetivo de esta empresa es romper con el paradigma rígido de conjuntos de datos específicos para tareas específicas.
Según su blog, si tienen éxito, el conjunto de datos Open X-Embodiment y el modelo RT-X podrían dar lugar al nacimiento de un robot de propósito general que pueda aprender y adaptarse a diferentes tipos de robots. En el artículo escrito del proyecto, este amplio equipo de instituciones trabajó en conjunto para recopilar datos de una impresionante variedad de 22 encarnaciones de robots.
En este esfuerzo colosal, se demostraron más de 500 habilidades y 150,000 tareas en un asombroso millón de episodios. Este conjunto de datos se posiciona como la colección de datos robóticos más extensa y diversa hasta la fecha.
- Revolucionando la formación en RCP con CPR-Coach aprovechando la inteligencia artificial para el reconocimiento de errores y evaluación
- Investigadores de UC Berkeley y UCSF revolucionan la generación de video neural presentando LLM-Grounded Video Diffusion (LVD) para mejorar la dinámica espacio-temporal.
- Las mejores 22 alternativas a ChatGPT que puedes probar en 2023 (gratuitas y de pago)
Sin el hardware adecuado, el software no tendría un medio para operar, y ahí es donde entra en juego el modelo RT-X. Este modelo nació a partir de los modelos de transformadores RT-1 y RT-2 de la robótica de Google DeepMind. Fue entrenado con el conjunto de datos Open X-Embodiment y muestra un rendimiento notable en diversas encarnaciones de robots.
En evaluaciones realizadas en universidades académicas asociadas, RT-1-X superó consistentemente a modelos adaptados para tareas específicas, con una mejora promedio del 50%. Este éxito señala un cambio monumental hacia el desarrollo de robots más versátiles y adaptables.
Ahora, la verdadera magia de RT-X radica en su capacidad para adquirir habilidades emergentes al extraer conocimientos de diferentes robots. Los experimentos con RT-2-X muestran una mejora triple en la realización de tareas que antes estaban fuera de sus capacidades.
Esto incluye una mejor comprensión espacial, como se ve en la diferencia sutil entre los comandos “mover la manzana cerca de la tela” y “mover la manzana sobre la tela”. El conjunto de habilidades ampliado de RT-2-X destaca el inmenso potencial del entrenamiento conjunto con datos diversos, especialmente cuando se combina con arquitecturas de alta capacidad.
Como demuestra este trabajo, los modelos capaces de generalizar entre encarnaciones no solo son posibles sino increíblemente prometedores. Las posibilidades son vastas, desde la integración de mecanismos de auto-mejora hasta la exploración del impacto de diferentes mezclas de conjuntos de datos en la generalización entre encarnaciones. Estos avances están impulsando la investigación en robótica hacia territorios desconocidos.
Pero con avances como este, el día de la robótica de propósito general podría estar más cerca de lo esperado. Y si se demuestra que es rentable construirlo a gran escala, podría ayudar a revolucionar la industria de manera similar a como lo hizo la máquina de vapor.
Google DeepMind también lanzó una animación interesante sobre el RT-X que puedes ver a continuación:
We will continue to update Zepes; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- Prepara tus datos para Amazon Personalize con Amazon SageMaker Data Wrangler
- Las 10 principales empresas de computación cuántica en el mundo (2024)
- ¿Tu conjunto de datos tiene valores faltantes? ¡No hagas nada!
- Preguntas visuales y respuestas con modelos de lenguaje grandes congelados
- De-codificado Transformers explicados en un lenguaje sencillo
- Revisión de Lovo.ai ¿El mejor generador de voz AI en octubre de 2023?
- Tu propia LLaMa personal