La retroalimentación colaborativa ayuda a entrenar a los robots
La retroalimentación colaborativa, un apoyo esencial en el entrenamiento de robots
![En el futuro, este método podría ayudar a un robot a aprender a realizar tareas específicas en el hogar de los usuarios rápidamente, sin que el propietario necesite mostrar ejemplos físicos de cada tarea al robot. Este nuevo enfoque permite recopilar comentarios de manera asincrónica, para que usuarios no expertos de todo el mundo puedan contribuir a la enseñanza del agente. ¶ Crédito: Christine Daniloff, MIT/iStock](https://ai.miximages.com/cacm.acm.org/system/assets/0004/6745/120423_iStock_Christine_Daniloff_MIT__faces.large.jpg?1701710004&1701710004)
Un enfoque de aprendizaje por refuerzo desarrollado por investigadores del Instituto de Tecnología de Massachusetts (MIT), la Universidad de Harvard y la Universidad de Washington entrena a los robots utilizando comentarios recopilados de usuarios no expertos.
Marcel Torne, del MIT, dijo que con el método de Exploración Guiada por Humanos (HuGE, por sus siglas en inglés), “La función de recompensa guía al agente hacia lo que debe explorar, en lugar de decirle exactamente qué debe hacer para completar la tarea”.
Los investigadores dividieron el proceso en dos partes, utilizando un algoritmo selector de objetivos que se actualiza continuamente con comentarios humanos recopilados y otro algoritmo que permite al agente de inteligencia artificial explorar de manera auto supervisada, guiado por el selector de objetivos.
Tanto en pruebas simuladas como en pruebas del mundo real, HuGE permitió a los agentes completar objetivos más rápidamente que otros métodos. De MIT News Ver artículo completo
- Cuantificar Patrones de Transporte Utilizando Datos GTFS
- El ex CEO de Google advierte que las actuales barreras de inteligencia artificial no son suficientes
- Pequeño pero poderoso avances de los modelos de lenguaje pequeños en la era de los modelos de lenguaje grandes dominantes
Resúmenes derechos de autor © 2023 SmithBucklin, Washington, D.C., EE. UU.
We will continue to update Zepes; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- 15+ Herramientas de IA para Desarrolladores (Diciembre 2023)
- Aprovechando el poder de las APIs Moldeando la hoja de ruta del producto y elevando las experiencias de los usuarios a través de la autenticación
- Una guía paso a paso para modelos de lenguaje pequeños en CPUs locales
- Alibaba prioriza esto sobre la computación cuántica
- Integración de datos e información impulsada por IA
- Dominando los flujos de trabajo de la ciencia de datos con ChatGPT
- Introducción comprensiva a la Inteligencia Artificial General (IAG)