La retroalimentación colaborativa ayuda a entrenar a los robots

La retroalimentación colaborativa, un apoyo esencial en el entrenamiento de robots

Este nuevo enfoque permite recopilar comentarios de manera asincrónica, para que usuarios no expertos de todo el mundo puedan contribuir a la enseñanza del agente. ¶ Crédito: Christine Daniloff, MIT/iStock

Un enfoque de aprendizaje por refuerzo desarrollado por investigadores del Instituto de Tecnología de Massachusetts (MIT), la Universidad de Harvard y la Universidad de Washington entrena a los robots utilizando comentarios recopilados de usuarios no expertos.

Marcel Torne, del MIT, dijo que con el método de Exploración Guiada por Humanos (HuGE, por sus siglas en inglés), “La función de recompensa guía al agente hacia lo que debe explorar, en lugar de decirle exactamente qué debe hacer para completar la tarea”.

Los investigadores dividieron el proceso en dos partes, utilizando un algoritmo selector de objetivos que se actualiza continuamente con comentarios humanos recopilados y otro algoritmo que permite al agente de inteligencia artificial explorar de manera auto supervisada, guiado por el selector de objetivos.

Tanto en pruebas simuladas como en pruebas del mundo real, HuGE permitió a los agentes completar objetivos más rápidamente que otros métodos. De MIT News Ver artículo completo

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

artificial intelligencecomputer applicationscomputers and societyhuman-computer interaction

Was this article helpful?

93 out of 132 found this helpful

La retroalimentación colaborativa ayuda a entrenar a los robots

Was this article helpful?

Cuantificar Patrones de Transporte Utilizando Datos GTFS

Chip fotónico ‘se ajusta como un Lego

Inteligencia Artificial

Los empleados quieren ChatGPT en el trabajo. Los jefes se preocupan de que revelen secretos.

Alibaba AI libera en código abierto la serie Qwen que incluye Qwen-1.8B, Qwen-7B, Qwen-14B y Qwen-72B junto con la serie Qwen-Chat.

Procesamiento del Lenguaje Natural Más allá de BERT y GPT

Microsoft Bing acelera la entrega de anuncios con NVIDIA Triton.

Microsoft redefine los 7 TB de 'Project Silica' como solución de almacenamiento en la nube usando vidrio como medio

Sistemas de IA Sesgos desenterrados y la apasionante búsqueda de la verdadera equidad