La retroalimentación colaborativa ayuda a entrenar a los robots

La retroalimentación colaborativa, un apoyo esencial en el entrenamiento de robots

Este nuevo enfoque permite recopilar comentarios de manera asincrónica, para que usuarios no expertos de todo el mundo puedan contribuir a la enseñanza del agente. ¶ Crédito: Christine Daniloff, MIT/iStock

Un enfoque de aprendizaje por refuerzo desarrollado por investigadores del Instituto de Tecnología de Massachusetts (MIT), la Universidad de Harvard y la Universidad de Washington entrena a los robots utilizando comentarios recopilados de usuarios no expertos.

Marcel Torne, del MIT, dijo que con el método de Exploración Guiada por Humanos (HuGE, por sus siglas en inglés), “La función de recompensa guía al agente hacia lo que debe explorar, en lugar de decirle exactamente qué debe hacer para completar la tarea”.

Los investigadores dividieron el proceso en dos partes, utilizando un algoritmo selector de objetivos que se actualiza continuamente con comentarios humanos recopilados y otro algoritmo que permite al agente de inteligencia artificial explorar de manera auto supervisada, guiado por el selector de objetivos.

Tanto en pruebas simuladas como en pruebas del mundo real, HuGE permitió a los agentes completar objetivos más rápidamente que otros métodos. De MIT News Ver artículo completo

Resúmenes derechos de autor © 2023 SmithBucklin, Washington, D.C., EE. UU.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Los empleados quieren ChatGPT en el trabajo. Los jefes se preocupan de que revelen secretos.

Algunos líderes corporativos han prohibido el uso de herramientas de inteligencia artificial generativa debido a preo...

Inteligencia Artificial

Alibaba AI libera en código abierto la serie Qwen que incluye Qwen-1.8B, Qwen-7B, Qwen-14B y Qwen-72B junto con la serie Qwen-Chat.

Con los modelos más recientes de su serie Qwen de modelos de inteligencia artificial de código abierto, Alibaba Cloud...

Inteligencia Artificial

Procesamiento del Lenguaje Natural Más allá de BERT y GPT

El mundo de la tecnología está en constante evolución, y una área que ha experimentado avances significativos es el P...

Aprendizaje Automático

Microsoft Bing acelera la entrega de anuncios con NVIDIA Triton.

El equipo de Jiusheng Chen acaba de acelerarse. Están entregando anuncios personalizados a los usuarios de Microsoft ...

Inteligencia Artificial

Microsoft redefine los 7 TB de 'Project Silica' como solución de almacenamiento en la nube usando vidrio como medio

Microsoft dijo que su tecnología de almacenamiento de medios de vidrio Project Silica puede conservar aproximadamente...

Inteligencia Artificial

Sistemas de IA Sesgos desenterrados y la apasionante búsqueda de la verdadera equidad

La Inteligencia Artificial (IA) ya no es un concepto futurista, se ha convertido en una parte intrínseca de nuestras ...