Presentamos Snowball Fight ☃️, nuestro primer entorno de ML-Agents.

Presentamos Snowball Fight ☃️, nuestro primer entorno de ML-Agents.

Estamos emocionados de compartir nuestro primer entorno personalizado de Aprendizaje por Refuerzo Profundo: Snowball Fight 1vs1 🎉.

Snowball Fight es un juego hecho con Unity ML-Agents, donde disparas bolas de nieve contra un agente de Aprendizaje por Refuerzo Profundo. El juego está alojado en Hugging Face Spaces.

👉 Puedes jugarlo en línea aquí

En esta publicación, cubriremos el ecosistema en el que estamos trabajando para investigadores y entusiastas del Aprendizaje por Refuerzo Profundo que utilizan Unity ML-Agents.

Unity ML-Agents en Hugging Face

Unity Machine Learning Agents Toolkit es una biblioteca de código abierto que te permite construir juegos y simulaciones con el motor de juegos Unity para servir como entornos para entrenar agentes inteligentes.

Con este primer paso, nuestro objetivo es construir un ecosistema en Hugging Face para investigadores y entusiastas del Aprendizaje por Refuerzo Profundo que utilizan ML-Agents, con tres características.

  1. Construir y compartir entornos personalizados. Estamos desarrollando y compartiendo entornos emocionantes para experimentar con nuevos problemas: peleas de bolas de nieve, carreras, rompecabezas… Todos ellos serán de código abierto y alojados en el Hub de Hugging Face.
  2. Permitirte alojar fácilmente tus entornos, guardar modelos y compartirlos en el Hub de Hugging Face. Ya hemos publicado el entorno de entrenamiento de Snowball Fight aquí, ¡pero habrá más por venir!
  3. Ahora puedes alojar fácilmente tus demos en Spaces y mostrar tus resultados rápidamente con el resto del ecosistema.

¡Sé parte de la conversación: únete a nuestro servidor de Discord!

Si estás utilizando ML-Agents o estás interesado en el Aprendizaje por Refuerzo Profundo y quieres ser parte de la conversación, puedes unirte a nuestro servidor de Discord. Acabamos de agregar dos canales (y agregaremos más en el futuro):

  • Aprendizaje por Refuerzo Profundo
  • ML-Agents

Nuestro Discord es el lugar donde puedes intercambiar ideas sobre Hugging Face, NLP, Deep RL y más. También es en este Discord donde anunciaremos todos nuestros nuevos entornos y características en el futuro.

¿Qué sigue?

En las próximas semanas y meses, ampliaremos el ecosistema mediante:

  • Escribir algunos tutoriales técnicos sobre ML-Agents.
  • Trabajando en una versión Snowball Fight 2vs2, donde los agentes colaborarán en equipos utilizando MA-POCA, un nuevo algoritmo de Aprendizaje por Refuerzo Profundo que entrena comportamientos cooperativos en un equipo.

  • Y estamos construyendo nuevos entornos personalizados que se alojarán en Hugging Face.

Conclusión

Estamos emocionados de ver en qué estás trabajando con ML-Agents y cómo podemos construir características y herramientas que te ayuden a potenciar tu trabajo.

No olvides unirte a nuestro servidor de Discord para recibir alertas sobre las nuevas características.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Mejorando los Modelos de Lenguaje con Indicaciones Analógicas para Mejorar el Razonamiento

En los últimos años, los modelos de lenguaje han demostrado una notable habilidad para entender y generar texto simil...

Inteligencia Artificial

La retroalimentación colaborativa ayuda a entrenar a los robots

Un enfoque de aprendizaje por refuerzo entrena a los robots utilizando retroalimentación proporcionada por usuarios n...

Inteligencia Artificial

Los exámenes no supervisados en línea proporcionan evaluaciones válidas

Jason Chan y Dahwi Ahn de la Universidad de Iowa State encontraron que las calificaciones en línea y no supervisadas ...

Inteligencia Artificial

IA generativa y agentes multimodales en AWS La clave para desbloquear nuevo valor en los mercados financieros

Los datos multimodales son un componente valioso de la industria financiera, que abarca datos de mercado, económicos,...