Presentamos Snowball Fight ☃️, nuestro primer entorno de ML-Agents.

Estamos emocionados de compartir nuestro primer entorno personalizado de Aprendizaje por Refuerzo Profundo: Snowball Fight 1vs1 🎉.

Snowball Fight es un juego hecho con Unity ML-Agents, donde disparas bolas de nieve contra un agente de Aprendizaje por Refuerzo Profundo. El juego está alojado en Hugging Face Spaces.

👉 Puedes jugarlo en línea aquí

En esta publicación, cubriremos el ecosistema en el que estamos trabajando para investigadores y entusiastas del Aprendizaje por Refuerzo Profundo que utilizan Unity ML-Agents.

Unity ML-Agents en Hugging Face

Unity Machine Learning Agents Toolkit es una biblioteca de código abierto que te permite construir juegos y simulaciones con el motor de juegos Unity para servir como entornos para entrenar agentes inteligentes.

Con este primer paso, nuestro objetivo es construir un ecosistema en Hugging Face para investigadores y entusiastas del Aprendizaje por Refuerzo Profundo que utilizan ML-Agents, con tres características.

Construir y compartir entornos personalizados. Estamos desarrollando y compartiendo entornos emocionantes para experimentar con nuevos problemas: peleas de bolas de nieve, carreras, rompecabezas… Todos ellos serán de código abierto y alojados en el Hub de Hugging Face.
Permitirte alojar fácilmente tus entornos, guardar modelos y compartirlos en el Hub de Hugging Face. Ya hemos publicado el entorno de entrenamiento de Snowball Fight aquí, ¡pero habrá más por venir!
Ahora puedes alojar fácilmente tus demos en Spaces y mostrar tus resultados rápidamente con el resto del ecosistema.

¡Sé parte de la conversación: únete a nuestro servidor de Discord!

Si estás utilizando ML-Agents o estás interesado en el Aprendizaje por Refuerzo Profundo y quieres ser parte de la conversación, puedes unirte a nuestro servidor de Discord. Acabamos de agregar dos canales (y agregaremos más en el futuro):

Aprendizaje por Refuerzo Profundo
ML-Agents

Nuestro Discord es el lugar donde puedes intercambiar ideas sobre Hugging Face, NLP, Deep RL y más. También es en este Discord donde anunciaremos todos nuestros nuevos entornos y características en el futuro.

¿Qué sigue?

En las próximas semanas y meses, ampliaremos el ecosistema mediante:

Escribir algunos tutoriales técnicos sobre ML-Agents.
Trabajando en una versión Snowball Fight 2vs2, donde los agentes colaborarán en equipos utilizando MA-POCA, un nuevo algoritmo de Aprendizaje por Refuerzo Profundo que entrena comportamientos cooperativos en un equipo.

Y estamos construyendo nuevos entornos personalizados que se alojarán en Hugging Face.

Conclusión

Estamos emocionados de ver en qué estás trabajando con ML-Agents y cómo podemos construir características y herramientas que te ayuden a potenciar tu trabajo.

No olvides unirte a nuestro servidor de Discord para recibir alertas sobre las nuevas características.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Was this article helpful?

93 out of 132 found this helpful

Presentamos Snowball Fight ☃️, nuestro primer entorno de ML-Agents.

Unity ML-Agents en Hugging Face

¡Sé parte de la conversación: únete a nuestro servidor de Discord!

¿Qué sigue?

Conclusión

Was this article helpful?

¡Gradio se une a Hugging Face!

Presentando la Herramienta de Medición de Datos una herramienta interactiva para analizar conjuntos de datos.

Inteligencia Artificial

Mejorando los Modelos de Lenguaje con Indicaciones Analógicas para Mejorar el Razonamiento

¿Está cambiando el comportamiento de ChatGPT con el tiempo? Los investigadores evalúan las versiones de marzo de 2023 y junio de 2023 de GPT-3.5 y GPT-4 en cuatro tareas diversas.

La retroalimentación colaborativa ayuda a entrenar a los robots

Esta investigación de IA de UCLA indica que los grandes modelos de lenguaje (como GPT-3) han adquirido la capacidad emergente de encontrar soluciones sin guía para una amplia gama de problemas de analogía.

Los exámenes no supervisados en línea proporcionan evaluaciones válidas

IA generativa y agentes multimodales en AWS La clave para desbloquear nuevo valor en los mercados financieros