ChatGPT se adentra en el lado robótico la última maravilla mecánica de Boston Dynamics ahora responde verbalmente

ChatGPT se sumerge en el mundo de la robótica la última maravilla mecánica de Boston Dynamics ahora responde verbalmente

En un desarrollo innovador, la empresa de ingeniería Boston Dynamics ha integrado ChatGPT, un sofisticado modelo de lenguaje desarrollado por OpenAI, en uno de sus robots destacados, Spot. Este compañero similar a un perro ahora está equipado para ofrecer visitas guiadas por un edificio, brindando comentarios perspicaces sobre cada exhibición en el camino.

Spot ha experimentado una transformación notable, ahora presume de una selección de personalidades distintivas. Dependiendo de la personalidad elegida, la voz, el tono y los comentarios personalizados del robot se adaptan en consecuencia.

Para percibir su entorno, Spot utiliza modelos de Visual Question Answering (VQA), capaces de generar subtítulos para imágenes y proporcionar respuestas concisas a las consultas sobre ellas. Esta información visual se actualiza aproximadamente una vez por segundo y se transmite al sistema como una solicitud de texto.

Las capacidades de comunicación de Spot también se han mejorado al agregar un soporte resistente a las vibraciones especialmente diseñado para un altavoz Respeaker V2, un micrófono de matriz de anillos adornado con LED. Este innovador hardware se integra perfectamente con el cargamento EAP 2 de Spot a través de USB.

El control del robot es gestionado por una computadora externa, ya sea una PC de escritorio o una laptop, que se comunica con Spot a través de su Kit de Desarrollo de Software (SDK). Se ha implementado un sencillo servicio de SDK de Spot para facilitar la comunicación de audio con el EAP 2.

En cuanto a las respuestas verbales, Spot depende del servicio de texto a voz de ElevenLabs. Para optimizar el tiempo de respuesta, los ingenieros han ideado un sistema en el que el texto se transmite al dispositivo de forma paralela en forma de “frases” y el audio resultante se reproduce de manera serial.

Agregando un toque de personalidad, Spot ahora exhibe capacidades de lenguaje corporal. Puede identificar y rastrear objetos en movimiento, lo que le permite discernir la ubicación de la persona más cercana y orientar su brazo hacia ella. Para crear un toque whimsical, se ha aplicado un filtro de paso bajo al discurso generado, imitando el movimiento de la boca de una marioneta. Este efecto se acentúa aún más al adornar el gripper con disfraces cómicos y colocarle ojos bobos.

Uno de los aspectos más intrigantes de este experimento reside en la lógica inherente de la IA, que requirió un ajuste fino mínimo. Cuando se le pregunta acerca de sus “padres”, Spot asombrosamente navega hacia la ubicación donde residen sus predecesores, declarándolos humorísticamente como sus “ancianos”. Esto es un testimonio de la capacidad del modelo para establecer asociaciones estadísticas entre conceptos sin implicar una conciencia.

Sin embargo, vale la pena señalar que la demostración tiene sus limitaciones. Spot, al igual que muchos modelos de lenguaje, ocasionalmente puede experimentar alucinaciones, donde genera información ficticia. Un ejemplo intrigante de este fenómeno se encuentra en un artículo que discute un pueblo inspirado en Sims poblado por agentes de IA. Además, hay un ligero retraso en las respuestas, y los usuarios ocasionalmente experimentan un tiempo de espera de aproximadamente seis segundos.

A pesar de estos contratiempos menores, este proyecto marca un avance significativo en la investigación en la intersección de la robótica y la IA. Boston Dynamics se compromete a explorar aún más esta fusión de tecnologías, con el objetivo final de mejorar el rendimiento de los robots en entornos centrados en los humanos. Este prometedor esfuerzo tiene el potencial de revolucionar la forma en que interactuamos con las máquinas, inaugurando una nueva era de compañerismo inteligente.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Herramientas de IA principales para emprendedores 2023

Grammarly es una herramienta de escritura impulsada por IA que garantiza que tu escritura esté libre de errores y pul...

Inteligencia Artificial

Meta AI anuncia Purple Llama para ayudar a la comunidad a construir de manera ética con modelos de IA abiertos y generativos.

Gracias al éxito en el aumento de los datos, el tamaño del modelo y la capacidad computacional para la modelización d...

Inteligencia Artificial

Web LLM Trae los Chatbots de LLM al Navegador.

¿No sería genial si pudieras ejecutar LLMs y chatbots de LLM de forma nativa en tu navegador? Aprendamos más sobre el...

Inteligencia Artificial

Prediciendo Touchdowns de Futbol Americano con Aprendizaje Automático

Fútbol. Un pasatiempo estadounidense que une a los fans en toda la nación. Con un promedio de 16.7 millones de espect...

Inteligencia Artificial

Hoja de ruta de Aprendizaje Automático Recomendaciones de la Comunidad 2023

En el último artículo, Parte 1 de este mapa de ruta, discutimos brevemente las herramientas iniciales y las direccion...