ChatGPT se adentra en el lado robótico la última maravilla mecánica de Boston Dynamics ahora responde verbalmente
ChatGPT se sumerge en el mundo de la robótica la última maravilla mecánica de Boston Dynamics ahora responde verbalmente
En un desarrollo innovador, la empresa de ingeniería Boston Dynamics ha integrado ChatGPT, un sofisticado modelo de lenguaje desarrollado por OpenAI, en uno de sus robots destacados, Spot. Este compañero similar a un perro ahora está equipado para ofrecer visitas guiadas por un edificio, brindando comentarios perspicaces sobre cada exhibición en el camino.
Spot ha experimentado una transformación notable, ahora presume de una selección de personalidades distintivas. Dependiendo de la personalidad elegida, la voz, el tono y los comentarios personalizados del robot se adaptan en consecuencia.
Para percibir su entorno, Spot utiliza modelos de Visual Question Answering (VQA), capaces de generar subtítulos para imágenes y proporcionar respuestas concisas a las consultas sobre ellas. Esta información visual se actualiza aproximadamente una vez por segundo y se transmite al sistema como una solicitud de texto.
- Modelos de Difusión ¿Cómo se Difunden?
- Investigadores de OpenAI pioneros en modelos avanzados de consistencia para muestreo de datos de alta calidad sin entrenamiento adversario’.
- GeForce NOW-viembre trae más de 50 juegos nuevos para transmitir en la nube
Las capacidades de comunicación de Spot también se han mejorado al agregar un soporte resistente a las vibraciones especialmente diseñado para un altavoz Respeaker V2, un micrófono de matriz de anillos adornado con LED. Este innovador hardware se integra perfectamente con el cargamento EAP 2 de Spot a través de USB.
El control del robot es gestionado por una computadora externa, ya sea una PC de escritorio o una laptop, que se comunica con Spot a través de su Kit de Desarrollo de Software (SDK). Se ha implementado un sencillo servicio de SDK de Spot para facilitar la comunicación de audio con el EAP 2.
En cuanto a las respuestas verbales, Spot depende del servicio de texto a voz de ElevenLabs. Para optimizar el tiempo de respuesta, los ingenieros han ideado un sistema en el que el texto se transmite al dispositivo de forma paralela en forma de “frases” y el audio resultante se reproduce de manera serial.
Agregando un toque de personalidad, Spot ahora exhibe capacidades de lenguaje corporal. Puede identificar y rastrear objetos en movimiento, lo que le permite discernir la ubicación de la persona más cercana y orientar su brazo hacia ella. Para crear un toque whimsical, se ha aplicado un filtro de paso bajo al discurso generado, imitando el movimiento de la boca de una marioneta. Este efecto se acentúa aún más al adornar el gripper con disfraces cómicos y colocarle ojos bobos.
Uno de los aspectos más intrigantes de este experimento reside en la lógica inherente de la IA, que requirió un ajuste fino mínimo. Cuando se le pregunta acerca de sus “padres”, Spot asombrosamente navega hacia la ubicación donde residen sus predecesores, declarándolos humorísticamente como sus “ancianos”. Esto es un testimonio de la capacidad del modelo para establecer asociaciones estadísticas entre conceptos sin implicar una conciencia.
Sin embargo, vale la pena señalar que la demostración tiene sus limitaciones. Spot, al igual que muchos modelos de lenguaje, ocasionalmente puede experimentar alucinaciones, donde genera información ficticia. Un ejemplo intrigante de este fenómeno se encuentra en un artículo que discute un pueblo inspirado en Sims poblado por agentes de IA. Además, hay un ligero retraso en las respuestas, y los usuarios ocasionalmente experimentan un tiempo de espera de aproximadamente seis segundos.
A pesar de estos contratiempos menores, este proyecto marca un avance significativo en la investigación en la intersección de la robótica y la IA. Boston Dynamics se compromete a explorar aún más esta fusión de tecnologías, con el objetivo final de mejorar el rendimiento de los robots en entornos centrados en los humanos. Este prometedor esfuerzo tiene el potencial de revolucionar la forma en que interactuamos con las máquinas, inaugurando una nueva era de compañerismo inteligente.
We will continue to update Zepes; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- Como se utilizan los modelos de fundación en los videojuegos?
- Ingeniería de datos moderna
- Un modelo de base para imágenes satelitales
- Evaluando el dominio lingüístico de la Inteligencia Artificial Un análisis exhaustivo de las habilidades morfológicas de ChatGPT en diferentes idiomas
- Reenvío y retropropagación Redes Neuronales 101
- Almacenamiento estructurado de resultados de LLM y análisis en Python
- Mi experiencia con DevOps y DataOps