El Orden Importa Cómo la Inteligencia Artificial Lucha con la Inversa

El Orden Importa Cómo la Inteligencia Artificial Lucha con la Inversa

|INTELIGENCIA ARTIFICIAL| GRANDES MODELOS DE LENGUAJE|

Cómo y por qué afecta la maldición inversa a los grandes modelos de lenguaje

Foto de Andre Taissin en Unsplash

Los grandes modelos de lenguaje han arrasado en el mundo. Cada día parecen mostrar mejores y mejores capacidades, pero ¿no tienen limitaciones? Parecería que no, sin embargo, en algunos casos, logran fallar.

Lo obvio no es tan fácil.

Foto de Sigmund en Unsplash

Nos hemos acostumbrado al rendimiento increíble de los modelos capaces de generar código o texto complejo con una velocidad increíble, y algunos investigadores han sugerido que incluso podrían ser conscientes.

Pero también existen informes en los que los grandes modelos de lenguaje son capaces de fallar espectacularmente. En algunos estudios anteriores, los autores han señalado que hay algunas instancias de programación con las que los modelos no pueden lidiar. O luchan con el sarcasmo (para ser justos, varios humanos también lo hacen).

¿Es divertida la IA? Quizás, un poco

Por qué la IA todavía tiene dificultades con el humor y por qué este es un paso importante

levelup.gitconnected.com

Recientemente, un artículo mostró cómo sorprendentemente los grandes modelos de lenguaje no pueden generalizar en lo que se considera una tarea trivial para los humanos:

Si un humano aprende el hecho de que “Olaf Scholz fue el noveno Canciller de Alemania”, también puede responder correctamente “¿Quién fue el noveno Canciller de Alemania?”. Esta es una forma tan básica de generalización que parece trivial. Sin embargo, demostramos que los modelos de lenguaje auto-regresivos no logran generalizar de esta manera. (fuente)

Si los modelos se entrenan con un texto con la forma “<nombre> es <descripción>”, es posible que el modelo no pueda predecir lo contrario “<descripción> es <nombre>” (o en la forma lógica si A es B, B es A).

fuente de la imagen: aquí

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Aprendizaje profundo para objetos profundos ZoeDepth es un modelo de IA para la estimación de profundidad en múltiples dominios

¿Alguna vez te has encontrado con ilusiones en las que un niño en la imagen parece más alto y más grande que un adult...

Inteligencia Artificial

Explorando NLP - Iniciando NLP (Paso #3)

Aquí hay algunos conceptos que revisé durante la semana, especialmente sobre incrustaciones de palabras. Hice algunas...

Inteligencia Artificial

Promocionar canalizaciones en una configuración multiambiente utilizando Amazon SageMaker Model Registry, HashiCorp Terraform, GitHub y Jenkins CI/CD

La creación de una plataforma de operaciones de machine learning (MLOps) en el ámbito en constante evolución de la in...

Inteligencia Artificial

CEO de OpenAI, Sam Altman Empleos en riesgo a medida que la IA demuestra su poderío

El CEO de OpenAI, Sam Altman, ha expresado públicamente sus preocupaciones sobre los posibles peligros de la intelige...

Inteligencia Artificial

AI diseña un nuevo robot desde cero en segundos

Un equipo de investigación liderado por científicos de la Universidad Northwestern creó una inteligencia artificial c...