Búsqueda de Haz el algoritmo más utilizado en modelos de secuencia

Búsqueda del algoritmo de secuencia más utilizado en modelos de secuencia

Aprende los principios de funcionamiento del algoritmo más famoso para la traducción de texto y el reconocimiento de voz.

Beam Search permite considerar múltiples corrientes de candidatos. Fuente de la imagen: unsplash.com.

Imagina que eres un modelo de lenguaje de IA, como ChatGPT, completando una frase. ¿Cómo eliges la siguiente palabra para que no solo sea gramaticalmente correcta sino también contextualmente relevante? Aquí es donde entra en juego Beam Search.

Al explorar de manera eficiente múltiples posibilidades en paralelo y mantener los mejores candidatos en cada paso, Beam Search juega un papel crucial en la tarea de predecir elementos subsecuentes. Siendo un algoritmo efectivo y poderoso, asegura que la salida se alinee con las restricciones gramaticales y el contexto.

Para comprender el impacto de Beam Search, piensa en todas las aplicaciones que requieren una generación precisa de secuencias, como la traducción de idiomas, la completación de texto y los chatbots. En todas estas aplicaciones, Beam Search desempeña un papel fundamental.

En este artículo, presentaré la teoría y te guiaré a través de un ejemplo práctico paso a paso del algoritmo Beam Search. También presentaré varias variantes de Beam Search y detallaré todos los pros y contras de este algoritmo fundamental.

Imagina que necesitas traducir la siguiente frase de español a inglés:

Pablo estará en Nueva York la próxima semana.

No solo queremos obtener una traducción correcta, sino que queremos obtener la mejor. Para un modelo de lenguaje, la mejor salida coincide con la opción más probable.

Para lograr esta tarea, la mayoría de los modelos secuencia a secuencia utilizan el Beam Search. Sirve como un algoritmo heurístico que explora sistemáticamente múltiples posibilidades en paralelo. En cada paso, un “ancho de haz” definido mantiene un número fijo de los mejores candidatos. Esto permite que el algoritmo explore varios candidatos.

Este enfoque imita los procesos de toma de decisiones, evaluando y seleccionando las opciones más prometedoras.

Beam Search Paso a Paso

Considera un modelo secuencia a secuencia estándar, representado por la red simple a continuación:

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Guía de un ingeniero de Microsoft para la innovación y el liderazgo en Inteligencia Artificial

Adéntrate en las ideas de la innovación de AI con el Ingeniero de Software Senior de Microsoft, Manas Joshi Un viaje ...

Investigación

Imágenes detalladas desde el espacio ofrecen una imagen más clara de los efectos de la sequía en las plantas.

Los investigadores de J-WAFS están utilizando observaciones de teledetección para construir sistemas de alta resoluci...

Inteligencia Artificial

EE.UU. busca malware chino que podría interrumpir las operaciones militares

Funcionarios de seguridad de Estados Unidos dicen que la Casa Blanca está buscando malware supuestamente oculto por C...

Ciencias de la Computación

Algoritmo encuentra esperma en hombres infértiles más rápido y con mayor precisión que los médicos.

La herramienta identifica instantáneamente el esperma, luego deja al embriólogo decidir si el esperma está realmente ...

Inteligencia Artificial

Investigadores de UC Berkeley presentan LLMCompiler Un compilador de LLM que optimiza el rendimiento de la llamada de funciones paralelas de LLMs

Las tareas de llamadas multifunción pueden ser lentas e inexactas cuando se utilizan LLM. Para abordar este problema,...