Ponte al día con los Modelos de Lenguaje Grandes
Actualízate con los Modelos de Lenguaje Grandes
Una guía práctica para modelos de lenguaje grandes sin el hype
Si estás aquí, significa que al igual que yo, te sentiste abrumado por el flujo constante de información y publicaciones de hype que rodean a los modelos de lenguaje grandes (MLGs).
Este artículo es mi intento de ayudarte a ponerte al día sobre el tema de los modelos de lenguaje grandes sin el hype. Después de todo, es una tecnología transformadora y creo que es importante que la entendamos, con suerte, despertando tu curiosidad para aprender aún más y construir algo con ella.
En las siguientes secciones, definiremos qué son los MLGs y cómo funcionan, cubriendo por supuesto la arquitectura Transformer. También exploraremos los diferentes métodos de entrenamiento de los MLGs y concluiremos el artículo con un proyecto práctico en el que utilizaremos Flan-T5 para realizar análisis de sentimientos utilizando Python.
¡Comencemos!
- IA en la computación en el borde Implementación de algoritmos para mejorar en tiempo real
- Procesamiento del Lenguaje Natural Más allá de BERT y GPT
- Investigadores de ByteDance y UCSD proponen un modelo de difusión multi-vista que es capaz de generar un conjunto de imágenes multi-vista de un objeto/escena a partir de cualquier texto dado.
MLGs y AI generativa: ¿son lo mismo?
La AI generativa es un subconjunto del aprendizaje automático que se enfoca en modelos cuya función principal es generar algo: texto, imágenes, video, código, etc.
Los modelos generativos se entrenan con enormes cantidades de datos creados por humanos para aprender patrones y estructuras que les permitan crear nuevos datos.
Ejemplos de modelos generativos incluyen:
- Generación de imágenes: DALL-E, Midjourney
- Generación de código: OpenAI Codex
- Generación de texto: GPT-3, Flan-T5, LLaMA
Los modelos de lenguaje grandes forman parte del panorama de la AI generativa, ya que toman un texto de entrada y predicen repetidamente la siguiente palabra hasta que se completa la salida.
Sin embargo, a medida que los modelos de lenguaje crecieron en tamaño, fueron capaces de realizar otras tareas en el procesamiento del lenguaje natural, como resumen, análisis de sentimientos, reconocimiento de entidades nombradas, traducción y más.
Con eso en mente, centrémonos ahora en cómo funcionan los MLGs.
Cómo funcionan los MLGs
Una de las razones por las que ahora tenemos modelos de lenguaje grandes es debido al trabajo seminal de Google y la Universidad de Toronto cuando publicaron el artículo Attention Is All You Need en 2017.
We will continue to update Zepes; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- Desarrollar XR con Oracle, Ep. 6 Resumidor + Generador de IA
- Limpieza de datos con Pandas
- ¿Cómo convertirse en un analista de investigación? Descripción, habilidades y salario
- Este artículo de IA explica cómo los lenguajes de programación pueden potenciarse entre sí a través de la sintonización de instrucciones.
- ¿Qué es la Redundancia de Datos? Beneficios, Desventajas y Consejos
- 6 Errores de Pandas que Silenciosamente Revelan que Eres un Novato
- Meta AI lanza Nougat un modelo de transformador visual que realiza OCR para procesar documentos científicos en un lenguaje de marcado.