Learn more about Large Language Models

Hacia la IA General el papel de LLMs y Modelos Fundamentales en la Revolución del Aprendizaje de por Vida

En la última década y especialmente con el éxito del aprendizaje profundo, se ha formado una discusión continua en to...

Modelos de Lenguaje Grandes y Bases de Datos Vectoriales para Recomendaciones de Noticias

Los modelos de lenguaje grandes (LLMs) generaron un gran revuelo a nivel mundial en la comunidad de aprendizaje autom...

Los 10 mejores modelos de lenguaje grandes en Hugging Face

Introducción Hugging Face se ha convertido en un tesoro para los entusiastas y desarrolladores de procesamiento de le...

Conectando los puntos Desentrañando el supuesto modelo Q-Star de OpenAI

‘Descubre el Q-Star de OpenAI un presunto salto hacia la Inteligencia Artificial General (IAG). Adéntrate en el drama...

Llamando a Todas las Funciones

La observabilidad en los modelos de lenguaje de terceros (LLMs) se aborda en gran medida mediante pruebas y evaluacio...

Cómo estar preparado para el trabajo en el mundo de los grandes modelos de lenguaje?

Introducción ¿Ha sido tu pasión contribuir al campo de la inteligencia artificial? Tu entrada soñada en este campo re...

Pequeño pero poderoso avances de los modelos de lenguaje pequeños en la era de los modelos de lenguaje grandes dominantes

Explora la revolución de los Modelos de Lenguaje Pequeños, alternativas de IA eficientes y rentables que desafían a l...

Grandes modelos de lenguaje DeBERTa – BERT mejorado con decodificación y atención desentrelazada

En los últimos años, BERT se ha convertido en la herramienta número uno en muchas tareas de procesamiento de lenguaje...

ExLlamaV2 La biblioteca más rápida para ejecutar LLMs

ExLlamaV2 es una biblioteca diseñada para exprimir aún más rendimiento de GPTQ. Gracias a nuevos kernels, está optimi...

Explicación de la Atención de Múltiples Consultas

La Atención de Múltiples Consultas (MQA) es un tipo de mecanismo de atención que puede acelerar la velocidad de gener...

La recuperación del conocimiento toma el centro del escenario

Para hacer la transición de la implementación del consumidor a la empresarial para GenAI, las soluciones deben constr...

Todo lo que necesitas saber para desarrollar usando modelos de lenguaje grandes

El propósito de este artículo es explicar de manera sencilla las tecnologías clave necesarias para comenzar a desarro...

Cómo configurar un sistema NL2SQL con Azure OpenAI Studio

En el artículo anterior, aprendimos cómo configurar un comando rápido capaz de generar comandos SQL a partir de las s...

Experiencia de clasificación de texto sin entrenamiento con Scikit-LLM

La clasificación de textos es una de las aplicaciones más comunes del procesamiento del lenguaje natural (NLP, por su...

El ABC de los Transformers Todo lo que necesitas saber

Probablemente ya hayas oído hablar de Transformers, y todo el mundo habla de ello, ¿así que por qué escribir un nuevo...

Una guía universal para la ingeniería rápida el Marco de Andamios Contextuales (CSF)

En mis artículos recientes, exploré un nuevo enfoque de ingeniería de sugerencias para ChatGPT4 al que me referí como...

Conoce a Fuyu-8B El modelo de fundación muy único detrás de la plataforma Adept

Adept.ai es parte de la generación de nuevos unicornios de la IA. Inicialmente incubado por algunos de los autores de...

Desbloqueando el poder de los datos de texto con LLMs

Las opiniones de los clientes, las encuestas a los empleados y las publicaciones en redes sociales pueden ser increíb...

QLoRA Entrenando un Modelo de Lenguaje Grande en una GPU de 16GB.

Vamos a combinar una técnica de reducción de peso para modelos, como la cuantización, con una técnica de ajuste fino ...

Predicción de resultados de ensayos clínicos

En la primera parte de esta serie me enfoqué en incrustar datos multimodales del mundo real derivados de ClinicalTria...

Dominando el Futuro Evaluando Arquitecturas de Datos Generadas por LLM utilizando tecnologías IaC

En este artículo, abordamos la idoneidad de los LLM para aprovechar el ciclo de vida de las aplicaciones reales, que ...

¿Quién es Harry Potter? Dentro del método de ajuste fino de Microsoft Research para desaprender conceptos en LLMs

Los modelos de lenguaje grandes (LLMs) se entrenan regularmente con grandes cantidades de datos no etiquetados, lo qu...

Una guía para principiantes sobre LLMOps para ingeniería de aprendizaje automático

Introducción El lanzamiento de ChatGPT de OpenAI ha generado mucho interés en los grandes modelos de lenguaje (LLMs, ...

Construyendo un Sugeridor Inteligente de Itinerarios de Viaje con LangChain, Google Maps API y Gradio (Parte 3)

En la segunda parte de esta serie de tres partes, construimos un sistema que toma una lista analizada de puntos de pa...

Cómo ajustar modelos de lenguaje grandes en memoria pequeña cuantización

Los Modelos de Lenguaje Grandes se pueden utilizar para la generación de texto, la traducción, las tareas de pregunta...

Learn more about Large Language Models

Find your business way