Learn more about Large Language Models
Hacia la IA General el papel de LLMs y Modelos Fundamentales en la Revolución del Aprendizaje de por Vida
En la última década y especialmente con el éxito del aprendizaje profundo, se ha formado una discusión continua en to...
Modelos de Lenguaje Grandes y Bases de Datos Vectoriales para Recomendaciones de Noticias
Los modelos de lenguaje grandes (LLMs) generaron un gran revuelo a nivel mundial en la comunidad de aprendizaje autom...
Los 10 mejores modelos de lenguaje grandes en Hugging Face
Introducción Hugging Face se ha convertido en un tesoro para los entusiastas y desarrolladores de procesamiento de le...
Conectando los puntos Desentrañando el supuesto modelo Q-Star de OpenAI
‘Descubre el Q-Star de OpenAI un presunto salto hacia la Inteligencia Artificial General (IAG). Adéntrate en el drama...
Llamando a Todas las Funciones
La observabilidad en los modelos de lenguaje de terceros (LLMs) se aborda en gran medida mediante pruebas y evaluacio...
Cómo estar preparado para el trabajo en el mundo de los grandes modelos de lenguaje?
Introducción ¿Ha sido tu pasión contribuir al campo de la inteligencia artificial? Tu entrada soñada en este campo re...
Pequeño pero poderoso avances de los modelos de lenguaje pequeños en la era de los modelos de lenguaje grandes dominantes
Explora la revolución de los Modelos de Lenguaje Pequeños, alternativas de IA eficientes y rentables que desafían a l...
Grandes modelos de lenguaje DeBERTa – BERT mejorado con decodificación y atención desentrelazada
En los últimos años, BERT se ha convertido en la herramienta número uno en muchas tareas de procesamiento de lenguaje...
ExLlamaV2 La biblioteca más rápida para ejecutar LLMs
ExLlamaV2 es una biblioteca diseñada para exprimir aún más rendimiento de GPTQ. Gracias a nuevos kernels, está optimi...
Explicación de la Atención de Múltiples Consultas
La Atención de Múltiples Consultas (MQA) es un tipo de mecanismo de atención que puede acelerar la velocidad de gener...
La recuperación del conocimiento toma el centro del escenario
Para hacer la transición de la implementación del consumidor a la empresarial para GenAI, las soluciones deben constr...
Todo lo que necesitas saber para desarrollar usando modelos de lenguaje grandes
El propósito de este artículo es explicar de manera sencilla las tecnologías clave necesarias para comenzar a desarro...
Cómo configurar un sistema NL2SQL con Azure OpenAI Studio
En el artículo anterior, aprendimos cómo configurar un comando rápido capaz de generar comandos SQL a partir de las s...
Experiencia de clasificación de texto sin entrenamiento con Scikit-LLM
La clasificación de textos es una de las aplicaciones más comunes del procesamiento del lenguaje natural (NLP, por su...
El ABC de los Transformers Todo lo que necesitas saber
Probablemente ya hayas oído hablar de Transformers, y todo el mundo habla de ello, ¿así que por qué escribir un nuevo...
Una guía universal para la ingeniería rápida el Marco de Andamios Contextuales (CSF)
En mis artículos recientes, exploré un nuevo enfoque de ingeniería de sugerencias para ChatGPT4 al que me referí como...
Conoce a Fuyu-8B El modelo de fundación muy único detrás de la plataforma Adept
Adept.ai es parte de la generación de nuevos unicornios de la IA. Inicialmente incubado por algunos de los autores de...
Desbloqueando el poder de los datos de texto con LLMs
Las opiniones de los clientes, las encuestas a los empleados y las publicaciones en redes sociales pueden ser increíb...
QLoRA Entrenando un Modelo de Lenguaje Grande en una GPU de 16GB.
Vamos a combinar una técnica de reducción de peso para modelos, como la cuantización, con una técnica de ajuste fino ...
Predicción de resultados de ensayos clínicos
En la primera parte de esta serie me enfoqué en incrustar datos multimodales del mundo real derivados de ClinicalTria...
Dominando el Futuro Evaluando Arquitecturas de Datos Generadas por LLM utilizando tecnologías IaC
En este artículo, abordamos la idoneidad de los LLM para aprovechar el ciclo de vida de las aplicaciones reales, que ...
¿Quién es Harry Potter? Dentro del método de ajuste fino de Microsoft Research para desaprender conceptos en LLMs
Los modelos de lenguaje grandes (LLMs) se entrenan regularmente con grandes cantidades de datos no etiquetados, lo qu...
Una guía para principiantes sobre LLMOps para ingeniería de aprendizaje automático
Introducción El lanzamiento de ChatGPT de OpenAI ha generado mucho interés en los grandes modelos de lenguaje (LLMs, ...
Construyendo un Sugeridor Inteligente de Itinerarios de Viaje con LangChain, Google Maps API y Gradio (Parte 3)
En la segunda parte de esta serie de tres partes, construimos un sistema que toma una lista analizada de puntos de pa...
Cómo ajustar modelos de lenguaje grandes en memoria pequeña cuantización
Los Modelos de Lenguaje Grandes se pueden utilizar para la generación de texto, la traducción, las tareas de pregunta...
![Zepes](/assets/img/zepes.jpg)
- You may be interested
- Indian Startup lanza OpenHathi el prime...
- Explained Meta-Heurísticas Optimización...
- Seis recursos útiles para ingenieros
- El problema de percepción pública del A...
- Errores que los nuevos científicos de d...
- Línea Open-Sources ‘japanese-large-lm’ ...
- Conoce a Skywork-13B una familia de gra...
- ¿Qué hay de nuevo en los Difusores? 🎨
- Chattanooga siembra semillas cuánticas.
- Una Guía Completa de las Bases de Datos...
- Creando gráficos con Matplotlib y Seaborn
- DENZA colabora con WPP para construir e...
- Ajuste fino rápido y rentable de LLaMA ...
- Tecnología de IA para Revolucionar la A...
- El camino hacia el éxito en Ciencia de ...
Find your business way
Globalization of Business, We can all achieve our own Success.