Learn more about Language Model – Section 7

Esta investigación de IA de Microsoft y la Universidad de Tsinghua presenta EvoPrompt un nuevo marco de IA para la optimización automática de indicaciones discretas que conecta LLMs y algoritmos evolutivos

Los modelos de lenguaje grandes (LLMs) están destacando en prácticamente todas las tareas de procesamiento del lengua...

Investigadores de la Universidad de Oregon y Adobe presentan CulturaX un conjunto de datos multilingüe con 6,3T de tokens en 167 idiomas diseñado para el desarrollo de modelos de lenguaje grandes (LLM).

Al mejorar drásticamente el rendimiento de vanguardia en una amplia gama de tareas y revelar nuevas habilidades emerg...

Reduciendo las alucinaciones de IA con la generación aumentada por recuperación

Esta técnica recién ideada muestra promesa en incrementar el conocimiento de LLMs al permitir que las indicaciones se...

Potenciando la recuperación contextual de documentos aprovechando GPT-2 y LlamaIndex

Introducción En el mundo de la recuperación de información, donde esperan la exploración océanos de datos de texto, l...

Deci AI presenta DeciDiffusion 1.0 un modelo de difusión latente de texto a imagen de 820 millones de parámetros y 3 veces más rápido que la difusión estable.

Definir el problema La generación de imágenes a partir de texto ha sido durante mucho tiempo un desafío en inteligenc...

Investigadores de UCSD liberan Graphologue de código abierto una técnica única de IA que transforma las respuestas de modelos de lenguaje grandes como GPT-4 en diagramas interactivos en tiempo real.

Los Modelos de Lenguaje Grandes (LLMs, por sus siglas en inglés) han ganado recientemente una inmensa popularidad deb...

Hugging Face es el nuevo GitHub para LLMs

Hugging Face se está convirtiendo en el GitHub para modelos de lenguaje grandes (LLMs). Hugging Face ofrece herramien...

RELU vs. Softmax en Vision Transformers ¿Importa la longitud de la secuencia? Ideas de un artículo de investigación de Google DeepMind

Hoy en día, una arquitectura común de aprendizaje automático es la arquitectura de transformer. Una de las partes pri...

Investigadores de UCI y la Universidad de Zhejiang introducen Aceleración de Modelos de Lenguaje Grandes sin Pérdidas a través de la Decodificación Autoespeculativa utilizando Etapas de Borrador y Verificación.

Los Modelos de Lenguaje Grandes (LLMs) basados en transformadores, como GPT, PaLM y LLaMA, se han utilizado ampliamen...

¿Puede la IA superar a los humanos en tareas de pensamiento creativo? Este estudio proporciona información sobre la relación entre la creatividad humana y el aprendizaje de máquinas.

Aunque la IA ha hecho enormes avances y se ha convertido en una herramienta valiosa en muchos campos, no es un reempl...

OpenAI presenta DALL·E 3 Un salto revolucionario en la generación de texto a imagen

En un salto tecnológico significativo, OpenAI ha anunciado el lanzamiento de DALL·E 3, la última iteración en su revo...

¿Puede ser más rentable la segmentación de video? Conoce DEVA Un enfoque de segmentación de video desacoplado que ahorra en anotaciones y generaliza en múltiples tareas.

¿Alguna vez te has preguntado cómo funcionan los sistemas de vigilancia y cómo podemos identificar individuos o vehíc...

Conoce a Baichuan 2 Una serie de modelos de lenguaje multilingües a gran escala que contienen 7B y 13B de parámetros, entrenados desde cero, con 2.6T tokens.

Los modelos de lenguaje grandes han experimentado avances significativos y alentadores en los últimos años. Los model...

Investigadores de la Universidad de Pensilvania presentan Kani un marco de inteligencia artificial de código abierto, ligero, flexible y agnóstico al modelo para construir aplicaciones de modelos de lenguaje.

Las aplicaciones de modelos de lenguaje grandes han experimentado un aumento en popularidad. Con sus increíbles capac...

¿Puede un Modelo de Lenguaje Revolucionar la Radiología? Conozca Radiology-Llama2 Un Gran Modelo de Lenguaje Especializado en Radiología a través de un Proceso Conocido como Ajuste de Instrucciones.

Los modelos de lenguaje grandes (LLMs) construidos sobre transformers, incluyendo ChatGPT y GPT-4, han demostrado sor...

¿Cómo deberíamos ver los datos clínicos sesgados en el aprendizaje automático médico? Un llamado a una perspectiva arqueológica

Investigadores del MIT, la Universidad Johns Hopkins y el Instituto Alan Turing argumentan que lidiar con datos médic...

Conoce vLLM una biblioteca de aprendizaje automático de código abierto para una inferencia y servicio LLM rápidos

Los grandes modelos de lenguaje (LLMs, por sus siglas en inglés) tienen un impacto cada vez mayor en cómo cambian nue...

Investigadores de Stanford presentan Spellburst un entorno de codificación creativa impulsado por un modelo de lenguaje grande (LLM).

Mientras crean impresionantes obras de arte digitales, los artistas generativos a menudo se enfrentan a las complejid...

Investigadores de Google AI presentan MADLAD-400 un conjunto de datos de dominio web con tokens de 2.8T que abarca 419 idiomas.

En el campo en constante evolución del Procesamiento del Lenguaje Natural (NLP, por sus siglas en inglés), el desarro...

Este artículo de Alibaba Group presenta FederatedScope-LLM un paquete integral para el ajuste fino de LLMs en el aprendizaje federado

Hoy en día, plataformas como Hugging Face han facilitado el acceso y la utilización de Modelos de Lenguaje de Gran Ta...

Conoce FLM-101B Un decodificador de solo lectura de LLM de código abierto con 101 mil millones de parámetros

Últimamente, los modelos de lenguaje grandes (LLMs) están destacando en tareas de NLP y multimodalidad, pero se enfre...

¿Pueden los modelos de lenguaje grandes realmente hacer matemáticas? Esta investigación de inteligencia artificial AI presenta MathGLM un modelo robusto para resolver problemas matemáticos sin una calculadora.

Cuando se trata de tareas de procesamiento del lenguaje natural (NLP) posteriores, los grandes modelos de lenguaje (L...

Mejorando la Sumarización de GPT-4 a través de una Cadena de Indicaciones de Densidad

Los Modelos de Lenguaje Grandes han ganado mucha atención en los últimos tiempos debido a sus excelentes capacidades....

Investigadores de Google proponen MEMORY-VQ un nuevo enfoque de IA para reducir los requisitos de almacenamiento de los modelos de memoria aumentada sin sacrificar el rendimiento

Investigaciones recientes en modelos de lenguaje han enfatizado la importancia de la mejora de la recuperación para m...

Conoce T2I-Adapter-SDXL Modelos de Control Pequeños y Eficientes.

Los T2I-Adapters son herramientas plug-and-play que mejoran los modelos de texto a imagen sin requerir un nuevo entre...

Learn more about Language Model - Section 7