Learn more about Large Language Model

La influencia oculta de la contaminación de datos en los grandes modelos de lenguaje

Veea los riesgos de la contaminación de datos en los Modelos de Lenguaje Extensos (LLMs). Estrategias para la detecci...

Alibaba AI libera en código abierto la serie Qwen que incluye Qwen-1.8B, Qwen-7B, Qwen-14B y Qwen-72B junto con la serie Qwen-Chat.

Con los modelos más recientes de su serie Qwen de modelos de inteligencia artificial de código abierto, Alibaba Cloud...

Conoce a Tarsier Una biblioteca de código abierto en Python para habilitar la interacción web con LLMs multimodales como GPT4

A medida que la IA continúa creciendo y afectando todos los aspectos de nuestras vidas, se está llevando a cabo una i...

¿Podemos transformar texto en gráficos vectoriales científicos? Este artículo de IA presenta AutomaTikZ y explica el poder de TikZ

Los últimos avances en la generación de texto a imagen han hecho posible la creación de gráficos detallados a partir ...

Reka AI presenta a Yasa-1 un asistente de lenguaje multimodal con sensores visuales y auditivos que puede tomar acciones mediante la ejecución de código.

La demanda de asistentes de lenguaje más avanzados y versátiles ha aumentado constantemente en el panorama en constan...

¿Son realmente buenos los modelos de lenguaje grandes para generar datos estructurados complejos? Este artículo de IA presenta Struc-Bench Evaluando las capacidades de los LLM e introduciendo una solución de ajuste fino con conciencia de estructura.

Los Modelos de Lenguaje Grandes (LLMs, por sus siglas en inglés) han logrado un progreso significativo en tareas de c...

Esta investigación de IA propone LayoutNUWA un modelo de IA que trata la generación de diseño como una tarea de generación de código para mejorar la información semántica y aprovechar la experiencia oculta de diseño de los modelos de lenguaje grandes (LLMs).

Con el crecimiento de los LLMs, se ha realizado una investigación exhaustiva sobre todos los aspectos de los LLMs. Po...

Esta investigación de IA de Microsoft y la Universidad de Tsinghua presenta EvoPrompt un nuevo marco de IA para la optimización automática de indicaciones discretas que conecta LLMs y algoritmos evolutivos

Los modelos de lenguaje grandes (LLMs) están destacando en prácticamente todas las tareas de procesamiento del lengua...

Investigadores de la Universidad de Oregon y Adobe presentan CulturaX un conjunto de datos multilingüe con 6,3T de tokens en 167 idiomas diseñado para el desarrollo de modelos de lenguaje grandes (LLM).

Al mejorar drásticamente el rendimiento de vanguardia en una amplia gama de tareas y revelar nuevas habilidades emerg...

Deci AI presenta DeciDiffusion 1.0 un modelo de difusión latente de texto a imagen de 820 millones de parámetros y 3 veces más rápido que la difusión estable.

Definir el problema La generación de imágenes a partir de texto ha sido durante mucho tiempo un desafío en inteligenc...

Investigadores de UCSD liberan Graphologue de código abierto una técnica única de IA que transforma las respuestas de modelos de lenguaje grandes como GPT-4 en diagramas interactivos en tiempo real.

Los Modelos de Lenguaje Grandes (LLMs, por sus siglas en inglés) han ganado recientemente una inmensa popularidad deb...

Investigadores de UCI y la Universidad de Zhejiang introducen Aceleración de Modelos de Lenguaje Grandes sin Pérdidas a través de la Decodificación Autoespeculativa utilizando Etapas de Borrador y Verificación.

Los Modelos de Lenguaje Grandes (LLMs) basados en transformadores, como GPT, PaLM y LLaMA, se han utilizado ampliamen...

OpenAI presenta DALL·E 3 Un salto revolucionario en la generación de texto a imagen

En un salto tecnológico significativo, OpenAI ha anunciado el lanzamiento de DALL·E 3, la última iteración en su revo...

Conoce a Baichuan 2 Una serie de modelos de lenguaje multilingües a gran escala que contienen 7B y 13B de parámetros, entrenados desde cero, con 2.6T tokens.

Los modelos de lenguaje grandes han experimentado avances significativos y alentadores en los últimos años. Los model...

Investigadores de la Universidad de Pensilvania presentan Kani un marco de inteligencia artificial de código abierto, ligero, flexible y agnóstico al modelo para construir aplicaciones de modelos de lenguaje.

Las aplicaciones de modelos de lenguaje grandes han experimentado un aumento en popularidad. Con sus increíbles capac...

¿Puede un Modelo de Lenguaje Revolucionar la Radiología? Conozca Radiology-Llama2 Un Gran Modelo de Lenguaje Especializado en Radiología a través de un Proceso Conocido como Ajuste de Instrucciones.

Los modelos de lenguaje grandes (LLMs) construidos sobre transformers, incluyendo ChatGPT y GPT-4, han demostrado sor...

Conoce vLLM una biblioteca de aprendizaje automático de código abierto para una inferencia y servicio LLM rápidos

Los grandes modelos de lenguaje (LLMs, por sus siglas en inglés) tienen un impacto cada vez mayor en cómo cambian nue...

Investigadores de Stanford presentan Spellburst un entorno de codificación creativa impulsado por un modelo de lenguaje grande (LLM).

Mientras crean impresionantes obras de arte digitales, los artistas generativos a menudo se enfrentan a las complejid...

Investigadores de Google AI presentan MADLAD-400 un conjunto de datos de dominio web con tokens de 2.8T que abarca 419 idiomas.

En el campo en constante evolución del Procesamiento del Lenguaje Natural (NLP, por sus siglas en inglés), el desarro...

Este artículo de Alibaba Group presenta FederatedScope-LLM un paquete integral para el ajuste fino de LLMs en el aprendizaje federado

Hoy en día, plataformas como Hugging Face han facilitado el acceso y la utilización de Modelos de Lenguaje de Gran Ta...

Conoce FLM-101B Un decodificador de solo lectura de LLM de código abierto con 101 mil millones de parámetros

Últimamente, los modelos de lenguaje grandes (LLMs) están destacando en tareas de NLP y multimodalidad, pero se enfre...

¿Pueden los modelos de lenguaje grandes realmente hacer matemáticas? Esta investigación de inteligencia artificial AI presenta MathGLM un modelo robusto para resolver problemas matemáticos sin una calculadora.

Cuando se trata de tareas de procesamiento del lenguaje natural (NLP) posteriores, los grandes modelos de lenguaje (L...

Mejorando la Sumarización de GPT-4 a través de una Cadena de Indicaciones de Densidad

Los Modelos de Lenguaje Grandes han ganado mucha atención en los últimos tiempos debido a sus excelentes capacidades....

Investigadores de Google proponen MEMORY-VQ un nuevo enfoque de IA para reducir los requisitos de almacenamiento de los modelos de memoria aumentada sin sacrificar el rendimiento

Investigaciones recientes en modelos de lenguaje han enfatizado la importancia de la mejora de la recuperación para m...

Conoce T2I-Adapter-SDXL Modelos de Control Pequeños y Eficientes.

Los T2I-Adapters son herramientas plug-and-play que mejoran los modelos de texto a imagen sin requerir un nuevo entre...

Learn more about Large Language Model

Find your business way