Search Results MMLU

Conoce a Gemini el innovador modelo multimodal de IA de Google que redefine el futuro de la inteligencia artificial

La última incursión de Google en la inteligencia artificial, Gemini, representa un salto significativo en la tecnología de IA. Presentado como un modelo de…

Bard recibe su mayor actualización hasta ahora con Gemini

Estamos empezando a incorporar las capacidades avanzadas de Gemini en Bard.

Conoce a Gemini La respuesta de Google a ChatGPT

En el mundo en constante evolución de la inteligencia artificial, Google ha dado un salto revolucionario con su última creación, Gemini AI. Según Google,…

Operacionalizar la evaluación de LLM a gran escala utilizando los servicios de Amazon SageMaker Clarify y MLOps

En los últimos años, los Modelos de Lenguaje Grande (LLMs) han cobrado importancia como herramientas excepcionales capaces de comprender, generar y manipular texto con…

Inflection-2 supera a PaLM-2 de Google Un avance en los modelos de lenguaje de IA

En un anuncio innovador, Inflection AI, los creadores de la popular PI AI Personal Assistant, revelaron su último logro. Un formidable modelo de lenguaje…

Una mejor manera de evaluar los LLMs

Este artículo presenta un nuevo enfoque para evaluar LLM, que aprovecha la perspicacia humana para comparar las respuestas de LLM con las peticiones de…

Grok Chatbot de IA de la xAI de Elon Musk

Adéntrate en Grok de Elon Musk por xAI, un chatbot de IA con capacidad para recuperar información en tiempo real, humor y habilidades de…

¡Abrocha tu cinturón ¡El Falcon 180B está aquí!

Vamos a sumergirnos en el modelo de lenguaje abierto más grande del mundo.

artificial intelligence

Guía completa para principiantes de las herramientas de Hugging Face LLM

Hugging Face es un laboratorio de investigación y centro de colaboración en inteligencia artificial que ha construido una comunidad de académicos, investigadores y entusiastas.…

Conoce a Baichuan 2 Una serie de modelos de lenguaje multilingües a gran escala que contienen 7B y 13B de parámetros, entrenados desde cero, con 2.6T tokens.

Los modelos de lenguaje grandes han experimentado avances significativos y alentadores en los últimos años. Los modelos de lenguaje ahora tienen miles de millones…

Extiende tus alas Falcon 180B está aquí

Introducción ¡Hoy estamos emocionados de dar la bienvenida al Falcon 180B de TII a HuggingFace! Falcon 180B establece un nuevo estado de la técnica…

No tan grandes modelos de lenguaje los buenos datos derrocan al gigante

En este artículo, veremos cómo los Modelos de Lenguaje (LM) pueden enfocarse en mejores estrategias de datos y entrenamiento en lugar de simplemente aumentar…

Conoce a QLORA Un enfoque de ajuste eficiente que reduce el uso de memoria lo suficiente como para ajustar un modelo de 65B parámetros en una sola GPU de 48GB, preservando al mismo tiempo el rendimiento completo de la tarea de ajuste fino de 16 bits.

Los modelos de lenguaje grandes (LLMs) pueden mejorarse mediante el ajuste fino, lo cual también permite agregar o eliminar comportamientos deseados. Sin embargo, el…

Conoce el modelo GOAT-7B-Community un modelo de IA ajustado finamente a partir del modelo LLaMA-2 7B en un conjunto de datos recopilados de la aplicación GoatChat.

Recientemente, científicos del Laboratorio de Investigación de IA presentaron el modelo GOAT-7B-Community, que mejora el modelo LLaMA-2 7B utilizando datos de la aplicación GoatChat.…

Conoce REPLUG un marco de modelado de lenguaje (LM) mejorado con recuperación que combina un modelo de lenguaje congelado con un recuperador congelado/ajustable, mejorando el rendimiento de GPT-3 (175B) en la modelización del lenguaje en un 6.3%.

En los últimos años, los modelos de lenguaje se han convertido en uno de los campos de mayor crecimiento en Inteligencia Artificial. Estos modelos,…

Conoce Automated Reasoning And Tool-Use (ART) Un marco de trabajo que utiliza modelos de lenguaje grandes congelados (LLMs) para producir rápidamente etapas intermedias en programas de razonamiento.

Los grandes modelos de lenguaje pueden adaptarse rápidamente a nuevas tareas utilizando el aprendizaje en contexto al recibir algunas demos e instrucciones reales en…

¿Qué está pasando con el Open LLM Leaderboard?

Recientemente surgió una interesante discusión en Twitter tras el lanzamiento de Falcon 🦅 y su incorporación al Open LLM Leaderboard, una tabla de clasificación…

Modelado del lenguaje a gran escala Gopher, consideraciones éticas y recuperación

El lenguaje, y su papel en demostrar y facilitar la comprensión -o la inteligencia-, es una parte fundamental de ser humano. Le da a…

Research

Un análisis empírico del entrenamiento de modelos de lenguaje grandes óptimos en cómputo

Nos hacemos la pregunta ¿Cuál es el tamaño óptimo del modelo y el número de tokens de entrenamiento para un presupuesto computacional dado? Para…

Technical blog

Guía para principiantes para construir tus propios modelos de lenguaje grandes desde cero.

Introducción Ya sea en Twitter o Linkedin, me encuentro con numerosas publicaciones sobre Modelos de Lenguaje Grande (LLMs) cada día. Tal vez me pregunte…

Conoce a ChatGLM2-6B la versión de segunda generación del modelo de chat de código abierto bilingüe (chino-inglés) ChatGLM-6B.

Desde la introducción del revolucionario ChatGPT de OpenAI, que rompió récords al obtener los 100 millones de usuarios más rápidamente para un producto, se…

Revolucionando la eficiencia de la IA El SqueezeLLM de UC Berkeley presenta la cuantificación densa y dispersa, uniendo la calidad y la velocidad en la entrega de modelos de lenguaje grandes.

Los recientes avances en los Modelos de Lenguaje Grande (LLM, por sus siglas en inglés) han demostrado su impresionante capacidad para resolver problemas en…

Learn more about Search Results MMLU