Learn more about Applications – Section 6

Investigadores de Alibaba presentan la serie Qwen-Audio Un conjunto de modelos de audio-idioma a gran escala con habilidades universales de comprensión de audio.

Investigadores de Alibaba Group presentaron Qwen-Audio, que aborda el desafío de los modelos de audio pre-entrenados ...

Investigadores de la Universidad de Pennsylvania han desarrollado un marco de aprendizaje automático para evaluar la eficacia de las características de inteligencia artificial basadas en la visión mediante la realización de una serie de pruebas en

El modelo GPT-Vision ha captado la atención de todos. La gente está emocionada por su capacidad para comprender y gen...

Iniciando en Autogen Explorando los fundamentos de un marco de trabajo multiagente

Introducción Embárcate en un emocionante viaje hacia el futuro del desarrollo de software con ‘Lanzándose en Au...

Investigadores de Stanford innovan en el modelo de lenguaje de gran escala para la veracidad de los hechos Rankings de preferencia automáticos y avances en NLP para la reducción de errores

Investigadores de la Universidad de Stanford y UNC Chapel Hill abordan el problema de las afirmaciones incorrectas en...

Investigadores de UC Berkeley introducen Ghostbuster un método de IA SOTA para detectar texto generado por LLM

ChatGPT ha revolucionado la capacidad de producir fácilmente una amplia gama de texto fluido sobre una amplia gama de...

Investigadores de Google DeepMind y YouTube anuncian Lyria un modelo avanzado de generación de música AI

En un anuncio reciente, DeepMind de Google, en colaboración con YouTube, presentó Lyria, un modelo de generación de m...

Construir un Equipo Estratégico de AI Ahora es Fácil con AutoGen

Introducción En un mundo donde la frontera digital no conoce límites, AutoGen emerge como el arquitecto de un paradig...

Investigadores de IA de KAIST presentan KTRL+F una tarea de búsqueda en documentos aumentada con conocimiento que requiere la identificación en tiempo real de objetivos semánticos dentro de un documento.

La tarea KTRL + F es un problema de búsqueda en documentos aumentado por el conocimiento que requiere la identificaci...

Investigadores de la Universidad de Stanford presentan FlashFFTConv un nuevo sistema de inteligencia artificial para optimizar convoluciones FFT en secuencias largas.

Razonar eficientemente a lo largo de secuencias extendidas es una dificultad importante en el aprendizaje automático....

Microsoft presenta Azure Custom Chips Revolucionando la computación en la nube y las capacidades de IA

En medio de persistentes rumores de la industria, la tan esperada revelación de Microsoft salió a la luz durante la c...

Meet GO To Any Thing (GOAT) Un Sistema Universal de Navegación que puede Encontrar Cualquier Objeto Especificado de Cualquier Manera, ya sea como una Imagen, en Lenguaje, o en una Categoría, en Entornos Completamente Inéditos

Un equipo de investigadores de la Universidad de Illinois Urbana-Champaign, la Universidad Carnegie Mellon, el Instit...

Investigadores del MIT presentan a MechGPT un precursor basado en el lenguaje que une escalas, disciplinas y modalidades en la modelación de mecánica y materiales.

Los investigadores se enfrentan a un desafío formidable dentro del amplio campo de la ciencia de materiales: destilar...

Meta presenta Emu Video y Emu Edit Avances pioneros en la generación de videos a partir de texto y en la edición precisa de imágenes.

“`html En el campo en constante evolución de la IA generativa, persisten desafíos para lograr modelos eficiente...

Investigadores de la Universidad de Chosun presentan un marco de aprendizaje automático para la localización precisa de corales blanqueados utilizando la clasificación de características visuales híbridas en bolsas.

Se dice que el entorno marino más diversificado de la Tierra se encuentra en los arrecifes de coral. Se pueden encont...

Investigadores de UC Berkeley proponen un algoritmo de inteligencia artificial que logra la adquisición sin entrenamiento de agentes de diálogo dirigidos por objetivos.

Los Modelos de Lenguaje Grandes (LLMs) han demostrado grandes capacidades en diversas tareas de procesamiento de leng...

Conoce a Tarsier Una biblioteca de código abierto en Python para habilitar la interacción web con LLMs multimodales como GPT4

A medida que la IA continúa creciendo y afectando todos los aspectos de nuestras vidas, se está llevando a cabo una i...

Investigadores de la Universidad Vanderbilt y UC Davis presentan PRANC Un marco de aprendizaje profundo que es eficiente en memoria tanto durante la fase de aprendizaje como de reconstrucción.

Investigadores de la Universidad Vanderbilt y de la Universidad de California, Davis, presentaron PRANC, un marco que...

Investigadores de la Universidad de Washington y la Universidad Duke presentan Punica un sistema de inteligencia artificial para servir múltiples modelos de LoRA en un clúster compartido de GPU.

Especializarse en modelos de lenguaje pre-entrenados (LLMs) grandes para tareas específicas del dominio con un mínimo...

LastMile AI lanza AiConfig un marco de desarrollo de aplicaciones de IA basado en configuración de código abierto y compatible con el control de fuente.

En el ámbito en constante evolución del desarrollo de aplicaciones de inteligencia artificial, AI Config de LastMile ...

Conoce a SPHINX Un modelo de lenguaje grande multi-modal y versátil (MLLM) con una combinación de tareas de entrenamiento, dominios de datos y embebimientos visuales.

En los modelos de lenguaje multi-modal, ha surgido un desafío apremiante: las limitaciones inherentes de los modelos ...

Este artículo de IA presenta LLaVA-Plus un asistente multimodal de propósito general que amplía las capacidades de los modelos multimodales grandes

Crear asistentes de propósito general que puedan llevar a cabo eficientemente diversas actividades del mundo real sig...

Meet mPLUG-Owl2 un modelo de base multilingüe multimodal que transforma los modelos de lenguaje multilingües multimodales (MLLM) mediante la colaboración de modalidades.

Los Modelos de Lenguaje Grandes, con sus capacidades de imitación humana, han causado sensación en la comunidad de In...

Este artículo de IA presenta un modelo de aprendizaje profundo para clasificar las etapas de la degeneración macular relacionada con la edad utilizando escaneos OCT de retina del mundo real.

Un nuevo artículo de investigación presenta un clasificador basado en aprendizaje profundo para etapas de degeneració...

NetEase Youdao abrió EmotiVoice al público un motor de texto a voz potente y moderno.

NetEase Youdao anunció el lanzamiento oficial del “Yi Mo Sheng”: Un motor de síntesis de voz a texto abie...

Esta investigación sobre IA de China presenta 4K4D una representación en la nube de puntos 4D que admite rasterización de hardware y permite una velocidad de renderizado sin precedentes.

La síntesis de vista dinámica es una tarea de visión por computadora y gráfica que intenta reconstruir escenas 3D din...

Learn more about Applications - Section 6