Jina AI presenta ‘jina-embeddings-v2’ los primeros modelos de incrustación de texto de código abierto 8k del mundo.

Jina AI presenta 'jina-embeddings-v2' los primeros modelos de incrustación de texto de código abierto de alta calidad del mundo.

Jina AI revela su último avance en su modelo de incrustación de texto de segunda generación: jina-embeddings-v2. Este modelo de última generación es la única solución de código abierto que admite una impresionante longitud de contexto de 8K (8192 tokens). Este logro lo posiciona de manera equivalente al modelo propietario de OpenAI, text-embedding-ada-002, en términos de capacidades y rendimiento en el Massive Text Embedding Benchmark (MTEB) leaderboard.

Jina-embeddings-v2 es un gran avance en los modelos de incrustación de texto de código abierto, que compite con contrapartes propietarias establecidas tanto en capacidad como en rendimiento de referencia. Se desempeña mejor que el modelo de 8K de OpenAI jina-embeddings-v2. Notablemente, Jina-embedding-v2 exhibe un rendimiento superior en comparación con su contraparte de OpenAI en métricas clave como Promedio de clasificación, Promedio de reubicación, Promedio de recuperación y Promedio de resumen.

Los investigadores dijeron que Jina-embeddings-v2 ha revolucionado diversas aplicaciones con sus capacidades avanzadas. En el análisis de documentos legales, captura y analiza cada detalle intrincado en textos legales extensos. Para la investigación médica, incrusta artículos científicos, facilitando análisis holísticos y fomentando descubrimientos revolucionarios. El modelo se sumerge en el contenido de formato largo en el análisis literario, capturando elementos temáticos para una mayor comprensión. La previsión financiera permite a los usuarios obtener información superior de informes financieros detallados, mejorando los procesos de toma de decisiones. En la IA conversacional, Jina Embeddings V2 mejora significativamente las respuestas de los chatbots a consultas complicadas de los usuarios. Con sus capacidades versátiles y poderosas, Jina Embeddings V2 se sitúa a la vanguardia de transformar cómo abordamos y obtenemos información de conjuntos de datos complejos en diversos dominios.

Las pruebas demuestran que este jina-embeddings-v2 habilitado para contexto supera a otros modelos de incrustación base líderes, enfatizando las ventajas prácticas de las capacidades de contexto más largas.

El Dr. Han Xiao, CEO de Jina AI, compartió reflexiones sobre el viaje y el significado profundo de este lanzamiento. Dijo que el logro con el lanzamiento de Jina-embeddings-v2 es notable, con el objetivo de crear el primer modelo de longitud de contexto de 8K de código abierto del mundo y competir con líderes de la industria como OpenAI. La misión de Jina AI sigue siendo muy clara: democratizar la IA mediante la provisión de herramientas que alguna vez estuvieron confinadas a ecosistemas exclusivos, dando grandes pasos hacia este objetivo hoy en día.

Los investigadores dijeron que han planeado publicar un artículo académico detallando las complejidades técnicas y los puntos de referencia de Jina-embeddings-v2, brindando a la comunidad de IA la oportunidad de explorar más a fondo las capacidades del modelo. El equipo avanza en el desarrollo de una plataforma de API de incrustación similar a OpenAI, alcanzando una etapa avanzada que garantiza una escalabilidad fluida del modelo de incrustación adaptada a las necesidades de los usuarios. Además, Jina AI está ampliando sus capacidades lingüísticas al aventurarse en incrustaciones multilingües, con la intención de introducir modelos alemán-inglés. Esta expansión tiene como objetivo mejorar su cartera y reforzar su posición como líderes en innovación en IA.

El modelo se puede descargar fácilmente de forma gratuita en Hugging Face. El modelo base, formulado para tareas exigentes que requieren alta precisión, encuentra aplicaciones en campos como la investigación académica o el análisis empresarial. En contraste, el modelo pequeño, con un tamaño compacto de 0.07G, está diseñado para tareas más livianas, lo que lo hace ideal para aplicaciones en aplicaciones móviles o dispositivos con recursos informáticos limitados. Reconociendo los diversos requisitos dentro de la comunidad de IA, Jina AI presenta estas dos opciones de modelos distintas, permitiendo a los usuarios elegir la que mejor se adapte a sus necesidades computacionales y se alinee con sus preferencias de aplicación.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Comprendiendo el sesgo algorítmico Tipos, causas y estudios de casos

Introducción ¿Alguna vez te has preguntado por qué tu feed de redes sociales parece predecir tus intereses con una pr...

Inteligencia Artificial

Conoce a WebAgent el nuevo LLM de DeepMind que sigue instrucciones y completa tareas en sitios web

La integración entre modelos de lenguaje grandes (LLMs) y sitios web es una de las áreas que puede desbloquear una nu...

Inteligencia Artificial

Pensar, rápido y lento + IA

Los cerebros de los humanos contienen un mecanismo diseñado para dar prioridad a las malas noticias. - Daniel Kahnema...