Indian Startup lanza OpenHathi el primer LLM en hindi de la historia

Indian Startup lanza OpenHathi, el primer LLM en hindi en la historia de la moda y la belleza

En un notable avance hacia la innovación lingüística, la startup india de IA Sarvam AI ha lanzado OpenHathi LLM, marcando un salto significativo en el ámbito de los modelos de lenguaje hindi. Tan solo una semana después de asegurar impresionantes $41 millones en financiamiento de la Serie A, la compañía presentó OpenHathi-Hi-v0.1, el primer lanzamiento en la serie OpenHathi.

Génesis de OpenHathi

La última creación de Sarvam AI se basa en la arquitectura Llama2-7B de Meta AI, específicamente diseñada para los matices del hindi, el idioma más hablado de la India. Posicionado como el primer Modelo de Lenguaje Grande (LLM) en hindi de la serie OpenHathi, promete un rendimiento equivalente al de GPT-3.5 para los idiomas indios. Los cimientos del modelo se basan en una plataforma rentable, que amplía las capacidades de Llama2-7B.

Revelando el Proceso de Entrenamiento

OpenHathi-Hi-v0.1 pasa por un meticuloso proceso de entrenamiento en dos fases. Inicialmente, el enfoque está en la alineación de incrustaciones, alineando las incrustaciones en hindi inicializadas aleatoriamente. Posteriormente, el modelo se dedica al modelado de lenguaje bilingüe, dominando la atención interlingüística entre tokens. El resultado es un rendimiento sólido en diversas tareas en hindi, mostrando habilidades tanto en escrituras nativas como en romanizadas.

Colaboraciones y Contribuciones Académicas

Desarrollado en colaboración con socios académicos en AI4Bharat, OpenHathi-Hi-v0.1 de Sarvam AI se beneficia de los recursos de lenguaje y las pruebas proporcionadas por estos socios. Este esfuerzo colaborativo se extiende más allá de las fronteras lingüísticas, como se puede ver con el reciente anuncio de KissanAI sobre Dhenu 1.0, un innovador Modelo de Lenguaje Grande para Agricultura. Esta maravilla bilingüe se adapta directamente a las necesidades lingüísticas de los agricultores en inglés, hindi e hinglish.

El Futuro de Sarvam AI

Pratyush Kumar y Vivek Raghavan, los cofundadores de Sarvam AI, lanzaron la startup en julio de 2023. Impulsados por el sólido financiamiento de la Serie A liderado por Lightspeed Ventures, la dupla tiene como objetivo abordar las necesidades únicas de la India a través de la integración de la IA Generativa para diversos idiomas indios. Su enfoque se extiende a fomentar colaboraciones con empresas para el desarrollo de modelos de IA específicos de dominio utilizando datos como base.

Nuestra Opinión

En un panorama donde la diversidad lingüística es fundamental, OpenHathi-Hi-v0.1 de Sarvam AI emerge como una adición prometedora, encarnando el compromiso con la innovación en el ámbito de la IA en el lenguaje indio. El espíritu colaborativo con socios académicos y un claro plan de ruta para el futuro posicionan a Sarvam AI como un líder en el dominio de la IA Generativa. A medida que el modelo invita a los desarrolladores a explorar su potencial, anticipamos un efecto dominó de creatividad y modelos especializados que enriquecerán aún más el panorama de la IA en la India.

Adhiriéndose a los principios de transparencia y colaboración, el trayecto de Sarvam AI desde la investigación y desarrollo de infraestructura digital hasta la creación de modelos de lenguaje pioneros demuestra un enfoque consciente para abordar el singular tapiz lingüístico de la India.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Investigación en Stanford presenta PointOdyssey un conjunto de datos sintético a gran escala para el seguimiento de puntos a largo plazo

Los conjuntos de datos anotados a gran escala han servido como una autopista para crear modelos precisos en varias ta...

Inteligencia Artificial

Conoce a Ego-Exo4D Un conjunto de datos y una suite de referencia esenciales para apoyar la investigación sobre aprendizaje de video y percepción multimodal.

Hoy en día, la inteligencia artificial encuentra su aplicación en casi todos los campos imaginables. Definitivamente ...