BERTopic ¿Qué tiene de especial la versión 0.16?
BERTopic ¿Qué hace especial a la versión 0.16?
Explorando la Modelización de Temas sin Etiquetas, la Combinación de Modelos y los LLM
Mi ambición para BERTopic es convertirlo en el punto de referencia para la modelización de temas, permitiendo una flexibilidad y modularidad significativas.
Ese ha sido el objetivo durante los últimos años y con el lanzamiento de v0.16, creo que estamos un GRAN paso más cerca de lograrlo.
Primero, retrocedamos un poco. ¿Qué es BERTopic?
- Cuantificar el consumo de electricidad de la AI generativa
- Principales trabajos importantes sobre visión por computadora de la semana del 04/12 al 10/12
- Tendencias de IA en ciberseguridad para observar en 2024
Bueno, BERTopic es un marco de modelización de temas que permite a los usuarios crear su propia versión de un modelo de tema. Con muchas variaciones de modelización de temas implementadas, la idea es que pueda adaptarse a casi cualquier caso de uso.
![La naturaleza modular de BERTopic te permite construir tu modelo de tema como desees. Cambiar los componentes permite que BERTopic crezca con los últimos avances en IA del lenguaje.](https://ai.miximages.com/miro.medium.com/v2/resize:fit:640/format:webp/1*mJUr8GX5-kov9GUJ3ZPc-A.png)
Con v0.16, se implementaron varias características que creo que llevarán a BERTopic al siguiente nivel, a saber:
- Modelización de Temas sin Etiquetas
- Combinación de Modelos
- Mayor Soporte para Modelos de Lenguaje de Amplia Escala (LLM)
![Solo algunas de las capacidades de BERTopic.](https://ai.miximages.com/miro.medium.com/v2/resize:fit:640/format:webp/1*-exz3H1s-rD3CwrKBs3MhA.png)
En este tutorial, vamos a repasar qué son estas características y en qué casos de uso podrían ser útiles.
Para empezar, puedes instalar BERTopic (con conjuntos de datos de HF) de la siguiente manera:
pip install bertopic datasets
También puedes seguir el Notebook de Google Colab para asegurarte de que todo funcione como se espera.
Modelización de Temas sin Etiquetas: Una Técnica Flexible
Las técnicas de modelización sin etiquetas generalmente se refieren a no tener ejemplos para entrenar tus datos. Aunque conoces el objetivo, no se asigna a tus datos.
En BERTopic, utilizamos la Modelización de Temas sin Etiquetas para encontrar temas predefinidos en grandes cantidades de documentos.
Imagina que tienes resúmenes de ArXiv sobre Aprendizaje Automático y sabes que el tema “Modelos de Lenguaje de Amplia Escala” está presente. Con la Modelización de Temas sin Etiquetas, puedes pedirle a BERTopic que encuentre todos los documentos relacionados con…
We will continue to update Zepes; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- Principales repositorios de Generative AI en GitHub para revisar en 2023
- ¿Por qué el modelo de IA Orca-2 de Microsoft marca un avance significativo en la IA sostenible?
- Mistral AI presenta Mixtral 8x7B un potente modelo disperso de mezcla de expertos
- Una Exploración Integral de las Pruebas de Accesibilidad Automatizadas vs. Manuales
- Empezando con MyScale a través del cliente de Python
- Lo que las empresas deben saber sobre los grandes modelos de lenguaje
- Essential AI recauda $56.5 millones en la Serie A