BERTopic ¿Qué tiene de especial la versión 0.16?

BERTopic ¿Qué hace especial a la versión 0.16?

Explorando la Modelización de Temas sin Etiquetas, la Combinación de Modelos y los LLM

Mi ambición para BERTopic es convertirlo en el punto de referencia para la modelización de temas, permitiendo una flexibilidad y modularidad significativas.

Ese ha sido el objetivo durante los últimos años y con el lanzamiento de v0.16, creo que estamos un GRAN paso más cerca de lograrlo.

Primero, retrocedamos un poco. ¿Qué es BERTopic?

Bueno, BERTopic es un marco de modelización de temas que permite a los usuarios crear su propia versión de un modelo de tema. Con muchas variaciones de modelización de temas implementadas, la idea es que pueda adaptarse a casi cualquier caso de uso.

La naturaleza modular de BERTopic te permite construir tu modelo de tema como desees. Cambiar los componentes permite que BERTopic crezca con los últimos avances en IA del lenguaje.

Con v0.16, se implementaron varias características que creo que llevarán a BERTopic al siguiente nivel, a saber:

  • Modelización de Temas sin Etiquetas
  • Combinación de Modelos
  • Mayor Soporte para Modelos de Lenguaje de Amplia Escala (LLM)
Solo algunas de las capacidades de BERTopic.

En este tutorial, vamos a repasar qué son estas características y en qué casos de uso podrían ser útiles.

Para empezar, puedes instalar BERTopic (con conjuntos de datos de HF) de la siguiente manera:

pip install bertopic datasets

También puedes seguir el Notebook de Google Colab para asegurarte de que todo funcione como se espera.

Modelización de Temas sin Etiquetas: Una Técnica Flexible

Las técnicas de modelización sin etiquetas generalmente se refieren a no tener ejemplos para entrenar tus datos. Aunque conoces el objetivo, no se asigna a tus datos.

En BERTopic, utilizamos la Modelización de Temas sin Etiquetas para encontrar temas predefinidos en grandes cantidades de documentos.

Imagina que tienes resúmenes de ArXiv sobre Aprendizaje Automático y sabes que el tema “Modelos de Lenguaje de Amplia Escala” está presente. Con la Modelización de Temas sin Etiquetas, puedes pedirle a BERTopic que encuentre todos los documentos relacionados con…

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Aprendizaje Automático

Escribir canciones con GPT-4 Parte 3, Melodías

Cómo usar ChatGPT con GPT-4 de OpenAI para escribir melodías para nuevas canciones utilizando tablaturas de guitarra ...

Inteligencia Artificial

Los modelos Whisper para reconocimiento automático del habla ahora están disponibles en Amazon SageMaker JumpStart.

Hoy, nos complace anunciar que el modelo de base Whisper de OpenAI está disponible para los clientes que utilizan Ama...

Aprendizaje Automático

Los ejércitos de robots luchan en las épicas batallas en pantalla de Battlecode.

La competencia de programación de larga duración fomenta habilidades y amistades que duran toda la vida.

Aprendizaje Automático

Toma esto y conviértelo en una marioneta digital GenMM es un modelo de IA que puede sintetizar movimiento usando un solo ejemplo.

Las animaciones generadas por computadora se están volviendo cada vez más realistas cada día. Este avance se puede ve...

Aprendizaje Automático

Detectando el Crecimiento del Cáncer Utilizando Inteligencia Artificial y Visión por Computadora.

El cáncer de mama es una de las formas más mortales de cáncer en mujeres. Según la Organización Mundial de la Salud (...