Aumentando la precisión del modelo Técnicas que aprendí durante mi tesis de Machine Learning en Spotify (+fragmentos de código)
Aumentando precisión modelo Técnicas aprendidas tesis Machine Learning Spotify (+código)
Una pila de tecnología de un científico de datos para mejorar modelos de ML obstinados
Este artículo es una de las dos partes que documentan mis aprendizajes de mi Tesis de Aprendizaje Automático en Spotify. Asegúrate de revisar también el segundo artículo sobre cómo implementé la Importancia de las Características en esta investigación.
En 2021, pasé 8 meses construyendo un modelo predictivo para medir la satisfacción del usuario como parte de mi Tesis en Spotify.
![Imagen del autor](https://miro.medium.com/v2/resize:fit:640/format:webp/1*SUiVM45BO_U51aRFrOJ1pw.jpeg)
Mi objetivo era entender qué hacía que los usuarios estuvieran satisfechos con su experiencia musical. Para hacerlo, construí un clasificador LightGBM cuya salida era una respuesta binaria: y = 1 → el usuario aparentemente está satisfecho, y = 0 → no tanto
Predecir la satisfacción humana es un desafío porque los humanos, por definición, no están satisfechos. Incluso una máquina no está tan capacitada para descifrar los misterios de la psicología humana. Por lo tanto, naturalmente, mi modelo estaba tan confundido como se puede estar.
- Microsoft Azure vs. Google Cloud Platform’ ‘Microsoft Azure vs. Google Cloud Platform
- La inteligencia artificial ayuda a los robots a manipular objetos con todo su cuerpo
- Investigadores de la Universidad de Tokio desarrollaron un esquema de aprendizaje por refuerzo fotónico extendido que se mueve desde el problema estático del bandido hacia un entorno dinámico más desafiante.
De Predictor Humano a Adivino
Mi puntaje de precisión era alrededor de 0.5, que es el peor resultado posible que se puede obtener en un clasificador. Significa que el algoritmo tiene un 50% de probabilidad de predecir sí o no, y eso es tan aleatorio como una suposición humana.
Así que pasé 2 meses probando y combinando diferentes técnicas para mejorar la predicción de mi modelo. Al final, finalmente pude mejorar mi puntaje de ROC de 0.5 a 0.73, ¡lo cual fue un gran éxito!
En este artículo, compartiré contigo las técnicas que utilicé para mejorar significativamente la precisión de mi modelo. Este artículo puede ser útil cuando te enfrentes a modelos que simplemente no cooperan.
Debido a la confidencialidad de esta investigación, no puedo compartir información sensible, pero haré todo lo posible para que no suene confuso.
#0. Preparación de Datos
Antes de adentrarnos en los métodos que utilicé, quiero asegurarme de que primero comprendas los conceptos básicos correctamente. Algunos de estos métodos dependen de codificar tus variables y preparar tus datos adecuadamente para que funcionen. Algunos de los fragmentos de código que he incluido también hacen referencia a…
We will continue to update Zepes; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- Dos interesantes funciones de manipulación de datos en Pandas que necesitas conocer
- Hugging Face presenta IDEFICS Pionero en IA Conversacional Multimodal Abierta con Modelos de Lenguaje Visual
- Aprendizaje profundo en reconocimiento de imágenes técnicas y desafíos
- 14 complementos de Google Drive que te ahorrarán tiempo todos los días
- Cómo la IA está cambiando la forma en que programamos
- Algoritmos de búsqueda de IA Un análisis en profundidad de los más populares
- Novedades en IA complementos de ChatGPT y acceso a Internet