Aumentando la precisión del modelo Técnicas que aprendí durante mi tesis de Machine Learning en Spotify (+fragmentos de código)

Aumentando precisión modelo Técnicas aprendidas tesis Machine Learning Spotify (+código)

Una pila de tecnología de un científico de datos para mejorar modelos de ML obstinados

Este artículo es una de las dos partes que documentan mis aprendizajes de mi Tesis de Aprendizaje Automático en Spotify. Asegúrate de revisar también el segundo artículo sobre cómo implementé la Importancia de las Características en esta investigación.

En 2021, pasé 8 meses construyendo un modelo predictivo para medir la satisfacción del usuario como parte de mi Tesis en Spotify.

Mi objetivo era entender qué hacía que los usuarios estuvieran satisfechos con su experiencia musical. Para hacerlo, construí un clasificador LightGBM cuya salida era una respuesta binaria: y = 1 → el usuario aparentemente está satisfecho, y = 0 → no tanto

Predecir la satisfacción humana es un desafío porque los humanos, por definición, no están satisfechos. Incluso una máquina no está tan capacitada para descifrar los misterios de la psicología humana. Por lo tanto, naturalmente, mi modelo estaba tan confundido como se puede estar.

De Predictor Humano a Adivino

Mi puntaje de precisión era alrededor de 0.5, que es el peor resultado posible que se puede obtener en un clasificador. Significa que el algoritmo tiene un 50% de probabilidad de predecir sí o no, y eso es tan aleatorio como una suposición humana.

Así que pasé 2 meses probando y combinando diferentes técnicas para mejorar la predicción de mi modelo. Al final, finalmente pude mejorar mi puntaje de ROC de 0.5 a 0.73, ¡lo cual fue un gran éxito!

En este artículo, compartiré contigo las técnicas que utilicé para mejorar significativamente la precisión de mi modelo. Este artículo puede ser útil cuando te enfrentes a modelos que simplemente no cooperan.

Debido a la confidencialidad de esta investigación, no puedo compartir información sensible, pero haré todo lo posible para que no suene confuso.

#0. Preparación de Datos

Antes de adentrarnos en los métodos que utilicé, quiero asegurarme de que primero comprendas los conceptos básicos correctamente. Algunos de estos métodos dependen de codificar tus variables y preparar tus datos adecuadamente para que funcionen. Algunos de los fragmentos de código que he incluido también hacen referencia a…

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Was this article helpful?

93 out of 132 found this helpful

Aumentando la precisión del modelo Técnicas que aprendí durante mi tesis de Machine Learning en Spotify (+fragmentos de código)

Una pila de tecnología de un científico de datos para mejorar modelos de ML obstinados

De Predictor Humano a Adivino

#0. Preparación de Datos

Was this article helpful?

Microsoft Azure vs. Google Cloud Platform’ ‘Microsoft Azure vs. Google Cloud Platform

Los mejores cursos de IA de universidades con listas de reproducción de YouTube

Inteligencia Artificial

Técnica de Machine Learning Mejor para Predecir Tasas de Cura del Cáncer

Investigadores de UT Austin y UC Berkeley presentan Ambient Diffusion un marco de inteligencia artificial para entrenar/ajustar modelos de difusión dados solo datos corruptos como entrada.

Deja de usar PowerPoint para tus presentaciones de ML y prueba esto en su lugar

Manteniendo secretos en un mundo cuántico

Sensor de alcohol móvil para la muñeca podría impulsar la investigación sobre el consumo de alcohol.

Un caso que rima con Microsoft