Aumentando la precisión del modelo Técnicas que aprendí durante mi tesis de Machine Learning en Spotify (+fragmentos de código)

Aumentando precisión modelo Técnicas aprendidas tesis Machine Learning Spotify (+código)

Una pila de tecnología de un científico de datos para mejorar modelos de ML obstinados

Este artículo es una de las dos partes que documentan mis aprendizajes de mi Tesis de Aprendizaje Automático en Spotify. Asegúrate de revisar también el segundo artículo sobre cómo implementé la Importancia de las Características en esta investigación.

En 2021, pasé 8 meses construyendo un modelo predictivo para medir la satisfacción del usuario como parte de mi Tesis en Spotify.

Imagen del autor

Mi objetivo era entender qué hacía que los usuarios estuvieran satisfechos con su experiencia musical. Para hacerlo, construí un clasificador LightGBM cuya salida era una respuesta binaria: y = 1 → el usuario aparentemente está satisfecho, y = 0 → no tanto

Predecir la satisfacción humana es un desafío porque los humanos, por definición, no están satisfechos. Incluso una máquina no está tan capacitada para descifrar los misterios de la psicología humana. Por lo tanto, naturalmente, mi modelo estaba tan confundido como se puede estar.

De Predictor Humano a Adivino

Mi puntaje de precisión era alrededor de 0.5, que es el peor resultado posible que se puede obtener en un clasificador. Significa que el algoritmo tiene un 50% de probabilidad de predecir sí o no, y eso es tan aleatorio como una suposición humana.

Así que pasé 2 meses probando y combinando diferentes técnicas para mejorar la predicción de mi modelo. Al final, finalmente pude mejorar mi puntaje de ROC de 0.5 a 0.73, ¡lo cual fue un gran éxito!

En este artículo, compartiré contigo las técnicas que utilicé para mejorar significativamente la precisión de mi modelo. Este artículo puede ser útil cuando te enfrentes a modelos que simplemente no cooperan.

Debido a la confidencialidad de esta investigación, no puedo compartir información sensible, pero haré todo lo posible para que no suene confuso.

#0. Preparación de Datos

Antes de adentrarnos en los métodos que utilicé, quiero asegurarme de que primero comprendas los conceptos básicos correctamente. Algunos de estos métodos dependen de codificar tus variables y preparar tus datos adecuadamente para que funcionen. Algunos de los fragmentos de código que he incluido también hacen referencia a…

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Técnica de Machine Learning Mejor para Predecir Tasas de Cura del Cáncer

Un modelo de aprendizaje automático desarrollado por investigadores de la Universidad de Texas en Arlington (UTA) pue...

Ciencia de Datos

Deja de usar PowerPoint para tus presentaciones de ML y prueba esto en su lugar

Las malas presentaciones de PowerPoint crean audiencias distraídas (que apagan sus cámaras y realizan varias tareas a...

Inteligencia Artificial

Manteniendo secretos en un mundo cuántico

Los criptógrafos están trabajando en esquemas de cifrado de datos lo suficientemente fuertes como para resistir ataqu...

Investigación

Sensor de alcohol móvil para la muñeca podría impulsar la investigación sobre el consumo de alcohol.

Científicos de la Universidad Estatal de Pensilvania y de la Universidad de Carolina del Norte crearon un sensor de m...

Inteligencia Artificial

Un caso que rima con Microsoft

La lección predominante del caso de Microsoft, según los abogados antimonopolio, es que el escrutinio de Washington p...