Predicciones de rotación en evolución Navegando intervenciones y capacitación nuevamente

Predicciones de evolución en la rotación, navegando intervenciones y capacitación de nuevo

La reentrenamiento de modelos de abandono presenta desafíos únicos que requieren atención especial

Foto de CrowN en Unsplash

El reentrenamiento de modelos de aprendizaje automático, especialmente aquellos enfocados en la predicción de abandono de clientes, es un paso esencial para garantizar su relevancia y precisión a lo largo del tiempo. Sin embargo, el reentrenamiento de los modelos de abandono presenta desafíos únicos que requieren atención especial. Entre los más notables se encuentra distinguir entre los efectos causales de las intervenciones, es decir, identificar a los clientes que se han quedado debido al programa de retención proactiva para enfocarse exclusivamente en ellos.

Impacto de las intervenciones en el reentrenamiento de abandono

Considera la siguiente secuencia de eventos:

  1. Entrenamiento inicial del modelo: Se entrena un modelo utilizando datos históricos de clientes.
  2. Inferencia del modelo: Se identifica a ciertos clientes como propensos al abandono.
  3. Intervención por parte de la empresa: Interactuar con estos clientes para persuadirlos de que se queden o utilizar medidas como promociones y ofertas personalizadas para fomentar la retención.
  4. Reentrenamiento con nuevos datos: Cuando el rendimiento del modelo se degrada, es probable que sea hora de reentrenarlo; el modelo se actualiza con datos más recientes, que incluyen los resultados de estas intervenciones.

Imagina un escenario: se predice que un cliente abandonará, se le brinda atención por parte de un representante de retención y luego decide quedarse. El desafío surge al tratar de determinar la razón detrás de su decisión: ¿la intervención cambió su opinión o fueron mal clasificados por el modelo desde un principio? Al reentrenar el modelo con datos tan ambiguos, existe el riesgo de distorsionar las predicciones futuras del modelo; etiquetar al cliente anterior como “quedó” podría ser engañoso, ya que podrían haberse ido si no los hubiéramos persuadido a quedarse. Lo mismo ocurre con las etiquetas de abandono; una intervención podría ser el único motivo de abandono, lo que hace que algunas etiquetas de abandono sean poco confiables.

Cuando los esfuerzos de retención difuminan la claridad del modelo

Posibles formas de lidiar con el sesgo:

  1. Grupos de control y datos sintéticos: Crear un subconjunto de clientes “propensos al abandono” a los que no se les aplican intervenciones. Al comparar los resultados entre este grupo de control y el grupo interviniendo, se puede determinar el impacto real de las intervenciones; si un segmento específico de clientes abandona más cuando se les trata, se debe examinar su exclusión de la intervención. Al momento de reentrenar, se puede utilizar datos del grupo de control y excluir los datos del grupo intervenido, asegurando que el modelo se base en etiquetas de abandono confiables. La desventaja de este método es la pérdida de datos críticos, por lo que para compensar la exclusión de los clientes intervenidos, se pueden generar muestras sintéticas del grupo de control que representen a esos clientes. Esto se puede hacer utilizando técnicas de sobremuestreo como SMOTE.
  2. Encuestas de retroalimentación: Interactuar directamente con los clientes después de la intervención para comprender sus razones para quedarse o abandonar. Los conocimientos recopilados pueden proporcionar claridad sobre la efectividad de las intervenciones y ayudar a diferenciar entre aquellos que realmente se quedan y aquellos que son influenciados por los esfuerzos realizados.
  3. Combinación de modelos: Intentar combinar el modelo de entrenamiento inicial con el nuevo. El promedio de predicciones o el uso de métodos de conjunto pueden reducir el riesgo de que los sesgos de un solo modelo dominen la predicción general. Ten en cuenta que a medida que pasa el tiempo, los datos de entrenamiento inicial pueden ser menos relevantes.

Uplift Modeling: el estándar de oro para refinar las predicciones de abandono

A diferencia de los modelos tradicionales de abandono que predicen quién podría abandonar, el uplift modeling identifica a los clientes cuyo comportamiento cambia directamente debido a una intervención. Al comparar el grupo intervenido con el grupo de control, estos modelos predicen qué clientes se quedan por la intervención y, por otro lado, cuáles se van debido a una intervención. Este enfoque dirigido ayuda a las empresas a optimizar recursos y maximizar el valor del cliente.

Los clientes se pueden dividir en cuatro categorías teóricas en función de si fueron tratados o no para retenerlos:Casos seguros: Clientes que no se irán. Apuntar a ellos no ofrece ganancias adicionales pero agrega costos, como esfuerzos de comunicación e incentivos financieros potenciales.Casos perdidos: Clientes que se irán sin importar las intervenciones. No generan ingresos y pueden resultar en costos reducidos en comparación con los casos seguros, ya que no aprovechan los incentivos ofrecidos.Posibles persuadibles: Clientes que se quedan solo después del esfuerzo de retención. Contribuyen con ingresos adicionales.No molestar: Clientes que se irán solo si son contactados. Dejarlos tranquilos es beneficioso, mientras que contactarlos agrega costos significativos sin ganancias de ingresos, convirtiéndolos en “perros durmientes”.

El objetivo del modelado de aumento es dirigirse exclusivamente a los persuadibles. El desafío es que no podemos determinar en qué categoría caen las personas. No podemos tratarlos y tenerlos al mismo tiempo en el grupo de control. Entonces, ¿cómo podríamos identificarlos? ¿cómo podríamos saber si fueron persuadidos o si no tenían la intención de abandonar en primer lugar? Aquí es donde entra en juego el modelado de aumento.

Hay varios enfoques de aumento para este desafío, vamos a echar un vistazo al método de “Resultado Transformado”. Este método requiere datos tanto de un grupo de control como de tratamiento, y cambia nuestro enfoque de una tarea de clasificación a una de regresión. Las etiquetas se asignan en función de una fórmula específica, y para una asignación aleatoria de tratamiento donde la propensión al tratamiento es igual a 0.5, la variable objetivo se traduce en estos valores:

Podemos utilizar una función de pérdida como el error cuadrático medio (MSE) como métrica para resolver este problema de regresión: Para los Persuadibles, el control se etiqueta como 0 y el tratamiento como 2. El MSE más bajo entre ellos se producirá cuando la puntuación sea 1, lo que representa el aumento de los Persuadibles. Para los No molestar, el control es -2 y el tratamiento es 0, y la predicción óptima es -1, lo que significa el aumento. Para los Casos perdidos y los Casos seguros, la mejor predicción es 0. Idealmente, se deben dirigir las puntuaciones más altas para tratar de retener a los Persuadibles y evitar a los No molestar y a los demás en la medida de lo posible.

Como hemos explorado, el panorama de la predicción de la rotación, con sus complejidades de intervenciones y datos en evolución, plantea desafíos para las empresas. Volver a entrenar modelos no es simplemente un ejercicio técnico, sino parte de entender el comportamiento del cliente y dar sentido a una retención genuina. Aprovechar herramientas como grupos de control, mecanismos de retroalimentación y modelado de aumento. Pero quizás lo más importante es reconocer que los datos no son estáticos. Nuestra comprensión del comportamiento del cliente debe adaptarse. Abrazar esta situación dinámica, refinar continuamente los modelos y estar atentos a los patrones cambiantes será clave para una predicción y gestión exitosa de la rotación en el futuro.

Lecturas Adicionales:

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Robot se posiciona en el podio como director de orquesta en Seúl.

Un robot android creado por el Instituto de Tecnología Industrial de Corea del Sur recientemente dirigió la orquesta ...

Inteligencia Artificial

ChatGPT responde incorrectamente a más de la mitad de las preguntas de ingeniería de software

ChatGPT respondió incorrectamente el 52% de 517 preguntas de Stack Overflow, y el 77% de las respuestas fueron innece...

Inteligencia Artificial

La burbuja de la IA generativa estallará pronto

Debido a la exageración insostenible, las valoraciones poco realistas, las limitaciones de la tecnología actual y los...

Inteligencia Artificial

Los mejores cursos de IA de universidades con listas de reproducción de YouTube

¡Inicia una nueva carrera o desarrolla la actual con estas listas de reproducción de YouTube de universidades confiab...

Inteligencia Artificial

Acelerando el tiempo para obtener conocimientos con las colecciones de series temporales de MongoDB y Amazon SageMaker Canvas

Este es un artículo de invitado escrito conjuntamente con Babu Srinivasan de MongoDB. A medida que las industrias evo...