Predicciones de rotación en evolución Navegando intervenciones y capacitación nuevamente
Predicciones de evolución en la rotación, navegando intervenciones y capacitación de nuevo
La reentrenamiento de modelos de abandono presenta desafíos únicos que requieren atención especial
El reentrenamiento de modelos de aprendizaje automático, especialmente aquellos enfocados en la predicción de abandono de clientes, es un paso esencial para garantizar su relevancia y precisión a lo largo del tiempo. Sin embargo, el reentrenamiento de los modelos de abandono presenta desafíos únicos que requieren atención especial. Entre los más notables se encuentra distinguir entre los efectos causales de las intervenciones, es decir, identificar a los clientes que se han quedado debido al programa de retención proactiva para enfocarse exclusivamente en ellos.
Impacto de las intervenciones en el reentrenamiento de abandono
Considera la siguiente secuencia de eventos:
- Entrenamiento inicial del modelo: Se entrena un modelo utilizando datos históricos de clientes.
- Inferencia del modelo: Se identifica a ciertos clientes como propensos al abandono.
- Intervención por parte de la empresa: Interactuar con estos clientes para persuadirlos de que se queden o utilizar medidas como promociones y ofertas personalizadas para fomentar la retención.
- Reentrenamiento con nuevos datos: Cuando el rendimiento del modelo se degrada, es probable que sea hora de reentrenarlo; el modelo se actualiza con datos más recientes, que incluyen los resultados de estas intervenciones.
Imagina un escenario: se predice que un cliente abandonará, se le brinda atención por parte de un representante de retención y luego decide quedarse. El desafío surge al tratar de determinar la razón detrás de su decisión: ¿la intervención cambió su opinión o fueron mal clasificados por el modelo desde un principio? Al reentrenar el modelo con datos tan ambiguos, existe el riesgo de distorsionar las predicciones futuras del modelo; etiquetar al cliente anterior como “quedó” podría ser engañoso, ya que podrían haberse ido si no los hubiéramos persuadido a quedarse. Lo mismo ocurre con las etiquetas de abandono; una intervención podría ser el único motivo de abandono, lo que hace que algunas etiquetas de abandono sean poco confiables.
![Cuando los esfuerzos de retención difuminan la claridad del modelo](https://ai.miximages.com/miro.medium.com/v2/resize:fit:640/format:webp/1*zISA2D6RfPkgd0VB_Z1XSQ.jpeg)
Posibles formas de lidiar con el sesgo:
- Grupos de control y datos sintéticos: Crear un subconjunto de clientes “propensos al abandono” a los que no se les aplican intervenciones. Al comparar los resultados entre este grupo de control y el grupo interviniendo, se puede determinar el impacto real de las intervenciones; si un segmento específico de clientes abandona más cuando se les trata, se debe examinar su exclusión de la intervención. Al momento de reentrenar, se puede utilizar datos del grupo de control y excluir los datos del grupo intervenido, asegurando que el modelo se base en etiquetas de abandono confiables. La desventaja de este método es la pérdida de datos críticos, por lo que para compensar la exclusión de los clientes intervenidos, se pueden generar muestras sintéticas del grupo de control que representen a esos clientes. Esto se puede hacer utilizando técnicas de sobremuestreo como SMOTE.
- Encuestas de retroalimentación: Interactuar directamente con los clientes después de la intervención para comprender sus razones para quedarse o abandonar. Los conocimientos recopilados pueden proporcionar claridad sobre la efectividad de las intervenciones y ayudar a diferenciar entre aquellos que realmente se quedan y aquellos que son influenciados por los esfuerzos realizados.
- Combinación de modelos: Intentar combinar el modelo de entrenamiento inicial con el nuevo. El promedio de predicciones o el uso de métodos de conjunto pueden reducir el riesgo de que los sesgos de un solo modelo dominen la predicción general. Ten en cuenta que a medida que pasa el tiempo, los datos de entrenamiento inicial pueden ser menos relevantes.
Uplift Modeling: el estándar de oro para refinar las predicciones de abandono
A diferencia de los modelos tradicionales de abandono que predicen quién podría abandonar, el uplift modeling identifica a los clientes cuyo comportamiento cambia directamente debido a una intervención. Al comparar el grupo intervenido con el grupo de control, estos modelos predicen qué clientes se quedan por la intervención y, por otro lado, cuáles se van debido a una intervención. Este enfoque dirigido ayuda a las empresas a optimizar recursos y maximizar el valor del cliente.
- Cómo Getir redujo la duración del entrenamiento de modelos en un 90% con Amazon SageMaker y AWS Batch
- La historia interna de la colaboración de Microsoft con OpenAI
- Chip fotónico ‘se ajusta como un Lego
Los clientes se pueden dividir en cuatro categorías teóricas en función de si fueron tratados o no para retenerlos:Casos seguros: Clientes que no se irán. Apuntar a ellos no ofrece ganancias adicionales pero agrega costos, como esfuerzos de comunicación e incentivos financieros potenciales.Casos perdidos: Clientes que se irán sin importar las intervenciones. No generan ingresos y pueden resultar en costos reducidos en comparación con los casos seguros, ya que no aprovechan los incentivos ofrecidos.Posibles persuadibles: Clientes que se quedan solo después del esfuerzo de retención. Contribuyen con ingresos adicionales.No molestar: Clientes que se irán solo si son contactados. Dejarlos tranquilos es beneficioso, mientras que contactarlos agrega costos significativos sin ganancias de ingresos, convirtiéndolos en “perros durmientes”.
El objetivo del modelado de aumento es dirigirse exclusivamente a los persuadibles. El desafío es que no podemos determinar en qué categoría caen las personas. No podemos tratarlos y tenerlos al mismo tiempo en el grupo de control. Entonces, ¿cómo podríamos identificarlos? ¿cómo podríamos saber si fueron persuadidos o si no tenían la intención de abandonar en primer lugar? Aquí es donde entra en juego el modelado de aumento.
Hay varios enfoques de aumento para este desafío, vamos a echar un vistazo al método de “Resultado Transformado”. Este método requiere datos tanto de un grupo de control como de tratamiento, y cambia nuestro enfoque de una tarea de clasificación a una de regresión. Las etiquetas se asignan en función de una fórmula específica, y para una asignación aleatoria de tratamiento donde la propensión al tratamiento es igual a 0.5, la variable objetivo se traduce en estos valores:
Podemos utilizar una función de pérdida como el error cuadrático medio (MSE) como métrica para resolver este problema de regresión: Para los Persuadibles, el control se etiqueta como 0 y el tratamiento como 2. El MSE más bajo entre ellos se producirá cuando la puntuación sea 1, lo que representa el aumento de los Persuadibles. Para los No molestar, el control es -2 y el tratamiento es 0, y la predicción óptima es -1, lo que significa el aumento. Para los Casos perdidos y los Casos seguros, la mejor predicción es 0. Idealmente, se deben dirigir las puntuaciones más altas para tratar de retener a los Persuadibles y evitar a los No molestar y a los demás en la medida de lo posible.
Navegando el Futuro de las Predicciones de Churn
Como hemos explorado, el panorama de la predicción de la rotación, con sus complejidades de intervenciones y datos en evolución, plantea desafíos para las empresas. Volver a entrenar modelos no es simplemente un ejercicio técnico, sino parte de entender el comportamiento del cliente y dar sentido a una retención genuina. Aprovechar herramientas como grupos de control, mecanismos de retroalimentación y modelado de aumento. Pero quizás lo más importante es reconocer que los datos no son estáticos. Nuestra comprensión del comportamiento del cliente debe adaptarse. Abrazar esta situación dinámica, refinar continuamente los modelos y estar atentos a los patrones cambiantes será clave para una predicción y gestión exitosa de la rotación en el futuro.
Lecturas Adicionales:
- Modelado de aumento utilizando el enfoque de “Resultado Transformado”
- Inferencia causal y modelado de aumento: Una revisión de la literatura
- Métodos de aprendizaje automático para estimar efectos casuales heterogéneos
- Paquete python Pylift para modelado de aumento
We will continue to update Zepes; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- La retroalimentación colaborativa ayuda a entrenar a los robots
- Las 5 principales empresas de Web3 a tener en cuenta en 2024
- Cuantificar Patrones de Transporte Utilizando Datos GTFS
- El ex CEO de Google advierte que las actuales barreras de inteligencia artificial no son suficientes
- Pequeño pero poderoso avances de los modelos de lenguaje pequeños en la era de los modelos de lenguaje grandes dominantes
- 15+ Herramientas de IA para Desarrolladores (Diciembre 2023)
- Aprovechando el poder de las APIs Moldeando la hoja de ruta del producto y elevando las experiencias de los usuarios a través de la autenticación