¿Qué son las reglas de asociación en la minería de datos?

¿A qué se refieren las reglas de asociación en la minería de datos?

Introducción

La evolución de los humanos, desde la minería del carbón hasta la minería de datos, ha contribuido inmensamente al crecimiento humano y al desarrollo tecnológico. El peso del trabajo físico ha cambiado ahora hacia el esfuerzo mental para realizar este nuevo tipo de minería. El proceso de minería de datos incluye múltiples aspectos, entre los cuales destaca la regla de asociación, que es significativa debido a su contribución práctica para comprender a los clientes y impulsar el crecimiento empresarial. ¿Tienes los requisitos exactos? ¿Te interesa mejorar tus conocimientos para lograr un aumento exponencial en la satisfacción del cliente? ¿Estás buscando desarrollar un sistema de recomendación mejorado lo suficientemente competitivo como para competir con las grandes marcas? Aquí tienes una breve introducción a los conceptos clave y los fundamentos de las reglas de asociación en la minería de datos.

Objetivos de aprendizaje

  • Comprender la esencia de las reglas de asociación como declaraciones si/entonces que revelan relaciones dentro de los datos.
  • Identificar y diferenciar aplicaciones tales como el análisis de la cesta de la compra, detección de fraudes y sistemas de recomendación, demostrando la versatilidad y la importancia práctica de las reglas de asociación.
  • Obtener una visión de cómo funcionan las reglas de asociación, explorando el papel de la cardinalidad, el soporte, la confianza y el lift en la predicción y evaluación de las relaciones dentro de los conjuntos de datos.

¿Qué son las reglas de asociación en la minería de datos?

Tal como indica su nombre, las reglas de asociación son declaraciones si/entonces que identifican las relaciones o dependencias entre los datos. Con la propiedad característica de adaptarse a datos categóricos, numéricos y no numéricos, se aplica con frecuencia en el análisis de la cesta de la compra y otras aplicaciones. Puede extraer datos de bases de datos relacionales y transaccionales, así como de otras fuentes de datos.

La regla de asociación tiene dos partes: el antecedente o si, y el consecuente o entonces. El antecedente es la primera parte disponible en los datos, mientras que el consecuente es la parte resultante disponible en combinación con el antecedente. Por ejemplo, en el análisis de la cesta de la compra, la regla sería: “Si un cliente compra zapatillas para correr, es probable que también compre barras energéticas”. En este caso, las zapatillas para correr son el antecedente y las barras energéticas son el consecuente. Este ejemplo se enfoca especialmente en el público aficionado al fitness.

¿Cuáles son los casos de uso de las reglas de asociación?

Existen una amplia variedad de aplicaciones para las reglas de asociación. Los tres principales ejemplos de minería de reglas de asociación son:

Análisis de la cesta de la compra: Un ejemplo de una combinación de compra puede ser la adquisición de yogur y granola, lo que indica una asociación probable con la compra de frutas del bosque. Esto demuestra la importancia de las reglas de asociación en el análisis de los hábitos de compra y los requisitos de los clientes. Su uso práctico se observa en el desarrollo de ofertas de combinación adecuadas, la optimización de la ubicación de los productos y el aumento de las ventas.

Detección de fraudes: En este caso, la combinación de uso consiste en identificar un patrón de compra, su ubicación y frecuencia. El reconocimiento de ello ayuda a identificar actividades fraudulentas y tomar medidas preventivas desde la misma dirección IP.

Sistemas de recomendación: Incluyen la detección de patrones de uso a partir del historial de navegación y las compras anteriores para predecir los futuros requisitos del usuario. Las recomendaciones se basan en ello. La ampliación del uso va más allá del marketing, siendo especialmente relevante en servicios de música y programas de televisión.

Fuente: Dataaspirant

¿Cómo funcionan las reglas de asociación?

La predicción en las reglas de asociación, explicada precedentemente con ejemplos, se calcula en base a la cardinalidad, el soporte y la confianza. La cardinalidad se refiere a la relación entre dos elementos, que aumenta proporcionalmente con el número de objetos. El soporte indica la frecuencia de las afirmaciones, y la confianza informa sobre la frecuencia de veracidad de estas relaciones. Las reglas de asociación funcionan al determinar las reglas que rigen el motivo y la situación en la que pueden ocurrir las combinaciones. Por ejemplo, la opción preferida de desayuno saludable y rápida combina yogur con granola y frutas del bosque.

En ocasiones, en situaciones prácticas, los números pueden ser poco realistas. Algunos elementos estadísticamente independientes con la menor combinación de compras pueden agruparse con un porcentaje significativamente alto en el uso práctico. Por ejemplo, en términos estadísticos, es poco probable que se compre cerveza y pañales juntos, aunque las estadísticas del mundo real son considerablemente más altas. El aumento en las estadísticas se llama lift.

Medidas de la Efectividad de las Reglas de Asociación

La efectividad de las reglas de asociación se mide principalmente mediante el soporte, la confianza y el lift. El soporte se refiere a la frecuencia, y un alto soporte indica la frecuencia común de una cantidad en el conjunto de datos. La confianza mide la fiabilidad de la regla de asociación. Una alta confianza sugiere que A y B son proporcionales y, por lo tanto, aumentan en relación directa entre sí.

El lift compara la dependencia del elemento. Si los números estadísticos y prácticos son iguales o el antecedente y el consecuente son iguales, el lift será 1 y los objetos asociados serán independientes. Los objetos dependen entre sí si el lift es mayor que 1 y el antecedente es mayor que el consecuente. Además, la combinación tiene un impacto negativo entre sí si el consecuente es mayor que el antecedente con un lift menor que 1.

Fuente: Data Mining Map

Algoritmos de Reglas de Asociación

Tres algoritmos generan reglas de asociación. Estos se describen de la siguiente manera:

Algoritmo Apriori

Las reglas de asociación en el algoritmo apriori se generan a través de conjuntos de datos de transacciones frecuentes. Se utiliza a menudo para el análisis de la cesta de la compra de mercado, utilizando técnicas como la búsqueda en anchura y el árbol hash. Proporcionando información sobre los productos combinados comprados juntos, también sirve propósitos médicos al encontrar reacciones de medicamentos para los pacientes.

Algoritmo Eclat

También conocido como Transformación de Clase Equivalente, utiliza una técnica de búsqueda en profundidad. Proporciona una ejecución rápida y precisa, y también trata con bases de datos de transacciones. El algoritmo ECLAT utiliza menos almacenamiento y funciona sin escanear repetidamente los datos para calcular los valores de soporte individuales. En su lugar, utiliza conjuntos de identificación de transacciones o conjuntos Tidsets para fines de cálculo.

Algoritmo F-P Growth

Conocido como crecimiento de patrones frecuentes, es una versión mejorada del algoritmo Apriori. Se analiza en dos pasos. El primero es la conversión de la base de datos en una estructura de árbol, lo cual le da el nombre debido a la representación de patrones frecuentes. El segundo paso es el formato de representación, que facilita aún más la extracción de los patrones más frecuentes.

Fuente: ResearchGate

Conclusión

La minería de datos se refiere a la extracción de información de conjuntos de datos exhaustivos. La minería de reglas de asociación es el método para identificar las correlaciones, patrones, asociaciones o estructuras causales en los conjuntos de datos. Con un inmenso ámbito de aplicabilidad en el comercio minorista, la atención médica, la detección de fraudes, la investigación biológica y múltiples otros campos, la regla de asociación funciona a través de una declaración “if/then”. El soporte, la confianza y el lift desempeñan roles críticos en la evaluación de su efectividad. Además, el desarrollo de las reglas de asociación se produce a través de tres algoritmos. Por favor, preséntese a conceptos más importantes junto con el aprendizaje de reglas de asociación en minería de datos en detalle con nuestro curso de ciencia de datos.

Puntos clave

  • Las reglas de asociación encuentran un uso práctico en diversos campos, como la optimización de la ubicación de productos en el análisis de la cesta de la compra, la detección de actividades fraudulentas en la detección de fraudes y la mejora de la experiencia del usuario a través de sistemas de recomendación.
  • El soporte, la confianza y el lift son métricas cruciales para evaluar la efectividad de las reglas de asociación, proporcionando información sobre la frecuencia, la confiabilidad y la dependencia de las relaciones identificadas.
  • Explore tres algoritmos clave: Apriori, Eclat y F-P Growth, que impulsan la generación de reglas de asociación, cada uno ofreciendo ventajas únicas en términos de velocidad de ejecución, eficiencia de escaneo de datos y alcance de aplicación.

Preguntas frecuentes

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Diez años de revisión de la Inteligencia Artificial.

Desde la clasificación de imágenes hasta la terapia de chatbot.

Inteligencia Artificial

¿Qué tienen en común las neuronas, las luciérnagas y bailar el Nutbush?

Los científicos de la computación y los matemáticos han diseñado un marco para evaluar los fenómenos sincronizados.

Aprendizaje Automático

Red Cat y Athena AI crean drones militares inteligentes con visión nocturna.

Red Cat Holdings, Inc., una empresa líder en tecnología militar, ha logrado un hito en su colaboración con Athena AI....

Inteligencia Artificial

La FAA aprueba el sistema de aeronaves no tripuladas más grande de los Estados Unidos.

La Administración Federal de Aviación de los Estados Unidos aprobó la operación comercial de los rociadores agrícolas...

Inteligencia Artificial

Conoce a Ego-Exo4D Un conjunto de datos y una suite de referencia esenciales para apoyar la investigación sobre aprendizaje de video y percepción multimodal.

Hoy en día, la inteligencia artificial encuentra su aplicación en casi todos los campos imaginables. Definitivamente ...