Ensamble Apilado para Modelado Predictivo Avanzado con H2O.ai y Optuna

Ensamble Apilado para Modelado Predictivo Avanzado con H2O.ai y Optuna La combinación perfecta

¡Y cómo me clasifiqué en el top 10% en la competencia de aprendizaje automático más grande de Europa con ellos!

Imagen generada por DALL·E 3, representando un paisaje apilado

Todos sabemos que los modelos de conjunto superan a cualquier modelo individual en el modelado predictivo. Probablemente hayas escuchado sobre Bagging y Boosting como métodos de conjunto comunes, con Bosques Aleatorios (Random Forests) y Máquinas de Reforzamiento de Gradiente (Gradient Boosting Machines) como ejemplos respectivos.

Pero ¿qué pasa si combinamos diferentes modelos bajo un modelo separado de nivel superior? Aquí es donde entran los conjuntos apilados. Este artículo es una guía paso a paso sobre cómo entrenar conjuntos apilados utilizando la popular biblioteca de aprendizaje automático, H2O.

Para demostrar el poder de los conjuntos apilados, proporcionaré un recorrido por todo mi código para entrenar un conjunto apilado de 40 modelos de Redes Neuronales Profundas, XGBoost y LightGBM para la tarea de predicción planteada en la Competencia de Codificación Cloudflight 2023 (Categoría de IA), una de las competencias de codificación más grandes de Europa, ¡donde me clasifiqué en el top 10% en el tablero de clasificación de la competencia en un tiempo de entrenamiento de 1 hora!

Esta guía cubrirá:

  1. ¿Qué son los conjuntos apilados y cómo funcionan?
  2. Cómo entrenar conjuntos apilados con H2O.ai
  3. Comparar el rendimiento de un conjunto apilado versus modelos independientes

1. ¿Qué son los Conjuntos Apilados?

Un conjunto apilado combina predicciones de múltiples modelos a través de otro modelo de nivel superior, con el objetivo de aumentar el rendimiento predictivo general al aprovechar las fortalezas únicas de cada modelo constituyente. Involucra 2 etapas:

Etapa 1: Múltiples Modelos Base

Primero, se entrenan múltiples modelos base de forma independiente en el mismo conjunto de datos de entrenamiento. Estos modelos idealmente deben ser diversos, desde simples regresiones lineales hasta modelos de aprendizaje profundo complejos. La clave es que deben diferir entre sí de alguna manera, ya sea en términos de algoritmo o configuraciones de hiperparámetros.

Cuanto más diversos sean los modelos base, más poderoso será el conjunto apilado resultante. Esto se debe a que los diferentes modelos son capaces de capturar diferentes patrones en los…

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Los autos sin conductor pueden tener dificultades para detectar a los niños y a las personas de piel oscura.

Los científicos evaluaron ocho detectores de peatones basados en inteligencia artificial utilizados en la investigaci...

Inteligencia Artificial

Comprendiendo el concepto de GPT-4V(ision) La nueva tendencia de la inteligencia artificial

OpenAI ha estado a la vanguardia de los últimos avances en IA, con modelos altamente competentes como GPT y DALLE. Cu...

Inteligencia Artificial

Conoce Objaverse-XL Un conjunto de datos abierto de más de 10 millones de objetos en 3D.

Un avance reciente en IA ha sido la importancia de la escala para impulsar los avances en varios dominios. Los modelo...

Inteligencia Artificial

Desbloqueando el poder del contexto con Google IA una competencia entre prefixLM y causalLM en el aprendizaje en contexto

La Guerra de Troya es famosa, donde Aquiles grabó su nombre en la historia para siempre al derrotar al príncipe Hécto...

Inteligencia Artificial

Adopción empresarial de la IA generativa

Hola, soy Michael y he estado inmerso en la adopción de IA empresarial desde 2018 cuando comenzamos una conferencia s...