CatBoost Regresión Explícamelo detalladamente

CatBoost Regresión Explícamelo detalladamente' can be condensed to 'Explícame CatBoost Regresión en detalle'.

Una desglose completa (e ilustrada) de las entrañas de CatBoost

CatBoost, abreviatura de Categorical Boosting, es un poderoso algoritmo de aprendizaje automático que se destaca en el manejo de características categóricas y en la producción de predicciones precisas. Tradicionalmente, lidiar con datos categóricos es bastante complicado, requiriendo codificación one-hot, codificación de etiquetas o alguna otra técnica de preprocesamiento que puede distorsionar la estructura inherente de los datos. Para abordar este problema, CatBoost utiliza su propio sistema de codificación incorporado llamado Codificación Objetivo Ordenada.

Vamos a ver cómo trabaja CatBoost en la práctica construyendo un modelo para predecir cómo alguien podría calificar el libro “Murder, She Texted” en función de su calificación promedio de libros en Goodreads y su género favorito.

Pedimos a 6 personas que calificaran el libro “Murder, She Texted” y recopilamos otra información relevante sobre ellas.

Este es nuestro conjunto de entrenamiento actual, que utilizaremos para entrenar (obvio) los datos.

Paso 1: Mezclar el conjunto de datos y Codificar los Datos Categóricos Usando Codificación Objetivo Ordenada

La forma en que preprocesamos los datos categóricos es fundamental para el algoritmo CatBoost. En este caso, solo tenemos una columna categórica: Género Favorito. Esta columna se codifica (es decir, se convierte en un entero discreto) y la forma en que se hace varía según si es un problema de Regresión o Clasificación. Dado que estamos tratando con un problema de Regresión (porque la variable que queremos predecir, Murder, She Texted Rating, es continua), seguimos los siguientes pasos.

1 – Mezclar el conjunto de datos:

2 – Colocar la variable objetivo continua en intervalos discretos: Dado que tenemos muy pocos datos aquí, crearemos 2 intervalos del mismo tamaño para categorizar la variable objetivo. (Aprende más sobre cómo crear intervalos aquí).

Colocamos los 3 valores más pequeños de Murder, She Texted Rating en el intervalo 0 y el resto en el intervalo 1.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

AR y AI El papel de la IA en la Realidad Aumentada

Introducción Las industrias numéricas están siendo transformadas por las tecnologías revolucionarias de la inteligenc...

Inteligencia Artificial

Explora el poder de las imágenes dinámicas con Text2Cinemagraph una nueva herramienta de IA para la generación de cinemagraphs a partir de indicaciones de texto

Si eres nuevo en la terminología, quizás te estés preguntando qué son los cinemagraphs, pero puedo asegurarte que pro...

Inteligencia Artificial

Los mejores cursos de IA de universidades con listas de reproducción de YouTube

¡Inicia una nueva carrera o desarrolla la actual con estas listas de reproducción de YouTube de universidades confiab...

Inteligencia Artificial

Este artículo de IA hace público HyperDreamer un avance en la creación de contenido 3D con texturizado avanzado, modelado de 360 grados y edición interactiva

No es fácil generar modelos en 3D detallados y realistas a partir de una sola imagen RGB. Investigadores del Laborato...

Inteligencia Artificial

Línea Open-Sources ‘japanese-large-lm’ Un modelo de lenguaje japonés con 3.6 mil millones de parámetros

Desde noviembre de 2020, LINE se ha embarcado en un viaje transformador de investigación y desarrollo para crear y ap...