CatBoost Regresión Explícamelo detalladamente

CatBoost Regresión Explícamelo detalladamente' can be condensed to 'Explícame CatBoost Regresión en detalle'.

Una desglose completa (e ilustrada) de las entrañas de CatBoost

CatBoost, abreviatura de Categorical Boosting, es un poderoso algoritmo de aprendizaje automático que se destaca en el manejo de características categóricas y en la producción de predicciones precisas. Tradicionalmente, lidiar con datos categóricos es bastante complicado, requiriendo codificación one-hot, codificación de etiquetas o alguna otra técnica de preprocesamiento que puede distorsionar la estructura inherente de los datos. Para abordar este problema, CatBoost utiliza su propio sistema de codificación incorporado llamado Codificación Objetivo Ordenada.

Vamos a ver cómo trabaja CatBoost en la práctica construyendo un modelo para predecir cómo alguien podría calificar el libro “Murder, She Texted” en función de su calificación promedio de libros en Goodreads y su género favorito.

Pedimos a 6 personas que calificaran el libro “Murder, She Texted” y recopilamos otra información relevante sobre ellas.

Este es nuestro conjunto de entrenamiento actual, que utilizaremos para entrenar (obvio) los datos.

Paso 1: Mezclar el conjunto de datos y Codificar los Datos Categóricos Usando Codificación Objetivo Ordenada

La forma en que preprocesamos los datos categóricos es fundamental para el algoritmo CatBoost. En este caso, solo tenemos una columna categórica: Género Favorito. Esta columna se codifica (es decir, se convierte en un entero discreto) y la forma en que se hace varía según si es un problema de Regresión o Clasificación. Dado que estamos tratando con un problema de Regresión (porque la variable que queremos predecir, Murder, She Texted Rating, es continua), seguimos los siguientes pasos.

1 – Mezclar el conjunto de datos:

2 – Colocar la variable objetivo continua en intervalos discretos: Dado que tenemos muy pocos datos aquí, crearemos 2 intervalos del mismo tamaño para categorizar la variable objetivo. (Aprende más sobre cómo crear intervalos aquí).

Colocamos los 3 valores más pequeños de Murder, She Texted Rating en el intervalo 0 y el resto en el intervalo 1.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Was this article helpful?

93 out of 132 found this helpful

CatBoost Regresión Explícamelo detalladamente

Una desglose completa (e ilustrada) de las entrañas de CatBoost

Paso 1: Mezclar el conjunto de datos y Codificar los Datos Categóricos Usando Codificación Objetivo Ordenada

Was this article helpful?

¿La implementación del Momentum de Nesterov en PyTorch está equivocada?

Introducción a Semantic Kernel para los entusiastas de Python

Inteligencia Artificial

AR y AI El papel de la IA en la Realidad Aumentada

Explora el poder de las imágenes dinámicas con Text2Cinemagraph una nueva herramienta de IA para la generación de cinemagraphs a partir de indicaciones de texto

Los mejores cursos de IA de universidades con listas de reproducción de YouTube

Investigadores de NYU desarrollaron una nueva técnica de inteligencia artificial para cambiar la edad aparente de una persona en imágenes mientras se mantienen sus características únicas de identificación.

Este artículo de IA hace público HyperDreamer un avance en la creación de contenido 3D con texturizado avanzado, modelado de 360 grados y edición interactiva

Línea Open-Sources ‘japanese-large-lm’ Un modelo de lenguaje japonés con 3.6 mil millones de parámetros