Transferencia de Aprendizaje para Principiantes

El aprendizaje transferido para principiantes

Una guía práctica para la transferencia de aprendizaje en la clasificación de imágenes

En este artículo, veremos el concepto de transferencia de aprendizaje y veremos un ejemplo en la tarea de clasificación de imágenes.

¿Qué es la transferencia de aprendizaje?

La transferencia de aprendizaje es una técnica en el aprendizaje profundo donde se utilizan modelos pre-entrenados en conjuntos de datos a gran escala para resolver nuevas tareas con datos etiquetados limitados.

Implica tomar un modelo pre-entrenado, que ha aprendido representaciones de características ricas y generalizadas de una tarea de origen, y afinarlo en una tarea objetivo.

Por ejemplo, ImageNet, que es un gran conjunto de datos (14 millones de imágenes de 1000 clases), se utiliza a menudo para entrenar redes neuronales convolucionales grandes como VGGNet o ResNet.

Si entrenamos estas redes en ImageNet, estos modelos aprenden a extraer características poderosas e informativas. Llamamos a este entrenamiento pre-entrenamiento y estos modelos están pre-entrenados en ImageNet. Ten en cuenta que están entrenados para la tarea de clasificación de imágenes en ImageNet. Lo llamamos tarea de origen.

Para realizar la transferencia de aprendizaje en una nueva tarea, que llamamos tarea objetivo, en primer lugar, necesitamos tener nuestro conjunto de datos etiquetado, que se llama conjunto de datos objetivo. El conjunto de datos objetivo suele ser mucho más pequeño que el conjunto de datos de origen. Nuestro conjunto de datos de origen era enorme (tenía 14 millones de imágenes).

A continuación, tomamos estos modelos pre-entrenados y eliminamos la capa de clasificación final, y agregamos una nueva capa clasificadora al final y los entrenamos con nuestro propio conjunto de datos objetivo. Durante el entrenamiento, congelamos todas las capas excepto la última capa, como resultado, se entrenan muy pocos parámetros y, por lo tanto, el entrenamiento es rápido. Y ¡voilà!, hemos realizado la transferencia de aprendizaje.

El segundo entrenamiento al que el modelo se somete se llama ajuste fino. Como vimos, durante el ajuste fino, la mayoría de los pesos pre-entrenados se mantienen congelados, y solo las capas finales se ajustan al nuevo conjunto de datos.

Imagen por el autor

Beneficios de la transferencia de aprendizaje

Las principales ventajas de la transferencia de aprendizaje son que te permite aprovechar la experiencia ya desarrollada en modelos pre-entrenados, evitando así entrenar grandes modelos desde cero. También mitiga la necesidad de modelos grandes…

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Revolucionando el Diseño de Proteínas Cómo esta investigación de IA aumentó las tasas de éxito diez veces con mejoras en el Aprendizaje Profundo

Las proteínas son estructuras poliméricas que controlan casi todas las enfermedades. El principal problema es encontr...

Noticias de Inteligencia Artificial

El mercado oculto de China para las poderosas tarjetas Nvidia de inteligencia artificial

En las bulliciosas calles del área de electrónica de Huaqiangbei en Shenzhen, ha surgido un mercado subterráneo de ch...

Inteligencia Artificial

Desbloqueando el poder del contexto con Google IA una competencia entre prefixLM y causalLM en el aprendizaje en contexto

La Guerra de Troya es famosa, donde Aquiles grabó su nombre en la historia para siempre al derrotar al príncipe Hécto...

Inteligencia Artificial

Como se utilizan los modelos de fundación en los videojuegos?

Las tecnologías de inteligencia artificial están teniendo un impacto masivo en diversas industrias, incluyendo los me...

Inteligencia Artificial

Google AI presenta MedLM una familia de modelos base afinados para casos de uso en la industria de la salud

Investigadores de Google han introducido una base de modelos ajustados para la industria de la salud, MedLM, que actu...

Inteligencia Artificial

Samsung presenta 'Gauss' un nuevo modelo de lenguaje de IA para desafiar el reinado de ChatGPT.

Samsung ha presentado un nuevo modelo de lenguaje basado en inteligencia artificial (IA) llamado Gauss, que se presen...