RepVGG Una explicación detallada para la reparametrización estructural

RepVGG Una explicación detallada sobre la reparametrización estructural

Desmitificando RepVGG: Revelando los Secretos de la Re-parametrización Estructural

— ¿Por qué estoy escribiendo este artículo sobre RepVGG cuando ya hay varios recursos excelentes disponibles?

— La respuesta radica en la perspectiva única que pretendo proporcionar.

— Mientras que otros artículos pueden tocar conceptos similares o mostrar la velocidad de inferencia del código, mi enfoque se centra en brindar una comprensión completa de la parametrización estructural a nivel conceptual.

Profundizaré en los detalles intrincados de cómo estas convoluciones de 1×1 se parametrizan aún más en convoluciones de 3×3 y cómo el atajo de identidad se transforma en una convolución de 1×1. Este artículo tiene como objetivo proporcionar una ilustración exhaustiva que cubra el vacío en las explicaciones existentes. En nuestra modificación de la arquitectura original de VGG, introdujimos ramas residuales y ramas convolucionales de 1×1. Estas adiciones se hicieron con la intención de permitir una re-parametrización estructural posterior en un único camino. Para facilitar esta transformación, ajustamos cuidadosamente la ubicación de estas ramas sin introducir conexiones entre capas. En términos generales, el modelo RepVGG utilizado en el entrenamiento consta de tres caminos: convoluciones convencionales (conv_3x3), convoluciones de 1×1 (conv_1x1) y un camino de identidad. Cada uno de estos caminos está acompañado de capas de normalización por lotes (BN). En las siguientes secciones, proporcionaremos una explicación detallada de cómo se fusionan estos tres caminos en una unidad de convolución unificada conv_3x3 durante la inferencia.

Fuente: https://arxiv.org/pdf/2101.03697.pdf

Fusionando conv_1x1 y conv_3x3

Primero revisemos el proceso conv_3x3:

Solo para explicar en detalle, supongamos que el tamaño del mapa de características de entrada es (1, 2, 3, 3), lo que significa que el tamaño del lote es 1, el canal es 2 y la dimensión de la característica es 3 por 3. El tamaño del mapa de características de salida es igual al tamaño del mapa de características de entrada y la longitud del paso es…

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Was this article helpful?

93 out of 132 found this helpful

RepVGG Una explicación detallada para la reparametrización estructural

Desmitificando RepVGG: Revelando los Secretos de la Re-parametrización Estructural

Fusionando conv_1x1 y conv_3x3

Was this article helpful?

Las Difusores de Hugging Face ahora pueden cargar correctamente LoRA

LLMs en IA Conversacional Construyendo Chatbots y Asistentes más Inteligentes

Inteligencia Artificial

Conoce a PUG una nueva investigación de IA de Meta AI sobre conjuntos de datos fotorrealistas y semánticamente controlables utilizando Unreal Engine para una evaluación de modelos robusta

El Gobierno de Canadá llega a un acuerdo con Google sobre la Ley de Noticias en línea.

¿Qué es la Hiperpersonalización de IA? Ventajas, Estudios de Caso y Preocupaciones Éticas

Investigadores de China proponen iTransformer Repensando la arquitectura Transformer para una mejora en la previsión de series temporales

AI Modelos de Lenguaje y Visión de Gran Escala

Este artículo de IA presenta LLaVA-Plus un asistente multimodal de propósito general que amplía las capacidades de los modelos multimodales grandes