Redes convolucionales explicadas de manera intuitiva y exhaustiva

Explicación intuitiva y exhaustiva de las redes convolucionales

Desempaquetando una estrategia de modelado fundamental

“Convolved” por el autor usando MidJourney. Todas las imágenes son del autor, a menos que se especifique lo contrario.

Las redes neuronales convolucionales son un pilar en visión por computadora, procesamiento de señales y una gran cantidad de otras tareas de aprendizaje automático. Son bastante sencillas y, como resultado, muchas personas las dan por sentado sin realmente entenderlas. En este artículo repasaremos la teoría de las redes convolucionales, de manera intuitiva y exhaustiva, y exploraremos su aplicación en unos cuantos casos de uso.

¿A quién le resulta útil esto? A cualquier persona interesada en visión por computadora, análisis de señales o aprendizaje automático.

¿Qué nivel de conocimiento se requiere para entender esta publicación? Este es un concepto muy poderoso pero muy simple, ideal para principiantes. También puede servir como un buen repaso para científicos de datos experimentados, especialmente al considerar convoluciones en varias dimensiones.

Pre-requisitos: Tener una familiaridad general con la retropropagación y las redes neuronales densas podría ser útil, pero no es necesario. Cubro ambos temas en esta publicación:

¿Qué son los gradientes y por qué explotan?

Al leer esta publicación, obtendrás un conocimiento sólido del concepto más importante en el aprendizaje profundo

towardsdatascience.com

La razón por la que existen las redes convolucionales

El primer tema que exploran muchos científicos de datos novatos es una red neuronal densa. Esta es la clásica red neuronal que consta de nodos y bordes que tienen ciertos parámetros aprendibles. Estos parámetros permiten que el modelo aprenda relaciones sutiles sobre los temas en los que se entrena.

Un diagrama conceptual de una red densa que toma algunas entradas y predice una salida. Aprende los parámetros necesarios para realizar bien la tarea aprendiendo incrementalmente a partir de ejemplos conocidos (es decir, el éxito y el fracaso de los equipos anteriores del Super Bowl).

A medida que crece el número de neuronas dentro de la red, las conexiones entre capas se vuelven cada vez más abundantes. Esto puede permitir un razonamiento complejo, lo cual es genial, pero la “densidad” de las redes densas presenta un problema cuando se trabajan con imágenes.

Siguiendo el ejemplo de querer entrenar una red neuronal densa para predecir si una imagen contiene un perro o no. Podríamos crear una red densa que examine cada píxel de la imagen…

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Conoce Universal Simulator (UniSim) Un simulador interactivo de la interacción del mundo real a través del modelado generativo

Los modelos generativos han transformado la creación de contenido en texto, imágenes y videos. La próxima frontera es...

Inteligencia Artificial

Un 'mapa' más preciso de las luces que ves cuando cierras los ojos puede mejorar los resultados de los 'ojos biónicos'.

Un método de mapeo de fosfenos desarrollado por investigadores de la Universidad de Monash en Australia podría ayudar...

Inteligencia Artificial

La IA está haciendo que la política sea más fácil, más barata y más peligrosa

Los votantes ya están viendo materiales de campaña generados por IA, y probablemente no lo saben.

Inteligencia Artificial

EE.UU. acuerda sobre reglas históricas de Inteligencia Artificial

El acuerdo sobre la Ley de Inteligencia Artificial solidifica uno de los primeros intentos en el mundo de limitar el ...

Inteligencia Artificial

Las Pruebas Asistidas por Computadora Abordan el Flujo de Fluidos

Los investigadores utilizan computadoras para demostrar que las ecuaciones pueden explotar.

Ciencia de Datos

Conoce AnythingLLM Una Aplicación Full-Stack Que Transforma Tu Contenido en Datos Enriquecidos para Mejorar las Interacciones con Modelos de Lenguaje Amplio (LLMs)

Desde el lanzamiento del revolucionario ChatGPT de OpenAI, el número de proyectos relacionados con la IA, especialmen...