Mejora tus fotos con IA desde la mejora de resolución HD hasta los filtros de dibujos animados
Mejora tus fotos con IA, resolución HD y filtros de dibujos animados
StyleGANEX explicado
Originalmente publicado en louisbouchard.ai, ¡léelo 2 días antes en mi blog!
Ver el video:
Hablemos sobre los modelos de IA que toman tu rostro y pueden transformarlo en un dibujo animado divertido, editar atributos faciales como cambiar el color del cabello o simplemente mejorar la calidad de la imagen para que sea más HD. Si has estado siguiendo los artículos en el blog, sabrás que la mayoría de estas aplicaciones se basan en un único modelo y sus múltiples versiones llamadas StyleGAN, que ya he cubierto numerosas veces. StyleGAN es una arquitectura basada en GAN desarrollada por NVIDIA que puede tomar una entrada y transformarla en otra siguiendo un estilo específico en el que fue entrenado. También es de código abierto, lo que significa que cualquiera puede usarlo y construir sobre él, y por eso todos los trabajos de investigación lo utilizan.
![Ejemplo de resultados de StyleGANEX. Imagen del artículo.](https://miro.medium.com/v2/resize:fit:640/format:webp/1*GfEKY-OGYzM8CmtcuSNAkQ.png)
El problema con StyleGAN es que está limitado a rostros recortados y alineados con una resolución de imagen fija según los datos en los que fue entrenado. Esto significa que para imágenes del mundo real, necesitas otros enfoques para encontrar el rostro, recortarlo y reorientarlo, y también debe tener la misma resolución de imagen. Este es un gran problema ya que generalmente quieres tener imágenes de alta calidad, pero entrenar con ellas llevaría mucho tiempo.
Entonces, lo que típicamente hacemos es utilizar la arquitectura de StyleGAN para hacer la transferencia de estilo de nuestra imagen, y luego utilizamos otra red para mejorar la resolución de la imagen. Si bien este enfoque funciona bien, definitivamente no es ideal. Necesitas dos modelos en lugar de uno, lo que agrega más sesgos y posibles errores, además de necesitar entrenar ambos y limitar las capacidades de generalización. Afortunadamente para nosotros, algunos investigadores increíbles están trabajando en este problema de imagen de entrada limitada y recientemente han publicado un nuevo enfoque en ICCV 2023 llamado StyleGANEX a través de algunos cambios pequeños pero muy ingeniosos. Además, el código, los modelos pre-entrenados y una demostración en línea están disponibles para que lo pruebes tú mismo. Todos los enlaces están en las referencias a continuación.
- De cero a avanzado en la ingeniería de comandos con Langchain en Python
- Conoce MovieChat un innovador sistema de comprensión de video que integra modelos fundamentales de video y grandes modelos de lenguaje.
- IA Generativa en la Salud
We will continue to update Zepes; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- V-Net, el hermano mayor de U-Net en la segmentación de imágenes
- Una Introducción Suave al Aprendizaje Profundo Bayesiano
- Olvida ChatGPT, este nuevo asistente de IA está a años luz y cambiará la forma en que trabajas para siempre
- Revisión de Synthesys ¿El mejor generador de videos de IA? (agosto de 2023)
- Despacho basado en datos
- Lectura de playa una breve historia de los modelos pre-entrenados
- La evolución de OpenAI Una carrera hacia GPT5