Mejora tus fotos con IA desde la mejora de resolución HD hasta los filtros de dibujos animados

Mejora tus fotos con IA, resolución HD y filtros de dibujos animados

StyleGANEX explicado

Originalmente publicado en louisbouchard.ai, ¡léelo 2 días antes en mi blog!

Ver el video:

Hablemos sobre los modelos de IA que toman tu rostro y pueden transformarlo en un dibujo animado divertido, editar atributos faciales como cambiar el color del cabello o simplemente mejorar la calidad de la imagen para que sea más HD. Si has estado siguiendo los artículos en el blog, sabrás que la mayoría de estas aplicaciones se basan en un único modelo y sus múltiples versiones llamadas StyleGAN, que ya he cubierto numerosas veces. StyleGAN es una arquitectura basada en GAN desarrollada por NVIDIA que puede tomar una entrada y transformarla en otra siguiendo un estilo específico en el que fue entrenado. También es de código abierto, lo que significa que cualquiera puede usarlo y construir sobre él, y por eso todos los trabajos de investigación lo utilizan.

Ejemplo de resultados de StyleGANEX. Imagen del artículo.

El problema con StyleGAN es que está limitado a rostros recortados y alineados con una resolución de imagen fija según los datos en los que fue entrenado. Esto significa que para imágenes del mundo real, necesitas otros enfoques para encontrar el rostro, recortarlo y reorientarlo, y también debe tener la misma resolución de imagen. Este es un gran problema ya que generalmente quieres tener imágenes de alta calidad, pero entrenar con ellas llevaría mucho tiempo.

Entonces, lo que típicamente hacemos es utilizar la arquitectura de StyleGAN para hacer la transferencia de estilo de nuestra imagen, y luego utilizamos otra red para mejorar la resolución de la imagen. Si bien este enfoque funciona bien, definitivamente no es ideal. Necesitas dos modelos en lugar de uno, lo que agrega más sesgos y posibles errores, además de necesitar entrenar ambos y limitar las capacidades de generalización. Afortunadamente para nosotros, algunos investigadores increíbles están trabajando en este problema de imagen de entrada limitada y recientemente han publicado un nuevo enfoque en ICCV 2023 llamado StyleGANEX a través de algunos cambios pequeños pero muy ingeniosos. Además, el código, los modelos pre-entrenados y una demostración en línea están disponibles para que lo pruebes tú mismo. Todos los enlaces están en las referencias a continuación.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Was this article helpful?

93 out of 132 found this helpful

Mejora tus fotos con IA desde la mejora de resolución HD hasta los filtros de dibujos animados

StyleGANEX explicado

Ver el video:

Was this article helpful?

De cero a avanzado en la ingeniería de comandos con Langchain en Python

Optimizar la preparación de datos con nuevas funciones en AWS SageMaker Data Wrangler

Inteligencia Artificial

Estas herramientas podrían ayudar a proteger nuestras imágenes de la IA

Cómo la inteligencia artificial ayuda a combatir los incendios forestales en California

Conoce a Skill-it un marco de habilidades impulsado por datos para comprender y entrenar modelos de lenguaje

Investigadores de Google y UIUC proponen ZipLoRA un novedoso método de inteligencia artificial para fusionar de manera fluida LoRAs de estilo y de tema entrenadas de forma independiente'.

Optimizando los costos computacionales con AutoMix Un enfoque estratégico de IA para aprovechar modelos de lenguaje grandes desde la nube

De Oppenheimer a la IA generativa Valiosas lecciones para las empresas de hoy