Mejora tus fotos con IA desde la mejora de resolución HD hasta los filtros de dibujos animados

Mejora tus fotos con IA, resolución HD y filtros de dibujos animados

StyleGANEX explicado

Originalmente publicado en louisbouchard.ai, ¡léelo 2 días antes en mi blog!

Ver el video:

Hablemos sobre los modelos de IA que toman tu rostro y pueden transformarlo en un dibujo animado divertido, editar atributos faciales como cambiar el color del cabello o simplemente mejorar la calidad de la imagen para que sea más HD. Si has estado siguiendo los artículos en el blog, sabrás que la mayoría de estas aplicaciones se basan en un único modelo y sus múltiples versiones llamadas StyleGAN, que ya he cubierto numerosas veces. StyleGAN es una arquitectura basada en GAN desarrollada por NVIDIA que puede tomar una entrada y transformarla en otra siguiendo un estilo específico en el que fue entrenado. También es de código abierto, lo que significa que cualquiera puede usarlo y construir sobre él, y por eso todos los trabajos de investigación lo utilizan.

Ejemplo de resultados de StyleGANEX. Imagen del artículo.

El problema con StyleGAN es que está limitado a rostros recortados y alineados con una resolución de imagen fija según los datos en los que fue entrenado. Esto significa que para imágenes del mundo real, necesitas otros enfoques para encontrar el rostro, recortarlo y reorientarlo, y también debe tener la misma resolución de imagen. Este es un gran problema ya que generalmente quieres tener imágenes de alta calidad, pero entrenar con ellas llevaría mucho tiempo.

Entonces, lo que típicamente hacemos es utilizar la arquitectura de StyleGAN para hacer la transferencia de estilo de nuestra imagen, y luego utilizamos otra red para mejorar la resolución de la imagen. Si bien este enfoque funciona bien, definitivamente no es ideal. Necesitas dos modelos en lugar de uno, lo que agrega más sesgos y posibles errores, además de necesitar entrenar ambos y limitar las capacidades de generalización. Afortunadamente para nosotros, algunos investigadores increíbles están trabajando en este problema de imagen de entrada limitada y recientemente han publicado un nuevo enfoque en ICCV 2023 llamado StyleGANEX a través de algunos cambios pequeños pero muy ingeniosos. Además, el código, los modelos pre-entrenados y una demostración en línea están disponibles para que lo pruebes tú mismo. Todos los enlaces están en las referencias a continuación.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Estas herramientas podrían ayudar a proteger nuestras imágenes de la IA

Sin embargo, estas herramientas no son perfectas, ni suficientes por sí solas.

Inteligencia Artificial

Cómo la inteligencia artificial ayuda a combatir los incendios forestales en California

California tiene un nuevo arma contra los incendios forestales que han devastado el estado: la inteligencia artificia...

Inteligencia Artificial

Conoce a Skill-it un marco de habilidades impulsado por datos para comprender y entrenar modelos de lenguaje

Los modelos de lenguaje grandes (LM) son notablemente capaces de crear código fuente, crear obras de arte originales ...

Inteligencia Artificial

Optimizando los costos computacionales con AutoMix Un enfoque estratégico de IA para aprovechar modelos de lenguaje grandes desde la nube

AutoMix es un enfoque innovador que optimiza la asignación de consultas a modelos de lenguaje de mayor tamaño (LLM) e...

Inteligencia Artificial

De Oppenheimer a la IA generativa Valiosas lecciones para las empresas de hoy

El fin de semana pasado pasé 3 horas en el cine viendo el último éxito de taquilla - Oppenheimer. A pesar de que cono...