SalesForce AI Research BannerGen Una biblioteca de código abierto para la generación de banners de múltiples modalidades.

SalesForce AI Research BannerGen Una biblioteca de código abierto para generar banners de diferentes modalidades.

El diseño gráfico efectivo es el pilar de una campaña de marketing exitosa. Actúa como un puente de comunicación entre los diseñadores y su audiencia al cautivar a los usuarios, resaltar detalles esenciales y mejorar la apariencia visual de la campaña. Sin embargo, las metodologías actuales son tanto lentas como implican un trabajo de ensamblaje capa por capa, lo cual requiere experiencia y no es fácilmente escalable.

Para abordar el problema mencionado anteriormente, los investigadores de Salesforce han presentado una biblioteca de código abierto, BannerGen, que agiliza el proceso de diseño utilizando el poder de la IA generativa. La biblioteca consta de tres métodos de generación de banners multimodales paralelos: LayoutDETR, LayoutInstructPix2Pix y Framed Template RetrieveAdapter. Cada uno ha sido entrenado en un gran corpus de datos gráficos diseñados, lo cual les permite acelerar el proceso de diseño. Además, todos ellos han sido publicados en el repositorio GitHub de BannerGen y se pueden importar como módulos de Python, lo que facilita a los desarrolladores experimentar con cada método. BannerGen también cuenta con fuentes con licencia y plantillas cuidadosamente diseñadas, lo que permite a los desarrolladores crear diseños de alta calidad.

El usuario puede subir una imagen de la que desea crear un banner. La imagen luego pasa por un proceso de recorte que se enfoca en los elementos principales para crear múltiples subimágenes. Los usuarios también pueden especificar el tipo de banner que desean y el texto que desean incluir. Las subimágenes se integran luego en la plantilla seleccionada para crear una visual impresionante. El diseño final se produce como un archivo HTML y PNG.

Los investigadores han integrado el marco de trabajo VAEGAN en su enfoque para alinear los diseños generados con los patrones del mundo real. La arquitectura DETR también se ha incorporado en BannerGen y se denomina LayoutDETR. Los investigadores han modificado el decodificador DETR para manejar entradas de primer plano multimodales. Esta arquitectura permite a BannerGen comprender mejor los elementos de fondo y primer plano, lo que conduce a mejores resultados.

BannerGen también ha incorporado InstructPix2Pix, una técnica de edición de imágenes impulsada por modelos de difusión. Lo mismo se ha ajustado para convertir imágenes de fondo en imágenes con texto superpuesto.

El tercer método, Framed Template RetrieveAdapter, se utiliza para mejorar la diversidad de los diseños generados y consta de tres componentes: el recuperador, que encuentra el marco más adecuado según las métricas; el adaptador, que personaliza las imágenes y textos de entrada para que encajen en el marco, y el renderizador que produce el diseño en HTML/CSS integrando la capa de fondo con las entradas del usuario.

En conclusión, BannerGen es un marco potente y versátil que permite a los usuarios crear de manera fluida banners personalizados aprovechando la IA generativa. La arquitectura de BannerGen ha sido diseñada para aprender de diseños reales y comprender los elementos de fondo y primer plano. El diseño final se genera como un archivo HTML y PNG, lo que permite realizar ajustes manuales fáciles y se puede incrustar en cualquier medio para su uso inmediato. BannerGen tiene como objetivo hacer que el proceso de diseño gráfico sea menos demorado y ayudar a los usuarios a generar diseños de alta calidad y profesionales.

La publicación SalesForce AI Research BannerGen: An Open-Source Library for Multi-Modality Banner Generation apareció primero en MarkTechPost.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Varias filtraciones de datos en 23andMe

Datos genéticos robados llevan a una demanda colectiva contra la empresa de pruebas.

Inteligencia Artificial

Científicos recrean canción de Pink Floyd leyendo las señales cerebrales de los oyentes

El audio suena como si se estuviera reproduciendo bajo el agua. Aún así, es un primer paso hacia la creación de dispo...

Inteligencia Artificial

Analizar la infestación de roedores utilizando las capacidades geoespaciales de Amazon SageMaker

Los roedores como las ratas y los ratones están asociados con varios riesgos para la salud y se sabe que transmiten m...

Inteligencia Artificial

Conoce a Falcon 180B El modelo de lenguaje más grande disponible públicamente con 180 mil millones de parámetros

La demanda de modelos de lenguaje potentes y versátiles se ha vuelto más apremiante en el procesamiento del lenguaje ...

Aprendizaje Automático

¿Qué son los Modelos de Lenguaje Grandes (LLMs)? Aplicaciones y Tipos de LLMs

Los programas informáticos llamados modelos de lenguaje grandes proporcionan opciones novedosas para analizar y crear...