SalesForce AI Research BannerGen Una biblioteca de código abierto para la generación de banners de múltiples modalidades.
SalesForce AI Research BannerGen Una biblioteca de código abierto para generar banners de diferentes modalidades.
El diseño gráfico efectivo es el pilar de una campaña de marketing exitosa. Actúa como un puente de comunicación entre los diseñadores y su audiencia al cautivar a los usuarios, resaltar detalles esenciales y mejorar la apariencia visual de la campaña. Sin embargo, las metodologías actuales son tanto lentas como implican un trabajo de ensamblaje capa por capa, lo cual requiere experiencia y no es fácilmente escalable.
Para abordar el problema mencionado anteriormente, los investigadores de Salesforce han presentado una biblioteca de código abierto, BannerGen, que agiliza el proceso de diseño utilizando el poder de la IA generativa. La biblioteca consta de tres métodos de generación de banners multimodales paralelos: LayoutDETR, LayoutInstructPix2Pix y Framed Template RetrieveAdapter. Cada uno ha sido entrenado en un gran corpus de datos gráficos diseñados, lo cual les permite acelerar el proceso de diseño. Además, todos ellos han sido publicados en el repositorio GitHub de BannerGen y se pueden importar como módulos de Python, lo que facilita a los desarrolladores experimentar con cada método. BannerGen también cuenta con fuentes con licencia y plantillas cuidadosamente diseñadas, lo que permite a los desarrolladores crear diseños de alta calidad.
El usuario puede subir una imagen de la que desea crear un banner. La imagen luego pasa por un proceso de recorte que se enfoca en los elementos principales para crear múltiples subimágenes. Los usuarios también pueden especificar el tipo de banner que desean y el texto que desean incluir. Las subimágenes se integran luego en la plantilla seleccionada para crear una visual impresionante. El diseño final se produce como un archivo HTML y PNG.
- ¡El Estudio de IA de Google Tu puerta de entrada al universo creativo de Gemini!
- Lo mejor de TDS en 2023 sobre ChatGPT y LLMs
- Los documentos LLM más importantes de la semana del 04/12 al 10/12
Los investigadores han integrado el marco de trabajo VAEGAN en su enfoque para alinear los diseños generados con los patrones del mundo real. La arquitectura DETR también se ha incorporado en BannerGen y se denomina LayoutDETR. Los investigadores han modificado el decodificador DETR para manejar entradas de primer plano multimodales. Esta arquitectura permite a BannerGen comprender mejor los elementos de fondo y primer plano, lo que conduce a mejores resultados.
BannerGen también ha incorporado InstructPix2Pix, una técnica de edición de imágenes impulsada por modelos de difusión. Lo mismo se ha ajustado para convertir imágenes de fondo en imágenes con texto superpuesto.
El tercer método, Framed Template RetrieveAdapter, se utiliza para mejorar la diversidad de los diseños generados y consta de tres componentes: el recuperador, que encuentra el marco más adecuado según las métricas; el adaptador, que personaliza las imágenes y textos de entrada para que encajen en el marco, y el renderizador que produce el diseño en HTML/CSS integrando la capa de fondo con las entradas del usuario.
En conclusión, BannerGen es un marco potente y versátil que permite a los usuarios crear de manera fluida banners personalizados aprovechando la IA generativa. La arquitectura de BannerGen ha sido diseñada para aprender de diseños reales y comprender los elementos de fondo y primer plano. El diseño final se genera como un archivo HTML y PNG, lo que permite realizar ajustes manuales fáciles y se puede incrustar en cualquier medio para su uso inmediato. BannerGen tiene como objetivo hacer que el proceso de diseño gráfico sea menos demorado y ayudar a los usuarios a generar diseños de alta calidad y profesionales.
La publicación SalesForce AI Research BannerGen: An Open-Source Library for Multi-Modality Banner Generation apareció primero en MarkTechPost.
We will continue to update Zepes; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- Aprende IA juntos – Boletín de la comunidad Towards AI #5
- IA en roles íntimos novias y terapeutas
- Nuevo estudio revela vulnerabilidades ocultas en la inteligencia artificial
- Una guía completa sobre la convolución atroz en las redes neuronales convolucionales
- Aprendizaje adaptativo a través de la difusión Un paradigma de vanguardia
- Indian Startup lanza OpenHathi el primer LLM en hindi de la historia
- Este documento de IA presenta técnicas avanzadas para explicaciones detalladas de texto y visual en modelos de alineación de imágenes y texto.