OpenAI presenta DALL-E 3 y los usuarios pueden generar imágenes en ChatGPT

OpenAI presenta DALL-E 3 los usuarios ahora pueden generar imágenes en ChatGPT

OpenAI ha revelado su última versión de DALL-E, llamada DALL-E-3, como parte de una vista previa de investigación esta semana. Según una publicación en el blog de la startup de IA, DALL-E 3 “comprende significativamente más matices y detalles que nuestros sistemas anteriores”.

Para los clientes de empresas y ChatGPT Plus, DALL-E 3 estará disponible el próximo mes a través de la API y Labs. Para deleite de los usuarios, DALL-E 3 está construido nativamente en ChatGPT. Esto permitirá a los usuarios de ChatGPT generar instrucciones personalizadas y detalladas para DALL-E 3. Esto podría desbloquear aún más características creativas y empujar aún más los límites del arte de IA generativa.

Por supuesto, si la instrucción proporcionada por ChatGPT no cumple con los requisitos, siempre se puede pedir al chatbot que realice cambios y ajustes en función de lo que le gustaría ver. Lo interesante es que, según OpenAI, incluso las instrucciones idénticas ofrecen mejores resultados entre DALL-E 2 y DALL-E 3.

Además, debido a la responsabilidad potencial y su compromiso con el uso responsable de la IA, OpenAI ha tomado medidas para limitar la capacidad de DALL-E para generar contenido violento, adulto u odioso. Por ejemplo, DALL-E 3 está diseñado para rechazar solicitudes que piden una imagen en el estilo de un artista vivo.

Esto probablemente sea resultado de la creciente resistencia de la comunidad artística al uso de obras creadas por humanos para entrenar modelos de IA. En otro orden de ideas, los creadores también pueden optar por excluir sus imágenes del entrenamiento de los futuros modelos de generación de imágenes de OpenAI.

¿Por qué esto es importante? Como señala OpenAI, los sistemas modernos de texto a imagen tienden a ignorar palabras o descripciones, lo que obliga a los usuarios a aprender ingeniería de instrucciones. Por lo tanto, parece que OpenAI está intentando reducir la brecha de habilidades entre usuarios ocasionales y usuarios expertos.

Pero, ¿qué significa esto? Bueno, en resumen, DALL-E 3 debería tener la capacidad de generar imágenes que se adhieran exactamente al texto que proporcione. Si se demuestra que esto es cierto, sería un gran avance en el arte de la IA. Esta sería una característica que competidores como Midjourney y Stable Diffusion probablemente querrán replicar de alguna manera.

Esto no es todo para DALL-E 3. Como era de esperar debido a la importante inversión de Microsoft en OpenAI, obtendrán una buena parte. Y la forma en que lo obtendrán será mediante la disponibilidad de DALL-E 3 en Bing chat.

Este anuncio es otro vínculo directo entre la inversión de Microsoft en OpenAI. El gigante tecnológico continuará ofreciendo herramientas y características de IA generativa en su software. Como se mencionó anteriormente, DALL-E 3 ahora se encuentra en una vista previa de investigación y estará disponible para los clientes de ChatGPT Plus y Enterprise en octubre.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Was this article helpful?

93 out of 132 found this helpful

OpenAI presenta DALL-E 3 y los usuarios pueden generar imágenes en ChatGPT

Was this article helpful?

Tom Hanks advierte a sus seguidores sobre Deepfakes generados con IA

Automatizar la autorización previa utilizando CRD con CDS Hooks y AWS HealthLake

Inteligencia Artificial

Conoce a TARDIS Un marco de trabajo de IA que identifica singularidades en espacios complejos y captura estructuras singulares y complejidad geométrica local en datos de imágenes.

MosaicML acaba de lanzar su MPT-30B bajo la licencia Apache 2.0.

Datos portables predijeron las infecciones por COVID

Top 40+ Herramientas de IA Generativa (Septiembre 2023)

Conoce a Ego-Exo4D Un conjunto de datos y una suite de referencia esenciales para apoyar la investigación sobre aprendizaje de video y percepción multimodal.

Conoce a Nous-Hermes-Llama2-70b Un modelo de lenguaje de última generación ajustado finamente en más de 300,000 instrucciones.