Las 5 mejores APIs de difusión estable para una integración fácil de aplicaciones

Las 5 mejores APIs de difusión estable para una fácil integración de aplicaciones

Introducción

Las APIs son la solución en esta era de la Inteligencia Artificial, donde uno de los desafíos significativos para los negocios es gestionar los altos requisitos computacionales de los modelos de IA al integrarlos en software y aplicaciones. La solución a esto viene en forma de Interfaces de Programación de Aplicaciones (APIs). Las APIs te ahorran problemas de mantenimiento, permitiéndote enfocarte en la lógica de tu negocio y la experiencia del usuario. Esto significa que cualquier persona puede aprovechar estas APIs para construir y comercializar aplicaciones. Este artículo profundizará en las APIs de Difusión Estable, un conjunto de modelos de IA Generativa enfocados en la generación de imágenes, que se han vuelto cruciales para varias aplicaciones.

Primero veremos la API de Segmind, una opción muy eficiente y efectiva. Estas APIs han revolucionado cómo los desarrolladores, diseñadores y creadores abordan la generación de contenido visual. Exploraremos cinco de las mejores APIs de Difusión Estable, resaltando sus características, casos de uso, precios y más.

Objetivos de Aprendizaje

  • Obtener conocimientos sobre los modelos de Difusión Estable.
  • Comprender los fundamentos de los modelos de Difusión Estable, incluyendo sus aplicaciones.
  • Entender las APIs en el desarrollo de software moderno.
  • Explorar cómo las APIs desempeñan un papel crucial en la simplificación del desarrollo de software y aplicaciones.

Este artículo ha sido publicado como parte del Blogatón de Ciencia de Datos.

Entendiendo los Modelos de Difusión Estable

¿Qué son los Modelos de Difusión Estable?

Los Modelos de Difusión Estable son una clase de modelos de IA generativa que se centran en la generación de imágenes de alta calidad. Estos modelos están diseñados para producir imágenes realistas y de alta resolución con diversas aplicaciones. Se caracterizan por su estabilidad y confiabilidad, lo cual es útil para tareas como síntesis de imágenes, transferencia de estilo y aumento de datos.

Los Modelos de Difusión Estable utilizan un proceso de difusión para generar imágenes, donde se agrega gradualmente ruido a una imagen hasta que evoluciona hacia una salida compleja y coherente. Este proceso asegura que las imágenes generadas sean de alta calidad y muestren detalles finos.

¿Qué son las APIs?

Las APIs, o Interfaces de Programación de Aplicaciones, son un conjunto de reglas y protocolos que permiten que una aplicación de software interactúe y utilice las características o datos de otra aplicación, servicio o plataforma. Las APIs son intermediarios que facilitan la integración entre software.

En el desarrollo de software, las APIs brindan una forma para que los desarrolladores accedan a funciones, servicios o datos de fuentes, incluyendo servicios en la nube, bases de datos o modelos de IA, sin entender las complejidades subyacentes. Esto simplifica el desarrollo y acelera la creación de aplicaciones con funciones completas.

Las APIs pueden tomar varias formas, como APIs RESTful, APIs gRPC y APIs WebSocket, cada una adaptada a casos de uso específicos. Juegan un papel crítico en el software moderno, permitiendo a los desarrolladores aprovechar el poder de servicios y funcionalidades de terceros mientras se enfocan en la lógica central de su aplicación.

Las 5 Mejores APIs de Difusión Estable

Echemos un vistazo a las mejores APIs de Difusión Estable en nuestra lista, comenzando con la amigable API de Segmind.

1. APIs de Difusión Estable de Segmind

Encabezando nuestra lista está la API de Segmind, conocida por su facilidad de uso y poca configuración. Si tienes experiencia usando herramientas de API estándar como Postman, casi no necesitas aprender algo nuevo. Veremos brevemente cómo hacer esto. Puedes consultar este artículo https://www.analyticsvidhya.com/blog/2023/09/genai-app-integration-using-segmind-api-and-postman/ para obtener un enfoque detallado sobre cómo usar Segmind y Postman.

La API GenAI de Segmind proporciona muchos propósitos, capacidades y beneficios. Algunos incluyen reconocimiento de imágenes en comercio electrónico, moda, arquitectura como DvArch, animación, eliminación de fondo, etc. Los modelos de IA de Segmind están disponibles a través de la API y el playground en el sitio web en https://www.segmind.com/models.

¿Por qué las APIs de Segmind?

Hay muchas razones por las cuales Segmind encabeza nuestra lista aquí.

  • Velocidad: Segmind proporciona a los desarrolladores acceso a las API de Difusión Estable Sin Servidor más rápidas.
  • Accesibilidad: Las optimizaciones de Segmind ayudan a obtener inferencias más rentables, pagadas por llamada de API.
  • Sencillez de uso: Despliega sus APIs de alto rendimiento con una integración de API sin problemas con un solo clic y escala sin esfuerzo.
  • Escala: Segmind se amplía automáticamente para manejar la demanda. Solo pagas por las llamadas de API.

Demostración con Segmind API Playground

El playground de API hace que sea muy fácil usar los modelos en segundos. Para demostrar cómo funciona fácilmente el playground de API, consideremos los nuevos y poderosos modelos de difusión estable llamados “Dreamshaper SDXL”. Solo necesitas una cuenta, que puedes configurar en minutos. Ve a https://www.segmind.com/ para registrarte. Después de registrarte, ve a la página de modelos y busca ‘Dreamshaper SDXL’, un nuevo lanzamiento. O sigue este enlace https://www.segmind.com/models/sdxl1.0-dreamshaper. Una vez que hagas clic en el modelo, verás el playground. Además del playground, conoces la interfaz de llamada de API, como se muestra en la captura de pantalla a continuación.

Para probar la imagen anterior, aquí está el texto que usé:

Presentando un retrato cinematográfico: El Gato Gruñón 1.25 en un traje espacial, fondo de ciudad de Cyberpunk 2077, obra maestra en 2D de John Wilhelm, Grumpy 1.2, Cyberpunk 1.4, foto realista, renderizado Octane, HDR, neón, destellos de lente, mejor calidad 1.9, pose asimétrica activa, lleno de acción 1.8, tendencia en ArtStation, 8K, fotografía de 35 mm, película, bokeh, profesional, 4K, altamente detallado.

El enfoque anterior es para usar el playground, que está disponible directamente en el sitio web. La otra opción disponible es la API. Esta es una opción poderosa en Segmind. Aquí es donde puedes usar llamadas de API para construir tu aplicación y disfrutar del modelo de Segmind.

Usando llamadas de API de Segmind

Las llamadas de API eliminan la necesidad de alojar estos modelos grandes y costosos. No necesitas preocuparte por el mantenimiento del servidor o el alojamiento. Solo necesitas tener conocimientos básicos de las funcionalidades de la API, como el uso de Postman. Todo el proceso sigue siendo el mismo que con las llamadas de API regulares. Suponiendo que usas Javascript para tu aplicación web, a continuación se muestra el script para hacer una solicitud POST en Dreamshaper SDXL. Esto responderá con una imagen en formato jpeg.

import requestsapi_key = "TU CLAVE DE API"url = "https://api.segmind.com/v1/sdxl1.0-dreamshaper"# Datos de solicituddata = {  "prompt": "foto cinematográfica de retrato de cyberpunk (el Gato Grúñón:1.25) en un traje espacial, mirando con infinita tristeza al universo pasar, fondo de ciudad de cyberpunk 2077, obra maestra en 2D de John Wilhelm, (Grumpy:1.2), (Cyberpunk:1.4), foto realista, renderizado Octane, HDR, neón, destellos de lente, (mejor calidad:1.9), pose asimétrica activa, (lleno de acción:1.8), tendencia en ArtStation, 8K, fotografía de 35 mm, película, bokeh, profesional, 4K, altamente detallado",  "negative_prompt": "dibujo, pintura, crayón, boceto, grafito, impresionista, ruidoso, borroso, suave, deformado, feo, [deformado | desfigurado], mal dibujado, [mala : incorrecta] anatomía, [extra | faltante | flotante | desconectado] miembro, (manos y dedos mutados), borroso",  "samples": 1,  "scheduler": "UniPC",  "num_inference_steps": 35,  "guidance_scale": "7",  "seed": "1135424276",  "img_width": "1024",  "img_height": "1024",  "base64": False}response = requests.post(url, json=data, headers={'x-api-key': api_key})print(response)

Segmind ha hecho que cada modelo tenga su propio script de llamada a la API en su página como documentos individuales para facilitar el acceso. Todo lo que necesitas hacer es hacer una solicitud POST desde Postman. Suponiendo que estás desarrollando con Python, tienes el script para Python como se muestra a continuación:

import requestsapi_key = "TU API-KEY"url = "https://api.segmind.com/v1/sdxl1.0-dreamshaper"# Carga de la solicitud de datos = {  "prompt": "foto cinematográfica de un retrato de cyberpunk (el gato gruñón:1.25) en un traje espacial, mirando con tristeza infinita al universo pasar, fondo de ciudad cyberpunk 2077, obra maestra en 2D de john Wilhelm, (gruñón:1.2), (cyberpunk:1.4), foto realista, octano render, hdr, neon, lens flares, (la mejor calidad:1.9), pose asimétrica activa, (llena de acción:1.8), trending en artstation, 8k, fotografía de 35mm, película, bokeh, profesional, 4k, altamente detallada",  "negative_prompt": "dibujo, pintura, crayón, boceto, grafito, impresionista, ruidoso, borroso, suave, deforme, feo, [deformado | desfigurado], dibujo de mala calidad, anatomía [extra | faltante | flotante | desconectada] extremidad, (manos y dedos mutados), borroso",  "samples": 1,  "scheduler": "UniPC",  "num_inference_steps": 35,  "guidance_scale": "7",  "seed": "1135424276",  "img_width": "1024",  "img_height": "1024",  "base64": False}response = requests.post(url, json=data, headers={'x-api-key': api_key})print(response)

Todo lo que necesitas hacer es cambiar tu solicitud en los datos y la respuesta que obtenes es la imagen generada en jpeg. Puedes explorar más o consultar este artículo https://www.analyticsvidhya.com/blog/2023/09/interfaz-genai-con-segmind-api-y-postman/ para obtener pasos detallados sobre cómo usar Segmind con Postman o visitar la documentación o el repositorio de GitHub para obtener más información. Los enlaces se recopilan al final del artículo. A continuación, veremos brevemente otros proveedores de API de SD.

2. API de Stability AI – Inteligencia Artificial Generativa de Código Abierto

Stability AI, líder en inteligencia artificial generativa de código abierto, se dedica a avanzar en la infraestructura y la investigación. Su ética de código abierto respalda el lenguaje, el código, el audio, el video, el contenido 3D, el diseño y la biotecnología. Esto tiene como objetivo capacitar a la humanidad con el potencial de la inteligencia artificial.

La API de Stability AI ofrece un enfoque flexible para la autenticación, los créditos y las llamadas a la API. Los usuarios deben crear una cuenta para obtener una clave de API, que es esencial para acceder a la API. Se requieren créditos para utilizar la API de Stability, y los nuevos usuarios reciben 25 créditos gratuitos al registrarse.

Usando Llamadas a la API

Stability AI es un poco complejo para los principiantes, ya que proporciona más de un tipo de API. Además de la API REST regular, proporcionan API de gRPC. Puedes consultar GitHub para encontrar algunas guías técnicas aquí https://github.com/Stability-AI/. Puedes consultar la documentación que proporciona todas las llamadas a la API, pero para realizar una generación de texto a imagen, la estructura se ve así en Python:

import base64import osimport requestsengine_id = "stable-diffusion-xl-1024-v1-0"api_host = os.getenv('API_HOST', 'https://api.stability.ai')api_key = os.getenv("STABILITY_API_KEY")if api_key is None:    raise Exception("Falta la clave de API de Stability.")response = requests.post(    f"{api_host}/v1/generation/{engine_id}/text-to-image",    headers={        "Content-Type": "application/json",        "Accept": "application/json",        "Authorization": f"Bearer {api_key}"    },    json={        "text_prompts": [            {                "text": "Un faro en un acantilado"            }        ],        "cfg_scale": 7,        "height": 1024,        "width": 1024,        "samples": 1,        "steps": 30,    },)if response.status_code != 200:    raise Exception("Respuesta no 200: " + str(response.text))data = response.json()for i, image in enumerate(data["artifacts"]):    with open(f"./out/v1_txt2img_{i}.png", "wb") as f:        f.write(base64.b64decode(image["base64"]))

Para los desarrolladores que utilizan otros lenguajes, hay un script tanto para TypeScript como para Go. Puedes consultar su documentación para obtener más detalles. Ahora veamos la siguiente API.

3. API de Difusión Estable de Hotpot.ai – Adaptado a tus necesidades

La API de Difusión Estable de Hotpot.ai es otra que ofrece múltiples opciones para satisfacer diversos requisitos. Diseñada con optimizaciones patentadas para empresas y consumidores que ofrecen un modelo de Difusión Estable personalizable y rentable. Te permiten generar imágenes sin necesidad de registrarte. Utilizaremos su generador de Arte de IA para generar una imagen utilizando la primera frase de nuestra indicación anterior.

Indicación:

Crea una obra de arte que fusione los elementos del cyberpunk y la exploración espacial futurista.

Podemos utilizar fácilmente el parámetro ‘Estilo’ para ajustar la imagen. Cambiar a un estilo diferente nos da la siguiente imagen.

Precios: Los precios de la API dependen de factores como el volumen mensual, los planes de suscripción y los descuentos de co-marketing. Es crucial tener cuidado con las ofertas que ofrecen paquetes ilimitados, ya que pueden comprometer la fiabilidad y la latencia. Hotpot.ai garantiza escalabilidad, gestionando millones de solicitudes de generación de imágenes mientras mantiene una latencia baja y una alta fiabilidad.

Acceso a la API: El acceso a la API se facilita con el Editor en Línea de Difusión Estable, que ofrece resultados idénticos a los de la API. La diferencia clave es la velocidad, ya que los usuarios de la API tienen acceso a servidores privados más potentes para una generación de imágenes más rápida. Hotpot.ai incluso proporciona créditos de prueba gratuitos para su API de Difusión Estable, lo que la hace accesible para los desarrolladores.

Además, Hotpot.ai se mantiene al día con las últimas versiones de Difusión Estable, ofreciendo actualmente la versión 2.1 con planes para integrar Difusión Estable XL para fines comerciales.

Vamos a ver el script de llamada a la API para Hotpot. Hotpot.ai ofrece la API de Difusión Estable como presupuesto, estándar y premium. Para utilizar la API con Python, debes instalar primero ‘request’.

!pip3 install requestsimport requestsheaders = {  'Authorization': 'API_KEY_AQUÍ',}# cambia a la ruta completa del archivo de la imagen que deseas transformarbody = {  'image': open('/ruta/completa/a/imagen.jpg', 'rb'),}response = requests.post('https://api.hotpot.ai/remove-background', headers=headers, files=body)# cambia a la ruta completa de archivo donde deseas guardar la imagen resultantewith open('/ruta/completa/a/imagen-sin-fondo.jpg', 'wb') as file:  file.write(response.content)

Sí, incluso si estás utilizando el antiguo pero dorado PHP, no te quedas fuera aquí.

<?php$ch = curl_init();// cambia a la ruta completa del archivo de la imagen que deseas transformar$body = [  'image' => new CurlFile('/ruta/completa/a/imagen.jpg')];curl_setopt($ch, CURLOPT_URL, 'https://api.hotpot.ai/remove-background');curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);curl_setopt($ch, CURLOPT_POST, 1);curl_setopt($ch, CURLOPT_POSTFIELDS, $body);$headers = array('Authorization: API_KEY_AQUÍ');curl_setopt($ch, CURLOPT_HTTPHEADER, $headers);$response = curl_exec($ch);curl_close($ch);// cambia a la ruta completa de archivo donde deseas guardar la imagen resultantefile_put_contents('/ruta/completa/a/imagen-sin-fondo.jpg', $response);

Si necesitas más información sobre cómo hacerlo, consulta el archivo GitHub aquí.

4. API de Difusión Estable de ZYLA: Redefinición de la Generación de Imágenes

La API de Difusión Estable de ZYLA utiliza el modelo de Difusión Estable v2.1 de última generación para producir imágenes de alta calidad. Esta API ofrece capacidades avanzadas de generación de imágenes, escalabilidad y una interfaz fácil de usar. Los desarrolladores, diseñadores y creadores de contenido pueden mejorar sus proyectos con imágenes impresionantes y realistas. Zyla es como una tienda en línea de APIs. Nos enfocaremos solo en las APIs de Difusión Estable.

Casos de uso destacados para la API de ZYLA SD

Diseño gráfico y publicidad: Ideal para crear gráficos llamativos para sitios web, redes sociales y anuncios impresos.

Realidad virtual y realidad aumentada: Mejora la fidelidad visual en aplicaciones de realidad virtual y realidad aumentada.

Creación de contenido y producción de medios: Apoya a cineastas, desarrolladores de juegos y estudios de animación en la producción de contenido cautivador.

Comercio electrónico y visualización de productos: Eleva la experiencia de compra con imágenes realistas de productos.

Exploración artística y expresión creativa: Despierta la creatividad y la exploración artística.

Edición y mejora de imágenes: Potencia a los editores de imágenes con herramientas avanzadas.

La mayoría de las APIs tienen una prueba gratuita de 7 días. Puedes registrarte y ver si cumple tus necesidades.

La API de generación de imágenes AI admite Postman como Segmind AI. Después de registrarte, obtienes una clave de acceso personal para la API de generación de imágenes AI. Esta se utiliza para autenticarse con la API REST de la API de generación de imágenes AI simplemente incluyendo tu token de autorización en el encabezado de Autorización. La variable de encabezado en Postman es

Authorization

Necesitas registrarte para acceder a la API. Después de registrarte, ve a la sección “Tu clave de acceso a la API” y establece [Requerido] para Bearer access_key.

Bearer access_key

Recuerda que ZYLA es más como una tienda en línea para APIs, y la API SD es solo una de las colecciones.

5. API Getimg.ai

Esta API te permite generar y editar imágenes utilizando los últimos modelos basados en Difusión Estable. Puedes usar esta API para tuberías de generación de imágenes, como de texto a imagen, ControlNet, relleno, ampliación y más.

Hacen que la programación sea muy breve. Aquí tienes un ejemplo de cómo hacer una solicitud POST a la API de Difusión Estable para la generación de texto a imagen utilizando cURL:

curl \-X POST https://api.getimg.ai/v1/stable-diffusion/text-to-image \-H "Authorization: Bearer $ACCESS_TOKEN" \-H "Content-Type: application/json" \-d '{"prompt":"una foto de un astronauta montando un caballo en Marte"}'

Puedes usar el ejemplo anterior en el playground para probar el modelo. El siguiente ejemplo genera 4 imágenes a la vez. Esto es útil para generar fotos de stock.

Puedes personalizar el ejemplo anterior para generar imágenes diferentes según tus necesidades.

Además, getimg.ai ofrece diferentes opciones de precios según el tamaño, los pasos y las tuberías que elijas. Por ejemplo, Difusión Estable XL con 1024×1024 píxeles y 30 pasos tiene un precio de $0.00944 por imagen.

Puedes encontrar más información sobre esta API, sus casos de uso y precios en el sitio web de getimg.ai, y puedes explorar las características y modelos que ofrecen para la generación y edición de imágenes. Debes registrarte y obtener una clave de API para autenticar tus solicitudes para usar la API.

Conclusión

La generación de imágenes está evolucionando rápidamente y las API de Stable Diffusion están a la vanguardia. Los desarrolladores, diseñadores y creadores de contenido ahora tienen muchas opciones. Estas API ofrecen características avanzadas, escalabilidad y muchos casos de uso, lo que las convierte en herramientas indispensables en el panorama moderno de la IA. Utiliza estas API para transformar tus proyectos y disfrutar del poder de la tecnología de generación de imágenes de vanguardia.

Puntos clave a tener en cuenta

  • Las API de Stable Diffusion ofrecen un enfoque perfecto para el desarrollo de IA, permitiendo a los desarrolladores centrarse en la construcción de productos de IA mientras dejan el mantenimiento de la GPU al proveedor de servicios.
  • Muchas API de Stable Diffusion ofrecen un acceso fácil de usar a través de herramientas como Editores en línea de Stable Diffusion, ofreciendo resultados idénticos a sus API pero con una velocidad mejorada.
  • La API de Stability AI adopta una ética de código abierto, empoderando a los desarrolladores con acceso abierto a tecnologías de IA de vanguardia en múltiples dominios.

Preguntas frecuentes

  • https://www.segmind.com/
  • https://www.segmind.com/models
  • https://www.segmind.com/models/sdxl1.0-dreamshaper
  • https://platform.stability.ai/docs/getting-started
  • https://platform.stability.ai/docs/api-reference
  • https://hotpot.ai/stable-diffusion-api
  • https://hotpot.ai/art-generator?s=stable-diffusion-api
  • https://zylalabs.com/api-marketplace/tag/stable+diffusion
  • https://stablediffusionapi.com/
  • https://getimg.ai/tools/api

Los medios mostrados en este artículo no son propiedad de Analytics Vidhya y se utilizan a discreción del autor.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Las 5 Mejores Herramientas de IA para Maximizar la Productividad

VoAGI revisa un conjunto diverso de 5 herramientas de IA para ayudar a maximizar tu productividad. Echa un vistazo y ...

Inteligencia Artificial

Conoce FLM-101B Un decodificador de solo lectura de LLM de código abierto con 101 mil millones de parámetros

Últimamente, los modelos de lenguaje grandes (LLMs) están destacando en tareas de NLP y multimodalidad, pero se enfre...

Inteligencia Artificial

Textbooks son todo lo que necesitas Un enfoque revolucionario para la formación en IA

Esta es una descripción general del artículo Los libros de texto son todo lo que necesitas, resaltando el éxito del m...

Inteligencia Artificial

El Ascenso y Caída de la Ingeniería Rápida ¿Moda o Futuro?

Este artículo proporciona una visión general de la ingeniería rápida, desde sus inicios hasta su estado actual.

Inteligencia Artificial

EU AI Act ¿Un paso prometedor o una apuesta arriesgada para el futuro de la IA?

La Ley de la UE sobre IA es la primera ley de regulación internacional sobre IA. Su objetivo es garantizar el desarro...

Inteligencia Artificial

Descifrando la verdad de los datos Cómo los modelos de lenguaje grandes utilizan las personas para modelar la veracidad

Con la introducción de los Modelos de Lenguaje Grande (LLMs), el subcampo de la Inteligencia Artificial, es decir, el...