Search Results Amazon Inferentia

Minimiza la latencia de inferencia en tiempo real utilizando las estrategias de enrutamiento de Amazon SageMaker

Amazon SageMaker facilita la implementación de modelos de aprendizaje automático (ML) para inferencia en tiempo real y ofrece una amplia selección de instancias de…

Cómo Amazon Search M5 ahorró un 30% en el costo de capacitación de LLM utilizando AWS Trainium

Durante décadas, Amazon ha sido pionero en la innovación del aprendizaje automático (ML), brindando experiencias encantadoras a sus clientes. Desde los primeros días, Amazon…

Cómo Amazon Music utiliza SageMaker con NVIDIA para optimizar el rendimiento y el costo del entrenamiento y la inferencia de machine learning.

En el dinámico mundo de la transmisión en Amazon Music, cada búsqueda de una canción, podcast o lista de reproducción guarda una historia, un…

Haz que el tiempo de generación de tu llamada vuele con AWS Inferentia2

En un artículo anterior en el blog de Hugging Face, presentamos AWS Inferentia2, el acelerador AWS Inferentia de segunda generación, y explicamos cómo podrías…

Intuitivo logra un mayor rendimiento mientras ahorra en costos de IA/ML utilizando AWS Inferentia y PyTorch

Este es un post de invitado escrito por José Benítez, fundador y director de AI y Mattias Ponchon, jefe de infraestructura en Intuitivo. Intuitivo,…

Train y despliega modelos de ML en un entorno multicloud utilizando Amazon SageMaker

En esta publicación, demostramos una de las muchas opciones que tienes para aprovechar las capacidades de IA/ML más amplias y profundas de AWS en…

Desbloqueando la creatividad Cómo la inteligencia artificial generativa y Amazon SageMaker ayudan a las empresas a producir creatividades publicitarias para campañas de marketing con AWS

Las agencias de publicidad pueden utilizar la IA generativa y los modelos fundamentales de texto a imagen para crear creatividades y contenido publicitario innovador.…

Maximiza el rendimiento estable de la difusión y reduce los costos de inferencia con AWS Inferentia2

Los modelos de IA generativa han experimentado un crecimiento rápido en los últimos meses debido a sus impresionantes capacidades para crear texto, imágenes, código…

Acelerando Hugging Face Transformers con AWS Inferentia2

En los últimos cinco años, los modelos Transformer [1] se han convertido en el estándar de facto para muchas tareas de aprendizaje automático (ML),…

AWS Inferentia2 se basa en AWS Inferentia1 ofreciendo un rendimiento 4 veces mayor y una latencia 10 veces menor.

El tamaño de los modelos de aprendizaje automático (ML) - modelos de lenguaje grande (LLM) y modelos fundamentales (FMs) - está creciendo rápidamente año…

Escala tus cargas de trabajo de aprendizaje automático en Amazon ECS impulsado por instancias AWS Trainium.

Ejecutar cargas de trabajo de aprendizaje automático (ML) con contenedores se está convirtiendo en una práctica común. Los contenedores pueden encapsular completamente no solo…

Accenture crea una solución Knowledge Assist utilizando servicios de inteligencia artificial generativa en AWS

Esta publicación está coescrita con Ilan Geller y Shuyu Yang de Accenture. Las empresas hoy en día se enfrentan a grandes desafíos cuando se…

Bienvenido a una nueva era de construcción en la nube con IA generativa en AWS

Creemos que la IA generativa tiene el potencial, con el tiempo, de transformar virtualmente todas las experiencias de los clientes que conocemos. El número…

Microsoft presenta Azure Custom Chips Revolucionando la computación en la nube y las capacidades de IA

En medio de persistentes rumores de la industria, la tan esperada revelación de Microsoft salió a la luz durante la conferencia Ignite, marcando un…

Principal Financial Group utiliza la solución de análisis posterior a la llamada de AWS para extraer información sobre los clientes omnicanal

Una empresa de servicios financieros establecida con más de 140 años en el negocio, Principal es líder mundial en gestión de inversiones y atiende…

Implemente un punto final de inferencia de ML sin servidor para modelos de lenguaje grandes utilizando FastAPI, AWS Lambda y AWS CDK.

Para los científicos de datos, trasladar los modelos de aprendizaje automático (ML) desde la prueba de concepto a la producción a menudo presenta un…

Learn more about Search Results Amazon Inferentia