Amazon Web Services (AWS) ha anunciado la disponibilidad general de las instancias AWS EC2 Trn1. Con la tecnología de chips Trainium diseñados por AWS, las instancias Trn1 están diseñadas específicamente para el entrenamiento de alto rendimiento de modelos de aprendizaje automático (en la nube) y Amazon indica una reducción del 50 % en los ahorros de "costo de entrenamiento" en comparación con GPU similares. instancias basadas en
Amazon Web Services (AWS) ha anunciado la disponibilidad general de las instancias AWS EC2 Trn1. Con la tecnología de chips Trainium diseñados por AWS, las instancias Trn1 están diseñadas específicamente para el entrenamiento de alto rendimiento de modelos de aprendizaje automático (en la nube) y Amazon indica una reducción del 50 % en los ahorros de "costo de entrenamiento" en comparación con GPU similares. instancias basadas en
Las instancias de AWS EC2 Trn1 brindan el tiempo más rápido para entrenar modelos populares de aprendizaje automático en AWS. Esto permite a sus clientes reducir los tiempos de capacitación, iterar rápidamente en modelos para aumentar la precisión y mejorar la productividad general para cargas de trabajo como procesamiento de lenguaje natural, reconocimiento de voz e imágenes, búsqueda semántica, motores de recomendación, detección de fraudes y pronósticos.
Las instancias Trn1 también son muy flexibles en lo que respecta a los precios, ya que no hay compromisos mínimos ni tarifas iniciales. Los clientes también solo deben pagar por la cantidad de cómputo que usan.
Tamaños y especificaciones de las instancias AWS EC2 Trn1
Nombre de instancia | vCPU | Chips de tren de AWS | Memoria del acelerador | Enlace neuronal | Memoria de instancia | Redes de instancias | Almacenamiento de instancias locales |
trn1.2xgrande | 8 | 1 | 32 GB | XNUMX tabletas | 32 GB | Hasta 12.5 Gbps | 1 unidad NVMe de 500 GB |
trn1.32xgrande | 128 | 16 | 512 GB | Soportado | 512 GB | 800 Gbps | 4x 2TB NVMe |
Anteriormente, incluso si las organizaciones aprovechaban las instancias aceleradas más rápidas disponibles, entrenar modelos de aprendizaje automático más complejos seguía siendo demasiado costoso y requería mucho tiempo. Con las nuevas instancias AWS EC2 Trn1, Amazon indica que cuentan con el mejor rendimiento de precio y el entrenamiento de modelo de aprendizaje automático más rápido en AWS.
Otras características notables incluyen las siguientes:
- Aquellos que buscan comenzar sin cambiar significativamente el código pueden usar AWS Neuron, el kit de desarrollo de software (SDK) para instancias Trn1. También está integrado en marcos populares para el aprendizaje automático como PyTorch y TensorFlow.
- Las instancias Trn1 cuentan con hasta 16 aceleradores de AWS Trainium que están diseñados específicamente para implementar modelos de aprendizaje profundo.
- Para mejorar la eficiencia, Trn1 es la primera instancia de Amazon EC2 que ofrece hasta 800 Gbps de ancho de banda de red a través de 2nd-gen interfaz de red AWS Elastic Fabric Adapter (EFA).
- Para acelerar el entrenamiento, las instancias Trn1 también usan NeuronLink, una interconexión entre instancias de alta velocidad.
Ultraclústeres de Amazon EC2
Los clientes pueden implementar instancias Trn1 en Amazon EC2 UltraClusters (compuestos por decenas de miles de aceleradores Trainium) para entrenar rápidamente los modelos de aprendizaje profundo más complejos, incluso aquellos con billones de parámetros. Con EC2 UltraClusters, las organizaciones tienen la capacidad de escalar el entrenamiento de modelos de aprendizaje automático con hasta 30,000 XNUMX aceleradores Trainium interconectados con redes EFA a escala de petabit. Amazon indica que, por lo tanto, estas organizaciones tendrán acceso bajo demanda a un rendimiento de clase de supercomputación, lo que puede reducir significativamente el tiempo de capacitación que generalmente toma meses a solo días.
Cada instancia de AWS EC2 Trn1 admite hasta 8 TB de almacenamiento SSD NVMe local rápido, mientras que AWS Trainium admite una amplia gama de tipos de datos (FP32, TF32, BF16, FP16 y FP8 configurable). También es compatible con el redondeo estocástico, un método basado en la probabilidad, para permitir un alto rendimiento y una mayor precisión. Además, AWS Trainium admite formas de tensor dinámicas y operadores personalizados, lo que promueve una infraestructura flexible diseñada para adaptarse en función de las necesidades de capacitación del cliente.
Sistema Nitro de AWS
Las instancias Trn1 se basan en el sistema Nitro de AWS, una colección de innovaciones de hardware y software diseñadas por AWS que optimizan la entrega de almacenamiento local rápido, redes privadas y múltiples inquilinos aislados. Para brindar el rendimiento necesario, el sistema Nitro descarga las funciones de red, almacenamiento y virtualización de la CPU en hardware y software dedicados.
Disponibilidad de instancias de AWS EC2 Trn1
Las instancias de AWS Trn1 se pueden comprar ahora como instancias bajo demanda (con planes de ahorro), instancias reservadas o instancias puntuales. Actualmente, están disponibles en EE. UU. Este (Norte de Virginia) y EE. UU. Oeste (Oregón), y pronto se ampliará su disponibilidad en otras regiones de AWS.
También estarán disponibles a través de los siguientes otros servicios de AWS:
- Amazon SageMaker
- Servicio Amazon Elastic Kubernetes (Amazon EKS)
- Servicio de contenedor elástico de Amazon (Amazon ECS)
- Lote de AWS
Interactuar con StorageReview
Boletín informativo | Canal de YouTube | Podcast iTunes/Spotify | @Instagram | Twitter | @TikTok | RSS Feed