Inicio Empresa Instancias AWS EC2 Trn1 ahora disponibles

Instancias AWS EC2 Trn1 ahora disponibles

by lyle smith
Instancia de AWS Trn1: escalabilidad horizontal de ultraclúster

Amazon Web Services (AWS) ha anunciado la disponibilidad general de las instancias AWS EC2 Trn1. Con la tecnología de chips Trainium diseñados por AWS, las instancias Trn1 están diseñadas específicamente para el entrenamiento de alto rendimiento de modelos de aprendizaje automático (en la nube) y Amazon indica una reducción del 50 % en los ahorros de "costo de entrenamiento" en comparación con GPU similares. instancias basadas en

Amazon Web Services (AWS) ha anunciado la disponibilidad general de las instancias AWS EC2 Trn1. Con la tecnología de chips Trainium diseñados por AWS, las instancias Trn1 están diseñadas específicamente para el entrenamiento de alto rendimiento de modelos de aprendizaje automático (en la nube) y Amazon indica una reducción del 50 % en los ahorros de "costo de entrenamiento" en comparación con GPU similares. instancias basadas en

AWS EC2 Trn1: escalado ultraclúster

Las instancias de AWS EC2 Trn1 brindan el tiempo más rápido para entrenar modelos populares de aprendizaje automático en AWS. Esto permite a sus clientes reducir los tiempos de capacitación, iterar rápidamente en modelos para aumentar la precisión y mejorar la productividad general para cargas de trabajo como procesamiento de lenguaje natural, reconocimiento de voz e imágenes, búsqueda semántica, motores de recomendación, detección de fraudes y pronósticos.

Las instancias Trn1 también son muy flexibles en lo que respecta a los precios, ya que no hay compromisos mínimos ni tarifas iniciales. Los clientes también solo deben pagar por la cantidad de cómputo que usan.

Tamaños y especificaciones de las instancias AWS EC2 Trn1

Nombre de instancia vCPU Chips de tren de AWS Memoria del acelerador Enlace neuronal Memoria de instancia Redes de instancias Almacenamiento de instancias locales
trn1.2xgrande 8 1 32 GB XNUMX tabletas 32 GB Hasta 12.5 Gbps 1 unidad NVMe de 500 GB
trn1.32xgrande 128 16 512 GB Soportado 512 GB 800 Gbps 4x 2TB NVMe

Anteriormente, incluso si las organizaciones aprovechaban las instancias aceleradas más rápidas disponibles, entrenar modelos de aprendizaje automático más complejos seguía siendo demasiado costoso y requería mucho tiempo. Con las nuevas instancias AWS EC2 Trn1, Amazon indica que cuentan con el mejor rendimiento de precio y el entrenamiento de modelo de aprendizaje automático más rápido en AWS.

Otras características notables incluyen las siguientes:

  • Aquellos que buscan comenzar sin cambiar significativamente el código pueden usar AWS Neuron, el kit de desarrollo de software (SDK) para instancias Trn1. También está integrado en marcos populares para el aprendizaje automático como PyTorch y TensorFlow.
  • Las instancias Trn1 cuentan con hasta 16 aceleradores de AWS Trainium que están diseñados específicamente para implementar modelos de aprendizaje profundo.
  • Para mejorar la eficiencia, Trn1 es la primera instancia de Amazon EC2 que ofrece hasta 800 Gbps de ancho de banda de red a través de 2nd-gen interfaz de red AWS Elastic Fabric Adapter (EFA).
  • Para acelerar el entrenamiento, las instancias Trn1 también usan NeuronLink, una interconexión entre instancias de alta velocidad.

Ultraclústeres de Amazon EC2

Los clientes pueden implementar instancias Trn1 en Amazon EC2 UltraClusters (compuestos por decenas de miles de aceleradores Trainium) para entrenar rápidamente los modelos de aprendizaje profundo más complejos, incluso aquellos con billones de parámetros. Con EC2 UltraClusters, las organizaciones tienen la capacidad de escalar el entrenamiento de modelos de aprendizaje automático con hasta 30,000 XNUMX aceleradores Trainium interconectados con redes EFA a escala de petabit. Amazon indica que, por lo tanto, estas organizaciones tendrán acceso bajo demanda a un rendimiento de clase de supercomputación, lo que puede reducir significativamente el tiempo de capacitación que generalmente toma meses a solo días.

Cada instancia de AWS EC2 Trn1 admite hasta 8 TB de almacenamiento SSD NVMe local rápido, mientras que AWS Trainium admite una amplia gama de tipos de datos (FP32, TF32, BF16, FP16 y FP8 configurable). También es compatible con el redondeo estocástico, un método basado en la probabilidad, para permitir un alto rendimiento y una mayor precisión. Además, AWS Trainium admite formas de tensor dinámicas y operadores personalizados, lo que promueve una infraestructura flexible diseñada para adaptarse en función de las necesidades de capacitación del cliente.

Sistema Nitro de AWS

Las instancias Trn1 se basan en el sistema Nitro de AWS, una colección de innovaciones de hardware y software diseñadas por AWS que optimizan la entrega de almacenamiento local rápido, redes privadas y múltiples inquilinos aislados. Para brindar el rendimiento necesario, el sistema Nitro descarga las funciones de red, almacenamiento y virtualización de la CPU en hardware y software dedicados.

Disponibilidad de instancias de AWS EC2 Trn1

Las instancias de AWS Trn1 se pueden comprar ahora como instancias bajo demanda (con planes de ahorro), instancias reservadas o instancias puntuales. Actualmente, están disponibles en EE. UU. Este (Norte de Virginia) y EE. UU. Oeste (Oregón), y pronto se ampliará su disponibilidad en otras regiones de AWS.

También estarán disponibles a través de los siguientes otros servicios de AWS:

  • Amazon SageMaker
  • Servicio Amazon Elastic Kubernetes (Amazon EKS)
  • Servicio de contenedor elástico de Amazon (Amazon ECS)
  • Lote de AWS

Instancias de AWS Trn1

Interactuar con StorageReview

Boletín informativo | Canal de YouTube | Podcast iTunes/Spotify | @Instagram | Twitter | @TikTok | RSS Feed