Casa Impresa Istanze AWS EC2 Trn1 ora disponibili

Istanze AWS EC2 Trn1 ora disponibili

by Lile Smith
Istanza AWS Trn1: scalabilità orizzontale ultracluster

Amazon Web Services (AWS) ha annunciato la disponibilità generale delle istanze AWS EC2 Trn1. Alimentate da chip Trainium progettati da AWS, le istanze Trn1 sono progettate specificamente per l'addestramento ad alte prestazioni di modelli di machine learning (nel cloud) con Amazon che indica una riduzione del 50% del risparmio sul "costo di addestramento" rispetto a GPU simili istanze basate su

Amazon Web Services (AWS) ha annunciato la disponibilità generale delle istanze AWS EC2 Trn1. Alimentate da chip Trainium progettati da AWS, le istanze Trn1 sono progettate specificamente per l'addestramento ad alte prestazioni di modelli di machine learning (nel cloud) con Amazon che indica una riduzione del 50% del risparmio sul "costo di addestramento" rispetto a GPU simili istanze basate su

AWS EC2 Trn1: scalabilità orizzontale dell'ultracluster

Le istanze AWS EC2 Trn1 forniscono il tempo più veloce per addestrare i modelli di machine learning più diffusi su AWS. Ciò consente ai clienti di ridurre i tempi di formazione, ripetere rapidamente i modelli per aumentare la precisione e migliorare la produttività complessiva per carichi di lavoro quali elaborazione del linguaggio naturale, riconoscimento vocale e di immagini, ricerca semantica, motori di raccomandazione, rilevamento di frodi e previsioni.

Le istanze Trn1 sono molto flessibili anche per quanto riguarda i prezzi, poiché non sono previsti impegni minimi o commissioni anticipate. Inoltre, i clienti devono pagare solo per la quantità di elaborazione che utilizzano.

Dimensioni e specifiche delle istanze AWS EC2 Trn1

Nome istanza CPU virtuali Chip AWS Trainium Memoria dell'acceleratore NeuronLink Memoria di istanza Rete di istanze Archiviazione di istanze locali
trn1.2xgrande 8 1 32 GB N/A 32 GB Fino a 12.5 Gbps 1xNVMe da 500 GB
trn1.32xgrande 128 16 512 GB Supporto 512 GB 800 Gbps 4 NVMe da 2 TB

In precedenza, anche se le organizzazioni sfruttavano le istanze accelerate più veloci disponibili, la formazione di modelli di machine learning più complessi era ancora eccessivamente costosa e dispendiosa in termini di tempo. Con le nuove istanze AWS EC2 Trn1, Amazon afferma di vantare il miglior rapporto qualità-prezzo e il training del modello di machine learning più veloce su AWS.

Altre caratteristiche degne di nota includono quanto segue:

  • Coloro che desiderano iniziare senza modificare in modo significativo il codice possono utilizzare AWS Neuron, il kit di sviluppo software (SDK) per le istanze Trn1. È inoltre integrato in framework popolari per l'apprendimento automatico come PyTorch e TensorFlow.
  • Le istanze Trn1 presentano fino a 16 acceleratori AWS Trainium progettati specificamente per la distribuzione di modelli di deep learning.
  • Per migliorare l'efficienza, Trn1 è la prima istanza Amazon EC2 a offrire fino a 800 Gbps di larghezza di banda di rete tramite 2nd-gen Interfaccia di rete AWS Elastic Fabric Adapter (EFA).
  • Per accelerare l'addestramento, le istanze Trn1 utilizzano anche NeuronLink, un'interconnessione intra-istanza ad alta velocità.

UltraCluster di Amazon EC2

I clienti possono distribuire istanze Trn1 in Amazon EC2 UltraClusters (composti da decine di migliaia di acceleratori Trainium) per addestrare rapidamente i modelli di deep learning più complessi, anche quelli con trilioni di parametri. Con EC2 UltraClusters, le organizzazioni hanno la possibilità di scalare l'addestramento di modelli di machine learning con un massimo di 30,000 acceleratori Trainium interconnessi con reti EFA su scala petabit. Amazon indica che queste organizzazioni avranno quindi accesso on-demand a prestazioni di livello supercomputer, il che può ridurre significativamente i tempi di formazione che di solito richiedono mesi o solo giorni.

Ogni istanza AWS EC2 Trn1 supporta fino a 8 TB di veloce storage SSD NVMe locale, mentre AWS Trainium supporta un'ampia gamma di tipi di dati (FP32, TF32, BF16, FP16 e FP8 configurabile). Supporta inoltre l'arrotondamento stocastico, un metodo basato sulla probabilità, per consentire prestazioni elevate e maggiore precisione. Inoltre, AWS Trainium supporta forme tensoriali dinamiche e operatori personalizzati, il che promuove un'infrastruttura flessibile progettata per adattarsi in base alle esigenze di formazione dei clienti.

Sistema AWS Nitro

Le istanze Trn1 sono basate sul sistema AWS Nitro, una raccolta di innovazioni hardware e software progettate da AWS che semplificano la fornitura di multi-tenancy isolata, reti private e storage locale veloce. Per fornire le prestazioni necessarie, il sistema Nitro scarica le funzioni di virtualizzazione, archiviazione e rete della CPU su hardware e software dedicati.

Disponibilità delle istanze AWS EC2 Trn1

Le istanze AWS Trn1 possono essere acquistate ora come istanze on demand (con piani di risparmio), istanze riservate o istanze Spot. Attualmente sono disponibili negli Stati Uniti orientali (Nord Virginia) e negli Stati Uniti occidentali (Oregon), con disponibilità estesa presto in altre regioni AWS.

Saranno disponibili anche tramite i seguenti altri servizi AWS:

  • Amazon Sage Maker
  • Servizio Amazon Elastic Kubernetes (Amazon EKS)
  • Servizio Amazon Elastic Container (Amazon ECS)
  • Batch AWS

Istanze AWS Trn1

Interagisci con StorageReview

Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS feed