Amazon Web Services, Inc. (AWS) ha annunciato oggi la disponibilità generale di una nuova istanza Amazon Elastic Compute Cloud (Amazon EC2) basata su GPU, l'istanza G4. Questa nuova istanza è progettata per accelerare l'inferenza del machine learning (ML) fornendo al contempo l'inferenza ML più conveniente del settore per le applicazioni. La nuova istanza è ottima anche per carichi di lavoro ad uso intensivo di grafica in modo conveniente e sarebbe ideale per creare ed eseguire applicazioni ad uso intensivo di grafica, come workstation grafiche remote, transcodifica video, progettazione fotorealistica e streaming di giochi nel cloud .
Amazon Web Services, Inc. (AWS) ha annunciato oggi la disponibilità generale di una nuova istanza Amazon Elastic Compute Cloud (Amazon EC2) basata su GPU, l'istanza G4. Questa nuova istanza è progettata per accelerare l'inferenza del machine learning (ML) fornendo al contempo l'inferenza ML più conveniente del settore per le applicazioni. La nuova istanza è ottima anche per carichi di lavoro ad uso intensivo di grafica in modo conveniente e sarebbe ideale per creare ed eseguire applicazioni ad uso intensivo di grafica, come workstation grafiche remote, transcodifica video, progettazione fotorealistica e streaming di giochi nel cloud .
AWS afferma che il ML coinvolge due processi che richiedono elaborazione: formazione e inferenza. La formazione prevede l’utilizzo di dati etichettati per creare un modello in grado di fare previsioni, un’attività ad alta intensità di calcolo che richiede processori potenti e reti ad alta velocità. L'inferenza è il processo di utilizzo di un modello di machine learning addestrato per effettuare previsioni, che in genere richiede l'elaborazione simultanea di molti piccoli lavori di elaborazione. Questo lavoro è ideale per le potenti GPU NVIDIA. AWS non è estraneo alle istanze per ML, avendo lanciato per la prima volta l'istanza P3 due anni fa. Sebbene si sia trattato di un grande passo avanti, l’inferenza assorbe la maggior parte dei costi operativi per i carichi di lavoro ML.
Per risolvere questo problema, AWS ha rilasciato le nuove istanze G4 che sfruttano le GPU NVIDIA T4 di ultima generazione, i processori personalizzati Intel Xeon Scalable (Cascade Lake) di seconda generazione, fino a 2 Gbps di throughput di rete e fino a 100 TB di storage NVMe locale, per fornire le istanze GPU più convenienti per l'inferenza del machine learning. Le nuove istanze G1.8 possono offrire fino a 4 TFLOP di prestazioni a precisione mista, ideali per l'inferenza. I G65 possono anche essere utilizzati in modo economicamente vantaggioso per lavori di formazione sull'apprendimento automatico su piccola scala e entry-level che sono meno sensibili ai tempi di formazione. Per i carichi di lavoro ad uso intensivo di grafica, le nuove istanze offrono un aumento fino a 4 volte delle prestazioni grafiche e una capacità di transcodifica video fino a 1.8 volte superiore rispetto alle istanze G2 della generazione precedente.
Disponibilità
Le istanze G4 possono essere acquistate come istanze on demand, riservate o istanze Spot.
Iscriviti alla newsletter di StorageReview