오늘 Amazon Web Services, Inc.(AWS)는 새로운 GPU 기반 Amazon Elastic Compute Cloud(Amazon EC2) 인스턴스인 G4 인스턴스의 정식 출시를 발표했습니다. 이 새로운 인스턴스는 기계 학습(ML) 추론을 가속화하는 동시에 애플리케이션에 대해 업계에서 가장 비용 효율적인 ML 추론을 제공하도록 설계되었습니다. 새 인스턴스는 또한 비용 효율적인 방식으로 그래픽 집약적인 워크로드에 적합하며 원격 그래픽 워크스테이션, 비디오 트랜스코딩, 사실적인 디자인, 클라우드의 게임 스트리밍과 같은 그래픽 집약적인 애플리케이션을 구축하고 실행하는 데 이상적입니다. .
오늘 Amazon Web Services, Inc.(AWS)는 새로운 GPU 기반 Amazon Elastic Compute Cloud(Amazon EC2) 인스턴스인 G4 인스턴스의 정식 출시를 발표했습니다. 이 새로운 인스턴스는 기계 학습(ML) 추론을 가속화하는 동시에 애플리케이션에 대해 업계에서 가장 비용 효율적인 ML 추론을 제공하도록 설계되었습니다. 새 인스턴스는 또한 비용 효율적인 방식으로 그래픽 집약적인 워크로드에 적합하며 원격 그래픽 워크스테이션, 비디오 트랜스코딩, 사실적인 디자인, 클라우드의 게임 스트리밍과 같은 그래픽 집약적인 애플리케이션을 구축하고 실행하는 데 이상적입니다. .
AWS는 ML에 컴퓨팅이 필요한 두 가지 프로세스(훈련 및 추론)가 포함되어 있다고 말합니다. 교육에는 레이블이 지정된 데이터를 사용하여 강력한 프로세서와 고속 네트워킹이 필요한 컴퓨팅 집약적인 작업인 예측이 가능한 모델을 생성하는 작업이 수반됩니다. 추론은 훈련된 기계 학습 모델을 사용하여 예측을 수행하는 과정으로, 일반적으로 많은 소규모 컴퓨팅 작업을 동시에 처리해야 합니다. 이 작업은 NVIDIA의 강력한 GPU에 이상적입니다. AWS는 3년 전에 PXNUMX 인스턴스를 처음 출시한 ML용 인스턴스에 익숙합니다. 이것은 큰 단계였지만 추론은 ML 워크로드에 대한 운영 비용의 대부분을 차지합니다.
이 문제를 해결하기 위해 AWS는 최신 세대 NVIDIA T4 GPU, 맞춤형 4세대 Intel Xeon Scalable(Cascade Lake) 프로세서, 최대 2Gbps의 네트워킹 처리량 및 최대 100TB의 로컬 NVMe 스토리지를 활용하는 새로운 G1.8 인스턴스를 출시했습니다. 기계 학습 추론을 위한 가장 비용 효율적인 GPU 인스턴스를 제공합니다. 새로운 G4 인스턴스는 최대 65 TFLOP의 혼합 정밀도 성능을 제공할 수 있어 추론에 적합합니다. G4는 교육 시간에 덜 민감한 소규모 및 초보 수준의 기계 학습 교육 작업에 비용 효율적으로 사용할 수도 있습니다. 그래픽 집약적인 워크로드의 경우 새 인스턴스는 이전 세대 G1.8 인스턴스에 비해 최대 2배 향상된 그래픽 성능과 최대 3배의 비디오 트랜스코딩 기능을 제공합니다.
유효성
G4 인스턴스는 온디맨드, 예약 인스턴스 또는 스팟 인스턴스로 구매할 수 있습니다.