올해 ISC Digital에서 NVIDIA는 A100 GPU. 이와 함께 슈퍼컴퓨팅을 위한 새로운 AI 플랫폼인 NVIDIA Mellanox UFM Cyber-AI Platform을 발표했습니다. 그리고 NVIDIA는 또 다른 벤치마크를 무너뜨렸습니다.
올해 ISC Digital에서 NVIDIA는 A100 GPU. 이와 함께 슈퍼컴퓨팅을 위한 새로운 AI 플랫폼인 NVIDIA Mellanox UFM Cyber-AI Platform을 발표했습니다. 그리고 NVIDIA는 또 다른 벤치마크를 무너뜨렸습니다.
지난 달 NVIDIA는 새로운 Ampere 아키텍처와 7nm GPU인 NVIDIA A100을 발표했습니다. 회사는 동시에 자체 A100 시스템을 출시했습니다. NVIDIA는 A100용 PCIe 폼 팩터를 발표하여 모든 상위 벤더가 자체 버전의 A100을 출시할 수 있도록 했습니다. 이러한 공급업체 및 해당 시스템에는 다음이 포함됩니다.
- ASUS는 단일 서버에서 4000개의 A10 PCIe GPU로 구성할 수 있는 ESC100A-EXNUMX을 제공할 예정입니다.
- Atos는 2415개의 NVIDIA A100 Tensor Core GPU가 장착된 BullSequana XXNUMX 시스템을 제공합니다.
- Cisco는 Cisco 통합 컴퓨팅 시스템 서버와 하이퍼컨버지드 인프라 시스템인 Cisco HyperFlex에서 NVIDIA A100 Tensor Core GPU를 지원할 계획입니다.
- Dell Technologies는 다양한 제품에서 다른 NVIDIA GPU 가속기, 소프트웨어 및 기술을 지원하는 것처럼 에지에서 코어, 클라우드에 이르기까지 워크로드를 가속화하는 PowerEdge 서버 및 솔루션 전반에서 NVIDIA A100 Tensor Core GPU를 지원할 계획입니다.
- Fujitsu는 PRIMERGY 서버 라인에 A100 GPU를 도입하고 있습니다.
- GIGABYTE는 최대 481개의 A0 PCIe GPU를 지원하는 G492-HA50, G492-Z51 및 G10-Z100 서버를 제공하고 G292-Z40 서버는 최대 XNUMX개를 지원합니다.
- HPE는 HPE ProLiant DL100 Gen380 서버에서 A10 PCIe GPU를 지원하고 HPE Apollo 6500 Gen10 시스템에서 가속화된 HPC 및 AI 워크로드를 지원합니다.
- Inspur는 A100 PCIe GPU를 사용하는 NF5468M5, NF5468M6 및 NF5468A5, 100방향 NVLink를 사용하는 NF5488M5-D, NF5488A5, NF5488M6 및 NF5688M6, 5888방향 NVLink를 사용하는 NF6M16을 포함하여 XNUMX개의 NVIDIA AXNUMX 기반 시스템을 출시합니다.
- Lenovo는 Lenovo ThinkSystem SR100 AI 지원 서버를 포함한 일부 시스템에서 A670 PCIe GPU를 지원할 예정입니다. Lenovo는 가을에 ThinkSystem 및 ThinkAgile 포트폴리오 전반에 걸쳐 가용성을 확장할 예정입니다.
- One Stop Systems는 AI 및 HPC 고객이 Gen 4 서버를 확장할 수 있도록 최대 4개의 NVIDIA A100 PCIe GPU가 포함된 OSS 4UV Gen XNUMX PCIe 확장 시스템을 제공합니다.
- Quanta/QCT는 최대 52개의 NVIDIA A2 PCIe GPU를 지원하는 D43BV-2U, D52KQ-4U 및 D100G-XNUMXU를 포함한 여러 QuantaGrid 서버 시스템을 제공합니다.
- 슈퍼마이크로는 다른 4U, 100U 및 4.0U GPU 서버와 함께 최대 1개의 NVIDIA A2 PCIe GPU와 최대 4개의 추가 고성능 PCI-E XNUMX 확장 슬롯을 지원하는 XNUMXU A+ GPU 시스템을 제공할 예정입니다.
가동 중지 시간은 모든 데이터 센터를 괴롭힐 수 있지만 슈퍼컴퓨팅 데이터 센터에서 더 심각하게 나타날 수 있습니다. NVIDIA는 NVIDIA Mellanox UFM 사이버 AI 플랫폼을 출시하여 InfiniBand 데이터 센터의 가동 중지 시간을 최소화하고자 합니다. 이름에서 알 수 있듯이 플랫폼은 UFM 포트폴리오의 확장이며 AI를 활용하여 보안 위협 및 운영 문제를 탐지하고 네트워크 장애를 예측합니다. 플랫폼은 문제와 위협(해커 포함)을 감지할 뿐만 아니라 문제를 해결하기 위해 자동으로 시정 조치를 취합니다.
NVIDIA는 TPCx-BB로 알려진 빅 데이터 분석을 둘러싼 또 다른 벤치마크를 무너뜨릴 수 있었다고 자랑스럽게 발표했습니다. NVIDIA는 16개의 NVIDIA DGX A100 시스템으로 구동되는 오픈 소스 데이터 사이언스 소프트웨어 라이브러리의 RAPIDS 제품군을 사용했습니다. 이전 기록인 14.5시간에 비해 4.7분 만에 벤치마크를 실행할 수 있었습니다. 또는 19.5배 더 빠름
StorageReview에 참여
뉴스레터 | 유튜브 | 팟캐스트 iTunes/스포티 파이 | 인스타그램 | 트위터 | 페이스북 | RSS 피드