우리는 Graid SupremeRAID 카드와 소프트웨어를 여러 번 살펴보았고 Graid가 가능하게 하는 최고의 스토리지 성능에 끊임없이 깊은 인상을 받았습니다. 기존 하드웨어와 소프트웨어 RAID 모두 성능 측면에서 아쉬운 점이 많으므로 Graid가 더 나은 쥐덫을 제공할 수 있는 기회가 열립니다. 현재 Gen5 SSD가 대량으로 출시됨에 따라 우리는 플래시를 사용했을 때 무엇이 가능한지 알아보기 위해 잘 갖춰진 서버를 구성했습니다.
우리는 Graid SupremeRAID 카드와 소프트웨어를 여러 번 살펴보았고 Graid가 가능하게 하는 최고의 스토리지 성능에 끊임없이 깊은 인상을 받았습니다. 기존 하드웨어와 소프트웨어 RAID 모두 성능 측면에서 아쉬운 점이 많으므로 Graid가 더 나은 쥐덫을 제공할 수 있는 기회가 열립니다. 현재 Gen5 SSD가 대량으로 출시됨에 따라 우리는 플래시를 사용했을 때 무엇이 가능한지 알아보기 위해 잘 갖춰진 서버를 구성했습니다.
왜 Graid SupremeRAID와 하드웨어 RAID가 맞나요?
Graid 솔루션은 GPU와 SDS(소프트웨어 정의 스토리지) 스택이라는 두 가지 핵심 요소로 구성됩니다. RAID 카드와 마찬가지로 GPU는 대부분의 드라이브 관리 및 데이터 보호 작업을 CPU에서 맡아 애플리케이션을 실행할 수 있도록 해줍니다. 그러나 RAID 카드와 달리 SupremeRAID는 훨씬 더 효율적입니다. 추가 케이블 연결이나 복잡한 섀시 구성 없이 PCIe BUS를 통해 직접 드라이브를 처리합니다. 그리고 GPU는 RAID 카드의 ASIC보다 더 동적이기 때문에 Graid를 사용한 성능 확장이 크게 향상됩니다.
서버 내에서 병목 현상이 발생하는 위치를 살펴보면 확장의 이점이 즉시 드러납니다. 현재 RAID 카드는 Gen4로 제한되어 있으며 최고 속도는 28GB/s입니다. 괜찮은 Gen4 SSD 24개가 단일 RAID 카드를 포화시킬 수 있습니다. 32베이 서버의 모든 드라이브를 활용하려면 시스템에 여러 개의 RAID 카드가 필요합니다. 반면 SupremeRAID는 단일 시스템에서 XNUMX개의 드라이브를 지원할 수 있으며 PCIe 슬롯 대역폭 제한이 없습니다.
하드웨어 RAID의 성능 문제는 각 세대의 인터페이스 도약으로 인해 더욱 복잡해집니다. Gen5 SSD를 지원하려면 새로운 하드웨어 RAID ASIC이 필요합니다. 그러나 그럼에도 불구하고 하드웨어 RAID는 위에서 설명한 것과 동일한 확장 문제로 어려움을 겪습니다. SupremeRAID GPU는 현재 Gen4 인터페이스를 사용하며 공정하게 말하면 현재로서는 Intel/AMD/NVIDIA 문제일 뿐입니다. 하지만 이것이 Gen5 드라이브의 성능을 발휘하는 것을 막지는 못합니다. 이는 최대 260GB/s 및 28M IOPS의 성능 수준을 의미합니다. Gen5 GPU가 시장에 출시되면 Graid는 IOPS 수치를 더욱 향상시킬 수 있습니다.
Graid GPU에 대한 마지막 참고 사항: 오늘날 대부분의 구현은 Graid GPU에 있습니다. SR-1010 NVIDIA A2000 GPU를 활용하는 제품입니다. Graid는 SupremeRAID를 위해 비싸거나 찾기 어려운 GPU가 필요하지 않으며 외부 전원을 사용하는 GPU도 필요하지 않습니다. 어떤 이유로 사용자가 대체 카드를 선호하는 경우 Graid의 소프트웨어는 우리 실험실에서 A2에서 테스트한 거의 모든 NVIDIA 실리콘에서 실행되어 탁월한 결과를 얻었습니다. 어떤 경우에도 GPU는 설치가 쉽고 추가 배터리가 필요하지 않습니다.
Graid SupremeRAID와 소프트웨어 RAID를 비교하는 이유는 무엇입니까?
소프트웨어 RAID는 초기 NVMe RAID 카드의 비용, 복잡성 및 적당한 성능으로 인해 최근 몇 년간 인기를 얻었습니다. NVMe SSD를 그룹화하고 온라인으로 만드는 빠르고 쉬운 방법이 필요할 때 Windows 저장소 공간, Linux MD 또는 ZFS RAIDZ를 배포하는 것은 유죄입니다. 그러나 하드웨어 가속을 사용하지 않는 모든 스토리지 소프트웨어와 마찬가지로 비용이 듭니다. 호스트 CPU는 드라이브 관리 및 데이터 보호를 실행하여 애플리케이션의 주기를 줄여야 합니다. Graid의 GPU 기반 제품에는 이러한 제한이 없으므로 서버의 스토리지와 애플리케이션 모두에 대해 최상의 성능을 보장합니다.
또한 소프트웨어 RAID를 사용하면 운영 체제 선택에 따라 선택이 제한됩니다. Graid는 XNUMX개 이상의 Linux 배포판과 Windows를 포함하여 거의 모든 환경에서 실행됩니다. 공평하게 말하면 Graid는 소프트웨어 RAID보다 작동하기가 약간 더 무겁습니다. GPU는 시스템에 설치되어야 하며 추가 노력은 거의 무시할 수 있습니다. 하지만 아래에서 볼 수 있듯이 수익은 놀랍습니다. 우리는 소프트웨어 RAID에 비해 SupremeRAID를 사용하는 규모에 대해 이야기하고 있습니다.
Graid SupremeRAID Gen5 성능
이 테스트를 위해 우리는 AMD EPYC 2125 CPU 9654개, 384GB DRAM 및 24TB 3.84개를 갖춘 Supermicro AS-XNUMXHS-TNR 서버를 구성했습니다. KIOXIA의 CM7-R Gen5 SSD.
SW RAID와 Graid 모두에 대해 드라이브를 RAID5 구성으로 구성했습니다. 스트라이프 크기의 경우 Graid에는 4K 스트라이프를, mdadm에는 4K, 64K 및 512K 청크를 사용했습니다. 최적화된 구성에서 최대 4K 전송 속도를 보여주고 최상의 상태에서 최대 대형 블록 대역폭을 표시하려면 소프트웨어 RAID의 다양한 청크 크기가 필요했습니다. 이는 성능 저하 없이 다양한 블록 크기를 처리하는 Graid에게는 그다지 중요하지 않았습니다.
- 서버: 슈퍼마이크로 AS-2125HS-TNR
- CPU: 2 x AMD EPYC 9654 96코어 프로세서 x 2
- 메모리: 24 x 삼성 M321R2GA3BB6-CQKVS DDR5 4800MT/s 16GB x 24
- NVMe 드라이브: 24 x KIOXIA CM7-R 3.84T KCMY1RUG3T84 x 24
- RAID 컨트롤러: SupremeRAID SR-1010
- SupremeRAID Driver: 1.5.0-659.g10e76f72.010
- 리눅스 OS: 우분투 22.04.1 LTS
RAID 5 FIO 성능 |
||||
Test | SW RAID5 4KB 청크 |
SW RAID5 64K 청크 |
SW RAID5 512K 청크 |
SupremeRAID 4KB 스트라이프 |
1MB 순차 쓰기(192T/16Q) | 1.22GB / s | 3.51GB / s | 801MB / s의 | 148GB / s |
1MB 순차 읽기(192T/16Q) | 21.8GB / s | 279GB / s | 235GB / s | 279GB / s |
64K 랜덤 쓰기(192T/16Q) | 822MB / s의 | 627MB / s의 | 795MB / s의 | 30.2GB / s |
4K 랜덤 쓰기(192T/32Q) | 49.8k IOPS(61.6ms) | 205k IOPS(15.01ms) | 78.7k IOPS(39ms) | 2.02만 IOPS(1.52ms) |
4K 랜덤 읽기(192T/32Q) | 5.6만 IOPS(1.1ms) | 5.5만 IOPS(1.11ms) | 5.53만 IOPS(1.11ms) | 28.5만 IOPS(22ms) |
소프트웨어 RAID와 Graid의 성능을 비교하는 것은 매우 놀라운 일이었습니다. 최대 대역폭 측면에서 우리는 이 평가 중에 mdadm 청크 크기를 4K에서 64K 및 512K로 늘렸습니다. 4K에서는 최대 읽기 대역폭이 낮기 때문입니다. Mdadm은 전반적으로 훌륭하지는 않았지만 가장 높은 순차 읽기 속도는 64K 청크 크기로 279GB/s로 Graid HW RAID 구성의 속도와 일치했습니다. SW RAID의 순차 쓰기 성능은 3.51K 청크 크기에서 64GB/s를 기록했지만 이는 148GB/s를 측정한 Graid에 비하면 아무것도 아닙니다.
64K의 대규모 블록 무작위 쓰기 전송으로 전환한 SW RAID의 범위는 627MB/s ~ 822MB/s인 반면 Graid는 30.2GB/s로 이를 대폭 초과했습니다.
마지막 영역에서는 무작위 4K 전송 속도를 살펴보며 4K 청크 크기에서 가장 큰 SW RAID 성능을 측정했으며, 5.6ms에서 1.1M IOPS를 측정했습니다. Graid는 동일한 테스트에서 인상적인 28.5만 IOPS를 기록했습니다. 4K 쓰기 속도는 64ms에서 205M IOPS를 제공하는 Graid와 비교하여 15.01ms에서 2.02k IOPS를 측정하는 1.52K 청크에서 최고의 SW RAID 성능을 보였습니다.
최종 생각
우리는 전용 하드웨어 카드부터 다양한 소프트웨어 기반 솔루션에 이르기까지 거의 모든 최신 RAID 유형을 직접 사용해 보았습니다. 또한 세 가지 GPU, 다양한 SSD 미디어 유형 및 NVMe 인터페이스에서 Graid 솔루션을 여러 번 테스트했습니다. 공평하게 말하자면, 백업 및 복구, 대규모 데이터 레이크, 파일 공유 등 심각한 성능 요구 사항이 없는 많은 데이터 세트는 이러한 솔루션에 완벽하게 만족할 것입니다. 그러나 애플리케이션이 기본 플래시에 대한 완전한 액세스가 필요한 경우 Graid는 완전히 다른 수준에서 재생됩니다.
대부분의 고객은 NVMe 하드웨어를 보고 무슨 일이 있어도 성능이 뛰어날 것이라고 가정하지만, 드라이브가 결합되면 해당 시스템이 어떻게 작동할지 이해하고 그 위에 RAID 레이어를 추가하는 것이 중요합니다. Linux 환경에서 소프트웨어 RAID는 NVMe 장치, 특히 Gen5 SSD를 따라잡는 데 실제로 한계를 보여줍니다.
개별 드라이브 성능은 강력하지만 모든 RAID 솔루션이 가장 적합한 것은 아닙니다. 최적화된 구성을 서로 비교해 보면 Graid는 279개의 KIOXIA CM148-R Gen24 SSD 전체에서 7GB/s 읽기 및 5GB/s 쓰기가 넘는 대역폭을 제공한 반면, SW RAID는 279GB/s 읽기 및 3.51GB/s 쓰기를 관리했습니다. 4K 무작위 전송에서는 Graid에서 놀라운 28.5만 IOPS 읽기와 2.02만 IOPS 쓰기를 확인했으며, SW RAID는 단 5.6만 IOPS 읽기 및 205 IOPS 쓰기를 제공했습니다. SW RAID는 일부 환경에서는 "충분히 빠를" 수 있지만 가능한 최고 성능 수준을 요구하는 환경에서는 Graid의 SupremeRAID와 거의 비교할 수 없습니다.
이와 같은 단일 호스트에서 NVMe SSD 성능을 극대화하기 위해 Graid SupremeRAID Gen5 솔루션을 건드릴 수 있는 제품은 시장에서 본 적이 없습니다. 정말 환상적입니다. 이 테스트에서는 저렴한 NVIDIA A2000 GPU에서 작업을 수행하고 있습니다. Gen5 플래시에 대한 투자를 극대화하려는 조직이라면 Graid PoC를 통해 기술이 얼마나 영향력이 있는지 확인하는 것이 현명할 것입니다.
StorageReview에 참여
뉴스레터 | 유튜브 | 팟캐스트 iTunes/스포티 파이 | 인스타그램 | 트위터 | 틱톡 서비스 | RSS 피드