ScaleFlux는 대규모 컴퓨팅 스토리지에 고유하게 초점을 맞춥니다. 새로운 CSD(Computational Storage Device) 3000은 데이터 압축 및 압축 해제 엔진이 통합된 Gen4 SSD로 용량은 XNUMX배, 성능은 XNUMX배로 늘릴 수 있다고 회사는 말합니다. 우리는 그 주장을 시험해 볼 것입니다.
ScaleFlux는 대규모 컴퓨팅 스토리지에 고유하게 초점을 맞춥니다. 새로운 CSD(Computational Storage Device) 3000은 데이터 압축 및 압축 해제 엔진이 통합된 Gen4 SSD로 용량은 XNUMX배, 성능은 XNUMX배로 늘릴 수 있다고 회사는 말합니다. 우리는 그 주장을 시험해 볼 것입니다.
ScaleFlux CSD 3000 사양
컴퓨팅 스토리지에 대한 배경 지식은 ScaleFlux CSD 2000 검토 (여기에서 검토한 이전 버전의 CSD 3000)은 읽을만한 가치가 있습니다. 즉, 컴퓨팅 스토리지는 호스트 시스템의 컴퓨팅 리소스에 의존하는 대신 컴퓨팅 리소스를 스토리지 자체에 통합합니다.
CSD 3000의 계산 능력은 전용 하드웨어 가속 기능이 있는 맞춤형 SoC ARM 칩인 SFX 3000 스토리지 프로세서에서 나옵니다. 이 드라이브는 2.5TB, 2TB, 3.2GB 및 3.84TB 용량의 6.4인치 U.7.68 폼 팩터로 제공됩니다. CSD 4의 Gen4 인터페이스보다 개선된 PCIe Gen2000 x3 인터페이스를 사용합니다.
ScaleFlux는 유사한 드라이브인 NSD 3000을 제공합니다. 압축 기능이 내장되어 있지만 CSD 3000의 용량 배수는 없습니다.
CSD 3000의 주요 사양은 아래 표와 같습니다.
폼 팩터 | 2.5″ U.2(15mm) |
기본 용량 | 3.2TB, 3.84TB, 6.4TB, 7.68TB |
호스트 인터페이스 | PCIe 4세대 x4 |
가상화 | 15개의 가상 기능이 있는 SR-IOV |
보안
|
HW 보안 가속 기능이 있는 TCG Opal 2.0
|
SMBus를 통한 NVMe-MI 1.1
|
|
출력 | <20W 일반, <5W 유휴
|
신뢰성 | 엔드 투 엔드 데이터 경로 보호, 전력 손실
보호, LDPC 오류 수정, NAND 다이 RAID |
순차적 읽기 | 7.2 GB / 초 |
순차적 쓰기 | 4.8GB/s* |
랜덤 읽기(4kB) | 1450kIOPS |
랜덤 쓰기(4kB) | 380kIOPS* |
지속 70/30 임의 4kB 읽기/쓰기 2:1 압축 가능 Data | 1020kIOPS |
ScaleFlux CSD 3000 테스트 배경 및 유사 항목
StorageReview Enterprise Test Lab은 관리자가 실제 배포에서 경험하는 것과 유사한 환경에서 엔터프라이즈 스토리지 장치의 벤치마크를 수행하기 위한 유연한 아키텍처를 제공합니다. Enterprise Test Lab은 다양한 서버, 네트워킹, 전력 조절 및 기타 네트워크 인프라를 통합하여 직원이 실제 조건을 설정하여 검토 중에 성능을 정확하게 측정할 수 있도록 합니다.
랩 환경 및 프로토콜에 대한 이러한 세부 정보를 검토에 통합하여 IT 전문가와 스토리지 구입 책임자가 다음 결과를 달성한 조건을 이해할 수 있도록 합니다.
ScaleFlux CSD 3000 테스트베드
우리는 CSD 3000을 검토하기 위해 일반 테스트베드와 다른 시스템을 사용했습니다. 드라이브가 독특하고 다른 테스트 플랫폼이 활용되었기 때문에 기존의 Gen4 NVMe SSD와 정면으로 비교하지 않을 것입니다. 이 검토에서는 듀얼 Intel 3 프로세서가 잘 장착되어 고성능 로컬 스토리지에 스트레스를 주는 데 필요한 CPU 성능을 훨씬 능가하는 Intel OEM Scalable Gen8380 서버를 활용합니다. 높은 수준의 사양은 다음과 같습니다.
- 인텔 확장 가능 Gen2 3 8380개
- 32GB DDR32 4MHz 3200개
- Ubuntu 20.04.2 라이브 서버(합성 워크로드)
- VMware ESXi 7.0u2(애플리케이션 워크로드)
- 8 x PCI Gen4 U.2 NVMe 베이
ScaleFlux CSD 3000의 성능을 측정하기 위해 우리는 VDbench를 활용합니다. VDbench는 각 워크로드 전에 압축할 수 있는 수준을 조정할 수 있습니다. 일반적으로 이 설정은 기본적으로 0%로 유지되지만 이 SSD를 테스트할 때 압축률을 50:2로 1%로 높였습니다. 이 두 실행은 아래 차트에 반영되어 있습니다.
ScaleFlux CSD 3000 성능
주의 사항: ScaleFlux CSD 3000을 검토한 후 프로덕션 펌웨어가 포함된 두 가지 최신 모델을 받았습니다. 이 두 가지 용량 지점의 최신 결과로 검토를 업데이트했습니다.
VDBench 워크로드 분석
벤치마킹 스토리지 장치와 관련하여 애플리케이션 테스트가 가장 좋고 합성 테스트가 두 번째입니다. 실제 워크로드를 완벽하게 나타내지는 못하지만 합성 테스트는 경쟁 솔루션을 쉽게 비교할 수 있는 반복성 요소로 스토리지 장치의 기준선을 만드는 데 도움이 됩니다.
이러한 워크로드는 "포 코너" 테스트 및 일반적인 데이터베이스 전송 크기 테스트에서 다양한 VDI 환경의 추적 캡처에 이르는 다양한 테스트 프로필을 제공합니다. 이러한 테스트는 스크립팅 엔진과 함께 공통 vdBench 워크로드 생성기를 활용하여 대규모 컴퓨팅 테스트 클러스터에서 결과를 자동화하고 캡처합니다. 이를 통해 플래시 어레이 및 개별 저장 장치를 포함한 광범위한 저장 장치에서 동일한 작업 부하를 반복할 수 있습니다.
이러한 벤치마크에 대한 테스트 프로세스는 전체 드라이브 표면을 데이터로 채운 다음 드라이브 용량의 25%에 해당하는 드라이브 섹션을 분할하여 드라이브가 애플리케이션 작업 부하에 어떻게 반응하는지 시뮬레이션합니다. 이것은 드라이브의 100%를 사용하고 정상 상태로 만드는 완전한 엔트로피 테스트와 다릅니다. 결과적으로 이러한 수치는 더 높은 지속 쓰기 속도를 반영합니다.
프로필 :
- 4K 임의 읽기: 100% 읽기, 128 스레드, 0-120% iorate
- 4K 임의 쓰기: 100% 쓰기, 64 스레드, 0-120% iorate
- 64K 순차 읽기: 100% 읽기, 16 스레드, 0-120% iorate
- 64K 순차 쓰기: 100% 쓰기, 8개 스레드, 0-120% 속도
- 합성 데이터베이스: SQL 및 Oracle
- VDI 전체 클론 및 연결된 클론 추적
이 드라이브의 고유성은 드라이브 자체와만 비교할 것임을 의미합니다. 비교를 위해 VDBench가 비압축 데이터와 3000:2 압축 데이터를 전송하는 ScaleFlux CSD 1을 살펴보겠습니다.
첫 번째 벤치마크인 4K 랜덤 읽기에서 CSD 3000의 압축 성능은 909TB 모델(139TB 모델은 다른 모델보다 약간 뒤떨어짐)의 경우 대기 시간이 7.68µs인 3.85K IOPS까지 꾸준히 상승했습니다. 드라이브는 압축 없이 약간 느려졌고 동일한 용량으로 886µs에서 142.4K IOPS를 기록했습니다.
압축되지 않은 CSD 3000은 다음 테스트인 4K 랜덤 쓰기에서 롤러코스터와 같은 곡선을 나타냈으며, 7.68TB 모델은 454µs 대기 시간과 함께 275.7K IOPS에서 정점에 도달하여 두 모델 중 최상의 결과를 보여주었습니다. 압축된 드라이브는 약 735K IOPS와 168.2µs로 끝나는 훨씬 더 나은 결과를 보여주었습니다.
순차적인 64K 테스트로 넘어가서 비슷한 이야기를 하는 읽기 성능부터 시작합니다(압축 드라이브는 다시 인상적인 수치를 나타냄). 두 용량 모두 거의 동일한 성능을 보였으며 3.84TB 모델이 113µs에서 더 높은 용량인 7.06K IOPS(또는 282GB/s)를 약간 능가했습니다. 압축되지 않은 상위 드라이브(7.68TB)는 98µs에서 326.8K IOPS에 도달했습니다.
64K 순차 쓰기 결과는 압축 버전에서 훨씬 더 좋았습니다. 두 용량 모두 동일한 성능을 보였습니다(보시다시피 3.84TB는 96µs 대기 시간에서 154K IOPS로 더 큰 용량을 약간 능가했으며 100K IOPS에 도달할 때까지 90µs 미만을 유지했습니다. 반대로 압축되지 않은 드라이브는 29TB 용량의 경우 534µs에서 7,68K IOPS로, 25TB 용량의 경우 616.6µs에서 3.85K IOPS로 심각한 스파이크가 발생했습니다.
다음 테스트 세트는 SQL, SQL 90-10 및 SQL 80-20과 같은 SQL 워크로드입니다. SQL 워크로드 테스트가 먼저입니다. CSD 3000은 고용량 모델로 압축했을 때와 압축하지 않았을 때 비슷한 곡선을 보여주지만, 압축된 버전은 대기 시간이 310µs인 101.9K IOPS로 약간 더 나았습니다.
SQL 90-10에서는 7.68TB 압축 CSD 3000이 다시 한 번 최고 성능 드라이브였으며 311K IOPS와 101.3µs의 대기 시간으로 테스트를 완료했습니다. 이에 비해 압축되지 않은 최고의 드라이브(역시 7.68TB)는 285K IOPS와 110.8µs의 대기 시간으로 마무리되었습니다.
SQL 80-20에서 우리는 압축된 CSD 3000의 두 용량이 모두 최고의 자리를 차지하는 것을 볼 수 있으며, 7.68TB 모델은 319µs 대기 시간에서 98.3 IOPS로 끝납니다. 압축되지 않은 7.68TB는 277µs에서 113.5K IOPS로 눈에 띄게 뒤쳐졌습니다(소용량 모델에 매우 가깝지만).
다음은 Oracle 워크로드인 Oracle, Oracle 90-10 및 Oracle 80-20입니다. 여기에서 압축된 CSD 3000 드라이브는 전반적으로 우수한 성능을 계속 유지했습니다. Oracle 워크로드 테스트를 시작으로 가장 좋은 결과는 대기 시간이 7.68µs인 336K IOPS의 103.9TB 압축 드라이브였습니다. 압축된 7.68TB 드라이브는 279µs 대기 시간과 함께 126K IOPS로 정점을 찍었습니다.
Oracle 90-10에서; 압축된 7.86TB 드라이브는 229µs 대기 시간에서 94.7K IOPS로 완료되었습니다. 3.84TB(압축) 및 7.68TB(비압축) 드라이브는 대기 시간 214µs에서 101.4K IOPS로 동일한 성능을 보여주었습니다.
Oracle 80-20으로 이동하면 비슷한 이야기가 다시 한 번 나옵니다. 압축되지 않은 7.68TB 드라이브는 대기 시간이 237µs인 91K IOPS에서 완료되었으며, 7.68TB 압축 드라이브는 대기 시간이 213µs에 불과한 101.9 IOPS로 그 뒤를 이었습니다.
다음으로 VDI 클론 테스트인 전체 클론(FC) 및 연결된 클론(LC)으로 전환했습니다. 모든 드라이브는 VDI FC 부트에서 경미한 말단 불안정성을 보였습니다. 압축된 7.68TB CSD 3000은 대기 시간이 270µs인 126.9K IOPS로 다시 7.68위를 차지했습니다. 3.84TB 드라이브(실제로 242TB 압축 드라이브를 능가함)의 최고 성능 용량은 141.9µs의 대기 시간에서 XNUMXK IOPS를 제공합니다.
VDI FC 초기 로그인은 압축된 드라이브가 훨씬 더 나은 반면 압축되지 않은 드라이브는 모든 곳에 있었기 때문에 다른 이야기를 합니다. 7.68TB 압축 드라이브는 대기 시간이 244µs인 117.2K IOPS에서 정점을 찍은 반면, 3.84TB 모델은 대기 시간이 210µs인 137.2K IOPS로 정점을 찍었습니다. 압축되지 않은 드라이브는 대기 시간이 127µs(231.1TB)인 7.68K IOPS와 대기 시간이 94µs(312.4TB)인 3.84K IOPS에서 완료되었습니다.
압축된 CSD 3000은 마지막 FC 테스트인 Monday Login에서 계속 깊은 인상을 남겼습니다. 최고 수치는 대기 시간이 144µs(106.9TB)인 7.68K IOPS였습니다. 압축되지 않은 7.68TB 드라이브는 100µs의 대기 시간으로 154.6K IOPS를 보여주었습니다.
이제 부팅 테스트에서 모든 드라이브가 안정적인 라인을 보인 LC 테스트로 전환하겠습니다. 압축 드라이브는 계속 우위를 점했습니다(특히 7.68K IOPS와 131µs의 대기 시간을 기록한 120.1TB). 압축되지 않은 상위 드라이브(7.68TB)는 110µs에서 144.4 IOPS에 도달할 수 있었습니다.
LC 초기 로그인에서 압축되지 않은 드라이브의 불안정한 동작이 20,000 IOPS에 가까워지는 것을 볼 수 있습니다. 최종 수치는 49K IOPS/157.1µs(3.84TB) 및 56K IOPS/138µs(7.68TB)였습니다. 언제나처럼 압축 드라이브는 더 나은 성능과 안정성을 보여 73K IOPS/103.1µs(3.84TB) 및 80K IOPS/94.4µs(7.68TB)에서 테스트를 완료했습니다.
마지막 테스트에서 압축되지 않은 드라이브는 여전히 압축된 버전에 비해 성능이 떨어지는 것으로 나타났습니다. LC Monday Login에서 다시 압축 드라이브에 대한 몇 가지 이상한 대기 시간 스파이크를 보여 주었고, 3.84TB 및 7.68TB는 각각 62K IOPS/250.1µs 및 75K IOPS/207.5µs에서 완료되었습니다. 압축 드라이브의 최종 수치는 109K IOPS/140.9µs(3.84TB) 및 124K IOPS/123.5µs(7.68TB)로 훨씬 뛰어났습니다.
결론
ScaleFlux는 컴퓨팅 스토리지에 계속 집중하고 있습니다. 이 리뷰에서 살펴본 CSD 3000 드라이브는 주로 PCIe Gen2000 인터페이스를 제공하여 이전 CSD 4에서 개선되어 훨씬 더 높은 성능 잠재력을 제공합니다.
인텔 OEM Gen3000 확장 가능 서버의 Linux에서 CSD 3을 비압축 상태로 테스트하고 다시 2:1 압축 상태로 테스트하여 드라이브의 온보드 압축 엔진을 활용했습니다. 이 드라이브는 압축 가능한 데이터를 사용한 모든 테스트에서 우수한 성능과 짧은 대기 시간을 보여 주었으며 종종 두 자릿수 성능 델타를 나타냈습니다.
압축 데이터의 성능 하이라이트(최고 결과/용량)에는 909TB의 경우 4K 임의 읽기에서 7.68K IOPS(비압축 시 886K IOPS), 735TB의 경우 4K 임의 쓰기에서 7.68K IOPS(비압축 시 454K IOPS), 7.06TB의 경우 64K 순차 읽기(3.85GB/s 비압축) 및 6.12K 순차 쓰기의 경우 6GB/s(64GB/s 비압축).
CSD 3000은 SQL 및 Oracle 테스트에서 유사한 압축 및 비압축 수치를 보여주었지만 압축 드라이브가 더 일관적이었습니다. 한 가지 예인 SQL 80-20에서 압축 드라이브는 대기 시간 319µs(98.3TB 모델)에서 7.68 IOPS를 달성한 반면 비압축 모델은 277µs에서 113.5K IOPS로 눈에 띄게 뒤처졌습니다.
마지막으로 VDI Full 및 Linked 클론 테스트에서 CSD 3000 실행 압축 데이터와 비압축 데이터 간에 가장 눈에 띄는 차이가 나타났습니다. 즉, 압축 데이터가 훨씬 더 우수하고 일관되게 수행되었습니다. 예를 들면, VDI LC 초기 로그인은 49K IOPS/157.1µs(3.84TB) 및 56K IOPS/138µs(7.68TB)의 최고 성능을 가진 비압축 드라이브를 보여 주었고 압축 드라이브는 73K IOPS/103.1µs( 3.84TB) 및 80K IOPS/94.4µs(7.68TB).
주의할 점은 압축되지 않은 데이터를 실행하는 동안 설명할 수 없는 대기 시간 급증과 성능 저하를 확인했습니다. 이는 4K/64K, SQL/Oracle 및 VDI FC/LC 테스트에서 발생했기 때문에 하나의 시나리오에만 국한되지 않았습니다.
CSD3000의 강점은 일부 압축 가능한 데이터로 작업할 수 있을 때 가장 잘 드러날 것입니다. 여기에서 기존 SSD에 비해 전반적으로 가장 중요한 이점이 있습니다. ScaleFlux는 또한 이 버전에서 VMWare 지원을 추가했는데, 이전 CSD 2000을 검토할 때는 없었습니다. 이는 큰 장점이지만 여전히 Windows 가상화에 대한 지원이 없습니다. 그럼에도 불구하고 ScaleFlux의 CSD 3000은 플랫폼 지원 및 드라이브의 상당한 압축 강도로 워크로드를 정렬할 수 있는지 고려할 가치가 있습니다.
StorageReview에 참여
뉴스레터 | 유튜브 | 팟캐스트 iTunes/스포티 파이 | 인스타그램 | 트위터 | 틱톡 서비스 | RSS 피드