NVMe SSD는 전반적으로 최고의 성능을 발휘했습니다. 그들은 SAS 및 SATA 드라이브에 대한 엄청난 도약과 한계를 만들어 시작했지만 최근 몇 년 동안 반복할 때마다 조금씩 더 많은 성능을 끌어내고 있습니다. PCIe 3.0에는 상한선이 있으며 현재 드라이브가 상한선에 도달하고 있습니다. 그러나 이제 7002세대 AMD EPYC 4.0 CPU와 함께 PCIe 6이 등장했고 KIOXIA는 이를 CMXNUMX SSD와 함께 활용하고 있습니다.
NVMe SSD는 전반적으로 최고의 성능을 발휘했습니다. 그들은 SAS 및 SATA 드라이브에 대한 엄청난 도약과 한계를 만들어 시작했지만 최근 몇 년 동안 반복할 때마다 조금씩 더 많은 성능을 끌어내고 있습니다. PCIe 3.0에는 상한선이 있으며 현재 드라이브가 상한선에 도달하고 있습니다. 하지만 이제 XNUMX세대 AMD EPYC 7002 CPU, PCIe 4.0이 출시되었으며 KIOXIA는 이를 CM6 SSD와 함께 활용하고 있습니다.
KIOXIA는 지난 플래시 메모리 서밋에서 데모로 새로운 PCIe 4.0 드라이브인 CM6 및 CD6를 발표했습니다. 당시 이들은 최초의 PCIe 4.0 SSD였으며 이 글을 쓰는 시점에서 CM6 SSD 시리즈는 엔터프라이즈용 PCIe 4.0 SSD만 있다면 여전히 몇 안 되는 제품 중 하나일 수 있습니다. 새로운 드라이브의 가장 큰 장점은 더 높은 성능이 될 것입니다. 최대 6.9GB/s 및 1.4만 IOPS 읽기에 도달하는 것으로 인용됩니다. 그것들은 인상적인 이론적 수치입니다. 이 드라이브는 대역 내 NVMe-MI, 영구 이벤트 로그 및 네임스페이스 세분성도 함께 제공됩니다.
KIOXIA CM6은 U.3 폼 팩터이며 SFF-TA-1001을 준수하므로 6중 모드 지원 백플레인에서 사용할 수 있습니다. CM800은 30.72GB에서 6TB까지 다양한 용량으로 제공됩니다. 드라이브는 사용자의 필요에 따라 읽기 집약적(CM6-R) 및 혼합 사용(CM140-V) 버전으로 제공됩니다. 사용 사례별 모델 외에도 SIE(Sanitize Instat Erase), SED(Self-Encrypting Drive) 및 FIPS 2-2(Level XNUMX) 모델을 비롯한 다양한 보안 버전이 있습니다. 드라이브는 이중 포트로 되어 있어 고가용성도 제공합니다.
이 리뷰에서는 6TB 용량의 KIOXIA CM6.4-V를 살펴보고 있습니다.
KIOXIA CM6 PCIe 4.0 사양
모델 | CM6-R(읽기 집약적) | CM6-V(혼합 사용) |
폼 팩터 | 2.5인치 15mm Z 높이 | |
용량 1 | 960GB, 1.92TB, 3.84TB, 7.68TB, 15.36TB, 30.72TB | 800GB, 1.6TB, 3.2TB, 6.4TB, 12.8TB |
인터페이스 | PCIe Gen3 / 4, 1×4 및 2×2 | |
규정 준수 | PCIe 4.0 및 NVMe 1.4 | |
NAND 형 | KIOXIA BiCS FLASH96단 3D TLC | |
순차적 읽기 | Gen3 = 최대 3,500MB/s Gen4 = 최대 6,900MB/s |
Gen3 = 최대 3,500MB/s Gen4 = 최대 6,900MB/s |
순차적 쓰기 | Gen3 = 최대 3,100MB/s Gen4 = 최대 4,200MB/s |
Gen3 = 최대 3,100MB/s Gen4 = 최대 4,200MB/s |
무작위 읽기 | Gen3 = 최대 800K IOPS Gen4 = 최대 1.4만 IOPS |
Gen3 = 최대 800K IOPS Gen4 = 최대 1.4만 IOPS |
임의 쓰기 | Gen3 = 최대 155K IOPS Gen4 = 최대 170K IOPS |
Gen3 = 최대 290K IOPS Gen4 = 최대 350K IOPS |
전력 소비 | 활성: 20W; 유휴: <5W | |
지구력 | 1년간 5 DWPD | 3년간 5 DWPD |
수정할 수 없는 BER | 1^10비트 읽기당 17섹터 | |
MTTF / AFR | 2.5만 시간 / 0.35% | |
작동 온도 | 0 ~ 70C |
퍼포먼스
테스트베드
우리의 새로운 PCIe Gen4 기업용 SSD 리뷰는 레노버 씽크시스템 SR635 애플리케이션 테스트 및 합성 벤치마크용. ThinkSystem SR635는 잘 갖춰진 단일 CPU AMD 플랫폼으로, 고성능 로컬 스토리지에 스트레스를 주는 데 필요한 것보다 훨씬 더 많은 CPU 성능을 제공합니다. 또한 PCIe Gen4 U.2 베이가 있는 우리 연구실의 유일한 플랫폼(현재 시장에 나와 있는 몇 안 되는 플랫폼 중 하나)이기도 합니다. 합성 테스트는 많은 CPU 리소스를 필요로 하지 않지만 여전히 동일한 Lenovo 플랫폼을 활용합니다. 두 경우 모두 스토리지 공급업체의 최대 드라이브 사양과 일치하는 최상의 조명에서 로컬 스토리지를 보여주기 위한 것입니다.
PCIe Gen4 합성 및 애플리케이션 플랫폼(Lenovo ThinkSystem SR635)
- 1 x AMD 7452(2.35GHz x 32코어)
- 8GB DDR64-4MHz ECC DRAM 3200개
- 센트OS 7.7 1908
- ESXi 6.7u3
PCIe Gen3 애플리케이션 플랫폼(레노버 씽크시스템 SR850)
- 4 x Intel Platinum 8160 CPU(2.1GHz x 24코어)
- 16 x 32GB DDR4-2666Mhz ECC DRAM
- RAID 2-930i 8Gb/s RAID 카드 12개
- NVMe 베이 8개
- VM웨어 ESXI 6.7u3
PCIe Gen3 합성 플랫폼(델 파워에지 R740xd)
- Intel Gold 2 CPU 6130개(2.1GHz x 16코어)
- 4GB DDR16-4MHz ECC DRAM 2666개
- 1x PERC 730 2GB 12Gb/s RAID 카드
- 애드인 NVMe 어댑터
- 우분투-16.04.3-데스크탑-amd64
새로운 플랫폼에 대한 첫 번째 리뷰 세트로서 우리는 과거 드라이브 결과를 포함시켰습니다. 이전 플랫폼에서 테스트했기 때문에 유사하지만 100% 사과 대 사과 비교는 아닙니다. 우리의 합성 테스트 차이는 결과에 큰 왜곡이 없지만 단일 CPU AMD 플랫폼과 쿼드 CPU Intel 플랫폼에서 작동하는 애플리케이션 워크로드는 어느 정도 있을 수 있습니다. MySQL 테스트에서 새로운 Gen4 KIOXIA 제품 중 하나가 선두를 차지했지만 SQL 서버 대기 시간은 평균이었습니다. 단 4개의 GenXNUMX 드라이브로 주변에 게시할 수 있었던 상당한 양의 비교 가능한 데이터가 없지만 이러한 결과를 볼 때 참고해야 할 사항입니다. 또한 더 빠른 SSD를 활용하기 위해 합성 테스트를 강화했으며 이제 더 높은 피크 스레드 수로 테스트 결과를 보여줍니다.
테스트 배경 및 유사 항목
The StorageReview 엔터프라이즈 테스트 랩 관리자가 실제 배포에서 경험하는 것과 유사한 환경에서 엔터프라이즈 스토리지 장치의 벤치마크를 수행하기 위한 유연한 아키텍처를 제공합니다. Enterprise Test Lab은 다양한 서버, 네트워킹, 전력 조절 및 기타 네트워크 인프라를 통합하여 직원이 실제 조건을 설정하여 검토 중에 성능을 정확하게 측정할 수 있도록 합니다.
랩 환경 및 프로토콜에 대한 이러한 세부 정보를 검토에 통합하여 IT 전문가와 스토리지 구입 책임자가 다음 결과를 달성한 조건을 이해할 수 있도록 합니다. 우리의 리뷰는 우리가 테스트하는 장비 제조업체에서 비용을 지불하거나 감독하지 않습니다. 에 대한 추가 세부 정보 StorageReview 엔터프라이즈 테스트 랩 네트워킹 기능에 대한 개요는 해당 페이지에서 확인할 수 있습니다.
애플리케이션 워크로드 분석
엔터프라이즈 스토리지 장치의 성능 특성을 이해하려면 라이브 프로덕션 환경에서 발견되는 인프라 및 애플리케이션 워크로드를 모델링하는 것이 필수적입니다. 따라서 KIOXIA CM6에 대한 우리의 벤치마크는 SysBench를 통한 MySQL OLTP 성능 그리고 마이크로소프트 SQL 서버 OLTP 성능 시뮬레이션된 TCP-C 워크로드를 사용합니다. 애플리케이션 워크로드의 경우 각 드라이브는 동일하게 구성된 4개의 VM을 실행합니다.
SQL 서버 성능
각 SQL Server VM은 100개의 vDisk(부팅용 500GB 볼륨, 데이터베이스 및 로그 파일용 8GB 볼륨)로 구성됩니다. 시스템 리소스 관점에서 vCPU 64개, DRAM XNUMXGB로 각 VM을 구성하고 LSI Logic SAS SCSI 컨트롤러를 활용했습니다. Sysbench 워크로드는 이전에 스토리지 I/O 및 용량 모두에서 플랫폼을 포화 상태로 테스트했지만 SQL 테스트는 대기 시간 성능을 찾고 있습니다.
이 테스트는 Windows Server 2014 R2012 게스트 VM에서 실행되는 SQL Server 2를 사용하며 Quest의 Benchmark Factory for Databases에서 스트레스를 받습니다. StorageReview의 Microsoft SQL Server OLTP 테스트 프로토콜 복잡한 애플리케이션 환경에서 발견되는 활동을 시뮬레이트하는 온라인 트랜잭션 처리 벤치마크인 TPC-C(Transaction Processing Performance Council의 벤치마크 C) 최신 초안을 사용합니다. TPC-C 벤치마크는 합성 성능 벤치마크보다 데이터베이스 환경에서 스토리지 인프라의 성능 강점과 병목 현상을 측정하는 데 더 가깝습니다. 이 검토를 위한 SQL Server VM의 각 인스턴스는 333GB(1,500개 규모) SQL Server 데이터베이스를 사용하고 15,000명의 가상 사용자 로드에서 트랜잭션 성능과 대기 시간을 측정합니다.
SQL Server 테스트 구성(VM당)
- 윈도우 서버 2012 R2
- 스토리지 공간: 600GB 할당, 500GB 사용
- SQL 서버 2014
-
- 데이터베이스 크기: 1,500 규모
- 가상 클라이언트 로드: 15,000
- RAM 버퍼: 48GB
- 시험 시간: 3시간
-
- 2.5시간 전처리
- 30분 샘플 기간
SQL Server 트랜잭션 벤치마크에서 KIOXIA CM6은 12,633.6 TPS로 전체 10.6위를 차지했지만 최고 성능 아래에는 XNUMX TPS에 불과했습니다.
SQL Server 평균 대기 시간에서 CM6의 평균 대기 시간은 사촌인 CD5.5 SSD와 동일한 6ms였습니다.
시스벤치 성능
다음 애플리케이션 벤치마크는 Percona MySQL OLTP 데이터베이스 SysBench를 통해 측정. 이 테스트는 평균 TPS(Transactions Per Second), 평균 대기 시간 및 평균 99번째 백분위수 대기 시간도 측정합니다.
각각의 시스벤치 VM은 92개의 vDisk로 구성됩니다. 하나는 부팅용(~447GB), 하나는 사전 구축된 데이터베이스(~270GB), 세 번째는 테스트 중인 데이터베이스용(8GB)입니다. 시스템 리소스 관점에서 vCPU 60개, DRAM XNUMXGB로 각 VM을 구성하고 LSI Logic SAS SCSI 컨트롤러를 활용했습니다.
Sysbench 테스트 구성(VM당)
- 센트OS 6.3 64비트
- 페르코나 XtraDB 5.5.30-rel30.1
-
- 데이터베이스 테이블: 100
- 데이터베이스 크기: 10,000,000
- 데이터베이스 스레드: 32
- RAM 버퍼: 24GB
- 시험 시간: 3시간
-
- 2시간 동안 32개 스레드 사전 조정
- 1시간 32 스레드
Sysbench 트랜잭션 벤치마크를 살펴보면 KIOXIA CM6은 8,632 TPS로 비교 가능한 팩에서 다시 XNUMX위를 기록했습니다.
Sysbench 평균 대기 시간에서 CM6은 14.82ms로 다시 한 번 XNUMX위를 차지했습니다.
최악의 시나리오 대기 시간(99번째 백분위수)의 경우 CM6은 29.86ms로 XNUMX위로 편안한 상태를 유지했습니다.
VDBench 워크로드 분석
스토리지 장치를 벤치마킹할 때 애플리케이션 테스트가 가장 좋고 합성 테스트가 두 번째입니다. 실제 워크로드를 완벽하게 나타내지는 못하지만 합성 테스트는 경쟁 솔루션 간의 비교를 쉽게 수행할 수 있는 반복성 요소로 스토리지 장치의 기준선을 만드는 데 도움이 됩니다. 이러한 워크로드는 "포 코너" 테스트, 일반적인 데이터베이스 전송 크기 테스트에서 다양한 VDI 환경의 추적 캡처에 이르기까지 다양한 테스트 프로필을 제공합니다. 이러한 모든 테스트는 스크립팅 엔진과 함께 공통 vdBench 워크로드 생성기를 활용하여 대규모 컴퓨팅 테스트 클러스터에서 결과를 자동화하고 캡처합니다. 이를 통해 플래시 어레이 및 개별 스토리지 장치를 포함한 광범위한 스토리지 장치에서 동일한 워크로드를 반복할 수 있습니다. 이러한 벤치마크에 대한 테스트 프로세스는 전체 드라이브 표면을 데이터로 채운 다음 드라이브 용량의 25%에 해당하는 드라이브 섹션을 분할하여 드라이브가 애플리케이션 작업 부하에 어떻게 반응하는지 시뮬레이션합니다. 이것은 드라이브의 100%를 사용하고 정상 상태로 만드는 전체 엔트로피 테스트와 다릅니다. 결과적으로 이 수치는 더 높은 지속 쓰기 속도를 반영합니다.
프로필 :
- 4K 임의 읽기: 100% 읽기, 128 스레드, 0-120% iorate
- 4K 임의 쓰기: 100% 쓰기, 128 스레드, 0-120% iorate
- 4K 임의 읽기(고부하): 100% 읽기, 512 스레드, 0-120% iorate
- 4K 임의 쓰기(고부하): 100% 쓰기, 512 스레드, 0-120% 속도
- 64K 순차 읽기: 100% 읽기, 32 스레드, 0-120% iorate
- 64K 순차 쓰기: 100% 쓰기, 16개 스레드, 0-120% 속도
- 64K 순차 읽기(고부하): 100% 읽기, 64 스레드, 0-120% iorate
- 64K 순차 쓰기(고부하): 100% 쓰기, 64개 스레드, 0-120% 속도
- 합성 데이터베이스: SQL 및 Oracle
- VDI 전체 클론 및 연결된 클론 추적
유사점:
첫 번째 VDBench 워크로드 분석인 Random 4K Read에서 KIOXIA CM6은 846,288µs의 대기 시간에서 150 IOPS의 인상적인 성능으로 돌아섰습니다. 이것은 드라이브를 최고의 위치에 놓습니다.
새로운 PCIe 4.0 드라이브는 더 높은 부하를 견딜 수 있으며 그들이 무엇을 할 수 있는지 보기 위해 조금 더 세게 밀어붙이지 않았다면 우리는 태만할 것입니다. 따라서 랜덤 4K 읽기 높은 로드에서 CM6은 1,507,564µs의 대기 시간에서 337.9 IOPS로 정점을 찍을 수 있었습니다. CD6 대응 제품보다 훨씬 낫습니다.
임의 4K 쓰기의 경우 전체에서 100위를 차지했습니다. 약 490K IOPS까지 548,169µs 미만의 대기 시간으로 실행되었으며 226.4µs의 대기 시간에서 XNUMX IOPS로 정점에 도달했습니다.
무작위 4K 쓰기 높은 로드는 CM6이 이번에는 CD549,103에 뒤이어 922µs의 대기 시간에서 6 IOPS로 정점에 도달하는 것을 확인했습니다.
순차 워크로드로 전환한 CM6는 단 64µs의 대기 시간에서 97,779 IOPS 또는 6.11GB/s의 최고 점수로 325K 읽기에서 다시 한 번 빛을 발할 기회를 가졌습니다.
고부하 64K 순차 읽기는 대기 시간 4µs에서 CM6이 101,018 IOPS 또는 6.3GB/s로 최고인 629K 읽기의 배치와 유사했습니다.
64K 쓰기는 CM6가 강력한 최고 점수를 기록했지만 최고점 이후 성능이 떨어져 49위를 기록했습니다. 최대 성능은 약 3.1µs의 대기 시간에서 약 50K IOPS 또는 XNUMXGB/s였습니다.
고부하 64K 순차 쓰기에서는 CM6이 최고점은 더 높았지만 나중에는 성능이 떨어졌습니다. CM6은 대기 시간에서 약 49K IOP 또는 3.1GB/s로 정점을 찍었기 때문에 떨어지기 전에 거의 볼 수 없습니다.
다음 테스트 세트는 SQL, SQL 90-10 및 SQL 80-20과 같은 SQL 워크로드입니다. SQL을 시작으로 KIOXIA CM6은 266,458µs의 대기 시간에서 최고 119 IOPS로 전체 XNUMX위를 차지했습니다.
SQL 90-10의 경우 CM6이 265,276µs의 대기 시간에서 119.2 IOPS의 최고 성능으로 다시 한 번 XNUMX위를 차지했습니다.
SQL 80-20은 CM6에게 263,819 IOPS 119.4µs의 최고 성능으로 XNUMX위를 차지하여 과시할 기회를 제공했습니다.
다음은 Oracle 워크로드인 Oracle, Oracle 90-10 및 Oracle 80-20입니다. Oracle을 시작으로 CM6는 271,230µs의 대기 시간에서 128.6 IOPS의 최고 성능으로 다시 한 번 XNUMX위를 차지했습니다.
Oracle 90-10은 6µs의 대기 시간에서 202,341 IOPS의 최고 성능으로 CM107.4에서 XNUMX위를 차지했습니다.
CM6는 80µs의 낮은 대기 시간에서 최고 20 IOPS로 Oracle 206,733-104.7에서 다시 한 번 XNUMX위를 차지하기 위해 경쟁사 옆으로 미끄러졌습니다.
다음으로 VDI 클론 테스트인 Full and Linked로 전환했습니다. VDI 전체 복제(FC) 부팅의 경우 CM6이 223,668 IOPS와 153.5µs의 대기 시간으로 XNUMX위를 차지했습니다.
VDI FC 초기 로그인의 경우 CM6은 154,836µs의 대기 시간에서 189 IOPS의 최고 성능으로 XNUMX위로 떨어졌습니다.
VDI FC 월요일 로그인 벤치마크에서는 CM6이 98,867µs의 대기 시간과 함께 최고 158.4 IOPS로 XNUMX위를 유지했습니다.
VDI LC(Linked Clone) 부팅의 경우 KIOXIA CM6이 115,058µs의 대기 시간에서 최고 점수 137.7 IOPS로 다시 XNUMX위를 차지했습니다.
VDI LC 초기 로그인은 차트에서 읽기가 약간 어렵지만 CM6은 38,848µs의 대기 시간에서 최고 202.4 IOPS로 팩 중간에 도달한 후 일부를 떨어뜨렸습니다.
마지막으로 VDI LC Monday Login은 최고 점수 6 IOPS와 대기 시간 96,008µs로 CM162.5이 다시 한 번 최고의 성능을 발휘하도록 했습니다.
결론
KIOXIA CM6은 엔터프라이즈용 최초의 PCIe 4.0 SSD 중 하나였습니다. 새로운 드라이브는 이 경우 최대 6.9GB/s 및 최대 1.4만 IOPS의 성능을 약속합니다. CM6은 이중 포트로 드라이브에 고가용성을 추가합니다. 이 드라이브는 800GB에서 최대 30.72TB까지 다양한 용량으로 제공되며 그 사이에 9가지 용량 옵션이 있습니다. CM6에는 각각 1 및 3 DWPD가 있는 읽기 집약적 및 혼합 사용 모델이 있습니다. 그리고 SSD는 다양한 보안 모델 옵션과 함께 제공됩니다.
성능을 위해 우리는 몇 가지 예외를 제외하고 일반적인 Application Workload Analysis 및 VDBench를 실행했습니다. 테스트 플랫폼이 Intel이고 KIOXIA 드라이브가 Gen3 포트에 의해 장애가 될 것이기 때문에 Houdini 테스트를 건너뛰어야 했습니다. VDBench에서 우리는 더 높은 로드 테스트를 추가하여 새 드라이브가 처리하도록 설계되었기 때문에 조금 더 스트레스를 받았습니다.
애플리케이션 워크로드 분석에서는 SQL Server와 Sysbench를 실행했습니다. SQL Server에서 CM6은 12,633.6 TPS와 5.5ms로 TPS와 평균 지연 시간 모두에서 8,632위를 차지했지만 여전히 매우 좋은 점수를 받았습니다. Sysbench를 사용하여 드라이브는 14.82 TPS, 평균 대기 시간 29.86ms, 최악의 시나리오 대기 시간에서 XNUMXms로 다시 XNUMX위를 기록했습니다.
VDBench에서 드라이브는 정말 빛났습니다. CM6은 여러 벤치마크에서 최고의 성능을 보였습니다. 기본 하이라이트는 846K 읽기 시 4K IOPS, 1.5K 읽기 고부하 시 4만 IOPS, 548K 쓰기 시 4K IOPS, 549K 쓰기 고부하 시 4K IOPS, 6.1K 읽기 시 64GB/s, 6.3K 읽기 고부하 시 64GB/s, 3.1K 쓰기 및 64K 쓰기 고부하 모두에서 64GB/s. SQL은 266K IOPS, SQL 265-90에서 10K IOPS, SQL 264-80에서 20K IOPS의 피크를 보였습니다. Oracle은 Oracle 271-202에서 90K IOPS, 10K IOPS, Oracle 207-80에서 20K IOPS의 피크를 제공했습니다. VDI FC는 부팅 시 224K IOPS, 초기 로그인 시 155K IOPS, 월요일 로그인 시 99K IOPS를 제공했습니다. VDI LC는 115K IOPS 부팅, 39K IOPS 초기 로그인 및 96K IOPS 월요일 로그인을 확인했습니다.
이 리뷰와 CD6의 리뷰는 PCIe 4.0과 더 많은 시장에 진입함에 따라 저장 장치의 미래를 구체적으로 살펴봅니다. PCIe 4.0을 전면에서 후면으로 지원하는 서버 공급업체는 많지 않으며 Lenovo는 이 글을 쓰는 시점에서 우리 연구실에서 유일한 공급업체입니다. Lenovo는 KIOXIA CM2과 같은 스토리지 제품을 기대하면서 7002세대 AMD EPYC 6 프로세서가 제공하는 모든 이점을 빠르게 포착했습니다. 그러나 KIOXIA의 경우 다른 사람보다 앞서 있다는 흥미로운 지점에 놓이게 되지만 드라이브의 전체 잠재력은 최신 AMD 기반 서버에서만 충족됩니다(Intel도 게임에 뛰어들기로 결정할 때까지). 현재 CM6은 레거시 장비에서 계속 작동하며 회사가 업그레이드함에 따라 더 많은 성능을 발휘할 준비가 될 것입니다.
StorageReview에 참여
뉴스레터 | 유튜브 | 팟캐스트 iTunes/스포티 파이 | 인스타그램 | 트위터 | 페이스북 | RSS 피드