홈페이지 Enterprise Memblaze PBlaze5 910 AIC NVMe SSD 검토

Memblaze PBlaze5 910 AIC NVMe SSD 검토

by 라일 스미스

Memblaze PBlaze5 910은 애플리케이션 성능을 크게 향상시키도록 설계된 고성능 NVMe SSD입니다. 64단 3D NAND를 탑재한 PBlaze5는 이전 모델보다 15.36% 더 많은 최대 40TB의 단일 디스크 용량을 제공합니다. Memblaze는 이를 통해 새로운 SSD가 스토리지 서버 애플리케이션에서 랙 밀도를 증가시켜 공간을 절약하고 에너지 비용을 낮출 수 있다고 밝혔습니다. 데이터 센터에 더 많은 에너지 효율성을 추가한 910 시리즈는 와트당 성능을 38% 향상시키고 16W에서 10W 범위의 25가지 전원 모드 설정을 지원하는 것으로 보고되었습니다.


Memblaze PBlaze5 910은 애플리케이션 성능을 크게 향상시키도록 설계된 고성능 NVMe SSD입니다. 64단 3D NAND를 탑재한 PBlaze5는 이전 모델보다 15.36% 더 많은 최대 40TB의 단일 디스크 용량을 제공합니다. Memblaze는 이를 통해 새로운 SSD가 스토리지 서버 애플리케이션에서 랙 밀도를 증가시켜 공간을 절약하고 에너지 비용을 낮출 수 있다고 밝혔습니다. 데이터 센터에 더 많은 에너지 효율성을 추가한 910 시리즈는 와트당 성능을 38% 향상시키고 16W에서 10W 범위의 25가지 전력 모드 설정을 지원하는 것으로 보고되었습니다.

성능에 관한 한 Memblaze는 910 시리즈를 인용하여 읽기 및 쓰기에 대해 각각 최대 6GB/s 및 3.8GB/s, 지속적인 임의 처리량에서 1만 IOPS 읽기 및 135,000 IOPS 쓰기를 제공합니다.

PBlaze5 910 시리즈는 AES 256 데이터 암호화, 전체 데이터 경로 보호 및 향상된 정전 보호 기능을 지원하여 엔터프라이즈 애플리케이션 데이터의 무결성을 보장합니다. 또한 두 포트에 동시에 액세스할 수 있으므로 기본적으로 단일 경로 장애 문제를 제거하는 이중 포트 기능이 있습니다.

Memblaze PBlaze5 910 NVMe SSD 사양

폼 팩터 HHHL AIC
생산 능력 3.84TB 7.68TB
낸드 3D eTLC
인터페이스 PCIe 3.0 x 8
프로토콜 NVMe 1.2a
퍼포먼스
순차 읽기(128KB) 5.5GB / s 6.0GB / s
순차 쓰기(128KB) 3.1GB / s 3.8GB / s
지속적인 임의 읽기(4KB) 850K IOPS 1만 IOPS
지속적인 임의 쓰기(4KB) 99K IOPS 135K IOPS
레이턴시 R/W 87 / 12μs
DWPD 1
우버 <10^-17
MTBF 2 백만 시간
전력 소비  7 ~ 25W

 

퍼포먼스

테스트베드

당사의 엔터프라이즈 SSD 검토는 애플리케이션 테스트를 위해 Lenovo ThinkSystem SR850을 활용하고 델 파워에지 R740xd 합성 벤치마크용. ThinkSystem SR850은 고성능 로컬 스토리지에 스트레스를 주는 데 필요한 것보다 훨씬 더 많은 CPU 성능을 제공하는 잘 갖춰진 쿼드 CPU 플랫폼입니다. 많은 CPU 리소스가 필요하지 않은 합성 테스트는 보다 전통적인 듀얼 프로세서 서버를 사용합니다. 두 경우 모두 스토리지 공급업체의 최대 드라이브 사양과 일치하는 최상의 조명에서 로컬 스토리지를 보여주기 위한 것입니다.

레노버 씽크시스템 SR850

  • 4 x Intel Platinum 8160 CPU(2.1GHz x 24코어)
  • 16 x 32GB DDR4-2666Mhz ECC DRAM
  • RAID 2-930i 8Gb/s RAID 카드 12개
  • NVMe 베이 8개
  • VM웨어 ESXI 6.5

델 파워에지 R740xd

  • Intel Gold 2 CPU 6130개(2.1GHz x 16코어)
  • 16GB DDR16-4MHz ECC DRAM 2666개
  • 1x PERC 730 2GB 12Gb/s RAID 카드
  • 애드인 NVMe 어댑터
  • 우분투-16.04.3-데스크탑-amd64

테스트 배경 및 유사 항목

The StorageReview 엔터프라이즈 테스트 랩 관리자가 실제 배포에서 경험하는 것과 유사한 환경에서 엔터프라이즈 스토리지 장치의 벤치마크를 수행하기 위한 유연한 아키텍처를 제공합니다. Enterprise Test Lab은 다양한 서버, 네트워킹, 전력 조절 및 기타 네트워크 인프라를 통합하여 직원이 실제 조건을 설정하여 검토 중에 성능을 정확하게 측정할 수 있도록 합니다.

랩 환경 및 프로토콜에 대한 이러한 세부 정보를 검토에 통합하여 IT 전문가와 스토리지 구입 책임자가 다음 결과를 달성한 조건을 이해할 수 있도록 합니다. 우리의 리뷰는 우리가 테스트하는 장비 제조업체에서 비용을 지불하거나 감독하지 않습니다. 에 대한 추가 세부 정보 StorageReview 엔터프라이즈 테스트 랩 그리고 네트워킹 기능 개요 해당 페이지에서 사용할 수 있습니다.

이 리뷰에 대한 비교:

애플리케이션 워크로드 분석

엔터프라이즈 스토리지 장치의 성능 특성을 이해하려면 라이브 프로덕션 환경에서 발견되는 인프라 및 애플리케이션 워크로드를 모델링하는 것이 필수적입니다. 따라서 Memblaze PBlaze5 910에 대한 벤치마크는 SysBench를 통한 MySQL OLTP 성능 그리고 마이크로소프트 SQL 서버 OLTP 성능 시뮬레이션된 TCP-C 워크로드를 사용합니다. 애플리케이션 워크로드의 경우 각 드라이브는 2-4개의 동일하게 구성된 VM을 실행합니다.

SQL 서버 성능

각 SQL Server VM은 100개의 vDisk(부팅용 500GB 볼륨, 데이터베이스 및 로그 파일용 16GB 볼륨)로 구성됩니다. 시스템 리소스 관점에서 각 VM을 vCPU 64개, DRAM XNUMXGB로 구성하고 LSI Logic SAS SCSI 컨트롤러를 활용했습니다. Sysbench 워크로드는 이전에 스토리지 I/O 및 용량 모두에서 플랫폼을 포화 상태로 테스트했지만 SQL 테스트는 대기 시간 성능을 찾고 있습니다.

이 테스트는 Windows Server 2014 R2012 게스트 VM에서 실행되는 SQL Server 2를 사용하며 Quest의 Benchmark Factory for Databases에서 스트레스를 받습니다. StorageReview의 Microsoft SQL Server OLTP 테스트 프로토콜 복잡한 애플리케이션 환경에서 발견되는 활동을 시뮬레이트하는 온라인 트랜잭션 처리 벤치마크인 TPC-C(Transaction Processing Performance Council의 벤치마크 C) 최신 초안을 사용합니다. TPC-C 벤치마크는 합성 성능 벤치마크보다 데이터베이스 환경에서 스토리지 인프라의 성능 강점과 병목 현상을 측정하는 데 더 가깝습니다. 이 검토를 위한 SQL Server VM의 각 인스턴스는 333GB(1,500개 규모) SQL Server 데이터베이스를 사용하고 15,000명의 가상 사용자 로드에서 트랜잭션 성능과 대기 시간을 측정합니다.

SQL Server 테스트 구성(VM당)

  • 윈도우 서버 2012 R2
  • 스토리지 공간: 600GB 할당, 500GB 사용
  • SQL 서버 2014
    • 데이터베이스 크기: 1,500 규모
    • 가상 클라이언트 로드: 15,000
    • RAM 버퍼: 48GB
  • 시험 시간: 3시간
    • 2.5시간 전처리
    • 30분 샘플 기간

SQL Server 트랜잭션 벤치마크에서 Memblaze PBlaze5 910 AIC는 12,645.1 TPS로 최고의 성능을 자랑했습니다.

910 AIC 모델도 지연 시간이 1.5ms로 가장 낮았는데, 이는 3000위인 Huawei EDXNUMX의 절반 수준이었습니다.

시스벤치 성능

다음 애플리케이션 벤치마크는 Percona MySQL OLTP 데이터베이스 SysBench를 통해 측정. 이 테스트는 평균 TPS(Transactions Per Second), 평균 대기 시간 및 평균 99번째 백분위수 대기 시간도 측정합니다.

각각의 시스벤치 VM은 92개의 vDisk로 구성됩니다. 하나는 부팅용(~447GB), 하나는 사전 구축된 데이터베이스(~270GB), 세 번째는 테스트 중인 데이터베이스용(16GB)입니다. 시스템 리소스 관점에서 각 VM을 vCPU 60개, DRAM XNUMXGB로 구성하고 LSI Logic SAS SCSI 컨트롤러를 활용했습니다.

Sysbench 테스트 구성(VM당)

  • 센트OS 6.3 64비트
  • 페르코나 XtraDB 5.5.30-rel30.1
    • 데이터베이스 테이블: 100
    • 데이터베이스 크기: 10,000,000
    • 데이터베이스 스레드: 32
    • RAM 버퍼: 24GB
  • 시험 시간: 3시간
    • 2시간 동안 32개 스레드 사전 조정
    • 1시간 32 스레드

Sysbench 트랜잭션 벤치마크에서 AIC 910은 9,190.7 TPS로 인상적인 성능을 이어가 순위표 상단에 올랐습니다.

Sysbench 평균 대기 시간에서 AIC 910은 다시 13.9ms로 최고의 성능을 보였습니다.

최악의 시나리오 대기 시간 벤치마크에서 AIC 910은 단 25.9ms로 팩의 최상위에 있음을 발견했습니다.

SideFX의 후디니

Houdini 테스트는 CGI 렌더링과 관련하여 스토리지 성능을 평가하도록 특별히 설계되었습니다. 이 애플리케이션의 테스트 베드는 코어의 변형입니다. 델 파워에지 R740xd 이중 Intel 6130 CPU 및 64GB DRAM과 함께 연구실에서 사용하는 서버 유형입니다. 이 경우 베어 메탈을 실행하는 Ubuntu Desktop(ubuntu-16.04.3-desktop-amd64)을 설치했습니다. 벤치마크의 출력은 완료하는 데 몇 초 만에 측정되며 적을수록 좋습니다.

Maelstrom 데모는 스왑 파일을 확장 메모리의 한 형태로 효과적으로 사용하는 기능을 보여줌으로써 스토리지의 성능 기능을 강조하는 렌더링 파이프라인의 섹션을 나타냅니다. 테스트는 기본 스토리지 구성 요소에 대한 대기 시간 영향의 벽 시간 효과를 격리하기 위해 결과 데이터를 작성하거나 포인트를 처리하지 않습니다. 테스트 자체는 XNUMX단계로 구성되며 그 중 XNUMX개는 벤치마크의 일부로 실행되며 다음과 같습니다.

  1. 디스크에서 압축된 포인트를 로드합니다. 이것은 디스크에서 읽을 시간입니다. 이는 단일 스레드이므로 전체 처리량이 제한될 수 있습니다.
  2. 처리할 수 있도록 포인트를 단일 플랫 배열로 압축 해제합니다. 포인트가 다른 포인트에 종속되지 않는 경우 작업 세트가 코어에 유지되도록 조정할 수 있습니다. 이 단계는 다중 스레드입니다.
  3. (실행 안 함) 포인트를 처리합니다.
  4. 디스크에 다시 저장하기에 적합한 버킷 블록으로 다시 압축합니다. 이 단계는 다중 스레드입니다.
  5. (실행 안 함) 버킷 블록을 다시 디스크에 씁니다.

Houdini 테스트에서 910 AIC는 3,077.7초로 U.2 모델 바로 위이자 멤블레이즈 제품 중 중저가에 위치했습니다.

VDBench 워크로드 분석

스토리지 장치를 벤치마킹할 때 애플리케이션 테스트가 가장 좋고 합성 테스트가 두 번째입니다. 실제 워크로드를 완벽하게 나타내지는 못하지만 합성 테스트는 경쟁 솔루션 간의 비교를 쉽게 수행할 수 있는 반복성 요소로 스토리지 장치의 기준선을 만드는 데 도움이 됩니다. 이러한 워크로드는 "포 코너" 테스트, 일반적인 데이터베이스 전송 크기 테스트에서 다양한 VDI 환경의 추적 캡처에 이르기까지 다양한 테스트 프로필을 제공합니다. 이러한 모든 테스트는 스크립팅 엔진과 함께 공통 vdBench 워크로드 생성기를 활용하여 대규모 컴퓨팅 테스트 클러스터에서 결과를 자동화하고 캡처합니다. 이를 통해 플래시 어레이 및 개별 스토리지 장치를 포함한 광범위한 스토리지 장치에서 동일한 워크로드를 반복할 수 있습니다. 이러한 벤치마크에 대한 테스트 프로세스는 전체 드라이브 표면을 데이터로 채운 다음 드라이브 용량의 25%에 해당하는 드라이브 섹션을 분할하여 드라이브가 애플리케이션 작업 부하에 어떻게 반응하는지 시뮬레이션합니다. 이것은 드라이브의 100%를 사용하고 정상 상태로 만드는 전체 엔트로피 테스트와 다릅니다. 결과적으로 이 수치는 더 높은 지속 쓰기 속도를 반영합니다.

프로필 :

  • 4K 임의 읽기: 100% 읽기, 128 스레드, 0-120% iorate
  • 4K 임의 쓰기: 100% 쓰기, 64 스레드, 0-120% iorate
  • 64K 순차 읽기: 100% 읽기, 16 스레드, 0-120% iorate
  • 64K 순차 쓰기: 100% 쓰기, 8개 스레드, 0-120% 속도
  • 합성 데이터베이스: SQL 및 Oracle
  • VDI 전체 클론 및 연결된 클론 추적

첫 번째 VDBench 워크로드 분석인 Random 4K 읽기에서 Memblaze PBlaze5 910 AIC는 최고 1 IOPS와 814,640μs의 대기 시간으로 테스트 내내 155.9ms 미만을 유지하여 XNUMX위를 차지했습니다.

다시, 4K 임의 쓰기 성능은 전체적으로 밀리초 미만의 대기 시간을 보여주었습니다. 910 AIC는 900 IOPS의 최고 성능과 550,864μs의 대기 시간으로 테스트 드라이브 중 229.3위를 차지했습니다(PBlaze XNUMX이 XNUMX위).

순차 워크로드로 전환한 910 AIC는 64K 순차 읽기에서 최고 점수인 50,372 IOPS 또는 3.14GB/s, 대기 시간 317μs로 팩의 맨 위에 배치되었습니다.

PBlaze 900으로 위치를 바꾸면 910 AIC는 42,563K 순차 쓰기에서 2.66μs의 대기 시간과 함께 370 IOPS 또는 64GB/s로 정점을 찍었습니다.

SQL 워크로드로 이동하면 910 AIC는 대기 시간이 270,432μs에 불과한 117.8 IOPS로 정점에 도달하여 다시 한 번 순위표 상단에 올랐습니다.

SQL 90-10은 910이 273,321 IOPS의 최고 점수와 116.6μs의 대기 시간으로 큰 차이로 XNUMX위 자리를 유지했습니다.

910 AIC는 SQL 277,815-114 벤치마크에서 80.μs의 대기 시간과 함께 20 IOPS로 정점을 찍고 순위표 상단을 유지했습니다.

Oracle 워크로드에서 910 AIC는 282,326 IOPS의 최고 점수와 126.2μs의 대기 시간으로 우위를 이어갔습니다.

Oracle 90-10의 경우 910 AIC는 최고 202,695 IOPS와 108μs의 대기 시간을 보여 XNUMX위 자리를 차지했습니다.

80-20에서 910은 210,228 IOPS의 인상적인 최고 성능과 104μs의 대기 시간으로 Oracle 테스트를 종료했습니다.

다음으로 VDI 클론 벤치마크인 Full and Linked로 이동하여 910 AIC가 대부분의 테스트에서 최고의 성능을 보였습니다. VDI 전체 복제 부팅의 경우 910 AIC는 219,337 IOPS의 최고 성능과 158.2μs의 대기 시간을 가졌습니다.

VDI FC 초기 로그인에서는 910 AIC가 최고 성능 150,121 IOPS와 대기 시간 197μs를 기록했습니다.

VDI FC 월요일 로그인으로 910 AIC는 2로 끝났습니다.nd 101,128 IOPS와 156.3μs의 대기 시간으로 Huawei 바로 뒤에 위치합니다.

LC(Linked Clone)로 전환하면서 먼저 부팅 테스트를 살펴보았습니다. 이 시나리오에서 910 AIC는 98,284 IOPS와 161.3μs의 대기 시간으로 XNUMX위를 차지했습니다.

VDI LC 초기 로그인은 910 AIC와 Huawei가 55,061 IOPS와 143.4μs의 대기 시간으로 거의 동일한 성능을 보였습니다.

VDI LC 월요일 로그인 테스트에서 Huawei와 910 AIC는 최고 77,721 IOPS와 대기 시간 203.8μs로 다시 막강한 성능을 보여 다시 XNUMX위를 차지했습니다.

결론

U.2 및 AIC 폼 팩터 모델로 구성된 Memblaze의 PBlaze5 910은 64레이어 3D NAND를 사용하는 최신 NVMe 데이터 센터 드라이브입니다. 우리는 이 검토를 위해 AIC 모델을 살펴보았습니다. 이 모델은 3.84TB 및 7.68TB의 용량과 6.0GB/s 읽기 및 3.8GB/s 쓰기에 도달하는 것으로 인용된 성능과 최대 1만 IOPS 읽기의 처리량 성능을 주장합니다. 910 AIC는 AES 256 데이터 암호화 및 최대 8TB/s의 TRIM 기능 지원을 포함한 다양한 보호 기능과 함께 사용되는 거의 모든 애플리케이션에서 탁월한 성능을 발휘하는 데 필요한 성능을 갖추고 있습니다.

성능의 세부 사항을 살펴보면 910 AIC가 테스트한 많은 워크로드에서 순위표 상단에 있는 것으로 나타났습니다. SQL Server 벤치마크에서 12,645.1 TPS와 평균 지연 시간 1.5ms로 9,190.7위를 차지했습니다. Sysbench에서 드라이브는 13.3 TPS, 평균 대기 시간 25.9ms, 최악의 시나리오 대기 시간 910ms로 다시 순위표 상단에 올랐습니다. Houdini by SideFX 벤치마크에서 3,077.7 AIC는 2초를 기록했으며, 이는 U.910 모델 및 다른 Memblaze 제품보다 약간 더 나은 수치입니다. VDBench 벤치마크에서 4 AIC는 모든 테스트에서 5밀리초 미만의 대기 시간을 유지했으며 대부분의 범주에서 최고의 성능을 보였습니다. 무작위 910K 읽기 및 쓰기에서 Memblaze PBlaze814,640 550,864 AIC는 각각 3.14 IOPS 및 2.66 IOPS를 기록했으며 순차 워크로드는 각각 277,000GB/s 및 270,000GB/s를 기록했습니다. SQL 결과는 XNUMX IOPS에서 XNUMX IOPS 사이에서 실행되는 Oracle 테스트에서 약 XNUMX만 IOPS를 기록했습니다.

x4에서 x8 인터페이스로 이동하는 Memblaze PBlaze5 910은 sme 제품군의 U.2 폼 팩터 버전에 비해 성능이 크게 향상되었습니다. 전반적으로 AIC 910은 인터페이스 제한 U.2 모델에 비해 강점을 보였고 주어진 애플리케이션이 더 큰 폼 팩터를 활용할 수 있다면 무엇이 가능한지 고객에게 보여주었습니다.

멤블레이즈 PBlaze5 910

이 리뷰에 대해 토론

StorageReview 뉴스레터 신청