우리는 그것에 대해 이야기했고 그걸로 널 놀렸어, 그리고 이제 드디어 Intel Optane Review와 함께 VMware vSAN을 제공하고 있습니다. 이것은 a로 시작하는 vSAN의 세 번째 주요 검토가 될 것입니다. 하이브리드 vSAN 6.0에 대한 여러 부분 검토 다음에 vSAN 6.2의 전체 플래시 검토. 이 과정에서는 Dell PowerEdge R730xd 클러스터를 활용하는 대신 vSAN 2029을 실행하는 Supermicro의 24U-TN4R2T+ 24U, 6.7베이 서버를 사용하고 있습니다. 스토리지의 경우 쓰기 계층을 위한 Intel Optane P4800X(375GB) SSD와 용량 계층을 위한 Intel P4500(2TB) SSD가 포함된 모든 NVMe 구성을 사용하고 있습니다.
우리는 그것에 대해 이야기했고 그걸로 널 놀렸어, 그리고 이제 드디어 Intel Optane Review와 함께 VMware vSAN을 제공하고 있습니다. 이것은 a로 시작하는 vSAN의 세 번째 주요 검토가 될 것입니다. 하이브리드 vSAN 6.0에 대한 여러 부분 검토 다음에 vSAN 6.2의 전체 플래시 검토. 이 과정에서는 Dell PowerEdge R730xd 클러스터를 활용하는 대신 vSAN 2029을 실행하는 Supermicro의 24U-TN4R2T+ 24U, 6.7베이 서버를 사용하고 있습니다. 스토리지의 경우 쓰기 계층을 위한 Intel Optane P4800X(375GB) SSD와 용량 계층을 위한 Intel P4500(2TB) SSD가 포함된 모든 NVMe 구성을 사용하고 있습니다.
vSAN에 익숙하지 않은 분들을 위해 말씀드리자면 스토리지에 의존하는 vSphere에 최적화된 VMware의 하이퍼 컨버지드 인프라입니다. 즉, vSAN은 더 나은 성능을 제공하면서 스토리지 및 스토리지 관리를 단순하게 만드는 것을 목표로 하는 소프트웨어 정의 데이터 센터 빌딩 블록의 한 단계입니다. vSAN은 일반적으로 VMware 소프트웨어와 결합된 인증된 하드웨어의 조합인 VMware vSAN ReadyNodes라는 인증 프로그램을 통해 판매됩니다. 대부분의 주요 서버 공급업체는 ReadyNode 구성을 제공하고 일부는 vSAN을 어플라이언스로 제공하기도 합니다.
ReadyNode 아이디어와 유사한 것은 Intel의 Select Solution입니다. 인텔 셀렉트 솔루션은 인텔에서 제시한 요구 사항을 따르는 검증된 하드웨어 및 소프트웨어 스택입니다. 주요 서버 공급업체가 시장에 제공하는 솔루션은 인텔에서 설명한 벤치마크 성능을 복제하거나 능가할 수 있어야 하며 고객을 위한 자세한 배포 가이드가 있어야 합니다. 이 검토를 위해 사용하는 설정은 이 범주에 속하며 특히 VMware vSAN용 Intel Select Solution입니다. 이름에서 알 수 있듯이 이 솔루션은 VMware 환경을 위해 특별히 설계되었습니다.
VMware vSAN용 인텔 셀렉트 솔루션은 "기본" 및 "플러스"의 두 가지 구성으로 제공됩니다. 우리의 구성은 이러한 구성의 중간에 있습니다. 기본적으로 업그레이드된 CPU가 포함된 기본 구성입니다. 쓰기 계층용 Optane SSD를 사용하는 당사 시스템은 비즈니스 크리티컬 애플리케이션의 대기 시간 요구 사항을 충족하도록 설계되었습니다.
슈퍼마이크로 2029U-TN24R4T+ 사양:
- Supermicro 2029U-TN24R4T+ 서버(x4)
- CPU: Intel Xeon Gold 2 프로세서 6152개, 2.10GHz, 22코어
- 메모리: 384GB RAM(12 x 32GB 2,666MHz DDR4 DIMM)
- vSAN 디스크 그룹, 노드당 2개:
- vSAN 캐시 계층: 2GB Intel Optane SSD DC P375X 시리즈 NVMe SSD 4800개
- vSAN 용량 계층: 4 x 2TB Intel DC P4500 시리즈 NVMe SSD
- 네트워킹 :
- 인텔 이더넷 컨버지드 네트워크 어댑터 X710 10/40GbE(vSAN 전용 링크, vMotion/VM 트래픽/자체 VLAN으로 분할된 관리).
- 퍼포먼스
- 4KB 무작위, 대기열 깊이 16, R/W: 최대 550/500K IOPS
- 4KB 무작위, 대기열 깊이 16, 혼합 70/30 R/W: 최대 500K IOPS
- DWPD: 30
- 퍼포먼스
- 순차 읽기: 3200MB/s
- 순차 쓰기: 1050MB/s
- 임의 4K 읽기: 490,000 IOPS
- 임의 4K 쓰기: 38,000 IOPS
- DWPD 0.75 무작위; 4.62 순차적
애플리케이션 워크로드 분석
첫 번째 벤치마크는 SysBench를 통한 MySQL OLTP 성능 그리고 마이크로소프트 SQL 서버 OLTP 성능 시뮬레이션된 TPC-C 워크로드를 사용합니다.
각 SQL Server VM은 100개의 vDisk(부팅용 500GB 및 데이터베이스 및 로그 파일용 16GB)로 구성됩니다. 시스템 리소스 관점에서 각 VM을 vCPU 64개, DRAM XNUMXGB로 구성하고 LSI Logic SAS SCSI 컨트롤러를 활용했습니다. 이러한 테스트는 대기 시간에 민감한 애플리케이션이 컴퓨팅 및 스토리지 부하가 중간 정도이지만 과도하지는 않은 클러스터에서 수행되는 방식을 모니터링하도록 설계되었습니다.
SQL Server 테스트 구성(VM당)
- 윈도우 서버 2012 R2
- 스토리지 공간: 600GB 할당, 500GB 사용
- SQL 서버 2014
- 데이터베이스 크기: 1,500 규모
- 가상 클라이언트 로드: 15,000
- RAM 버퍼: 48GB
- 시험 시간: 3시간
- 2.5시간 전처리
- 30분 샘플 기간
하이퍼 컨버지드 플랫폼의 SQL Server TPC-C 테스트에서는 하이브리드 모드, AF(All-Flash) 모드 및 AF DR(All-Flash Data Reduction)에서 클러스터 전체의 워크로드 균형을 살펴봅니다. 당연히 Optane의 AF 모드는 개별 VM이 12,605 TPS에서 3,148.56 TPS 사이인 총 점수 3,152.66 TPS로 약간 더 나은 성능을 보였습니다. 이는 전체 점수가 12,472 TPS인 vSAN의 비 Optane 버전보다 약간 더 좋습니다. DR을 켠 상태에서 Optane은 12,604 TPS에서 3,148.7 TPS 범위의 개별 VM으로 3,153.5 TPS(DR을 껐을 때보다 단 11,969 TPS 낮음)의 총 점수를 기록했습니다. 이것은 DR의 총 점수가 XNUMXTPS인 비 Optane 버전에 비해 상당히 큰 도약이었습니다. 여기서 Gold CPU가 제한 요인일 가능성이 있으며 Platinum CPU를 사용하면 더 많은 장점이 있다는 점에 주목할 가치가 있습니다.
SQL Server TPC-C 테스트에서 가장 주목하는 변수는 평균 대기 시간입니다. 트랜잭션 성능의 작은 차이는 전체 내용을 표시하지 않습니다. 평균 대기 시간 테스트에서 AF Optane은 16.5ms에서 14ms 범위의 개별 VM에서 총 점수가 21ms에 불과했습니다. Optane 버전의 DR을 사용하면 개별 VM에 대한 대기 시간이 17ms~13ms인 집계에 대해 21ms로 증가했습니다. 이는 DR 없이 52.5ms, DR을 켠 상태에서 261ms의 집계 점수로 비 Optane vSAN에 비해 크게 개선된 것입니다.
시스벤치 성능
각 Sysbench VM은 92개의 vDisk로 구성됩니다. 하나는 부팅용(~447GB), 하나는 사전 구축된 데이터베이스(~400GB), 세 번째는 테스트 중인 데이터베이스용(16GB)입니다. 시스템 리소스 관점에서 각 VM을 vCPU 64개, DRAM XNUMXGB로 구성하고 LSI Logic SAS SCSI 컨트롤러를 활용했습니다.
Sysbench 테스트 구성(VM당)
- 센트OS 6.3 64비트
- 스토리지 공간: 1TB, 800GB 사용
- 페르코나 XtraDB 5.5.30-rel30.1
- 데이터베이스 테이블: 100
- 데이터베이스 크기: 10,000,000
- 데이터베이스 스레드: 32
- RAM 버퍼: 24GB
- 시험 시간: 12시간
- 6시간 동안 32개 스레드 사전 조정
- 1시간 32 스레드
- 1시간 16 스레드
- 1시간 8 스레드
- 1시간 4 스레드
- 1시간 2 스레드
Sysbench OLTP를 사용하여 각각에 대한 8VM 구성을 살펴봅니다. Optane AF는 비 Optane 버전의 10,699 TPS의 두 배 이상인 4,273 TPS의 총점을 기록했습니다. DR이 켜진 상태에서 Optane은 DR의 8,668 TPS로 비 Optane에 비해 3,625 TPS를 기록했습니다.
Sysbench 평균 대기 시간의 경우 Optane 기반 vSAN은 DR이 켜진 상태에서 23.95ms 및 29.62ms의 집계 점수로 실제로 빛을 발할 수 있었습니다. 이것은 비 Optane의 60.05ms 및 DR이 켜진 71.05ms와 비교됩니다. 두 경우 모두 Optane은 대기 시간이 절반 미만이었습니다.
평균 99번째 백분위수 지연 시간은 Optane 기반 vSAN이 총 점수 42.9ms 및 DR을 켠 상태에서 55.63ms로 훨씬 더 빠른 것으로 나타났습니다. 비 Optane의 126.02ms와 DR을 켠 상태에서 212.42ms였습니다.
VDBench 워크로드 분석
스토리지 어레이를 벤치마킹할 때 애플리케이션 테스트가 가장 좋고 합성 테스트가 두 번째입니다. 실제 워크로드를 완벽하게 나타내지는 못하지만 합성 테스트는 경쟁 솔루션 간의 비교를 쉽게 수행할 수 있는 반복성 요소로 스토리지 장치의 기준선을 만드는 데 도움이 됩니다. 이러한 워크로드는 "포 코너" 테스트, 공통 데이터베이스 전송 크기 테스트, 다양한 VDI 환경의 트레이스 캡처에 이르는 다양한 테스트 프로필을 제공합니다. 이러한 모든 테스트는 스크립팅 엔진과 함께 공통 vdBench 워크로드 생성기를 활용하여 대규모 컴퓨팅 테스트 클러스터에서 결과를 자동화하고 캡처합니다. 이를 통해 플래시 어레이 및 개별 스토리지 장치를 포함한 광범위한 스토리지 장치에서 동일한 워크로드를 반복할 수 있습니다.
프로필 :
- 4K 임의 읽기: 100% 읽기, 128 스레드, 0-120% iorate
- 4K 임의 쓰기: 100% 쓰기, 64 스레드, 0-120% iorate
- 64K 순차 읽기: 100% 읽기, 16개 스레드, 0-120% iorate
- 64K 순차 쓰기: 100% 쓰기, 8개 스레드, 0-120% 속도
- 합성 데이터베이스: SQL 및 Oracle
- VDI 전체 클론 및 연결된 클론 추적
VDBench 테스트의 경우 vSAN의 Optane Supermicro 버전만 살펴보고 DR이 켜져 있는지(이하 DR이라고 함) 꺼졌는지(이하 Raw라고 함) 살펴보겠습니다. 피크 4K 임의 읽기에 대한 첫 번째 테스트에서 Raw는 대략 440K IOPS까지 밀리초 미만의 대기 시간을 가졌고 대기 시간이 521,599ms인 4.65 IOPS에서 정점에 도달했습니다. DR은 1ms 미만에서 시작된 후 406,322 IOPS에서 정점에 이르렀고 대기 시간은 7.32ms였습니다.
4K 랜덤 쓰기로 Raw는 1ms 라인을 탔지만 약 150K IOPS까지 그 아래에 머물렀고 대기 시간은 202,081ms로 8.4 IOPS로 정점을 찍었습니다. DR은 114밀리초 미만의 대기 시간으로 약 183,947K IOPS를 달성했으며 1.43ms 대기 시간으로 XNUMX IOPS로 정점에 도달한 후 성능이 급격히 떨어지고 대기 시간이 급증했습니다.
다음으로 64K 순차 워크로드를 살펴봅니다. 읽기의 경우 Raw는 약 54K IOPS 또는 3.5GB/s까지 밀리초 미만의 지연 시간 성능을 보였고 지연 시간은 85,319ms로 5.33 IOPS 또는 4.69GB/s로 정점을 찍었습니다. DR은 1ms 이상에서 시작하여 지연 시간이 73,583ms인 4.6 IOPS 또는 4.23GB/s에서 정점에 도달했습니다.
64K 쓰기의 경우 Raw는 12ms를 깨기 전에 약 1K IOPS에 도달했으며, 40,869ms의 대기 시간으로 2.55 IOPS 또는 5.58GB/s에서 정점에 도달했습니다. DR은 전반적으로 7,303밀리초 미만의 대기 시간 성능을 보였지만 대기 시간이 456μs인 623 IOPS 또는 XNUMXMB/s에서 정점에 도달했습니다.
SQL 워크로드로 이동하면 Raw는 약 330K IOPS까지 385,159밀리초 미만의 대기 시간을 가졌고 최대 2.34 IOPS에서 1ms의 대기 시간을 가졌습니다. DR은 321,504ms의 대기 시간과 함께 3.02 IOPS의 피크 표시로 거의 전체 시간 동안 XNUMXms 이상을 유지했습니다.
SQL 90-10의 경우 Raw는 300ms를 깨기 전에 약 1 IOPS에 이르렀고 대기 시간이 363,550인 2.52 IOPS에서 정점에 도달했습니다. DR은 299,132ms의 대기 시간과 함께 3.26 IOPS로 정점을 찍었습니다.
우리의 SQL 80-20 테스트는 Raw가 277ms 미만에서 1K IOPS 이상 실행되고 최대 332,949 IOPS에서 2.79ms의 대기 시간으로 실행되는 것을 확인했습니다. DR은 285,010ms의 대기 시간과 함께 3.42 IOPS로 정점을 찍었습니다.
다음은 Oracle 워크로드입니다. Raw는 약 262K IOPS까지 323,706밀리초 미만의 대기 시간을 가졌고 대기 시간이 3.27ms인 211,993 IOPS에서 정점에 도달했습니다. DR은 대기 시간이 2.07ms인 XNUMX IOPS로 정점에 도달한 후 다시 한 번 성능이 떨어지고 대기 시간이 급증했습니다.
Oracle 90-10의 경우 Raw는 약 315K IOPS까지 밀리초 미만의 대기 시간 성능을 보였고 최대 354,590 IOPS에서 대기 시간 1.67ms를 기록했습니다. DR은 279,356ms의 대기 시간과 함께 2.24 IOPS로 정점을 찍었습니다.
Oracle 80-20 테스트에서 Raw 실행은 대략 1K IOPS까지 273ms 미만에서 실행되었고 대기 시간은 322,616ms로 최대 1.85 IOPS까지 실행되었습니다. DR은 263,425 IOPS와 2.36ms의 대기 시간에서 정점을 찍을 수 있었습니다.
다음으로 VDI 클론 테스트인 Full and Linked로 전환했습니다. VDI 전체 클론 부팅의 경우 Raw는 약 240K IOPS까지 293,335밀리초 미만의 지연 시간 성능을 보였고 3.3 IOPS와 181,527ms의 지연 시간에서 정점에 도달했습니다. DR은 5.31 IOPS로 정점에 이르렀고 지연 시간은 XNUMXms였습니다.
VDI FC 초기 로그인은 원시 시작 시간이 1ms에 가까웠고 약간 감소하기 전에 대기 시간이 153,513ms인 5.6 IOPS에서 빠르게 최고점을 통과했습니다. DR은 성능이 떨어지고 대기 시간이 급증하기 전에 약 68K IOPS 및 5.3ms 대기 시간으로 더 일찍 최고조에 달했습니다.
VDI FC 월요일 로그인을 통해 Raw는 약 58K IOPS까지 밀리초 미만의 대기 시간을 가졌고 대기 시간이 152,660ms인 3.14 IOPS에서 정점에 도달했습니다. DR은 최대 대기 시간(1.64ms)이 더 좋았지만 성능은 64,201 IOPS에 불과했습니다.
VDI LC 부팅의 경우 Raw는 약 170K IOPS까지 실행되는 밀리초 미만의 대기 시간이 있었고 대기 시간이 209,676ms인 2.21 IOPS에서 정점에 도달했습니다. DR을 사용하면 119,036 IOPS와 3.99ms의 대기 시간으로 정점을 찍었습니다.
VDI LC 초기 로그인으로 이동하면 Raw는 1K IOPS까지 29ms 미만을 유지했고 대기 시간은 92,951ms로 2.62 IOPS에서 정점에 도달했습니다. DR의 경우 약 64ms의 대기 시간과 함께 2.3K IOPS 바로 아래에서 정점을 찍었습니다.
마지막으로 VDI LC 월요일 로그인을 살펴보면 Raw는 약 35K IOPS까지 도달한 후 1ms를 깨고 101,997ms의 대기 시간으로 4.65 IOPS에 도달했습니다. DR을 사용하면 성능이 떨어지기 전 최대 지연 시간이 47ms일 때 약 1.82K IOPS였습니다.
결론
VMware의 하이퍼 컨버지드 스토리지 솔루션은 다양한 형태와 형태로 제공됩니다. 이 특정 반복은 컴퓨팅을 위해 2029개의 Supermicro 24U-TN4R4800T+ 서버를 사용합니다. 스토리지의 경우 이 버전의 vSAN은 Intel Optane P4500X SSD 형태의 Intel Optane과 Intel PXNUMX SSD 형태의 NVME 스토리지를 모두 활용합니다. 이 특정 빌드는 Intel의 새로운 선택 솔루션, 특히 VMware vSAN용 Intel 선택 솔루션의 일부입니다. 필요한 성능 지표를 달성하기 위해 VMware와 Intel 모두에서 인증을 받은 vSAN ReadyNode로 생각할 수 있습니다.
성능을 살펴보면, 애플리케이션 워크로드 분석에서 우리는 Dell/Toshiba 장비에서 이전에 테스트한 vSAN의 올플래시 버전과 vSAN의 Optane 버전을 비교했습니다. SQL Sever의 경우 Optane 구성은 데이터 축소(DR)를 켜고 껐을 때 거의 동일한 점수를 나타냈으며 총 점수는 DR이 없을 때 12,605 TPS, DR이 있을 때 12,604 TPS였습니다. 이것은 DR이 켜진(11,969TPS) 올플래시, 비 Optane 버전에 비해 상당히 큰 도약을 의미합니다. 대기 시간을 살펴보면 Optane 버전은 총 점수가 DR 없이 16.5ms, DR을 켠 상태에서 17ms로 크게 개선되었으며 이는 vSAN 6.2의 SAS 올플래시 버전 대기 시간의 절반도 되지 않습니다. Sysbench를 사용하면 vSAN의 Optane 버전은 총 점수가 10,699 TPS Raw이고 DR이 켜진 상태에서 8,668 TPS로 올플래시 버전의 TPS가 두 배 이상 높았습니다. 이 추세는 대기 시간과 최악의 시나리오 대기 시간으로 계속됩니다. 두 경우 모두 집계 점수가 평균 DR이 있는 경우 24ms 및 30ms이고 최악의 경우 DR이 있는 경우 60ms 및 71ms입니다.
VDBench의 경우 Optane vSAN은 4K IOPS의 522K 읽기, 4K IOPS의 202K 쓰기, 64GB/s의 5.33K 읽기 및 64GB/s의 2.55K 쓰기를 포함하여 Raw 성능에 대한 몇 가지 하이라이트를 가졌습니다. DR을 켠 상태에서 vSAN은 406K IOPS 4K 읽기, 184K IOPS 쓰기(이후 급격한 하락), 4.6K에서 64GB/s 읽기, 456K에서 64MB/s 쓰기만 기록했지만 대기 시간은 1ms 미만이었습니다. vSAN은 SQL에서 385K IOPS, 364-90에서 10K IOPS, 333-80에서 20K IOPS를 기록하는 강력한 성능과 DR에서 322K IOPS, 299-90에서 10K IOPS, 285-80에서 20K IOPS로 계속해서 강력한 성능을 보였습니다. Oracle에서 Raw는 324K IOPS, 355-90에서 10K IOPS, 323-80에서 20K IOPS로 상당히 강력한 성능을 보였습니다. DR은 또한 Oracle에서 212K IOPS(떨어지기 전), 279-90에서 10K IOPS, 263-80에서 20K IOPS로 강력했습니다.
Optane SSD를 포함하면 vSAN의 쓰기 성능에 큰 영향을 미칩니다. 이는 드라이브가 375GB에 불과하고 vSAN이 쓰기 계층 드라이브에 대해 600GB 용량을 지원한다는 점을 고려한 것입니다. 따라서 더 큰 드라이브를 사용하여 쓰기 성능을 조금 더 높일 수 있습니다. 더 빠른 상호 연결이 검증되고 더 공격적인 RAM 및 CPU 구성이 Plus 옵션에서와 같이 사용되기 때문에 이러한 Intel 구성에 대한 상당한 잠재력도 있습니다. 인텔은 또한 현재 읽기 계층에 사용할 수 있는 더 빠르고 더 나은 드라이브를 보유하고 있습니다. P4510은 P4500에 비해 크게 개선되었습니다. 요점은 이 데이터를 Optane이 할 수 있는 최선의 것으로 간주하기보다는 필요한 경우 더 많은 것을 제공할 수 있는 미드레인지 서버 구성의 기준을 설정하는 것에 관한 것입니다. vSAN이 시장에 출시될 때 새로운 스토리지 및 서버 기술의 이점을 지속적으로 누릴 수 있는 좋은 위치에 있다는 점을 고려하는 것도 중요합니다. 이는 기존 어플라이언스 벤더가 달성하기 훨씬 더 어려운 일입니다.
그러나 vSAN이 성숙함에 따라 VMware는 Intel Optane SSD와 같은 새로운 기술의 선두에 서기 위해 현명해졌습니다. 이는 HCI 시장에서 어떤 성능을 보일 수 있는지에 대해 vSAN에 상당한 이점을 제공합니다. 많은 HCI 솔루션이 중간 수준의 성능 프로파일을 가진 ROBO 사용 사례의 요구 사항을 기꺼이 충족하는 반면, vSAN은 차세대 데이터 센터를 위한 기반을 마련하고 있기 때문에 에지에서도 똑같이 만족하는 솔루션을 만들기 위해 최고의 파트너를 계속 찾고 있습니다. SDDC 세계에서처럼 보입니다. Optane 기반 vSAN 클러스터는 후자에 매우 적합하며 모든 애플리케이션 워크로드에 대해 가능한 최상의 쓰기 지연 시간을 제공합니다.