Dell EMC PowerEdge C6525는 HPC 워크로드와 같은 고성능 고밀도 컴퓨팅 환경에 대한 요구 사항을 해결하도록 설계된 2U 서버입니다. 이름/번호가 "5"로 끝나면 C6525가 AMD EPYC 기반 서버임을 나타냅니다. 7002 그리고 7003. 후자는 더 높은 성능(더 많은 코어 및 스레드), 더 많은 RAM 용량 및 PCIe Gen4 기능과 함께 제공됩니다. C6525에는 총 512개의 코어, 1024개의 스레드 및 8U 클러스터에서 최대 2TB의 메모리에 대해 각각 XNUMX개의 AMD EPYC CPU를 허용하는 XNUMX개의 노드가 있습니다.
Dell EMC PowerEdge C6525는 HPC 워크로드와 같은 고성능 고밀도 컴퓨팅 환경에 대한 요구 사항을 해결하도록 설계된 2U 서버입니다. 이름/번호가 "5"로 끝나면 C6525가 AMD EPYC 기반 서버임을 나타냅니다. 7002 그리고 7003. 후자는 더 높은 성능(더 많은 코어 및 스레드), 더 많은 RAM 용량 및 PCIe Gen4 기능과 함께 제공됩니다. C6525에는 총 512개의 코어, 1024개의 스레드 및 8U 클러스터에서 최대 2TB의 메모리에 대해 각각 XNUMX개의 AMD EPYC CPU를 허용하는 XNUMX개의 노드가 있습니다.
C 시리즈이기 때문에 이 서버는 클라우드에 중점을 둡니다. 이 서버의 많은 비밀 소스는 하드웨어 설계에 있습니다. 설계 및 빌드 섹션에서 이에 대해 자세히 살펴보겠습니다. 그러나 간단히 말해서, 이 2U 폼 팩터 내에서 Dell Technologies는 각각 XNUMX개의 AMD EPYC CPU 또는 총 XNUMX개의 노드를 포함할 수 있는 XNUMX개의 노드를 배치할 수 있었습니다. 이것은 매우 조밀한 컴퓨팅(디지털 제조, 연구 및 웹 기술에 적합)을 가능하게 하지만 전체 스토리지와 같은 다른 옵션을 제한할 수 있습니다. 주어진 사용 사례에서는 덜 우려됩니다.
Dell과 마찬가지로 Dell EMC PowerEdge C6525는 Dell EMC OpenManage, iDRAC 및 vSphere 사용을 포함하여 뛰어난 보안 및 관리 옵션을 제공합니다. 보안은 AMD SME(Secure Memory Encryption) 및 SEV(Secure Encrypted Virtualization)를 사용하여 더욱 강화됩니다. 서버는 실리콘 신뢰 루트를 활용하고 디지털 서명된 펌웨어 패키지로 서버 펌웨어 안전을 유지합니다.
Dell EMC PowerEdge C6525 사양
프로세서 | 프로세서당 최대 2개의 코어 및 최대 3W(TDP)의 노드 구성당 64개 또는 280개의 XNUMX세대 또는 XNUMX세대 AMD EPYC 프로세서 |
메모리 | 최대 16개의 DDR4 최대 RDIMM 2TB 최대 LRDIMM 2TB 최대 3200MT/S의 대역폭 |
유효성 | 핫플러그 예비 하드 드라이브, 팬, PSU |
컨트롤러 | HW RAID: H10.4, H745, HBA345 칩셋용 PERC 345 포트 SW RAID(S150): 예 |
드라이브 베이 | 노드당 최대 2.5개의 SAS/SATA 드라이브, 섀시당 최대 6개의 24인치 다이렉트 백플레인 구성 노드당 최대 2.5개의 NVMe 드라이브 및 2개의 SAS/SATA 드라이브가 있는 4인치 NVMe 백플레인 구성. 섀시당 최대 총 24개의 드라이브 노드당 최대 3.5개의 SAS/SATA 드라이브, 섀시당 최대 3개의 12인치 다이렉트 백플레인 구성 내부: microSD 카드 | M.2 SATA 보스 1.0 |
Power Supplies | 이중 핫플러그 예비 2000W 및 2400W AC 전원 공급 장치 이중 핫플러그 중복 2000W AC/DC 혼합 모드 전원 공급 장치 냉각 옵션: 공기 냉각, 직접 액체 냉각(DLC) |
팬 | 핫플러그 팬 |
크기 | 높이: 86.8mm(3.4인치) 너비: 448.0mm(17.6인치) 깊이: 790.0mm(31.1”) 무게45.53kg(100.3lbs) 3.5인치 다이렉트 백플레인 섀시 41.5kg(91.4lbs) 2.5” 다이렉트/NVMe 백플레인 섀시 35.15kg(77.4lbs) 백플레인 섀시 없음 |
랙 유닛 | 2U/4N 랙 서버 |
임베디드 관리 | iDRAC9 RedfishiDRAC Direct를 사용한 iDRAC RESTful API |
내장형 NIC | 단일 포트 1GbE LOM |
네트워킹 옵션(NDC) | OCP 1 3.0개 |
GPU 옵션 | 1x 싱글 와이드 GPU |
포트 | 후면 포트: iDRAC Direct 마이크로 USB 포트 1개 미니 디스플레이 포트 1개 iDRAC 또는 NIC 포트 1개 1 X USB 포트 3.0 |
PCIe | 2x PCIe x16 Gen4 라이저 1x OCP 3.0 x16 Gen4 1x PCIe x8 Gen3 M.2 라이저 |
운영 체제 및 하이퍼바이저 | 정식 우분투 서버 LTS RHEL 8.0 커널 기반 CentOS Citrix 하이퍼 바이저 Hyper-V가 포함된 Microsoft Windows Server Red Hat Enterprise Linux SUSE Linux Enterprise 서버 VM웨어 ESXi를 |
Dell EMC PowerEdge C6525 설계 및 구축
명시된 바와 같이 Dell EMC PowerEdge C6525는 2U 서버입니다. 구성에 따라 서버 전면에는 24개의 2.5" 베이 또는 12개의 3.5" 베이가 있습니다. 양쪽에는 전원 버튼 및 LED 표시등과 같은 기능이 있는 제어판이 있습니다. 오른쪽에 정보 태그가 있습니다.
서버를 뒤쪽으로 뒤집으면 3.0개의 노드가 보입니다. 각각 상단에 3.0개의 PCIe 슬롯, 중간에 슬레드 분리 핸들, 오른쪽에 잠금 장치가 있습니다. 각 슬레드의 오른쪽 하단에는 OCP XNUMX SFF 카드 슬롯도 있습니다. 연결을 위해 USB XNUMX 포트, iDRAC 또는 NIC 포트, Mini 디스플레이 포트 및 iDRAC Direct Micro-USB 포트가 있습니다. 슬레드에는 시스템 식별 LED와 EST 태그도 있습니다.
슬레드를 꺼내면 두 개의 프로세서와 주변 RAM을 볼 수 있습니다. CPU 사이에는 공기 덮개가 있습니다. CPU 근처에는 전면 드라이브 베이를 사용하지 않고 부팅 드라이브용 M.2 라이저가 있습니다.
Dell EMC PowerEdge C6525 관리
우리는 과거에 iDRAC를 여러 번 다루었고 여기에서 깊이있게. 또한 Dell EMC PowerEdge C6525 관리를 위해 iDRAC를 사용했습니다. 각 노드는 주변 노드나 섀시에 대한 많은 인식 없이 개별적으로 관리됩니다. 이는 해당 계층을 포함하는 Dell EMC FX2와 같은 플랫폼과 대조됩니다. 이 애플리케이션의 경우 노드 간에 리소스를 공유하지 않는 것은 그다지 중요하지 않습니다.
팬 제어와 같은 하드웨어 요소 공유의 경우 수요가 가장 높은 노드가 냉각 프로필 측면에서 우선합니다. 하나의 노드가 뜨겁고 XNUMX개는 차가운 경우 섀시는 모두 뜨거운 것처럼 응답합니다. 먼저 대시보드입니다. 여기에서 사용자는 시스템 도움말, 정보, 작업 요약 및 최근 로그를 포함한 모든 것에 대한 빠른 개요를 얻습니다. 서버를 정상적으로 종료하는 기능도 여기에서 찾을 수 있습니다.
시스템 탭에서 다양한 구성 요소를 볼 수 있습니다. CPU/가속기를 클릭하면 각 노드에서 실행 중인 CPU를 확인할 수 있습니다(이 경우 AMD EPYC 7452).
PowerEdge 서버의 큰 특징은 열을 발생시키는 고성능 부품을 실행하면서 냉각 상태를 유지하는 능력입니다. 최대 성능을 위해 설정할 수 있지만 항상 그런 방식으로 서버를 실행할 필요는 없습니다. 대신 사용자는 구성으로 이동하여 필요에 맞게 냉각 구성을 조정할 수 있습니다.
Dell이 플랫폼을 보다 쉽게 관리할 수 있도록 하는 방법은 iDRAC를 사용하여 수동으로 BIOS 자체에 들어가지 않고도 각 노드에 대한 BIOS 수준 변경을 수행하는 것입니다. 변경 사항이 예약되면 다음 재부팅 시 적용됩니다.
Dell EMC PowerEdge C6525 성능
Dell EMC PowerEdge C6525 구성, 각각 다음을 포함하는 4개의 노드:
- 2 X AMD EPYC 7452 CPU
- 128GB DDR4 RAM
- 2 X 마이크론 9300 3.84TB NVMe SSD
- M.1 부트 SSD 2개
시스벤치 MySQL 성능
첫 번째 로컬 스토리지 애플리케이션 벤치마크는 SysBench를 통해 측정된 Percona MySQL OLTP 데이터베이스로 구성됩니다. 이 테스트는 평균 TPS(Transactions Per Second), 평균 대기 시간 및 평균 99번째 백분위수 대기 시간도 측정합니다.
각 Sysbench VM은 92개의 vDisk로 구성됩니다. 하나는 부팅용(~447GB), 하나는 사전 구축된 데이터베이스(~270GB), 세 번째는 테스트 중인 데이터베이스용(16GB)입니다. 시스템 리소스 관점에서 각 VM을 vCPU 60개, DRAM XNUMXGB로 구성하고 LSI Logic SAS SCSI 컨트롤러를 활용했습니다.
Sysbench 테스트 구성(VM당)
- 센트OS 6.3 64비트
- 페르코나 XtraDB 5.5.30-rel30.1
-
- 데이터베이스 테이블: 100
- 데이터베이스 크기: 10,000,000
- 데이터베이스 스레드: 32
- RAM 버퍼: 24GB
- 시험 시간: 3시간
-
- 2시간 동안 32개 스레드 사전 조정
- 1시간 32 스레드
Sysbench OLTP를 통해 우리는 개별 노드가 49,701 TPS에서 12,170 TPS 사이의 집계에 도달하는 12,606 TPS의 총 점수를 확인했습니다. 최고급 CPU와 약간의 DRAM이 없어도 Dell EMC C6525는 2U 설치 공간에서 엄청난 성능을 제공했습니다.
평균 대기 시간을 통해 개별 노드가 10.3ms에서 10.15ms 사이에 도달하는 총 집계가 10.51ms임을 확인했습니다.
최악의 시나리오 대기 시간(99번째 백분위수)의 경우 C6525는 개별 노드가 18.3ms에서 18.01ms에 도달하는 총 18.8ms에 불과했습니다.
VDBench 워크로드 분석
스토리지 어레이를 벤치마킹할 때는 애플리케이션 테스트가 가장 좋고 합성 테스트가 두 번째입니다. 실제 워크로드를 완벽하게 표현하는 것은 아니지만 합성 테스트는 경쟁 솔루션 간의 비교를 쉽게 할 수 있는 반복성 요소를 사용하여 스토리지 장치의 기준선을 만드는 데 도움이 됩니다.
이러한 워크로드는 "포 코너" 테스트, 공통 데이터베이스 전송 크기 테스트, 다양한 VDI 환경의 트레이스 캡처에 이르는 다양한 테스트 프로필을 제공합니다. 이러한 모든 테스트는 스크립팅 엔진과 함께 공통 vdBench 워크로드 생성기를 활용하여 대규모 컴퓨팅 테스트 클러스터에서 결과를 자동화하고 캡처합니다. 이를 통해 플래시 어레이 및 개별 스토리지 장치를 포함한 광범위한 스토리지 장치에서 동일한 워크로드를 반복할 수 있습니다.
프로필 :
- 4K 임의 읽기: 100% 읽기, 128 스레드, 0-120% iorate
- 4K 임의 쓰기: 100% 쓰기, 128 스레드, 0-120% iorate
- 64K 순차 읽기: 100% 읽기, 32개 스레드, 0-120% iorate
- 64K 순차 쓰기: 100% 쓰기, 16개 스레드, 0-120% 속도
- 합성 데이터베이스: SQL 및 Oracle
- VDI 전체 클론 및 연결된 클론 추적
VDBench 성능을 위해 각 노드와 성능 및 집계 방식을 살펴봅니다.
무작위 4K 읽기를 보면 모든 노드가 거의 동일하게 수행되었으며 단일 노드는 1,320,861µs의 대기 시간에서 최대 191 IOPS를 기록했습니다. 모든 노드의 집계는 약 5.2만 IOPS입니다.
4K 랜덤 쓰기에서 각 노드의 SSD는 서로 가깝게 추적되지 않았습니다. 노드 4는 411,075µs의 대기 시간에서 337 IOPS로 가장 높았습니다. 최대 집계는 1.2만 IOPS 이상입니다.
64K 워크로드를 사용하여 순차적 작업으로 전환하면서 읽기에서 다시 한 번 노드가 훨씬 더 가깝게 추적되는 것을 보았습니다. 단일 노드의 최고 피크는 107µs의 대기 시간에서 약 6.7K IOPS 또는 488GB/s였습니다. 총 점수는 약 428K IOPS 또는 26.8GB/s입니다.
64K 쓰기로 각 노드의 성능이 다시 한 번 차이가 나는 것을 볼 수 있습니다. 단일 노드의 최고 피크는 4µs의 대기 시간에서 38,504 IOPS 또는 2.4GB/s의 노드 828입니다. 모든 최고 점수를 합치면 137K IOPS 또는 8.5GB/s가 됩니다.
다음 테스트 세트는 SQL, SQL 90-10 및 SQL 80-20과 같은 SQL 워크로드입니다. SQL부터 시작하여 Dell EMC PowerEdge C6525의 409,064개 노드 모두 다시 한 번 매우 근접했습니다. 가장 높은 단일 노드 피크는 157µs에서 1.6 IOPS였습니다. 집계 피크는 IOPS를 XNUMX만 이상으로 끌어올립니다.
SQL 90-10을 사용하면 노드 4가 391,425µs의 대기 시간에서 최고 154 IOPS로 한 번 더 앞서 나가는 끝까지 노드가 어느 정도 함께 이동했습니다. 결합된 피크는 1.5만 IOPS 이상입니다.
SQL 80-20은 노드가 약간 다르게 수행되는 것을 확인했습니다. 노드 2는 340,626µs의 대기 시간에서 176 IOPS로 가장 높았습니다. 결합하면 모든 노드가 1.34만 IOPS 이상의 성능을 제공합니다.
다음은 Oracle 워크로드인 Oracle, Oracle 90-10 및 Oracle 80-20입니다. Oracle을 시작으로 신뢰할 수 있는 4번으로 서로 추적된 327,398개의 노드는 188µs의 대기 시간과 함께 1.26 IOPS로 가장 높았습니다. 이렇게 하면 총 성능이 XNUMX만 IOPS 이상입니다.
Oracle 90-10은 노드 4가 325,058µs의 대기 시간에서 다시 한 번 132 IOPS로 최고점을 기록했지만 대부분의 경우 노드를 더 긴밀하게 정렬했습니다. 결합된 성능은 1.25만 IOPS 이상입니다.
Oracle 80-20을 보면 여기에서 노드가 약간 더 떨어져 있지만 거의 같은 줄에 속합니다. 노드 4는 297,033 IOPS로 1.1위를 차지합니다. 총 성능은 XNUMX만 IOPS 이상입니다.
다음으로 VDI 클론 테스트인 Full and Linked로 전환했습니다. VDI 전체 클론(FC) 부팅의 경우 4개 노드 모두 매우 근접하게 실행되었으며 행운의 노드 312,464는 가장 높은 202 IOPS와 1.2µs의 대기 시간을 기록했습니다. 피크를 합치면 XNUMX만 IOPS가 넘습니다.
VDI FC 초기 로그인을 사용하면 마지막에 노드가 분리됩니다. 노드 4는 84,792µs의 대기 시간에서 449 IOPS로 가장 높았습니다. 결합된 성능은 331K IOPS 이상입니다.
VDI FC 월요일 로그인은 끝 무렵에 노드 성능의 또 다른 차이를 보았습니다. 최고의 단일 노드 성능은 84,346µs의 대기 시간에서 310 IOPS였습니다. 총 성능은 323K IOPS 이상이었습니다.
VDI LC(Linked Clone) 부팅의 경우 노드가 다시 한 번 매우 유사한 성능으로 실행되었습니다. 단일 노드는 158,820µs의 대기 시간에서 196 IOPS로 정점을 찍었습니다. 결합된 성능은 628K IOPS 이상으로 나타났습니다.
VDI LC 초기 로그인은 끝 부분에서 노드 성능에 약간의 차이가 있음을 확인했습니다. 단일 노드 최고 피크는 대기 시간 48,484µs에서 272 IOPS였습니다. 총 성능은 181K IOPS 이상을 제공합니다.
마지막으로 VDI LC 월요일 로그인을 통해 노드의 성능이 다른 것을 확인했습니다. 최고의 단일 노드 성능은 약 53K IOPS 및 450µs였습니다. 결합된 최고 성능은 197K IOPS 이상이었습니다.
결론
Dell EMC PowerEdge C6525는 클라우드 배포를 목표로 하는 2U 서버입니다. 서버는 밀도가 높고 XNUMX개의 노드를 포함하며 AMD EPYC CPU(여기에서 테스트한 CPU는 XNUMX 세대 그러나 Dell은 C6525를 제공하고 있습니다. XNUMX세대 EPYC 또한 총 512개의 코어와 1,024개의 스레드가 있습니다. CPU는 노드당 총 2TB의 DDR4 3200MT/S 메모리를 허용합니다. 각 노드는 AMD EPYC 프로세서 3.0개, PCIe 베이 2개, OCP 2.5 슬롯 6개, 부팅용 온보드 m.XNUMX SSD를 수용할 수 있습니다. 이것은 모든 종류의 컴퓨팅을 가능하게 하지만 서버에 들어갈 수 있는 스토리지의 양에는 제한이 있습니다. XNUMX인치 드라이브 섀시 구성을 사용하면 각 노드에 XNUMX개의 드라이브를 할당할 수 있으며 그 중 최대 XNUMX개는 적절한 백플레인이 있는 NVMe입니다.
애플리케이션 성능을 위해 VDBench를 살펴보았습니다. 두 개별 노드를 모두 테스트하고 총 점수를 살펴보았습니다. 이를 통해 사용자는 각 부품의 작동 방식과 전체 성능에 대한 그림을 볼 수 있습니다. Application Workload Analysis에서는 Sysbench만 실행했습니다. 거래에서 우리는 49,701 TPS의 총 점수를 보았습니다. 평균 대기 시간에서 서버는 10.3ms의 총 대기 시간을 제공했습니다. 최악의 시나리오에서 C6525의 총 점수는 18.3ms에 불과했습니다.
VDBench의 경우 5.2개 노드의 총 성능은 4K 읽기에서 1.2만 IOPS, 4K 쓰기에서 26.8만 IOPS, 64K 읽기에서 8.5GB/s, 64K 쓰기에서 1.6GB/s를 제공했습니다. SQL 워크로드에서 1.5만 IOPS, SQL 90-10에서 1.34만 IOPS, SQL 80-20에서 1.26만 IOPS의 최고치를 확인했습니다. Oracle에서 전체 서버는 1.25만 이상의 IOPS, Oracle 90-10에서는 1.1만 IOPS, Oracle 80-20에서는 1.2만 IOPS를 기록했습니다. 다음은 전체 및 연결된 VDI 클론 테스트였습니다. FC에서 부팅은 331만 IOPS, 초기 로그인은 약 323K IOPS, 월요일 로그인은 약 628K IOPS였습니다. LC 부팅은 약 181K IOPS, 초기 로그인은 197K IOPS, 월요일 로그인은 XNUMXK IOPS였습니다.
우리는 또한 VDBench에서 단일 노드 성능을 살펴보았는데, 여기에서 약간의 성능 변화가 나타났습니다. SSD 그룹 크기가 작을수록 이러한 변형의 대부분은 SSD 자체에 있을 가능성이 큽니다. 단일 노드 성능은 1.3K 읽기에서 4만 IOPS, 411K 쓰기에서 4K IOPS, 6.7K 읽기에서 64GB/s, 2.4K 쓰기에서 64GB/s를 제공했습니다. SQL 워크로드에서 최고 409K IOPS, SQL 391-90에서 10K IOPS, SQL 341-80에서 20K IOPS를 확인했습니다. Oracle에서 전체 서버는 327K IOPS, Oracle 325-90에서 10K IOPS, Oracle 297-80에서 20K IOPS를 기록했습니다. 다음은 전체 및 연결된 VDI 클론 테스트였습니다. FC에서 우리는 부팅 312K IOPS, 초기 로그인은 약 85K IOPS, 월요일 로그인은 약 84K IOPS를 보았습니다. LC 부팅은 약 159K IOPS, 초기 로그인은 48K IOPS, 월요일 로그인은 53K IOPS였습니다.
Dell EMC PowerEdge C6525는 2개의 노드와 최대 6525개의 AMD EPYC 프로세서를 수용할 수 있는 고밀도 6525U 서버입니다. 이 서버는 작은 공간에서 엄청난 성능을 제공할 수 있지만 스토리지 비용이 많이 듭니다. 궁극적으로 CXNUMX는 전력과 밀도의 엘리트 조합을 활용할 수 있는 컴퓨팅 집약적인 클라우드 사용 사례를 목표로 합니다. 이러한 콤보가 필요한 사용자에게 CXNUMX는 경이로운 옵션을 제공합니다.
StorageReview에 참여
뉴스레터 | 유튜브 | 팟캐스트 iTunes/스포티 파이 | 인스타그램 | 트위터 | 페이스북 | RSS 피드