홈페이지 Enterprise 인텔 옵테인 DC 퍼시스턴트 메모리를 탑재한 슈퍼마이크로 슈퍼서버 첫 검토 검토

인텔 옵테인 DC 퍼시스턴트 메모리를 탑재한 슈퍼마이크로 슈퍼서버 첫 검토 검토

by 브라이언 빌러

Supermicro SuperServer 1029U-TN10RT는 1U 듀얼 프로세서 시스템입니다. 슈퍼마이크로는 가상화, 데이터베이스, 클라우드 컴퓨팅 및 고밀도 컴퓨팅 파워의 혜택을 받을 수 있는 기타와 같은 수많은 대중적인 사용 사례를 처리하기 위해 슈퍼서버를 설계했습니다. 이 시스템은 XNUMX세대 Intel Xeon Scalable CPU를 지원하도록 업데이트되었으며 다음을 지원하는 최초의 제품 중 하나입니다. Intel Optane DC 영구 메모리 모듈.


Supermicro SuperServer 1029U-TN10RT는 1U 듀얼 프로세서 시스템입니다. 슈퍼마이크로는 가상화, 데이터베이스, 클라우드 컴퓨팅 및 고밀도 컴퓨팅 파워의 혜택을 받을 수 있는 기타와 같은 수많은 대중적인 사용 사례를 처리하기 위해 슈퍼서버를 설계했습니다. 이 시스템은 XNUMX세대 Intel Xeon Scalable CPU를 지원하도록 업데이트되었으며 다음을 지원하는 최초의 제품 중 하나입니다. Intel Optane DC 영구 메모리 모듈 (피엠).

최신 Intel 데이터 센터 기술에 대한 지원 외에도 시스템은 전면에 있는 2.5개의 핫스왑 가능한 2인치 NVMe 베이를 통해 스토리지를 제공합니다. 내부적으로 Supermicro는 M.2 슬롯 24개, SATA 10개, NVMe 3.0개를 지원하지만 추가 M.16 슬롯은 옵션으로 추가할 수 있습니다. 이 보드는 10.5개의 DIMM 슬롯을 지원하며 DRAM과 함께 기존 방식으로 사용하거나 이 리뷰의 구성과 같이 PMEM과 함께 사용할 수 있습니다. 연결성을 살펴보면 시스템에는 XNUMX개의 XNUMXGBase-T LAN 포트가 내장되어 있습니다. XNUMX개의 PCI-E XNUMX xXNUMX(FH, XNUMX″L) 카드 슬롯을 통해 추가 연결을 위한 확장이 가능합니다.

언급한 바와 같이 검토 시스템에는 8268개의 DRAM 스틱 및 2.9개의 Intel Optane DC 영구 메모리 모듈과 함께 24개의 Intel Xeon Scalable 12(12GHz, 4C)이 있습니다. 영구 메모리 여정의 초기 단계이지만 보드의 모든 메모리 슬롯과 1개의 Intel CPU를 사용하는 DRAM에 대한 XNUMX:XNUMX 영구 메모리 구성은 일반적이고 권장되는 서버 구성이 될 가능성이 높습니다. 이러한 새로운 기술. 이러한 핵심 구성 요소 외에도 검토 중인 시스템에는 XNUMX가지가 포함됩니다. 인텔 DC P4510 NVMe SSD.

Supermicro SuperServer 1029U-TN10RT 사양

  • 섀시 – 울트라 1U SYS-1029U-TN10RT
  • CPU - 2 x Intel Xeon 확장 가능 8268(2.9GHz, 24C)
  • 스토리지 – 10 x Intel DC P4510 2TB NVMe SSD, 1DWPD
  • DRAM - 12 x 32GB DDR4-2933
  • 영구 메모리 – 12 x 128GB DDR4-2666 Intel Optane DC PMM
  • 네트워크 - 2GBaseT 10개

설계 및 구축

언급한 바와 같이 Supermicro SuperServer 1029U-TN10RT는 새로운 Intel Xeon Scalable 프로세서 1개를 수용할 수 있는 고밀도 2.5U 서버입니다. 장치 전면의 대부분은 총 3.0개의 XNUMX인치 NVMe 드라이브 베이로 채워져 있습니다. 오른쪽에는 전원 버튼, UID 버튼 및 상태 LED가 있는 제어판이 있습니다. 아래에는 XNUMX개의 USB XNUMX type-A 포트가 있습니다.

장치를 뒤쪽으로 뒤집으면 왼쪽에 10개의 PSU가 있고 그 뒤에 45GBase-T PJ3.0 LAN 포트 XNUMX개, USB XNUMX 포트 XNUMX개, IPMI 전용 LAN 포트 XNUMX개, 직렬 포트 XNUMX개, UID 표시기 및 스위치, 비디오 포트 XNUMX개가 있습니다. PCIe 슬롯.

전면에 있는 2.5인치 베이는 핫스왑이 가능하며 사용자는 주황색 탭을 쉽게 밀어 핸들을 확장하여 신속하게 제거/설치할 수 있습니다. 이 서버와 Supermicro의 다른 서버에서 주황색 캐디는 NVMe 지원을 나타냅니다.

2.5개의 10인치 베이가 장착된 SuperServer와 함께 리뷰 시스템에는 4510개의 Intel P2 XNUMXTB NVMe SSD가 제공되었습니다.

Intel Optane 영구 메모리 모듈은 기존 DRAM과 동일한 폼 팩터를 갖습니다. 추가 전원 케이블 연결이나 냉각이 필요하지 않습니다. 히트 스프레더는 퍼시스턴트 메모리 설계의 일부로 포함되며, 너비와 높이에 대해 DRAM 모듈과 동일한 설계 고려 사항을 따릅니다. 따라서 DRAM 슬롯 위에 공기 흐름 덮개가 있는 슬림형 서버에 대한 새로운 변경 사항을 볼 수 없습니다.

많은 Supermicro 서버와 마찬가지로 상단 덮개는 XNUMX개의 푸시 버튼과 후면의 부착 나사 제거로 쉽게 분리됩니다. 이를 통해 새 CPU, RAM, GPU 또는 기타 PCIe 장치 설치에 대한 빠른 액세스를 제공하고 이 검토에서 중요한 것은 Intel Optane DC PMM을 설치하는 것입니다.

퍼포먼스

새로운 Intel Optane DC 영구 메모리에 대한 첫 번째 살펴보기에서는 상당히 전통적인 형태로 성능을 측정하는 데 중점을 둡니다. 블록 스토리지 성능을 표준 NVMe SSD와 비교합니다. 영구 메모리가 작동하는 다양한 모드가 있지만 가까운 장래에 메모리 모드 및 앱 다이렉트 바이트 수준을 둘러싼 특정 사용 사례에 집중할 계획입니다. 구체적으로 우리는 12개의 Intel P128 6TB NVMe SSD에 대해 10개의 풀에 구성된 4510개의 2GB 영구 메모리 모듈(CPU당 XNUMX개)을 포지셔닝합니다. 이 시나리오의 벤치마크 애플리케이션은 데이터베이스 워크로드 프로필뿐만 아니라 Four Corners 워크로드와 함께 여전히 vdbench를 사용하고 있습니다. 앞으로 우리는 영구 메모리를 직접 사용하는 데이터베이스 애플리케이션뿐만 아니라 FIO로 다시 전환할 것입니다.

벤치마크 기술 구성 측면에서 6개의 영구 메모리 모듈을 함께 그룹화하여 단일 풀(CPU당 하나의 풀)을 형성하고 전체 풀 공간을 영구 메모리 네임스페이스에 할당합니다. 그런 다음 OS 수준에서 원시 영구 메모리 모듈을 미리 채우고 전체 크기의 50%로 분할하고 더 작은 섹션에서 워크로드를 수행합니다. 그런 다음 애플리케이션 데이터 세트가 작동하는 방식을 모방하는 지속적인 성능을 보여주기 위해 워크로드를 적용합니다.

첫 번째 테스트는 4K 랜덤 읽기 테스트입니다. 여기서 영구 메모리는 1,371,386μs에서 4.6 IOPS에서 시작하여 단 13,169,761μs의 대기 시간에서 12.1 IOPS로 정점에 도달했습니다. Intel NVMe 드라이브가 잘 작동했지만 최고 5,263,647 IOPS와 191.4μs의 대기 시간은 PMM이 두 배 이상의 처리량과 NVMe 드라이브의 6%에 불과한 대기 시간으로 확실히 압도했습니다.

4K 랜덤 쓰기를 보면 쓰기와 관련하여 기술의 한계를 알 수 있습니다. 위의 성능이 극적으로 향상되었음을 보여주므로 영구 메모리는 쓰기에서 훨씬 더 빠르게 최고점에 도달합니다. 여기에서 영구 메모리는 대기 시간 162,642μs의 8.9 IOPS에서 시작하여 약 980μs 대기 시간에서 약 60K IOPS에 도달한 후 감소했습니다.

순차 워크로드로 전환하면 64K 읽기에서 Optane DC PMM은 106,739μs의 대기 시간에서 6.67 IOPS 또는 31.9GB/s에서 시작하여 1,055,634μs의 대기 시간에서 65.98 IOPS 또는 57.2GB/s에서 정점에 도달했습니다. 다시 NVMe 드라이브는 431,252μs의 대기 시간에서 26.6 IOPS 또는 721.5GB/s의 최고 점수로 좋은 성능을 보였지만 영구 메모리에 미치지 못했습니다.

64K 순차 쓰기에서 영구 메모리는 대기 시간 52,472μs에서 1.64 IOPS 또는 78.8GB/s에서 시작했습니다. 영구 메모리 모듈은 255,405μs의 대기 시간에서 15.96 IOPS 또는 121.8GB/s로 정점을 찍었습니다. 이는 드라이브가 포화 지점에 도달하거나 초과함에 따라 대기 시간이 급증한 Intel P4510 그룹과 대조됩니다.

다음은 SQL, SQL 90-20 및 SQL 80-20을 포함한 SQL VDBench 테스트입니다. SQL의 경우 영구 메모리는 547,821μs 대기 시간에서 6.4 IOPS로 시작하여 5,095,690μs 대기 시간에서 10.7 IOPS로 정점에 도달했습니다. NVMe 드라이브는 다시 188,170 IOPS 및 170µs의 최고 성능으로 강력한 성능을 보였습니다.

SQL 90-10의 경우 대기 시간에 대해서는 의문의 여지가 없지만 두 가지 비교는 처리량에서 조금 더 가깝습니다. 영구 메모리는 대기 시간이 더 낮습니다. 영구 메모리는 대기 시간 169,874μs의 8.1 IOPS에서 시작하여 대기 시간 1,911,900μs의 NVMe 피크 27.1 IOPS와 비교하여 대기 시간 1,612,337μs의 189.8 IOPS에서 정점을 찍었습니다.

SQL 80-20의 경우 영구 메모리는 65.3μs의 대기 시간에서 NVMe 드라이브의 처리량인 668,983 IOPS에 비해 최대 지연 시간(1,482,554μs)이 더 좋았지만 처리량(206 IOPS)이 훨씬 낮았습니다.

이 검토를 위한 최종 테스트 배치는 Oracle 워크로드, Oracle, Oracle 90-10 및 Oracle 80-20입니다. Oracle 테스트는 영구 메모리가 453,449μs의 대기 시간과 함께 103 IOPS에서 조기에 정점에 도달하는 것으로 나타났습니다. NVMe 드라이브는 1,366,615μs의 대기 시간과 함께 225.8 IOPS에서 최고조에 달할 수 있었습니다.

Oracle 90-10의 경우 영구 메모리는 대기 시간이 181,455μs인 7.8 IOPS에서 시작하여 대기 시간이 2,080,543μs인 16.9 IOPS에서 정점에 도달했습니다. 1,357,112μs의 대기 시간으로 157.1 IOPS에서 정점을 찍은 NVMe 드라이브의 성능을 다시 한 번 압도했습니다.

마지막으로 Oracle 80-20의 영구 메모리는 대기 시간 225,492μs에서 8.5 IOPS로 시작하여 대기 시간 1,146,229μs에서 30.4 IOPS로 정점에 도달했습니다. NVMe 드라이브는 처리량이 1,265,479 IOPS로 낮았지만 지연 시간은 165.9μs로 훨씬 더 컸습니다.

결론

Supermicro SuperServer 1029U-TN10RT는 10U 풋프린트에 맞는 2.5개의 1인치 NVMe 드라이브 베이가 있는 듀얼 소켓 시스템입니다. 2.5인치 NVMe 드라이브 베이 외에도 서버는 2개의 M.24 스토리지 슬롯, 하나는 SATA 및 다른 NVMe로 구성할 수 있습니다. 이 서버는 가상화, 데이터베이스 및 클라우드 컴퓨팅을 위해 설계되었으며, 그 중에서도 높은 컴퓨팅 성능을 갖춘 고밀도 폼 팩터를 활용하는 다른 사용 사례가 있습니다. 컴퓨팅에 대해 말하자면, 이 서버는 새로 출시된 XNUMX세대 Intel Xeon Scalable CPU를 지원합니다. CPU 옆에는 XNUMX개의 DIMM 슬롯이 있습니다. 이 서버를 많은 DRAM으로 포장하는 것 외에도 새로운 CPU에 대한 지원은 Intel의 새로운 Optane DC 영구 메모리 모듈에 대한 지원을 의미합니다.

성능을 살펴보면 Intel 영구 메모리 모듈은 우리 연구실에서 아직 볼 수 없는 수준의 성능을 달성할 수 있었습니다. 인텔은 현재 영구 메모리를 사용하는 거의 유일한 게임이기 때문에 비교할 경쟁자나 이전 버전이 없습니다. 대신 우리는 새로운 기술을 활용할 때 무엇을 기대할 수 있는지에 대한 예로 Intel P4510 2TB NVMe 드라이브와 비교했습니다. 읽기에서 PMM은 4K 읽기가 단 13.2μs 대기 시간에서 12.1만 IOPS이고 64K 순차 읽기가 단 66μs 대기 시간에서 57.2GB/s에 도달하는 NVMe 기술을 날려 버렸습니다. 랜덤 쓰기는 영구 메모리가 NVMe 드라이브보다 훨씬 낮은 최대 980K IOPS와 약 60μs의 대기 시간을 빠르게 증가시키는 기술의 한계를 보았습니다. 그러나 64K 쓰기에서는 영구 메모리가 15.96μs의 대기 시간에서 121.8GB/s로 우세한 것으로 나타났습니다. SQL 벤치마크의 경우 영구 메모리는 SQL(5,095,690μs 대기 시간에서 10.7 IOPS) 및 SQL 90-10(1,911,900μs 대기 시간에서 27.1 IOPS)에서 NVMe 드라이브를 압도했습니다. Oracle 테스트에서 Persistent Memory는 Oracle 90-10에서 훨씬 더 높은 점수(2,080,543 IOPS, 지연 시간 16.9μs)를 보였지만 처리량 측면에서 다른 두 테스트에서는 뒤처졌습니다. 주목해야 할 것은 대기 시간입니다. 영구 메모리의 최고 피크 지연 시간은 103μs이고 최저 피크 지연 시간은 10.7μs입니다.

이 검토에서 초기 결과를 볼 때 매우 열광적인 모든 이유가 분명히 있습니다. 우리는 전체적으로 새로운 Xeon Scalable CPU의 향상을 보았지만 여기서는 물론 Optane DC 영구 메모리 모듈이 별입니다. 언급한 바와 같이 이 최초 검토는 영구 메모리가 있는 시스템을 평가하는 방법에 대한 중단점이 아닙니다. 그것은 단지 시작일 뿐입니다. 우리는 현재 이 시스템의 애플리케이션 성능을 보다 심층적으로 살펴보기 위한 작업을 진행 중이며 앱 다이렉트 및 메모리 모드 모두에서 Intel Optane DC 영구 메모리를 평가하기 위한 한계와 모범 사례를 계속해서 추진할 것입니다. 하지만 지금은 이 키트를 매우 빠르고 포괄적으로 조립한 Supermicro와 그들의 엔지니어링 팀에 큰 찬사를 보냅니다. 이것은 일련의 재미있는 리뷰가 될 것입니다.

Supermicro SuperServer 1029U-TN10RT 제품 페이지

이 리뷰에 대해 토론하기