지난 주 인텔은 3세대 제온 CPU, Optane SSD 스토리지를 포함하는 생태계 플레이를 기반으로 합니다. P5800X 그리고 물론 최신 200 시리즈 영구 메모리 모듈 (PMem). 초기 Intel 스토리지 검토를 마치고 실험실에 있는 Intel 서버와 스토리지 기술의 용도를 변경하기로 결정했습니다. Windows Server 2019를 설치하여 Optane PMem 200, Optane P5800X SSD 및 TLC NAND를 테스트했습니다. P5510 SSD 머리에 머리. 이 검토의 목적은 베어 메탈 시나리오에서 이러한 각 기술의 강점이 어디에 있는지 더 잘 이해할 수 있도록 Windows Server에서 인텔 스토리지 성능을 평가하는 것입니다.
지난 주 인텔은 3세대 제온 CPU, Optane SSD 스토리지를 포함하는 생태계 플레이를 기반으로 합니다. P5800X 그리고 물론 최신 200 시리즈 영구 메모리 모듈 (PMem). 초기 Intel 스토리지 검토를 마치고 실험실에 있는 Intel 서버와 스토리지 기술의 용도를 변경하기로 결정했습니다. Windows Server 2019를 설치하여 Optane PMem 200, Optane P5800X SSD 및 TLC NAND를 테스트했습니다. P5510 SSD 머리에 머리. 이 검토의 목적은 베어 메탈 시나리오에서 이러한 각 기술의 강점이 어디에 있는지 더 잘 이해할 수 있도록 Windows Server에서 인텔 스토리지 성능을 평가하는 것입니다.
Optane PMem 대 Optane SSD 대 NAND SSD
인텔이 오랫동안 선호하는 스토리지 피라미드에도 불구하고 특정 애플리케이션이나 사용 사례에 적합한 스토리지 기술에 대해서는 여전히 많은 질문이 있습니다. 물론 DRAM이 가장 빠르지만 불행히도 그만큼 비싸다. Optane PMem은 DRAM처럼 사용할 수 있어 재부팅 시 수분 보충이 필요하지 않은 영구 스토리지를 제공합니다. PMem은 또한 기존 DIMM 슬롯을 활용하므로 쉽게 삽입할 수 있습니다. 또한 PMem은 기존 SSD와 비교할 때 인상적인 성능 프로파일을 가지고 있습니다.
물론 쓰기를 흡수하도록 최적화된 Optane SSD도 있습니다. 이 작업은 기존 SSD가 어려움을 겪을 수 있습니다. 이것이 일반적으로 다중 계층 스토리지 아키텍처의 일부로 캐시 또는 계층화 풀로 사용되는 이유입니다. Optane SSD는 TLC NAND SSD보다 비싸고 엄청난 용량 단점이 있습니다. 예를 들어 P5800X는 1.6TB에서 최고입니다.
다음과 같은 TLC SSD가 있습니다. 인텔 P5510, 이는 달러당 성능에 가장 적합합니다. 마지막으로 플래시 영역에는 QLC SSD가 있습니다. 이들은 테라바이트당 가장 큰 용량과 가치를 제공하지만 읽기가 많은 환경에 있는 것을 선호하며, 쓰기를 집계하여 부드럽고 사랑스러운 방식으로 QLC SSD에 전달하는 캐시 또는 계층 뒤에 있는 경우에는 더욱 좋습니다. 거기에서 스토리지 피라미드는 하드 드라이브, 테이프 드라이브 및 클라우드 스토리지 순열의 늪으로 이어집니다.
Windows Server의 인텔 스토리지 성능
이러한 최신 인텔 스토리지 기술의 성능을 평가하기 위해 가능한 한 오버헤드가 적은 상황에서 특히 PMem과 기존 테스트 방법론에 대한 적절한 지원을 찾고자 했습니다. 첫 번째 후보는 Microsoft Windows Server 2019입니다. 우리는 3세대 Xeon, PMem 200 및 PCIe Gen4 스토리지 지원과 같은 최신 플랫폼 기술을 선보이도록 설계된 Intel OEM 서버에서 테스트하고 있습니다.
인텔 OEM 서버 사양
- 2 x Intel Xeon Platinum 8380 @ 2.3GHz 40코어
- 16GB DDR32 4MHz 3200개
- 16 x 128GB Intel Persistent Memory 200 시리즈
- 부팅 SSD: Intel 1TB SATA
- 운영 체제: 윈도우 서버 2019
엔터프라이즈 종합 워크로드 분석
당사의 엔터프라이즈 공유 스토리지 벤치마크 프로세스는 스레드당 16개의 대기 대기열이 있는 16개 스레드의 과도한 로드에서 장치를 테스트한 다음 여러 스레드/대기열에서 설정된 간격으로 테스트할 동일한 워크로드로 각 장치를 정상 상태로 사전 조정합니다. 라이트 및 헤비 사용에서 성능을 보여주는 깊이 프로필. 우리는 각 장치에서 20%의 작은 저장 공간을 테스트하고 있기 때문에 각 테스트의 주요 섹션만 그래프로 표시합니다.
사전 조건화 및 기본 정상 상태 테스트:
- 처리량(읽기+쓰기 IOPS 집계)
- 평균 대기 시간(읽기+쓰기 대기 시간을 함께 평균화)
- 최대 대기 시간(최대 읽기 또는 쓰기 대기 시간)
- 대기 시간 표준 편차(함께 평균화된 읽기+쓰기 표준 편차)
당사의 Enterprise Synthetic Workload Analysis에는 실제 작업을 기반으로 하는 1개의 프로필이 포함되어 있으며 낮은 부하 성능에 중점을 둔 1T/4Q 4K 워크로드가 있습니다. 이러한 프로필은 기업용 드라이브에 일반적으로 사용되는 최대 8k 읽기 및 쓰기 속도 및 70k 30/XNUMX과 같이 널리 게시된 값뿐만 아니라 과거 벤치마크와 쉽게 비교할 수 있도록 개발되었습니다.
- 4K 1T/1Q
- 100% 읽기 또는 100% 쓰기
- 100% 4K
- 4K 16T/16Q
- 100% 읽기 또는 100% 쓰기
- 100% 4K
- 8K 70/30
- 70% 읽기, 30% 쓰기
- 100% 8K
- 8K(순차적)
- 100% 읽기 또는 100% 쓰기
- 100% 8K
- 128K(순차적)
- 100% 읽기 또는 100% 쓰기
- 100% 128K
테스트를 위해 인텔 3세대 서버 플랫폼 내부의 세 가지 스토리지 구성을 살펴보았습니다. 여기에는 다음이 포함됩니다.
- 두 개의 네임스페이스에 있는 16 x 128GB Intel Persistent Memory 200 시리즈(각각 약 1TB의 스토리지 포함)
- 2GB Intel P800X Optane SSD 5800개
- 8 x 7.68TB Intel P5510 SSD
각 장치 그룹 또는 네임스페이스는 지속적인 성능을 측정하기 위해 20% 장치 용량 풋프린트를 사용하여 FIO 작업으로 직접 테스트되었습니다. 그룹당 각 장치에 고유한 작업이 지정되었고 결과가 집계되었습니다. 예를 들어, 테스트 중인 두 장치의 경우 각각에 1T/1Q 워크로드가 주어졌으므로 해당 워크로드에 대해 총 1개의 대기열에 있는 두 개의 스레드입니다. XNUMX개의 장치는 하나의 대기열 등에서 총 XNUMX개의 스레드가 됩니다.
첫 번째 테스트에서는 단일 스레드, 단일 대기열 깊이 4K 임의 읽기 및 쓰기 워크로드에 중점을 두었습니다. 오프라인 성능은 많은 애플리케이션에서 중요합니다. 일부 장치는 빛을 발하기 위해 많은 I/O 큐 깊이가 필요하지 않기 때문입니다.
인텔 PMem은 듀얼 인텔 P5800X SSD 또는 인텔 P5510 SSD 5800개에 비해 거의 두 배로 측정되는 읽기 성능에서 상당한 이점을 보여주었습니다. 쓰기 성능을 살펴보면 PMem은 여전히 P5510X SSD보다 우위에 있었지만 XNUMX개의 PXNUMX 드라이브가 더 높은 처리량을 제공할 수 있었습니다.
다음으로 1T/1Q 4K 읽기 및 쓰기 테스트의 평균 대기 시간 영향을 살펴봅니다.
인텔 PMem은 10K 랜덤 읽기에서 4마이크로초의 대기 시간을 측정했으며 P5800X는 24마이크로초, P5510 SSD는 81마이크로초로 측정했습니다. 쓰기 대기 시간을 살펴보면 PMem에서 11마이크로초, P23x SSD에서 5800마이크로초, P27 SSD에서 5510ms가 나타났습니다.
동일한 4K 읽기 및 쓰기 테스트의 더 무거운 형태로 이동하여 각 장치 유형이 최고인 위치를 살펴봅니다.
5510개의 Intel P4.8 SSD 그룹이 거의 3.2만 IOPS로 가장 많은 읽기 처리량을 제공했고 PMem이 5800만 IOPS, 듀얼 P1.7X SSD가 4만 IOPS로 그 뒤를 이었습니다. 5800K 랜덤 쓰기에서 1.91개의 P5510X SSD가 1.78만 IOPS로 선두를 차지했고, 1.35개의 PXNUMX SSD가 XNUMX만 IOPS로, XNUMX개의 PMem 네임스페이스가 XNUMX만 IOPS로 뒤를 이었습니다.
처리량이 중요하지만 PMem 및 SSD 모두에서 Optane의 가장 흥미로운 측면 중 하나는 스토리지 대기 시간을 얼마나 잘 처리하는지입니다. 더 무거운 4K 랜덤 읽기 및 쓰기 워크로드에서도 이러한 현상이 발생하는 것을 볼 수 있습니다.
인텔 PMem은 읽기 대기 시간이 159마이크로초로 가장 낮았고, P5800X SSD 296개(5510마이크로초), 뒷면에 P427 SSD 5800개(265마이크로초)가 그 뒤를 이었습니다. 쓰기 대기 시간은 377개의 P5510X SSD가 1.147마이크로초로 선두에 있었고 PMem은 XNUMX마이크로초로 뒤처졌으며 XNUMX개의 기존 PXNUMX SSD는 XNUMXms로 뒤를 이었습니다.
블록 크기를 8K 70/30 워크로드로 이동하면서 세 가지 다른 스토리지 유형과 계속 증가하는 스레드 및 대기열 수에 어떻게 대응하는지 살펴봅니다.
최고 성능 측면에서 5510개의 Intel P4.34 SSD 그룹은 실제로 다리를 펴고 몇 가지 인상적인 최고 수치를 제공했습니다. 맨 위에서는 16T/16Q에서 5800M IOPS로 최대치를 기록했지만 흥미로운 점은 PMem과 XNUMX개의 PXNUMXX가 일부 하위 스레드 및 대기열 지점에서 약간 앞서갈 수 있다는 것입니다.
초점을 평균 대기 시간으로 전환하면 다양한 스토리지 유형에 걸쳐 다른 그림이 그려지는 것을 볼 수 있습니다. Intel PMem은 처리량이 가장 높지는 않았지만 이 테스트에서 평균 지연 시간이 가장 낮았고 P5800X SSD가 그 뒤를 바짝 쫓았습니다. 5510개의 PXNUMX SSD는 지금까지 가장 높은 처리량을 제공했지만 XNUMX개의 Optane 기술보다 훨씬 높은 (상대적으로) 대기 시간 수준입니다.
다음으로 먼저 8K 전송 크기부터 시작하여 순차적 워크로드로 이동합니다.
5510개의 Intel P4.45 SSD 그룹이 1.92만 IOPS로 이 테스트에서 쉽게 5800위를 차지했고 PMem이 1.71만 IOPS로 그 뒤를 이었고, 1.75개의 P5510X SSD가 1.55만 IOPS로 그 뒤를 이었습니다. 서면으로 PMem이 5800만 IOPS로 1.18위를 차지했고, 그 뒤를 XNUMX만 IOPS의 PXNUMX SSD XNUMX개, XNUMX만 IOPS의 PXNUMXX SSD XNUMX개가 그 뒤를 이었습니다.
마지막 테스트에서는 세 가지 저장 매체의 최대 대역폭을 살펴봅니다. 두 U.2 장치 유형 모두에서 일부 제한된 최고급은 각 배포의 레인 수에서 비롯됩니다.
읽기 대역폭의 상단에서 시작하여 5510개의 P54이 인상적인 44GB/s를 제공했고, PMem이 5800GB/s를 제공하는 14개의 네임스페이스를 제공하고 5510개의 P32.7X SSD가 14.3GB/s 읽기를 제공했습니다. 대역폭과 관련하여 PMem이 얼마나 높아질 수 있는지 보는 것은 흥미로울 것입니다. 대형 블록 쓰기로 전환하면 5800개의 P11.1 SSD가 XNUMXGB/s로 XNUMX위를 차지했고, PMem이 XNUMXGB/s로 그 뒤를 이었고, XNUMX개의 PXNUMXX SSD가 XNUMXGB/s로 그 뒤를 이었습니다. 전반적으로 전반적으로 매우 인상적인 숫자입니다.
결론
인텔은 지난 몇 년 동안 PMem 및 SSD 변형 모두에서 Optane과 열심히 작업했습니다. 데이터 센터에서 AMD를 물리치기 위한 노력의 일환으로 포괄적인 Intel 플랫폼 스토리를 함께 짜는 과정에서 이 스토리지 기술이 그들에게 근본적으로 중요하다는 것을 분명히 알 수 있습니다. 미션 크리티컬 워크로드의 경우 결과가 이를 입증합니다. 스토리지 계층화의 경우 P5800X는 NVMe 장치 계층 구조의 맨 위에 깔끔하게 위치하며 부분적으로 PCIe Gen4 덕분에 이전 세대 모델에 비해 성능이 크게 향상되었습니다. 이 향상은 사실 너무 커서 PMem이 제공하는 대역폭이 아니라 처리량에 근접하기 시작합니다.
테스트 내내 우리는 우리가 기대했던 것을 정확히 보았습니다. PMem은 낮은 대기열 깊이에서 대기 시간 및 처리량 측면에서 엄청난 성능 가치를 보여주었습니다. 또한 읽기 성능에서 엄청난 대역폭 이득을 제공합니다. P5800X Optane SSD는 5800개 배포에서도 전반적으로 PMem에 매우 가까워지기 시작합니다. 이를 통해 PXNUMXX는 TLC 또는 QLC 드라이브를 캐시 또는 계층으로 활용할 수 있는 솔루션에서 환상적인 페어링이 될 수 있습니다.
Intel Gen3 Xeon 플랫폼을 어디에서 보든 스토리지와 관련하여 좋아할 것이 많습니다. 우리의 연구 결과는 44GB/s 읽기를 초과하는 PMem의 엄청난 읽기 대역폭과 낮은 큐 깊이 10K 임의 읽기 및 쓰기 워크로드에서 4마이크로초 대기 시간으로 강조됩니다. P5800X는 보다 일반적인 U.2 베이에서 더 넓은 도달 범위를 통해 유사한 대기 시간 이점을 제공하며 낮은 대기열 및 스레드 수에서 Intel PMem 대기 시간의 약 두 배를 측정합니다. P5510 SSD조차도 더 높은 대기열 워크로드와 관련하여 순차 또는 임의 IO 벤치마크에서 차트 최고 수치를 제공하면서 강점을 보여주었습니다.
결론은 PMem과 SSD 모두 최신 인텔 스토리지 장치가 이전 세대 제품과 비교할 때 상당한 발전을 이루었다는 것입니다. 이것은 인텔이 DRAM 및 PCIe Gen4 슬롯을 위한 더 빠른 BUS를 제공할 수 있게 된 지금 특히 사실입니다. 이 베어메탈 데이터를 통해 각 기술이 뛰어난 특정 지점을 확인할 수 있습니다. 이 데이터를 이해하면 시스템 빌더는 모든 애플리케이션을 탁월하게 만들 수 있는 플랫폼을 지능적으로 설계할 수 있습니다.
StorageReview에 참여
뉴스레터 | 유튜브 | 링크드인 | 인스타그램 | 트위터 | 페이스북 | 틱톡 서비스 | RSS 피드