지난 몇 년 동안 하이퍼스케일 공간에서 부팅 드라이브를 둘러싼 문제에 대해 많은 논의가 있었습니다. 하이퍼스케일러는 너무 많은 비용을 지출하고 싶지 않지만 다른 필수 사양 중에서 기본적인 최소 성능 임계값이 필요합니다.
지난 몇 년 동안 하이퍼스케일 공간에서 부팅 드라이브를 둘러싼 문제에 대해 많은 논의가 있었습니다. 하이퍼스케일러는 너무 많은 비용을 지출하고 싶지 않지만 다른 필수 사양 중에서 기본적인 최소 성능 임계값이 필요합니다.
기업용 SSD 제조업체가 대부분 이 분야에서 나갔기 때문에 누가 실제로 소용량 M.2 NVMe 부팅 드라이브를 계속 만들 것인지에 대한 질문도 있습니다. Solidigm은 스토리지 포트폴리오에 최신 M.2 부트 드라이브가 없으며 Samsung, KIOXIA 및 Micron에서 제공하는 대부분의 최신 옵션은 고용량으로 인해 비용 문제가 있습니다. 그런 다음 성능이 필요합니다. 훌륭하지는 않지만 부팅 드라이브는 여전히 최소한의 결과를 안정적으로 생성해야 합니다.
아래 차트에서 볼 수 있듯이 부팅 및 데이터 드라이브의 용량이 지속적으로 증가하고 있으며 이는 조직에 더 많은 지출을 의미합니다.
하이퍼스케일 NVMe 부팅 드라이브 요구 사항 및 장애물
OCP Summit에서 이러한 문제는 Google 및 Meta 대표의 프레젠테이션 중에 논의되었으며 가장 중요한 것은 문제 해결을 위해 무엇을 하고 있는지입니다.
I/O 읽기 및 쓰기와 TRIM 트랜잭션이 포함된 하루 동안의 활동을 나타내는 하이퍼스케일 부팅 SSD의 예가 표시되었습니다. 가장 눈에 띄는 것은 TRIM의 높은 처리량으로 수명이 짧은 데이터(생성된 후 곧 삭제됨)를 보여줍니다. 적절하게 설계되지 않은 경우 TRIM은 대기 시간 지연으로 이어지고 읽기 및 쓰기 트래픽을 방해합니다. 트래픽의 대부분은 임의 읽기 및 쓰기이기도 합니다.
하이퍼스케일 NVMe 부팅이 직면하는 몇 가지 장애물은 다음과 같습니다.
- 궁극적으로 하이퍼스케일 워크로드는 대기 시간에 민감하므로 효율적인 사용자 경험을 제공하기 위해서는 지속적인 성능이 매우 중요합니다.
- 규모에 맞게 디버깅하는 것도 어렵기 때문에 자세한 모니터링 메트릭을 갖는 것이 장애를 예측하고 감지하는 데 가장 중요합니다.
- 내구성은 부팅 SSD에 매우 중요합니다. 시스템을 완성한 후(시간이 걸릴 수 있음) 내구성이 높은 부팅 드라이브를 사용하면 전체 제품 수명 주기 동안 오래 지속될 수 있습니다.. 이것은 또한 수리할 필요성을 없애고 조기 마모를 방지하는 데 도움이 됩니다.
- 무엇보다 하이퍼스케일 고객은 개인 정보 보호 및 보안을 매우 중요하게 생각하며 이러한 표준을 모두 충족하기 어려운 경우가 있습니다.
이것은 매우 다양한 범위의 문제이므로 올바르게 수행하지 않으면 이러한 문제를 해결하는 것이 복잡한 프로세스가 될 수 있습니다.
부트 드라이브가 직면한 문제 해결
OCP의 주요 원동력이자 목적인 것처럼 이러한 문제를 해결하는 유일한 방법은 협업과 공개 사양을 통해서입니다. 이와 같이 Meta와 Google은 요구 사항을 결합하고 하이퍼스케일 NMEe 부팅 SSD 사양(버전 1.0), 부팅 드라이브 효율성에 대한 중요한 이정표를 표시합니다. 올해 초에 제출되었으며 OCP 웹 사이트를 통해 제공됩니다.
이러한 사양에는 많은 이점이 있습니다. 궁극적으로 이를 통해 시장은 하이퍼스케일러가 부팅 장치에 필요하고 사용하는 기능을 더 잘 이해할 수 있으며 SSD 부팅 드라이브 채택에 대한 업계의 조정을 받을 수 있습니다. 또한 조직에 부팅 SSD를 관리할 수 있는 오픈 소스 도구를 제공하여 3개의 개발로 이어집니다.rd-모든 요구 사항을 충족할 수 있는 파티 테스트 스위트.
세션 중에 하이퍼스케일 부팅 SSD를 만드는 방법에는 두 가지가 있다고 밝혔습니다. 엔터프라이즈급 SSD를 다운그레이드하거나 소비자급 SSD를 업그레이드하십시오. 요구 사항이 이 두 공간의 중간에 있기 때문입니다.
부트 벤치
서버 부팅 작업용으로 설계된 SSD를 측정하기 위해 OCP에서 채택한 워크로드 프로필인 SSD 검토에 부트 벤치 성능 섹션을 추가하기 시작했습니다. 이 부팅 워크로드는 읽기가 많은 워크로드 시퀀스를 테스트하기 전에 드라이브를 쓰기로 완전히 채우는 상대적으로 집중적인 테스트 계획을 실행합니다.
각 테스트에 대해 32MiB/s 동기식 15k 랜덤 쓰기 및 128MiB/s 동기식 5k 랜덤 쓰기/트림 백그라운드 워크로드와 함께 128K 랜덤 읽기 비동기 작업을 수행합니다. 스크립트는 4개 작업 수준에서 임의 읽기 활동으로 시작하여 최대 256개 작업으로 확장됩니다. 최종 결과는 피크 실행 중에 수행되는 읽기 작업입니다.
이 벤치마크의 OCP 목표는 60K 읽기 IOPS에서 합격/불합격입니다. 우리가 테스트하는 대부분의 드라이브는 최소값을 훨씬 초과하지만 결과는 상관없이 유익합니다. 테스트에서 가장 흥미로운 점은 성능 지향 NVMe SSD 모델로 IOPS 임계값을 훨씬 초과할 수 있었지만 더 느리게 통과하는 SSD는 아니라는 것입니다. 970 EVO Plus 2TB 모델이 더 느린 비적격 속도를 보고했지만 많은 느린 SSD 모델이 비통과 범주에 쉽게 속하는 것 같습니다.
SSD | 읽기 IOPS |
SK 하이닉스 플래티넘 P41 | 220,884 IOPS |
WD SN850X | 219,883 IOPS |
솔리드다임 P44 프로 | 211,999 IOPS |
팬텀 VENOM8 | 190,573 IOPS |
Samsung 990 Pro | 176,677 IOPS |
사브런트 로켓 4 플러스 | 162,230 IOPS |
삼성 970 EVO 플러스 2TB | 52,005 IOPS |
해적 MP600 GS | DNF |
솔리드다임 P41 플러스 | DNF |
하이퍼스케일 워크로드 사용 사례 예
세션 중에 그들은 또한 두 개의 서로 다른 드라이브를 비교했습니다. 하나는 더 일반적인 드라이브이고 다른 하나는 OCP 하이퍼스케일 사양에 더 부합하는 드라이브입니다. 전반적으로 그들은 하이퍼스케일 공간에서 매우 중요한 후자 드라이브를 사용하여 전반적으로 대기 시간이 극적으로 개선되었음을 발견했습니다.
현실 세계에서 이는 사양에 더 잘 맞는 드라이브를 배포하려고 할 때 시장 출시 시간이 눈에 띄게 개선되었음을 의미합니다.
앞으로 나아가기 OCP 하이퍼스케일 NVMe 부팅 SSD 사양
일부 회사는 이전에 특정 요구 사항(및 고객의 특정 요청)에 맞게 자체 하이퍼스케일 부팅 드라이브를 만들었지만 이러한 사양은 업계에서 공유되지 않았습니다. 이로 인해 공급업체는 고객의 요구를 충족하기 위해 자체 맞춤형 하드웨어/펌웨어를 생산해야 했습니다.
OCP가 지금 만든 것처럼 그 이후로 우리는 먼 길을 왔습니다. Hyperscale NVMe Boot SSD 사양의 버전 1.0 공식적으로 사용 가능. 이를 통해 시스템 제조업체와 SSD 제공업체는 더 많은 협업을 장려하면서 공통 요구 사항 집합에 맞출 수 있습니다.
OCP는 모든 OEM(즉, 시스템 제조업체) 및 하이퍼스케일러가 동참할 것을 촉구하고 있으며 스토리지 환경이 변화함에 따라 사양을 계속 발전시키고 개선할 것을 약속합니다.
기업에 미치는 영향
부팅 드라이브의 필요성은 하이퍼스케일 사용 사례로 제한되지 않습니다. M.2는 현재 대부분의 서버 및 스토리지 어레이에 대한 사실상의 부팅 드라이브 표준입니다. 대부분의 경우 드라이브가 많은 작업을 수행할 필요는 없지만 신뢰할 수 있고 어느 정도 성능이 있어야 하며 절대적으로 필요한 것보다 더 크거나 비싸지 않아야 합니다. 스토리지 공급업체가 인프라 제공업체가 어느 정도의 표준화를 유지할 수 있도록 부트별 SSD로 이 이니셔티브에 대응하는 것을 볼 수 있기를 바랍니다.
StorageReview에 참여
뉴스레터 | 유튜브 | 팟캐스트 iTunes/스포티 파이 | 인스타그램 | 트위터 | 틱톡 서비스 | RSS 피드