AMD EPYC 9754S는 SMT가 비활성화된 HPC 워크로드용으로 설계되었으며 기본 TDP 128W로 128개 코어와 360개 스레드를 제공합니다.
작년에 AMD는 4세대 EPYC으로 서버 CPU 라인을 확장했습니다. 128코어, 256스레드 EPYC 9754가 가장 높은 평가를 받았지만 SKU 매트릭스에서 바로 아래에는 AMD EPYC 9754S가 있습니다. 두 칩의 차이점은 간단하면서도 극적입니다. 9754S에는 SMT(동시 멀티스레딩)가 비활성화되어 있습니다. 이는 9754S가 128와 동일한 9754개의 코어를 제공하지만 SMT가 비활성화된 경우 128개에 비해 스레드가 256개에 불과하다는 것을 의미합니다. 이러한 변화는 이미 SMT를 비활성화한 고객에게 상당한 할인 혜택을 제공합니다.
모델 | 코어 | 최대 스레드 | 기본 TDP | 기본 주파수 (GHz) | 부스트 주파수 (GHz) | L3 캐시 (MB) |
---|---|---|---|---|---|---|
9754 | 128 | 256 | 360W | 2.25 | 3.10 | 256 |
9754S | 128 | 128 | 360W | 2.25 | 3.10 | 256 |
9734 | 112 | 224 | 320W | 2.2 | 3.0 | 256 |
AMD SMT란 무엇이며 9754S가 존재하는 이유는 무엇입니까?
SMT를 사용하면 단일 EPYC CPU 코어가 두 개의 스레드를 동시에 처리할 수 있으므로 프로세서 리소스를 보다 효율적으로 사용할 수 있습니다. 한 스레드가 메모리에서 데이터가 로드되기를 기다리고 있거나 유휴 상태인 경우 다른 스레드가 명령을 실행 중일 수 있습니다. 이는 코어가 유휴 시간을 덜 소비하여 잠재적으로 성능이 향상된다는 것을 의미합니다. 이는 가상화 및 렌더링과 같은 사용 사례에서 특히 그렇습니다.
SMT를 비활성화하면 제조업체는 이러한 칩을 하위 제품으로 판매하여 특정 성능 및 안정성 기준을 충족할 수 있습니다. SMT가 비활성화된 CPU는 비닝 프로세스, 시장 세분화 전략, 특정 성능 또는 효율성 요구 사항을 충족하려는 욕구의 영향을 받을 수 있으며, 이는 제조업체가 제품 계획 및 포지셔닝에서 취하는 미묘한 접근 방식을 보여줍니다.
즉, 모든 워크로드가 SMT의 이점을 누리는 것은 아니며 AMD 서버의 BIOS에서 SMT가 비활성화되어 있는 경우가 많습니다. 이는 효과적인 조정이 될 수 있지만 또 다른 중요한 점을 제시합니다. SMT가 비활성화된 9754S 칩은 9754보다 약간 저렴합니다. 두 경우 모두 단일 스레드 애플리케이션, 계산 작업 부하 및 CPU 대기 시간이 매우 중요한 사용 사례에서는 SMT를 비활성화하면 이점을 얻을 수 있습니다.
AMD EPYC 9754S 대 EPYC 9754 성능
우리는 두 가지 정기 테스트인 y-cruncher와 Cinebench 2024를 실행하여 SMT 유무에 따른 성능 차이를 확인하고 싶습니다. SMT가 전혀 없는 9754S의 장점을 확인하기 위해 SMT를 켜고 끄고 9754를 실행하는 동안 9754S와 9754를 서로 비교하여 실행했습니다.
테스트 플랫폼 및 사양:
- TYAN 운송 HX TN85-B8261
- 512GB DDR5
- 윈도우 서버 2022
Cinebench 2024
첫 번째는 S가 아닌 모델에서 SMT가 활성화된 Cinebench 2024입니다. 여기서 우리는 실행 간 변형 차이 내에 있음을 알 수 있습니다.
시네벤치 2024 CPU | 2x EPYC 9754S | 2x 에픽 9754 |
---|---|---|
CPU 멀티 코어 | 2,682 | 2,587 |
CPU 단일 코어 | 68 | 69 |
MP 비율 | SR 39.19x | SR 37.64x |
y-cruncher는 전체 시스템 테스트로 자리 잡은 프로그램 아키텍처 때문에 특별히 선택되었습니다. 시스템 메모리에 맞는 대규모 Pi 계산을 수행하면서 우리는 SMT가 CPU 및 메모리 바인딩 워크로드에 부정적인 영향을 미칠 수 있다는 오랜 직관을 증명하는 것을 목표로 했습니다. 이것이 무엇을 의미하는지 알아보기 전에 먼저 결과를 살펴보겠습니다.
와이-크런처 0.8.3
y-cruncher 0.8.3 총 계산 시간(초) (낮을수록 좋습니다) |
2x EPYC 9754S | 2x EPYC 9754(SMT 꺼짐) | 2x EPYC 9754(SMT 켜짐) | 9754 SMT 끄기 성능 향상 |
---|---|---|---|---|
1 억 | 13.481 | 13.546 | 14.139 | 4.65% |
2.5 억 | 23.818 | 24.144 | 28.111 | 15.27% |
5 억 | 40.760 | 40.797 | 49.271 | 17.27% |
10 억 | 77.409 | 77.959 | 95.420 | 18.88% |
25 억 | 203.303 | 202.124 | 233.629 | 12.98% |
50 억 | 475.557 | 476.949 | 520.349 | 8.61% |
100 억 | 1,248.458 | 1,251.36 | 1,242.419 | -0.49 % |
와이-크런처 0.8.4
y-cruncher 0.8.4 총 계산 시간(초) (낮을수록 좋습니다) |
2x EPYC 9754S | 2x EPYC 9754(SMT 꺼짐) | 2x EPYC 9754(SMT 켜짐) | 9754 SMT 끄기 성능 향상 |
---|---|---|---|---|
1 억 | 13.480 | 13.56 | 14.573 | 7.50% |
2.5 억 | 23.680 | 23.501 | 28.649 | 17.34% |
5 억 | 40.819 | 40.547 | 50.082 | 18.50% |
10 억 | 78.523 | 77.466 | 93.842 | 16.32% |
25 억 | 206.399 | 206.078 | 236.070 | 12.57% |
50 억 | 483.797 | 482.79 | 521.867 | 7.29% |
100 억 | 1,269.484 | 1,266.83 | 1,253.446 | -1.28 % |
결과 분석
AMD SMT의 복잡성을 자세히 살펴보면 기술 커뮤니티 내에서 시스템 성능에 미치는 영향에 대한 설득력 있는 대화가 있습니다. 기본적으로 SMT는 향상된 성능을 추구하는 사람들에게 간단한 선택인 것으로 보입니다. 이론은 다음과 같습니다. SMT를 활성화하면 이상적인 확장이 가능하다면 이를 유익한 아키텍처 선택으로 받아들이는 것이 어떻겠습니까?
SMT 효율성과 핵심 아키텍처 간의 관계는 흑백이 아닙니다. Lackluster SMT 확장이 반드시 구현상의 결함을 가리키는 것은 아닙니다. 실제로 이는 SMT가 눈에 띄는 차이를 만들 여지를 거의 남기지 않는 견고한 코어 설계를 암시할 수 있습니다. 이러한 역설은 중요한 업계 통찰력을 강조합니다. 즉, 프로세서 제조업체는 SMT 또는 유사한 기술을 통해 모든 경우에 적용되는 단일한 이점을 주장할 수 없습니다. 그들은 SMT가 특정 사용 사례에서 추가 성능을 짜낼 수 있지만 다른 시나리오에서는 단점이 없는 것은 아니라는 점을 인정합니다.
고성능 컴퓨팅과 슈퍼컴퓨팅 작업이라는 렌즈를 통해 SMT의 한계는 더욱 분명해집니다. 코어당 스레드 수를 두 배로 늘리는 아이디어는 유망해 보일 수 있지만 현실은 코어 수를 두 배로 늘리는 것과 유사하지 않습니다. 극단적인 경우에는 스레드가 캐시 리소스를 놓고 경쟁하면서 성능 저하가 발생할 수 있습니다. 그럼에도 불구하고 대부분의 멀티스레드 애플리케이션, 특히 캐시 경쟁이 없는 애플리케이션의 경우 SMT는 성능을 향상시키며, 주로 잠재력을 최대한 활용할 수 있는 작업에서 빛을 발합니다.
생각을 폐쇄
AMD SMT는 기업에서 흔히 발생하는 다양한 워크로드에 매우 유용합니다. 그러나 모든 워크로드에 SMT가 필요하거나 이점을 제공하는 것은 아닙니다. 테스트를 통해 우리는 AMD가 어떻게 제조의 변화를 활용하여 고유한 가치 제안을 지닌 견고한 제품을 제공할 수 있는지 보여주었습니다. SMT 없이 순수 코어가 필요한 특정 유형의 워크로드용 플랫폼을 설계하는 조직은 공장에서 SMT가 영구적으로 비활성화된 AMD EPYC 9754S를 구입하여 약간의 비용을 절약할 수 있습니다.
StorageReview에 참여
뉴스레터 | 유튜브 | 팟캐스트 iTunes/스포티 파이 | 인스타그램 | 트위터 | 틱톡 서비스 | RSS 피드