Intel Data Center GPU Flex 시리즈 170은 VDI 사용자에게 저렴한 GPU를 제공하려는 조직에 큰 도움이 됩니다.
엔터프라이즈 가상 데스크탑 인프라(VDI) 커뮤니티는 더욱 강력한 솔루션을 요구해 왔습니다. 기업이 더 높은 효율성과 향상된 사용자 경험을 위해 노력함에 따라 전용 하드웨어 가속기의 역할이 중요해졌습니다. Intel의 데이터 센터 GPU Flex 시리즈는 데이터 센터 내에서 클라우드 게임, 미디어, VDI 및 그래픽 가속을 위한 맞춤형 솔루션을 제공하여 이 분야에서 두각을 나타내고 있습니다.
Intel Flex 시리즈 GPU란 무엇입니까?
인텔이 제공하는 서비스의 핵심에는 두 가지 뛰어난 제품이 있습니다. Flex 140 및 Flex 170 GPU에스. 로우 프로파일 PCIe Gen140 카드인 Flex Series 4에는 각각 6개의 Xe 코어와 6GB의 GDDR12 메모리를 자랑하는 듀얼 GPU가 있습니다. 이 구성은 최대 XNUMX개의 VDI 세션에 적합하며 중간 정도의 그래픽 요구 사항을 가진 지식 근로자에게 적합합니다.
그래픽 집약적인 애플리케이션의 경우 Flex Series 170은 32개의 Xe 코어와 16GB의 GDDR6 메모리를 모두 풀사이즈 PCIe 카드에 탑재한 단일 GPU 노드로 확장하여 고해상도 작업에 상당한 성능을 제공합니다.
인텔 데이터 센터 GPU Flex 170 | 인텔 데이터 센터 GPU Flex 140 | |
---|---|---|
베이직 라인 | ||
마이크로 아키텍처 | Xe HPG | Xe HPG |
사용 가능한 임베디드 옵션 | 아니 | 아니 |
사용 조건 | 서버/엔터프라이즈 | 서버/엔터프라이즈 |
사용 사례 | 생명과학 혁신을 위한 | 생명과학 혁신을 위한 |
GPU 사양 | ||
Xe-색상 | 32 | 16 |
렌더 슬라이스 | 8 | 4 |
광선 추적 장치 | 32 | 16 |
인텔® Xe 매트릭스 확장(인텔® XMX) 엔진 | 512 | 256 |
실행 단위 | 512 | 256 |
그래픽 최대 동적 시계 | 2050 MHz | 1950 MHz |
인텔® Xe 매트릭스 확장(인텔® XMX) 최대 동적 클럭 | 1950 MHz | 1600 MHz |
TBP | 150 승 | 75 승 |
메모리 사양 | ||
메모리 크기 | 16 GB | 12 GB |
메모리 유형 | GDDR6 | GDDR6 |
그래픽 메모리 인터페이스 | 256 비트 | 192 비트 |
그래픽 메모리 대역폭 | 576 GB / 초 | 336 GB / 초 |
지원되는 기술 | ||
광선 추적 | 가능 | 가능 |
oneAPI 지원 | 가능 | 가능 |
OpenVINO™ 지원 | 가능 | 가능 |
DirectX* 지원 | 다이렉트X 12 얼티밋 | 다이렉트X 12 얼티밋 |
Vulkan* 지원 | 1.3 | 1.3 |
OpenGL* 지원 | 최대 4.6까지 | 최대 4.6까지 |
OpenCL* 지원 | 3 | 3 |
다중 형식 코덱 엔진 | 2 | 4 |
기능 | ||
H.264 하드웨어 인코딩/디코딩 | 가능 | 가능 |
H.265(HEVC) 하드웨어 인코딩/디코딩 | 가능 | 가능 |
AV1 인코딩/디코딩 | 가능 | 가능 |
VP9 비트스트림 및 디코딩 | 가능 | 가능 |
이러한 그래픽 처리 장치의 기반은 Xe-core이며, Flex Series 170은 Flex 140보다 두 배의 코어와 렌더링 슬라이스를 제공합니다. 이는 두 배의 레이 트레이싱 능력으로의 직접적인 경로를 설명하고 Flex 170의 복잡한 렌더링 처리 능력을 강화합니다. 작업과 시뮬레이션을 쉽게 수행할 수 있습니다.
메모리 측면에서는 Flex Series 170이 Flex 16의 6GB를 능가하는 140GB GDDR12 할당으로 앞서나가는 것을 볼 수 있습니다. 더 넓은 256비트 인터페이스와 결합된 이 추가 메모리는 해당 제품의 576GB/s에 비해 최대 336GB/s의 그래픽 대역폭을 제공합니다.
GPU의 열 설계 전력(TDP)과 관련하여 효율성에 대한 논의가 계속되고 있습니다. Flex Series 170의 150와트 TDP는 성능에 중점을 두고 있음을 나타내는 반면, Flex Series 140의 75와트 TDP는 절전 및 에너지 효율적인 애플리케이션에 대한 성향을 강조합니다.
Ray Tracing, oneAPI 및 OpenVINO와 같은 최첨단 기술에 대한 지원은 두 모델을 통합하는 공통 스레드로, 미래 지향적인 개발자 플랫폼을 보장합니다. 한편, DirectX 12 Ultimate 호환성은 전문 시각화 및 클라우드 게임과 같은 영역에서 잠재적인 크로스오버 애플리케이션에 대한 고개를 끄덕이는 초현실적인 그래픽을 지원합니다.
Intel Flex GPU의 마법: SR-IOV
Flex 시리즈 GPU의 마법은 SR-IOV에서 비롯됩니다. 이에 익숙하다면 다음 섹션으로 건너뛰셔도 됩니다. 여기에는 새로운 것이 없습니다. 그렇지 않거나 재충전이 필요하다면 버클을 채우세요. 이건 정말 멋진 일이에요.
SR-IOV(Single Root I/O Virtualization)는 NIC(네트워크 인터페이스 카드) 또는 GPU(그래픽 처리 장치)와 같은 단일 물리적 장치를 가상 환경의 관리 용이성과 효율성을 향상시키는 기술입니다. 여러 개의 개별 가상 장치. 이는 가상 머신(VM)의 성능을 향상하고 기본 하드웨어 리소스의 활용도를 극대화하기 위해 데이터 센터에서 특히 유용합니다.
SR-IOV 기술에는 PF(물리적 기능)와 VF(가상 기능)라는 두 가지 핵심 개념이 있습니다. PF는 물리적 장치의 기본 인터페이스이며 VF 생성 및 관리를 포함하여 SR-IOV 기능을 관리합니다. 이러한 VF는 PF의 경량 버전으로, 데이터 이동에 필요한 리소스를 갖추고 있지만 구성 기능이 축소되었습니다. 각 VF는 VM에 직접 할당될 수 있으므로 가상화된 장치의 일반적인 오버헤드 없이 장치 기능에 대한 고성능 직접 액세스를 제공합니다.
SR-IOV를 GPU와 함께 사용하면 각 VM(가상 머신)이 GPU 리소스의 일부에 직접 액세스할 수 있습니다. 이러한 직접 액세스는 VM에 개별적으로 할당할 수 있는 GPU의 경량 표현인 VF(가상 기능)를 통해 촉진됩니다.
VF는 할당된 VM에 의해 제어되지만 PF는 리소스 관리, 장치 수준 정책 시행 등 전반적인 제어를 유지합니다. 이 설정은 복잡한 VDI 환경, 고성능 컴퓨팅 작업 및 대규모 웹 서비스와 같이 성능과 낮은 대기 시간이 중요한 시나리오에서 매우 중요하며 가상화된 시스템의 운영 효율성을 크게 향상시킵니다.
이 설정을 통해 VM은 기존 하이퍼바이저 기반 리소스 공유 방법을 우회하여 오버헤드를 줄이고 성능을 향상시킬 수 있습니다. 3D 렌더링, 비디오 처리 또는 기계 학습 애플리케이션과 같은 GPU 집약적 작업을 통해 지연 시간이 크게 줄어들고 GPU 리소스를 보다 효율적으로 사용하며 가상화된 환경에서 전반적인 성능이 향상될 수 있습니다.
Intel Flex GPU는 "무료" VDI 가속을 제공합니다.
섹션 제목이 농담이 아닙니다. Intel 데이터 센터 GPU Flex 시리즈는 VDI 배포에 상당한 이점을 제공하며 가상 GPU(vGPU) 구성 설정에 대한 라이센스 비용이 전혀 들지 않는 가속기 현장에 출시되었습니다. 앞서 언급한 SR-IOV(단일 루트 I/O 가상화) 기반 GPU 가상화를 활용하는 이 Intel Flex 시리즈는 vGPU 프로비저닝과 관련된 기존의 재정적 장벽을 제거합니다. 라이센스 비용이 없기 때문에 초기 설정 비용이 줄어들고 지속적인 운영 비용이 줄어들어 장기적으로 상당한 비용 절감 효과를 얻을 수 있습니다.
vGPU 관리에 대한 이러한 비용 효율적인 접근 방식은 VDI 서버 배포의 확장성을 향상시킵니다. 조직은 증가하는 라이센스 비용에 대한 걱정 없이 가상 환경 전체에서 vGPU 리소스를 동적으로 프로비저닝하고 조정할 수 있습니다. 이러한 유연성은 변화하는 워크로드 요구 사항에 적응하고 특히 지식 근로자 부문의 일반적인 고밀도 설정에서 점점 더 많은 사용자를 지원하는 데 중요합니다.
비즈니스 관점에서 Intel Flex 시리즈 GPU는 상당한 재정적 이점을 제공합니다. 인텔은 라이센스의 복잡성과 비용을 제거함으로써 조직이 VDI 인프라를 간소화할 수 있도록 지원합니다. 이러한 단순화로 인해 배포 시간이 가속화되고 GPU 기능에 대한 광범위한 예산 할당의 필요성이 줄어들어 Intel Flex 시리즈는 높은 성능과 안정성을 유지하면서 VDI 투자를 최적화하려는 기업에게 매력적인 옵션이 됩니다.
실습: Supermicro SuperBlade를 탑재한 Intel Flex 시리즈 170
연구실에는 Intel Flex Series 170이 있었고 이를 VMware와 함께 사용하기로 결정했습니다. 슈퍼마이크로 슈퍼블레이드 X13 GPU 블레이드 시스템. 사용자 경험과 시스템 성능을 향상시키기 위해 VMware ESXi에 Intel 개별 그래픽 카드 설치가 간소화되었습니다. 로딩만큼 간단했어요 드라이버의 ZIP SCP를 통해 호스트에 SSH 액세스를 활성화하고 드라이버 설치를 실행합니다. 빠른 호스트 재부팅 후 Flex Series 170이 하드웨어 목록에 나타 났고 0-31의 SR-IOV 옵션을 구성에 사용할 수 있었습니다.
테스트는 다음을 사용하여 수행되었습니다. 슈퍼마이크로 슈퍼블레이드 시스템 이는 VDI 가속기로서 Flex Series 170 GPU의 성능을 검증하는 데 필수적인 호스트입니다. SuperBlade 시스템은 전력 소비를 최소화하면서 컴퓨팅 밀도와 효율성을 극대화하도록 설계되었습니다. 따라서 Intel Flex 시리즈 GPU에서 판매하는 것과 같은 고밀도 지식 근로자 사용 사례를 테스트하는 데 이상적인 플랫폼입니다.
부분 | SuperMicro 슈퍼블레이드 구성 |
---|---|
CPU | 1x 인텔 제온 8562Y+ |
메모리 | 256GB DDR5 |
드라이브 | 2x 삼성 3840G M.2 드라이브 |
GPU | 인텔 플렉스 시리즈 170 |
Supermicro SuperBlade X13 시스템은 밀도 논쟁을 위한 이상적인 플랫폼을 만듭니다. 단일 10U 섀시에 이러한 노드 중 8개를 넣을 수 있는 기능을 사용하면 관리하기 쉬운 하나의 섀시에 320개의 가속 VDI를 수용할 수 있습니다. 반면에 Flex 시리즈 170 카드당 더 많은 코어와 VRAM을 사용하고 80-160개의 지식 근로자 수준 VDI를 보유하지만 이 시스템에 10개의 GPU를 넣을 수 있는 기능 덕분에 혼합 및 일치가 가능합니다. 초고속 내부 네트워킹을 사용하면 꽤 창의적인 장애 조치 솔루션을 가질 수 있습니다. 전체 리뷰를 확인해보세요 "Swiss Army Knife" SuperBlade 서버가 된 것에 대해 자세히 알아보세요.
Intel 데이터 센터 GPU Flex 시리즈 170 성능
여기서는 공식적으로 완전한 결과를 생성할 수 있는 테스트, 즉 특별한 조정이나 해킹 없이 가상 환경에서 테스트할 수 있는 한계를 기반으로 테스트가 선택되었다는 점을 고려하는 것이 중요합니다. 몇 개의 SR-IOV 슬라이스를 선택한 다음 몇 개의 비표준 슬라이스를 선택하여 어떻게 보일지 확인했습니다.
3D 렌더링
Flex 시리즈 GPU의 클라우드 게임 및 3D 렌더링 기능을 보여주기 위해 3D Mark Wildlife 벤치마크를 살펴보았습니다.
3DMark Wild Life는 Windows, Android 및 Apple iOS 시스템과 호환되는 크로스 플랫폼 벤치마킹 도구를 제공합니다. 이 도구는 노트북, 태블릿, 스마트폰을 포함한 다양한 장치의 그래픽 성능을 평가하고 대조합니다. Wild Life는 Windows 및 Android 장치에 Vulkan 그래픽 API를 사용하는 반면, iOS 장치에는 Metal을 사용합니다. 이 테스트는 다양한 점수의 통합 그래픽에서 작동하므로 Intel Flex 시리즈 170의 순수 그래픽 점수의 힘을 보여줄 수 있습니다.
테스트/SR-IOV 슬라이스 | 2GB | 4GB | 7GB | 14GB |
---|---|---|---|---|
3D 마크 야생 동물 | 29,062 | 42,466 | 49,671 | 45,908 |
3D 마크 야생 동물 익스트림 | 9,023 | 14,948 | 17,661 | 16,959 |
럭스마크
다음은 OpenCL GPU 벤치마킹 유틸리티인 LuxMark입니다. Flex Series 170은 이번 테스트에서 정말 뛰어난 성능을 보여 인상적인 수치와 확장성을 보여주었습니다.
테스트/SR-IOV 슬라이스 | 2GB | 4GB | 7GB | 14GB |
---|---|---|---|---|
럭스마크 홀 | 2,961 | 4,382 | 11,002 | 11,202 |
럭스마크 푸드 | N/A | 1,316 | 4,502 | 4,525 |
PCMark 10 익스프레스
직장에서 직면하는 다양한 작업을 정확하게 반영하는 광범위한 테스트 제품군을 갖춘 PCMark 10을 살펴보세요. 이 벤치마킹 도구에는 다양한 성능 평가, 맞춤형 테스트 옵션, 배터리 수명 프로필, 새로 추가된 스토리지 벤치마크가 포함되어 있어 최신 사무용 PC의 성능을 평가하기 위한 포괄적인 솔루션입니다.
테스트/SR-IOV 슬라이스 | 2GB | 4GB | 7GB | 14GB |
---|---|---|---|---|
PCMark 10 Express 전체 | 5,111 | 5,146 | 5,311 | 5,218 |
에센셜 10 | 10,269 | 10,318 | 10,734 | 10,364 |
앱 시작 점수 | 17,833 | 17,664 | 19,034 | 17,340 |
화상회의 점수 | 7,798 | 7,933 | 8,095 | 7,980 |
웹 브라우징 점수 | 7,789 | 7,839 | 8,028 | 8,046 |
생산성 | 6,952 | 7,004 | 7,181 | 7,180 |
스프레드시트 점수 | 6,924 | 6,953 | 7,186 | 7,184 |
작문 점수 | 6,981 | 7,057 | 7,178 | 7,177 |
여기에서 결과를 살펴보면 비록 극적이지는 않지만 가속을 활용하는 다양한 작업에 걸쳐 명확한 확장을 볼 수 있습니다.
비교의 편의를 위해 모든 테스트 결과를 하나의 표로 정리했습니다.
테스트/SR-IOV 슬라이스 | 2GB | 4GB | 7GB | 14GB |
---|---|---|---|---|
3D 마크 와일드 라이프 | 29,062 | 42,466 | 49,671 | 45,908 |
3D 마크 와일드 라이프 익스트림 | 9,023 | 14,948 | 17,661 | 16,959 |
럭스마크 홀 | 2,961 | 4,382 | 11,002 | 11,202 |
럭스마크 푸드 | N/A | 1,316 | 4,502 | 4,525 |
PCMark 10 Express 전체 | 5,111 | 5,146 | 5,311 | 5,218 |
에센셜 10 | 10,269 | 10,318 | 10,734 | 10,364 |
앱 시작 점수 | 17,833 | 17,664 | 19,034 | 17,340 |
화상회의 점수 | 7,798 | 7,933 | 8,095 | 7,980 |
웹 브라우징 점수 | 7,789 | 7,839 | 8,028 | 8,046 |
생산성 | 6,952 | 7,004 | 7,181 | 7,180 |
스프레드시트 점수 | 6,924 | 6,953 | 7,186 | 7,184 |
작문 점수 | 6,981 | 7,057 | 7,178 | 7,177 |
생각을 폐쇄
이 모든 데이터를 수집하고 인간적 요소를 적용하면서 저는 이 카드가 가져온 단순성과 힘에 대해 끊임없이 충격을 받았고 경외심까지 느꼈습니다. GPU의 1/32를 VM에 매핑하고 설치한 후 인텔의 Windows 드라이버, 내장된 원격 데스크톱과 같은 기능이 더 잘 수행되었습니다. Chrome에서 Intel의 Google Earth 파티 트릭을 사용하면 512MB의 VRAM과 하나의 Xe-core를 사용하더라도 VDI 경험이 놀라울 정도로 향상된다는 것이 분명해졌습니다. 이전 경력에서 다른 VDI 제품을 사용해 본 경험이 있어서 드라이버를 설치한 후에는 "느낌이 좋았습니다".
Intel 데이터 센터 GPU Flex 시리즈, 특히 Flex 시리즈 170 모델은 VM 밀도와 확장성을 향상시키면서 뛰어난 성능을 제공하는 안정적이고 미래 지향적인 VDI 솔루션임이 입증되었습니다. 낮은 CPU 사용률, 일관된 프레임 속도, 높은 와트당 인코딩 성능이 결합되어 VDI 인프라를 성능이 뛰어나고 신뢰할 수 있으며 확장 가능한 솔루션으로 전환하려는 데이터 센터에 이상적인 선택입니다. Intel Flex 170 GPU를 핵심으로 하는 VDI 관리자는 다양한 디스플레이 해상도에서 고품질 표준을 유지하면서 최종 사용자에게 최고의 그래픽 사용자 경험을 자신있게 제공할 수 있습니다.
이를 Supermicro SuperBlade 시스템으로 달성할 수 있는 밀도와 결합하면 초밀도의 매우 효과적인 VDI 기기를 구축할 수 있습니다. 블레이드의 유연성 덕분에 섀시는 Flex 시리즈 GPU 옆에 더 강력한 Max 카드를 호스팅하여 모든 사용자와 서비스 상호 작용을 더욱 긴밀하게 만들 수 있습니다. 이에 대해서는 곧 자세히 설명하겠습니다.
이 테스트 범위에는 대부분의 비즈니스급 노트북과의 비교가 포함되지 않았지만 직접 그 선을 그릴 수 있습니다. 유선으로 픽셀을 전송하기 위한 데이터 압축, VDI와 함께 제공되는 보안 및 관리 용이성, 라이선스 모델(방향이 바뀌지 않기를 바랍니다)을 고려할 때 Flex 시리즈는 놀라울 정도로 좋은 위치에 있습니다. Flex 시리즈 카드는 기업과 사용자를 행복하게 만드는 두 가지 이점으로 요약할 수 있습니다. 즉, 더 나은 성능과 더 저렴한 배포용 클라이언트 PC입니다. 우리 입장에서는 조직이 어려움을 겪고 있는 노후화 또는 부진한 VDI 설정을 개선하려고 할 때 이러한 기능을 고려할 필요가 없습니다.
Intel 데이터 센터 GPU Flex 시리즈 170 제품 페이지
StorageReview에 참여
뉴스레터 | 유튜브 | 팟캐스트 iTunes/스포티 파이 | 인스타그램 | 트위터 | 틱톡 서비스 | RSS 피드