홈페이지 EnterpriseAI SLI에서 NVLink까지: 게임 및 다중 GPU 기술의 진화와 AI에 미치는 영향

SLI에서 NVLink까지: 게임 및 다중 GPU 기술의 진화와 AI에 미치는 영향

by 조던 라누스
HP Z8 Fury G5 CPU 쿨러

그래픽 처리 장치(GPU) 환경은 지난 XNUMX년 동안 엄청난 변화를 겪었으며, 훨씬 더 최근에는 AI의 급증으로 인해 발생했습니다. 이러한 발전의 중요한 부분은 여러 GPU가 동시에 작동할 수 있는 기술의 개발이었습니다. GPU 분야의 선두주자인 NVIDIA는 SLI(Scalable Link Interface)와 엔비디아 NV링크. 이 기사에서는 SLI에서 NVLink로의 여정을 추적하여 NVIDIA가 끊임없이 변화하는 컴퓨팅 요구에 지속적으로 적응하는 방법을 강조합니다.

그래픽 처리 장치(GPU) 환경은 지난 XNUMX년 동안 엄청난 변화를 겪었으며, 훨씬 더 최근에는 AI의 급증으로 인해 발생했습니다. 이러한 발전의 중요한 부분은 여러 GPU가 동시에 작동할 수 있는 기술의 개발이었습니다. GPU 분야의 선두주자인 NVIDIA는 SLI(Scalable Link Interface)와 엔비디아 NV링크. 이 기사에서는 SLI에서 NVLink로의 여정을 추적하여 NVIDIA가 끊임없이 변화하는 컴퓨팅 요구에 지속적으로 적응하는 방법을 강조합니다.

SLI의 새벽

NVIDIA는 원래 Voodoo2000 카드 라인용으로 3dfx에서 개발한 SLI를 2년대 초반에 선보였으며 비디오 게임 및 소비자 애플리케이션에서 더 높은 그래픽 충실도에 대한 수요 증가에 대한 NVIDIA의 대답이었습니다. 기본적으로 SLI는 AFR(대체 프레임 렌더링)이라는 기술을 사용하여 렌더링 작업 부하를 여러 GPU에 나눕니다. 각 카드는 매 프레임마다 또는 각 프레임의 일부를 그려 그래픽 성능을 효과적으로 두 배로 늘립니다. 당시 SLI는 혁신적이었지만 지연 시간이 길고 GPU 간 데이터 공유 유연성이 부족하다는 등의 한계가 있었습니다.

SLI 대 CrossFire: 다중 GPU 솔루션의 경쟁

NVIDIA의 SLI가 다중 GPU 구성의 속도를 설정했지만 경쟁이 없었던 것은 아닙니다. AMD의 크로스파이어 다중 GPU 설정에 유사한 기능을 제공하는 직접적인 경쟁자였습니다. SLI와 마찬가지로 CrossFire는 AFR(대체 프레임 렌더링) 및 SFR(분할 프레임 렌더링)과 같은 기술을 통해 그래픽 성능을 향상시키는 것을 목표로 했습니다.

이미지 크레디트 달라스 무어

이미지 크레디트 달라스 무어

그러나 CrossFire에는 고유한 장점과 과제가 있었습니다. 일반적으로 사용할 수 있는 GPU 조합이 더 유연하여 다양한 AMD 카드를 혼합할 수 있습니다. 단점이라면 CrossFire는 소프트웨어 스택으로 인해 종종 비판을 받았는데, 일부 사용자는 NVIDIA의 SLI보다 안정성이 낮고 구성이 더 복잡하다고 생각했습니다. 이러한 차이점에도 불구하고 두 기술은 게임 및 소비자 그래픽 경험 향상이라는 동일한 목표를 향해 맞춰졌습니다. 보다 발전되고 데이터 집약적인 작업을 처리하는 데 있어 한계가 있기 때문에 결국 NVLink와 같은 차세대 솔루션의 길을 열어줄 것입니다.

2010년대에 들어서면서 컴퓨팅 환경은 극적으로 변화하기 시작했습니다. 인공지능(AI), 고성능 컴퓨팅(HPC), 빅데이터 분석의 등장으로 더욱 강력한 다중 GPU 솔루션이 필요해졌습니다. 처음에 게임 및 소비자 작업 부하를 염두에 두고 설계된 SLI는 이러한 계산 집약적인 작업에 충분하지 않다는 것이 분명해졌습니다. NVIDIA에는 새로운 패러다임이 필요했습니다.

듀얼 GPU 카드 시대: 다중 GPU 컴퓨팅에 대한 독특한 접근 방식

SLI 및 CrossFire와 같은 기술은 여러 개별 GPU를 연결하는 데 중점을 두었지만 다중 GPU 구성에 대한 덜 일반적인 접근 방식인 듀얼 GPU 카드가 있었습니다. 이러한 특수 그래픽 카드는 단일 PCB(인쇄 회로 기판)에 690개의 GPU 코어를 수용하여 단일 카드에서 SLI 또는 CrossFire 설정으로 효과적으로 작동합니다. NVIDIA GeForce GTX 6990 및 AMD Radeon HD XNUMX과 같은 카드는 이러한 접근 방식의 인기 있는 예입니다.

듀얼 GPU 카드는 여러 가지 장점을 제공합니다. 두 개의 GPU를 하나의 카드 슬롯으로 압축하여 공간을 절약하여 소형 폼 팩터 PC에 적합합니다. 또한 별도의 카드를 외부 커넥터와 연결할 필요가 없어 설정이 단순화되었습니다. 그러나 이 카드에도 문제가 있었습니다. 열 방출은 심각한 문제였으며 종종 고급 냉각 솔루션이 필요했습니다. 전력 소비량도 높았기 때문에 시스템을 안정화하려면 강력한 전원 공급 장치가 필요했습니다.

흥미롭게도 듀얼 GPU 카드는 다중 GPU 설정의 강력한 성능과 단일 카드의 단순성을 결합한 일종의 "두 세계 최고의" 솔루션이었습니다. 그러나 높은 비용과 관련 기술 문제로 인해 틈새 제품으로 간주되는 경우가 많았습니다. NVLink와 같은 다중 GPU 기술이 더 높은 대역폭과 더 낮은 대기 시간을 제공하도록 발전함에 따라 듀얼 GPU 카드의 필요성이 감소했습니다. 그럼에도 불구하고 이는 GPU 개발 역사에서 여전히 흥미로운 장으로 남아 있습니다.

NVIDIA의 Tesla GPU 제품군은 특히 데이터 센터와 고성능 컴퓨팅 클러스터에서 엔터프라이즈급 컴퓨팅의 초석이었습니다. 대부분의 Tesla GPU는 최대 성능과 효율성을 위해 설계된 단일 GPU 카드이지만 단일 카드에 듀얼 GPU를 탑재한 Tesla K80과 같은 예외도 있었습니다. 이러한 다중 GPU Tesla 카드는 고도의 병렬 계산에 최적화되었으며 과학 연구, 기계 학습 및 빅 데이터 분석의 필수 요소였습니다. 이러한 애플리케이션의 특정 요구 사항을 충족하도록 설계되어 높은 계산 처리량, 대용량 메모리 및 ECC(오류 정정 코드) 메모리와 같은 고급 기능을 제공합니다. 단일 GPU에 비해 ​​덜 일반적이지만, 이러한 듀얼 GPU Tesla 카드는 비록 틈새 시장이기는 하지만 엔터프라이즈 컴퓨팅에서 강력하고 강력한 솔루션을 제시했습니다.

NVLink의 출현

2017년 NVIDIA의 Volta 아키텍처와 함께 도입된 NVLink를 만나보세요. 이 기술은 단순한 업그레이드가 아니라 GPU가 상호 연결될 수 있는 방법에 대한 근본적인 재검토였습니다. NVLink는 훨씬 더 높은 대역폭(최신 버전의 경우 최대 900GB/s), 더 낮은 대기 시간 및 GPU 간의 더 복잡하고 수많은 상호 연결을 허용하는 메시 토폴로지를 제공했습니다. 또한 NVLink는 통합 메모리 개념을 도입하여 연결된 GPU 간의 메모리 풀링을 가능하게 합니다. 이는 대규모 데이터 세트가 필요한 작업에 중요한 기능입니다.

NVLink 성능의 진화

NVLink 성능의 진화

SLI 대 NVLink

언뜻 보면 NVLink를 "스테로이드를 사용한 SLI"로 생각할 수도 있지만 이는 지나치게 단순화된 것입니다. 두 기술 모두 여러 GPU를 연결하는 것을 목표로 하지만 NVLink는 다양한 대상을 염두에 두고 설계되었습니다. 과학 연구, 데이터 분석, 특히 AI 및 기계 학습 애플리케이션을 위해 제작되었습니다. 더 높은 대역폭, 더 낮은 대기 시간 및 통합 메모리 덕분에 NVLink는 오늘날의 컴퓨팅 문제를 해결하는 훨씬 더 유연하고 강력한 솔루션입니다.

NVLink의 기술 백본

NVLink는 속도뿐 아니라 아키텍처 설계 측면에서도 다중 GPU 상호 연결 기술의 논리적 발전을 나타냅니다. NVLink의 패브릭은 데이터를 양방향으로 전송할 수 있는 고속 데이터 레인으로 구성됩니다. 기존 버스 기반 시스템과 달리 NVLink는 지점 간 연결을 사용하여 병목 현상을 효과적으로 줄이고 데이터 처리량을 향상시킵니다. 최신 반복에서는 SLI 기능에 비해 크게 향상된 최대 900GB/s의 대역폭을 제공합니다.

HP Z8 Fury G5 인테리어

8x A5 GPU를 탑재한 HP Z4 Fury G6000

NVLink를 차별화하는 주요 기능 중 하나는 메시 토폴로지를 지원하는 기능입니다. 기존 기술의 데이지 체인 또는 허브 앤 스포크 토폴로지와 달리 메시 설정을 사용하면 GPU 간에 더욱 다양한 연결이 가능합니다. 이는 복잡한 데이터 경로가 일반적인 데이터 센터 및 고성능 컴퓨팅 애플리케이션에 특히 유용합니다.

통합 메모리는 NVLink의 또 다른 기능입니다. 이를 통해 GPU는 공통 메모리 풀을 공유할 수 있어 보다 효율적인 데이터 공유가 가능하고 GPU 간에 데이터를 복사할 필요성이 줄어듭니다. 이는 대규모 데이터 세트가 종종 단일 GPU의 메모리 용량을 초과하는 기계 학습 및 빅 데이터 분석과 같은 애플리케이션에 엄청난 이점을 제공합니다.

NVLink는 또한 모든 고성능 컴퓨팅 설정에서 중요한 요소인 대기 시간을 개선합니다. 대기 시간이 짧을수록 GPU 간의 데이터 전송 및 동기화 속도가 빨라져 병렬 계산이 더욱 효율적으로 이루어집니다. 이는 NVLink의 DMA(직접 메모리 액세스) 기능을 통해 달성되며, GPU는 CPU를 사용하지 않고도 서로의 메모리를 직접 읽고 쓸 수 있습니다.

AI와 머신러닝에 미치는 영향

현대 컴퓨팅에서 AI의 중요성이 증가함에 따라 NVLink의 장점은 점진적일 뿐만 아니라 혁신적입니다. AI 모델 훈련 및 데이터 생성에서 NVLink는 GPU 간 데이터 전송 속도를 높여 보다 효율적인 병렬 처리를 가능하게 합니다. 이는 AI 모델 훈련 데이터 생성이라는 새로운 분야와 밀접하게 관련된 주제인 대규모 훈련 데이터세트로 작업할 때 특히 유용합니다.

양자 시뮬레이션, 실시간 분석, 차세대 AI 알고리즘과 같은 고급 컴퓨팅에 대한 수요가 증가함에 따라 NVLink의 기능이 더욱 향상될 것으로 기대할 수 있습니다. 대역폭의 증가이든, GPU 간의 협력을 훨씬 더 촉진하는 새로운 기능이든, NVLink 또는 그 후속 제품은 의심할 여지 없이 미래의 컴퓨팅 요구 사항을 충족하는 데 핵심이 될 것입니다.

SLI에서 NVLink로의 전환은 다중 GPU 기술에 있어서 중요한 이정표입니다. 이는 변화하는 컴퓨팅 환경에 대한 혁신과 예리한 이해에 대한 NVIDIA의 의지를 반영합니다. 게임에서 AI, 소비자 애플리케이션, 데이터 센터에 이르기까지 게임과 SLI에서 NVLink의 뿌리는 필요성이 혁신을 낳고 끝없는 개선 주기에서 기술을 발전시키는 방법을 보여줍니다.

StorageReview에 참여 

뉴스레터 | 유튜브 | 팟캐스트 iTunes/스포티 파이 | 인스타그램 | 트위터 | 틱톡 서비스 | RSS 피드