Ontdek hoe u Proxmox vGPU configureert voor AI, VDI en rendering met stapsgewijze installatie-, test- en prestatie-inzichten.
Proxmox Server Solutions heeft onlangs NVIDIA vGPU-ondersteuning aangekondigd voor hun Virtual Environment (VE) hypervisor, waarmee een compleet nieuwe wereld van GPU-acceleratie voor rendering, VDI, AI en andere applicaties wordt ontsloten. Doe met ons mee terwijl we de nieuwe functieset van de hypervisor beoordelen en u erdoorheen leiden en de prestaties ervan evalueren.
Wat is het grote voordeel van vGPU-ondersteuning?
Als u niet bekend bent met de vGPU-software van NVIDIA, kunt u hiermee de computer- en geheugenbronnen van een GPU partitioneren en distribueren over meerdere virtuele machines (VM's). In deze opstelling wisselen de VM's elkaar af met de verwerkingskracht van de GPU en alloceren ze een deel van het geheugen van de kaart voor hun behoeften. Deze aanpak stelt de GPU in staat om piekgebruik te behouden, zelfs als de werklasten van de gast-VM's in intensiteit variëren.
Voordat we beginnen… (Vereisten)
U hebt een paar dingen nodig voordat u een GPU-virtualisatieomgeving in Proxmox VE (PVE) kunt opstarten. Zoals veel datacenter-goodies is de vGPU-software van NVIDIA niet gratis. U moet inkomsten or Meld je aan voor de evaluatieversie van hun Virtual GPU Software en maak een NVIDIA Enterprise-account aan. Vervolgens moet u een vGPU-compatibele kaart en download de juiste drivers van de licentieportaal. Pak de huidige versies van de “Linux KVM” drivers. Download minimaal deze:
- vGPU-software: 18.0
- Hoststuurprogramma: 570.124.03
- Linux gastdriver: 570.124.06
- Windows gaststuurprogramma: 572.60
Voor dit project hebben we gebruikgemaakt van de NVIDIA L40S en een Dell PowerEdge R760.
Daarnaast hebt u een dedicated licensing server (DLS) of cloud licensing server (CLS) nodig om vGPU-functionaliteit op uw gasten te activeren. U kunt een quick start guide vinden door te klikken op hier.
Controleer vervolgens of de UEFI (BIOS)-instellingen van uw server de juiste virtualisatiefuncties inschakelen. Zoek naar VT-d or amd v, SR-IOV, boven 4G-decodering, aanpasbare balken Alternatieve routerings-ID-interpretatie (ARI) instellingen en zorg ervoor dat alles is ingeschakeld.
Opmerking: Het is mogelijk dat u niet al deze functies in het UEFI-menu vindt, omdat sommige niet zichtbaar zijn voor de gebruiker.
Controleer ten slotte of u een geschikte versie van Proxmox VE gebruikt. vGPU-functionaliteit vereist minimaal pve-manager versie 8.3.4, met kernel 6.18.12-8-pve of nieuwer. U kunt de softwareversies van uw PVE-knooppunt controleren door naar het tabblad 'Samenvatting' op de gewenste server te gaan, zoals hieronder wordt weergegeven:
De host met de meeste (Proxmox Host vGPU-installatie)
Nu alles klaar is, is het tijd om de Proxmox VE-server te configureren. Klik in de webinterface van uw Proxmox VE-server op de servernaam aan de linkerkant van het scherm en selecteer het tabblad 'Shell'. Typ deze opdracht in het consolevenster dat verschijnt en druk op Enter wanneer u klaar bent:
apt installeer pve-nvidia-vgpu-helper
Dit zorgt ervoor dat de vGPU-installatietool op uw server wordt geïnstalleerd en voorbereidt op Proxmox vGPU-ondersteuning. Nadat de server klaar is met het installeren van het script of u laat weten dat het al aanwezig is, voert u nog een opdracht uit om de tool uit te voeren.
pve-nvidia-vgpu-helper-installatie
Antwoord "Y" op alle vragen en ga door totdat het consolevenster terugkeert en het script is voltooid. Voer een snelle herstart van de server uit door naar het tabblad "Summary" van de server te navigeren en op de knop "Reboot" te drukken, of typ de reboot-opdracht in het tabblad "Shell" van de console en druk op Enter.
Vervolgens moet de vGPU-hostdriver van NVIDIA op de server worden geladen. Nadat de server opnieuw is opgestart, gebruikt u een SSH- of SCP-overdrachtstool zoals WinSCP om de hostdriver naar het knooppunt te kopiëren.
Opmerking: Als u alle drivers samen als een gecomprimeerde (.zip) map hebt gedownload, moet u mogelijk eerst de inhoud ervan uitpakken en het bestand “.run” selecteren in de map “Host_Drivers”.
Plaats het bestand in de map “/home” van de server en bereid u voor om het installatieprogramma uit te voeren met de volgende opdrachten.
cd /home chown root NVIDIA-Linux-x86_64-570.124.03-vgpu-kvm.run chmod +X NVIDIA-Linux-x86_64-570.124.03-vgpu-kvm.run ./NVIDIA-Linux-x86_64-570.124.03-vgpu-kvm.run --dkms
Opmerking: Vervang “NVIDIA-Linux-x86_64-570.124.03-vgpu-kvm.run” door de werkelijke naam van de driver die u hebt gedownload. U kunt de opdracht “ls” gebruiken om de naam van het bestand weer te geven nadat het in de map “/home” is geplaatst.
Nu de driver op de server is geïnstalleerd, zijn we nog maar een paar stappen verwijderd van het gereed hebben van de host-kant van onze Proxmox vGPU-configuratie! Voordat we de GPU kunnen markeren als een apparaat dat kan worden gesplitst tussen virtuele machines, moeten we Single Root I/O Virtualization (SR-IOV) inschakelen. NVIDIA definieert deze functie als "...een technologie die een fysiek PCIe-apparaat toestaat zichzelf meerdere keren te presenteren via de PCIe-bus. Deze technologie maakt meerdere virtuele instanties van het apparaat mogelijk met afzonderlijke bronnen." Omdat SR-IOV een cruciaal stukje technologie is dat nodig is voor basis-vGPU-functionaliteit op moderne GPU's, stelt u het in om bij het opstarten in te schakelen met de volgende opdracht:
systemctl enable --nu [e-mail beveiligd]
Ten slotte kunnen we de resources van de GPU in kaart brengen om ze netjes te verdelen tussen VM's. Klik op de webinterface van de Proxmox VE-server op "Datacenter" in de linkerbovenhoek en scroll naar beneden om het tabblad "Resource Mappings" te selecteren.
Klik op de knop 'Toevoegen' onder het gedeelte 'PCI-apparaten' van de pagina en vul het veld 'Naam:' in het volgende venster in met de naam die de GPU beschrijft die u toewijst.
Selecteer vervolgens het vakje met het label "Use with Mediated Devices" en zorg ervoor dat het dropdownmenu "Mapping on Node" de server bevat met de GPU die wordt toegewezen. Scroll naar beneden in de lijst met apparaten en bevestig dat alle apparaat-ID's "NVIDIA Corporation" bevatten in de kolom "Vendor". Als dit het geval is, klikt u op het selectievakje linksboven in de tabel om alle apparaten te selecteren; selecteer anders alleen de apparaten met "NVIDIA Corporation" als leverancier.
Opmerking: Als er meerdere GPU's in uw systeem zijn geïnstalleerd, kunt u de opdracht 'lspci' op het tabblad 'Shell' op de gewenste server gebruiken om de ID's te bepalen die bij elke kaart horen.
Wanneer u klaar bent met het selecteren van het apparaat, klikt u op de knop "Create" rechtsonder in het pop-upvenster om uw selectie te bevestigen. Uw NVIDIA GPU is nu klaar om te worden gesplitst in vGPU's voor de gasten van uw Proxmox VE-server!
Gasten bedienen (vGPU's toewijzen aan virtuele machines)
De stukken zijn allemaal op hun plaats zodat we kunnen beginnen met het toewijzen en gebruiken van vGPU's op onze virtuele machines. Begin met het maken van een nieuwe virtuele machine, zoals gebruikelijk, of door een bestaande VM te gebruiken. Voor onze demonstratie gebruiken we een Windows Server 2025 virtuele machine.
Sluit de virtuele machine af via de webinterface van de Proxmox VE-server met de methode die u het beste vindt (noVNC-console, gast-voedingsmenu, enz.) en klik op het tabblad 'Hardware' van de gast.
Selecteer een 'PCI-apparaat' in het vervolgkeuzemenu dat verschijnt nadat u op de knop 'Toevoegen' hebt geklikt.
Selecteer in het pop-upvenster 'Toevoegen: PCI-apparaat' de naam die u hebt toegewezen aan de resource-toegewezen GPU in het veld 'Apparaat:'.
Klik vervolgens op het veld "MDev Type:" en bekijk de lijst met gepresenteerde opties voor gemedieerde apparaattypen. U ziet dat elke keuze een nummer en letteraanduiding heeft. Het nummer staat voor de hoeveelheid VRAM die is toegewezen aan de gast (in gigabytes), terwijl de "A", "B" en "Q" verwijzen naar het gebruiksscenario van de vGPU:
- V – Virtuele werkstations met RTX Enterprise Drivers (vereist RTX vWS-licentie)
- B – Virtuele desktops (vereist NVIDIA Virtual PC-licentie of RTX vWS-licentie)
- A – Toepassingsoplossingen (vereist een NVIDIA Virtual Applications-licentie)
Opmerking: U kunt meer lezen over de verschillende vGPU-profielen en de vereiste licenties hier.
Voor deze demonstratie gebruikten we het profiel "NVIDIA L40S-12Q". Nadat u het gewenste mediated device type hebt geselecteerd, rondt u af door het selectievakje "PCI-Express" aan te vinken en op de blauwe knop "Add" te klikken.
De VM heeft nu een vGPU toegewezen gekregen, maar we moeten nog steeds de gastdriver en een licentietoken installeren om alles aan de praat te krijgen. U kunt nu de virtuele machine aanzetten en inloggen.
Nadat u bent ingelogd, brengt u de eerder verkregen NVIDIA vGPU-gastdriver over van de licentieportaal naar de VM op elke gewenste manier (SMB, SCP, direct downloaden, enz.). U kunt ook een virtueel CD-ROM-bestand (.iso) met de driver maken en uploaden naar de opslag van uw PVE-server met behulp van software zoals ImgBurn om meerdere vGPU-geschikte gasten tegelijkertijd te implementeren.
Voer het installatiebestand van de driver uit door te dubbelklikken op het uitvoerbare bestand en volg de instructies in het installatiemenu dat verschijnt.
Pak de driver uit naar de standaardlocatie in het veld 'Extractiepad:' en kies de optie 'Snelle' installatie wanneer daarom wordt gevraagd.
Zodra de installatie van de driver is voltooid, klikt u op de knop “SLUITEN” om het menu te verlaten.
Vervolgens moeten we de vGPU-licentie op de gast activeren. Activeringsmethoden kunnen aanzienlijk verschillen, afhankelijk van of u een dedicated license server (DLS) of cloud license server (CLS) selecteert en uw besturingssysteem. Volg NVIDIA's Snelstartgids voor het licentiesysteem en Gebruikershandleiding voor clientlicenties voor gedetailleerde stappen voor het activeren van clients voor uw specifieke configuratie.
We gebruikten een cloudlicentieserver en ontvingen een tokenbestand om op gasten te plaatsen voor activering. Verplaats dit bestand naar de gast en kopieer het naar de map "C:\Program Files\NVIDIA Corporation\vGPU Licensing\ClientConfigToken".
Vervolgens is het nodig om de gast opnieuw op te starten om het activeringsproces te voltooien.
Als u alle host- en gastconfiguratiestappen volgt die hier worden beschreven, bent u klaar om programma's en applicaties uit te voeren die een GPU vereisen. Vergeet niet om Remote Desktop Protocol (RDP) in te schakelen of uw favoriete externe bureaubladsoftware op uw gasten te installeren na het opnieuw opstarten om te genieten van GPU-versnelde externe weergave!
Motor opvoeren (Proxmox vGPU uitproberen)
Nu we een aantal virtuele servers met virtuele GPU's hebben, gaan we ze eens uitproberen! Elk van onze VM's is geconfigureerd met 8 gepinde Intel Xeon Platinum 8580 vCPU's (4 hyperthreaded cores), 32 gigabyte DDR5 4800 MT/s geregistreerde ECC RAM en het NVIDIA L40S-12Q (virtual workstation) vGPU-profiel met 12 gigabyte VRAM. Hieronder ziet u de volledige hardwareconfiguratie van de virtuele machines:
Cinebench 2024
Gebaseerd op Maxon's Cinema 4D modellerings- en animatiesoftware, biedt Cinebench 2024 een interessante en objectieve blik op renderingprestaties op vGPU's. Laten we de volledige kracht van de L40S in zijn "48Q" (alle 48 gigabytes VRAM) profiel vergelijken met één virtuele machine versus vier VM's die het "12Q" profiel draaien.
Hoewel het niet veel zin heeft om één virtuele machine de hele L40S te laten innemen, kunnen we zien dat de prestaties indrukwekkend zijn met 21,147 punten in de single-pass GPU-benchmark. Echter, het op vier manieren splitsen van de GPU laat de impact zien van NVIDIA's time-slicing-aanpak om de CUDA-cores van de GPU te delen, met individuele scores variërend van 2,514 tot 2,567 wanneer de benchmark gelijktijdig werd uitgevoerd op alle VM's.
Door de test opnieuw uit te voeren op een enkele virtuele machine met het "12Q"-profiel en de andere drie VM's inactief te laten zijn, stijgt de score weer naar 15,133. Het is niet bepaald een terugkeer naar de volledige GPU-score, maar het is nog steeds respectabel voor een gepartitioneerde vGPU.
Blender-benchmarks
Laten we doorgaan met nog een paar rendering benchmarks met Blender. In navolging van vergelijkbare trends als Cinebench 2024, resulteert het splitsen van de GPU in vier richtingen in dramatisch lagere totale prestaties in vergelijking met een enkele virtuele machine die dezelfde workload in hetzelfde profiel uitvoert.
Zoals aangetoond in de Monster-benchmark, betekent het delen van de rekenkracht van de GPU door slechts vier VM's dat de individuele renderprestaties slechts 8% van die van een enkele VM met hetzelfde profiel kunnen bedragen. We zagen echter wel dat één virtuele machine een behoorlijke voorsprong op de anderen kreeg, tot wel 2.4 keer de score van de slechtste presteerder.
De Junkshop- en Classroom-benchmarks laten een soortgelijk verhaal zien, met grote prestatiedalingen bij drie van de vier VM's en één gast die een veel hogere score krijgt dan de anderen.
Interessant genoeg lijken er korte momenten te zijn waarop de vGPU van één virtuele machine een hogere prioriteit krijgt en een aanzienlijke voorsprong neemt. Bijvoorbeeld, tijdens de Classroom-benchmark behaalde onze tweede Windows Server 2025 VM (WIN2025-2) meer dan drie keer de prestaties van zijn peers, ondanks dat deze gelijktijdig werden uitgevoerd. Hoewel we niet precies kunnen bepalen of dit komt door de planning van de vGPU-software of door de aard van de GPU zelf, benadrukt het enkele prestatie-eigenaardigheden die synoniem zijn met NVIDIA's time-slicing-only-aanpak met deze kaart.
Conclusie
De installatie en ondersteuning voor NVIDIA's vGPU-software is misschien niet zo gepolijst als die van andere concurrerende platforms. Toch is het een opwindende en waardevolle functie voor organisaties en homelabbers die al Proxmox Virtual Environment-systemen gebruiken. Hoewel de prestaties aanzienlijk worden verminderd bij het splitsen van GPU-bronnen, maken veel organisaties nog steeds gebruik van NVIDIA's vGPU-technologie en hebben ze vastgesteld dat het delen van een GPU opweegt tegen dit nadeel. Deze houding is overgenomen door veel hyperscalers en datacenters met beperkte ruimte, waar het proppen van zoveel mogelijk tenants (in dit geval virtuele machines met vGPU's) in de kleinst mogelijke footprint de meest efficiënte en winstgevende optie is.
De recente en snelle uitbreiding van functies door Proxmox Server Solutions, zoals softwaregedefinieerde netwerken, ondersteuning voor de Linux 6.11-kernel en een speciaal datacenterbeheersysteem toont significante vooruitgang en bewijst dat het een geldige keuze wordt in de hypervisorarena. We hopen op verdere ontwikkeling in deze ruimte en kijken ernaar uit om u binnenkort meer te vertellen over opwindende tools en technologieën die naar PVE komen!
Neem contact op met StorageReview
Nieuwsbrief | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS Feed