Casa Impresa Aumentare l'efficienza del data center con SSD Solidigm e server raffreddati a liquido

Aumentare l'efficienza del data center con SSD Solidigm e server raffreddati a liquido

by Brian Beeler
Unità CD-ROM Dell PowerEdge CoolIT Mini

L'abbinamento del raffreddamento a liquido con una gestione efficiente degli SSD offre una strada nuova per i data center che mirano ad aumentare le prestazioni e la densità di archiviazione.

Mentre i data center si sforzano di raggiungere una maggiore efficienza energetica, in particolare con le richieste dei carichi di lavoro AI, molti si stanno rivolgendo al raffreddamento a liquido per ottimizzare le prestazioni e gestire il consumo energetico. Il raffreddamento a liquido può gestire in modo efficiente il calore generato dai server ad alte prestazioni, consentendo loro di funzionare alla massima capacità senza i costi ad alta intensità energetica associati al tradizionale raffreddamento ad aria. Gli SSD ad alta densità di Solidigm sono ideali per questi ambienti, offrendo un'eccezionale efficienza terabyte-watt.

Mentre l'intelligenza artificiale costringe molti operatori di data center a prendere in considerazione il raffreddamento a liquido, il suo impatto si estende molto più lontano. In un precedente rapporto, abbiamo esaminato il effetto del raffreddamento a liquido su un Dell PowerEdge R2 760U. Il raffreddamento a liquido diretto (DLC) di CoolIT ha ridotto significativamente il consumo energetico del server abbassando la velocità delle ventole, con un risparmio energetico di 200 watt. Quel test era incentrato interamente sulle prestazioni della CPU; questa volta, volevamo dare un'occhiata più incentrata sullo storage per comprendere l'impatto degli SSD sul consumo energetico del server.

Dell PowerEdge Solidigm e CDU

Cosa sono gli stati di potenza attiva NVMe?

Gli stati di potenza NVMe sono stati predefiniti in cui un dispositivo NVMe può passare per gestire il consumo energetico e le prestazioni. La specifica NVMe consente fino a 32 stati di alimentazione, ciascuno caratterizzato da consumo energetico massimo, latenza di ingresso (ENLAT), latenza di uscita (EXLAT) e valori di prestazioni relativi. Questi stati di alimentazione sono divisi in stati operativi e non operativi. Gli stati di alimentazione operativi, o P-States, consentono al dispositivo di gestire le operazioni di I/O. Gli stati non operativi, o F-States, vengono utilizzati quando il dispositivo è inattivo e non gestisce le operazioni di I/O.

La gestione di questi stati di alimentazione è fondamentale per ottimizzare l'efficienza energetica dei dispositivi NVMe, soprattutto in ambienti in cui il consumo energetico è un problema critico, come i dispositivi edge e le applicazioni specializzate come gli SSD sulla Stazione Spaziale Internazionale. Ad esempio, la specifica NVMe include funzionalità come Autonomous Power State Transition (APST), che consente al dispositivo di passare automaticamente tra stati di alimentazione in base all'utilizzo corrente e alle condizioni termiche. Ciò aiuta a bilanciare le prestazioni con il consumo energetico, garantendo un funzionamento affidabile in ambienti remoti o limitati. Il supporto Runtime D3 (RTD3) consente al dispositivo di entrare in uno stato di inattività a zero potenza, risparmiando ulteriormente energia quando il dispositivo non è in uso.

Gli stati di potenza NVMe sono particolarmente utili quando l'efficienza energetica e la gestione termica sono fondamentali. Nei dispositivi edge, ad esempio, la capacità di passare rapidamente a stati di potenza inferiori quando inattivi può ridurre significativamente il consumo energetico, il che è fondamentale per i dispositivi che operano in ambienti remoti o difficili con disponibilità di potenza limitata. Ciò si ottiene tramite funzionalità come PCIe Active State Power Management (ASPM) e stati di bassa potenza come L1.1 e L1.2, che riducono il consumo energetico a livelli minimi. La gestione di potenza e output termico sulla ISS è fondamentale a causa dell'ambiente limitato e controllato. Gli stati di potenza NVMe possono aiutare a limitare il consumo energetico degli SSD per gestire il thermal design power (TDP) e ottimizzare il budget energetico complessivo, assicurando che gli SSD funzionino in modo efficiente senza surriscaldarsi.

In questi ambienti specializzati, gli stati di alimentazione NVMe forniscono un modo flessibile ed efficiente per gestire il consumo energetico dei dispositivi NVMe. Sfruttando questi stati, i dispositivi possono bilanciare prestazioni ed efficienza energetica, rendendoli adatti a varie applicazioni, dall'edge computing alle missioni spaziali. La capacità di regolare dinamicamente gli stati di alimentazione in base alle condizioni in tempo reale garantisce che i dispositivi NVMe possano soddisfare le diverse esigenze di diversi ambienti, ottimizzando al contempo l'efficienza energetica e la gestione termica.

Oltre agli stati di potenza NVMe, il concetto di temperatura composita e temperatura di tocco svolge un ruolo cruciale nella gestione delle prestazioni termiche degli SSD NVMe nei nuovi SSD aziendali. La temperatura di tocco rappresenta la temperatura esterna del case dell'SSD. Solidigm è stata leader nell'adozione di nuovi standard di temperatura di tocco più elevati. La temperatura di tocco impostata in fabbrica per Solidigm D5-P5336, ad esempio, è di 80 °C. Questo limite di temperatura di tocco più elevato consente agli SSD di essere raffreddati con un flusso d'aria inferiore o di funzionare a temperature ambiente più elevate. Questa flessibilità consente ai data center di ottimizzare le strategie di raffreddamento e migliorare la gestione termica complessiva, riducendo potenzialmente i costi di raffreddamento e migliorando l'affidabilità e la longevità degli SSD.

Gestione degli stati di potenza attiva NVMe

In un ambiente di test Linux che esegue Ubuntu 22.04, possiamo usare il set di strumenti NVMe per interrogare l'unità per visualizzare e modificare gli stati di alimentazione del D5-P5336. Come puoi vedere di seguito, l'unità supporta gli stati 0,1, 2 e 0, con lo stadio 2 che è il meno restrittivo e lo stadio XNUMX che è il più restrittivo.

Per il Solidigm 61.44 TB D5-P5336, PS0 è 25 W, PS1 è 15 W e PS2 è 10 W. L'unità è inattiva a circa 5.5 W, quindi con ogni aumento della modalità di alimentazione, l'SSD ha sempre meno overhead di potenza da dedicare alle operazioni di lettura e scrittura NAND. Le operazioni di scrittura subiscono il colpo più grande, poiché utilizza più potenza per scrivere su NAND rispetto a quando legge da essa.

Il comando per controllare lo stato di alimentazione corrente sul nostro SSD Solidigm D5-P5336 è mostrato di seguito. Il valore corrente di 00000000 indica che l'unità è in PS0, che è la modalità più alta da 25 W.

Un comando simile viene emesso per modificare lo stato di alimentazione, con il numero finale che rappresenta la modalità di alimentazione in cui si desidera che si trovi l'SSD. Ad esempio, il seguente comando imposta la modalità di alimentazione su PS0 sull'SSD Soldigim D5-P5336. Se si utilizzano le modalità di alimentazione 1 o 2, modificare la cifra—-value= in modo che corrisponda alla modalità di alimentazione corretta.

Impatto degli stati di potenza sulle prestazioni

Per misurare l'impatto sulla potenza e sulle prestazioni degli stati di potenza sull'SSD Solidigm D5-P5336 da 61.44 TB, abbiamo equipaggiato un Dell PowerEdge R760 con 24 SSD. Eseguendo Ubuntu e il generatore di carichi di lavoro FIO, potremmo facilmente eseguire un carico di lavoro coerente su tutti gli SSD e aggiornare la modalità di alimentazione al volo.

Dell PowerEdge Solido P5336

Abbiamo utilizzato il monitoraggio dell'alimentazione integrato di Dell all'interno del sistema di gestione integrato iDRAC9 del server per monitorare l'alimentazione a livello di sistema.

Alimentazione Dell PowerEdge iDRAC

Ci siamo concentrati sui carichi di lavoro di larghezza di banda di lettura e scrittura sequenziali, utilizzando una dimensione di blocco di 128 K su ogni unità, e poi abbiamo misurato le prestazioni aggregate su tutti i 24 SSD. Va notato che questa particolare configurazione Dell PowerEdge R760 con 24 bay NVMe sfrutta uno switch PCIe rispetto ai bay NVMe con collegamento diretto. Quindi, la larghezza di banda totale misurata satura le corsie dello switch PCIe disponibili prima di raggiungere le unità. Ciò influisce sulle prestazioni di lettura totali che abbiamo misurato rispetto alla scheda tecnica Soldigim P5536, ma le velocità di scrittura aggregate erano tutte al di sotto di tale limite.

Total Watts Velocità di scrittura Leggi GB/s Watts
Sopra la base
Watt/potenza
(con sovraccarico di sistema)
Inattivo Nessuna unità 462 - - - -
Unità inattive installate 594 - - 132 5.5
Lettura sequenziale 24x PS0 858 - 109GB / s 396 16.5
Lettura sequenziale 24x PS1 858 - 105GB / s 396 16.5
Lettura sequenziale 24x PS2 759 - 79.8GB / s 297 12.375
Scrittura sequenziale 24x PS0 1089 82.5GB / s - 627 26.125
Scrittura sequenziale 24x PS1 825 34.4GB / s - 363 15.125
Scrittura sequenziale 24x PS2 726 17.3GB / s - 264 11

Ripensando al nostro articolo sui vantaggi della conversione di una piattaforma raffreddata ad aria in raffreddamento diretto a liquido, abbiamo notato un leggero aumento delle prestazioni per quanto riguarda le CPU, ma abbiamo anche risparmiato 200 W di potenza. La potenza è una risorsa preziosa nella nuova ondata di server incentrati sull'intelligenza artificiale che dedicano frequentemente tutte le risorse disponibili a GPU e CPU di fascia alta. In un data center con un limite di budget energetico sul raffreddamento ad aria o vicino a esso, il passaggio a DLC consente di acquistare un budget energetico che consente di riempire il server con più SSD per lo stesso ingombro energetico di un server raffreddato ad aria.

raffreddamento a liquido solidigm coolit CDU

Un risparmio energetico di 200 W può fare molta strada per quanto riguarda la densità di archiviazione; tale risparmio consente di raddoppiare l'ingombro di archiviazione da 12 a 24 SSD in un server raffreddato a liquido rispetto a un server raffreddato ad aria se si hanno carichi di lavoro orientati verso carichi di lavoro intensivi di lettura. Con Solidigm D5-P5336, questo server a 24 alloggiamenti ha aumentato la capacità di archiviazione da 737 TB a 1,474 TB grazie al loop liquido. Se il carico di lavoro è pesante in scrittura, si potrebbe equipaggiare il server con circa altri otto SSD. Tuttavia, queste cifre si riferiscono alle modalità di alimentazione di base, quindi se si è disposti a ridurre un po' le prestazioni di scrittura rispetto alla fascia alta, si potrebbe facilmente riempire il server con 24 SSD con un carico di lavoro pesante in scrittura con prestazioni ridotte.

Conclusione

Attraverso i nostri test degli SSD Solidigm D5-P5336, abbiamo visto come la gestione degli stati di alimentazione NVMe può avere un impatto significativo sull'efficienza energetica senza influire drasticamente sulle prestazioni. Gli operatori di data center che cercano di massimizzare l'efficienza energetica possono sfruttare questi stati di alimentazione per ottenere una maggiore densità di archiviazione o ridurre i costi operativi, in particolare negli ambienti incentrati sull'intelligenza artificiale in cui l'alimentazione è un bene prezioso. Gli SSD ad alta densità di Solidigm sono ben posizionati per questo, offrendo un'eccellente efficienza terabyte-watt, in particolare con le moderne tecnologie di raffreddamento a liquido.

I nostri risultati rivelano che anche piccole modifiche agli stati di alimentazione possono produrre significativi risparmi energetici, il che può essere cruciale in ambienti limitati dalla disponibilità di energia. L'ottimizzazione del consumo energetico complessivo dei server aumenta la densità di storage e supporta operazioni di data center più sostenibili.

Dell PowerEdge Solidigm P5336 Singolo

La gestione dell'alimentazione diventa sempre più critica man mano che i server moderni vengono spinti al limite, soprattutto nei carichi di lavoro basati sull'intelligenza artificiale. L'abbinamento di raffreddamento a liquido ed efficienti opzioni di gestione SSD offre una strada da seguire per i data center che cercano di scalare prestazioni e densità di storage senza superare i budget energetici.

Puoi vedere la demo completa di queste tecnologie dal vivo all'OCP 2024. Mostreremo come il raffreddamento a liquido e gli SSD di Solidigm possono essere i capisaldi dell'efficienza energetica nel moderno data center.

Soluzioni di archiviazione Solidigm

Questo rapporto è sponsorizzato da Solidigm. Tutti i pareri e le opinioni espressi in questo rapporto si basano sulla nostra visione imparziale dei prodotti in esame.

Interagisci con StorageReview

Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS feed