À propos Entreprise Optimiser l'efficacité des centres de données grâce aux SSD Solidigm et aux serveurs refroidis par liquide

Optimiser l'efficacité des centres de données grâce aux SSD Solidigm et aux serveurs refroidis par liquide

by Brian Beeler
Unité de distribution de courant Dell PowerEdge CoolIT Mini

L'association du refroidissement liquide et d'une gestion efficace des SSD offre une voie à suivre pour les centres de données qui cherchent à augmenter les performances et la densité de stockage.

Alors que les centres de données s'efforcent d'améliorer leur efficacité énergétique, en particulier en raison des exigences des charges de travail de l'IA, beaucoup se tournent vers le refroidissement liquide pour optimiser les performances et gérer la consommation d'énergie. Le refroidissement liquide peut gérer efficacement la chaleur générée par les serveurs hautes performances, leur permettant de fonctionner à pleine capacité sans les coûts énergivores associés au refroidissement par air traditionnel. Les SSD haute densité de Solidigm sont parfaitement adaptés à ces environnements, offrant une efficacité exceptionnelle en téraoctets par watt.

Alors que l'IA oblige de nombreux opérateurs de centres de données à envisager le refroidissement liquide, son impact va bien au-delà. Dans un rapport précédent, nous avons examiné effet du refroidissement liquide sur un Dell PowerEdge R2 760U. Le refroidissement liquide direct (DLC) de CoolIT a considérablement réduit la consommation d'énergie du serveur en réduisant la vitesse des ventilateurs, ce qui représente une économie d'énergie de 200 watts. Ces tests étaient entièrement centrés sur les performances du processeur ; cette fois, nous voulions adopter une approche plus centrée sur le stockage pour comprendre l'impact des SSD sur la consommation d'énergie du serveur.

Dell PowerEdge Solidigm et CDU

Que sont les états d’alimentation actifs NVMe ?

Les états d'alimentation NVMe sont des états prédéfinis qu'un périphérique NVMe peut adopter pour gérer la consommation d'énergie et les performances. La spécification NVMe autorise jusqu'à 32 états d'alimentation, chacun caractérisé par une consommation d'énergie maximale, une latence d'entrée (ENLAT), une latence de sortie (EXLAT) et des valeurs de performances relatives. Ces états d'alimentation sont divisés en états opérationnels et non opérationnels. Les états d'alimentation opérationnels, ou états P, permettent au périphérique de gérer les opérations d'E/S. Les états non opérationnels, ou états F, sont utilisés lorsque le périphérique est inactif et ne gère pas les opérations d'E/S.

La gestion de ces états d’alimentation est essentielle pour optimiser l’efficacité énergétique des périphériques NVMe, en particulier dans les environnements où la consommation d’énergie est une préoccupation majeure, comme les périphériques de périphérie et les applications spécialisées comme les SSD de la Station spatiale internationale. Par exemple, la spécification NVMe comprend des fonctionnalités telles que la transition d’état d’alimentation autonome (APST), qui permet à l’appareil de passer automatiquement d’un état d’alimentation à l’autre en fonction de l’utilisation actuelle et des conditions thermiques. Cela permet d’équilibrer les performances avec la consommation d’énergie, garantissant un fonctionnement fiable dans des environnements distants ou contraints. La prise en charge de Runtime D3 (RTD3) permet à l’appareil d’entrer dans un état de veille à consommation nulle, ce qui permet d’économiser davantage d’énergie lorsque l’appareil n’est pas utilisé.

Les états d’alimentation NVMe sont particulièrement avantageux lorsque l’efficacité énergétique et la gestion thermique sont primordiales. Dans les appareils de périphérie, par exemple, la possibilité de passer rapidement à des états de consommation plus faibles lorsqu’ils sont inactifs peut réduire considérablement la consommation d’énergie, ce qui est essentiel pour les appareils fonctionnant dans des environnements distants ou difficiles avec une disponibilité énergétique limitée. Cela est possible grâce à des fonctionnalités telles que la gestion de l’alimentation PCIe Active State (ASPM) et les états de faible consommation tels que L1.1 et L1.2, qui réduisent la consommation d’énergie à des niveaux minimes. La gestion de l’alimentation et de la production thermique sur l’ISS est cruciale en raison de l’environnement limité et contrôlé. Les états d’alimentation NVMe peuvent aider à limiter la consommation d’énergie des SSD pour gérer la puissance de conception thermique (TDP) et optimiser le budget énergétique global, garantissant ainsi que les SSD fonctionnent efficacement sans surchauffe.

Dans ces environnements spécialisés, les états d'alimentation NVMe offrent un moyen flexible et efficace de gérer la consommation d'énergie des périphériques NVMe. En exploitant ces états, les périphériques peuvent équilibrer les performances et l'efficacité énergétique, ce qui les rend adaptés à diverses applications, de l'informatique de pointe aux missions spatiales. La possibilité d'ajuster dynamiquement les états d'alimentation en fonction des conditions en temps réel garantit que les périphériques NVMe peuvent répondre aux différentes exigences des différents environnements tout en optimisant l'efficacité énergétique et la gestion thermique.

Outre les états d'alimentation NVMe, le concept de température composite et de température tactile joue un rôle crucial dans la gestion des performances thermiques des SSD NVMe dans les nouveaux SSD d'entreprise. La température tactile représente la température externe du boîtier du SSD. Solidigm est un leader dans l'adoption de nouvelles normes de température tactile plus élevées. La température tactile réglée en usine pour Solidigm D5-P5336, par exemple, est de 80 °C. Cette limite de température tactile plus élevée permet aux SSD d'être refroidis avec un flux d'air plus faible ou de fonctionner à des températures ambiantes plus élevées. Cette flexibilité permet aux centres de données d'optimiser les stratégies de refroidissement et d'améliorer la gestion thermique globale, réduisant potentiellement les coûts de refroidissement et améliorant la fiabilité et la longévité des SSD.

Gestion des états d’alimentation actifs NVMe

Dans un environnement de test Linux exécutant Ubuntu 22.04, nous pouvons utiliser le jeu d'outils NVMe pour interroger le lecteur afin d'afficher et de modifier les états d'alimentation du D5-P5336. Comme vous pouvez le voir ci-dessous, le lecteur prend en charge les états 0,1, 2 et 0, l'étape 2 étant la moins restrictive et l'étape XNUMX la plus restrictive.

Pour le Solidigm 61.44 To D5-P5336, PS0 est de 25 W, PS1 de 15 W et PS2 de 10 W. Le disque tourne au ralenti à environ 5.5 W, donc à chaque augmentation du mode d'alimentation, le SSD a de moins en moins de surcharge d'énergie à consacrer aux opérations de lecture et d'écriture NAND. Les opérations d'écriture sont les plus touchées, car elles consomment plus d'énergie pour écrire sur la NAND que pour lire à partir de celle-ci.

La commande permettant de vérifier l'état d'alimentation actuel de notre SSD Solidigm D5-P5336 est présentée ci-dessous. La valeur actuelle de 00000000 indique que le lecteur est en mode PS0, qui correspond au mode 25 W le plus élevé.

Une commande similaire est émise pour modifier l'état d'alimentation, le dernier numéro représentant le mode d'alimentation souhaité pour le SSD. Par exemple, la commande suivante définit le mode d'alimentation sur PS0 sur le SSD Soldigim D5-P5336. Si vous utilisez les modes d'alimentation 1 ou 2, modifiez le chiffre—-value= pour qu'il corresponde au mode d'alimentation correct.

Impact des états de puissance sur les performances

Pour mesurer l'impact sur la consommation d'énergie et les performances des états d'alimentation sur le SSD Solidigm D5-P5336 de 61.44 To, nous avons équipé un Dell PowerEdge R760 de 24 SSD. En exécutant Ubuntu et le générateur de charge de travail FIO, nous avons pu facilement exécuter une charge de travail cohérente sur tous les SSD et mettre à jour le mode d'alimentation à la volée.

Carte mère Dell PowerEdge Solidigm P5336

Nous avons utilisé la surveillance de l’alimentation embarquée de Dell à l’intérieur du système de gestion embarqué iDRAC9 du serveur pour surveiller l’alimentation au niveau du système.

Alimentation Dell PowerEdge iDRAC

Nous nous sommes concentrés sur les charges de travail de bande passante de lecture et d'écriture séquentielles, en utilisant une taille de bloc de 128 Ko sur chaque lecteur, puis nous avons mesuré les performances globales sur les 24 SSD. Il convient de noter que cette configuration particulière du Dell PowerEdge R760 avec 24 baies NVMe exploite un commutateur PCIe par rapport aux baies NVMe à connexion directe. Ainsi, la bande passante totale mesurée sature les voies de commutation PCIe disponibles avant d'atteindre les lecteurs. Cela a un impact sur les performances de lecture totales que nous avons mesurées par rapport à la fiche technique du Soldigim P5536, mais les vitesses d'écriture globales étaient toutes inférieures à cette limite.

Puissance totale Vitesse d'écriture Lire Go/s Watts
Au dessus de la base
Watts/entraînement
(avec surcharge du système)
Pas de lecteur au ralenti 462 - - - -
Disques de ralenti installés 594 - - 132 5.5
Lecture séquentielle 24x PS0 858 - 109GB / s 396 16.5
Lecture séquentielle 24x PS1 858 - 105GB / s 396 16.5
Lecture séquentielle 24x PS2 759 - 79.8GB / s 297 12.375
Écriture séquentielle 24x PS0 1089 82.5GB / s - 627 26.125
Écriture séquentielle 24x PS1 825 34.4GB / s - 363 15.125
Écriture séquentielle 24x PS2 726 17.3GB / s - 264 11

En revenant sur notre article sur les avantages de la conversion d’une plateforme refroidie par air en refroidissement liquide direct, nous avons constaté une légère augmentation des performances des processeurs, mais nous avons également économisé 200 W d’énergie. L’énergie est une denrée précieuse dans la nouvelle vague de serveurs centrés sur l’IA qui consacrent souvent toutes les ressources disponibles aux GPU et aux processeurs haut de gamme. Dans un centre de données dont le budget énergétique est limité ou proche de la limite du refroidissement par air, le passage au DLC permet d’acheter un budget énergétique qui permet au serveur d’être rempli de plus de SSD pour la même empreinte énergétique qu’un serveur refroidi par air.

système de refroidissement liquide solidigm coolit CDU

Une économie d’énergie de 200 W peut s’avérer très utile en termes de densité de stockage. Cette économie vous permet de doubler l’empreinte de stockage de 12 à 24 SSD dans un serveur refroidi par liquide par rapport à un serveur refroidi par air si vous avez des charges de travail orientées vers des charges de travail à lecture intensive. Avec le Solidigm D5-P5336, ce serveur à 24 baies a augmenté sa capacité de stockage de 737 To à 1,474 24 To grâce à la boucle liquide. Si la charge de travail est lourde en écriture, vous pourrez équiper le serveur d’environ huit SSD supplémentaires. Cependant, ces chiffres concernent les modes d’alimentation de base, donc si vous êtes prêt à réduire les performances d’écriture du haut de gamme, vous pouvez facilement équiper votre serveur de XNUMX SSD avec une charge de travail lourde en écriture avec des performances réduites.

Conclusion

Grâce à nos tests des SSD Solidigm D5-P5336, nous avons pu constater que la gestion des états d'alimentation NVMe peut avoir un impact significatif sur l'efficacité énergétique sans affecter considérablement les performances. Les opérateurs de centres de données qui cherchent à maximiser l'efficacité énergétique peuvent exploiter ces états d'alimentation pour atteindre une plus grande densité de stockage ou réduire les coûts opérationnels, en particulier dans les environnements centrés sur l'IA où l'énergie est primordiale. Les SSD haute densité de Solidigm sont bien placés pour cela, offrant une excellente efficacité téraoctet par watt, en particulier avec les technologies modernes de refroidissement liquide.

Nos résultats révèlent que même de légers ajustements des états d'alimentation peuvent générer des économies d'énergie significatives, ce qui peut s'avérer crucial dans les environnements limités par la disponibilité de l'énergie. L'optimisation de la consommation électrique globale des serveurs améliore la densité de stockage et favorise des opérations de centre de données plus durables.

Dell PowerEdge Solidigm P5336 simple

La gestion de l'alimentation devient de plus en plus critique à mesure que les serveurs modernes sont poussés à leurs limites, en particulier dans les charges de travail pilotées par l'IA. L'association du refroidissement liquide et des options de gestion efficaces des SSD offre une voie à suivre pour les centres de données qui cherchent à faire évoluer les performances et la densité de stockage sans dépasser les budgets énergétiques.

Vous pourrez voir la démonstration complète de ces technologies en direct à l'OCP 2024. Nous montrerons comment le refroidissement liquide et les SSD de Solidigm peuvent être les pierres angulaires de l'efficacité énergétique dans le centre de données moderne.

Solutions de stockage Solidigm

Ce rapport est sponsorisé par Solidigm. Tous les points de vue et opinions exprimés dans ce rapport sont basés sur notre vision impartiale du ou des produits à l'étude.

S'engager avec StorageReview

Newsletter |  YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | Flux RSS