Accueil Entreprise Examen du SSD Intel Optane DC P4800X

Examen du SSD Intel Optane DC P4800X

by Brian Beeler

La série Optane SSD DC P4800X d'Intel était lancé en mars 2017 avec la promesse de mettre sur le marché un nouveau support de mémoire de classe de stockage (SCM) appelé 3D XPoint (Intel sous la marque Optane). Le P4800X a été lancé à la fois comme un lecteur NVMe 2.5″ traditionnel (U.2) et comme une carte d'extension PCIe. Les capacités initiales ont commencé à 375 Go avec des plans pour atteindre 1.5 To d'ici la fin de 2017. Cet objectif de capacité ne s'est pas concrétisé, mais Intel a lancé Modèles Optane 750 Go en novembre. Indépendamment de la capacité, le P4800X a une tâche : fournir le stockage le plus rapide possible aux applications sensibles à la latence dans le centre de données.


La série Optane SSD DC P4800X d'Intel était lancé en mars 2017 avec la promesse de mettre sur le marché un nouveau support de mémoire de classe de stockage (SCM) appelé 3D XPoint (Intel sous la marque Optane). Le P4800X a été lancé à la fois comme un lecteur NVMe 2.5″ traditionnel (U.2) et comme une carte d'extension PCIe. Les capacités initiales ont commencé à 375 Go avec des plans pour atteindre 1.5 To d'ici la fin de 2017. Cet objectif de capacité ne s'est pas concrétisé, mais Intel a lancé Modèles Optane 750 Go en novembre. Indépendamment de la capacité, le P4800X a une tâche : fournir le stockage le plus rapide possible aux applications sensibles à la latence dans le centre de données.

Compte tenu de la plus petite capacité des disques, il est moins probable que l'entreprise remplisse les JBOD avec des SSD P4800X à utiliser pour le stockage principal. Bien que cela soit certainement possible en tant que solution ponctuelle pour les applications qui peuvent bénéficier d'un stockage plus rapide, comme les petits ensembles de données d'analyse et les cas d'utilisation de la BI. Les fournisseurs de baies d'entreprise ne se sont pas non plus précipités pour adopter Optane en quantité dans leurs conceptions de systèmes, encore une fois en grande partie à cause des limitations de capacité. HPE a cependant exploré l'utilisation d'Optane comme cache pour les systèmes 3PAR et d'autres cherchent certainement à intégrer cette classe de stockage dans leurs systèmes à mesure que la technologie mûrit. Il existe cependant un ensemble immédiat d'excellents cas d'utilisation pour les SSD basés sur Optane dans le monde du stockage défini par logiciel où les conceptions ont plus de flexibilité pour tenir compte de cette nouvelle classe de stockage.

VMware vSAN est peut-être le plus visible dans cet espace car ils offraient prise en charge du jour 0 pour le P4800X et avoir une avance dominante dans l'espace HCI. vSAN est également particulièrement bien placé pour tirer parti de ces disques plus petits, car ils fonctionnent dans une architecture à deux niveaux. Le stockage vSAN est coordonné en groupes de disques, avec un niveau pour toutes les activités d'écriture entrantes ainsi qu'un niveau de lecture orienté capacité. Actuellement, vSAN n'exploite que jusqu'à 600 Go par lecteur dans le niveau d'écriture, de sorte que les capacités plus petites du P4800X ne sont pas vraiment une limitation. Pour les utilisateurs de vSAN, cela signifie que pour les déploiements avec le P4800X agissant comme lecteur de cache, les écritures se font à la vitesse la plus rapide possible sur les clusters vSAN.

Cette revue concerne le P4800X au format U.375 de 2 Go. Tout en travaillant en grande partie au sein d'un groupe de disques pour notre prochaine révision de vSAN, nous avons pu exécuter un sous-ensemble de nos tests SSD d'entreprise normaux pour donner une image plus complète du profil de performances du P4800X.

Spécifications du SSD Intel Optane DC P4800X

Facteur de forme AIC HHHL, U.2
Capacités 375GB, 750GB
Interface PCIe 3 × 4, NVMe
Latence <10 μs
QoS
4 Ko aléatoire, profondeur de file d'attente 1, lecture/écriture <60/100μs
4 Ko aléatoire, profondeur de file d'attente 16, R/W <150/200μs
Cadence de production
4 Ko aléatoire, profondeur de file d'attente 16, R/W jusqu'à 550/500K IOPS
4 Ko aléatoire, profondeur de file d'attente 16, mixte 70/30 R/W jusqu'à 500 XNUMX IOPS
Endurance
DWPD  30
Pétaoctets écrits
375GB 20.5 PBW
750GB 41 PBW

Performance

Banc d'essai

Nos critiques de SSD d'entreprise s'appuient sur un Lenovo ThinkSystem SR850 pour les tests d'application et un Dell PowerEdge R740xd pour les benchmarks synthétiques. Le ThinkSystem SR850 est une plate-forme à quatre processeurs bien équipée, offrant une puissance de processeur bien supérieure à ce qui est nécessaire pour mettre l'accent sur le stockage local hautes performances. Les tests synthétiques qui ne nécessitent pas beaucoup de ressources CPU utilisent le serveur biprocesseur plus traditionnel. Dans les deux cas, l'intention est de présenter le stockage local sous le meilleur jour possible, conformément aux spécifications maximales des lecteurs du fournisseur de stockage.

Lenovo Think System SR850

  • 4 processeurs Intel Platinum 8160 (2.1 GHz x 24 cœurs)
  • 16 x 32 Go DDR4-2666 Mhz ECC DRAM
  • 2 cartes RAID RAID 930-8i 12 Go/s
  • 8 baies NVMe
  • VMwareESXI 6.5

Dell PowerEdge R740xd

  • 2 processeurs Intel Gold 6130 (2.1 GHz x 16 cœurs)
  • 16 x 16 Go DDR4-2666 MHz ECC DRAM
  • 1x carte RAID PERC 730 2 Go 12 Go/s
  • Adaptateur NVMe complémentaire
  • Ubuntu-16.04.3-bureau-amd64

Contexte des tests et comparables

La Laboratoire de test d'entreprise StorageReview fournit une architecture flexible pour effectuer des tests de performances des périphériques de stockage d'entreprise dans un environnement comparable à ce que les administrateurs rencontrent dans les déploiements réels. Le laboratoire de test d'entreprise intègre une variété de serveurs, de réseaux, de conditionnement d'alimentation et d'autres infrastructures de réseau qui permettent à notre personnel d'établir des conditions réelles pour évaluer avec précision les performances lors de nos examens.

Nous intégrons ces détails sur l'environnement de laboratoire et les protocoles dans les revues afin que les professionnels de l'informatique et les responsables de l'acquisition du stockage puissent comprendre les conditions dans lesquelles nous avons obtenu les résultats suivants. Aucun de nos examens n'est payé ou supervisé par le fabricant de l'équipement que nous testons. Des détails supplémentaires sur le Laboratoire de test d'entreprise StorageReview et  un aperçu de ses capacités de mise en réseau sont disponibles sur ces pages respectives.

Comparables pour cet avis :

Houdini par SideFX

Le test Houdini est spécifiquement conçu pour évaluer les performances de stockage en ce qui concerne le rendu CGI. Le banc d'essai pour cette application est une variante du noyau Dell PowerEdge R740xd type de serveur que nous utilisons en laboratoire avec deux processeurs Intel 6130 et 64 Go de DRAM. Dans ce cas, nous avons installé Ubuntu Desktop (ubuntu-16.04.3-desktop-amd64) fonctionnant en métal nu. La sortie de l'indice de référence est mesurée en secondes pour terminer, moins étant mieux.

La démo Maelstrom représente une section du pipeline de rendu qui met en évidence les capacités de performance du stockage en démontrant sa capacité à utiliser efficacement le fichier d'échange comme une forme de mémoire étendue. Le test n'écrit pas les données de résultat ou ne traite pas les points afin d'isoler l'effet de temps d'arrêt de l'impact de la latence sur le composant de stockage sous-jacent. Le test lui-même est composé de cinq phases, dont trois que nous exécutons dans le cadre du benchmark, qui sont les suivantes :

  1. Charge les points compactés à partir du disque. C'est le moment de lire à partir du disque. Il s'agit d'un thread unique, ce qui peut limiter le débit global.
  2. Déballe les points dans un seul tableau plat afin de permettre leur traitement. Si les points ne dépendent pas d'autres points, l'ensemble de travail peut être ajusté pour rester dans le noyau. Cette étape est multithread.
  3. (Non exécuté) Traite les points.
  4. Les remballe dans des blocs de compartiments adaptés au stockage sur disque. Cette étape est multithread.
  5. (Non exécuté) Réécrit les blocs compartimentés sur le disque.

Le SSD Intel Optane DC P4800X a pris la première place du test Houdini avec 1,520.4 4800 secondes. Le PXNUMXX avait les meilleures performances de tous les disques Optane, ainsi que les meilleures dans l'ensemble.

Analyse de la charge de travail VDBench

Lorsqu'il s'agit de comparer les périphériques de stockage, les tests d'application sont les meilleurs et les tests synthétiques viennent en deuxième position. Bien qu'ils ne soient pas une représentation parfaite des charges de travail réelles, les tests synthétiques aident à référencer les périphériques de stockage avec un facteur de répétabilité qui facilite la comparaison « des pommes avec des pommes » entre les solutions concurrentes. Ces charges de travail offrent une gamme de profils de test différents, allant des tests « aux quatre coins », des tests de taille de transfert de base de données communs, aux captures de trace à partir de différents environnements VDI. Tous ces tests exploitent le générateur de charge de travail vdBench commun, avec un moteur de script pour automatiser et capturer les résultats sur un grand cluster de test de calcul. Cela nous permet de répéter les mêmes charges de travail sur une large gamme de périphériques de stockage, y compris les baies flash et les périphériques de stockage individuels. Notre processus de test pour ces benchmarks remplit toute la surface du disque avec des données, puis partitionne une section de disque égale à 25 % de la capacité du disque pour simuler la façon dont le disque pourrait répondre aux charges de travail des applications. Ceci est différent des tests d'entropie complète qui utilisent 100% du lecteur et les amènent dans un état stable. Par conséquent, ces chiffres refléteront des vitesses d'écriture plus soutenues.

Profils:

  • Lecture aléatoire 4K : 100 % de lecture, 128 threads, 0-120 % d'iorate
  • Écriture aléatoire 4K : 100 % d'écriture, 64 threads, 0-120 % de vitesse
  • Lecture séquentielle 64K : 100 % de lecture, 16 threads, 0-120 % d'iorate
  • Écriture séquentielle 64K : 100 % d'écriture, 8 threads, 0-120 % d'iorate
  • Base de données synthétique : SQL et Oracle
  • Traces de clone complet et de clone lié VDI

Pour des performances aléatoires de pointe 4K, le SSD Intel Optane DC P4800X (appelé P4800X à partir d'ici) a commencé avec une latence beaucoup plus faible que les autres disques avant de monter juste après 500K IOPS et de terminer en dernier avec 585,754 213 IOPS avec une latence de XNUMX μs .

Avec des performances d'écriture maximales de 4K, le P4800X a obtenu de meilleurs résultats, terminant deuxième avec des performances maximales d'environ 554K IOPS et une latence de seulement 155 μs.

En passant aux charges de travail séquentielles, dans notre lecture 64K, nous avons constaté un schéma similaire à la lecture 4K. Le P4800X a commencé avec une latence beaucoup plus faible que les autres disques avant de grimper à environ 35 40,558 IOPS et de culminer à 2.53 394 IOPS ou XNUMX Go/s avec une latence de XNUMX μs. Cela a placé le lecteur au quatrième rang.

Pour l'écriture 64K, le P4800X est arrivé en deuxième position avec une performance maximale d'environ 34,700 2.17 IOPS ou 380 Go/s à une latence de XNUMX μs avant de chuter légèrement.

Avec notre charge de travail SQL, nous voyons le P4800X bondir vers l'avant par une large marge avec un score maximal de 286,548 111 IOPS avec une latence de seulement XNUMX μs.

Dans notre SQL90-10, le P4800X a poursuivi son règne avec un meilleur score de 276,530 114 IOPS avec une latence de XNUMX μs.

Restant en première place dans le SQL 80-20, le P4800X a culminé à environ 266 111 IOPS avec une latence d'environ XNUMX μs avant une petite baisse.

Passant à nos charges de travail Oracle, le P4800X a pris la deuxième place avec un score maximal de près de 248 127 IOPS et une latence de XNUMX μs.

Dans l'Oracle 90-10, le P4800X a époustouflé les autres disques avec une performance maximale de 276,703 79 IOPS avec une latence de seulement XNUMX μs.

Toujours dans l'Oracle 80-20, nous avons vu le P4800X se démarquer avec 265,769 82 IOPS et une latence de seulement XNUMX μs.

Ensuite, nous sommes passés à notre test de clone VDI, Full Clone (FC) et Linked Clone (LC). Pour VDI FC Boot, le P4800X a commencé extrêmement fort avant de sauter et de prendre la troisième place avec une performance maximale de 167,856 199 IOPS et une latence de XNUMX μs.

Avec VDI ​​FC Initial Login, le P4800X a de nouveau pris la troisième place avec 108,159 274 IOPS et une latence de XNUMX μs.

Pour VDI FC Monday Login, le P4800X est passé à la deuxième place avec une performance maximale de 97,198 163 IOPS et une latence de XNUMX μs.

Passant au démarrage VDI LC, le P4800X a pu prendre la première place avec un score de 93,095 171 IOPS et une latence de XNUMX μs.

VDI LC Initial Login a obtenu une autre première place pour le P4800X avec un score de 66,463 118 IOPS et une latence de XNUMX μs.

Enfin, notre test VDI LC Monday Login a placé le P4800X en deuxième position avec 67,085 235 IOPS avec une latence de XNUMX μs.

Pour aller plus loin

Le SSD Intel Optane DC P4800X est un autre disque lancé avec la technologie 3D XPoint d'Intel. Comme son nom l'indique, le disque est conçu spécifiquement pour le centre de données et se présente sous les formats courants U.2 et AIC HHHL. L'un des inconvénients qui apparaît immédiatement est que le lecteur n'est proposé qu'en capacités de 375 Go et 750 Go. Cela limite ses cas d'utilisation d'une part, mais d'autre part, ses cas d'utilisation sont principalement orientés vers des charges de travail et des applications où une faible latence est primordiale par rapport à la capacité. À cet égard, la technologie Optane a fait ses preuves dans les charges de travail des entreprises et des utilisateurs finaux pour être le leader du secteur.

La petite capacité du P4800X est la raison pour laquelle nous avons un petit trou dans notre barrage normal de références. La capacité du disque n'était pas assez grande pour exécuter SQL ou Sysbench, ils sont donc absents de cet examen d'un seul disque. Sur la première charge de travail d'analyse d'application que nous avons pu exécuter, Houdini de SideFX, le P4800X était le plus performant avec 1,520.4 4800 secondes. Dans notre VDBench, le P4800X dominait à tous les niveaux à de faibles profondeurs de file d'attente. Les performances haut de gamme étaient plus mitigées avec le P90X où certains produits NVMe traditionnels le dépassaient en termes de performances. Cependant, il en a balayé d'autres dans des domaines tels que SQL et Oracle 10-80 et 20-4800. Les points forts du P4X incluent plus d'un demi-million d'IOPS dans les deux tests 2.53K, 64 Go/s en lecture 2.17K et 64 Go/s en écriture 4800K. Dans les trois tests SQL, le P250X était supérieur à un quart de million d'IOPS et égal ou supérieur à 4800 4800 IOPS dans nos tests Oracle. Mais à part les performances de pointe, l'Intel Optane P79X avait des latences extrêmement faibles. Dans chaque test, la latence a commencé très faible, généralement beaucoup plus faible que tous les autres disques. Et dans quelques cas, le P90X avait des performances de pointe avec une latence aussi faible que 10 μs dans Oracle 82-80 et 20 μs dans Oracle XNUMX-XNUMX.

Pour les charges de travail à faible latence, il n'y a actuellement rien qui se rapproche du SSD Intel Optane DC P4800X. Bien qu'il existe des domaines où les produits NVMe traditionnels peuvent le surpasser en termes de bande passante globale et d'IOPS, de manière générale, le P4800X ne conviendrait pas à ces cas d'utilisation en fonction de ses mesures prix/capacité. C'est excitant, cependant, de penser aux possibilités de la technologie Intel Optane une fois que les disques de l'entreprise atteignent les points de capacité les plus élevés ; en particulier quelque chose dans la classe 2 To qui est toujours un favori pour les fournisseurs de baies, bien que les SSD SAS de 30 To soient couramment disponibles. Dans notre cas d'utilisation spécifique autour de vSAN, le P4800X offre les performances les plus rapides possibles pour la couche de cache en écriture. Pour tous ceux qui souhaitent tirer le meilleur parti de vSAN, le P4800X est la norme de facto.

Page produit Intel P4800X

Discutez de cet avis

Inscrivez-vous à la newsletter StorageReview