Accueil Entreprise Examen de l'accélérateur d'application Fusion-io ioDrive2 Duo SLC (1.2 To)

Examen de l'accélérateur d'application Fusion-io ioDrive2 Duo SLC (1.2 To)

by Kevin O'Brien

Le Fusion-io ioDrive2 Duo est un accélérateur d'applications pleine hauteur et demi-longueur qui, lorsqu'il est associé à SLC NAND, offre 1.2 To de stockage à faible latence et haute endurance pour les applications les plus exigeantes d'aujourd'hui. Bien que la marque soit un produit de deuxième génération, la dénomination est quelque peu trompeuse car Fusion-io est depuis longtemps un pionnier dans la gamme de mémoire en tant que stockage avec ses produits ioMemory assortis. Cette expérience se manifeste non seulement dans le développement de produits et les points forts des fiches techniques, mais également jusqu'à la gestion ; Fusion-io propose la suite logicielle de gestion de disque la plus robuste du marché avec ioSphere. Pourtant, un joli logiciel et une conception de disque éprouvée ne sont qu'une partie de l'équation. Les entreprises déploient ces produits avec un seul objectif en tête ; réduire les temps de réponse des applications en s'attaquant à la latence du système de stockage. L'itération SLC de l'ioDrive2 met l'accent sur ce problème, offrant une latence d'accès en lecture de 47 µs et une latence d'accès en écriture de 15 µs. Cela se compare à la latence d'accès en lecture de 68 µs dans l'ioDrive2 basé sur MLC (ils ont la même latence d'écriture) et bien qu'environ 20 µs ne semblent pas beaucoup, cela peut être une éternité virtuelle pour les applications qui ont été réglées pour une utilisation avec le stockage flash .


Le Fusion-io ioDrive2 Duo est un accélérateur d'applications pleine hauteur et demi-longueur qui, lorsqu'il est associé à SLC NAND, offre 1.2 To de stockage à faible latence et haute endurance pour les applications les plus exigeantes d'aujourd'hui. Bien que la marque soit un produit de deuxième génération, la dénomination est quelque peu trompeuse car Fusion-io est depuis longtemps un pionnier dans la gamme de mémoire en tant que stockage avec ses produits ioMemory assortis. Cette expérience se manifeste non seulement dans le développement de produits et les points forts des fiches techniques, mais également jusqu'à la gestion ; Fusion-io propose la suite logicielle de gestion de disque la plus robuste du marché avec ioSphere. Pourtant, un joli logiciel et une conception de disque éprouvée ne sont qu'une partie de l'équation. Les entreprises déploient ces produits avec un seul objectif en tête ; réduire les temps de réponse des applications en s'attaquant à la latence du système de stockage. L'itération SLC de l'ioDrive2 met l'accent sur ce problème, offrant une latence d'accès en lecture de 47 µs et une latence d'accès en écriture de 15 µs. Cela se compare à la latence d'accès en lecture de 68 µs dans l'ioDrive2 basé sur MLC (ils ont la même latence d'écriture) et bien qu'environ 20 µs ne semblent pas beaucoup, cela peut être une éternité virtuelle pour les applications qui ont été réglées pour une utilisation avec le stockage flash .

Au-delà des gains de la fiche technique en termes de latence et de performances de débit, Fusion-io a travaillé dur pour apporter plusieurs autres améliorations matérielles à la plate-forme de cette dernière génération. Les appareils ioDrive de la génération précédente avaient une fonctionnalité appelée FlashBack, qui permettait au lecteur de continuer à fonctionner en cas de panne NAND, et les accélérateurs d'applications ioDrive2 se sont appuyés sur cet attribut avec la nouvelle version baptisée Adaptive FlashBack. Adaptive FlashBack augmente les tolérances de défaillance des puces NAND en gardant le disque en ligne et les données sécurisées dans le cas peu probable de plusieurs défaillances NAND. Dans un tel cas, l'ioDrive2 peut remapper et récupérer sans se déconnecter. 

Fusion-io a également déployé un nouveau contrôleur NAND et une nouvelle version du micrologiciel pour la famille ioDrive2. Les avantages ici sont en grande partie liés aux performances, à un meilleur débit et à une latence améliorée, mais il existe également un avantage de compatibilité NAND. Fusion-io a également mis à jour son logiciel VSL vers 3.2.x qui, en combinaison avec le nouveau contrôleur NAND, donne à l'ioDrive2 des performances améliorées avec des tailles de bloc plus petites. Sur le sujet NAND, Fusion-io a apporté un changement d'architecture matérielle qui place la NAND dans ses propres modules, séparés du contrôleur NAND, ce qui simplifie la conception. L'avantage net est que Fusion-io peut prendre en charge plus rapidement un nouveau boîtier NAND ou NAND, en exploitant la même disposition de PCB. 

Bien que nous approfondissions la présentation du matériel dans la section de conception ci-dessous, il est instructif de fournir ici un bref aperçu de l'architecture Fusion-io. Comme le Virident FlashMAX II nous avons examiné précédemment, la conception ioDrive2 exploite un FPGA qui décharge la plupart des tâches de gestion NAND sur le processeur hôte. Alors que d'autres conceptions comme P320h de Micron tirer parti d'un contrôleur embarqué pour la plupart de ces tâches, Fusion-io préfère tirer parti du processeur puissant et souvent sous-utilisé du système hôte. Cette conception a également tendance à donner un chemin plus direct vers le stockage, réduisant ainsi la latence de stockage. La conception du Duo exploite des contrôleurs jumeaux, comme le FlashMAX II, mais diverge en ce sens qu'il utilise six cartes filles qui n'incluent que la NAND, plutôt que de combiner la NAND et les contrôleurs sur des PCB individuels. Contrairement à la solution Virident, Fusion-io avec VSL 3.2.2 présente quatre disques de 300 Go au système, au lieu du volume que Virident présente. Les utilisateurs peuvent choisir d'adresser chaque volume seul, mais pour obtenir un seul volume, ils doivent être mis en RAID logiciel. Il convient également de noter que les cartes Fusion-io Duo sont pleine hauteur et demi-longueur, ce qui les rend plus grandes que les cartes demi-hauteur et demi-longueur généralement universelles proposées par Virident, Micron et d'autres. Cela dit, la plupart des serveurs de niveau 1 1U et 2U sur le marché acceptent facilement les cartes FHHL, ce qui rend la forme de la carte pertinente uniquement dans les cas marginaux. 

Fusion-io livre le ioDrive2 Duo dans les configurations MLC et SLC. Le MLC est livré dans une capacité de 2.4 To, le SLC 1.2 To. Les disques bénéficient d'une garantie de cinq ans.

Spécifications du Fusion ioDrive2 Duo

  • ioDrive2 Duo Capacité 1.2 To SLC
    • Bande passante en lecture (1 Mo) 3.0 Go/s
    • Bande passante en écriture (1 Mo) 2.5 Go/s
    • Couru. Lire IOPS (512B) 700,000 XNUMX
    • Couru. IOPS en écriture (512B) 1,100,000 XNUMX XNUMX
    • Couru. Lire IOPS (4K) 580,000 XNUMX
    • Couru. IOPS en écriture (4K) 535,000 XNUMX
    • Latence d'accès en lecture 47µs
    • Latence d'accès en écriture 15µs
  • Cellule à un niveau de mémoire flash NAND 2xnm (SLC)
  • Bus Interface PCI-Express 2.0 x8 électrique x8 physique
  • Poids : Moins de 11 onces
  • Facteur de forme : pleine hauteur, demi-longueur (FHHL)
  • Garantie : 5 ans ou endurance maximale utilisée
  • Endurance : 190 PBW (95 PBW par contrôleur)
  • Systèmes d'exploitation pris en charge
    • Microsoft Windows Microsoft Windows : Windows Server 64 2012 bits, Windows Server 2008 R2, Windows Server 2008, Windows Server 2003
    • Linux RHEL 5/6 ; SLES 10/11 ; OEL 5/6 ; CentOS 5/6 ; Debian Squeeze ; Fedora 16/17 ; openSUSE 12 ; Ubuntu 10/11/12
    • UNIX Solaris 10/11 x64 ; OpenSolaris 2009.06 x64 ; OSX 10.6/10.7/10.8
    • Hyperviseurs VMware ESX 4.0/4.1/ESXi 4.1/5.0/5.1, Windows 2008 R2 avec Hyper-V, Hyper-V Server 2008 R2

Concevoir et construire

Le Fusion ioDrive2 Duo 1.2 To SLC est une carte PCI-Express 8 pleine hauteur et demi-longueur (FHHL) x2.0, avec deux contrôleurs et un commutateur PCIe attaché à la carte de circuit imprimé principale. La NAND est connectée via deux cartes filles, ce qui donne à Fusion un avantage de fabrication lors du passage à de nouvelles configurations NAND. Au lieu de reconcevoir la carte à chaque changement de lithographie (NAND mourir rétrécir), ils peuvent installer une nouvelle carte fille et flasher un nouveau firmware sur le FPGA. Notre SLC ioDrive2 Duo est formé de deux périphériques ioMemory de 600 Go, chacun utilisant 4 voies de la connexion PCIe. La disposition du PCB est très efficace, avec de grands dissipateurs thermiques passifs couvrant les deux contrôleurs sur le côté droit de la carte.

Chaque contrôleur représente un ioDrive2, avec son propre FPGA Xilinx Virtex-40 6 nm et un pool de 768 Go de SLC NAND. Le ioDrive2 Duo que nous avons examiné utilise Micron NAND, mais Fusion-io est indépendant du fabricant de NAND. La NAND est répartie entre 24 puces de 32 Go par appareil, avec 600 Go utilisables sous formatage de stock. Ce ratio place les niveaux de sur-approvisionnement des stocks à 22 %, à peu près au même niveau que la plupart des périphériques flash d'entreprise.

Fusion ioMemory s'interface avec la mémoire flash NAND comme un processeur interagirait avec la mémoire système ; il utilise une combinaison du contrôleur NAND (FPGA) de Fusion-io, qui communique directement via PCIe, et du pilote de Fusion-io ou du logiciel Virtual Storage Layer (VSL) installé sur le système hôte pour traduire le périphérique en un périphérique bloc traditionnel. Grâce à VSL de Fusion-io, le logiciel émule un périphérique bloc pour la compatibilité, bien que Fusion propose également un SDK pour permettre aux éditeurs de logiciels de communiquer nativement avec NAND, en contournant la surcharge d'émulation. ioMemory est également non traditionnel dans le sens où il consomme des ressources système pour que les pilotes VSL fonctionnent, tirant parti du processeur hôte tout en créant une empreinte dans la mémoire système. En termes de support produit, étant donné que Fusion-io utilise un FPGA comme contrôleur NAND par rapport à un ASIC, ils peuvent déployer des mises à jour logicielles de très bas niveau qui peuvent corriger des bogues et améliorer les performances. Cela contraste avec les contrôleurs SSD standard, où des modifications fondamentales ne peuvent être apportées qu'en fabriquant un nouveau contrôleur - bien que les deux conceptions permettent un réglage de plus haut niveau via des mises à jour du micrologiciel. 

Une amélioration apportée avec la sortie de VSL 3.2.2 pour les appareils ioDrive2 est une nouvelle fonctionnalité de contrôleur. Auparavant, chaque périphérique ioMemory apparaissait comme un périphérique unique pour le système hôte. Dans les versions les plus récentes du VSL de Fusion, le contrôleur est divisé en deux appareils et fonctionne en mode "double tuyau". Ainsi, au lieu d'un LUN pour un ioDrive2 et de deux LUN pour un ioDrive2 Duo, il s'agit respectivement de deux ou quatre LUN. Lors de nos tests sur l'ancienne et la nouvelle mise en page, nous avons noté une forte amélioration des performances des petites E/S, bien que tous nos tests formels aient eu lieu avec VSL 3.2.2 uniquement.

L'alimentation est un autre sujet qui revient fréquemment lorsque les périphériques Fusion ioMemory sont comparés au paysage PCIe, car ils se distinguent comme l'un des rares à disposer de connexions d'alimentation externes pour certaines applications. Cela s'applique aux produits de la famille Duo, qui sont deux périphériques ioMemory sur une seule carte PCIe. Dans ces cas, pour fonctionner à pleine puissance, ils consomment plus de 25 watts, ce qui correspond à la puissance nominale x8 PCIe minimale. Fusion-io a deux façons de répondre à cette exigence d'alimentation : des câbles d'alimentation externes ou des remplacements d'alimentation qui permettent à la carte de consommer plus de 25 W via un emplacement PCIe x8. Dans notre test qui évaluait le ioDrive2 Duo SLC dans un Lenovo Think Server RD630, nous avons effectué tous les benchmarks avec le power-override activé, nous donnant des performances complètes sans alimentation externe nécessaire. Dans le guide d'installation du matériel, Fusion-io indique que si le serveur hôte est conçu pour une consommation électrique de 55 W, le remplacement du logiciel peut être activé en toute sécurité.

Logiciel de gestion

Fusion-io a continuellement placé la barre que les autres fabricants tentent d'atteindre avec leur suite de gestion de centre de données ioSphere ioMemory. Comme nous l'avons vu en travaillant intensivement avec des accélérateurs d'applications concurrents, même une interface graphique de base dans Windows est difficile à trouver, de nombreux fabricants offrant une prise en charge CLI limitée. Cela joue un rôle important dans la gestion à long terme d'un périphérique flash donné. puisque la garantie et la durée de vie attendue reviennent à ce qu'est le profil d'utilisation dans un environnement donné. 

ioSphere de Fusion traite de nombreux domaines clés pour un administrateur informatique via une interface Web, notamment : les performances en temps réel et historiques, la surveillance de l'état de santé et les prévisions de garantie. ioSphere prend en charge à la fois la surveillance des périphériques ioMemory installés localement ainsi que des périphériques ioMemory installés sur un grand réseau, et il peut également être configuré avec un accès à distance pour permettre aux administrateurs de surveiller les données en dehors du centre de données. Cet ensemble complet de fonctionnalités est inégalé.

Sans exception, l'une des fonctionnalités les plus intéressantes est la diffusion en temps réel des performances. ioSphere permet aux utilisateurs de se connecter à un périphérique ioMemory spécifique et de surveiller l'activité frappant le périphérique au fur et à mesure qu'elle se produit. Nous avons largement utilisé cette fonctionnalité lors des tests, comme indiqué ci-dessus dans le flux capturé lors d'un examen interne de notre Référence de base de données MarkLogic NoSQL. Comme ioSphere enregistre en permanence les données de tous les périphériques ioMemory connectés, il peut également créer des rapports indiquant les informations sur les performances passées afin que vous puissiez mieux estimer la durée de vie d'un périphérique ioMemory particulier dans un environnement de production donné.

Pour les utilisateurs intéressés par des informations avancées, ioSphere suivra également la consommation d'énergie, la température de la carte, le total des données lues et écrites, et une multitude d'autres détails utiles lors du débogage. Ces données sont accessibles à la fois via ioSphere et la CLI Fusion-io qui est installée par défaut avec les pilotes de périphérique. Un autre domaine dans lequel ces fonctionnalités avancées entrent en jeu est le sur-provisionnement ou le sous-provisionnement du disque, qui échange la capacité contre les performances. Lors de notre évaluation, nous avons testé le ioDrive2 Duo SLC en mode stock et en mode haute performance. Le mode hautes performances comporte 20 % de surprovisionnement supplémentaire, bien que pour les utilisateurs avancés, Fusion-io offre la possibilité de sélectionner le niveau exact de surprovisionnement ou de sous-provisionnement. En cas de sous-provisionnement, les utilisateurs peuvent augmenter la capacité de l'ioDrive2 au-dessus de la capacité annoncée (au détriment des performances et de l'endurance). 

Contexte des tests et comparables 

Tous les accélérateurs d'application comparés dans cette revue sont testés sur notre plate-forme de test d'entreprise de deuxième génération composée d'un processeur Intel Romley Lenovo Think Server RD630. Cette nouvelle plate-forme est configurée à la fois avec Windows Server 2008 R2 SP1 et Linux CentOS 6.3 pour nous permettre de tester efficacement les performances de différents AA dans les différents environnements pris en charge par leurs pilotes. Chaque système d'exploitation est optimisé pour des performances optimales, notamment en ayant le profil d'alimentation Windows défini sur hautes performances ainsi que cpuspeed désactivé dans CentOS 6.3 pour verrouiller le processeur à sa vitesse d'horloge la plus élevée. Pour les benchmarks synthétiques, nous utilisons la version 2.0.10 de FIO pour Linux et la version 2.0.12.2 pour Windows, avec les mêmes paramètres de test utilisés dans chaque système d'exploitation lorsque cela est autorisé.

StockageExaminer la configuration du Lenovo ThinkServer RD630 :

  • 2 x Intel Xeon E5-2620 (2.0 GHz, 15 Mo de cache, 6 cœurs)
  • Jeu de puces Intel C602
  • Mémoire – 16 Go (2 x 8 Go) 1333 Mhz DDR3 enregistrés RDIMM
  • Windows Server 2008 R2 SP1 64 bits, Windows Server 2012 Standard, CentOS 6.3 64 bits
  • Disque SSD de démarrage RealSSD P100e Micron de 400 Go
  • LSI 9211-4i SAS/SATA 6.0Gb/s HBA (pour les SSD de démarrage)
  • LSI 9207-8i SAS/SATA 6.0Gb/s HBA (pour l'analyse comparative des SSD ou HDD)

Lorsqu'il s'est agi de choisir des comparables pour cet examen, nous avons choisi les tout derniers accélérateurs d'applications SLC et MLC les plus performants. Ceux-ci ont été choisis en fonction des caractéristiques de performance de chaque produit, ainsi que de la gamme de prix. Nous incluons à la fois les résultats de référence de stock et de haute performance pour le ioDrive2 Duo SLC et le comparons au Micron RealSSD P320h ainsi qu'au Virident FlashMAX II sur-provisionné en mode haute performance. 

Fusion ioDrive1.2 Duo SLC de 2 To

  • Sortie : 2S2011
  • Type NAND : SLC
  • Contrôleur : 2 x FPGA avec firmware propriétaire
  • Visibilité des appareils : 4 appareils JBOD
  • Version Windows de Fusion-io VSL : 3.2.2
  • Fusion-io VSL Linux Version : 3.2.2
  • Temps de préconditionnement : 12 heures

700 Go Micron RealSSD P320h

  • Sortie : 2S2011
  • Type NAND : SLC
  • Contrôleur : 1 x ASIC propriétaire
  • Visibilité de l'appareil : appareil unique
  • Micron Windows : 8.01.4471.00
  • Micron Linux : 2.4.2-1
  • Temps de préconditionnement : 6 heures

FlashMAX II Virident de 2.2 To

  • Sortie : 2S2012
  • Type NAND : MLC
  • Contrôleur : 2 x FPGA avec firmware propriétaire
  • Visibilité de l'appareil : appareil unique ou double selon le formatage
  • Virident Windows : Version 3.0
  • Virident Linux : Version 3.0
  • Temps de préconditionnement : 12 heures

Analyse synthétique de la charge de travail d'entreprise

La façon dont nous envisageons les solutions de stockage PCIe va plus loin que la simple analyse des performances traditionnelles en rafale ou en régime permanent. Lorsque vous examinez les performances moyennes sur une longue période, vous perdez de vue les détails des performances de l'appareil sur toute cette période. Étant donné que les performances flash varient considérablement au fil du temps, notre processus d'analyse comparative analyse les performances dans des domaines tels que le débit total, la latence moyenne, la latence maximale et l'écart type sur l'ensemble de la phase de préconditionnement de chaque appareil. Avec les produits d'entreprise haut de gamme, la latence est souvent plus importante que le débit. Pour cette raison, nous nous efforçons de montrer les caractéristiques de performance complètes de chaque appareil que nous soumettons à notre laboratoire de test d'entreprise.

Nous incluons également des comparaisons de performances pour montrer comment chaque périphérique fonctionne sous un ensemble de pilotes différent sur les systèmes d'exploitation Windows et Linux. Pour Windows, nous utilisons les derniers pilotes au moment de l'examen initial, sous lesquels chaque appareil est ensuite testé sur un environnement Windows Server 64 R2008 2 bits. Pour Linux, nous utilisons l'environnement CentOS 64 6.3 bits, pris en charge par chaque accélérateur d'application Enterprise PCIe. Notre objectif principal avec ces tests est de montrer en quoi les performances du système d'exploitation diffèrent, car le fait d'avoir un système d'exploitation répertorié comme compatible sur une fiche produit ne signifie pas toujours que les performances entre eux sont égales.

Les performances Flash varient tout au long de la phase de préconditionnement de chaque périphérique de stockage. Avec différentes conceptions et capacités variables, notre processus de préconditionnement dure 6 heures ou 12 heures selon la durée nécessaire pour atteindre un comportement à l'état d'équilibre. Notre objectif principal est de nous assurer que chaque disque est entièrement en mode d'état stable au moment où nous commençons nos tests primaires. Au total, chacun des appareils comparables est effacé de manière sécurisée à l'aide des outils du fournisseur, préconditionné à l'état stable avec la même charge de travail avec laquelle l'appareil sera testé sous une charge importante de 16 threads avec une file d'attente exceptionnelle de 16 par thread, puis testé à intervalles définis dans plusieurs profils de profondeur de thread/file d'attente pour afficher les performances en cas d'utilisation légère et intensive.

Attributs surveillés dans les tests de préconditionnement et d'état stable principal :

  • Débit (agrégat IOPS lecture + écriture)
  • Latence moyenne (latence de lecture + écriture moyennée ensemble)
  • Latence maximale (latence maximale de lecture ou d'écriture)
  • Écart-type de latence (écart-type de lecture + écriture moyenné ensemble)

Notre analyse de charge de travail synthétique d'entreprise comprend quatre profils basés sur des tâches réelles. Ces profils ont été développés pour faciliter la comparaison avec nos références passées ainsi qu'avec des valeurs largement publiées telles que la vitesse de lecture et d'écriture maximale de 4K et 8K 70/30, qui est couramment utilisée pour les disques d'entreprise. Nous avons également inclus deux charges de travail mixtes héritées, le serveur de fichiers traditionnel et le serveur Web, chacune offrant un large éventail de tailles de transfert.

  • 4K
    • 100 % de lecture ou 100 % d'écriture
    • 100% 4K
  • 8K70/30
    • 70 % de lecture, 30 % d'écriture
    • 100% 8K
  • Serveur de fichiers
    • 80 % de lecture, 20 % d'écriture
    • 10 % 512b, 5 % 1k, 5 % 2k, 60 % 4k, 2 % 8k, 4 % 16k, 4 % 32k, 10 % 64k
  • webserver
    • 100 % lu
    • 22 % 512b, 15 % 1k, 8 % 2k, 23 % 4k, 15 % 8k, 2 % 16k, 6 % 32k, 7 % 64k, 1 % 128k, 1 % 512k

Dans notre première charge de travail, nous examinons un profil de préconditionnement d'écriture 4K entièrement aléatoire avec une charge de travail exceptionnelle de 16T/16Q. Dans ce test, le Fusion ioDrive2 Duo SLC offre les performances en rafale les plus élevées du groupe, mesurant près de 550,000 360 IOPS en rafale avec son pilote Linux. Sous Windows, les vitesses de rafale ont baissé à "seulement" 420,000-2 230,000 IOPS. En regardant ses performances à l'approche de l'état stable, l'ioDrive200,000 Duo en mode HP s'est stabilisé à environ 140,000 115,000 IOPS sous Linux et XNUMX XNUMX IOPS sous Windows. En mode capacité de stockage, les performances mesuraient environ XNUMX XNUMX IOPS sous Linux et XNUMX XNUMX IOPS sous Windows.

Avec une charge lourde de 16T/16Q, la latence moyenne sur le Fusion ioDrive2 Duo mesurée entre 1.85 ms et 2.20 ms en mode capacité de stockage pour Linux et Windows respectivement. Dans les configurations hautes performances, la latence est tombée à environ 1.10 ms et 1.25 ms.

En comparant la latence maximale sur l'ioDrive2 Duo sous Windows et Linux avec notre profil d'écriture aléatoire 4k, il était facile de constater qu'il favorisait un environnement Linux en ce qui concerne les temps de réponse de pointe. Au cours de la période de préconditionnement, la latence maximale de Windows variait entre 40 et 360 ms en capacité de stockage et entre 100 et 250 ms en mode hautes performances. Cela contrastait avec ses performances sous Linux qui maintenaient des temps de réponse de pointe entre 20 et 50 ms pour les configurations standard et hautes performances.

En explorant l'écart type de latence, le Fusion ioDrive2 Duo SLC avait moins de cohérence de latence sous Windows en mode stock et hautes performances que sous Linux. En le comparant au Micron P320h et au Virident FlashMAX II en mode HP, ces deux modèles ont conservé à peu près la même cohérence sur les deux systèmes d'exploitation.

Après la fin de notre période de préconditionnement de 12 heures sur le ioDrive2 Duo SLC, il avait des performances 4k aléatoires à l'état stable mesurant un pic de 231,456 4 IOPS sous Linux lorsqu'il était provisionné en mode haute performance. Cela lui a donné les performances d'écriture 320K aléatoires les plus élevées du groupe, bien que ses performances Windows soient à peu près conformes à la vitesse d'écriture du Micron P4h. En mode performance stock, les vitesses d'écriture aléatoires 114,917k sont tombées à 139,421 4 IOPS sous Windows et 320 637 IOPS sous Linux. C'était à peu près à égalité avec le FlashMAX II avec celui-ci configuré dans son mode haute performance. En ce qui concerne la vitesse de lecture aléatoire des groupes 2K, le Micron P460h était en tête du peloton avec 463k IOPS sous Linux, avec le ioDrive384 Duo SLC mesurant 392-XNUMXk IOPS sous Linux et XNUMX-XNUMXk IOPS sous Windows.

En comparant la latence moyenne avec une lourde charge de travail 16T/16Q avec une activité de lecture aléatoire 100 % 4K, le ioDrive2 Duo SLC a mesuré entre 0.550 et 0.552 ms sous Windows et entre 0.649 et 0.663 ms sous Linux. Passant aux performances d'écriture, il mesurait 1.102-1.255 ms en mode haute performance et 1.832-2.223 ms en capacité de stockage, avec sa force d'écriture du côté Linux.

En comparant la latence maximale, le Fusion ioDrive2 Duo s'est démarqué sous Windows avec les temps de réponse de pointe les plus élevés du groupe, mesurant 373-1018 ms avec une activité d'écriture aléatoire de 4k. Ses performances sous Linux étaient bien meilleures, mesurant 43 à 51 ms au maximum. En ce qui concerne la latence de lecture maximale, l'ioDrive2 Duo de Windows était en tête du peloton avec une latence maximale de 3.32 à 3.76 ms.

En comparant l'écart type de latence entre chaque PCIe AA dans notre profil 4K aléatoire, le ioDrive2 Duo SLC offrait une excellente cohérence de latence de lecture sous Windows, mais avec l'activité d'écriture, il avait une des latences les moins cohérentes du groupe. Cela a été amélioré dans un environnement Linux, bien que ceux-ci soient également plus élevés que les autres dans le groupe. Au sommet du groupe se trouve le Micron RealSSD P320h, offrant un écart type de latence équilibré avec une activité de lecture et d'écriture.

Notre prochain test passe à une charge de travail mixte 8K 70/30 où le ioDrive2 Duo SLC était en tête du peloton avec les vitesses de rafale les plus élevées mesurant entre 424 et 443,000 2 IOPS, avec un débit plus élevé sous Windows. Alors que les performances se rapprochaient de l'état stable, la capacité de stockage de l'ioDrive140 Duo SLC mesurait entre 148 et 195 200 IOPS, ce qui est passé à XNUMX et XNUMX XNUMX IOPS en mode hautes performances.

En comparant la latence moyenne de notre charge de travail 8k 70/30, le Fusion ioDrive2 Duo SLC mesurait 0.57-0.59 ms en rafale (petite avance sous Windows) et augmentait à environ 1.70-1.80 ms en capacité de stockage et 1.28-1.33 ms en mode haute performance .

Lorsque l'ioDrive2 Duo SLC est passé de la rafale à l'état soutenu ou stable, la latence maximale sous Windows et Linux, ainsi que les modes stock et hautes performances, oscillait entre 50 et 250 ms. Ceci par rapport au Micron P320h qui mesurait 10 à 30 ms ou au Virident FlashMAX II qui mesurait entre 30 et 50 ms.

Alors que la latence maximale de l'ioDrive2 Duo était élevée lors de notre test de préconditionnement 8k 70/30, nous avons noté sa cohérence de latence en mode haute performance inséré juste derrière le Micron P320h. En configuration de capacité de stock, il évoluait légèrement plus haut que le Virident FlashMAX II.

Par rapport à la charge de travail fixe à 16 threads et 16 files d'attente maximales que nous avons effectuée lors du test d'écriture 100 % 4K, nos profils de charge de travail mixtes adaptent les performances à une large gamme de combinaisons thread/file d'attente. Dans ces tests, nous étendons l'intensité de notre charge de travail de 2 threads et 2 files d'attente à 16 threads et 16 files d'attente. Dans notre test 8K 70/30 étendu, le Fusion ioDrive2 Duo SLC a obtenu les performances de pointe les plus élevées du groupe en configuration hautes performances. En le comparant directement au Micron P320h, il a pu offrir des performances de profondeur de file d'attente beaucoup plus élevées à 2, 4, 8 et 16 threads, mais a ensuite pris du retard à mesure que la profondeur de la file d'attente augmentait. En approvisionnement de stock, il offrait des performances remarquablement proches du Virident FlashMAX II avec sa configuration en mode hautes performances.

Dans le segment de latence moyenne à l'échelle de notre test 8k 70/30, nous avons constaté que le Fusion ioDrive2 Duo SLC offrait la latence moyenne la plus faible du groupe, en partie grâce à ses bonnes performances à faible profondeur de file d'attente. Au fur et à mesure que la profondeur de la file d'attente augmentait, le Micron P320h a pris les devants, jusqu'à 16T/16Q où le ioDrive2 Duo SLC est revenu en tête.

Lorsque nous avons comparé la latence maximale dans notre test à l'échelle 8k 70/30, nous avons enregistré des pics plus importants du ioDrive2 Duo SLC, qui semblaient augmenter à mesure que la profondeur effective de la file d'attente augmentait. Cela était particulièrement notable avec la capacité de stockage ioDrive2 sous Windows. Ses performances Linux, ainsi que Windows en mode hautes performances, ont maintenu la latence maximale en dessous de 70 ms à des charges effectives inférieures ou égales à QD64, tandis que la latence à QD128 et QD256 a augmenté jusqu'à 160 ms et 220 ms respectivement.

Dans notre test 8k 70/30 à l'échelle, le Micron P320h était en tête du peloton avec la latence la plus constante sur toutes les charges de travail, avec le Virident FlashMAX II en deuxième position et le ioDrive2 Duo SLC en hautes performances juste derrière. 

La charge de travail du serveur de fichiers représente un spectre de taille de transfert plus important pour chaque appareil particulier, donc au lieu de s'installer pour une charge de travail statique de 4k ou 8k, le lecteur doit faire face à des demandes allant de 512b à 64k. Dans cette charge de travail, alors que le Fusion ioDrive2 Duo SLC devait commencer à faire face à une plus grande propagation de transfert, il était capable de fléchir certains muscles et de mener le peloton en mode haute performance. En rafale, le ioDrive2 Duo SLC avait un débit presque le double du Micron P320h et du Virident FlashMAX II, mesurant environ 305,000 136,000 IOPS. Alors qu'il s'approchait de l'état stable en mode hautes performances, il s'est stabilisé autour de 320 125,000 IOPS pour Windows et Linux, par rapport aux 110,000 70,000 IOPS du PXNUMXh. Dans le formatage de capacité de stockage, le débit a diminué à environ XNUMX XNUMX IOPS, par rapport au Virident FlashMAX II en mode hautes performances qui atteignait près de XNUMX XNUMX IOPS.

Avec ses fortes performances en rafale, la latence moyenne au début de notre courbe de préconditionnement mesurait environ 0.83 ms à partir du ioDrive2 Duo SLC, avant de se stabiliser à 1.87 ms en mode haute performance ou environ 2.25 ms à capacité de stockage.

Alors que le ioDrive2 Duo SLC est passé d'une rafale à un état soutenu et stable, la latence maximale a commencé à augmenter comme lors de notre test 8k 70/30, mais pas aussi élevée. Dans l'ensemble, nous avons mesuré une latence maximale comprise entre 20 ms et 200 ms à partir de l'ioDrive2 Duo dans tous les modes, le meilleur étant le mode Linux HP. Nous avons également noté un pic légèrement supérieur à 1,000 2 ms du ioDrive320 Duo sous Windows en mode hautes performances. En revanche, le Micron P20h a maintenu une latence maximale inférieure à XNUMX ms pour Windows et Linux.

Bien que nous ayons remarqué plus de flutter de latence maximale du ioDrive2 Duo lors de notre test précédent, en regardant son écart type de latence, il se situait au milieu du peloton entre le Micron P320h et le Virident FlashMAX II. Dans l'ensemble, Linux offrait une meilleure cohérence dans les configurations de stock et hautes performances, ces dernières ayant plus de stabilité.

Une fois le processus de préconditionnement du serveur de fichiers terminé avec une charge constante de 16T/16Q, nous sommes passés à nos tests principaux qui mesurent les performances à des niveaux définis entre 2T/2Q et 16T/16Q. Dans notre charge de travail principale de serveur de fichiers, le ioDrive2 Duo SLC offrait les performances de pointe les plus élevées, mesurant 132-135,000 16 IOPS à 16T/320Q pour le P125,500h qui mesurait 2 320 IOPS. L'ioDrive2 Duo a également montré sa faible profondeur de file d'attente par rapport au Micron P4h à des charges de travail de 8, 320 et XNUMX threads, avec un léger avantage en mode hautes performances. Au fur et à mesure que la profondeur des files d'attente augmentait, le Micron PXNUMXh offrait les performances les plus élevées à chaque étape, dépassant beaucoup plus.

En comparant la latence moyenne entre chaque accélérateur d'application PCIe haut de gamme dans notre charge de travail de serveur de fichiers, le ioDrive2 Duo SLC avait la latence la plus faible du groupe, mesurant 0.14 ms pour Linux et Windows à 2T/2Q en mode hautes performances. Au fur et à mesure que la charge de travail augmentait, le Micron P320h a maintenu une forte avance, jusqu'à 16T/16Q où le ioDrive2 Duo SLC avait la latence moyenne la plus faible à la charge maximale.

En regardant les temps de réponse de pointe dans notre test principal de serveur de fichiers, le Fusion ioDrive2 Duo SLC avait une latence maximale plus élevée, qui a commencé à augmenter à des charges de travail égales ou supérieures à une profondeur de file d'attente effective de 128. En dessous de QD128, le ioDrive2 Duo avait une latence maximale de 11 -100 ms, avec ses meilleures performances en mode haute performance. 

Basculant notre point de vue des temps de réponse maximaux à la cohérence de la latence dans notre test de serveur de fichiers, le ioDrive2 Duo SLC a suivi le Micron P320h en mode hautes performances et a offert un léger avantage en écart type de latence par rapport au Virident FlashMAX II en configuration de stock.

Dans notre dernière charge de travail synthétique couvrant un profil de serveur Web, qui est traditionnellement un test de lecture à 100 %, nous appliquons une activité d'écriture à 100 % pour préconditionner entièrement chaque lecteur avant nos tests principaux. Dans le cadre de ce test de préconditionnement stressant, le ioDrive2 Duo SLC a pris une avance impressionnante sur le Micron P320h et le Virident FlashMAX II dans les configurations d'origine et hautes performances. Dans ce test, les vitesses de rafale ont dépassé 145,000 320 IOPS, tandis que le Micron P67,000h a culminé à 32,000 XNUMX IOPS et que le Virident FlashMAX II a commencé à XNUMX XNUMX IOPS en mode hautes performances.

Avec une lourde charge de travail d'écriture à 100 % de 16T/16Q dans notre test de préconditionnement de serveur Web, l'ioDrive2 a maintenu un temps de réponse moyen d'environ 3.5 à 3.8 ms en configuration haute performance et de 6.4 à 7.2 ms en configuration de stock.

En comparant la latence maximale dans notre test de préconditionnement de serveur Web, l'ioDrive2 Duo SLC a mesuré entre 25 et 70 ms sous Linux en mode stock et haute performance, avec une latence maximale de Windows passant de 25 à 380 ms avec quelques pointes supérieures à 1,000 XNUMX ms. 

En comparant la cohérence de la latence dans notre cycle de préconditionnement stressant du serveur Web, le Micron P320h est arrivé en tête du peloton, avec le ioDrive2 Duo SLC au milieu. Lorsqu'il était configuré en mode hautes performances, il avait de meilleures performances sous Windows et Linux que dans la configuration de stock.

En passant au segment principal de notre test de serveur Web avec un profil de lecture à 100 %, le ioDrive2 Duo SLC avait une mise à l'échelle des performances de 23.9 à 25.5 2 IOPS à 2T/141Q, qui a augmenté jusqu'à un pic de 147 à 16 16 IOPS à 320T/2Q. Comparé au Micron P32h, le ioDriveXNUMX Duo n'a pas pu égaler ses performances à des profondeurs de file d'attente faibles ou élevées, et il a suivi le Virident FlashMAX II à des profondeurs de file d'attente effectives inférieures à QDXNUMX, bien qu'au-dessus de ce niveau, il l'ait rapidement dépassé.

La latence moyenne du Fusion ioDrive2 Duo SLC variait de 0.153 à 0.163 ms à 2T/2Q et augmentait jusqu'à un pic de 1.737 à 1.803 ms à 16T/16Q. Dans l'ensemble, le Micron P320h avait la latence la plus faible, tandis que le Virident FlashMAX II avait l'avantage à QD32 et en dessous, que le ioDrive2 Duo SLC a pu surpasser à des profondeurs de file d'attente efficaces plus élevées.

Dans notre profil de serveur Web lu à 100 %, nous avons noté des pics de latence du ioDrive2 Duo SLC pouvant atteindre 130 ms, bien que la plupart soient inférieurs à 20 ms à partir de profondeurs de file d'attente effectives inférieures à 256. Sous notre charge la plus élevée de 16T/16Q, le ioDrive2 Duo SLC a augmenté à 164-320 ms, le plus élevé étant mesuré sous Windows dans la configuration en stock.

En comparant l'écart type de latence dans notre test de serveur Web à 100 % de lecture, le Micron P320h avait une forte avance dans le groupe, avec le ioDrive2 Duo SLC à la traîne ou à égalité avec le Virident FlashMAX II des profondeurs de file d'attente efficaces faibles à élevées.

Conclusion

Fusion-io a montré une capacité à développer plus qu'un simple changement incrémentiel avec l'accélérateur d'application ioDrive2 Duo SLC. Du fonctionnement interne, comme la protection contre les pannes Adaptive FlashBack NAND, à la conception de carte améliorée qui déplace la NAND vers ses propres cartes filles, Fusion-io a apporté plusieurs modifications matérielles qui rendent l'ioDrive2 meilleur que le prédécesseur. L'équipe de développement a travaillé d'arrache-pied pour atténuer la latence du disque ; nous avons vu ces avantages dans les tests 4K 100% et 8K 70/30 où le SLC ioDrive2 a affiché les meilleurs scores de latence et de débit sous une charge de pointe. Il avait également les performances les plus élevées à faible profondeur de file d'attente, avec une avance significative sur le Micron P320h et FlashMAX II dans notre test 8k 70/30 à QD2 pour les charges de travail à 2, 4 et 8 threads. Cela offrait un autre avantage de générer la latence moyenne la plus faible, car il n'était pas nécessaire d'avoir autant d'E / S en attente pour générer des performances nettement supérieures. Du côté de la gestion, l'ioDrive2 est livré avec ioSphere, le logiciel de gestion de disque le plus complet disponible. Comparez-le à n'importe quel logiciel groupé associé à des accélérateurs d'application actuellement sur le marché et il les bat haut la main en termes de fonctionnalités et de conception d'interface.

Nous avons vu avec la plupart des autres accélérateurs d'applications qu'ils fonctionnent généralement mieux dans un système d'exploitation que dans un autre. C'est bien sûr la raison pour laquelle nous testons les disques sous Windows et Linux, afin de déterminer les forces et les faiblesses d'un disque. Comme nous l'avons vu avec les disques Fusion-io précédents, le ioDrive2 Duo fonctionne extrêmement bien dans les environnements Linux, bien qu'il devienne un peu plus erratique sous Windows. Bien que plus évidentes lorsqu'elles sont visualisées sur nos graphiques, les performances globales de Windows ne souffrent pas beaucoup, mais il y a certainement place à l'amélioration. Sous des charges de pointe de 16T/16Q, nous avons remarqué des pics de latence de pointe du ioDrive2 Duo. Bien que, lorsque l'on compare sa cohérence de latence, dans l'ensemble, cela n'a pas eu beaucoup d'impact sur ces chiffres. Bien que certains des chiffres de latence ne soient pas là où Fusion-io le souhaiterait, leur conception permet des mises à jour de très bas niveau qui devraient pouvoir atténuer certains de ces problèmes de latence au fil du temps. Il convient également de noter sur le sujet de la compatibilité que Fusion-io prend en charge l'une des listes de systèmes d'exploitation les plus robustes, ce qui rend le lecteur facile à déployer dans un grand nombre de cas d'utilisation. 

La conception de la carte Fusion-io est souvent critiquée par la concurrence car elle utilise le processeur et la RAM de l'hôte pour effectuer la plupart des travaux de gestion NAND. Comme nous l'avons vu, il s'agit d'une conception efficace, également utilisée par Virident, qui offre des performances et une latence impressionnantes en exploitant des processeurs de plus en plus puissants. Le P320h de Micron est un brillant exemple de l'approche alternative, tirant parti d'un très bon contrôleur embarqué, mais leur carte dépasse 700 Go de stockage SLC illustrant les compromis qui doivent être faits par les fournisseurs de stockage. Une nouvelle attaque de l'industrie contre Fusion-io est quelque peu intéressante, celle-ci autour du facteur de forme. L'ioDrive2 Duo utilise une conception FHHL, là où la plupart des autres utilisent HHHL, qui, du point de vue de l'ajustement du serveur, est une conception plus universelle. Tous les serveurs de notre laboratoire de HP, Dell, Lenovo et SuperMicro prennent en charge les formats FHHL et HHHL, mais il convient de noter que la conception Fusion-io est quelque peu aberrante à cet égard. Du point de vue de la conception, il semble acceptable d'utiliser plus d'espace pour permettre des segments NAND modulaires. Cela limite les coûts de conception sur la longue durée de vie de la gamme de produits à mesure que la NAND évolue, mais la concurrence remarque rapidement ses limites dans des cas d'utilisation particuliers.

Avantages

  • Offre les performances de pointe les plus élevées dans nos charges de travail 100 % 4K, 8k 70/30 et serveur de fichiers
  • La suite de gestion ioSphere offre le meilleur ensemble de fonctionnalités de sa catégorie
  • Débit le plus élevé et latence la plus faible dans les charges de travail 8k 70/30 et serveur de fichiers à faible profondeur de file d'attente
  • Architecture éprouvée avec des fonctionnalités telles que Adaptive Flashback pour améliorer la fiabilité

Inconvénients

  • Problèmes de latence maximale sous Windows et Linux
  • Perd du terrain par rapport au Micron P320h entre les profondeurs de file d'attente effectives les plus basses et les plus élevées

Conclusion

L'accélérateur d'application Fusion-io ioDrive2 Duo SLC fournit 1.2 To de stockage disponible le plus rapide dans plusieurs charges de travail, tout en offrant de nombreuses mises à niveau de conception et de fonctionnalités par rapport au produit de la génération précédente. L'une de ces mises à niveau est Adaptive FlashBack qui préserve les données et maintient le disque opérationnel même après plusieurs pannes de matrice NAND. Associant le meilleur logiciel de gestion de l'industrie et la capacité d'améliorer continuellement le disque sans avoir besoin d'un nouveau contrôleur, le ioDrive2 Duo SLC trouvera certainement une utilisation à long terme au service des applications les plus critiques qui peuvent tirer parti d'excellentes performances de stockage. 

Page produit ioDrive2

Discutez de cet avis