Accueil Entreprise Examen Microsoft Azure Stack HCI (DataON HCI-224 avec Intel Optane NVMe)

Examen Microsoft Azure Stack HCI (DataON HCI-224 avec Intel Optane NVMe)

by Laboratoire d'entreprise StorageReview
Examen Microsoft Azure Stack HCI DataON

Jusqu'ici nous avons plongé profondément dans Microsoft Azure Stack HCI, l'implémentation sur site du service cloud Azure de Microsoft. Azure Stack HCI peut être considéré comme un type de plate-forme offrant le meilleur des deux mondes. Il dispose de tous les outils de gestion d'Azure comme Azure Monitor, Azure Security Center, Azure Update Management, Azure Network Adapter et Azure Site Recovery, tout en hébergeant les données sur site et en respectant certaines réglementations. Azure Stack HCI est divisé en trois parties : architecture définie par logiciel, services Azure et matériel.


Jusqu'ici nous avons plongé profondément dans Microsoft Azure Stack HCI, l'implémentation sur site du service cloud Azure de Microsoft. Azure Stack HCI peut être considéré comme un type de plate-forme offrant le meilleur des deux mondes. Il dispose de tous les outils de gestion d'Azure comme Azure Monitor, Azure Security Center, Azure Update Management, Azure Network Adapter et Azure Site Recovery, tout en hébergeant les données sur site et en respectant certaines réglementations. Azure Stack HCI est divisé en trois parties : architecture définie par logiciel, services Azure et matériel.

Choisir le bon matériel est important comme nous l'avons détaillé dans notre article, "L'importance du matériel dans Microsoft Azure Stack HCI.” La première étape du déploiement d'Azure Stack HCI serait de trouver un fournisseur de matériel certifié, dans ce cas, DataON. DataON entretient un partenariat solide avec Microsoft et Intel depuis plusieurs années et concrétise pleinement ce partenariat dans la configuration matérielle d'Azure Stack HCI dans une configuration Intel Select. Une facette intéressante du partenariat avec Intel est la possibilité de tirer parti du PMEM de l'entreprise (et bien sûr de ses derniers processeurs) avec Azure Stack HCI.

Dans de nombreux cas, les solutions DataON HCI Intel Select sont configurées et livrées dans leur propre rack, prêtes à être déployées immédiatement. Cette méthode de livraison est particulièrement utile à la périphérie, où l'infrastructure informatique existante est limitée ou inexistante. Dans le laboratoire StorageReview, nous avons déployé les quatre nœuds de stockage et de calcul, le contrôleur de domaine et les commutateurs comme illustré ci-dessous.

Construire et concevoir

Le cluster Microsoft Azure Stack HCI que nous avons examiné est construit sur la plate-forme DataON HCI-224 All Flash NVMe. Ces serveurs ont une taille de 2U avec 24 baies NVMe à l'avant, offrant de nombreuses extensions à l'arrière pour les composants basés sur PCIe. L'étiquetage est élevé contrairement aux caddies de lecteur noir mat, ce qui permet de repérer facilement des lecteurs spécifiques si le moment est venu de les échanger. Tout est étiqueté, ce qui n'est pas si rare, mais l'étendue de l'étiquetage l'est. Notre déploiement a chaque nœud étiqueté (1 à 4), ainsi qu'un certain nombre d'autres éléments qui facilitent le déploiement et la gestion dans le centre de données.

Notre configuration était équipée de 48 SSD NVMe, soit 12 par nœud. Ceux-ci comprenaient quatre SSD Intel Optane P375X de 4800 Go et huit SSD Intel P4510 de 2 To.

À l'arrière, nous avons deux cartes réseau 100G Mellanox Connect-X 5 à double port, offrant une connexion entièrement redondante via deux commutateurs Mellanox 100G (SN2100) pour le trafic réseau du cluster. Toutes les connexions ne sont pas représentées dans nos photographies de studio avec un étiquetage complet à chaque extrémité du câble réseau approprié pour permettre un câblage sans erreur lors de la phase de déploiement.

StockageExaminer le diagramme de cluster Microsoft Azure Stack HCI DataON

Avant cela, nous n'avions jamais eu de solution avec ce niveau de documentation dans l'étiquette. Microsoft et DataON font du déploiement d'Azure Stack un processus indolore afin que les clients puissent être opérationnels immédiatement. Chaque câble est codé par couleur pour l'utilisation spécifique et étiqueté pour l'endroit où chaque extrémité va. Combiné avec la feuille personnalisée que DataON fournit aux clients, il garantit presque un déploiement sans erreur. Dans notre déploiement, le système a été préconfiguré avec des adresses IP avant l'expédition, avec les adresses IP pour la gestion et IPMI étiquetées.

Gestion et convivialité

Pour les acheteurs qui exploitent une boutique Hyper-V fonctionnant sur Windows Server, Microsoft Azure Stack HCI constituera une transition facile. Bon nombre des mêmes outils de gestion sont en place, dont beaucoup offrent un flux de travail plus intégré et plus simple. Dans notre processus d'examen, nous avons utilisé à la fois le gestionnaire de cluster de basculement Windows pour gérer le cluster DataOn HCI, ainsi que le centre d'administration Windows pour surveiller les charges de travail et voir comment elles fonctionnaient.

En examinant d'abord davantage le niveau du nœud via une session Microsoft Remote Desktop (RDP) connectée à l'un des nœuds, nous avons examiné le gestionnaire de cluster de basculement Windows. Cela offre à la fois des capacités de gestion au niveau du nœud et une visibilité au niveau du cluster. Ce type d'accès serait plus orienté vers le déploiement initial, où la surveillance quotidienne aurait lieu à partir du centre d'administration Windows.

Tout d'abord, nous cliquons sur notre cluster particulier et obtenons des informations générales à son sujet, la possibilité de le configurer et un aperçu des ressources. Cela donne une vue récapitulative du cluster sélectionné, vous permettant de voir où se trouvent les problèmes et de commencer à explorer des zones spécifiques.

Ensuite, les rôles de basculement. Ici, nous pouvons voir toutes les machines virtuelles Hyper-V en cours d'exécution sur le cluster. Les nombreuses machines virtuelles vmfleet que nous avons utilisées pour tester le cluster sont présentées.

Les réseaux nous permettent de voir quels réseaux de clusters sont disponibles et le statut de chacun. La sélection d'un réseau de cluster vous permet de voir la carte réseau sous-jacente qui lui est associée, ainsi que son adresse IP.

Sous l'option de stockage se trouvent Disques, pools et boîtiers. Pour les disques, on peut cliquer sur les disques virtuels et obtenir des informations telles que l'état, l'endroit où il est attribué, le nœud propriétaire, le numéro de disque, le style de partition et la capacité. Les utilisateurs peuvent également approfondir un peu plus avec encore plus d'informations présentées comme l'ID, le nom et la description du pool, ainsi que l'ID, le nom et la description du disque virtuel, l'état de santé et de fonctionnement et la résilience.

Les pools sont similaires, avec les informations de certains pools de stockage telles que l'état, la santé, le nœud propriétaire, les états opérationnels et la capacité globale, ainsi que l'espace libre et utilisé.

Sous Nœuds, on peut facilement voir tous les nœuds du cluster et leur statut.

Sur la droite, on peut passer aux disques de basculement et voir le disque individuel pour un nœud donné en bas.

À partir de la même barre latérale, on peut également regarder le réseau pour un nœud donné.

Bien que le gestionnaire de cluster de basculement Windows soit un appareil de gestion plus « détaillé », il oblige les utilisateurs à se connecter via Windows Remote Desktop à un serveur lui-même (ou à un autre serveur connecté à ce cluster) pour travailler avec lui. Bien que ce style de gestion convienne à de nombreuses utilisations, Microsoft a simplifié les choses avec une nouvelle plate-forme appelée Windows Admin Center. Contrairement au gestionnaire de cluster de basculement, Windows Admin Center est entièrement basé sur un navigateur Web, ce qui facilite la connexion à partir de n'importe quel ordinateur ou tablette sur le lieu de travail. Il offre également un aspect et une sensation modernisés et esthétiques, ce qui rend la surveillance quotidienne plus agréable. Il offre un aperçu d'une grande partie des mêmes informations, en mettant davantage l'accent sur la surveillance des activités que le gestionnaire de cluster de basculement n'offre pas dans la même mesure.

Une fois que Windows Admin Center est associé à un cluster, vous pouvez explorer des zones spécifiques pour afficher et gérer les opérations. Ici, nous voyons des informations sur les performances de calcul globales du cluster, qui permettent de suivre les ressources globales utilisées par les machines virtuelles.

Bien que le centre d'administration Windows soit idéal pour afficher l'activité, vous pouvez toujours interagir avec les machines virtuelles de votre cluster. Ci-dessous, nous mettons sous tension un certain nombre de machines virtuelles vmfleet.

Les utilisateurs peuvent également explorer des informations sur des machines virtuelles spécifiques.

Sous les rôles, nous obtenons une vision légèrement différente des rôles, mais la plupart des mêmes informations clés.

Dans les paramètres, les utilisateurs peuvent télécharger, installer et mettre à jour des extensions pour Azure.

Grâce à Windows Admin Center, nous pouvons également accéder au gestionnaire de cluster hyperconvergé pour examiner de plus près le calcul et le stockage. Nous ouvrons le tableau de bord qui contient des informations générales telles que le nombre de serveurs, de lecteurs, de machines virtuelles, de volumes, ainsi que l'utilisation du processeur, de la mémoire et du stockage. Au bas du tableau de bord se trouvent les performances du cluster qui sont décomposées en un laps de temps spécifique, en IOPS et en latence.

Sous calcul, les administrateurs peuvent explorer les serveurs eux-mêmes pour la gestion, y compris la suppression du serveur du cluster. Ici, il y a des informations générales sur le serveur utilisé telles que la disponibilité, l'emplacement, le domaine, le fabricant, le modèle, le numéro de série, le nom du système d'exploitation, la version et le numéro de build. En outre, les utilisateurs peuvent consulter les performances spécifiques au serveur.

En cliquant sur l'onglet Volumes, les utilisateurs accèdent à un résumé de tous les volumes du cluster. L'intégrité des volumes est codée par couleur : vert pour sain, rouge pour critique et jaune pour avertissement. Les performances sont également suivies pour tous les volumes, ventilées par période et en IOPS, latence et débit.

L'exploration en profondeur d'un seul volume donne des propriétés spécifiques du volume, notamment l'état, le système de fichiers, le chemin, la reconnaissance du domaine de pannes, la taille totale, la taille utilisée, la résilience et l'empreinte. Il existe des fonctionnalités facultatives (déduplication et compression ainsi que sommes de contrôle d'intégrité) qui peuvent être activées ou désactivées ici. La capacité est représentée graphiquement, montrant utilisée par rapport à disponible. Et encore une fois, nous voyons la performance.

Sous l'onglet Lecteurs, nous obtenons un résumé de tous les lecteurs du système. Ici, nous voyons le nombre total de lecteurs et s'il existe ou non des alertes avec le même code couleur que les volumes. Nous pouvons également voir la capacité : utilisée, disponible et réservée.

En cliquant sur Inventaire, nous obtenons une liste de tous les lecteurs et plusieurs détails. Les détails incluent l'état du lecteur, son modèle, la taille de la capacité, le type, son utilisation et la quantité de stockage utilisée.

Nous pouvons explorer un seul lecteur et voir des propriétés telles que l'état, l'emplacement, la taille, le type, l'utilisation, le fabricant, le modèle, le numéro de série, la version du micrologiciel et le pool de stockage dans lequel il se trouve. Nous pouvons voir la quantité de capacité utilisée. versus disponible pour le lecteur individuel et ses performances en termes d'IOPS, de latence et de débit.

Sous les performances, nous pouvons également voir la latence du lecteur et les statistiques d'erreur.

Performance

Les performances au sein de l'écosystème Microsoft Azure Stack ont ​​toujours été excellentes, un point fort qui a fait son chemin depuis l'époque des espaces de stockage. Dans cet esprit, nous avons examiné certaines charges de travail de référence courantes dans cette revue pour permettre aux utilisateurs de voir à quel point cette plate-forme se compare aux autres solutions HCI du marché. Dans cet esprit, nous avons utilisé des charges de travail pour mettre l'accent sur des tailles de petits blocs aléatoires ainsi que sur des transferts de gros blocs pour montrer le potentiel que cette solution Microsoft peut offrir. Dans notre revue Azure Stack HCI, nous avons utilisé vmfleet pour les tests de performances, tandis que sur VMware ou Linux bare-metal, nous avons utilisé vdbench.

Pour les performances ici, nous avons testé le système avec un miroir à 2 voies et un miroir à 3 voies. Le miroir fait référence à la méthode de protection des données (soit deux copies, soit trois copies). Évidemment, avec plus de copies, les utilisateurs perdront de la capacité. Du point de vue des performances, 3-way devrait conduire à de meilleures lectures grâce à l'augmentation du parallélisme et 2-way est meilleur pour les performances d'écriture avec un tiers de trafic réseau en moins.

Pour notre test aléatoire 4K, le miroir bidirectionnel a enregistré un débit de 2 2,204,296 247 IOPS en lecture avec une latence moyenne de 564,601 µs et un débit en écriture de 3.69 3 IOPS avec une latence moyenne de 2,302,610 ms. Le 170 voies a vu un débit de lecture de 338,538 9.12 521 IOPS en lecture à une latence moyenne de 4 µs et pour l'écriture, c'était un débit de 202 XNUMX IOPS à une latence moyenne de XNUMX ms. Pour mettre cela en perspective, l'offre vSAN de VMware utilisant deux SSD Optane et quatre SSD NVMe Capacity par nœud a mesuré XNUMXK IOPS XNUMXK en lecture à son apogée et XNUMXK IOPS en écriture.

Ensuite, nous examinons notre référence séquentielle 32K. Pour les lectures, nous avons vu le 2 voies atteindre 42.59 Go/s et le 3 voies atteindre 39.48 Go/s. Pour les écritures, le HCI nous a donné 13.8 Go/s pour le 2 voies et 7.19 Go/s pour le 3 voies.

Poursuivant notre travail séquentiel, nous passons à nos tests 64K. Ici, le 2 voies atteint 39.5 Go/s en lecture et 15.24 Go/s en écriture et le 3 voies atteint 46.47 Go/s en lecture et 7.72 Go/s en écriture. Par rapport à vSAN, les différences de bande passante en lecture ne se rapprochent même pas, où la bande passante dans ses tests dépassait un peu plus de 5.3 Go/s avec une taille de bloc de 64K. La bande passante en écriture avait une différence similaire, où vSAN plafonnait à 2.55 Go/s.

Notre prochaine référence est SQL avec des performances mixtes en lecture/écriture. Ici, le bidirectionnel avait un débit de 2 1,959,921 324 IOPS avec une latence moyenne de 3 µs. Le 1,929,030 voies a atteint 185 2 321 IOPS avec une latence moyenne de XNUMX µs. La charge de travail SQL est un autre domaine dans lequel Azure Stack HCI est capable de montrer sa force, mesurant un peu moins de XNUMX millions d'IOPS, tandis que le vSAN de VMware dans le même profil de charge de travail mesurait XNUMX XNUMX IOPS.

Avec SQL 90-10, le 2 voies a atteint 1,745,560 411 3 IOPS avec une latence moyenne de 1,547,388 µs et le 285 voies avait XNUMX XNUMX XNUMX IOPS et XNUMX µs pour la latence.

Pour SQL 80-20, le bidirectionnel avait un débit de 2 1,530,319 581 IOPS à 3 µs pour la latence. Le 1,175,469 voies a atteint 681 XNUMX XNUMX IOPS et XNUMX µs pour la latence.

SPECsfs

La prochaine étape est notre benchmark SPECsfs 2014 SP2 - un nouveau test pour nous ici. Le SPECsfs est une suite de référence qui mesure le débit et le temps de réponse du serveur de fichiers. Le benchmark nous donne une méthode standardisée pour comparer les performances entre différentes plates-formes de fournisseurs. Le benchmark fonctionne en définissant une échelle et en incrémentant jusqu'à ce que le point de latence soit trop grand pour les spécifications du benchmark. Ici, nous examinons l'échelle qui peut être réalisée jusqu'à ce que 11 ms soient dépassées, ainsi que la bande passante atteinte par le serveur lorsqu'il échoue au nombre de latence.

Nous examinerons d'abord la latence ici, car cela nous éclairera davantage sur les raisons pour lesquelles la bande passante s'est arrêtée là où elle s'est arrêtée dans la deuxième partie. L'échelle et leurs latences pour les 2 voies et 3 voies sont dans le tableau ci-dessous :

SPECsfs Latence (ms)
Escaliers intérieurs Miroir bidirectionnel DataON HCI-224 Miroir bidirectionnel DataON HCI-224
100 0.243 0.262
200 0.329 0.371
300 0.466 0.499
400 0.636 0.699
500 0.753 0.896
600 0.953 1.083
700 1.113 1.314
800 1.326 1.557
900 1.501 1.826
1000 1.88 2.167
1100 2.061 2.807
1200 2.323 4.64
1300 2.749 8.557
1400 5.47 10.449
1500 8.616 11.285 (échec)
1600 10.485 11.414 (échec)
1700 11.069
1800 11.697 (échec)
1900 12.51 (échec)

Comme on peut le voir, les deux configurations ont démarré vers 250µs, le bidirectionnel légèrement en dessous et le restant tout au long. À une échelle de 2, le 1500 voies a échoué à 3 ms, ce qui lui donne une plage de 11.285 µs à 262 ms. Le bidirectionnel a échoué à une échelle de 10.45 atteignant 2 ms, ce qui lui donne une plage de 1800 µs à 11.7 ms.

Le tableau suivant montre la bande passante pour chaque configuration à chaque build, avec l'échec répertorié ci-dessus en latence.

Bande passante SPECsfs (Ko/s)
Escaliers intérieurs Miroir bidirectionnel DataON HCI-224 Miroir bidirectionnel DataON HCI-224
100 300897 300880
200 600372 600857
300 901672 902964
400 1202779 1203106
500 1504492 1503394
600 1805952 1806455
700 2105973 2108432
800 2408183 2406171
900 2710895 2707106
1000 3007499 3009280
1100 3308648 3308168
1200 3608244 3610219
1300 3910414 3888303
1400 4212976 4026720
1500 4513454 4000079 (échec)
1600 4587183 4229678 (échec)
1700 4621067
1800 4630352 (échec)
1900 4569824 (échec)

Pour la bande passante, les deux configurations ont fonctionné au coude à coude avec des intervalles de 300 Mo/s jusqu'à ce que le 3 voies échoue la latence avec sa bande passante finale de 4.02 Go/s, et la 2 voies ayant une bande passante finale de 4.62 Go/s. s.

Conclusion

Cela fait un certain temps que nous n'avons pas été aussi profonds avec quoi que ce soit dans la pile centrée sur le stockage Microsoft; et mon garçon, sommes-nous heureux d'être de retour. Avec la solution renommée Microsoft Azure Stack HCI, Microsoft a fait quelque chose de si basique et fondamental qu'il est facile de sous-apprécier. Microsoft a rendu sa solution HCI extrêmement simple à utiliser sans rien superposer pour atténuer les performances. Comme le montrent nos chiffres, le cluster DataON que nous avons testé a affiché des chiffres énormes, les plus rapides que nous ayons vus dans un cluster HCI à 4 nœuds de taille moyenne. Pour être juste, nous ne testons même pas non plus le matériel le plus récent et le plus performant de DataON. Bien que cette configuration ne soit clairement pas en reste, avec les SSD Intel Optane DC, DataON propose des solutions plus rapides qui tirent parti des processeurs Intel Xeon de 2e génération, de la mémoire persistante et d'une mise en réseau plus rapide. Le fait qu'il y ait encore plus de performances disponibles dans une solution Azure Stack HCI est passionnant, mais il est également important de se rappeler que la solution peut également évoluer vers des déploiements aussi petits que HCI à deux nœuds qui peut être configuré sans commutateur pour une solution Edge ou SMB à faible coût.

En analysant les performances, le cluster Microsoft Azure Stack HCI a pu offrir une quantité incroyable d'E/S et de bande passante. Dans le domaine des quatre coins, nous avons mesuré plus de 2.3 millions d'IOPS 4K en lecture aléatoire avec une configuration de miroir à 3 voies et 338k IOPS en écriture aléatoire 4K. Si vous avez besoin de meilleures performances d'écriture, une configuration de miroir bidirectionnel a pu augmenter les vitesses d'écriture aléatoire 2K à 4k IOP. En ce qui concerne la bande passante, cependant, c'est là que Microsoft Azure Stack brille vraiment. Dans notre charge de travail de transfert séquentiel de 564 64 blocs, le miroir bidirectionnel mesurait 2 Go/s en lecture et 39.5 Go/s en écriture, tandis que le miroir tridirectionnel mesurait 15.24 Go/s en lecture et 3 Go/s en écriture. Cela dépasse de loin ce que nous avons mesuré à partir des anciens clusters HCI.

Dans l'ensemble, la solution Azure Stack HCI de Microsoft s'est avérée à la fois simple à déployer, facile à gérer et exceptionnellement performante, tout ce que vous voulez. DataON, en tant que partenaire de solution, a excellé dans la fourniture d'une version clé en main, offrant du matériel conçu sur mesure avec des instructions claires qui est finalement vendu dans une configuration qui peut être opérationnelle en un rien de temps. Les clients peuvent même ignorer le câblage dans de nombreux cas, cela dépend donc vraiment du besoin spécifique. Dans les deux cas, cependant, Azure Stack HCI combiné à Intel Optane, aux SSD Intel NVMe et au réseau Mellanox 100G s'est avéré être une force avec laquelle il faut compter.

Solutions DataON HCI

Discutez de cet avis

Inscrivez-vous à la newsletter StorageReview