Le déploiement et la gestion continue des ressources informatiques dans les petits bureaux et les environnements de bureaux distants/succursales (ROBO) ont toujours été problématiques, avec de nombreux facteurs différents et concurrents en jeu. De nombreuses entreprises, ainsi que des petites et moyennes entreprises (PME), dépendent des systèmes ROBO HCI pour gérer les transactions critiques quotidiennes qui sont la pierre angulaire de ces organisations. Ces systèmes doivent être peu coûteux mais performants, offrir une redondance tout en ayant le moins de composants possible, et être bien entretenus sans disposer de ressources informatiques et de personnel coûteux dédiés à chaque site.
avec les solutions Dell EMC pour Microsoft Azure Stack HCI
Le déploiement et la gestion continue des ressources informatiques dans les petits bureaux et les environnements de bureaux distants/succursales (ROBO) ont toujours été problématiques, avec de nombreux facteurs différents et concurrents en jeu. De nombreuses entreprises, ainsi que des petites et moyennes entreprises (PME), dépendent des systèmes ROBO HCI pour gérer les transactions critiques quotidiennes qui sont la pierre angulaire de ces organisations. Ces systèmes doivent être peu coûteux mais performants, offrir une redondance tout en ayant le moins de composants possible, et être bien entretenus sans disposer de ressources informatiques et de personnel coûteux dédiés à chaque site.
Heureusement, les fournisseurs informatiques ont reconnu les défis uniques des systèmes ROBO et ont proposé des solutions pour les relever. Dans cet article, nous verrons comment le matériel Dell Technologies exécutant des logiciels Microsoft relève ces défis. Notre approche sera un peu différente de celle de nos articles réguliers où nous nous concentrons habituellement sur les performances du système. Bien que nous effectuions des tests de performances sur le système, nous examinerons également l'ensemble de son cycle de vie, en commençant par son dimensionnement initial.
Présentation du ROBO HCI
Le système que nous allons étudier dans cet article est un Solutions Dell EMC pour Microsoft Azure Stack HCI cluster avec 2 nœuds AX exécutant Windows Server 2019 (2NC). Plus tôt cette année, Dell Technologies a lancé des nœuds AX spécialement conçus (avec validation et certification) pour exécuter Azure Stack HCI. Dell Technologies propose actuellement trois types de nœuds différents dans son catalogue de solutions : AX-640, AX-740xd et AX-6515. Chacun de ces modèles offre aux clients la possibilité de concevoir la plate-forme idéale pour leurs déploiements ROBO HCI grâce à une configuration avec différents composants.
Les nœuds AX-640 et AX-740xd sont des nœuds à double socket qui utilisent des processeurs Intel Xeon Scalable de deuxième génération, tandis que l'AX-6515 est un nœud à socket unique qui exécute un processeur AMD EPYC Gen 64 à 2 cœurs. Les modèles AX de Dell EMC permettent aux clients de choisir les nœuds les mieux adaptés à leur cas d'utilisation. L'AX-640 est conçu pour les charges de travail à densité de calcul, l'AX-740xd pour les charges de travail à capacité de stockage élevée et l'AX-6515 pour les utilisateurs qui ont besoin d'un système optimisé et d'une diversification des processeurs dans leurs centres de données d'entreprise.
Le système que nous allons examiner de plus près dans cet article est l'AX-640, un nœud 1U à double socket qui prend en charge 96 à 768 Go de RAM. Il peut être configuré avec 3 à 92 To de stockage NVMe, SSD et/ou HDD pour créer un stockage hybride ou 640 % flash. Il s'agit actuellement du seul nœud du portefeuille AX qui prend en charge les périphériques Intel Optane Persistent Memory et SSD ultra hautes performances. Lorsqu'il est correctement configuré, le nœud AX-XNUMX est un concurrent sérieux pour le titre de nœud HCI le plus rapide disponible dans le commerce. Dell Technologies propose un joli tableau qui décrit ses options de configuration Azure Stack HCI pour ses nœuds AX.
Le nœud AX-640 que nous utiliserons dans cet article était équipé de deux processeurs Intel Xeon 6230, de 384 Go de mémoire DDR4, ainsi que de dix SSD NVMe de 4 To.
Disposer d'un matériel fiable et performant n'est que la moitié de l'histoire lors du déploiement d'une solution ROBO HCI ; l'autre moitié est le logiciel. Dans ce cas, nous exécuterons un système validé Azure Stack HCI. Azure Stack HCI permet aux clients d'exécuter un système d'exploitation Windows Server avec l'avantage supplémentaire de se connecter de manière transparente au cloud Azure pour des services supplémentaires (tels que les sauvegardes et la reprise après sinistre) via le Centre d'administration Microsoft Windows. Les services Azure sont intégrés via des extensions WAC à partir du même plan de gestion.
Azure Stack HCI utilise Hyper-V pour son hyperviseur et Storage Spaces Direct pour son stockage local. L'utilisation d'un 2NC pour les déploiements ROBO HCI peut réduire considérablement le coût de mise en œuvre. Pour les implémentations extrêmement soucieuses des coûts, il peut être configuré pour fonctionner dans une configuration 2NC sans commutateur dans une configuration à liaison simple ou double pour sa structure de stockage. Pour les implémentations commutées, un réseau 10GbE fonctionnera. Dell Technologies recommande un réseau de stockage 25GbE car il ne coûtera pas beaucoup plus cher que le réseau 10GbE.
De toute évidence, réduire l'investissement qu'une entreprise fait dans l'équipement est un non-démarrage si le système n'est pas résilient. Sur une base par système, Storage Spaces Direct prend en charge la mise en miroir bidirectionnelle et tridirectionnelle et le codage d'effacement à parité simple et double. Microsoft a fait un bon travail en documentant l'efficacité du stockage, ainsi que les avantages généraux et les compromis de ces différents systèmes de protection. Nous vous recommandons de le lire pour décider quel schéma serait le mieux adapté à votre environnement. La mise en miroir est généralement la plus performante, c'est ce que nous avons utilisé dans nos tests.
Azure Stack HCI peut utiliser la mise en miroir bidirectionnelle imbriquée ou la parité accélérée par miroir imbriqué comme une option de résilience. Le premier offre de meilleures performances, et le second permet une plus grande efficacité des données. La mise en miroir bidirectionnelle imbriquée crée une copie RAID 1 des données sur l'hôte et sur l'autre nœud. La parité accélérée par miroir imbriqué fait une copie des données sur chaque serveur mais utilise un codage d'effacement, plutôt que RAID 1, pour la résilience des données (sauf pour les écritures récentes qui utilisent la mise en miroir bidirectionnelle pour assurer la fiabilité). La mise en miroir bidirectionnelle imbriquée a un taux d'efficacité des données de 25 % car quatre copies des données sont écrites sur le disque ; en comparaison, la parité accélérée par miroir imbriqué a un taux d'efficacité des données de 33 % à 40 %.
Les deux schémas sont capables de prendre en charge simultanément une panne de disque et une panne de serveur.
Aucun des schémas de résilience imbriqués ne nécessite de matériel RAID spécial.
La topologie Microsoft 2NC nécessite un témoin qui agit en tant que tiers neutre pour ajouter un vote au nœud survivant afin d'éviter un scénario de « cerveau partagé ». Vous pouvez soit utiliser un partage de fichiers (que nous avons utilisé dans nos tests), soit le cloud Azure comme témoin. Microsoft recommande ce dernier si les deux nœuds du cluster disposent d'une connexion Internet fiable. Le témoin cloud Azure est un objet de stockage d'objets blob tandis que le partage de fichiers est un partage de fichiers SMB. Le témoin ne contient que le fichier journal du témoin.
Approvisionnement et déploiement ROBO HCI
Comme promis, nous voulions jeter un regard holistique sur ce qu'il faut pour se procurer, déployer et gérer un cluster de nœuds AX dans une situation ROBO.
La première étape lors du déploiement d'un nouveau système consiste à le dimensionner. Dell Technologies facilite le calcul de l'équipement qui sera requis pour le déploiement avec Live Optics, un outil en ligne gratuit utilisé pour collecter des données sur le stockage, la protection des données, le serveur et les systèmes de fichiers d'un environnement. Bien qu'il soit capable d'obtenir des informations sur votre environnement seulement 24 heures après le déploiement, plus vous laissez Live Optics fonctionner longtemps, plus il comprendra les caractéristiques des charges de travail que vous exécutez. Live Optics peut collecter des données à partir de serveurs Microsoft Windows, VMware vCenter ou Linux/Unix.
Le tableau de bord Live Optics présentera des données collectées compilées à partir de l'utilisation du processeur, de la mémoire et du stockage de l'ensemble de votre environnement, qui vous fourniront toutes une image précise du type de système dont vous aurez besoin dans votre environnement. Vous pouvez également partager ces données avec d'autres utilisateurs (c'est-à-dire des collègues, des revendeurs à valeur ajoutée, etc.) si vous souhaitez qu'ils fassent des recommandations de dimensionnement.
Les données collectées à partir de Live Optics sont utilisées dans l'outil de dimensionnement Azure Stack HCI disponible via l'équipe de compte Dell Technologies. L'outil de dimensionnement intègre toutes les meilleures pratiques d'ingénierie pour produire des options de configuration non seulement pour vos besoins actuels, mais aussi pour prendre en compte votre croissance future.
L'un des problèmes avec les environnements ROBO est de trouver des talents informatiques locaux pour les installer et les configurer. Une façon d'y parvenir consiste à utiliser les services Dell EMC ProDeploy. Cette option aide les organisations à accélérer le déploiement sur des sites distants, ce qui signifie qu'ils sont en ligne et qu'ils ajoutent de la valeur immédiatement. Sinon, si vous disposez de ressources locales et que vous souhaitez les déployer vous-même, Dell propose une documentation et des scripts pour vous guider tout au long du processus.
L'un des plus grands maux de tête pour toute organisation est de prendre en charge un système. Une grande partie des tracas liés à la prise en charge de systèmes complexes est due aux multiples fournisseurs de matériel et de logiciels impliqués. Par exemple, vous pouvez avoir un fournisseur qui fournit les serveurs et le stockage, un autre qui fournit les commutateurs réseau et un troisième qui fournit le système d'exploitation. Dell EMC ProSupport a contribué à rationaliser ce processus en disposant d'un personnel de support dédié pour leurs solutions HCI. Ces ingénieurs de support sont formés et connaissent à la fois le matériel et les logiciels d'un système Dell Azure Stack HCI et, si nécessaire, ils connaissent les bonnes personnes à qui faire remonter les problèmes.
Nous avons eu l'occasion d'utiliser le personnel d'assistance dédié Dell Technologies HCI lorsque nous avons mal configuré notre système en l'installant par inadvertance. L'ingénieur de support avec lequel nous avons travaillé était très compétent et a pu nous aider à démêler le gâchis dans lequel nous nous sommes plongés.
Gestion quotidienne des nœuds AX
Dans le monde parfait, les déploiements ROBO HCI ne nécessiteraient aucune gestion. Ce n'est cependant pas la réalité et Dell Technologies et Microsoft ont la meilleure option suivante. Lorsque les systèmes sont situés dans un endroit éloigné avec peu ou pas de support informatique local, il est important de disposer des outils nécessaires à la maintenance du système. Pour ce faire, Dell Technologies utilise Windows Admin Center (WAC) avec certaines extensions adaptées à leur propre adresse IP, Dell EMC OpenManage Integration for Windows Admin Center.
WAC est un outil de plate-forme de gestion basé sur un navigateur pour gérer Windows 10 et Windows Server. Il est installé sur un système client et utilise à distance PowerShell et Windows Management Instrumentation (WMI) sur Windows Remote Management (WinRM) pour surveiller et gérer les systèmes Windows ainsi que les clusters Azure Stack HCI.
Le volet de présentation de WAC donne un résumé de l'utilisation des ressources d'un système et des outils de gestion des certificats et des périphériques d'un système. WAC vous permet également d'afficher les événements et les processus, d'installer des rôles et des fonctionnalités, et de gérer les utilisateurs et groupes locaux, les pare-feu, les services et le stockage.
Dell Technologies a tiré parti de l'extensibilité de WAC et a créé Dell EMC OpenManage Integration with Microsoft Windows Admin Center (OMIMSWAC). Cela a été conçu pour faciliter et simplifier le processus de surveillance et d'inventaire approfondis du matériel et d'orchestration des mises à jour du BIOS, du micrologiciel et des pilotes. OMIMSWAC utilise la fonctionnalité de mise à jour adaptée aux clusters de Windows Server 2019 pour mettre à jour les nœuds AX et le cluster Azure Stack HCI. Pour lancer OMIMSWAC, cliquez sur Intégration Dell EMC OpenManage situé sur la barre de ruban de WAC.
Nous avons ajouté OMIMSWAC à notre système en lançant WAC, en cliquant sur Paramètres et alors Extensions entrant Dell EMC dans la zone de texte de recherche, en sélectionnant Intégration Dell EMC Open Manage, puis en cliquant Installer.
En utilisant OMIMSWAC pour examiner notre cluster, nous avons pu voir la santé du système et plonger suffisamment profondément dans le matériel pour voir un inventaire de ses composants et le micrologiciel qu'ils utilisaient.
Vous pouvez même utiliser OMIMSWAC pour lancer la console iDRAC pour la gestion hors bande des nœuds AX.
Une fois que vous avez découvert le cluster, vous pouvez utiliser OMIMSWAC pour afficher un rapport de conformité pour les nœuds au niveau du cluster. Si le système sur lequel OMIMSWAC s'exécute dispose d'une connexion Internet, il télécharge automatiquement les utilitaires Dell EMC System Update (DSU) et Dell EMC Inventory Collector (IC) à partir de downloads.dell.com pour exécuter la conformité et mettre à jour le ou les nœuds cibles si DSU et IC ne sont pas configurés dans les paramètres.
OMIMSWAC brille vraiment dans l'accomplissement des tâches de routine, telles que les mises à jour. Non seulement OMIMSWAC téléchargera automatiquement les packages de mise à jour Dell (DUP) nécessaires, mais il effectuera également une mise à jour continue d'un cluster pour éliminer les temps d'arrêt.
Test de nœud AX
Lorsque nous avons examiné le cluster HCI à 2 nœuds Dell EMC, nous avons voulu examiner à la fois ses performances et la disponibilité des applications à travers différents scénarios de panne. À cette fin, nous avons configuré un test de performances SQL Server comprenant jusqu'à 8 machines virtuelles SQL Server 2019 exécutant Windows Server 2019 équilibrées sur notre cluster à 2 nœuds. Chaque instance de SQL Server a ensuite reçu une base de données TPC-C à l'échelle 1,500 350 où la base de données et les fichiers journaux équivalaient à 1.4 Go de capacité par instance. Cela nous a donné une empreinte de stockage de base de données allant de 4 To avec 2.8 VM à 8 To avec 15,000 VM. Nous avons utilisé Benchmark Factory de Quest comme générateur de charge de travail pour ce projet, avec XNUMX XNUMX utilisateurs virtuels interagissant avec chaque machine virtuelle.
Chaque machine virtuelle s'est vu attribuer 8 processeurs virtuels et 60 Go de RAM ainsi que son empreinte de stockage. Notre cluster étant configuré avec 384 Go de RAM par hôte, dans notre scénario de nœud défaillant, nous avons réduit l'allocation de RAM VM à 40 Go pour adapter les 8 machines virtuelles sur un seul hôte.
Nos quatre scénarios de test de base de données étaient :
- Cluster de travail : 8 VM au total, 4 VM par nœud
- 1 SSD a échoué sur un nœud : 8 VM au total, 4 VM par nœud
- Échec d'un nœud : 8 VM au total, 8 VM par nœud
Lors de notre premier test mesurant les performances de 8 VM, 4 sur chaque nœud, la latence mesurée était de 5 ms en moyenne.
Bien que des performances élevées et une faible latence de la base de données soient excellentes, il est tout aussi important de savoir comment une plate-forme fonctionne dans des conditions moins qu'optimales. Notre premier scénario couvrait comment la plate-forme réagirait à un SSD défaillant. Nous avons lancé la charge de travail et juste après qu'elle se soit stabilisée, nous avons retiré un seul SSD d'un nœud. Dans cette situation, les performances ont légèrement ralenti à 6.5 ms contre 5 ms dans des conditions normales.
Notre deuxième scénario couvrait comment le cluster fonctionnerait si un nœud était hors ligne pour maintenance ou comment les choses fonctionneraient si l'un d'entre eux échouait. Dans les deux conditions, tout revient à un seul nœud, bien qu'il y ait un avantage subtil à ce qu'aucun trafic ne passe sur le réseau principal. Dans cette situation, nous avons mesuré une latence moyenne de 5.875 ms.
Réflexions finales
Nous constatons de plus en plus d'intérêt pour les 2NC pour les applications ROBO. Les entreprises recherchent des systèmes à un prix raisonnable, solides comme le roc et qui ne nécessitent qu'un minimum d'interaction avec le personnel informatique, car leur accès peut être problématique. Les solutions Dell EMC pour Azure Stack HCI vérifient toutes ces exigences.
Nous avons examiné ce qu'il faudrait pour dimensionner, acquérir et configurer correctement un système 2NC ROBO HCI. Nous avons été impressionnés par la simplicité avec Dell Technologies. Après avoir examiné la configuration initiale du système, nous avons ensuite examiné ce qui serait nécessaire pour maintenir le système et nous avons une fois de plus été impressionnés par la facilité avec laquelle WAC a rendu ce processus. Ce qui nous a vraiment époustouflés, cependant, c'est l'intégration de Dell Technologies OMIMSWAC, car elle a effectué une mise à niveau continue de notre système, couvrant tout, du micrologiciel jusqu'à, avec peu d'interaction de l'opérateur. Il s'agit d'un différenciateur fondamental pour Dell Technologies, car cette profondeur d'intégration est unique pour les fournisseurs Azure Stack HCI.
Lorsque nous avons exécuté nos tests de performance sur le système, nous avons trouvé de solides performances de charge de travail d'application dans des conditions optimales. Nos charges de travail SQL Server TPC-C mesuraient 2.25 ms sur quatre machines virtuelles à l'échelle de 1,500 5 réparties uniformément sur le cluster et 8 ms lorsque cette charge de travail était portée à huit machines virtuelles. Ce qui était encore plus impressionnant, cependant, était la performance du cluster avec un SSD défaillant ou un seul nœud opérationnel. Dans le premier scénario d'un SSD défaillant, notre charge de travail de 5 VM est passée de 6.5 à 5.875 ms de latence. Avec un nœud complètement hors ligne, la latence a à peine atteint XNUMX ms.
Pour résumer nos tests sur ce système, nous avons constaté qu'il pouvait facilement gérer la charge que les déploiements ROBO lui imposeraient. C'est important; ces types de déploiements devraient se soucier beaucoup moins des capacités de performance d'un système comme celui-ci et davantage des opérations à long terme. Pour le premier point, Dell Technologies a conçu ces nœuds AX à un niveau où les performances sont largement hors de propos. Tous nos tests confirment que même les charges de travail SQL Server agressives ont été absorbées sans problème.
Si les performances sont efficacement résolues pour les cas d'utilisation de ROBO HCI, les organisations doivent alors se tourner vers les opérations du jour 2. Ici, les nœuds Dell EMC AX commencent vraiment à s'éloigner, l'intégration avec WAC pour les mises à jour de cluster est essentielle du point de vue de la gestion continue. Dell Technologies est un leader incontesté sur ce front en ce qui concerne Azure Stack HCI. Enfin, les organisations devraient se pencher sur la résilience du système. Avec seulement deux nœuds et, dans de nombreux cas, sans assistance immédiate sur site, la disponibilité est essentielle pour l'entreprise. Lors de nos tests de plusieurs états dégradés, les nœuds AX ont fonctionné sans interruption, ce qui signifie que le bureau restera en ligne sans que les performances des applications ne soient affectées. Il existe plusieurs façons de déployer Azure Stack HCI, mais il n'existe pas de solution plus complète que celle que Dell Technologies propose avec les nœuds AX.
Solutions Dell EMC Azure Stack HCI
Ce rapport est parrainé par Dell Technologies. Tous les points de vue et opinions exprimés dans ce rapport sont basés sur notre vision impartiale du ou des produits à l'étude.