Avec l'avènement de la technologie des disques à semi-conducteurs, la réduction des coûts de la mémoire volatile à grande vitesse, le faible coût du SATA et la fiabilité du SAS, l'organisation et l'intégration optimales des nouvelles technologies de stockage sont devenues plus difficiles. Il existe des opportunités de placer les données « chaudes » fréquemment consultées sur des supports à faible latence et plus rapides, tout en laissant les données rarement consultées sur des supports à latence plus élevée et à moindre coût.
Par Kimberly Robinson, ingénieur des performances, Société LSI
Avec l'avènement de la technologie des disques à semi-conducteurs, la réduction des coûts de la mémoire volatile à grande vitesse, le faible coût du SATA et la fiabilité du SAS, l'organisation et l'intégration optimales des nouvelles technologies de stockage sont devenues plus difficiles. Il existe des opportunités de placer les données « chaudes » fréquemment consultées sur des supports à faible latence et plus rapides, tout en laissant les données rarement consultées sur des supports à latence plus élevée et à moindre coût.
Avec tous ces choix disponibles pour les professionnels du stockage informatique, il existe une énorme opportunité d'utiliser de manière innovante les mesures de coût, de performance et de capacité pour déterminer l'emplacement idéal pour les données des utilisateurs. Cet article explique comment la hiérarchisation du stockage peut améliorer considérablement les performances et la fiabilité dans les environnements de stockage mixtes, en complétant et en améliorant le cache du système d'exploitation hôte, tout en optimisant les coûts.
Les serveurs d'aujourd'hui fournissent de nombreuses fonctions différentes, et bien que nous puissions faire des généralisations, chaque application produit sa propre caractéristique de charge de travail unique. De plus, les besoins en performances dépendent de la charge actuelle et de toute exigence QOS. Alors que les environnements de stockage ont plus d'options que jamais auparavant, permettant une meilleure personnalisation, ils ajoutent en même temps plus de complexité et rendent la planification de la capacité de performance de stockage plus difficile. La planification de la capacité de performance nécessite une connaissance des caractéristiques d'E/S des applications, des exigences de croissance de la capacité et des performances, des caractéristiques de performance du disque et du stockage, des besoins de protection des données et du budget de l'entreprise.
Plus d'options = Plus de contrôle
Les contrôleurs de stockage modernes offrent une pléthore d'options : des types RAID nouveaux et composés, des fonctionnalités premium, des options de cache avancées et des variantes de déchargement matériel adaptées à tous les budgets. Les processeurs embarqués avancés d'aujourd'hui ont rendu les contrôleurs de stockage intelligents encore plus performants, leur permettant d'étendre leurs capacités et de se transformer à mesure que de nouvelles technologies émergent.
Les technologies de disque ne font pas exception au boom des nouvelles options. Serial Attached SCSI (SAS) a été conçu pour intégrer à la fois SATA et SAS afin que les deux interfaces puissent être combinées pour créer un backend de stockage personnalisé en fonction des besoins individuels en matière de coût et de performances. La popularité de SATA réside principalement dans son excellent indicateur de coût par capacité, mais du point de vue des performances, il offre les performances globales les plus faibles. SAS offre des performances nettement supérieures et une fiabilité améliorée, mais à un coût plus élevé. Une autre option est les technologies Solid State Disk (SSD) qui viennent dans les interfaces SATA et SAS. Les SSD offrent des performances aléatoires étonnamment supérieures à celles des supports rotatifs, mais à un prix plus élevé.
Les performances des différents types de RAID ajoutent à la complexité. L'optimisation de votre charge de travail nécessite de comprendre vos caractéristiques d'E/S spécifiques et de savoir comment les mapper dans le type de RAID idéal en fonction de vos besoins de disponibilité.
Si nous nous concentrons sur RAID 10, vous pouvez voir clairement que certains types de disques sont mieux adaptés à différentes applications, les SSD coûtant en moyenne environ 6.5 fois plus que les disques SAS 15K RPM 6Gb. Pourtant, toutes les applications ne fournissent pas une augmentation de 6.5 fois des performances réelles réelles.
Chaque professionnel de l'informatique s'est probablement, à un moment ou à un autre, posé la question : "Combien de disques rotatifs faut-il pour offrir les mêmes performances qu'un SSD hautes performances ?" C'est un excellent processus de réflexion, mais dans le monde réel, il est probable que seule une partie de la capacité de stockage réelle sera accessible à un moment donné. Les architectures de cache ont été conçues avec succès sur la base de cette hypothèse pendant des décennies. Et si vous pouviez construire votre stockage à partir de différents supports de stockage avec des caractéristiques de coût et de performance différentes ?
Ça devient trop dur
Les fournisseurs de stockage reconnaissent qu'avec la prévalence d'architectures multimédias non uniformes, cette hiérarchisation offre le meilleur de tous les mondes. La hiérarchisation du stockage est un concept simple ; placez les données les plus fréquemment utilisées sur les supports disponibles les plus rapides, tout en laissant les données froides sur des supports plus lents. La hiérarchisation est différente de la mise en cache dans la mesure où la capacité de tous les disques logiques participants peut être utilisée pour le stockage des données utilisateur. Bien qu'il ne s'agisse pas d'un nouveau concept, il ne fait traditionnellement pas partie de l'intelligence du stockage, mais la technologie perturbatrice du SSD a créé de nouvelles opportunités.
Examinons un exemple de la façon dont la hiérarchisation du stockage peut aider dans un environnement de base de données. La société ACME est en train de concevoir un nouveau serveur SQL et, sur la base de son expérience passée, elle connaît les informations suivantes.
- 4 téraoctets de stockage
- 3 % est chaud (~ 125 Go) et accessible 65 % du temps.
- 6 % sont consultés par intermittence (~250 Go) 25 % du temps
- Le sum-rest est constitué de données froides consultées 10 % du temps.
- La base de données est accessible dans des tailles de 8 Ko, avec un rapport lecture/écriture d'environ 2:1.
- Huit emplacements sont disponibles pour les disques.
Une solution idéale sensible aux coûts qui nous amène à 4 To serait de créer un périphérique logique qui fournit la solution de performance requise pour chaque niveau de données, à la fois en termes d'E/S par seconde et de temps de réponse.
Considérons les alternatives de disques homogènes.
Vous trouverez ci-dessous une comparaison récapitulative des trois options d'infrastructure de stockage. De toute évidence, l'option à plusieurs niveaux offre non seulement un coût inférieur par transaction de base de données, mais produit plus de six fois plus de capacités d'IOP qu'une solution SATA uniquement, et plus de trois fois la solution SAS pure, avec plus de capacité que les autres propositions.
De nombreuses solutions peuvent être conçues en fonction des performances, du coût, de la capacité ou des limites de l'immobilier. Ce n'est qu'un exemple qui met clairement en évidence les avantages en termes de coûts d'une solution à plusieurs niveaux. Bien sûr, cela peut être fait manuellement, en supposant que : vous savez déjà exactement quels fichiers seront très utilisés ; avoir la capacité de les séparer physiquement sur différents supports ; et les données chaudes ne sont ni transitoires ni dynamiques.
Avantages et inconvénients de la hiérarchisation du stockage
La hiérarchisation du stockage offre le meilleur de tous les mondes. En tirant parti de plusieurs types de supports, les coûts et les performances peuvent être optimisés et l'espace de serveur précédent peut être économisé. Considérez ceci : pour obtenir le même nombre d'IOP de base de données possible dans l'exemple de hiérarchisation, il faudrait plus de cinquante disques SATA, ce qui augmenterait considérablement les besoins en puissance et en espace de rack. La hiérarchisation intelligente peut permettre un environnement dynamique dans lequel les données fréquemment consultées sont continuellement et automatiquement placées sur le support le plus rapide. Des possibilités peuvent même exister où les données les plus critiques peuvent être placées sur des volumes à haute disponibilité, ou les données accessibles par des sites géographiquement éloignés peuvent être copiées vers des installations de stockage locales.
Malgré les avantages de la hiérarchisation, il y a quelques inconvénients à prendre en compte. Bien que le travail d'identification et de stockage correct des données chaudes soit effectué automatiquement, la création d'un sous-système de stockage approprié qui répond à vos exigences actuelles et croissantes doit toujours être conçue sur mesure par un professionnel du stockage. Un autre inconvénient potentiel est que dans un modèle de hiérarchisation du stockage, bien que le volume logique apparaisse comme un seul disque, le volume peut être réparti sur plusieurs groupes de disques physiques. En utilisant la protection matérielle RAID, la possibilité de perte de données peut être réduite.
Nous sommes à l'ère d'une tempête technologique parfaite : augmentation spectaculaire des besoins en capacité de stockage, plus d'options de disque que jamais auparavant, exigences de performances plus élevées dues à la popularité croissante des transactions commerciales numériques, augmentation de la densité de traitement et nécessité d'une meilleure protection de nos plus atout précieux, les données. La hiérarchisation vous permet de profiter des coûts de stockage SATA à faible coût, de la sécurité et de la fiabilité des SAS d'entreprise et des hautes performances des SSD, le tout dans un seul ensemble.
Kimberly Robinson travaille comme ingénieur de performance pour LSI Corporation Division Stockage Engenio. Elle travaille depuis plus de dix ans sur l'optimisation des solutions de stockage d'entreprise pour les principaux équipementiers.