Casa Consumatori Tiering negli ambienti di archiviazione RAID

Tiering negli ambienti di archiviazione RAID

by Autore ospite

Con l'avvento della tecnologia dei dischi a stato solido, la riduzione dei costi della memoria volatile ad alta velocità, il basso costo di SATA e l'affidabilità di SAS, l'organizzazione ottimale e l'integrazione delle nuove tecnologie di storage sono diventate più difficili. Esistono opportunità per collocare i dati “caldi” a cui si accede di frequente su supporti più veloci e a latenza più bassa, lasciando invece i dati a cui si accede raramente su supporti a latenza più elevata e a costo inferiore. 

 


 

Di Kimberly Robinson, Ingegnere delle prestazioni, LSI Corporation

Con l'avvento della tecnologia dei dischi a stato solido, la riduzione dei costi della memoria volatile ad alta velocità, il basso costo di SATA e l'affidabilità di SAS, l'organizzazione ottimale e l'integrazione delle nuove tecnologie di storage sono diventate più difficili. Esistono opportunità per collocare i dati “caldi” a cui si accede di frequente su supporti più veloci e a latenza più bassa, lasciando invece i dati a cui si accede raramente su supporti a latenza più elevata e a costo inferiore.

Con tutte queste scelte a disposizione dei professionisti dello storage IT, esiste un'enorme opportunità di utilizzare in modo innovativo i parametri di costi, prestazioni e capacità per determinare la posizione ideale per i dati degli utenti. In questo articolo verrà illustrato come il tiering dello storage può migliorare significativamente le prestazioni e l'affidabilità negli ambienti di storage misti, integrando e migliorando la cache del sistema operativo host e ottimizzando al tempo stesso i costi.

I server di oggi forniscono molte funzioni diverse e, sebbene possiamo fare generalizzazioni, ciascuna applicazione produce le proprie caratteristiche uniche di carico di lavoro. Inoltre, le esigenze prestazionali dipendono dal caricamento corrente e da eventuali requisiti QOS. Sebbene gli ambienti di storage dispongano di più opzioni che mai, consentendo una migliore personalizzazione, allo stesso tempo aggiungono maggiore complessità e rendono più difficile la pianificazione della capacità delle prestazioni di storage. La pianificazione della capacità prestazionale richiede la conoscenza delle caratteristiche I/O delle applicazioni, dei requisiti di crescita di capacità e prestazioni, delle caratteristiche prestazionali del disco e dello storage, delle esigenze di protezione dei dati e del budget aziendale.

Più opzioni = più controllo

I moderni controller di archiviazione dispongono di una vasta gamma di opzioni: tipi RAID nuovi e compositi, funzionalità premium, opzioni cache avanzate e varianti di offload hardware per soddisfare ogni budget. Gli avanzati processori embedded di oggi hanno reso i controller di storage intelligenti ancora più capaci, consentendo loro di estendere le proprie capacità e trasformarsi man mano che emergono nuove tecnologie.  

Le tecnologie dei dischi non fanno eccezione al boom di nuove opzioni. Serial attached SCSI (SAS) è stato progettato per integrare sia SATA che SAS in modo che entrambe le interfacce possano essere combinate per creare un backend di archiviazione personalizzato in base alle esigenze individuali di costi e prestazioni. La popolarità di SATA risiede principalmente nel suo eccellente costo per capacità, tuttavia dal punto di vista delle prestazioni fornisce le prestazioni complessive più basse. SAS offre prestazioni significativamente più elevate e maggiore affidabilità, ma a un costo più elevato. Un'altra opzione sono le tecnologie Solid State Disk (SSD) disponibili sia con interfaccia SATA che SAS. Gli SSD forniscono prestazioni casuali sorprendentemente più elevate rispetto ai supporti rotanti, ma a un prezzo più elevato.

Ad aumentare la complessità ci sono i risultati prestazionali per diversi tipi di RAID. L'ottimizzazione del carico di lavoro richiede la comprensione delle caratteristiche I/O specifiche e la conoscenza di come mapparle nel tipo RAID ideale in base alle proprie esigenze di disponibilità.

Se ci concentriamo su RAID 10, puoi vedere chiaramente che alcuni tipi di disco sono più adatti per diverse applicazioni, con gli SSD che costano in media circa 6.5 ​​volte di più rispetto alle unità SAS da 15 Gb da 6 RPM. Tuttavia, non tutte le applicazioni forniscono un aumento di 6.5 volte delle prestazioni effettive nel mondo reale.

Ogni professionista IT probabilmente prima o poi si è posto la domanda: "quanti dischi rotanti sono necessari per offrire le stesse prestazioni di un SSD ad alte prestazioni?" È un ottimo processo di riflessione, tuttavia nel mondo reale è probabile che in un dato momento si accederà solo a una parte della capacità di archiviazione effettiva. Da decenni le architetture della cache vengono progettate con successo sulla base di questo presupposto. E se potessi creare il tuo storage utilizzando diversi supporti di storage con caratteristiche di costo e prestazioni diverse?

Sta diventando troppo difficile

I fornitori di storage riconoscono che, data la prevalenza di architetture multimediali non uniformi, il tiering offre il meglio di tutti i mondi. Il tiering dello storage è un concetto semplice; posizionare i dati utilizzati più frequentemente sui supporti più veloci disponibili, lasciando i dati freddi sui supporti più lenti. Il tiering è diverso dalla memorizzazione nella cache in quanto la capacità di tutti i dischi logici partecipanti può essere utilizzata per l'archiviazione dei dati utente. Anche se questo non è un concetto nuovo, tradizionalmente non fa parte dell’intelligenza dello storage, ma la tecnologia dirompente degli SSD ha creato nuove opportunità.  

Diamo un'occhiata a un esempio di come il tiering dello storage potrebbe essere utile in un ambiente di database. La società ACME sta progettando un nuovo SQL Server e, in base alla propria esperienza passata, conosce le seguenti informazioni.

 

  • 4 terabyte di spazio di archiviazione
  • Il 3% è caldo (~ 125 GB) e vi si accede il 65% delle volte.
  • Al 6% si accede in modo intermittente (~ 250 GB) il 25% delle volte
  • Il resto sono dati freddi a cui si accede il 10% delle volte.
  • L'accesso al database ha dimensioni di 8KB, con un rapporto di lettura/scrittura di circa 2:1.
  • Sono disponibili otto slot per i dischi.

 
Una soluzione ideale in termini di costi che ci porti a 4 TB sarebbe quella di creare un dispositivo logico che fornisca la soluzione prestazionale richiesta per ogni livello di dati, sia in termini di I/O al secondo che di tempi di risposta.

Consideriamo le alternative del disco omogeneo.

Di seguito è riportato un confronto riepilogativo delle tre opzioni di infrastruttura di storage. Chiaramente, l'opzione a più livelli non solo fornisce un costo inferiore per transazione di database, ma produce oltre sei volte più capacità IOP rispetto a una soluzione solo SATA e più di tre volte rispetto alla soluzione SAS pura, con maggiore capacità rispetto alle altre proposte.

Molte soluzioni possono essere realizzate in base a prestazioni, costi, capacità o limitazioni immobiliari. Questo è solo un esempio che evidenzia chiaramente i vantaggi in termini di costi di una soluzione a più livelli. Naturalmente questo potrebbe essere fatto manualmente, presupponendo che: si sappia già esattamente quali file verranno maggiormente utilizzati; avere la capacità di separarli fisicamente su supporti diversi; e i dati caldi non sono transitori o dinamici.

Pro e contro del tiering dello storage

Il tiering dello storage offre il meglio di tutti i mondi. Sfruttando più tipi di media, è possibile ottimizzare costi e prestazioni e risparmiare spazio sui server precedenti. Considera questo: per ottenere lo stesso numero di IOP del database possibile nell'esempio del tiering sarebbero necessarie oltre cinquanta unità SATA, aumentando significativamente i requisiti di alimentazione e spazio su rack. Il tiering intelligente può consentire un ambiente dinamico in cui i dati a cui si accede di frequente vengono inseriti continuamente e automaticamente sui supporti più veloci. Potrebbero anche esistere possibilità in cui i dati più critici possono essere collocati su volumi ad alta disponibilità o i dati a cui accedono siti geograficamente distanti possono essere copiati in strutture di archiviazione locali.

Nonostante i vantaggi della suddivisione in livelli, ci sono alcuni inconvenienti da considerare. Sebbene il lavoro di identificazione e archiviazione corretta dei dati importanti venga eseguito automaticamente, la creazione di un sottosistema di archiviazione adeguato che soddisfi i requisiti attuali e crescenti dovrebbe comunque essere progettato su misura da un professionista dell'archiviazione. Un altro potenziale svantaggio è che in un modello di suddivisione dello storage, sebbene il volume logico venga visualizzato come un disco singolo, il volume potrebbe essere suddiviso su più gruppi di dischi fisici. Utilizzando la protezione RAID hardware, è possibile ridurre la possibilità di perdita di dati.

Siamo nell’era della tempesta tecnologica perfetta: esigenze di capacità di archiviazione in drammatico aumento, più opzioni disco che mai, richieste di prestazioni più elevate derivanti dalla crescente popolarità delle transazioni commerciali digitali, crescente densità di elaborazione e la necessità di una maggiore protezione dei nostri più risorsa preziosa, dati. Il tiering ti consente di sfruttare i bassi costi di storage SATA, la sicurezza e l'affidabilità dei SAS aziendali e le prestazioni elevate degli SSD, tutto in un unico pacchetto.

Kimberly Robinson lavora come ingegnere delle prestazioni per della LSI Corporation Divisione Stoccaggio Engenio. Da oltre dieci anni lavora all'ottimizzazione delle soluzioni di storage aziendale per i principali OEM.

Discuti questa storia