Negli ultimi anni si è discusso molto delle problematiche relative alle unità di avvio nello spazio hyperscale. Anche se gli hyperscaler non vogliono spendere troppo, hanno bisogno di una soglia prestazionale minima di base oltre alle altre specifiche necessarie.
Negli ultimi anni si è discusso molto delle problematiche relative alle unità di avvio nello spazio hyperscale. Anche se gli hyperscaler non vogliono spendere troppo, hanno bisogno di una soglia prestazionale minima di base oltre alle altre specifiche necessarie.
C’è anche la questione di chi continuerà effettivamente a produrre unità di avvio M.2 NVMe di piccola capacità, poiché i produttori di SSD aziendali sono per lo più usciti da questo spazio. Solidigm non ha un'unità di avvio M.2 moderna nel suo portafoglio di storage e le opzioni più moderne offerte da Samsung, KIOXIA e Micron hanno problemi di costi a causa della loro elevata capacità. Poi c’è la necessità di prestazioni. Anche se non eccezionale, un'unità di avvio deve comunque produrre in modo affidabile un risultato minimo.
Come puoi vedere nel grafico seguente, la capacità sia delle unità di avvio che di quelle dei dati è in continua crescita, il che significa maggiori spese per le organizzazioni.
Requisiti e ostacoli dell'unità di avvio NVMe iperscale
Al vertice OCP, questi problemi sono stati discussi durante una presentazione dei rappresentanti di Google e Meta e, soprattutto, di cosa stanno facendo per affrontarli.
È stato mostrato un esempio di un SSD di avvio iperscalabile che rappresenta l'attività per un giorno, che includeva letture e scritture di I/O, nonché transazioni TRIM. La cosa più evidente è l'elevata produttività dei TRIM, che dimostra dati di breve durata (creati e quindi eliminati subito dopo). Se non progettati correttamente, i TRIM porteranno a stalli di latenza e interferiranno con il traffico di lettura e scrittura. La maggior parte del traffico è costituita anche da letture e scritture casuali.
Alcuni ostacoli che l'avvio Hyperscale NVMe deve affrontare includono:
- In definitiva, i carichi di lavoro iperscalabili sono sensibili alla latenza, quindi prestazioni sostenute sono molto importanti per offrire un'esperienza utente efficiente.
- È anche difficile eseguire il debug su larga scala, quindi disporre di metriche di monitoraggio dettagliate è fondamentale sia per prevedere che per rilevare gli errori.
- La resistenza è molto importante per gli SSD di avvio. Dopo aver finalizzato il sistema (operazione che potrebbe richiedere del tempo), disporre di unità di avvio con elevata resistenza consentirà loro di durare quanto l'intero ciclo di vita del prodotto. Ciò contribuirà anche a eliminare la necessità di riparazioni e a prevenire l'usura precoce.
- Ancora più importante, i clienti iperscalabili attribuiscono grande importanza alla privacy e alla sicurezza e talvolta è difficile soddisfare tutti questi standard.
Si tratta di una gamma di problemi piuttosto diversificata, quindi affrontarli può essere un processo complicato se non eseguito correttamente.
Affrontare i problemi delle unità di avvio
Poiché è l’impulso e lo scopo principale dell’OCP, l’unico modo per risolvere questi problemi è attraverso la collaborazione e le specifiche aperte. Pertanto, Meta e Google hanno unito le forze per unire i requisiti e creare il Specifiche SSD di avvio NMEe iperscale (versione 1.0), segnando un traguardo importante per l'efficienza dell'unità di avvio. È stato presentato all'inizio di quest'anno ed è disponibile tramite il sito Web dell'OCP.
Ci sono molti vantaggi che derivano da queste specifiche. In definitiva, consente al mercato di comprendere meglio le funzionalità di cui gli hyperscaler hanno bisogno e che utilizzano per i loro dispositivi di avvio e garantisce che stiano ottenendo un allineamento del settore sull’adozione delle unità di avvio SSD. Inoltre, offre alle organizzazioni strumenti open source per gestire l'SSD di avvio, il che porta allo sviluppo di 3rdsuite di test di terze parti in grado di soddisfare tutti i requisiti.
Durante la sessione, hanno anche indicato che esistono due modi per avvicinarsi alla creazione di un SSD di avvio hyperscale. Effettua il downgrade di un SSD di classe enterprise o aggiorna un SSD di livello consumer, poiché i suoi requisiti si trovano da qualche parte nel mezzo di questi due spazi.
Banco per stivali
Abbiamo iniziato ad aggiungere una sezione sulle prestazioni del boot bench nelle nostre recensioni SSD, che è un profilo di carico di lavoro adottato da OCP per valutare gli SSD progettati per l'avvio del server. Questo carico di lavoro di avvio esegue un piano di test relativamente intenso che riempie interamente l'unità con scritture prima di testare una sequenza di carico di lavoro ad alta intensità di lettura.
Per ogni test, esegue un'operazione asincrona di lettura casuale da 32 KB insieme a una scrittura casuale sincrona da 15 KB da 128 MiB/s e un carico di lavoro in background di scrittura/ritaglio casuale sincrono da 5 KB da 128 MiB/s. Lo script inizia con l'attività di lettura casuale a livello di 4 lavori e arriva fino a 256 lavori al suo apice. Il risultato finale sono le operazioni di lettura eseguite durante l'esecuzione di punta.
L'obiettivo OCP per questo benchmark è un superamento/fallimento a 60 IOPS in lettura. La maggior parte delle unità che testiamo supererà di gran lunga il minimo, ma i risultati sono comunque istruttivi. Ciò che è stato più interessante nei nostri test è che siamo stati in grado di superare di gran lunga la soglia IOPS con i modelli SSD NVMe orientati alle prestazioni, ma non con gli SSD che passano più lentamente. Molti modelli SSD più lenti sembrano rientrare facilmente nella categoria non passante, anche se abbiamo riscontrato che un modello 970 EVO Plus da 2TB riporta una velocità più lenta non qualificante.
SSD | Leggi IOPS |
Skhynix Platino P41 | 220,884 IOPS |
WD SN850X | 219,883 IOPS |
Solidig P44 Pro | 211,999 IOPS |
FantasmaVENOM8 | 190,573 IOPS |
Samsung 990 Pro | 176,677 IOPS |
Sabrent Razzo 4 Plus | 162,230 IOPS |
Samsung 970 EVO Plus 2TB | 52,005 IOPS |
CorsairMP600GS | DNF |
Solidigm P41 Plus | DNF |
Esempio di caso d'uso del carico di lavoro su vasta scala
Durante la sessione, hanno anche confrontato due diverse unità: una più generica e una più conforme alle specifiche hyperscale OCP. Nel complesso, hanno scoperto che c'era un notevole miglioramento della latenza su tutta la linea con quest'ultima unità, che è qualcosa di molto importante per lo spazio iperscale.
Nel mondo reale, ciò significa che si verifica un notevole miglioramento nel time-to-market quando si tenta di implementare un'unità più in linea con le specifiche.
Andare avanti con il Specifiche dell'SSD di avvio NVMe iperscale OCP
Sebbene alcune aziende in precedenza creassero le proprie unità di avvio iperscalabili per soddisfare le proprie esigenze specifiche (e le richieste specifiche dei propri clienti), queste specifiche non erano condivise nel settore. Ciò ha comportato che i fornitori dovessero produrre il proprio hardware/firmware personalizzato per soddisfare le esigenze dei propri clienti.
Abbiamo fatto molta strada da allora, come ha fatto ora l’OCP versione 1.0 della specifica Hyperscale NVMe Boot SSD ufficialmente disponibile. Ciò consente ai produttori di sistemi e ai fornitori di SSD di allinearsi su una serie comune di requisiti, incoraggiando nel contempo un’ulteriore collaborazione.
OCP invita tutti gli OEM (ovvero i produttori di sistemi) e gli hyperscaler a unirsi alla causa e promette di continuare ad evolvere e migliorare le specifiche man mano che il panorama dello storage cambia.
Impatto sull'impresa
La necessità dell'unità di avvio non è limitata ai casi d'uso Hyperscale. M.2 è attualmente lo standard di unità di avvio di fatto per la maggior parte dei server e degli array di archiviazione. Anche se nella maggior parte dei casi l’unità non deve fare molto, deve essere affidabile, abbastanza performante e non più grande (più costosa) di quanto sia assolutamente necessario. Si spera di vedere i fornitori di storage rispondere a questa iniziativa con un SSD specifico per l'avvio affinché i fornitori di infrastrutture possano mantenere un certo grado di standardizzazione.
Interagisci con StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS feed