Casa Impresa Metodi di gestione dei dati SMR

Metodi di gestione dei dati SMR

by Adam Armstrong

SMR utilizza un sistema di mappatura per gli LBA che desiderano essere scritti in modo casuale per scriverli solo in sequenza. Similmente al Flash Translation Layer (FTL) degli SSD, gli HDD SMR utilizzano quello che a volte viene chiamato SMR (o Shingle) Translation Layer (STL), che è un concetto simile. Con SMR, tuttavia, si può ottenere molto di più rendendo l'host consapevole della tecnologia SMR sottostante. L'industria è nelle fasi finali del processo di standardizzazione per SMR con ZBC (Zoned Block Commands) che è lo standard per SAS e ZAC (Zoned ATA Commands) che è lo standard per SATA. Questi standard definiscono un dispositivo a blocchi a zone in cui lo spazio LBA è diviso in zone indipendenti. All'interno di ciascuna zona, le scritture dovrebbero essere sequenziali. Per sovrascrivere i dati è necessario prima reimpostare la zona, in modo simile a un blocco di cancellazione in un SSD. Ciò che accade quando le scritture non sequenziali vengono inviate a una zona varia a seconda del tipo di implementazione SMR.


SMR utilizza un sistema di mappatura per gli LBA che desiderano essere scritti in modo casuale per scriverli solo in sequenza. Similmente al Flash Translation Layer (FTL) degli SSD, gli HDD SMR utilizzano quello che a volte viene chiamato SMR (o Shingle) Translation Layer (STL), che è un concetto simile. Con SMR, tuttavia, si può ottenere molto di più rendendo l'host consapevole della tecnologia SMR sottostante. L'industria è nelle fasi finali del processo di standardizzazione per SMR con ZBC (Zoned Block Commands) che è lo standard per SAS e ZAC (Zoned ATA Commands) che è lo standard per SATA. Questi standard definiscono un dispositivo a blocchi a zone in cui lo spazio LBA è diviso in zone indipendenti. All'interno di ciascuna zona, le scritture dovrebbero essere sequenziali. Per sovrascrivere i dati è necessario prima reimpostare la zona, in modo simile a un blocco di cancellazione in un SSD. Ciò che accade quando le scritture non sequenziali vengono inviate a una zona varia a seconda del tipo di implementazione SMR.

Esistono tre categorie in cui rientrano le unità SMR o, più precisamente, tre tipi di unità di gestione che i fornitori possono utilizzare. Ognuno ha la propria serie di vantaggi e svantaggi.

Guida gestita

Il primo tipo è noto come drive gestito, noto anche come trasparente. In poche parole, l'unità SMR gestisce tutte le richieste provenienti dall'host, come un tradizionale HDD oggi. L'unità gestita ha il vantaggio di non aver bisogno di un host compatibile con SMR, gli SMR gestiti dall'unità sono compatibili con quasi tutto, rendendoli i più semplici da implementare. La natura a zone dell'HDD SMR sottostante è completamente nascosta all'host. Questo è il tipo di gestione SMR che ci aspettiamo di vedere generalmente disponibile nella versione iniziale del mercato consumer poiché non esistono sistemi operativi o file system disponibili in commercio che supportino le unità SMR al momento della stesura di questo documento. Tuttavia, man mano che vengono effettuati ulteriori test e la tecnologia SMR diventa più pervasiva, vedremo sistemi operativi e stack software ampiamente disponibili che supportano SMR.

Lo svantaggio dell'unità gestita è che le prestazioni sono imprevedibili poiché l'unità gestisce i processi in background quando necessario, indipendentemente dalle richieste di I/O. Inoltre, poiché le scritture casuali in entrata non vengono riunite in scritture sequenziali sul lato host, l'unità è sottoposta a maggiori sollecitazioni, e quindi con prestazioni inferiori in carichi di lavoro sostenuti, rispetto a quanto sarebbe se l'host fosse in grado di riconoscere SMR. Le unità SMR gestite da unità risolvono queste carenze sfruttando una sorta di "zona di destinazione", in cui è possibile gestire le scritture casuali prima di essere scritte su disco. Tuttavia, le modalità di incorporazione di questo spazio sulle unità SMR possono variare ampiamente, portando a profili prestazionali significativamente diversi a seconda del mercato di destinazione di ciascuna unità e produttore.

Gestito dall'ospite

Il successivo tipo di gestione è noto come gestito dall'host. Con questo tipo di gestione l'host utilizza comandi e informazioni sulla zona per ottimizzare il comportamento dell'unità SMR gestendo gli IO per garantire che le scritture siano sempre sequenziali all'interno di una zona. Se un host invia una scrittura non sequenziale all'interno di una zona, l'unità la rifiuterà e restituirà un errore. Ciò conferisce all'unità prestazioni più prevedibili e sarebbe più probabile che venga visto inizialmente nelle applicazioni aziendali e su vasta scala.

Lo svantaggio della gestione tramite host è che le unità SMR non sono compatibili con i sistemi host (HBA, driver di dispositivo, file system, database, ecc.) che non supportano SMR. Ciò significa che i file system devono essere adattati per supportare le unità SMR. Ciò si sta verificando, prima nello spazio su vasta scala in cui i più grandi attori del mondo hanno la possibilità di modificare i propri stack di storage per tenere conto dell’SMR, e ora anche nello spazio open source mainstream. Il manutentore di xfs, Dave Chinner, ha pubblicato un documento che delinea le ottimizzazioni SMR per xfs durante la conferenza Linux Vault a Boston all'inizio di marzo. Nello stesso evento, Hannes Rienecke di Suse ha presentato un meccanismo di caching della zona che può consentire agli attuali filesystem di funzionare con unità SMR gestite dall'host. È probabile che questi investimenti, insieme alla fame di capacità, incoraggino altri ad adottare le nuove soluzioni open source e a perseguire modifiche ai loro sistemi per supportare le unità SMR.

Host consapevole

L'ultimo tipo di gestione è noto come host aware. In poche parole, host aware è una combinazione dei due tipi di gestione sopra menzionati. L'unità SMR è autogestita ma implementa anche i nuovi standard ZBC/ZAC e consente all'host di utilizzare il nuovo set di comandi per ottimizzare il comportamento dell'unità. In questo caso, se l'unità riceve una scrittura non sequenziale dall'host, accetterà la richiesta ma le prestazioni della richiesta potrebbero essere imprevedibili. L'host aware ha il vantaggio di essere compatibile con le versioni precedenti e offre all'host un certo controllo. È probabile che la gestione host sia il modello preferito per la maggior parte dei sistemi client e aziendali tradizionali, assumendo il controllo di tutte le implementazioni gestite da unità, mentre la gestione host sta iniziando ad apparire come la scelta per le moderne soluzioni di storage distribuito.

Che cos'è la registrazione magnetica Shingled (SMR)?

Discuti questa storia