É evidente que os SSDs Gen5 mais recentes, como o Western Digital SN861, estão influenciando os resultados dos negócios. Se você precisar de provas, basta olhar para o impacto deles na revolução da IA.
Patrocinado pela Western Digital
O SSD Western Digital Ultrastar® DC SN861 foi projetado para atender às necessidades de alto desempenho de data centers de hiperescala e ambientes corporativos. O SN861 oferece suporte a uma interface PCIe® Gen5 e vem em vários formatos, incluindo U.2 e E1.S, permitindo que ele se adapte a vários cenários de implantação. Porém, não é tão simples quanto fabricar o SN861 em diferentes formatos; A Western Digital projetou sabiamente o conjunto de recursos SN861 para se alinhar aos seus mercados-alvo.
A interface Gen5 dá ao SN861 um aumento imediato de desempenho em relação à geração anterior SN655. Os benefícios da nova unidade são muito mais profundos, com recursos como o posicionamento flexível de dados (FDP) no formato E1.S. O FDP reduz a amplificação de gravação e otimiza o posicionamento dos dados. O SN861 inclui recursos avançados de segurança, como proteção de dados ponta a ponta, criptografia AES-XTS e TCG OPAL 2.01. O controlador também ajuda a reduzir o consumo de energia do SSD, com média abaixo de 5 watts em modo inativo. Além disso, a unidade oferece suporte a vários padrões como NVMe® 2.0 e OCP Cloud Spec 2.0.
Embora os recursos de segurança e eficiência sejam essenciais, cada atualização geracional inclui um salto significativo de desempenho, e o SN861 não é diferente. A unidade oferece velocidades de leitura sequencial de até 13,700 MB/s e IOPS de leitura aleatória de até 3.3 milhões, essencial para aplicações como IA/ML e análise de big data. Ambas as versões do SN861 consomem em média 20 watts durante a operação e menos de 5 watts em modo inativo. A energia é ajustável, portanto, é fácil ajustar o perfil de energia da unidade para corresponder à carga de trabalho esperada. Os hiperescaladores, por exemplo, geralmente executam seus drives E1.S em estados de consumo de energia muito mais baixos.
Curiosamente, embora os dois formatos do SN861 sejam tecnicamente muito semelhantes em design, a Western Digital ajustou cada unidade para cargas de trabalho específicas. Na versão E1.S, por exemplo, isso significa recursos como FDP e desempenho ajustado para cargas de trabalho em nuvem. A unidade U.2, por outro lado, encontrará seu caminho em cargas de trabalho empresariais de alto desempenho e, sem dúvida, em cargas de trabalho emergentes, como IA, que podem se beneficiar do enorme salto no desempenho da unidade.
EDSFF e FDP
O FDP oferece benefícios significativos para hiperscaladores como o Meta, otimizando o desempenho e a confiabilidade de seus SSDs em cargas de trabalho como o CacheLib. O FDP reduz o fator de amplificação de gravação (WAF), levando a melhores velocidades de gravação e maior vida útil do SSD, o que é crucial para lidar com tarefas massivas de processamento de dados.
A tecnologia aprimora a organização dos dados agrupando de forma inteligente dados semelhantes, minimizando o provisionamento excessivo e reduzindo a necessidade de coleta intensiva de lixo. O FDP também oferece suporte a vários namespaces, garantindo desempenho consistente em diferentes cargas de trabalho. Essa otimização melhora o desempenho e a resistência dos aplicativos e reduz significativamente o custo total de propriedade (TCO) para infraestruturas de armazenamento em grande escala.
O suporte para FDP na versão E1.S do Ultrastar SN861 afirma que o drive está pronto para as necessidades dos hiperscaladores, mas o FDP é apenas uma parte da equação. A versão E1.S da unidade precisa atender aos requisitos de desempenho de hiperescala, especificamente QoS em relação ao desempenho de leitura.
U.2 para empresas
Por mais interessante que o drive E1.S seja para casos de uso de hiperescala, o U.2 SN861 é o drive que a maioria das empresas adotará. Submetemos a unidade a uma série de testes para medir o desempenho geral em nosso conjunto de testes padrão.
Folha de dados do SSD Western Digital Ultrastar DC SN861
1.60TB | 1.92TB | 3.20TB | 3.84TB | 6.40TB | 7.68TB | |
---|---|---|---|---|---|---|
resistencia | 3 DWPD | 1 DWPD | 3 DWPD | 1 DWPD | 3 DWPD | 1 DWPD |
Segurança | ||||||
Fator de Forma | ||||||
Interface | ||||||
Especificação NVMe | ||||||
Desempenho (projetado) | 1.60TB | 1.92TB | 3.20TB | 3.84TB | 6.40TB | 7.68TB |
Taxa de transferência de leitura (máx. MB/s, Seq 128 KiB) | 13,700 | 13,700 | 13,700 | 13,700 | 13,700 | 13,700 |
Taxa de transferência de gravação (máx. GB/s, Seq 256 KiB) | 3,600 | 3,600 | 7,200 | 7,200 | 7,500 | 7,500 |
Leia IOPS (max, Rnd 4KiB) | 2,100K | 2,100K | 3,300K | 3,300K | 3,300K | 3,300K |
IOPS de gravação (max, Rnd 4KiB) | 350K | 165K | 665K | 330K | 800K | 430K |
Latência de leitura (µS) | 65 | 65 | 65 | 65 | 65 | 65 |
Latência de gravação (µS) | 8 | 8 | 8 | 8 | 8 | 8 |
Confiabilidade | ||||||
MTTF (horas, projetadas) | ||||||
Taxa de erro de bit incorrigível (UBER) | ||||||
Taxa de falha anualizada (AFR, projetada) | ||||||
Garantia Limitada (anos) | ||||||
Gerenciamento de energia (projetado) | ||||||
Requisito (DC, +/- 10%) | ||||||
Modos de operação (média, máx.) | ||||||
Inativo (média) | ||||||
Tamanho físico | ||||||
altura z (mm) | ||||||
Dimensões (largura x comprimento, mm) | ||||||
Ambiental | ||||||
Temperatura operacional (ambiente) | ||||||
Temperatura Não operacional |
Para medir o desempenho dos SSDs corporativos NVMe® Gen5 usados nesta comparação, aproveitamos um conjunto de testes fio para cargas de trabalho de quatro cantos e Vdbench para cargas de trabalho mistas. O pacote de script fio que utilizamos é um script automatizado configurado para pré-condicionar e testar drives levemente de maneira consistente, encontrado aqui no github. Usamos isso para realizar testes de leitura e gravação sequenciais de 256K para largura de banda de pico e testes de leitura e gravação aleatórios de 4K para taxa de transferência de pico.
Pico de rendimento e largura de banda |
Western Digital SN861 7.68 TB | KIOXIA CM7-R 7.68 TB | Samsung PM1743 7.68 TB | Samsung PM9A3 7.68 TB |
Leitura sequencial de 256K (1T/64Q) | 13,283MB / s | 12,092MB / s | 14,495MB / s | 6,751MB / s |
Gravação sequencial de 256K (1T/64Q) | 7,696MB / s | 5,796MB / s | 6,052MB / s | 4,055MB / s |
Leitura aleatória de 4K (8T/32Q) | 2,108,065 IOPS | 1,963,066 IOPS | 1,900,838 IOPS | 1,068,508 IOPS |
Gravação aleatória 4K (8T/32Q) | 473,658 IOPS | 301,061 IOPS | 319,758 IOPS | 206,660 IOPS |
Quando olhamos para os números de desempenho de primeira linha do Western Digital SN861, ele faz bom uso de sua interface Gen5. Na leitura sequencial, mediu 13.3 GB/s, ficando em segundo lugar em comparação com o Samsung PM1743, que mediu 14.5 GB/s. Na gravação sequencial, o SN861 ficou em primeiro lugar, superando os outros dois modelos Gen5 comparáveis, com uma velocidade de 7.7 GB/s, com 6.1 GB/s do Samsung PM1743 como o próximo mais próximo.
O desempenho de leitura aleatória de 4K foi notavelmente forte, medindo 2.11 milhões de IOPS, com 1.96 milhões de IOPS do KIOXIA CM7-R como o próximo mais próximo. Quando analisamos o desempenho de gravação aleatória em 4K, o Western Digital SN861 também ficou em primeiro lugar, com uma velocidade de 474K IOPS, com o Samsung PM1743 com 320K IOPS como o próximo modelo mais próximo. Em nossas cargas de trabalho de quatro cantos, o Western Digital SN861 obteve o melhor resultado em três dos quatro testes.
Para testar o SSD SN861 Gen5, aproveitamos o Dell® PowerEdge® R760 em nosso laboratório de testes. É um servidor de montagem em rack 2U altamente versátil que suporta dois processadores Intel Xeon de 4ª geração e possui configurações que suportam até 24 unidades NVMe. Este servidor destina-se a cargas de trabalho mistas, bancos de dados e VDI. Deve-se observar que a versão do CM7-R que estamos testando nesta análise veio de um servidor Dell com firmware da Dell. Esta unidade pode funcionar de forma diferente com o firmware padrão da KIOXIA.
Configuração do Dell PowerEdge R760:
- Dual Intel® Xeon® Gold 6430 (32 núcleos/64 threads, base de 1.9 GHz)
- RAM DDR1 de 5 TB
- Ubuntu 22.04
Para maior flexibilidade, também trabalhamos com Serial Cables, que nos forneceu um JBOF PCIe Gen8 de 5 compartimentos para testes de SSD U.2/U.3, M.2 e EDSFF. Isso nos permite testar todos os tipos de unidades atuais e emergentes no mesmo hardware de teste. O VDbench também foi aproveitado para comparar o desempenho dimensionado em nossa seleção de SSDs em diferentes tipos de carga de trabalho. Nosso processo de teste para esses benchmarks preenche toda a superfície da unidade com dados e, em seguida, particiona uma seção da unidade igual a 25% da capacidade da unidade para simular como a unidade pode responder às cargas de trabalho do aplicativo. Isso difere dos testes de entropia completos, que usam 100% da unidade e os colocam em estado estacionário. Como resultado, esses números refletirão velocidades de gravação sustentadas mais altas.
perfis:
- Leitura sequencial de 16K: 100% de leitura, 32 threads, 0-120% iorado
- Gravação sequencial de 16K: 100% gravação, 16 threads, 0-120% iorado
- 4K, 8K e 16K 70R/30W Random Mix, 64 threads, 0-120% iorate
- Banco de Dados Sintético: SQL e Oracle
- Clone completo de VDI e rastreamentos de clone vinculados
Nosso primeiro teste Vdbench mediu o desempenho de leitura sequencial de 16K com uma carga de 32 threads. Aqui, medimos um pico de rendimento de 325 mil IOPS e 5.1 GB/s a 98 μs do Western Digital SN861, que estava lado a lado com o KIOXIA CM7-R, medindo 329 mil IOPS. O PCIe Gen5 Samsung PM1743 mediu 289 mil IOPS, e o Samsung PM9A3 que trouxemos como referência Gen4 SSD mediu 227 mil IOPS.Movendo nosso foco para o desempenho de gravação com a mesma carga de trabalho sequencial de 16K, o Western Digital SN861 ofereceu uma forte liderança em relação aos outros SSDs U.2 PCIe Gen5 com os quais o comparamos. O SN861 mediu um pico de 200 mil IOPS e 3.1 GB/s a 78 μs, com uma boa vantagem acima do KIOXIA CM7-R e do Samsung PM1743. Em comparação com o cenário Gen4, todos tinham uma forte vantagem sobre o Samsung PM9A3, que mediu 131 mil IOPS.
Nossos próximos três testes analisam o dimensionamento dos tamanhos dos blocos em um teste de transferência aleatória com uma mistura R/W de 70/30. O primeiro teste mediu um tamanho de bloco de 4K. Aqui, descobrimos que o Western Digital SN861 e o KIOXIA CM7-R têm desempenho muito semelhante, com o SN861 medindo 903K IOPS a 70 μs versus 881K IOPS do CM7-R. O Samsung PM1743 ficou atrás com uma velocidade máxima de 521K IOPS, com o Gen4 PM9A3 medindo 396K IOPS.
Movendo-se para um tamanho de bloco de 8K com nosso teste aleatório de 70/30 R/W, o Western Digital SN861 ultrapassou o KIOXA CM7-R, medindo um pico de 682K IOPS a 93 μs, versus o CM7-R com 599K IOPS. O Samsung PM1743 ficou atrás com 414K IOPS, enquanto o Gen4 PM9A3 mediu 301K IOPS.
Nosso teste final aleatório de R/W 70/30 analisa um tamanho de bloco de 16K. O Western Digital SN861 continua sua forte liderança aqui, medindo um pico de 434K IOPS a 143 μs, com o CM7-R medindo 337K IOPS. O Samsung PM1743 continuou atrás, medindo 231 mil IOPS, enquanto o Gen4 PM9A3 mediu 183 mil IOPS.
Nosso próximo grupo de testes concentra-se em uma carga de trabalho SQL sintética. Neste primeiro teste, encontramos o Western Digital SN861 liderando o KIOXIA CM7-R, com uma velocidade de pico de 407K IOPS a 78 μs contra 396K IOPS do CM7-R. O Samsung PM1743 obteve um pico de 340 mil IOPS, enquanto o Gen4 PM9A3 mediu 310 mil IOPS.
Com a carga de trabalho SQL em uma combinação R/W de 80/20, o Western Digital SN861 continua a liderar o KIOXIA CM7-R, medindo um pico de 424K IOPS a 75 μs versus 407K do CM7-R. O Samsung PM1743 ficou atrás desses dois com uma velocidade máxima de 322K IOPS, com o Gen4 PM9A3 medindo 281K IOPS.
Aumentando a propagação de leitura para uma divisão R/W de 90/10 em nossa carga de trabalho SQL, o Western Digital SN861 continuou a manter sua liderança sobre o KIOXIA CM7-R, medindo 411 mil IOPS a 77 μs versus 398 mil IOPS do CM7-R. O Samsung ainda estava atrás desses dois com uma velocidade máxima de 328 mil IOPS, e o Gen4 PM9A3 mediu 297 mil IOPS.
Após nossos testes SQL, mudamos o foco para uma carga de trabalho Oracle sintética. Aqui, nossos três SSDs Gen5 mostram grandes melhorias em relação ao Samsung PM4A9 Gen3. O Western Digital SN861 manteve sua liderança com uma velocidade de pico de 445K IOPS a 80 μs, à frente do KIOXIA CM7-R com 417K IOPS. O Samsung PM1743 ficou atrás deles, medindo 317 mil IOPS, e o PM9A3 com 267 mil IOPS.
Mudando a dispersão R/W de nossa carga de trabalho Oracle sintética para 80/20, a dispersão entre o Western Digital SN861 e o KIOXIA CM7-R diminuiu, com o SN861 medindo um pico de 309K IOPS a 71 μs e o CM7-R medindo 304K IOPS . O Samsung PM1743 mediu pico de 252 mil IOPS, com o Gen4 PM9A3 chegando com 228 mil IOPS.
Nossa carga de trabalho Oracle sintética final com uma mistura R/W 90/10 viu uma lacuna semelhante entre o Western Digital SN861 e o KIOXIA CM7-R. O SN861 teve uma velocidade máxima de 296 mil IOPS a 74 μs, enquanto o CM7-R mediu 292 mil IOPS. O Samsung PM1743 ficou mais atrás com uma velocidade máxima de 250 mil IOPS, enquanto o Gen4 PM9A3 mediu 231 mil IOPS.
Nossas últimas seis cargas de trabalho se concentram em rastreamentos VDI de VMs Full-Clone e Linked-Clone. Eles cobrem três cenários cada: inicialização, login inicial e login de segunda-feira. Nosso teste cobre um cenário de inicialização Full-Clone, onde o Western Digital SN861 mediu 370 mil IOPS a 94 μs em comparação ao KIOXIA CM7-R com 348 mil IOPS. O Samsung PM1743 ficou atrás com 263 mil IOPS e o Gen4 PM9A3 com 227 mil IOPS.
Em nosso cenário de login inicial, o KIOXIA CM7-R saiu na frente com uma vantagem sobre o Western Digital SN861, medindo 196 mil IOPS a 163 μs em relação ao SN861 com 181 mil IOPS. O Samsung PM1743 mediu pico de 157 mil IOPS, enquanto o Gen4 PM9A3 veio com 117 mil IOPS.
No perfil de login de segunda-feira, o Western Digital SN861 e o KIOXIA CM7-R apareceram lado a lado. O SN861 mediu um pico de 158 mil IOPS a 99 μs, enquanto o CM7-R mediu 160 mil IOPS. O Samsung PM1743 mediu 126 mil IOPS e o Gen4 PM9A3 veio com 83 mil IOPS.
Em nossos últimos três testes, analisamos esses mesmos perfis em uma configuração VDI Linked Clone, começando com um arquivo boot. O KIOXIA CM7-R ficou em primeiro lugar, medindo 161 mil IOPS, para o Western Digital SN861 com 156 mil IOPS a 102 μs. O Samsung PM1743 mediu 138 mil IOPS, com o Gen4 PM9A3 atrás dele com 110 mil IOPS.
Em nosso teste medindo um perfil de login inicial, o KIOXIA CM7-R teve a velocidade mais alta de 89K IOPS, com o Western Digital SN861 logo atrás com 85K IOPS a 102 μs. O Samsung PM1743 ficou atrás com 70K IOPS, com seu irmão Gen4 atrás dele com 53K IOPS.
Em nossa última carga de trabalho VDI cobrindo um perfil de login de segunda-feira, o Western Digital SN861 ficou na liderança com uma velocidade de pico de 122 mil IOPS a 129 μs, com o KIOXIA CM7-R atrás dele medindo 115 mil IOPS. O Samsung PM1743 mediu 95K IOPS, com o Gen4 PM9A3 atrás com uma velocidade máxima de 64K IOPS.
Western Digital SN861 e IA
Em um caminho um tanto relacionado ao trabalho com o SN861 neste relatório, também trabalhamos com a geração anterior Western Digital Ultrastar DC SN655 dentro da plataforma OpenFlex™ Data24 fornecida pelo grupo de sistemas Western Digital. Em uma demonstração do FMS '24, exibimos uma demonstração de IA com um servidor GPU, a plataforma Data24 NVMe-oF™ e SSDs Gen4 SN655.
Nossos testes com NVIDIA® IndeX® se concentraram em aproveitar seus recursos avançados de visualização volumétrica para lidar com conjuntos de dados massivos com alta fidelidade. O IndeX utiliza aceleração de GPU para fornecer visualização interativa em tempo real de dados volumétricos 3D, o que é fundamental para setores como exploração de petróleo e gás, imagens médicas e pesquisa científica.
Para alcançar o desempenho ideal, especialmente em ambientes com uso intensivo de GPU, é necessário garantir a troca de dados em alta velocidade entre GPUs e armazenamento. Por exemplo, para saturar completamente a largura de banda de uma GPU NVIDIA H100, precisávamos atingir aproximadamente 64 GB/s de taxa de transferência, o que envolve o uso de soluções de armazenamento NVMe de alto desempenho e tecnologias como NVIDIA GPUDirect™. Essa integração reduz a latência e maximiza o rendimento dos dados, garantindo a utilização eficiente da GPU para um processamento mais rápido e eficaz de conjuntos de dados em grande escala.
Quando olhamos para as diferenças de largura de banda no que o Gen4 SN655 pode fazer com pico de 6.8 GB/s versus 13.7 GB/s do SN861, é óbvio ver as vantagens de mudar para um SSD Gen5. Para atingir 64 GB/s com o modelo da geração anterior, você precisa de dez SSDs, enquanto o SN861 poderia atingir essa meta com apenas cinco. Essa diferença pode permitir aumentar a contagem de unidades para obter largura de banda ou capacidade adicional.
O desempenho e a capacidade serão essenciais para que o armazenamento seja dimensionado de acordo com as necessidades da IA e de outras aplicações avançadas. A interface Gen5 e o aumento de desempenho geral que o SN861 oferece em relação às unidades Gen4 são muito atraentes nesse aspecto, o que significa que essas unidades podem suportar mais GPUs em um único sistema de armazenamento e garantir que essas GPUs sejam alimentadas a uma taxa rápida o suficiente para garantir a utilização total.
Conclusão
O SN861 marca um salto substancial para a Western Digital. A unidade vem em formatos para oferecer suporte a clientes corporativos e de hiperescala, com recursos de unidade como FDP na unidade E1.S ajustados para seus possíveis casos de uso. A interface Gen5 é o benefício mais aparente para as unidades, oferecendo um perfil de desempenho geral impressionante.
O Western Digital SN861 ofereceu forte desempenho desde o início, ocupando três primeiros lugares em nossas cargas de trabalho iniciais de quatro cantos, medindo largura de banda sequencial de pico e taxa de transferência aleatória. Os destaques incluem desempenho de leitura aleatória em 4K de 2.11 milhões de IOPS e desempenho de gravação aleatória em 4K medindo 474 mil IOPS. O desempenho de leitura sequencial foi forte, ficando em segundo lugar em comparação com o Samsung PM1743 com 13.3 GB/s, embora tenha sido capaz de assumir a liderança na largura de banda de gravação sequencial medindo 7.7 GB/s.
Em nossas cargas de trabalho VDbench, que se concentravam principalmente em cargas de trabalho mistas ou transferências de blocos menores, o SN861 continuou a ter um desempenho excepcionalmente bom. Medimos uma forte velocidade de gravação sequencial de 16K de 200K IOPS e fortes resultados nos testes de mixagem de 70/30 R/W cobrindo tamanhos de transferência de 4K, 8K e 16K. Em nossas cargas de trabalho VDI, o SN861 trocou o primeiro lugar com o KIOXIA CM7-R, que estava lado a lado em algumas áreas. No geral, o Western Digital SN861 teve uma forte exibição em nossa linha de testes.
É evidente que os SSDs Gen5 mais recentes, como o Western Digital SN861, estão influenciando os resultados dos negócios. Se você precisar de provas, basta olhar para o impacto deles na revolução da IA. Vimos isso em nossos testes; Os sistemas de IA precisam de armazenamento rápido para manter as GPUs funcionando, seja em um cache como o exemplo NVIDIA IndeX acima ou em matrizes de armazenamento compartilhado ou servidores GPU. A Western Digital se saiu muito bem ao posicionar o SN861 para essas cargas de trabalho avançadas, ao mesmo tempo que oferece SKUs habilitados para FDP para hiperescaladores.
Armazenamento de data center Western Digital
Envolva-se com a StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS feed