Home Empreendimento Análise do SSD Samsung 983 DCT NVMe

Análise do SSD Samsung 983 DCT NVMe

by Adam Armstrong

O Samsung 983 DCT é o mais recente SSD de Data Center da empresa. O 983 DCT aproveita a interface NVMe e vem em dois formatos: 2.5” e M.2. A unidade é construída com componentes Samsung comprovados e seu V-NAND comprovado em batalha. A unidade é especificamente voltada para o desempenho, mas também oferece proteção de dados de ponta a ponta, gerenciamento mais eficiente por meio do software Samsung SSD Toolkit e garantia de 5 anos.


O Samsung 983 DCT é o mais recente SSD de Data Center da empresa. O 983 DCT aproveita a interface NVMe e vem em dois formatos: 2.5” e M.2. A unidade é construída com componentes Samsung comprovados e seu V-NAND comprovado em batalha. A unidade é especificamente voltada para o desempenho, mas também oferece proteção de dados de ponta a ponta, gerenciamento mais eficiente por meio do software Samsung SSD Toolkit e garantia de 5 anos.

A empresa recentemente atualizou suas unidades de centro de dados recentemente com o 983 DCT sendo a unidade que visa alta velocidade e alta capacidade de resposta. A Samsung afirma que atingirá esse objetivo por meio da tecnologia NVMe, bem como com seu controlador Phoenix. Para a versão de 2.5”, a empresa afirma que o 983 DCT pode atingir velocidades sequenciais de até 3,400 MB/s e até 580,000 IOPS para taxa de transferência aleatória. 

Conforme declarado, o Samsung 983 DCT vem em formatos M.2 e 2.5”. Para esta análise, estamos analisando o fator de forma de 1.92 TB e 2.5”. 

Especificações do Samsung 983 DCT

Fator de Forma 2.5 "
Capacidade 960GB 1.92TB
Interface PCIe Geração 3 x4, NVMe 1.2b
NAND Samsung V-NAND
Responsável pelo Tratamento Samsung Phoenix
Suporte para criptografia AES de 256 bits
Desempenho 
Leitura Seqüencial Até 3.3 GB/s Até 3.4 GB/s
Escrita Seqüencial Até 1.3 GB/s Até 2.2 GB/s
Leitura aleatória (4K, QD32) IOPS 440K IOPS 580K
Gravação aleatória (4K, QD32) IOPS 46K IOPS 52K
Leitura de QoS (99.99%, 4 KB, QD1) Até 0.13ms
QoS Write (99.99%, 4KB, QD1) Até 0.09ms
Consumo de energia
Leitura Ativa Até 8.7W
Gravação ativa Até 10.6W
inativo Até 4.0W
resistencia
MTBF 2.0 milhões de horas
UBER5 1 setor por 10^17 bits lidos
Choque 1500G, duração 0.5 ms, meia onda senoidal
Meio Ambiente
Tensão Admissível 12.0V ± 8%
Temperatura de Operação 0-70 ° C
Físico
Dimensões (LxAxP) Máx. 100.2 69.85 x x 6.8 (mm)
Peso máx. 70g
Garantia 5 anos ou 0.8 DWPD

Desempenho

Mesa de teste

Nossas análises de SSD corporativo utilizam um Lenovo ThinkSystem SR850 para testes de aplicativos e um Dell PowerEdge R740xd para benchmarks sintéticos. O ThinkSystem SR850 é uma plataforma quad-CPU bem equipada, oferecendo potência de CPU bem acima do necessário para enfatizar o armazenamento local de alto desempenho. Os testes sintéticos que não exigem muitos recursos da CPU usam o servidor de processador duplo mais tradicional. Em ambos os casos, a intenção é mostrar o armazenamento local da melhor maneira possível, de acordo com as especificações máximas de unidade do fornecedor de armazenamento.

Lenovo Think System SR850

  • 4 x CPU Intel Platinum 8160 (2.1 GHz x 24 núcleos)
  • 16 x 32GB DDR4-2666Mhz ECC DRAM
  • 2 x placas RAID 930-8i 12 Gb/s
  • 8 compartimentos NVMe
  • VMware ESXI 6.5

Dell PowerEdge R740xd

  • 2 x CPU Intel Gold 6130 (2.1 GHz x 16 núcleos)
  • 16 x 16 GB DDR4-2666 MHz ECC DRAM
  • 1 placa RAID PERC 730 2GB 12Gb/s
  • Adaptador NVMe Complementar
  • Ubuntu-16.04.3-desktop-amd64

Histórico de testes e comparáveis

Laboratório de teste StorageReview Enterprise fornece uma arquitetura flexível para realizar benchmarks de dispositivos de armazenamento corporativo em um ambiente comparável ao que os administradores encontram em implantações reais. O Enterprise Test Lab incorpora uma variedade de servidores, redes, condicionamento de energia e outras infraestruturas de rede que permitem que nossa equipe estabeleça condições do mundo real para avaliar com precisão o desempenho durante nossas análises.

Incorporamos esses detalhes sobre o ambiente de laboratório e protocolos em revisões para que os profissionais de TI e os responsáveis ​​pela aquisição de armazenamento possam entender as condições em que alcançamos os resultados a seguir. Nenhuma de nossas análises é paga ou supervisionada pelo fabricante do equipamento que estamos testando. Detalhes adicionais sobre o Laboratório de teste StorageReview Enterprise e uma visão geral de seus recursos de rede estão disponíveis nessas respectivas páginas.

Principais comparáveis ​​para esta revisão:

Análise de carga de trabalho do aplicativo

Para entender as características de desempenho dos dispositivos de armazenamento corporativo, é essencial modelar a infraestrutura e as cargas de trabalho de aplicativos encontradas em ambientes de produção ao vivo. Nossos benchmarks para o Samsung 983 DCT são, portanto, os Desempenho OLTP do MySQL via SysBench. Para nossas cargas de trabalho de aplicativos, cada unidade executará de 2 a 4 VMs configuradas de forma idêntica. Nota: O modelo de 1.92 TB não era grande o suficiente para a carga de trabalho do nosso aplicativo SQL, por isso não foi incluído nesta análise.

Desempenho do Sysbench

O próximo benchmark de aplicativo consiste em um Banco de dados MySQL OLTP Percona medida via SysBench. Este teste mede o TPS (transações por segundo) médio, a latência média e também a latência média do 99º percentil.

Cada sysbench A VM é configurada com três vDisks: um para inicialização (~92 GB), um com o banco de dados pré-construído (~447 GB) e o terceiro para o banco de dados em teste (270 GB). Do ponto de vista dos recursos do sistema, configuramos cada VM com 16 vCPUs, 60 GB de DRAM e aproveitamos o controlador LSI Logic SAS SCSI.

Configuração de teste do Sysbench (por VM)

  • CentOS 6.3 64 bits
  • Percona XtraDB 5.5.30-rel30.1
    • Tabelas de banco de dados: 100
    • Tamanho do banco de dados: 10,000,000
    • Segmentos de banco de dados: 32
    • Memória RAM: 24 GB
  • Duração do teste: 3 horas
    • 2 horas de pré-condicionamento 32 tópicos
    • 1 hora 32 tópicos

Com o benchmark transacional Sysbench, o Samsung 983 DCT (referido como Samsung no restante da seção de desempenho) ficou em último lugar com 6,159.4 TPS.

Para a latência média do Sysbench, novamente a Samsung ficou em último lugar com 20.8 ms. 

Para o nosso pior cenário de latência (99º percentil), o Samsung ficou em último lugar com 38.6ms. 

Houdini por SideFX

O teste Houdini foi projetado especificamente para avaliar o desempenho do armazenamento no que se refere à renderização CGI. O banco de teste para esta aplicação é uma variante do núcleo Dell PowerEdge R740xd tipo de servidor que usamos no laboratório com duas CPUs Intel 6130 e DRAM de 64 GB. Nesse caso, instalamos o Ubuntu Desktop (ubuntu-16.04.3-desktop-amd64) executando bare metal. A saída do benchmark é medida em segundos para ser concluída, com menos sendo melhor.

A demonstração do Maelstrom representa uma seção do pipeline de renderização que destaca os recursos de desempenho do armazenamento, demonstrando sua capacidade de usar efetivamente o arquivo de troca como uma forma de memória estendida. O teste não grava os dados do resultado nem processa os pontos para isolar o efeito do tempo decorrido do impacto da latência no componente de armazenamento subjacente. O teste em si é composto por cinco fases, três das quais executamos como parte do benchmark, que são as seguintes:

  1. Carrega pontos compactados do disco. Este é o momento de ler do disco. Isso é de thread único, o que pode limitar a taxa de transferência geral.
  2. Descompacta os pontos em uma única matriz plana para permitir que sejam processados. Se os pontos não tiverem dependência de outros pontos, o conjunto de trabalho pode ser ajustado para permanecer no núcleo. Esta etapa é multiencadeada.
  3. (Não Executar) Processe os pontos.
  4. Reempacota-os em blocos agrupados adequados para armazenamento em disco. Esta etapa é multiencadeada.
  5. (Não executado) Grave os blocos agrupados de volta no disco.

Com o teste de Houdini, o Samsung pousou aproximadamente no meio de nossas unidades não Optane com 2,634.2 segundos.

Análise de Carga de Trabalho do VDBench

Quando se trata de dispositivos de armazenamento de comparação, o teste de aplicativo é o melhor e o teste sintético vem em segundo lugar. Embora não seja uma representação perfeita das cargas de trabalho reais, os testes sintéticos ajudam a estabelecer a linha de base dos dispositivos de armazenamento com um fator de repetibilidade que facilita a comparação entre soluções concorrentes. Essas cargas de trabalho oferecem uma variedade de perfis de teste diferentes, desde testes de "quatro cantos", testes comuns de tamanho de transferência de banco de dados até capturas de rastreamento de diferentes ambientes VDI. Todos esses testes utilizam o gerador de carga de trabalho vdBench comum, com um mecanismo de script para automatizar e capturar resultados em um grande cluster de teste de computação. Isso nos permite repetir as mesmas cargas de trabalho em uma ampla variedade de dispositivos de armazenamento, incluindo arrays flash e dispositivos de armazenamento individuais. Nosso processo de teste para esses benchmarks preenche toda a superfície da unidade com dados e, em seguida, particiona uma seção da unidade igual a 25% da capacidade da unidade para simular como a unidade pode responder às cargas de trabalho do aplicativo. Isso é diferente dos testes de entropia total, que usam 100% da unidade e os colocam em estado estacionário. Como resultado, esses números refletirão velocidades de gravação sustentadas mais altas.

perfis:

  • Leitura aleatória em 4K: 100% de leitura, 128 threads, 0-120% de atualização
  • Gravação aleatória em 4K: 100% de gravação, 64 threads, 0-120% de atualização
  • Leitura sequencial de 64K: 100% de leitura, 16 threads, 0-120% iorado
  • Gravação sequencial de 64K: 100% gravação, 8 threads, 0-120% iorado
  • Banco de Dados Sintético: SQL e Oracle
  • Clone completo de VDI e rastreamentos de clone vinculados

Em nossa primeira análise de carga de trabalho VDBench, Random 4K Read, a Samsung começou com latência de 82.1 μs a 59,187 IOPS. O Samsung ficou abaixo de 100μs até cerca de 300K IOPS e passou a ter o desempenho de pico mais baixo em 591,839 IOPS em 215.2μs.

Em gravações aleatórias de 4K, a Samsung ficou atrás de todas as outras unidades por uma ampla margem. Começou em 20.2 μs a 35,420 IOPS e disparou rapidamente para 52,822 IOPS a 2.42 ms de latência em seu pico. 

Mudando para o trabalho sequencial, em nossa leitura de 64K a Samsung começou com a menor latência (187.8μs) e manteve uma latência menor até cerca de 32K IOPS ou 2.1GB/s e atingiu o pico com o menor desempenho do grupo em 36,389 IOPS ou 2.27 GB/s.

Para gravações de 64K, vemos outro desempenho ruim da Samsung, começando com apenas 67.3 μs de latência, a unidade aumentou rapidamente e atingiu o pico de 3,299 IOPS ou 206 MB/s com uma latência de 4.84 ms. 

Nosso próximo lote de benchmarks se concentra em cargas de trabalho SQL. Para o primeiro benchmark, a Samsung começou com a menor latência em 82μs e 21,107 IOPS. A unidade manteve a latência mais baixa até cerca de 150 IOPS e passou a ter o segundo pico geral de desempenho em 210,323 IOPS com latência de 149.5 μs.

Para o SQL 90-10, a Samsung começou forte mais uma vez com 18,589 IOPS em uma latência de apenas 82.5μs. A unidade ficou abaixo de 100μs até quase 90K IOPS e ficou em segundo lugar com uma pontuação máxima de 184,773 IOPS e uma latência de 172.3μs.

O SQL 80-20 viu o drive escorregar um pouco. Apesar de começar com a latência mais baixa (86.8 μs), a unidade teve o desempenho de pico mais fraco de cerca de 132K IOPS e 233 μs para latência.

Passando para o Oracle Workloads, vemos que a Samsung começou com o pé esquerdo. Mais uma vez, o drive entra com a latência mais baixa (82.7μs), mas dispara rapidamente e atinge o pico de 95,205 IOPS com latência de 418.9μs, bem atrás dos outros drives. 

Com o Oracle 90-10 a Samsung melhorou. Começando com 15,515 IOPS e uma latência de 82.5μs, a unidade permaneceu abaixo de 100μs até aproximadamente 72K IOPS e chegando ao pico de 159,976 IOPS a 139.6μs.

O Oracle 80-20 fez com que a Samsung mantivesse uma latência abaixo de 100μs de 12,687 IOPS até cerca de 60K IOPS com um desempenho máximo de 130,766 IOPS e 166.5μs de latência. 

Em seguida, passamos para nosso teste de clone VDI, Full and Linked. Para VDI Full Clone Boot, a Samsung começou com pouco menos de 100 μs para ultrapassá-lo rapidamente e pousar em terceiro lugar com um desempenho máximo de 123,613 IOPS e uma latência de 279.4 μs.

O login inicial do VDI FC fez o Samsung começar com 3,987 IOPS com 72.7 μs. A latência permaneceu baixa, na verdade caiu tão baixo que parece zero em nossos gráficos, até cerca de 12K IOPS, onde dispara rapidamente atingindo um pico de 15,845 IOPS com uma latência de 1.9 ms. 

Com o VDI Monday Login, a Samsung ficou em último, começando logo abaixo de 100μs antes de saltar para um pico de 17,810 IOPS com uma latência de 895μs.

Para o VDI Linked Clone (LC), começamos mais uma vez com o teste de inicialização. Aqui, a Samsung mostrou seu desempenho mais forte em nosso teste Clone rodando lado a lado com o Memblaze PBlaze5 910. No entanto, a Samsung ainda ficou em último lugar com um desempenho máximo de 64,503 IOPS com uma latência de 248.8 μs.

O VDI LC Initial Login fez o Samsung começar logo acima de 100 μs e rapidamente atingir um pico de 9,959 IOPS com latência de 799.4 μs, bem atrás das outras duas unidades.

Por fim, o VDI LC Monday Login mostrou que a Samsung continuou com seu desempenho ruim, começando acima de 100μs e subindo rapidamente para 10,410 IOPS com latência de 1.52 ms. 

Conclusão 

O Samsung 983 DCT é a versão NVMe focada na leitura da atualização do data center da empresa. O 983 DCT vem em dois formatos, 2.5” e M.2, bem como em duas capacidades, 960 GB e 1.92 TB. O 983 DCT está programado como a unidade de data center de desempenho da Samsung com velocidades cotadas de até 3.4 GB/s sequencial e 580 K IOPS aleatório, lido em ambos os casos. A unidade utiliza V-NAND, a interface NVMe e o controlador Phoenix da empresa para atingir esses números. 

Enquanto outros na categoria de leitura intensiva oferecem 1 DWPD, o Samsung 983 DCT é um pouco mais leve com apenas 0.8 DWPD. Sendo esse o caso, não foi uma grande surpresa ver o 983 DCT ficar abaixo de outros nesta categoria que oferecia uma pequena vantagem no desempenho de gravação. Em nossa análise de carga de trabalho do aplicativo, o Samsung 983 DCT ficou em último lugar em todos os três testes Sysbench com 6,159.4 TPS, uma latência média de 20.8ms e uma latência de pior cenário de 38.6ms. Houdini viu o drive pousar aproximadamente no meio dos drives NVMe tradicionais com 2,634.2 segundos. Devido à sua capacidade menor (1.92 TB nesta análise), não conseguimos executar nossos testes de aplicativos do SQL Server. 

Passando para o VDBench testando o novo para o Samsung 983 DCT, temos uma visão mais clara de como a unidade reage às cargas de trabalho de leitura e gravação. A unidade teve desempenho de leitura decente em 4K com 592K IOPS e em 64K atingiu 2.27GB/s. Em ambos os casos, o Samsung teve a menor latência mais longa do que as outras duas unidades. Para Writes, foi um contraste gritante. A gravação em 4K atingiu um pico de míseros 53K IOPS e teve uma latência de 2.42 ms. As gravações de 64K viram apenas um pico de 206 MB/s e uma latência de 4.84 ms. O SQL e o Oracle observaram uma melhoria no desempenho e no posicionamento da Samsung, com a unidade normalmente tendo a menor latência por mais tempo. Os destaques incluem 210 IOPS para SQL, 185 IOPS para SQL 90-10, 160 IOPS para Oracle 90-10 e 131 IOPS para Oracle 80-20. Com exceção do teste VDI Full Clone Boot, a Samsung apresentou um desempenho geral ruim em nossos testes VDI Clone.

À medida que o mercado de SSD procura segmentar ainda mais os produtos, o Samsung 983 DCT chega como um produto NVMe que oferece 0.8 DWPD, um pouco abaixo dos produtos concorrentes que se concentram na marca 1 DWPD em suas unidades posicionadas de leitura intensiva. Como tal, não foi chocante ver um desempenho de gravação inferior do 983 DCT. Em vez disso, a unidade carrega uma ênfase maior no desempenho de leitura. Aqui, ele foi capaz de oferecer latência inicial mais baixa em transferências de blocos pequenos e grandes. No geral, o 983 DCT fará um bom trabalho em ambientes de leitura pesada que se inclinam para uma unidade NVMe mais orientada para o valor.

Samsung 983 DCT

Discuta esta avaliação

Inscreva-se no boletim informativo StorageReview