Home Empreendimento Análise do SSD DapuStor H3200

Análise do SSD DapuStor H3200

by Lyle Smith

O DapuStor H3200 é um SSD NVMe empresarial de alto desempenho e baixo consumo de energia projetado para aplicativos que envolvem uso pesado, como data centers, vigilância por vídeo e computação de borda. O H3200 apresenta o mais recente 96L 3D eTLC NAND e é alimentado por um controlador Marvell empresarial. O H3200 é oferecido nos formatos U.2 e HHHL em capacidades que variam de 960 GB a 7.68 TB, com uma classificação de resistência de 1DWPD.

O DapuStor H3200 é um SSD NVMe empresarial de alto desempenho e baixo consumo de energia projetado para aplicativos que envolvem uso pesado, como data centers, vigilância por vídeo e computação de borda. O H3200 apresenta o mais recente 96L 3D eTLC NAND e é alimentado por um controlador Marvell empresarial. O H3200 é oferecido nos formatos U.2 e HHHL em capacidades que variam de 960 GB a 7.68 TB, com uma classificação de resistência de 1DWPD.

DapuStor H3200

O H3200 está equipado com uma variedade de recursos que se concentram em manter os dados seguros, como proteção de dados de ponta a ponta no caminho do firmware e do hardware, incluindo DDR ECC, LDPC, proteção contra perda de energia. Em termos de desempenho, o DapuStor H3200 é cotado para atingir velocidades sequenciais de até 3,578 MB/s de leitura e 2559 MB/s de gravação, enquanto o desempenho aleatório de 4k deve atingir até 832,000 IOPS de leitura e 101,000 IOPS de gravação.

DapuStor H3200 inferior

O DapuStor H3200 vem em capacidades de 1 TB, 1.92 TB, 3.84 TB e 7.58 TB. Estaremos olhando para o modelo de 3.84 TB para esta revisão.

 

DapuStor H3200 Especificações

Modelo n H3200
Capacidade (TB1) 0.96 1.92 3.84 7.68
Esboço U.2 & HHHL
Protocolo de Interface PCIe3.0 x 4 NVMe 1.3
Tipo de flash 96L 3D eTLC NAND
Largura de banda de leitura (128 KB) MB/s 3527 3521 3577 3578
Largura de banda de gravação (128 KB) MB/s 1322 2499 2570 2559
Leitura Aleatória (4KB) KIOPS 562 805 830 832
Gravação Aleatória (4KB) KIOPS 52 108 121 101
Consumo de energia 7.0/8.5 8.0/9.5 8.5/10.5 8.5/11.5
Latência aleatória de 4K (Típico) R/W μs 86/17
Latência Sequencial 4K (Típico) R/W μs 15/17
Tempo de vida 1 DWPD
Taxa de erro de bit incorrigível (UBER) <10-17
Tempo médio entre falhas (MTBF) 2 milhões de horas
Sistema compatível RHEL, SLES, CentOS, Ubuntu, Windows Server, VMware ESXi
FDA FCC, CE, ROHS, REACH, WEEE, PCI Express, NVM Express

Desempenho DapuStor Haishen3 H3200

Mesa de teste

Nossas análises de SSD corporativo utilizam um Lenovo ThinkSystem SR850 para testes de aplicativos (observação: tivemos que usar uma placa adaptadora em vez de um slot frontal devido a um problema de compatibilidade) e um Dell PowerEdge R740xd para benchmarks sintéticos. O ThinkSystem SR850 é uma plataforma quad-CPU bem equipada, oferecendo potência de CPU bem acima do necessário para enfatizar o armazenamento local de alto desempenho. Os testes sintéticos que não exigem muitos recursos da CPU usam o servidor de processador duplo mais tradicional. Em ambos os casos, a intenção é mostrar o armazenamento local da melhor maneira possível, de acordo com as especificações máximas de unidade do fornecedor de armazenamento.

Lenovo Think System SR850

  • 4 x CPU Intel Platinum 8160 (2.1 GHz x 24 núcleos)
  • 16 x 32GB DDR4-2666Mhz ECC DRAM
  • 2 x placas RAID 930-8i 12 Gb/s
  • 8 compartimentos NVMe
  • VMware ESXI 6.5

Dell PowerEdge R740xd

  • 2 x CPU Intel Gold 6130 (2.1 GHz x 16 núcleos)
  • 4 x 16 GB DDR4-2666 MHz ECC DRAM
  • 1 placa RAID PERC 730 2GB 12Gb/s
  • Adaptador NVMe Complementar
  • Ubuntu-16.04.3-desktop-amd64

Histórico de testes e comparáveis

Laboratório de teste StorageReview Enterprise fornece uma arquitetura flexível para realizar benchmarks de dispositivos de armazenamento corporativo em um ambiente comparável ao que os administradores encontram em implantações reais. O Enterprise Test Lab incorpora uma variedade de servidores, redes, condicionamento de energia e outras infraestruturas de rede que permitem que nossa equipe estabeleça condições do mundo real para avaliar com precisão o desempenho durante nossas análises.

Incorporamos esses detalhes sobre o ambiente de laboratório e protocolos em revisões para que os profissionais de TI e os responsáveis ​​pela aquisição de armazenamento possam entender as condições em que alcançamos os resultados a seguir. Nenhuma de nossas análises é paga ou supervisionada pelo fabricante do equipamento que estamos testando. Detalhes adicionais sobre o Laboratório de teste StorageReview Enterprise e uma visão geral de seus recursos de rede estão disponíveis nessas respectivas páginas.

Análise de carga de trabalho do aplicativo

Para entender as características de desempenho dos dispositivos de armazenamento corporativo, é essencial modelar a infraestrutura e as cargas de trabalho de aplicativos encontradas em ambientes de produção ao vivo. Nossos benchmarks para o DapuStor H3200 são, portanto, os Desempenho OLTP do MySQL via SysBench e Desempenho OLTP do Microsoft SQL Server com uma carga de trabalho TCP-C simulada. Para nossas cargas de trabalho de aplicativos, cada unidade executará de 2 a 4 VMs configuradas de forma idêntica.

Houdini por SideFX

O teste Houdini foi projetado especificamente para avaliar o desempenho do armazenamento no que se refere à renderização CGI. O banco de teste para este aplicativo é uma variante do tipo de servidor central Dell PowerEdge R740xd que usamos no laboratório com CPUs Intel 6130 duplas e DRAM de 64 GB. Nesse caso, instalamos o Ubuntu Desktop (ubuntu-16.04.3-desktop-amd64) executando bare metal. A saída do benchmark é medida em segundos para ser concluída, com menos sendo melhor.

A demonstração do Maelstrom representa uma seção do pipeline de renderização que destaca os recursos de desempenho do armazenamento, demonstrando sua capacidade de usar efetivamente o arquivo de troca como uma forma de memória estendida. O teste não grava os dados do resultado nem processa os pontos para isolar o efeito do tempo decorrido do impacto da latência no componente de armazenamento subjacente. O teste em si é composto por cinco fases, três das quais executamos como parte do benchmark, que são as seguintes:

  • Carrega pontos compactados do disco. Este é o momento de ler do disco. Isso é de thread único, o que pode limitar a taxa de transferência geral.
  • Descompacta os pontos em uma única matriz plana para permitir que sejam processados. Se os pontos não tiverem dependência de outros pontos, o conjunto de trabalho pode ser ajustado para permanecer no núcleo. Esta etapa é multiencadeada.
  • (Not Run) Processa os pontos.
  • Reempacota-os em blocos agrupados adequados para armazenamento em disco. Esta etapa é multiencadeada.
  • (Não executado) Grava os blocos agrupados de volta no disco.

Aqui, o DapuStor H3200 teve um bom desempenho com 2,733 segundos, colocando-o na parte intermediária superior da tabela de classificação, logo atrás do Samsung EVO Plus.

Houdini DapuStor H3200

Desempenho do SQL Server

Cada VM do SQL Server é configurada com dois vDisks: volume de 100 GB para inicialização e um volume de 500 GB para o banco de dados e arquivos de log. Do ponto de vista dos recursos do sistema, configuramos cada VM com 16 vCPUs, 64 GB de DRAM e aproveitamos o controlador LSI Logic SAS SCSI. Embora nossas cargas de trabalho Sysbench testadas anteriormente tenham saturado a plataforma tanto em E/S de armazenamento quanto em capacidade, o teste de SQL procura desempenho de latência.

Este teste usa o SQL Server 2014 em execução em VMs convidadas do Windows Server 2012 R2 e é enfatizado pelo Benchmark Factory para bancos de dados da Quest. StorageReview's Protocolo de teste OLTP do Microsoft SQL Server emprega o rascunho atual do Benchmark C (TPC-C) do Transaction Processing Performance Council, um benchmark de processamento de transações on-line que simula as atividades encontradas em ambientes de aplicativos complexos. O benchmark TPC-C chega mais perto do que os benchmarks sintéticos de desempenho para medir os pontos fortes de desempenho e os gargalos da infraestrutura de armazenamento em ambientes de banco de dados. Cada instância de nossa VM SQL Server para esta revisão usa um banco de dados SQL Server de 333 GB (escala 1,500) e mede o desempenho transacional e a latência sob uma carga de 15,000 usuários virtuais.

Configuração de teste do SQL Server (por VM)

  • Windows Server 2012 R2
  • Ocupação de armazenamento: 600 GB alocados, 500 GB usados
  • SQL Server 2014
    • Tamanho do banco de dados: escala 1,500
    • Carga de cliente virtual: 15,000
    • Memória RAM: 48 GB
  • Duração do teste: 3 horas
    • 2.5 horas de pré-condicionamento
    • período de amostra de 30 minutos

Para nosso benchmark transacional do SQL Server, o DapuStor H3200 obteve uma pontuação de 12,323.6 TPS em 4 VMs.

Na latência média, o DapuStor H3200 apresentou 126.5 ms, significativamente maior do que os outros drives testados.

Desempenho do Sysbench

O próximo benchmark de aplicativo consiste em um Banco de dados MySQL OLTP Percona medida via SysBench. Este teste mede o TPS (transações por segundo) médio, a latência média e também a latência média do 99º percentil.

Cada sysbench A VM é configurada com três vDisks: um para inicialização (~92 GB), um com o banco de dados pré-construído (~447 GB) e o terceiro para o banco de dados em teste (270 GB). Do ponto de vista dos recursos do sistema, configuramos cada VM com 16 vCPUs, 60 GB de DRAM e aproveitamos o controlador LSI Logic SAS SCSI.

Configuração de teste do Sysbench (por VM)

  • CentOS 6.3 64 bits
  • Percona XtraDB 5.5.30-rel30.1
    • Tabelas de banco de dados: 100
    • Tamanho do banco de dados: 10,000,000
    • Segmentos de banco de dados: 32
    • Memória RAM: 24 GB
  • Duração do teste: 3 horas
    • 2 horas de pré-condicionamento 32 tópicos
    • 1 hora 32 tópicos

Olhando para nosso benchmark transacional Sysbench, o DapuStor H3200 postou uma pontuação agregada de 7,879.1 TPS, colocando-o no meio da tabela de classificação.

A latência média do Sysbench viu o H3200 com uma latência de 16.25ms, bem no meio do pacote.

Para nossa latência de pior cenário (99º percentil), o H3200 uma latência de 31.12, que estava bem no meio dos outros dois comparáveis.

Análise de Carga de Trabalho do VDBench

Quando se trata de dispositivos de armazenamento de comparação, o teste de aplicativo é o melhor e o teste sintético vem em segundo lugar. Embora não seja uma representação perfeita das cargas de trabalho reais, os testes sintéticos ajudam a estabelecer a linha de base dos dispositivos de armazenamento com um fator de repetibilidade que facilita a comparação entre soluções concorrentes. Essas cargas de trabalho oferecem uma variedade de perfis de teste diferentes, desde testes de "quatro cantos", testes comuns de tamanho de transferência de banco de dados até capturas de rastreamento de diferentes ambientes VDI. Todos esses testes utilizam o gerador de carga de trabalho vdBench comum, com um mecanismo de script para automatizar e capturar resultados em um grande cluster de teste de computação. Isso nos permite repetir as mesmas cargas de trabalho em uma ampla variedade de dispositivos de armazenamento, incluindo arrays flash e dispositivos de armazenamento individuais. Nosso processo de teste para esses benchmarks preenche toda a superfície da unidade com dados e, em seguida, particiona uma seção da unidade igual a 25% da capacidade da unidade para simular como a unidade pode responder às cargas de trabalho do aplicativo. Isso é diferente dos testes de entropia total, que usam 100% da unidade e os colocam em estado estacionário. Como resultado, esses números refletirão velocidades de gravação sustentadas mais altas.

perfis:

  • Leitura aleatória em 4K: 100% de leitura, 128 threads, 0-120% de atualização
  • Gravação aleatória em 4K: 100% de gravação, 64 threads, 0-120% de atualização
  • Leitura sequencial de 64K: 100% de leitura, 16 threads, 0-120% iorado
  • Gravação sequencial de 64K: 100% gravação, 8 threads, 0-120% iorado
  • Banco de Dados Sintético: SQL e Oracle
  • Clone completo de VDI e rastreamentos de clone vinculados

Comparáveis:

Em nossa primeira análise de carga de trabalho VDBench, Random 4K Read, o H3200 teve uma pontuação de pico sólida de 788,014 IOPS com uma latência de 158.3 µs, que estava perto do topo do pacote.DapuStor H3200 leitura 4kPara gravação aleatória de 4K, o H3200 atingiu 274,362 IOPS com uma latência de 462µs, tendo uma grande queda no desempenho em torno da marca de 240K.

Mudando para cargas de trabalho sequenciais de 64k, o H3200 apresentou ótimos resultados com desempenho máximo de 52,860 IOPS (ou 3.3 GB/s) com latência de 301.8 ms.

DapuStor H3200 leitura 64kNa gravação de 64k, embora o SSD DapuStor H3200 de 3.84 TB tenha ficado na parte inferior da tabela de classificação, atingindo 22,200 IOPS (ou 1.4 GB/s) e 708 ms, este último que estava de longe entre as pontuações de latência mais altas (logo abaixo da unidade Samsung ).

Nosso próximo conjunto de testes são nossas cargas de trabalho SQL: SQL, SQL 90-10 e SQL 80-20. Começando com SQL, o DapuStor H3200 foi de longe o drive mais bem testado durante todo o teste, onde atingiu um pico de 281,512 IOPS com uma latência de apenas 113.2 µs.

DapuStor H3200sqlNo SQL 80-20, o H3200 novamente apresentou ótimo desempenho com pico de 246,601 IOPS e 128.4µs.

Com o SQL 90-10, o H3200 continuou a mostrar um desempenho impressionante, chegando a 269,251 IOPS com uma latência de 118.2 µs para o primeiro lugar.

A seguir estão nossas cargas de trabalho Oracle: Oracle, Oracle 90-10 e Oracle 80-20. Começando com o Oracle, o DapuStor H3200 atingiu o pico com 232,468 IOPS com uma latência de 154.7 µs, o que foi bom o suficiente para o 3º lugar geral.

DapuStor H3200 oráculoO Oracle 90-10 nos mostrou mais do que foi dito acima, o DapuStor H3200 voltou ao primeiro lugar com um desempenho máximo de 214,076 IOPS a 102.1 µs.

Com o Oracle 80-20, o H3200 foi novamente o de melhor desempenho, chegando a 204,281 IOPS com uma latência de 107.1 µs.

Em seguida, mudamos para nosso teste de clone VDI, Full and Linked. Para VDI Full Clone (FC) Boot, o DapuStor H3200 teve um pico de 188,260 IOPS com uma latência de 183.3 µs atrás apenas do Memblaze.

Inicialização DapuStor H3200 vdi fcO login inicial do VDI FC viu o pico do DapuStor H3200 em 81,510 IOPS com uma latência de 363.9 µs, desta vez bem atrás das unidades Memblaze e Huawei.

Para o VDI FC Monday Login, o DapuStor H3200 atingiu o pico de 68,280 IOPS com uma latência de 232.8 µs, novamente bem atrás dos líderes.

Para VDI Linked Clone (LC) Boot, o DapuStor H3200 ficou em segundo lugar com uma pontuação máxima de 93,152 IOPS com uma latência de 171.2 µs.

Inicialização DapuStor H3200 vdi lcO VDI LC Initial Login mostrou uma pontuação máxima de 40,228 IOPS com uma latência de 196.6 µs, mostrando um desempenho muito semelhante ao da unidade Intel P4610.

Por fim, com o VDI LC Monday Login, o DapuStor H3200 apresentou desempenho intermediário com 50,330 IOPS com uma latência de 315.3 µs.

Conclusão

O DapuStor H3200 é o mais recente SSD NVMe da empresa que apresenta 96D eTLC NAND de 3 camadas, que é subdividido em duas categorias diferentes, os fatores de forma U.2 e HHHL. Alimentado por um controlador Marvell, o H3200 também vem em uma variedade de modelos de alta capacidade, incluindo 960 GB, 1.92 TB, 3.84 TB e até 7.68 TB, permitindo uma variedade de opções de implantação flexíveis para manter os custos baixos.

Durante nossos testes, comparamos a unidade com uma variedade de outros SSDs, incluindo o Memblaze PBlaze C926, o Huawei ES3000 e o Intel P4610. Para análise de carga de trabalho do aplicativo, vimos o DapuStor H3200 atingir 12,323.6 TPS em 4 VMs 126.5 ms em latência média, que foi significativamente maior do que as outras unidades testadas. Para Sysbench, a unidade atingiu 7,879.1 TPS, latência média de 16.25 ms e latência de pior cenário de 31.23 ms, todos desempenhos intermediários.

Durante nosso teste VDbench, os destaques incluíram: 788,014 IOPS na leitura de 4K, 274,362 IOPS na gravação de 4K, 3.3 GB/s na leitura de 64 K e 1.4 GB/s na gravação de 64 K. Em cargas de trabalho SQL, atingiu 281,512 IOPS enquanto atingiu 269,251 IOPS para SQL 90-10 e 246,601 IOPS para SQL 80-20, colocando-o no topo da tabela de classificação em todas as três categorias. O DapuStor manteve seu sólido desempenho em cargas de trabalho Oracle com 232,468 IOPS, 214,076 IOPS no Oracle 90-10 e 204,281 IOPS no Oracle 80-20. Em nossos testes VDI Full Clone, o H3200 atingiu 188,260 IOPS (inicialização), 81,510 IOPS (login inicial), 68,280 IOPS (login na segunda-feira), enquanto o Linked Clone registrou 93,152 IOPS (inicialização), 40,228 IOPS (login inicial) e 50,330 IOPS ( login de segunda-feira).

No geral, o desempenho do DapuStor H3200 foi um pouco desigual: foi sólido durante nossos testes sintéticos, mas ficou atrás do pacote na carga de trabalho do aplicativo SQL Server.

DapuStorGenericName

Discuta no Reddit

Envolva-se com a StorageReview

Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | Facebook | RSS feed