O DapuStor Haishen3 é o SSD empresarial NVMe da empresa. A linha vem em dois modelos, o DapuStor H3200 SSD (revisado aqui) e o SSD DapuStor H3100 que estamos analisando hoje. Ambos os dois tipos de unidade têm os mesmos casos de uso que incluem: sistemas de servidor e armazenamento, data centers, vigilância por vídeo, fotografia profissional, streaming, computação de borda e personalização.
O DapuStor Haishen3 é o SSD empresarial NVMe da empresa. A linha vem em dois modelos, o DapuStor H3200 SSD (revisado aqui) e o SSD DapuStor H3100 que estamos analisando hoje. Ambos os dois tipos de unidade têm os mesmos casos de uso que incluem: sistemas de servidor e armazenamento, data centers, vigilância por vídeo, fotografia profissional, streaming, computação de borda e personalização.
O H3100, como o H3200, apresenta o mais recente 96L 3D eTLC NAND e é alimentado por um controlador Marvell empresarial. A série H3200 vai até 6.4 TB, com 800 GB no limite inferior. A unidade é oferecida nos formatos U.2 e HHHL. Existem algumas diferenças de desempenho aqui e ali no desempenho citado, mas a grande diferença é o DWPD, com o H3100 tendo 3 DWPD contra o H3200 tendo apenas 1 DWPD.
O SSD DapuStor H3100 vem em capacidades de 800 GB, 1.6 TB, 3.2 TB e 6.4 TB. Para esta análise, estamos analisando o modelo de 3.2 TB.
Especificações do SSD DapuStor H3100
Modelo n | H3200 | |||
Capacidade (TB) | 0.8 | 1.6 | 3.2 | 6.4 |
Fator de Forma | U.2 & HHHL | |||
Protocolo de Interface | PCIe3.0 x 4 NVMe 1.3 | |||
Tipo de flash | 96L 3D eTLC NAND | |||
Largura de banda de leitura (128 KB) MB/s | 3522 | 3529 | 3528 | 3529 |
Largura de banda de gravação (128 KB) MB/s | 1330 | 2521 | 2603 | 2553 |
Leitura Aleatória (4KB) KIOPS | 563 | 806 | 803 | 803 |
Gravação Aleatória (4KB) KIOPS | 122 | 242 | 250 | 213 |
Consumo de energia | 7.0/8.5 | 7.0/9.5 | 7.0/10.5 | 7.0/11.5 |
Latência aleatória de 4K (Típico) R/W μs | 87/17 | |||
Latência Sequencial 4K (Típico) R/W μs | 15/17 | |||
Tempo de vida | 3 DWPD | |||
Taxa de erro de bit incorrigível (UBER) | <10-17 | |||
Tempo médio entre falhas (MTBF) | 2 milhões de horas | |||
Sistema compatível | RHEL, SLES, CentOS, Ubuntu, Windows Server, VMware ESXi | |||
FDA | FCC, CE, ROHS, REACH, WEEE, PCI Express, NVM Express |
Desempenho do SSD DapuStor H3100
Mesa de teste
Nossas análises de SSD corporativo aproveitam um Lenovo Think System SR850 para testes de aplicativos (Nota: tivemos que usar uma placa adaptadora em vez de um slot frontal devido a um problema de compatibilidade) e um Dell PowerEdge R740xd para benchmarks sintéticos. O ThinkSystem SR850 é uma plataforma quad-CPU bem equipada, oferecendo potência de CPU bem acima do necessário para enfatizar o armazenamento local de alto desempenho. Os testes sintéticos que não exigem muitos recursos da CPU usam o servidor de processador duplo mais tradicional. Em ambos os casos, a intenção é mostrar o armazenamento local da melhor maneira possível, de acordo com as especificações máximas de unidade do fornecedor de armazenamento.
Lenovo Think System SR850
- 4 x CPU Intel Platinum 8160 (2.1 GHz x 24 núcleos)
- 16 x 32GB DDR4-2666Mhz ECC DRAM
- 2 x placas RAID 930-8i 12 Gb/s
- 8 compartimentos NVMe
- VMware ESXI 6.5
Dell PowerEdge R740xd
- 2 x CPU Intel Gold 6130 (2.1 GHz x 16 núcleos)
- 4 x 16 GB DDR4-2666 MHz ECC DRAM
- 1 placa RAID PERC 730 2GB 12Gb/s
- Adaptador NVMe Complementar
- Ubuntu-16.04.3-desktop-amd64
Histórico de testes e comparáveis
A Laboratório de teste StorageReview Enterprise fornece uma arquitetura flexível para realizar benchmarks de dispositivos de armazenamento corporativo em um ambiente comparável ao que os administradores encontram em implantações reais. O Enterprise Test Lab incorpora uma variedade de servidores, redes, condicionamento de energia e outras infraestruturas de rede que permitem que nossa equipe estabeleça condições do mundo real para avaliar com precisão o desempenho durante nossas análises.
Incorporamos esses detalhes sobre o ambiente de laboratório e protocolos em revisões para que os profissionais de TI e os responsáveis pela aquisição de armazenamento possam entender as condições em que alcançamos os resultados a seguir. Nenhuma de nossas análises é paga ou supervisionada pelo fabricante do equipamento que estamos testando. Detalhes adicionais sobre o Laboratório de teste StorageReview Enterprise e uma visão geral de seus recursos de rede estão disponíveis nessas respectivas páginas.
Análise de carga de trabalho do aplicativo
Para entender as características de desempenho dos dispositivos de armazenamento corporativo, é essencial modelar a infraestrutura e as cargas de trabalho de aplicativos encontradas em ambientes de produção ao vivo. Nossos benchmarks para o DapuStor H3100 são, portanto, os Desempenho OLTP do MySQL via SysBench e Desempenho OLTP do Microsoft SQL Server com uma carga de trabalho TCP-C simulada. Para nossas cargas de trabalho de aplicativos, cada unidade executará de 2 a 4 VMs configuradas de forma idêntica.
Houdini por SideFX
O teste Houdini foi projetado especificamente para avaliar o desempenho do armazenamento no que se refere à renderização CGI. O banco de teste para este aplicativo é uma variante do tipo de servidor central Dell PowerEdge R740xd que usamos no laboratório com CPUs Intel 6130 duplas e DRAM de 64 GB. Nesse caso, instalamos o Ubuntu Desktop (ubuntu-16.04.3-desktop-amd64) executando bare metal. A saída do benchmark é medida em segundos para ser concluída, com menos sendo melhor.
A demonstração do Maelstrom representa uma seção do pipeline de renderização que destaca os recursos de desempenho do armazenamento, demonstrando sua capacidade de usar efetivamente o arquivo de troca como uma forma de memória estendida. O teste não grava os dados do resultado nem processa os pontos para isolar o efeito do tempo decorrido do impacto da latência no componente de armazenamento subjacente. O teste em si é composto por cinco fases, três das quais executamos como parte do benchmark, que são as seguintes:
- Carrega pontos compactados do disco. Este é o momento de ler do disco. Isso é de thread único, o que pode limitar a taxa de transferência geral.
- Descompacta os pontos em uma única matriz plana para permitir que sejam processados. Se os pontos não tiverem dependência de outros pontos, o conjunto de trabalho pode ser ajustado para permanecer no núcleo. Esta etapa é multiencadeada.
- (Not Run) Processa os pontos.
- Reempacota-os em blocos agrupados adequados para armazenamento em disco. Esta etapa é multiencadeada.
- (Não executado) Grava os blocos agrupados de volta no disco.
Aqui, o DapuStor H3100 teve um tempo de renderização de 2,689.1 segundos, colocando-o próximo ao topo das unidades não Optane.
Desempenho do SQL Server
Cada VM do SQL Server é configurada com dois vDisks: volume de 100 GB para inicialização e um volume de 500 GB para o banco de dados e arquivos de log. Do ponto de vista dos recursos do sistema, configuramos cada VM com 16 vCPUs, 64 GB de DRAM e aproveitamos o controlador LSI Logic SAS SCSI. Embora nossas cargas de trabalho Sysbench testadas anteriormente tenham saturado a plataforma tanto em E/S de armazenamento quanto em capacidade, o teste de SQL procura desempenho de latência.
Este teste usa o SQL Server 2014 em execução em VMs convidadas do Windows Server 2012 R2 e é enfatizado pelo Benchmark Factory para bancos de dados da Quest. StorageReview's Protocolo de teste OLTP do Microsoft SQL Server emprega o rascunho atual do Benchmark C (TPC-C) do Transaction Processing Performance Council, um benchmark de processamento de transações on-line que simula as atividades encontradas em ambientes de aplicativos complexos. O benchmark TPC-C chega mais perto do que os benchmarks sintéticos de desempenho para medir os pontos fortes de desempenho e os gargalos da infraestrutura de armazenamento em ambientes de banco de dados. Cada instância de nossa VM SQL Server para esta revisão usa um banco de dados SQL Server de 333 GB (escala 1,500) e mede o desempenho transacional e a latência sob uma carga de 15,000 usuários virtuais.
Configuração de teste do SQL Server (por VM)
- Windows Server 2012 R2
- Ocupação de armazenamento: 600 GB alocados, 500 GB usados
- SQL Server 2014
-
- Tamanho do banco de dados: escala 1,500
- Carga de cliente virtual: 15,000
- Memória RAM: 48 GB
- Duração do teste: 3 horas
-
- 2.5 horas de pré-condicionamento
- período de amostra de 30 minutos
Para nosso benchmark transacional do SQL Server, o SSD DapuStor H3100 ocupou o primeiro lugar com uma pontuação agregada de 12,646.3 TPS.
Com a latência média do SQL Server, o H3100 ficou em terceiro lugar com 3.5ms
Desempenho do Sysbench
O próximo benchmark de aplicativo consiste em um Banco de dados MySQL OLTP Percona medida via SysBench. Este teste mede o TPS (transações por segundo) médio, a latência média e também a latência média do 99º percentil.
Cada sysbench A VM é configurada com três vDisks: um para inicialização (~92 GB), um com o banco de dados pré-construído (~447 GB) e o terceiro para o banco de dados em teste (270 GB). Do ponto de vista dos recursos do sistema, configuramos cada VM com 16 vCPUs, 60 GB de DRAM e aproveitamos o controlador LSI Logic SAS SCSI.
Configuração de teste do Sysbench (por VM)
- CentOS 6.3 64 bits
- Percona XtraDB 5.5.30-rel30.1
-
- Tabelas de banco de dados: 100
- Tamanho do banco de dados: 10,000,000
- Segmentos de banco de dados: 32
- Memória RAM: 24 GB
- Duração do teste: 3 horas
-
- 2 horas de pré-condicionamento 32 tópicos
- 1 hora 32 tópicos
Olhando para o nosso benchmark transacional Sysbench, o DapuStor H3100 fica bem no meio com uma pontuação agregada de 7,928.1 TPS.
Para a latência média do Sysbench, o H3100 atingiu uma pontuação agregada de 16.14ms, uma pontuação um pouco melhor do que o H3200.
Para nossa latência de pior cenário (99º percentil), o H3100 tem uma latência de 31.2 ms.
Análise de Carga de Trabalho do VDBench
Quando se trata de dispositivos de armazenamento de comparação, o teste de aplicativo é o melhor e o teste sintético vem em segundo lugar. Embora não seja uma representação perfeita das cargas de trabalho reais, os testes sintéticos ajudam a estabelecer a linha de base dos dispositivos de armazenamento com um fator de repetibilidade que facilita a comparação entre soluções concorrentes. Essas cargas de trabalho oferecem uma variedade de perfis de teste diferentes, desde testes de "quatro cantos", testes comuns de tamanho de transferência de banco de dados até capturas de rastreamento de diferentes ambientes VDI. Todos esses testes utilizam o gerador de carga de trabalho vdBench comum, com um mecanismo de script para automatizar e capturar resultados em um grande cluster de teste de computação. Isso nos permite repetir as mesmas cargas de trabalho em uma ampla variedade de dispositivos de armazenamento, incluindo arrays flash e dispositivos de armazenamento individuais. Nosso processo de teste para esses benchmarks preenche toda a superfície da unidade com dados e, em seguida, particiona uma seção da unidade igual a 25% da capacidade da unidade para simular como a unidade pode responder às cargas de trabalho do aplicativo. Isso é diferente dos testes de entropia total, que usam 100% da unidade e os colocam em estado estacionário. Como resultado, esses números refletirão velocidades de gravação sustentadas mais altas.
perfis:
- Leitura aleatória em 4K: 100% de leitura, 128 threads, 0-120% de atualização
- Gravação aleatória em 4K: 100% de gravação, 64 threads, 0-120% de atualização
- Leitura sequencial de 64K: 100% de leitura, 16 threads, 0-120% iorado
- Gravação sequencial de 64K: 100% gravação, 8 threads, 0-120% iorado
- Banco de Dados Sintético: SQL e Oracle
- Clone completo de VDI e rastreamentos de clone vinculados
Comparáveis:
Em nossa primeira análise de carga de trabalho VDBench, leitura aleatória de 4K, o DapuStor H3100 funcionou quase da mesma forma que o H3200 com desempenho máximo de 789,572 IOPS e latência de 159.9 µs.
Na gravação aleatória de 4K, o H3100 mostrou um desempenho melhor do que o H3200 e ficou no meio com uma pontuação máxima de 370,475 IOPS e uma latência de 341.4 µs.
Mudando para cargas de trabalho sequenciais de 64K, o H3100 mais uma vez correu lado a lado com o H3200 com um pico de 52,962 IOPS ou 3.31GB/s com uma latência de 301.6µs em leitura de 64K
Para gravação de 64K, o H3100 ficou em segundo lugar geral com um desempenho máximo de 32,200 IOPS ou 2.0 GB/s com uma latência de 490 µs.
Nosso próximo conjunto de testes são nossas cargas de trabalho SQL: SQL, SQL 90-10 e SQL 80-20. Começando com SQL, o DapuStor H3100 atingiu o pico de 248,214 IOPS com uma latência de 128.1 µs, ocupando o terceiro lugar geral.
SQL 90-10 o H3100 ficou em segundo lugar para o H3200 com um pico de 252,474 IOPS com uma latência de 126.2µs.
Para SQL 80-20, vimos o H3100 ficar logo atrás do H3200 em quarto lugar com 242,861 IOPS e uma latência de 132.1µs.
A seguir estão nossas cargas de trabalho Oracle: Oracle, Oracle 90-10 e Oracle 80-20. Começando com o Oracle, o DapuStor H3100 ficou em segundo lugar com um desempenho máximo de 263,317 IOPS em uma latência de 132.8 µs.
No Oracle 90-10, o H3100 ficou em primeiro lugar com um desempenho máximo de 218,142 IOPS em uma latência de 100.4 µs.
O Oracle 80-20 ficou em primeiro lugar no H3100 mais uma vez, com um desempenho máximo de 212,157 IOPS com 103.1 µs de latência.
Em seguida, mudamos para nosso teste de clone VDI, Full and Linked. Para inicialização VDI Full Clone (FC), o H3100 ficou em segundo lugar geral com um pico de 192,659 IOPS em uma latência de 181.1 µs.
Para VDI FC Initial Login, o H3100 ficou em terceiro lugar com uma pontuação máxima de 115,354 IOPS e uma latência de 257.2 µs.
O VDI FC Monday Login viu o H3100 ficar em terceiro mais uma vez com 87,136 IOPS e uma latência de 181.7 µs.
Para inicialização VDI Linked Clone (LC), o DapuStor H3100 ficou em segundo lugar com 95,726 IOPS e uma latência de 166.5 µs.
O login inicial do VDI LC viu o H3100 atingir o segundo lugar com 50,905 IOPS e 154.9 µs de latência.
Por fim, o VDI LC Monday Login colocou o H3100 em terceiro lugar, com desempenho máximo de 66,846 IOPS e latência de 236.9 µs.
Conclusão
O SSD DapuStor H3100 é a outra unidade corporativa Haishen3 lançada pela empresa. Muito parecido com o H3200 analisado anteriormente, o H3100 é oferecido em fatores de forma U.2 e HHHL que são destinados a uma variedade de casos de uso corporativo. A unidade utiliza 96D eTLC NAND de 3 camadas e vem em capacidades que variam de 800 GB a 6.4 TB. A unidade tem velocidades máximas cotadas de 3.53 GB/s e 803,000 IOPS. Ao contrário do H3200, o H3100 possui 3DWPD.
Olhando para o desempenho, executamos nossos testes Application Workload Analysis e VDBench. No Sysbench, o H3100 teve desempenho semelhante ao H3200, a menos que fosse um teste sensível à latência como o SQL Server. No SQL Server, o H3100 atingiu pontuações agregadas de 12,646.3 TPS e uma latência média de 3.5ms. Para Sysbench, o H3100 teve pontuação agregada de 7,928 TPS, uma latência média de 16.14ms e uma latência de pior cenário de 31.2ms. Para Houdini, a unidade DapuStor ficou perto do topo com 2,689.1 segundos.
Mudando para o VDBench, o DapuStor H3100 foi capaz de acompanhar alguns dos melhores desempenhos em nosso pool de SSD corporativo NVMe e mostrou um desempenho mais forte em gravações do que sua unidade irmã. Os destaques incluem 790K IOPS na leitura de 4K, 370K IOPS na gravação de 4K, 3.31GB/s na leitura de 64K e 2GB/s na gravação de 64K. No SQL, vimos 248K IOPS, 252K IOPS no SQL 90-10 e 243K IOPS no SQL 80-20. A Oracle nos deu 263K IOPS, 218K IOPS Oracle 90-10 e 212K IOPS no Oracle 80-20, ocupando o primeiro lugar nos dois últimos benchmarks. Em nossos testes de clone VDI, o H3100 atinge 193K IOPS na inicialização FC, 115K IOPS no FC Initial Login, 87K IOPS no FC Monday Login, 96K IOPS na inicialização LC, 51K IOPS no LC Initial Login e 67K IOPS no LC Monday Login.
No geral, o DapuStor H3100 pode ficar muito bem com os melhores e oferece melhor desempenho de gravação do que o H3200. Escolher entre os dois seria mais necessário para um determinado caso de uso, mas é uma unidade de alto desempenho com boa capacidade e resistência.
Envolva-se com a StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | Facebook | RSS feed