A série PBlaze5 916 é uma linha 64D NAND de alto desempenho de 3 camadas de SSDs NVMe com foco na eficiência energética para data centers. Ele tem os suspeitos usuais para recursos corporativos, incluindo criptografia de dados AES 256, proteção completa do caminho de dados e proteção aprimorada contra falhas de energia, ajudando a proteger os aplicativos corporativos críticos. A série 916 vem nos formatos U.2.5 e HHHL AIC de 2 polegadas, o primeiro que estamos analisando para esta análise.
A série PBlaze5 916 é uma linha 64D NAND de alto desempenho de 3 camadas de SSDs NVMe com foco na eficiência energética para data centers. Ele tem os suspeitos usuais para recursos corporativos, incluindo criptografia de dados AES 256, proteção completa do caminho de dados e proteção aprimorada contra falhas de energia, ajudando a proteger os aplicativos corporativos críticos. A série 916 vem nos formatos U.2.5 e HHHL AIC de 2 polegadas, o primeiro que estamos analisando para esta análise.
O PBlaze5 916 possui 16 configurações de modo de energia (que variam de 10W a 25W) e uma chave de modo de energia que permite aos usuários mover rapidamente entre diferentes níveis em um milissegundo. Além disso, a nova linha Memblaze SSD oferece suporte à função TRIM de classe empresarial, que garante que dados antigos cortados fiquem inacessíveis para novos usuários. Também melhora o desempenho e a resistência.
No que diz respeito ao desempenho, o modelo U.5 da série PBlaze916 2 atinge até 3.5 GB/s em leituras e gravações para o modelo de 6.4 GB, enquanto leituras e gravações aleatórias devem atingir 830,000 IOPS e 303,000 IOPS, respectivamente. Em termos de resistência, suporta até 3 DWPD, enquanto o PBlaze5 910 suporta apenas 1 DWPD.
Ambos os fatores de forma da série PBlaze5 916 vêm em duas capacidades de 3.2 TB e 6.4 TB. Estaremos olhando para o modelo de 3.2 TB para esta revisão.
Memblaze PBlaze5 916 Series U.2 Especificações
Capacidade do usuário (TB) | 3.2, 6.4 |
Fator de Forma | U.2.5 de 2 polegadas |
Interface: | PCIe 3.0 x 4 |
Leitura sequencial (128 KB) (GB/s) | 3.5, 3.5 |
Gravação sequencial (128 KB) (GB/s) | 3.1, 3.5 |
IOPS de leitura aleatória sustentada (4 KB) | 835K, 830K |
Gravação aleatória sustentada (4 KB) IOPS (estado estacionário) | 210K, 303K |
Latência de Leitura/Gravação | 87/11μs |
Resistência vitalícia | 3 DWPD |
UBER | <10-17 |
MTBF | 2 milhões de horas |
Protocolo | NVMe 1.2a |
Memória flash NAND | 3D eTLC NAND |
Sistema operacional | RHEL, SLES, CentOS, Ubuntu, Windows Server, VMware ESXi |
Consumo de energia | 7 ~ 25 W |
Suporte a recursos básicos | Proteção contra falha de energia, Hot Pluggable, Proteção completa do caminho de dados, SMART: TRIM, Multi-namespace, AES 256 Data Encryption, Fast Reboot, Crypto Erase, |
Suporte a recursos avançados | TRIM, Multi-namespace, criptografia de dados AES 256, reinicialização rápida, apagamento de criptografia, porta dupla |
Suporte de software | Ferramenta de gerenciamento de código aberto, ferramenta de depuração CLI, driver nativo do sistema operacional (Fácil integração do sistema) |
Desempenho
Mesa de teste
Nossas análises de SSD corporativo utilizam um Lenovo ThinkSystem SR850 para testes de aplicativos e um Dell PowerEdge R740xd para benchmarks sintéticos. O ThinkSystem SR850 é uma plataforma quad-CPU bem equipada, oferecendo potência de CPU bem acima do necessário para enfatizar o armazenamento local de alto desempenho. Os testes sintéticos que não exigem muitos recursos da CPU usam o servidor de processador duplo mais tradicional. Em ambos os casos, a intenção é mostrar o armazenamento local da melhor maneira possível, de acordo com as especificações máximas de unidade do fornecedor de armazenamento.
Lenovo Think System SR850
- 4 x CPU Intel Platinum 8160 (2.1 GHz x 24 núcleos)
- 16 x 32GB DDR4-2666Mhz ECC DRAM
- 2 x placas RAID 930-8i 12 Gb/s
- 8 compartimentos NVMe
- VMware ESXI 6.5
Dell PowerEdge R740xd
- 2 x CPU Intel Gold 6130 (2.1 GHz x 16 núcleos)
- 4 x 16 GB DDR4-2666 MHz ECC DRAM
- 1 placa RAID PERC 730 2GB 12Gb/s
- Adaptador NVMe Complementar
- Ubuntu-16.04.3-desktop-amd64
Histórico de testes e comparáveis
A Laboratório de teste StorageReview Enterprise fornece uma arquitetura flexível para realizar benchmarks de dispositivos de armazenamento corporativo em um ambiente comparável ao que os administradores encontram em implantações reais. O Enterprise Test Lab incorpora uma variedade de servidores, redes, condicionamento de energia e outras infraestruturas de rede que permitem que nossa equipe estabeleça condições do mundo real para avaliar com precisão o desempenho durante nossas análises.
Incorporamos esses detalhes sobre o ambiente de laboratório e protocolos em revisões para que os profissionais de TI e os responsáveis pela aquisição de armazenamento possam entender as condições em que alcançamos os resultados a seguir. Nenhuma de nossas análises é paga ou supervisionada pelo fabricante do equipamento que estamos testando. Detalhes adicionais sobre o Laboratório de teste StorageReview Enterprise e uma visão geral de seus recursos de rede estão disponíveis nas respectivas páginas.
Comparáveis para esta revisão:
- Memblaze PBlaze5 3.2TB
- Toshiba PX04 1.6 TB
- Samsung PM1725a 1.6 TB
- Elemento Líquido AIC 7.68 TB
- SSD Intel DC P4610 1.6 TB
- Huawei ES3000 V5 3.2 TB
- SSD Intel DC P4510 2 TB, 8 TB
Análise de carga de trabalho do aplicativo
Para entender as características de desempenho dos dispositivos de armazenamento corporativo, é essencial modelar a infraestrutura e as cargas de trabalho de aplicativos encontradas em ambientes de produção ao vivo. Nossos benchmarks para o Memblaze PBlaze5 916 são, portanto, os Desempenho OLTP do MySQL via SysBench e Desempenho OLTP do Microsoft SQL Server com uma carga de trabalho TCP-C simulada. Para nossas cargas de trabalho de aplicativos, cada unidade executará de 2 a 4 VMs configuradas de forma idêntica.
Desempenho do SQL Server
Cada VM do SQL Server é configurada com dois vDisks: volume de 100 GB para inicialização e um volume de 500 GB para o banco de dados e arquivos de log. Do ponto de vista dos recursos do sistema, configuramos cada VM com 16 vCPUs, 64 GB de DRAM e aproveitamos o controlador LSI Logic SAS SCSI. Embora nossas cargas de trabalho Sysbench testadas anteriormente tenham saturado a plataforma tanto em E/S de armazenamento quanto em capacidade, o teste de SQL procura desempenho de latência.
Este teste usa o SQL Server 2014 em execução em VMs convidadas do Windows Server 2012 R2 e é enfatizado pelo Benchmark Factory para bancos de dados da Quest. StorageReview's Protocolo de teste OLTP do Microsoft SQL Server emprega o rascunho atual do Benchmark C (TPC-C) do Transaction Processing Performance Council, um benchmark de processamento de transações on-line que simula as atividades encontradas em ambientes de aplicativos complexos. O benchmark TPC-C chega mais perto do que os benchmarks sintéticos de desempenho para medir os pontos fortes de desempenho e os gargalos da infraestrutura de armazenamento em ambientes de banco de dados. Cada instância de nossa VM SQL Server para esta revisão usa um banco de dados SQL Server de 333 GB (escala 1,500) e mede o desempenho transacional e a latência sob uma carga de 15,000 usuários virtuais.
Configuração de teste do SQL Server (por VM)
- Windows Server 2012 R2
- Ocupação de armazenamento: 600 GB alocados, 500 GB usados
- SQL Server 2014
- Tamanho do banco de dados: escala 1,500
- Carga de cliente virtual: 15,000
- Memória RAM: 48 GB
- Duração do teste: 3 horas
- 2.5 horas de pré-condicionamento
- período de amostra de 30 minutos
Para nosso benchmark transacional do SQL Server, o Memblaze PBlaze5 916 postou 12,644 TPS, um pouco atrás do 910 AIC que registrou 12,645.1 TPS.
O 916 apresentou bons resultados de latência com apenas 2.0ms; no entanto, ainda ficou atrás do 910 AIC, que tinha 1.0ms.
Desempenho do Sysbench
O próximo benchmark de aplicativo consiste em um Banco de dados MySQL OLTP Percona medida via SysBench. Este teste mede o TPS (transações por segundo) médio, a latência média e também a latência média do 99º percentil.
Cada sysbench A VM é configurada com três vDisks: um para inicialização (~92 GB), um com o banco de dados pré-construído (~447 GB) e o terceiro para o banco de dados em teste (270 GB). Do ponto de vista dos recursos do sistema, configuramos cada VM com 16 vCPUs, 60 GB de DRAM e aproveitamos o controlador LSI Logic SAS SCSI.
Configuração de teste do Sysbench (por VM)
- CentOS 6.3 64 bits
- Percona XtraDB 5.5.30-rel30.1
- Tabelas de banco de dados: 100
- Tamanho do banco de dados: 10,000,000
- Segmentos de banco de dados: 32
- Memória RAM: 24 GB
- Duração do teste: 3 horas
- 2 horas de pré-condicionamento 32 tópicos
- 1 hora 32 tópicos
Com o benchmark transacional Sysbench, o 916 manteve seu desempenho sólido com 8,532.2 TPS, o que o colocou na parte intermediária da tabela de classificação.
Com latência média do Sysbench, o 916 ficou em quarto lugar entre os comparáveis com 15ms.
Em nosso benchmark de latência de pior cenário, o 916 ficou em quarto lugar novamente com 27.7 ms, embora, como nos outros, não estivesse muito atrás dos líderes.
Houdini por SideFX
O teste Houdini foi projetado especificamente para avaliar o desempenho do armazenamento no que se refere à renderização CGI. O banco de teste para esta aplicação é uma variante do núcleo Dell PowerEdge R740xd tipo de servidor que usamos no laboratório com duas CPUs Intel 6130 e DRAM de 64 GB. Nesse caso, instalamos o Ubuntu Desktop (ubuntu-16.04.3-desktop-amd64) executando bare metal. A saída do benchmark é medida em segundos para ser concluída, com menos sendo melhor.
A demonstração do Maelstrom representa uma seção do pipeline de renderização que destaca os recursos de desempenho do armazenamento, demonstrando sua capacidade de usar efetivamente o arquivo de troca como uma forma de memória estendida. O teste não grava os dados do resultado nem processa os pontos para isolar o efeito do tempo decorrido do impacto da latência no componente de armazenamento subjacente. O teste em si é composto por cinco fases, três das quais executamos como parte do benchmark, que são as seguintes:
- Carrega pontos compactados do disco. Este é o momento de ler do disco. Isso é de thread único, o que pode limitar a taxa de transferência geral.
- Descompacta os pontos em uma única matriz plana para permitir que sejam processados. Se os pontos não tiverem dependência de outros pontos, o conjunto de trabalho pode ser ajustado para permanecer no núcleo. Esta etapa é multiencadeada.
- (Not Run) Processa os pontos.
- Reempacota-os em blocos agrupados adequados para armazenamento em disco. Esta etapa é multiencadeada.
- (Não executado) Grava os blocos agrupados de volta no disco.
Com o teste de Houdini, o 916 se classificou de médio a superior com 2,839.7 segundos, que também foi o melhor desempenho entre todos os produtos Memblaze testados.
Análise de Carga de Trabalho do VDBench
Quando se trata de dispositivos de armazenamento de comparação, o teste de aplicativo é o melhor e o teste sintético vem em segundo lugar. Embora não seja uma representação perfeita das cargas de trabalho reais, os testes sintéticos ajudam a estabelecer a linha de base dos dispositivos de armazenamento com um fator de repetibilidade que facilita a comparação entre soluções concorrentes. Essas cargas de trabalho oferecem uma variedade de perfis de teste diferentes, desde testes de "quatro cantos", testes comuns de tamanho de transferência de banco de dados até capturas de rastreamento de diferentes ambientes VDI. Todos esses testes utilizam o gerador de carga de trabalho vdBench comum, com um mecanismo de script para automatizar e capturar resultados em um grande cluster de teste de computação. Isso nos permite repetir as mesmas cargas de trabalho em uma ampla variedade de dispositivos de armazenamento, incluindo arrays flash e dispositivos de armazenamento individuais. Nosso processo de teste para esses benchmarks preenche toda a superfície da unidade com dados e, em seguida, particiona uma seção da unidade igual a 25% da capacidade da unidade para simular como a unidade pode responder às cargas de trabalho do aplicativo. Isso é diferente dos testes de entropia total, que usam 100% da unidade e os colocam em estado estacionário. Como resultado, esses números refletirão velocidades de gravação sustentadas mais altas.
perfis:
- Leitura aleatória em 4K: 100% de leitura, 128 threads, 0-120% de atualização
- Gravação aleatória em 4K: 100% de gravação, 64 threads, 0-120% de atualização
- Leitura sequencial de 64K: 100% de leitura, 16 threads, 0-120% iorado
- Gravação sequencial de 64K: 100% gravação, 8 threads, 0-120% iorado
- Banco de Dados Sintético: SQL e Oracle
- Clone completo de VDI e rastreamentos de clone vinculados
Em nossa primeira análise de carga de trabalho VDBench, leitura aleatória de 4K, o Memblaze PBlaze5 916 conseguiu ficar abaixo de 1 ms durante o teste com um pico de 664,910 IOPS e uma latência de 191.4 μs, ficando em terceiro lugar (embora muito atrás das duas unidades líderes).
O desempenho de gravação aleatória de 4K mostrou latência abaixo de milissegundos durante todo o teste novamente. Aqui, o 916 apresentou desempenho máximo de 489,619 IOPS e uma latência de 258.7 μs. Isso foi bom o suficiente para o primeiro lugar entre os comparáveis.
Mudando para cargas de trabalho sequenciais, o 916 ficou próximo ao final do pacote em leituras sequenciais de 64K com pontuação máxima de 38,275 IOPS ou 2.4 GB/s com latência de 418 μs.
O 916 atingiu um pico de 33,715 IOPS ou 2.11 GB/s com uma latência de 368μs na gravação sequencial de 64K, colocando-o em primeiro lugar por uma grande margem.
Passando para cargas de trabalho SQL, o 916 atingiu o pico de 250,053 IOPS com apenas 127.6 μs de latência, o que o colocou no topo da tabela de classificação.
O SQL 90-10 viu que o 916 estava lado a lado com o Huawei ES3000, chegando a 248,229 IOPS e uma latência de 128.4 μs.
O 916 atingiu o pico de 246,510 IOPS com uma latência de 129.1 μs no benchmark SQL 80-20, mantendo-o próximo ao topo da tabela de classificação ao lado do Huawei novamente.
Em nossa carga de trabalho Oracle, o 916 continuou a ter um bom desempenho com uma pontuação máxima de 243,041 IOPS e uma latência de 146.8 μs, logo atrás da unidade Huawei.
Para o Oracle 90-10, o 916 apresentou um pico de 189,276 IOPS e uma latência de 115.7 μs para o primeiro lugar.
O 916 teve um bom desempenho novamente em nosso último teste Oracle (80-20) com um desempenho máximo impressionante de 192,998 IOPS e uma latência de 113.4μs.
Em seguida, passamos para nosso benchmark de clone VDI, Full and Linked, onde o PBlaze5 916 mostrou ótimo desempenho por toda parte e logo atrás da unidade Huawei. Para VDI Full Clone Boot, o 916 teve um desempenho máximo de 182,646 IOPS e uma latência de 191.4 μs.
O VDI FC Initial Login viu o 916 com um desempenho máximo de 107,565 IOPS e uma latência de 276μs.
Com o VDI FC Monday Login, o 916 terminou em 2º lugar atrás do drive da Huawei com 84,663 IOPS e uma latência de 187.1μs.
Mudando para Linked Clone (LC), primeiro examinamos o teste de inicialização. Aqui, o 916 ficou em segundo lugar com 86,488 IOPS e latência de 184.4μs.
O login inicial do VDI LC mostrou 48,524 IOPS e uma latência de 162.5 μs para o 916, colocando-o novamente em segundo lugar.
No teste VDI LC Monday Login, o 916 registrou um pico de 65,837 IOPS e uma latência de 240.5μs.
Conclusão
Disponível nos formatos U.2 e AIC, o PBlaze5 916 faz parte da linha de unidades de data center da Memblaze com suporte para 3 DWPD, uma oferta de maior resistência em comparação com o PBlaze5 910 que suporta apenas 1 DWPD. Possui tecnologia NAND 64D de 3 camadas e suporta criptografia de dados AES 256, proteção completa do caminho de dados e proteção aprimorada contra falha de energia, o conjunto usual de recursos de nível empresarial. Para esta revisão, analisamos o modelo U.2, que vem com capacidades de 3.2 TB e 6.4 TB, e citamos velocidades máximas de 3.5 GB/s para leituras e gravações. O Memblaze também afirma até 835,000 IOPS em leituras aleatórias sustentadas para o modelo de maior capacidade.
No geral, o desempenho mostrou resultados sólidos do modelo 916 de 3.2 TB, mesmo com as limitações de largura de banda de sua interface U.2 (x4 canais vs. um AIC x8). Em nossos benchmarks do SQL Server, a taxa de transferência atingiu 12,644 TPS, enquanto a latência média atingiu impressionantes 2.0 ms. No Sysbench, a unidade Memblaze teve um bom desempenho com 8,532.2 TPS, latência média de 15ms e uma latência de pior cenário de 27.7ms. Em nosso benchmark Houdini by SideFX, o 916 ficou no meio da parte superior da tabela de classificação com 2,839.7 segundos, que também foi o produto Memblaze de melhor desempenho que analisamos para este benchmark.
Em nossos benchmarks VDBench, o 916 U.2 manteve uma latência abaixo de um milissegundo em todos os nossos testes, onde estava no topo ou próximo a ele em muitas de nossas categorias. Os destaques incluem 665K IOPS em leitura de 4K, 490K IOPS em gravação de 4K, 2.4GB/s de leitura de 64K e 2.11GB/s de gravação de 64K. Para nossos testes de SQL, o 916 U.2 flutuou em torno de um quarto de milhão de IOPS em todos os três testes. A Oracle obteve bons resultados com 243 IOPS, 189 IOPS em 90-10 e 193 IOPS em 80-20.
O SSD PBlaze5 916 U.2 é outro forte desempenho da Memblaze. O SSD 916 atende à necessidade de maior desempenho e resistência, colocando-se no topo de quase todos os nossos testes quando comparado a outras unidades U.2. Como os data centers precisam cada vez mais de capacidade e velocidade, o Memblaze PBlaze5 916 U.2 se torna uma opção muito atraente.
Inscreva-se no boletim informativo StorageReview