A Memblaze lançou outra série de SSDs NVMe com o PBlaze5. Isso marca a segunda geração de produtos SSD NVMe da empresa após o PBlaze4. A nova unidade vem em dois formatos, U.2 e HHHL AIC, e em duas séries, as séries 700 e 900. A série 700 tem capacidade de até 11 TB e é voltada para uso em data center. A série 900 tem maior resistência e destina-se a aplicações empresariais.
A Memblaze lançou outra série de SSDs NVMe com o PBlaze5. Isso marca a segunda geração de produtos SSD NVMe da empresa após o PBlaze4. A nova unidade vem em dois formatos, U.2 e HHHL AIC, e em duas séries, as séries 700 e 900. A série 700 tem capacidade de até 11 TB e é voltada para uso em data center. A série 900 tem maior resistência e destina-se a aplicações empresariais.
Ambas as séries são projetadas para a empresa e têm reivindicações de desempenho de velocidades sequenciais de até 6 GB/s com latência de leitura tão baixa quanto 90 μs. Onde as duas séries divergem é que a série 700 tem um custo menor, menor resistência e maior capacidade. A série 900, por outro lado, possui maior resistência, portas duplas para maior disponibilidade e criptografia de dados. Essas principais diferenças se prestam a diferentes casos de uso: bancos de dados, nuvem, hiperescala, SDS, Big Data, renderização 3D para a série 700 e banco de dados de missão crítica, ERP, SAP HANNA, BOSS, bancos, comércio de alta frequência tributária e pagamento on-line para a série 900.
Para esta revisão, veremos o PLaze3.2 da série 2 TB, U.900, 5.
Memblaze PBlaze5 NVMe SSD série 900 especificações:
Fator de Forma | 2.5″ U.2 | HHHL AIC | ||
Interface | PCIe 3.0 x4 | PCIe 3.0 x 8 | ||
Protocolo | NVMe 1.2a | |||
NAND | 3D eTLC NAND | |||
Capacidade | 2TB | 3.2TB | 4TB | 8TB |
Desempenho | ||||
Leitura sequencial (128 KB) | Até 3.2 GB/s | Até 6 GB/s | ||
Gravação sequencial (128 KB) | Até 2.4 GB/s | |||
Leitura aleatória sustentada (4KB/8KB) | Até 760K IOPS | Até 1.042 milhões de IOPS | ||
Gravação aleatória sustentada (4 KB) | Até 304K IOPS | |||
Latência R/W | 90 / 15μs | |||
resistencia | ||||
DWPD | 3 | |||
MTBF | 2.1 milhões de horas | |||
Erro de bit silencioso | <1 erro de setor por 10^23 bits lidos | |||
Taxa de erro de bit incorrigível | <1 erro de setor por 10^17 bits lidos | |||
Consumo de energia | 7 ~ 23W |
Design e Construção
O Memblaze PBlaze5 que estamos analisando é um design de fator de forma U.2.5 de 2”. A unidade possui uma caixa preta sólida e fosca. A parte superior da unidade possui a marca no lado direito.
A parte inferior da unidade é ocupada quase inteiramente por um dissipador de calor.
Em cada extremidade da unidade há aberturas para auxiliar no resfriamento. No lado oposto à interface NVMe, pode-se ver a segunda porta.
Desempenho
Mesa de teste
Nossas análises de SSD corporativo utilizam um Lenovo ThinkSystem SR850 para testes de aplicativos e um Dell PowerEdge R740xd para benchmarks sintéticos. O ThinkSystem SR850 é uma plataforma quad-CPU bem equipada, oferecendo potência de CPU bem acima do necessário para enfatizar o armazenamento local de alto desempenho. Os testes sintéticos que não exigem muitos recursos da CPU usam o servidor de processador duplo mais tradicional. Em ambos os casos, a intenção é mostrar o armazenamento local da melhor maneira possível, de acordo com as especificações máximas de unidade do fornecedor de armazenamento.
Lenovo Think System SR850
- 4 x CPU Intel Platinum 8160 (2.1 GHz x 24 núcleos)
- 16 x 32GB DDR4-2666Mhz ECC DRAM
- 2 x placas RAID 930-8i 12 Gb/s
- 8 compartimentos NVMe
- VMware ESXI 6.5
Dell PowerEdge R740xd
- 2 x CPU Intel Gold 6130 (2.1 GHz x 16 núcleos)
- 16 x 16 GB DDR4-2666 MHz ECC DRAM
- 1 placa RAID PERC 730 2GB 12Gb/s
- Adaptador NVMe Complementar
- Ubuntu-16.04.3-desktop-amd64
Histórico de testes e comparáveis
A Laboratório de teste StorageReview Enterprise fornece uma arquitetura flexível para realizar benchmarks de dispositivos de armazenamento corporativo em um ambiente comparável ao que os administradores encontram em implantações reais. O Enterprise Test Lab incorpora uma variedade de servidores, redes, condicionamento de energia e outras infraestruturas de rede que permitem que nossa equipe estabeleça condições do mundo real para avaliar com precisão o desempenho durante nossas análises.
Incorporamos esses detalhes sobre o ambiente de laboratório e protocolos em revisões para que os profissionais de TI e os responsáveis pela aquisição de armazenamento possam entender as condições em que alcançamos os resultados a seguir. Nenhuma de nossas análises é paga ou supervisionada pelo fabricante do equipamento que estamos testando. Detalhes adicionais sobre o Laboratório de teste StorageReview Enterprise e uma visão geral de seus recursos de rede estão disponíveis nas respectivas páginas.
Comparáveis para esta revisão:
Análise de carga de trabalho do aplicativo
Para entender as características de desempenho dos dispositivos de armazenamento corporativo, é essencial modelar a infraestrutura e as cargas de trabalho de aplicativos encontradas em ambientes de produção ao vivo. Nossos benchmarks para o Memblaze PBlaze5 são, portanto, os Desempenho OLTP do MySQL via SysBench e Desempenho OLTP do Microsoft SQL Server com uma carga de trabalho TCP-C simulada. Para nossas cargas de trabalho de aplicativos, cada unidade executará de 2 a 4 VMs configuradas de forma idêntica.
Desempenho do SQL Server
Cada VM do SQL Server é configurada com dois vDisks: volume de 100 GB para inicialização e um volume de 500 GB para o banco de dados e arquivos de log. Do ponto de vista dos recursos do sistema, configuramos cada VM com 16 vCPUs, 64 GB de DRAM e aproveitamos o controlador LSI Logic SAS SCSI. Embora nossas cargas de trabalho Sysbench testadas anteriormente tenham saturado a plataforma tanto em E/S de armazenamento quanto em capacidade, o teste de SQL procura desempenho de latência.
Este teste usa o SQL Server 2014 em execução em VMs convidadas do Windows Server 2012 R2 e é enfatizado pelo Benchmark Factory para bancos de dados da Quest. StorageReview's Protocolo de teste OLTP do Microsoft SQL Server emprega o rascunho atual do Benchmark C (TPC-C) do Transaction Processing Performance Council, um benchmark de processamento de transações on-line que simula as atividades encontradas em ambientes de aplicativos complexos. O benchmark TPC-C chega mais perto do que os benchmarks sintéticos de desempenho para medir os pontos fortes de desempenho e os gargalos da infraestrutura de armazenamento em ambientes de banco de dados. Cada instância de nossa VM SQL Server para esta revisão usa um banco de dados SQL Server de 333 GB (escala 1,500) e mede o desempenho transacional e a latência sob uma carga de 15,000 usuários virtuais.
Configuração de teste do SQL Server (por VM)
- Windows Server 2012 R2
- Ocupação de armazenamento: 600 GB alocados, 500 GB usados
- SQL Server 2014
- Tamanho do banco de dados: escala 1,500
- Carga de cliente virtual: 15,000
- Memória RAM: 48 GB
- Duração do teste: 3 horas
- 2.5 horas de pré-condicionamento
- período de amostra de 30 minutos
Para nosso benchmark transacional do SQL Server, o Memblaze PBlaze5 ficou em segundo lugar atrás do PBlaze4 com 12,6239.9 TPS. Embora deva ser notado que a diferença nos resultados do mais baixo, HGST SN100, para o mais alto, Memblaze PBlaze4, foi de apenas 41.4 TPS. Também deve ser observado que o memblaze foi executado com o firmware original e depois atualizado ao longo de nossos testes e pode ser visto nos resultados.
Para a latência média do SQL, o PBlaze5 ficou em segundo lugar mais uma vez com 7.5ms de latência, com o PBlaze4 tendo apenas 5ms.
Desempenho do Sysbench
O próximo benchmark de aplicativo consiste em um Banco de dados MySQL OLTP Percona medida via SysBench. Este teste mede o TPS (transações por segundo) médio, a latência média e também a latência média do 99º percentil.
Cada sysbench A VM é configurada com três vDisks: um para inicialização (~92 GB), um com o banco de dados pré-construído (~447 GB) e o terceiro para o banco de dados em teste (270 GB). Do ponto de vista dos recursos do sistema, configuramos cada VM com 16 vCPUs, 60 GB de DRAM e aproveitamos o controlador LSI Logic SAS SCSI.
Configuração de teste do Sysbench (por VM)
- CentOS 6.3 64 bits
- Percona XtraDB 5.5.30-rel30.1
- Tabelas de banco de dados: 100
- Tamanho do banco de dados: 10,000,000
- Segmentos de banco de dados: 32
- Memória RAM: 24 GB
- Duração do teste: 3 horas
- 2 horas de pré-condicionamento 32 tópicos
- 1 hora 32 tópicos
Com o benchmark transacional Sysbench, vimos o Memblaze PBlaze5 ocupar o primeiro lugar com 8,260.5 TPS.
Olhando para a latência média do Sysbench, o PBlaze5 novamente teve a melhor pontuação com 15.5ms.
Em termos de pior cenário de latência do MySQL (99º percentil de latência), o PBlaze5 ficou em primeiro lugar com 29.4 ms.
Houdini por SideFX
O teste Houdini foi projetado especificamente para avaliar o desempenho do armazenamento no que se refere à renderização CGI. O banco de teste para esta aplicação é uma variante do núcleo Dell PowerEdge R740xd tipo de servidor que usamos no laboratório com duas CPUs Intel 6130 e DRAM de 64 GB. Nesse caso, instalamos o Ubuntu Desktop (ubuntu-16.04.3-desktop-amd64) executando bare metal. A saída do benchmark é medida em segundos para ser concluída, com menos sendo melhor.
A demonstração do Maelstrom representa uma seção do pipeline de renderização que destaca os recursos de desempenho do armazenamento, demonstrando sua capacidade de usar efetivamente o arquivo de troca como uma forma de memória estendida. O teste não grava os dados do resultado nem processa os pontos para isolar o efeito do tempo decorrido do impacto da latência no componente de armazenamento subjacente. O teste em si é composto por cinco fases, três das quais executamos como parte do benchmark, que são as seguintes:
- Carrega pontos compactados do disco. Este é o momento de ler do disco. Isso é de thread único, o que pode limitar a taxa de transferência geral.
- Descompacta os pontos em uma única matriz plana para permitir que sejam processados. Se os pontos não tiverem dependência de outros pontos, o conjunto de trabalho pode ser ajustado para permanecer no núcleo. Esta etapa é multiencadeada.
- (Não Executar) Processe os pontos.
- Reempacota-os em blocos agrupados adequados para armazenamento em disco. Esta etapa é multiencadeada.
- (Não executado) Grave os blocos agrupados de volta no disco.
Em nossa carga de trabalho Houdini, o Memblaze PBlaze5 ficou atrás do PBlaze4 e outros do grupo NVMe, com um tempo de renderização de 8 quadros de 3,259 segundos.
Análise de Carga de Trabalho do VDBench
Quando se trata de dispositivos de armazenamento de comparação, o teste de aplicativo é o melhor e o teste sintético vem em segundo lugar. Embora não seja uma representação perfeita das cargas de trabalho reais, os testes sintéticos ajudam a estabelecer a linha de base dos dispositivos de armazenamento com um fator de repetibilidade que facilita a comparação entre soluções concorrentes. Essas cargas de trabalho oferecem uma variedade de perfis de teste diferentes, desde testes de "quatro cantos", testes comuns de tamanho de transferência de banco de dados até capturas de rastreamento de diferentes ambientes VDI. Todos esses testes utilizam o gerador de carga de trabalho vdBench comum, com um mecanismo de script para automatizar e capturar resultados em um grande cluster de teste de computação. Isso nos permite repetir as mesmas cargas de trabalho em uma ampla variedade de dispositivos de armazenamento, incluindo arrays flash e dispositivos de armazenamento individuais. Nosso processo de teste para esses benchmarks preenche toda a superfície da unidade com dados e, em seguida, particiona uma seção da unidade igual a 25% da capacidade da unidade para simular como a unidade pode responder às cargas de trabalho do aplicativo. Isso é diferente dos testes de entropia total, que usam 100% da unidade e os colocam em estado estacionário. Como resultado, esses números refletirão velocidades de gravação sustentadas mais altas.
perfis:
- Leitura aleatória em 4K: 100% de leitura, 128 threads, 0-120% de atualização
- Gravação aleatória em 4K: 100% de gravação, 64 threads, 0-120% de atualização
- Leitura sequencial de 64K: 100% de leitura, 16 threads, 0-120% iorado
- Gravação sequencial de 64K: 100% gravação, 8 threads, 0-120% iorado
- Banco de Dados Sintético: SQL e Oracle
- Clone completo de VDI e rastreamentos de clone vinculados
Em nossa primeira análise de carga de trabalho VDBench, analisamos o desempenho de leitura aleatória de 4K. Todas as unidades testadas tiveram latência abaixo de milissegundos em todo o benchmark. O Memblaze PBlaze5 atingiu um pico de 748,510 IOPS com uma latência de 170 μs, tornando-o de longe o melhor desempenho.
Em seguida, analisamos o desempenho de gravação em 4K, e aqui o PBlaze5 atingiu o pico de 597,647 IOPS e latência de 211μs, novamente o melhor desempenho por uma ampla margem.
Passando para o desempenho sequencial, analisamos nossos benchmarks de 64K. Com leitura sequencial de 64K, o PBlaze5 atingiu o pico de 43,653 IOPS ou 2.72 GB/s com uma latência de 366 μs, novamente ocupando o primeiro lugar.
Para gravação sequencial de 64K, o PBlaze5 liderou o pacote, com pico de 43,352 IOPS ou 2.71 GB/s com latência de 363 μs.
Em seguida, examinamos nossas cargas de trabalho SQL, onde novamente nenhuma unidade ultrapassou a latência de 1ms. O Memblaze PBlaze5 atingiu o pico de 243,899 IOPS com uma latência de 131μs.
Em nosso SQL 90-10, o PBlaze5 continuou a dominar com uma pontuação máxima de 235,428 IOPS e uma latência de 135μs.
O SQL 80-20 mostrou o PBlaze5 na liderança pela maior margem até agora com uma pontuação máxima de 229,029 IOPS com uma latência de 139μs.
As cargas de trabalho Oracle mostraram novamente todas as unidades com desempenho inferior a milissegundos. Na carga de trabalho Oracle, o PBlaze5 atingiu o pico de 277,100 IOPS com uma latência de 157μs.
Com o Oracle 90-10, o PBlaze5 conquistou o primeiro lugar com 178,747 IOPS e uma latência de 123μs.
Nosso último benchmark Oracle, 80-20, mostrou o PBlaze5 com a melhor pontuação máxima de 177,851 IOPS e uma latência de 123μs.
Em seguida, mudamos para nosso teste de clone VDI, Full and Linked. Para VDI Full Clone Boot, o PBlaze5 mais uma vez conquistou o primeiro lugar com um pico de 184,936 IOPS com uma latência de 189μs.
Para VDI FC Initial Login, o PBlaze5 liderou os outros drives com um pico de 118,389 IOPS e uma latência de 251μs.
Com o VDI FC Monday Login, o PBlaze5 teve um desempenho máximo de 75,691 IOPS e uma latência de 209μs.
No teste VDI LC Boot, vimos que o Toshiba PX04 funcionou muito mais próximo do PBlaze5 do que qualquer outro drive até este ponto. O PBlaze5 ainda ficou no topo com uma pontuação máxima de 88,179 IOPS e uma latência de 180μs.
O VDI LC Initial Login viu novamente o PBlaze5 romper com uma pontuação máxima de 41,657 IOPS e 189μs de latência.
Nosso teste final, o VDI LC Monday Login, teve o PBlaze5 com pico de 59,449 IOPS e 267μs de latência.
Conclusão
O Memblaze PBlaze5 NVMe SSD é a unidade corporativa NVMe de segunda geração da empresa. A unidade vem com uma capacidade máxima de 11 TB (para a série 700) e cita velocidades de 6 GB/s, mais de 1 milhão de IOPS e latência tão baixa quanto 15 μs. A unidade vem em dois formatos: um U.2.5 de 2” hot-swappable e um HHHL AIC. A unidade também é oferecida com duas séries: a série 700 de menor resistência, menor custo, maior capacidade e a série 900 criptografada de maior resistência, maior disponibilidade. Para nossa análise, medimos o desempenho da série 900.
Olhando para o desempenho, em nossa análise de carga de trabalho do aplicativo, o Memblze PBlaze5 apresentou bons números no SQL Server, com 12,629.9 TPS e uma latência média de 7.5ms; no entanto, o PBlaze4 conseguiu vencê-lo por 2.5 ms. No Sysbench, o PBlaze5 teve a pontuação máxima no teste transacional, 8,260.5 TPS, e latência média, 15.5ms, e pior cenário, 29.4ms. Em nossa carga de trabalho Houdini, o PBlaze5 ficou atrás da unidade da geração anterior e de outros SSDs corporativos NVMe.
Em nosso teste VDbench, o PBlaze5 dominou todos os testes e, às vezes, por uma ampla margem. Em nossos testes de 4K, o PBlaze5 foi capaz de atingir quase 750K IOPS com latência de 170μs para leitura e mais de 597K IOPS com latência de 211μs. Para sequencial de 64K, a unidade atingiu 2.71 GB/s com latência de 363 μs na gravação e 2.73 GB/s com latência de 365 μs na leitura. O PBlaze5 continuou a impressionar nos testes SQL com pontuações máximas de aproximadamente 244 IOPS, 235 IOPS para 90-10 e 229 IOPS para 80-20. A Oracle mostrou a unidade com pontuações de aproximadamente 227 IOPS, 178 IOPS para 90-10 e 178 IOPS para 80-20. E durante nossos testes VDI Clone, o PBlaze5 liderou o caminho, embora algumas das outras unidades tenham dado uma corrida pelo seu dinheiro em um dos testes Linked Clone.
Concluindo!
O Memblaze PBlaze5 NVMe SSD oferece uma boa atualização progressiva em relação à geração anterior, enquanto define uma marca de capacidade de 11 TB, o que é muito alto para SSDs de interface NVMe.
Inscreva-se no boletim informativo StorageReview