Discutimos o SK hynix pela última vez em agosto, quando analisamos o história da empresa e uma visão geral de suas soluções Enterprise SSD. Hoje estamos revisando e analisando o desempenho do SK hynix Enterprise SSD PE6011. O PE6011 possui um fator de forma U.2 de 7 mm, 3D TLC NAND, interface PCIe NVMe e capacidades de até 7.68 TB. É ideal para cargas de trabalho de leitura intensiva e uso leve de gravação. O que há de único neste produto é que, desde a concepção até a fabricação, tudo é feito internamente pela SK hynix. Este produto é destinado a quem procura uma solução PCIe econômica para o ambiente de datacenter.
Discutimos o SK hynix pela última vez em agosto, quando analisamos o história da empresa e uma visão geral de suas soluções Enterprise SSD. Hoje estamos revisando e analisando o desempenho do SK hynix Enterprise SSD PE6011. O PE6011 possui um fator de forma U.2 de 7 mm, 3D TLC NAND, interface PCIe NVMe e capacidades de até 7.68 TB. É ideal para cargas de trabalho de leitura intensiva e uso leve de gravação. O que há de único neste produto é que, desde a concepção até a fabricação, tudo é feito internamente pela SK hynix. Este produto é destinado a quem procura uma solução PCIe econômica para o ambiente de datacenter.
Olhando para o design e a construção desta unidade, toda a caixa é de prata polida. É uma unidade de 2.5″ com um conector U.2 e um fator de forma com altura z de 7 mm. O tamanho de 7 mm proporciona uma pegada fisicamente menor e dá a essa unidade a capacidade de ser equipada e caber em uma grande variedade de coisas para apelo universal. A marca, bem como informações de identificação exclusivas, podem ser encontradas na parte superior da unidade.
Especificações SK hynix PE6011
Fator de Forma | U.2 7mm | |||
Interface | PCIe Gen3x4/NVMe 1.3 | |||
NAND | TLC 3D V4 | |||
Capacidade | 960 GB | 1.92 TB | 3.84 TB | 7.68 TB |
Desempenho | ||||
Leitura sequencial (128 KB) | Até 3,200MB / s | Até 3,200MB / s | Até 3,200MB / s | Até 3,200MB / s |
Gravação sequencial (128 KB) | Até 650 MB / S | Até 1,250MB / s | Até 2,300MB / s | Até 2,450MB / s |
Leitura aleatória (4 KB, QD64) | Até 220K IOPS | Até 410K IOPS | Até 620K IOPS | Até 620K IOPS |
Gravação aleatória (4 KB, QD64) | Até 27K IOPS | Até 50K IOPS | Até 67K IOPS | Até 70K IOPS |
QOS 4KB Leitura Aleatória | 95μs | 95μs | 95μs | 95μs |
QOS 4KB Gravação Aleatória | 25μs | 25μs | 25μs | 25μs |
Segurança | Criptografia AES de 256 bits | |||
resistencia | ||||
MTBF | 2 milhões de horas | |||
UBER | 1 setor por 10^17 bits lidos | |||
Consumo de energia | ||||
Ativo Pronto/Gravação Típica | Até 14.0W | |||
inativo | Até 3.7W | |||
Tensão permitida | 12.0V ± 5% | |||
Temperatura de Operação | 0-70 ° C | |||
Choque | 1500G, duração 0.5ms | |||
Físico | ||||
Dimensões (LxPxA) | 69.85 x 100 x 7.0 milímetros | |||
Peso | 84.7 g (± 5%) |
Desempenho
Mesa de teste
Nossas análises de SSD corporativo aproveitam um Lenovo Think System SR850 para testes de aplicativos e um Dell PowerEdge R740xd para benchmarks sintéticos. O ThinkSystem SR850 é uma plataforma quad-CPU bem equipada, oferecendo potência de CPU bem acima do necessário para enfatizar o armazenamento local de alto desempenho. Os testes sintéticos que não exigem muitos recursos da CPU usam o servidor de processador duplo mais tradicional. Em ambos os casos, a intenção é mostrar o armazenamento local da melhor maneira possível, de acordo com as especificações máximas de unidade do fornecedor de armazenamento.
Lenovo Think System SR850
- 4 x CPU Intel Platinum 8160 (2.1 GHz x 24 núcleos)
- 16 x 32GB DDR4-2666Mhz ECC DRAM
- 2 x placas RAID 930-8i 12 Gb/s
- 8 compartimentos NVMe
- VMware ESXI 6.5
Dell PowerEdge R740xd
- 2 x CPU Intel Gold 6130 (2.1 GHz x 16 núcleos)
- 4 x 16 GB DDR4-2666 MHz ECC DRAM
- 1 placa RAID PERC 730 2GB 12Gb/s
- Adaptador NVMe Complementar
- Ubuntu-16.04.3-desktop-amd64
Fundo de teste
A Laboratório de teste StorageReview Enterprise fornece uma arquitetura flexível para realizar benchmarks de dispositivos de armazenamento corporativo em um ambiente comparável ao que os administradores encontram em implantações reais. O Enterprise Test Lab incorpora uma variedade de servidores, redes, condicionamento de energia e outras infraestruturas de rede que permitem que nossa equipe estabeleça condições do mundo real para avaliar com precisão o desempenho durante nossas análises.
Incorporamos esses detalhes sobre o ambiente de laboratório e protocolos em revisões para que os profissionais de TI e os responsáveis pela aquisição de armazenamento possam entender as condições em que alcançamos os resultados a seguir. Nenhuma de nossas análises é paga ou supervisionada pelo fabricante do equipamento que estamos testando.
Análise de carga de trabalho do aplicativo
Para entender as características de desempenho dos dispositivos de armazenamento corporativo, é essencial modelar a infraestrutura e as cargas de trabalho de aplicativos encontradas em ambientes de produção ao vivo. Nossos benchmarks para o Kingston DC500M são, portanto, os Desempenho OLTP do MySQL via SysBench e Desempenho OLTP do Microsoft SQL Server com uma carga de trabalho TCP-C simulada. Para nossas cargas de trabalho de aplicativos, cada unidade executará de 2 a 4 VMs configuradas de forma idêntica.
Desempenho do SQL Server
Cada VM do SQL Server é configurada com dois vDisks: volume de 100 GB para inicialização e um volume de 500 GB para o banco de dados e arquivos de log. Do ponto de vista dos recursos do sistema, configuramos cada VM com 16 vCPUs, 64 GB de DRAM e aproveitamos o controlador LSI Logic SAS SCSI. Embora nossas cargas de trabalho Sysbench testadas anteriormente tenham saturado a plataforma tanto em E/S de armazenamento quanto em capacidade, o teste de SQL procura desempenho de latência.
Este teste usa o SQL Server 2014 em execução em VMs convidadas do Windows Server 2012 R2 e é enfatizado pelo Benchmark Factory para bancos de dados da Quest. StorageReview's Protocolo de teste OLTP do Microsoft SQL Server emprega o rascunho atual do Benchmark C (TPC-C) do Transaction Processing Performance Council, um benchmark de processamento de transações on-line que simula as atividades encontradas em ambientes de aplicativos complexos. O benchmark TPC-C chega mais perto do que os benchmarks sintéticos de desempenho para medir os pontos fortes de desempenho e os gargalos da infraestrutura de armazenamento em ambientes de banco de dados. Cada instância de nossa VM SQL Server para esta revisão usa um banco de dados SQL Server de 333 GB (escala 1,500) e mede o desempenho transacional e a latência sob uma carga de 15,000 usuários virtuais.
Configuração de teste do SQL Server (por VM)
- Windows Server 2012 R2
- Ocupação de armazenamento: 600 GB alocados, 500 GB usados
- SQL Server 2014
- Tamanho do banco de dados: escala 1,500
- Carga de cliente virtual: 15,000
- Memória RAM: 48 GB
- Duração do teste: 3 horas
- 2.5 horas de pré-condicionamento
- período de amostra de 30 minutos
Para nosso benchmark transacional do SQL Server, o desempenho do SK hynix PE6011 foi igual ao do Intel P4510 8TB com um total de 12,625.4 TPS.
Uma indicação melhor do desempenho do SQL Server é a latência em comparação com o TPS. Aqui, vemos que o SK hynix PE6011 ficou para trás com uma latência média visivelmente mais longa em comparação com o Intel P4510 com 46.3 ms.
Desempenho do Sysbench
O próximo benchmark de aplicativo consiste em um Banco de dados MySQL OLTP Percona medida via SysBench. Este teste mede o TPS (transações por segundo) médio, a latência média e também a latência média do 99º percentil.
Cada sysbench A VM é configurada com três vDisks: um para inicialização (~92 GB), um com o banco de dados pré-construído (~447 GB) e o terceiro para o banco de dados em teste (270 GB). Do ponto de vista dos recursos do sistema, configuramos cada VM com 16 vCPUs, 60 GB de DRAM e aproveitamos o controlador LSI Logic SAS SCSI.
Configuração de teste do Sysbench (por VM)
- CentOS 6.3 64 bits
- Percona XtraDB 5.5.30-rel30.1
- Tabelas de banco de dados: 100
- Tamanho do banco de dados: 10,000,000
- Segmentos de banco de dados: 32
- Memória RAM: 24 GB
- Duração do teste: 3 horas
- 2 horas de pré-condicionamento 32 tópicos
- 1 hora 32 tópicos
Com o benchmark transacional Sysbench, o PE6011 ficou para trás e ficou em último lugar com 5,936.6 TPS.
Na latência média do Sysbench, o PE6011 novamente apresentou resultados que o colocaram no fundo do pacote com 21.6ms.
Para nossa latência de pior cenário (99º percentil), o PE6011 finalizado em último lugar está a 1 ms do Samsung 983 DCT com um resultado de 39.6 ms de latência.
Houdini por SideFX
O teste Houdini foi projetado especificamente para avaliar o desempenho do armazenamento no que se refere à renderização CGI. O banco de teste para este aplicativo é uma variante do tipo de servidor central Dell PowerEdge R740xd que usamos no laboratório com CPUs Intel 6130 duplas e DRAM de 64 GB. Nesse caso, instalamos o Ubuntu Desktop (ubuntu-16.04.3-desktop-amd64) executando bare metal. A saída do benchmark é medida em segundos para ser concluída, com menos sendo melhor.
A demonstração do Maelstrom representa uma seção do pipeline de renderização que destaca os recursos de desempenho do armazenamento, demonstrando sua capacidade de usar efetivamente o arquivo de troca como uma forma de memória estendida. O teste não grava os dados do resultado nem processa os pontos para isolar o efeito do tempo decorrido do impacto da latência no componente de armazenamento subjacente. O teste em si é composto por cinco fases, três das quais executamos como parte do benchmark, que são as seguintes:
Carrega pontos compactados do disco. Este é o momento de ler do disco. Isso é de thread único, o que pode limitar a taxa de transferência geral.
Descompacta os pontos em uma única matriz plana para permitir que sejam processados. Se os pontos não tiverem dependência de outros pontos, o conjunto de trabalho pode ser ajustado para permanecer no núcleo. Esta etapa é multiencadeada.
(Not Run) Processa os pontos.
Reempacota-os em blocos agrupados adequados para armazenamento em disco. Esta etapa é multiencadeada.
(Não executado) Grava os blocos agrupados de volta no disco.
Com o teste de Houdini, o PE6011 ficou na faixa intermediária com 2,860.1 segundos.
Análise de Carga de Trabalho do VDBench
Quando se trata de dispositivos de armazenamento de comparação, o teste de aplicativo é o melhor e o teste sintético vem em segundo lugar. Embora não seja uma representação perfeita das cargas de trabalho reais, os testes sintéticos ajudam a estabelecer a linha de base dos dispositivos de armazenamento com um fator de repetibilidade que facilita a comparação entre soluções concorrentes. Essas cargas de trabalho oferecem uma variedade de perfis de teste diferentes, desde testes de "quatro cantos", testes comuns de tamanho de transferência de banco de dados até capturas de rastreamento de diferentes ambientes VDI. Todos esses testes utilizam o gerador de carga de trabalho VDBench comum, com um mecanismo de script para automatizar e capturar resultados em um grande cluster de teste de computação. Isso nos permite repetir as mesmas cargas de trabalho em uma ampla variedade de dispositivos de armazenamento, incluindo arrays flash e dispositivos de armazenamento individuais. Nosso processo de teste para esses benchmarks preenche toda a superfície da unidade com dados e, em seguida, particiona uma seção da unidade igual a 25% da capacidade da unidade para simular como a unidade pode responder às cargas de trabalho do aplicativo. Isso é diferente dos testes de entropia total, que usam 100% da unidade e os colocam em estado estacionário. Como resultado, esses números refletirão velocidades de gravação sustentadas mais altas.
perfis:
- Leitura aleatória em 4K: 100% de leitura, 128 threads, 0-120% de atualização
- Gravação aleatória em 4K: 100% de gravação, 64 threads, 0-120% de atualização
- Leitura sequencial de 64K: 100% de leitura, 16 threads, 0-120% iorado
- Gravação sequencial de 64K: 100% gravação, 8 threads, 0-120% iorado
- Banco de Dados Sintético: SQL e Oracle
- Clone completo de VDI e rastreamentos de clone vinculados
Em nossa primeira VDBench Workload Analysis, Random 4K Read, o SK hynix PE6011 conseguiu ficar abaixo de 1ms durante todo o teste com um pico de 626,681 IOPS e uma latência de 203.2μs
O desempenho de gravação aleatória de 4K mostrou latência abaixo de milissegundos durante todo o teste novamente. Aqui, o PE6011 apresentou desempenho máximo de 209,000 IOPS e uma latência de 609.6 μs.
Mudando para cargas de trabalho sequenciais, o SK hynix PE6011 ficou no topo do pacote em leituras sequenciais de 64K com pontuação máxima de 41,554 IOPS ou 2.59 GB/s com latência de 384.5 μs.
O PE6011 atingiu o pico de 13,956 IOPS ou 0.87 GB/s com uma latência de 1137.7 μs na gravação sequencial de 64K.
Passando para cargas de trabalho SQL, o PE6011 atingiu o pico de 164,402 IOPS com latência de 194.2 μs
O SQL 90-10 viu o pico PE6011 em 133,898 IOPS e uma latência de 238.4 μs.
O PE6011 atingiu o pico de 120,450 IOPS e uma latência de 264.8.
Em nossa carga de trabalho Oracle, o PE6011 ficou no meio do pacote com um pico de 112,610 IOPS e uma latência de 312.8 μs.
No Oracle 90-10, o PE6011 atingiu o pico de 117,287 IOPS e uma latência de 187μs.
Para o Oracle 80-20, vimos o pico PE6011 em 106,489 IOPS e uma latência de 205.9 μs.
Em seguida, passamos para nosso benchmark de clone VDI, Full and Linked, onde o PE6011 ficou no meio do pacote para a maioria desses testes com latências de pico consistentemente abaixo de 1ms. Para VDI Full Clone Boot, o PE6011 teve um desempenho máximo de 99,196 IOPS e uma latência de 349.4 μs.
O VDI FC Initial Login viu o PE6011 com um desempenho máximo de 46,907 IOPS e uma latência de 635.8 μs, logo atrás do Intel P4510.
Com o VDI FC Monday Login, o PE6011 terminou com um desempenho máximo de 43,590 IOPS e uma latência de 364.6 μs.
Mudando para Linked Clone (LC), primeiro examinamos o teste de inicialização. Aqui, o PE6011 ficou um pouco atrás com 62,680 IOPS e uma latência de 254.6μs.
O login inicial do VDI LC mostrou 27,110 IOPS e uma latência de 292.2 μs, colocando-o no meio do pacote.
No teste VDI LC Monday Login, o PE6011 mostrou um desempenho máximo de 30,740 e uma latência de 516.9 μs, para um primeiro lugar de acabamento fotográfico.
Conclusão:
Disponível em formato U.2 de 7 mm, o PE6011 faz parte da nova linha SK hynix de SSDs Enterprise NVMe, incluindo um produto de próxima geração compatível com PCIe 4.0 que será lançado no 1S'20. O PE6011 é ideal para baixa latência e cargas de trabalho intensivas de leitura (70/30 r/w). No mercado empresarial, esta unidade pode ser lucrativa com base no preço de volume econômico, bem como no fato de ser uma unidade com uma orientação horizontal totalmente integrada. O PE6011 vem com capacidades de até 7.68 TB, que atendem à maioria das cargas de trabalho corporativas convencionais, bem como cargas de trabalho com grandes requisitos de capacidade. Possui tecnologia NAND 72D de 3 camadas e suporta criptografia de dados AES de 256 bits, proteção contra perda de energia (por circuito integrado), controle térmico e gerenciamento básico SMBus (fora da banda).
Ao observar o desempenho do SK hynix PE6011, ele não domina o campo, mas oferece um perfil de desempenho completo que funciona para a maioria das aplicações. Embora o tenhamos comparado a algumas unidades da Samsung e da Intel, o PE6011 não funcionou muito longe dessas unidades na maioria das vezes. Com o Sysbench, a unidade SK hynix atingiu 5,936.6 TPS, uma latência média de 21.6 ms e uma latência de pior cenário de 39.6 ms. Em Houdini, o SK hynix PE6011 foi posicionado de forma bastante neutra no meio do pelotão. Em nossos benchmarks VDBench, o PE6011 manteve uma latência abaixo de um milissegundo em todos os nossos testes. Ele se saiu bem em nossos 4K e 64K, manteve-se em nossos VDI Full Clone e Linked Clone Traces, mas caiu um pouco nos bancos de dados sintéticos. Alguns dos destaques são desempenhos máximos de 626,681 IOPS de leitura aleatória 4K, 41,554 IOPS de leitura sequencial de 64K, 46,907 IOPS VDI-FC-Init-Login e 30,740 IOPS VDI-LC-Monday Login.
O SK hynix PE6011 oferece bom desempenho, baixa latência e muita capacidade em um formato pequeno de 2.5” e 7 mm. Embora não seja o melhor desempenho de nossas unidades comparáveis, o PE6011 oferece bons números em todos os aspectos. Aqueles que procuram um bom preço para desempenho para determinadas cargas de trabalho não precisam ir muito além do PE6011.