Home Empreendimento Revisão do Fusion ioMemory SX300

Revisão do Fusion ioMemory SX300

by Laboratório StorageReview Enterprise

O Fusion ioMemory SX300 é um acelerador de aplicativos PCIe de terceira geração com ênfase em resistência e preço por desempenho. O SX300 e seu irmão PX600 de alto desempenho compreendem a nova “Série Atomic” da Fusion, que é essencialmente uma plataforma de hardware com dois esquemas diferentes de superprovisionamento de NAND que resultam em diferentes perfis de desempenho para as duas unidades.


O Fusion ioMemory SX300 é um acelerador de aplicativos PCIe de terceira geração com ênfase em resistência e preço por desempenho. O SX300 e seu irmão PX600 de alto desempenho compreendem a nova “Série Atomic” da Fusion, que é essencialmente uma plataforma de hardware com dois esquemas diferentes de superprovisionamento de NAND que resultam em diferentes perfis de desempenho para as duas unidades.

O PX600 e o SX300 estão usando a mesma plataforma de controlador e o mesmo NAND bruto, a principal diferença entre os dois está no provisionamento de NAND. O SX300 é ajustado para capacidade e melhores métricas de custo, enquanto o PX600 é ajustado para resistência. Ambas as unidades oferecem perfis de desempenho semelhantes. O SX300 vem com capacidades de 1.25 TB, 1.6 TB e 3.2 TB em formatos discretos, além de um perfil de meio comprimento e altura total de 6.4 TB. Esta análise apresenta a edição de 3.2 TB do SX300. Todas as placas são oferecidas com uma interface PCIe 2.0 x8.

O Fusion-io ioMemory SX300 vem com garantia de cinco anos até a resistência máxima utilizada para cada cartão. Nossa unidade de análise é o cartão com capacidade de 3.2 TB.

Especificações do Fusion ioMemory SX300

  • Capacidade útil:
    • 1.25 TB (Modelo nº: 1300)
      • Largura de banda de leitura (GB/s): 2.6
      • Largura de banda de gravação (GB/s): 1.1
      • Corrido. Ler IOPS (4K): 195,000
      • Corrido. IOPS de gravação (4K): 285,000
      • Resistência (PBW): 4
    • 1.6 TB (Modelo: 1600)
      • Largura de banda de leitura (GB/s): 2.6
      • Largura de banda de gravação (GB/s): 1.1
      • Corrido. Ler IOPS (4K): 195,000
      • Corrido. IOPS de gravação (4K): 285,000
      • Resistência (PBW): 5.5
    • 3.2 TB (Modelo nº: 3200)
      • Largura de banda de leitura (GB/s): 2.6
      • Largura de banda de gravação (GB/s): 1.2
      • Corrido. Ler IOPS (4K): 215,000
      • Corrido. IOPS de gravação (4K): 300,000
      • Resistência (PBW): 11
    • 6.4 TB (Modelo nº: 6400)
      • Largura de banda de leitura (GB/s): 2.6
      • Largura de banda de gravação (GB/s): 1.2
      • Corrido. Ler IOPS (4K): 180,000
      • Corrido. IOPS de gravação (4K): 285,000
      • Resistência (PBW): 22
  • Tipo NAND: MLC (Multi Level Cell)
  • Latência de acesso de leitura: 92μs
  • Latência de acesso de gravação: 15μs
  • Interface de barramento: PCI-Express 2.0 x8
  • Peso 5.2 onças 7.25 onças
  • Fator de forma: Altura padrão de baixo perfil (1.25 TB, 1.6TB, 3.2 TB) Meio comprimento (6.4 TB)
  • Sistemas operacionais
    • Microsoft: Windows Server 2012 R2, 2012, 2008 R2 SP1
    • Linux: RHEL 5/6, SLES 11, OEL 5/6, CentOS 5/6, Debian Squeeze, Ubuntu 12/13
    • Unix: Solaris 11.1/11 x64, Solaris 10 U11 x64
    • Hipervisores: VMware ESXi 5.0/5.1/5.5, Windows Server 2012 Hyper-V, 2012 R2 Hyper-V
  • Requisitos de energia: 25W
  • Temperature
    • Operacional: 0°C - 55°C
    • Não operacional: -40°C - 70°C
  • Fluxo de ar: 300 (LFM)2
  • Umidade: Sem condensação 5-95%
  • Altitude
    • Operacional: -1,000 pés a 10,000 pés
    • Não operacional: -1,000 pés a 30,000 pés
  • Garantia: 3 anos ou resistência máxima usada

Design e Construção

O Fusion-io Atomic Series SX300 é um acelerador de aplicativo PCIe de controlador único que vem em fatores de forma HHHL e FHHL. Para versões de 1.2-3.2 TB, a placa tem o fator de forma HHHL menor, o que a torna quase universal em servidores do mercado. O modelo de 6.4 TB de maior capacidade precisa de uma altura maior para o NAND adicional, embora ainda caiba na maioria dos servidores do mercado, mas não em todos os slots.

As novas placas Atomic Series SX300 são semelhantes aos Application Accelerators anteriores da Fusion-io, aproveitando um controlador FPGA, que é capaz de aproveitar os recursos do host, que eles afirmam oferecer menor desempenho de latência estando mais próximo da CPU. Uma pequena diferença em comparação com a série ioDrive2 é que nenhum dos modelos mais novos usa dois controladores (que foram encontrados nos produtos Duo SLC e MLC antes). Isso ajuda a economizar no consumo de energia, sem mencionar que apresenta ao usuário um único pool de armazenamento, em vez de dois que ele precisaria agrupar.

O Fusion-io também eliminou qualquer conectividade de energia externa nas placas SX300, que era vista nos modelos de primeira e segunda geração. A razão para isso é que os modelos mais antigos podem consumir mais energia em modos de desempenho mais alto, e alguns servidores não podem funcionar com segurança acima das especificações mínimas de energia PCIe. No entanto, a safra atual de servidores no mercado oferece suporte a demandas de energia muito maiores, então o Fusion-io incluiu a capacidade de habilitar modos de energia mais altos por meio do próprio slot.

Histórico de testes e comparáveis

O Fusion-io ioMemory SX300 é um único controlador FPGA e Intel MLC NAND com uma interface PCIe 2.0 x8.

Comparáveis ​​para esta revisão:

Todos os aceleradores de aplicativos PCIe são comparados em nossa plataforma de teste empresarial de segunda geração com base em um Lenovo ThinkServer RD630. Para benchmarks sintéticos, utilizamos FIO versão 2.0.10 para Linux e versão 2.0.12.2 para Windows. Em nosso ambiente de teste sintético, usamos uma configuração de servidor convencional com uma velocidade de clock de 2.0 GHz, embora as configurações de servidor com processadores mais potentes possam render um desempenho ainda maior.

  • 2 x Intel Xeon E5-2620 (2.0 GHz, 15 MB de cache, 6 núcleos)
  • Chipset Intel C602
  • Memória – 16GB (2 x 8GB) 1333Mhz DDR3 RDIMMs registrados
  • Windows Server 2008 R2 SP1 64 bits ou CentOS 6.3 64 bits
  • HBA LSI 9211-4i SAS/SATA 6.0 Gb/s (para SSDs de inicialização)
  • LSI 9207-8i SAS/SATA 6.0Gb/s HBA (para benchmarking de SSDs ou HDDs)

Análise de desempenho de aplicativos

Para entender as características de desempenho dos dispositivos de armazenamento corporativo, é essencial modelar a infraestrutura e as cargas de trabalho de aplicativos encontradas em ambientes de produção ao vivo. Nossos três primeiros benchmarks do ioMemory SX300 são, portanto, os Benchmark de Armazenamento de Banco de Dados NoSQL MarkLogicDesempenho OLTP do MySQL via SysBench e Desempenho OLTP do Microsoft SQL Server com uma carga de trabalho TCP-C simulada.

Nosso ambiente de banco de dados MarkLogic NoSQL requer grupos de quatro SSDs com capacidade utilizável de pelo menos 200 GB, pois o banco de dados NoSQL requer aproximadamente 650 GB de espaço para seus quatro nós de banco de dados. Nosso protocolo usa um host SCST e apresenta cada SSD em JBOD, com um alocado por nó de banco de dados. O teste se repete em 24 intervalos, exigindo um total de 30 a 36 horas. O MarkLogic registra a latência média total, bem como a latência de intervalo para cada SSD.

O ioMemory SX300 obteve uma latência média de 1.527 ms quando superprovisionado para melhor desempenho durante o benchmark NoSQL, comparável ao seu irmão, o PX600. Ambas as unidades Atomic pontuaram entre os melhores aceleradores neste grande conjunto de dados.

Durante o benchmark NoSQL, o ioMemory SX300 experimentou um pico de latência de até 13.79 ms durante uma operação de leitura de mesclagem no início do protocolo e um pico menor de 11.84 ms durante uma operação de gravação de mesclagem. Nenhum dos picos foi grande o suficiente para afetar significativamente o desempenho geral durante o benchmark.

Nossa Teste de banco de dados Percona MySQL via SysBench mede o desempenho da atividade OLTP. Nesta configuração de teste, usamos um grupo de Lenovo ThinkServer RD630s e carregue um ambiente de banco de dados em uma única unidade SATA, SAS ou PCIe. Este teste mede o TPS médio (transações por segundo), a latência média, bem como a latência média do 99º percentil em um intervalo de 2 a 32 threads. Percona e MariaDB podem fazer uso de APIs de aceleração de aplicativos com reconhecimento de flash Fusion-io em versões recentes de seus bancos de dados, embora, para fins de comparação, testemos cada dispositivo em um modo de armazenamento em bloco "legado".

A plataforma Memblaze PBlaze3 ocupou a primeira posição entre as unidades flash PCIe que comparamos até o momento com a carga de trabalho do MySQL. Com até 16 threads, ambas as unidades Atomic ioMemory superam as comparáveis ​​PBlaze3. Acima de 16 threads, o PX600 e o SX300 são apenas ligeiramente superados pelo PBlaze3H.

Os resultados comparativos são semelhantes para latências médias durante o benchmark MySQL, com o PX600 e o SX300 superando as unidades PBlaze3 em quase todas as cargas de trabalho.

As unidades Fusion lidam com o pior cenário de latência melhor do que a plataforma PBlaze3.

Protocolo de teste OLTP do Microsoft SQL Server da StorageReview emprega o rascunho atual do Benchmark C (TPC-C) do Transaction Processing Performance Council, um benchmark de processamento de transações on-line que simula as atividades encontradas em ambientes de aplicativos complexos. O benchmark TPC-C chega mais perto do que os benchmarks sintéticos de desempenho para medir os pontos fortes de desempenho e os gargalos da infraestrutura de armazenamento em ambientes de banco de dados. Nosso protocolo SQL Server usa um banco de dados SQL Server de 685 GB (escala 3,000) e mede o desempenho transacional e a latência sob uma carga de 30,000 usuários virtuais.

Em termos de transações por segundo, o SX300 foi capaz de acompanhar as unidades comparáveis ​​em nosso benchmark Microsoft SQL. A taxa de transferência geralmente não é um fator limitante para o armazenamento PCIe de geração atual com o benchmark SQL Server de 30,000 usuários.

A métrica mais importante para avaliar o desempenho no benchmark do Microsoft SQL Server é a latência média. Com uma carga de trabalho de 30,000 usuários virtuais, o ioMemory SX300 mostrou suas cores Fusion-io como parte de uma coorte de unidades Fusion que tiveram os melhores desempenhos PCIe até o momento no benchmark SQL Server.

Análise de Carga de Trabalho Sintética Corporativa

O desempenho do flash varia durante a fase de pré-condicionamento de cada dispositivo de armazenamento. Nosso processo de referência de armazenamento corporativo sintético começa com uma análise do desempenho da unidade durante uma fase de pré-condicionamento completa. Cada uma das unidades comparáveis ​​é apagada com segurança usando as ferramentas do fornecedor, pré-condicionadas em estado estacionário com a mesma carga de trabalho com a qual o dispositivo será testado sob uma carga pesada de 16 threads com uma fila pendente de 16 por thread e, em seguida, testado em intervalos definidos em vários perfis de profundidade de encadeamento/fila para mostrar o desempenho sob uso leve e pesado.

  • Testes de pré-condicionamento e estado estacionário primário:
  • Rendimento (Agregado de IOPS de Leitura+Gravação)
  • Latência média (latência de leitura+gravação calculada em conjunto)
  • Latência máxima (latência máxima de leitura ou gravação)
  • Desvio padrão de latência (desvio padrão de leitura + gravação calculado em conjunto)

Nossa Enterprise Synthetic Workload Analysis inclui dois perfis baseados em tarefas do mundo real. Esses perfis foram desenvolvidos para facilitar a comparação com nossos benchmarks anteriores, bem como valores amplamente publicados, como velocidade máxima de leitura e gravação de 4k e 8k 70/30, que é comumente usado para hardware corporativo.

  • 4k
    • 100% de leitura ou 100% de gravação
    • 100% 4K
  • 8k 70/30
    • 70% de leitura, 30% de gravação
    • 100% 8K

Com uma carga de trabalho de pré-condicionamento de 4K de 100% de operações de gravação no Linux, o SX300 com superprovisionamento de alto desempenho experimentou um período de pico competitivo. Caso contrário, ambos os esquemas de superprovisionamento do SX300 tiveram um desempenho inferior à medida que se aproximavam do estado estável.

Em um ambiente Windows, a taxa de transferência de gravação de 300k do SX4 é melhor no Windows, mostrando uma ligeira vantagem sobre o desempenho do Linux.

As latências médias de gravação de 4k para o esquema de superprovisionamento padrão do SX300 eventualmente aumentam para o nível mais alto entre as unidades comparáveis ​​no Linux, mas o superprovisionamento de alto desempenho leva o SX300 para o meio do pacote.

No Windows, o superprovisionamento de alto desempenho também coloca o SX300 no meio do pacote em termos de latência média para operações de gravação durante o pré-condicionamento de 4k.

Apesar dos problemas momentâneos de desempenho, como uma latência de 20ms medida durante o pré-condicionamento de 4k com superprovisionamento de estoque, o SX300 teve um desempenho competente em termos de latência média com o ambiente de teste do Linux.

Os resultados de latência máxima do ioMemory SX300 durante o pré-condicionamento de gravação de 4k foram mais dramáticos no Windows. As latências máximas da configuração de estoque regularmente ultrapassavam 200 ms, enquanto o superprovisionamento de alto desempenho ainda excedia regularmente 150 ms para a latência máxima medida.

A plotagem de cálculos de desvio padrão fornece uma maneira mais clara de comparar a quantidade de variação entre pontos de dados de latência individuais coletados durante um benchmark. Os resultados do desvio padrão para o SX300 o colocam no meio do pacote de comparáveis ​​durante o pré-condicionamento de gravação para o benchmark de 4k no Linux.

No Windows, a situação é praticamente a mesma. O SX300 alcança resultados de desvio padrão respeitáveis ​​durante o pré-condicionamento de 4k, mas nada tão impressionante quanto o Huawei ES3000 ou o Micron P430m. O SX300 também fica atrás de seu irmão Atomic, mais orientado para o desempenho de gravação, o PX600.

Com o pré-condicionamento completo, o ioMemory SX300 atinge o quarto melhor desempenho de gravação quando superprovisionado para alto desempenho no benchmark 4k Linux. O superprovisionamento de alto desempenho tem menos efeito no desempenho de leitura, o que coloca o SX300 no último lugar ou próximo a ele para ambas as configurações.

O SX300 foi capaz de superar ligeiramente o PX600 em termos de desempenho de leitura com ambas as unidades superprovisionadas para alto desempenho durante o benchmark de 4k no Windows. O desempenho de gravação para a configuração de alto desempenho foi de 138,897IOPS menos competitivo.

Os resultados de latência média de benchmark de 4k no Linux para o SX300 foram os mais altos ou próximos dos comparáveis, independentemente de o drive ter sido superprovisionado para desempenho adicional.

As latências médias no Windows foram mais competitivas para o SX300, principalmente com superprovisionamento de alto desempenho.

O superprovisionamento de alto desempenho só tem um efeito notável com operações de gravação para o ioMemory SX300 durante o benchmark de 4k no Linux. Habilitar a configuração de alto desempenho diminuiu a latência máxima de 15.36ms para 12.96ms.

No Windows, tanto o SX300 quanto o PX600 lutaram contra picos de latência maiores do que durante o benchmark Linux 4k.

Os cálculos de desvio padrão continuam a mostrar o SX300 como um desempenho confiável, mas não excepcional entre as unidades comparáveis ​​durante o benchmark 4k Linux.

No Windows, o SX300 está no meio do pacote em termos de consistência de seus resultados de latência; independentemente dos picos momentâneos de centenas de milissegundos, o desempenho de latência geral do SX300 é mais competitivo em relação a seus pares no Windows do que no Linux.

Nossa próxima carga de trabalho usa transferências de 8k com uma proporção de 70% de operações de leitura e 30% de operações de gravação. O primeiro conjunto de gráficos apresenta as medições feitas durante o processo de pré-condicionamento. No Linux, o desempenho de taxa de transferência de pico do SX300 está na metade superior dos comparáveis. Após o período de rajada, o SX300 superprovisionado para alto desempenho é capaz de manter uma posição competitiva à medida que se aproxima do estado estável próximo a 140,000 IOPS.

Durante o pré-condicionamento do Windows para o benchmark 8k 70/30, o SX300 também teve um bom desempenho em termos de rendimento durante o período de rajada em ambas as configurações. A configuração de alto desempenho manteve um terceiro lugar quando as unidades se aproximaram do estado estável.

Em termos de latência média, a configuração de alto desempenho do SX300 ficou atrás das duas configurações do ioMemory PX600 e do Huawei ES3000 durante o pré-condicionamento do Linux.

No Windows, a configuração de alto desempenho do SX300 superou os resultados de latência média do PX600 padrão para se aproximar do estado estável na terceira melhor posição.

As latências máximas de 8k registradas no Linux para as duas configurações do SX300, muito parecidas com as duas configurações do PX600 que também comparamos, foram melhores do que todas as outras comparáveis, exceto para o Huawei ES3000 e o Micron P420m.

As medições de pré-condicionamento do Windows para o benchmark de 8k demonstram a dificuldade que tanto o SX300 quanto o PX600 têm em lidar com a latência máxima aqui em comparação com o desempenho da plataforma Atomic ioMemory no Linux. Ambas as configurações do SX300 apresentam picos acima de 235ms.

Os cálculos de desvio padrão para latências medidas no Linux durante o pré-condicionamento de 8k colocam o SX300 no meio do caminho em termos de consistência entre as unidades comparáveis, com o esquema de superprovisionamento de estoque SX300 e quando superprovisionado para alto desempenho.

Os resultados do desvio padrão do Windows para o SX300 mostram mais ciclos de valores do que no Linux, mas também colocam o SX300 no meio do pacote em termos de consistência de seus resultados de latência.

Com o pré-condicionamento 8k 70/30 completo no ambiente de teste do Linux, o superprovisionamento do SX300 de alto desempenho é capaz de quase espelhar o desempenho do PX600 padrão em um empate pelo terceiro lugar em cada uma das variações na carga de trabalho.

No Windows, o SX300 também se sai bem quando superprovisionado para maior desempenho. Sob a carga máxima de 16 threads e uma profundidade de fila de 16, a configuração SX300 de alto desempenho ficou em terceiro lugar com 129,852IOPS.

Os resultados de latência média no Linux durante o benchmark 8k 70/30 colocam o SX300 em uma luz favorável, especialmente configurado com superprovisionamento de alto desempenho. Assim configurado, ele fica logo atrás do PX600 entre os melhores drives que comparamos nesta classe.

O benchmark 8k 70/30 é menos competitivo no Windows para o SX300, onde o superprovisionamento de estoque supera consistentemente a configuração ioDrive Duo MLC de estoque entre os comparáveis.

As medições de latência máxima para o benchmark 8k 70/30 em nossa plataforma Linux são impressionantes, sem picos notáveis ​​e resultados gerais de latência máxima muito semelhantes aos do PX600.

No Windows, o SX300 e o PX600 lutam com picos de latência que introduzem drama no gráfico de latência máxima para o benchmark 8k 70/30. A configuração do SX300 com superprovisionamento de estoque aumentou para 249.35ms de latência com 16 threads e uma profundidade de fila de 4.

Os resultados do desvio padrão para o benchmark Linux 8k mostram o superprovisionamento do SX300 de alto desempenho movendo-se em conjunto com a configuração padrão do PX600.

Os picos de latência revelados no gráfico de latência máxima do Windows desaparecem nas médias dos resultados de desvio padrão. O SX300 oferece um desempenho de latência consistente, embora não notável, com cargas de trabalho de 8k 70/30, independentemente dos picos ocasionais plotados nos resultados de latência máxima.

Conclusão

O Fusion-io (SanDisk) ioMemory SX300 foi concebido para ser a oferta de alta capacidade da nova e simplificada linha ioMemory Atomic Series. Seu desempenho é consistente, se não digno de nota, em uma variedade de benchmarks de armazenamento corporativo. Para uma unidade projetada para cargas de trabalho mais intensas de leitura e resistência moderada, seu desempenho de gravação pode ser mais competitivo do que o esperado. O Fusion-io diferencia o PX600 e o SX300 em grande parte com base no superprovisionamento que afeta a resistência e a capacidade, bem como o desempenho em alguns casos. Graças a um nível de superprovisionamento mais pesado de fábrica, o PX600 é capaz de manter maior desempenho e resistência de gravação, ao mesmo tempo em que abre mão de alguma capacidade. O SX300 obtém mais capacidade e um perfil de custo/GB melhor, mas abre mão da resistência e, em alguns casos, do desempenho, para seu irmão PX600.

Em benchmarks sintéticos, como o teste 4k e 8k 70/30, a capacidade total da unidade é testada. Nas configurações de estoque, isso é 3.2 TB para o SX300 e 2.6 TB para o PX600. O PX600 tem vantagem quando se trata de desempenho de gravação porque a unidade tem mais NAND disponível para lidar com atividades em segundo plano. Se a capacidade do SX300 fosse reduzida usando ioSphere para corresponder ao PX600, os resultados seriam quase idênticos.

Em testes de aplicativos em que o conjunto de dados testado é finito e do mesmo tamanho em todos os produtos analisados, o desempenho é quase idêntico para ambas as unidades Atomic Series. No teste MarkLogic NoSQL, ambas as unidades estavam separadas por 0.003 ms em um teste de mais de 30 horas. No teste Microsoft SQL Server TPC-C, ambos os drives empataram com 3ms de latência média registrada, com uma ligeira vantagem de TPS para o SX300. Nos testes do Sysbench, vimos a mesma coisa em que os dois discos se sobrepunham no desempenho um do outro, embora o PX600 mantivesse outra ligeira vantagem.

Quando chega a hora de tomar uma decisão de compra, a diferença entre os cartões realmente se resume aos níveis de resistência para os quais cada um é garantido, e não ao desempenho. O PX600 oferece resistência de gravação de 12, 16, 32 e 64 PB em quatro capacidades, enquanto o SX300 é classificado para 4, 5.5, 11 e 22 PB. Nos cartões menores, há uma diferença de 4x que diminui para pouco menos de 3x nos modelos maiores. Para aqueles que têm mais cargas de trabalho de leitura pesada e podem passar sem a resistência extra, o SX300 traz mais capacidade e um melhor valor por GB para o mercado.

Vantagens

  • Desempenho igual ao da geração anterior, apesar dos desafios de encolhimento do NAND
  • Excelente software de gerenciamento de unidade
  • Ajustado para desempenho de aplicativos e resistência razoável

Desvantagens

  • Alguns problemas de latência de pico no Windows vs Linux

ponto de partida

O Fusion ioMemory SX300 oferece um excelente perfil de desempenho para cargas de trabalho sensíveis à latência que tendem a ser mais centradas na leitura. Os clientes podem aproveitar o melhor preço/GB, graças ao aumento da capacidade sobre o PX600, sacrificando pouco em termos de desempenho.

Fusion ioMemory SX300