Inicio Empresa La especificación SSD de arranque NVMe de hiperescala de OCP brinda rendimiento, asequibilidad y eficiencia

La especificación SSD de arranque NVMe de hiperescala de OCP brinda rendimiento, asequibilidad y eficiencia

by lyle smith
unidades de arranque nvme

Ha habido mucha discusión sobre los problemas relacionados con las unidades de arranque en el espacio de hiperescala en los últimos años. Si bien los hiperescaladores no quieren gastar demasiado en ellos, necesitan un umbral de rendimiento mínimo básico entre otras especificaciones necesarias.

Ha habido mucha discusión sobre los problemas relacionados con las unidades de arranque en el espacio de hiperescala en los últimos años. Si bien los hiperescaladores no quieren gastar demasiado en ellos, necesitan un umbral de rendimiento mínimo básico entre otras especificaciones necesarias.

unidades de arranque nvme

También está la cuestión de quién continuará fabricando unidades de arranque M.2 NVMe de pequeña capacidad, ya que los fabricantes de SSD empresariales en su mayoría han salido de este espacio. Solidigm no tiene una unidad de arranque M.2 moderna en su cartera de almacenamiento, y la mayoría de las opciones modernas que ofrecen Samsung, KIOXIA y Micron tienen problemas de costos debido a su alta capacidad. Luego está la necesidad de rendimiento. Si bien no es excelente, una unidad de arranque aún debe producir un resultado mínimo de manera confiable.

Como puede ver en el gráfico a continuación, la capacidad de las unidades de datos y de arranque crece continuamente, lo que significa más gastos para las organizaciones.

Requisitos y obstáculos de la unidad de arranque NVMe de hiperescala

En la Cumbre de OCP, estos problemas se discutieron durante una presentación de los representantes de Google y Meta y, lo que es más importante, lo que están haciendo para abordarlos.

Se mostró un ejemplo de un SSD de arranque a hiperescala que representaba la actividad de un día, que incluía lecturas y escrituras de E/S, así como transacciones TRIM. Lo más notable es el alto rendimiento de TRIM, que demuestra datos de corta duración (creados y luego eliminados poco después). Si no se diseñan correctamente, los TRIM darán lugar a paradas de latencia e interferirán con el tráfico de lectura y escritura. La mayor parte del tráfico también son lecturas y escrituras aleatorias.

Algunos obstáculos que enfrenta Hyperscale NVMe Boot incluyen:

  • En última instancia, las cargas de trabajo de hiperescala son sensibles a la latencia, por lo que el rendimiento sostenido es muy importante para brindar una experiencia de usuario eficiente.
  • También es un desafío depurar a escala, por lo que tener métricas de monitoreo detalladas es fundamental para predecir y detectar fallas.
  • La resistencia es muy importante para los SSD de arranque. Una vez que haya finalizado su sistema (lo que puede llevar algún tiempo), tener unidades de arranque con alta resistencia les permitirá durar tanto como el ciclo de vida completo del producto.. Esto también ayudará a eliminar la necesidad de reparar y evitar el desgaste prematuro.
  • Lo que es más importante, los clientes de hiperescala otorgan gran importancia a la privacidad y la seguridad y, a veces, es difícil cumplir con todos estos estándares.

Esta es una gama bastante diversa de problemas, por lo que abordarlos puede ser un proceso complicado si no se hace correctamente.

Abordar los problemas que enfrentan las unidades de arranque

Como es el principal impulso y propósito detrás de OCP, la única forma de resolver estos problemas es a través de la colaboración y las especificaciones abiertas. Como tal, Meta y Google se han unido para combinar requisitos y crear el Especificación SSD de arranque NMEe de hiperescala (versión 1.0), marcando un hito importante para la eficiencia de la unidad de arranque. Se presentó a principios de este año y está disponible a través del sitio web de OCP.

Hay muchos beneficios que vienen con estas especificaciones. En última instancia, permite que el mercado comprenda mejor las funciones que los hiperescaladores necesitan y usan para sus dispositivos de arranque y garantiza que se alineen con la industria en cuanto a la adopción de unidades de arranque SSD. Además, brinda a las organizaciones herramientas de código abierto para administrar SSD de arranque, lo que conduce al desarrollo de 3rd-Suites de prueba para fiestas que pueden cumplir con todos los requisitos.

Durante la sesión, también indicaron que hay dos formas de abordar la creación de un SSD de arranque a hiperescala. Puede degradar un SSD de clase empresarial o actualizar un SSD de nivel de consumidor, ya que sus requisitos se encuentran en algún lugar en el medio de estos dos espacios.

banco de arranque

Hemos comenzado a agregar una sección de rendimiento del banco de arranque en nuestras revisiones de SSD, que es un perfil de carga de trabajo adoptado por OCP para medir los SSD que están diseñados para el arranque del servidor. Esta carga de trabajo de arranque ejecuta un plan de prueba relativamente intenso que llena la unidad por completo con escrituras antes de probar una secuencia de carga de trabajo de lectura intensa.

Para cada prueba, realiza una operación asíncrona de lectura aleatoria de 32K junto con una escritura aleatoria síncrona de 15k de 128MiB/s, así como una carga de trabajo de fondo de escritura/recorte aleatorio de 5k síncrona de 128MiB/s. El script comienza con la actividad de lectura aleatoria en un nivel de 4 trabajos y escala hasta 256 trabajos en su punto máximo. El resultado final son las operaciones de lectura realizadas durante su ejecución máxima.

El objetivo de OCP para este punto de referencia es aprobar/fallar a 60 970 IOPS de lectura. La mayoría de las unidades que probamos superarán con creces el mínimo, pero los resultados son instructivos independientemente. Lo más interesante de nuestras pruebas es que pudimos superar con creces el umbral de IOPS con modelos de SSD NVMe orientados al rendimiento, pero no con SSD de paso más lento. Muchos modelos SSD más lentos parecen caer fácilmente en la categoría de no aprobados, aunque obtuvimos un modelo 2 EVO Plus de XNUMX TB para informar una velocidad no calificada más lenta.

SSD Leer IOPS
Sk hynix platino P41 220,884 IOPS
WD SN850X 219,883 IOPS
Solidigm P44 Pro 211,999 IOPS
fantasma VENOM8 190,573 IOPS
Samsung 990 Pro 176,677 IOPS
Sabrent cohete 4 más 162,230 IOPS
Samsung 970 EVO Plus 2TB 52,005 IOPS
Corsair MP600GS DNF
Solidigm P41 más DNF

Ejemplo de caso de uso de carga de trabajo de hiperescala

Durante la sesión, también compararon dos unidades diferentes: una que es más genérica y otra que se ajusta más a las especificaciones de hiperescala de OCP. En general, descubrieron que hubo una mejora espectacular en la latencia en todos los ámbitos con la última unidad, que es algo muy importante para el espacio de hiperescala.

En el mundo real, esto significa que hay una mejora notable en el tiempo de comercialización cuando se intenta implementar una unidad más acorde con las especificaciones.

Avanzando con el Especificaciones de SSD de arranque NVMe de hiperescala OCP

Si bien algunas empresas creaban anteriormente sus propias unidades de arranque a hiperescala para satisfacer sus necesidades específicas (y las solicitudes específicas de sus clientes), estas especificaciones no se compartían en la industria. Esto dio lugar a que los proveedores tuvieran que producir su propio hardware/firmware personalizado para satisfacer las necesidades de sus clientes.

Hemos recorrido un largo camino desde entonces, ya que OCP ha logrado versión 1.0 de su especificación de SSD de arranque NVMe de hiperescala disponible oficialmente. Esto permite a los fabricantes de sistemas y proveedores de SSD alinearse en un conjunto común de requisitos al mismo tiempo que fomenta una mayor colaboración.

OCP llama a todos los OEM (es decir, fabricantes de sistemas) e hiperescaladores a unirse a la causa y promete seguir evolucionando y mejorando las especificaciones a medida que cambia el panorama del almacenamiento.

Impacto en la Empresa

La necesidad de la unidad de arranque no se limita a los casos de uso de Hiperescala. M.2 es el estándar de unidad de arranque de facto ahora para la mayoría de los servidores y matrices de almacenamiento. Si bien la unidad no tiene que hacer una tonelada en la mayoría de los casos, debe ser confiable, algo eficiente y no más grande (más costosa) de lo absolutamente necesario. Con suerte, veremos a los proveedores de almacenamiento responder a esta iniciativa con un SSD específico de arranque para que los proveedores de infraestructura puedan mantener cierto grado de estandarización.

Interactuar con StorageReview

Boletín informativo | Canal de YouTube | Podcast iTunes/Spotify | @Instagram | Twitter | @TikTok | RSS Feed