La serie Optane SSD DC P4800X de Intel fue lanzado en marzo de 2017 con la promesa de traer al mercado un nuevo medio de memoria de clase de almacenamiento (SCM) llamado 3D XPoint (Intel con la marca Optane). La P4800X se lanzó como una unidad NVMe tradicional de 2.5″ (U.2) y como una tarjeta complementaria PCIe. Las capacidades iniciales comenzaron en 375 GB con planes para llegar a 1.5 TB a fines de 2017. Ese objetivo de capacidad no se cumplió, pero Intel lanzó Modelos Optane de 750 GB en noviembre. Independientemente de la capacidad, el P4800X tiene un trabajo y es ofrecer el almacenamiento de mayor velocidad posible a las aplicaciones sensibles a la latencia en el centro de datos.
La serie Optane SSD DC P4800X de Intel fue lanzado en marzo de 2017 con la promesa de traer al mercado un nuevo medio de memoria de clase de almacenamiento (SCM) llamado 3D XPoint (Intel con la marca Optane). La P4800X se lanzó como una unidad NVMe tradicional de 2.5″ (U.2) y como una tarjeta complementaria PCIe. Las capacidades iniciales comenzaron en 375 GB con planes para llegar a 1.5 TB a fines de 2017. Ese objetivo de capacidad no se cumplió, pero Intel lanzó Modelos Optane de 750 GB en noviembre. Independientemente de la capacidad, el P4800X tiene un trabajo y es ofrecer el almacenamiento de mayor velocidad posible a las aplicaciones sensibles a la latencia en el centro de datos.
Dada la menor capacidad de las unidades, es menos probable que la empresa llene los JBOD con SSD P4800X para usar como almacenamiento principal. Aunque eso es ciertamente posible como una solución puntual para aplicaciones que pueden beneficiarse de un almacenamiento más rápido, como pequeños conjuntos de datos analíticos y casos de uso de BI. Los proveedores de matrices empresariales tampoco se han apresurado a adoptar Optane en cantidad en sus diseños de sistemas, nuevamente en gran parte debido a las limitaciones de capacidad. Sin embargo, HPE ha explorado el uso de Optane como caché para sistemas 3PAR y otros ciertamente buscan integrar esta clase de almacenamiento en sus sistemas a medida que la tecnología madura. Sin embargo, existe un conjunto inmediato de excelentes casos de uso para SSD basados en Optane en el mundo del almacenamiento definido por software donde los diseños tienen más flexibilidad para dar cuenta de esta nueva clase de almacenamiento.
VMware vSAN es quizás el más visible en este espacio, ya que ofreció soporte de día 0 para el P4800X y tener una ventaja dominante en el espacio HCI. vSAN también está excepcionalmente bien posicionado para aprovechar estas unidades más pequeñas porque operan en una arquitectura de dos niveles. El almacenamiento de vSAN se coordina en grupos de discos, con un nivel para toda la actividad de escritura entrante, así como un nivel de lectura orientado a la capacidad. Actualmente, vSAN solo aprovecha hasta 600 GB por unidad en el nivel de escritura, por lo que las capacidades más pequeñas del P4800X no son realmente una limitación. Para los usuarios de vSAN, esto significa que para las implementaciones con el P4800X actuando como una unidad de caché, las escrituras se realizan a la mayor velocidad posible en los clústeres de vSAN.
Esta revisión es del P4800X en formato U.375 de 2 GB. Si bien trabaja en gran medida como parte de un grupo de discos para nuestro próxima revisión de vSAN, pudimos ejecutar un subconjunto de nuestras pruebas SSD empresariales normales para brindar una imagen más completa del perfil de rendimiento del P4800X.
Especificaciones Intel Optane SSD DC P4800X
Factor de forma | AIC HHHL, U.2 |
Capacidad | 375GB, 750GB |
Fácil de usar | PCIe 3 × 4, NVMe |
Estado latente | <10μs |
QoS | |
4 KB aleatorio, profundidad de cola 1, lectura/escritura | <60/100μs |
4 KB aleatorio, profundidad de cola 16, R/W | <150/200μs |
Throughput | |
4 KB aleatorio, profundidad de cola 16, R/W | hasta 550/500K IOPS |
4 KB aleatorio, profundidad de cola 16, mixto 70/30 R/W | hasta 500 XNUMX IOPS |
Trabajadora | |
DWPD | 30 |
Petabytes escritos | |
375GB | 20.5PBW |
750GB | 41PBW |
Desempeno
Banco de pruebas
Nuestras revisiones de Enterprise SSD aprovechan un Lenovo ThinkSystem SR850 para pruebas de aplicaciones y un Dell PowerEdge R740xd para benchmarks sintéticos. El ThinkSystem SR850 es una plataforma de CPU cuádruple bien equipada que ofrece una potencia de CPU muy por encima de lo que se necesita para hacer hincapié en el almacenamiento local de alto rendimiento. Las pruebas sintéticas que no requieren muchos recursos de CPU utilizan el servidor de doble procesador más tradicional. En ambos casos, la intención es mostrar el almacenamiento local de la mejor manera posible que se alinee con las especificaciones máximas de la unidad del proveedor de almacenamiento.
Lenovo Think System SR850
- 4 CPU Intel Platinum 8160 (2.1 GHz x 24 núcleos)
- 16 DRAM ECC de 32 GB DDR4-2666 MHz
- 2 tarjetas RAID 930-8i 12 Gb/s
- 8 bahías NVMe
- VMware ESXI 6.5
Dell PowerEdge R740xd
- 2 CPU Intel Gold 6130 (2.1 GHz x 16 núcleos)
- 16 memorias ECC de 16 GB DDR4-2666 MHz
- 1 tarjeta RAID PERC 730 de 2 GB y 12 Gb/s
- Adaptador NVMe adicional
- Ubuntu-16.04.3-escritorio-amd64
Antecedentes de prueba y comparables
Los Laboratorio de pruebas de StorageReview Enterprise proporciona una arquitectura flexible para realizar pruebas comparativas de dispositivos de almacenamiento empresarial en un entorno comparable al que encuentran los administradores en implementaciones reales. El Enterprise Test Lab incorpora una variedad de servidores, redes, acondicionamiento de energía y otra infraestructura de red que permite a nuestro personal establecer condiciones del mundo real para medir con precisión el rendimiento durante nuestras revisiones.
Incorporamos estos detalles sobre el entorno de laboratorio y los protocolos en las revisiones para que los profesionales de TI y los responsables de la adquisición de almacenamiento puedan comprender las condiciones en las que hemos logrado los siguientes resultados. El fabricante del equipo que estamos probando no paga ni supervisa ninguna de nuestras revisiones. Detalles adicionales sobre el Laboratorio de pruebas de StorageReview Enterprise y una descripción general de sus capacidades de red están disponibles en esas respectivas páginas.
Comparables para esta revisión:
- Memblaze PBlaze5 3.2TB
- Intel P4510 2 TB
- Samsung PM1725a 1.6TB
- Huawei ES3000 V5 3.2TB
- Toshiba PX04 1.6TB
Houdini por SideFX
La prueba de Houdini está diseñada específicamente para evaluar el rendimiento del almacenamiento en relación con la representación CGI. El banco de pruebas para esta aplicación es una variante del núcleo Dell PowerEdge R740xd tipo de servidor que usamos en el laboratorio con dos CPU Intel 6130 y 64 GB de DRAM. En este caso, instalamos Ubuntu Desktop (ubuntu-16.04.3-desktop-amd64) ejecutando bare metal. La salida del punto de referencia se mide en segundos para completarse, cuanto menos mejor.
La demostración de Maelstrom representa una sección de la canalización de renderizado que destaca las capacidades de rendimiento del almacenamiento al demostrar su capacidad para usar de manera efectiva el archivo de intercambio como una forma de memoria extendida. La prueba no escribe los datos de los resultados ni procesa los puntos para aislar el efecto de tiempo de pared del impacto de la latencia en el componente de almacenamiento subyacente. La prueba en sí se compone de cinco fases, tres de las cuales ejecutamos como parte del benchmark, que son las siguientes:
- Carga puntos empaquetados desde el disco. Este es el momento de leer desde el disco. Esto es de un solo subproceso, lo que puede limitar el rendimiento general.
- Desempaqueta los puntos en una sola matriz plana para permitir que se procesen. Si los puntos no dependen de otros puntos, el conjunto de trabajo podría ajustarse para permanecer en el núcleo. Este paso es de subprocesos múltiples.
- (No Ejecutar) Procesa los puntos.
- Los vuelve a empaquetar en bloques divididos en cubos adecuados para volver a almacenarlos en el disco. Este paso es de subprocesos múltiples.
- (No Ejecutar) Escribe los bloques almacenados nuevamente en el disco.
El Intel Optane SSD DC P4800X ocupó el primer lugar en la prueba de Houdini con 1,520.4 segundos. El P4800X tuvo el mejor rendimiento de cualquiera de las unidades Optane, así como el mejor en general.
Análisis de carga de trabajo de VDBench
Cuando se trata de comparar dispositivos de almacenamiento, las pruebas de aplicaciones son las mejores y las pruebas sintéticas ocupan el segundo lugar. Si bien no son una representación perfecta de las cargas de trabajo reales, las pruebas sintéticas ayudan a los dispositivos de almacenamiento de referencia con un factor de repetibilidad que facilita la comparación de "manzanas con manzanas" entre las soluciones de la competencia. Estas cargas de trabajo ofrecen una gama de diferentes perfiles de prueba que van desde pruebas de "cuatro esquinas", pruebas comunes de tamaño de transferencia de bases de datos, hasta capturas de seguimiento de diferentes entornos VDI. Todas estas pruebas aprovechan el generador de cargas de trabajo vdBench común, con un motor de secuencias de comandos para automatizar y capturar resultados en un gran clúster de pruebas informáticas. Esto nos permite repetir las mismas cargas de trabajo en una amplia gama de dispositivos de almacenamiento, incluidos arreglos flash y dispositivos de almacenamiento individuales. Nuestro proceso de prueba para estos puntos de referencia llena toda la superficie del disco con datos, luego divide una sección del disco equivalente al 25% de la capacidad del disco para simular cómo el disco podría responder a las cargas de trabajo de la aplicación. Esto es diferente a las pruebas de entropía completa que usan el 100% del impulso y lo llevan al estado estable. Como resultado, estas cifras reflejarán velocidades de escritura más altas.
perfiles:
- Lectura aleatoria 4K: 100 % de lectura, 128 subprocesos, 0-120 % de iorate
- Escritura aleatoria 4K: 100 % de escritura, 64 subprocesos, 0-120 % de iorate
- Lectura secuencial de 64 K: 100 % de lectura, 16 subprocesos, 0-120 % de iorate
- Escritura secuencial de 64 K: 100 % de escritura, 8 subprocesos, 0-120 % de iorate
- Base de datos sintética: SQL y Oracle
- Trazas de clones vinculados y clones completos de VDI
Para un rendimiento aleatorio máximo de 4K, la Intel Optane SSD DC P4800X (denominada P4800X de aquí en adelante) comenzó con una latencia mucho más baja que las otras unidades antes de aumentar justo después de 500 585,754 IOPS y terminar en último lugar con 213 XNUMX IOPS con una latencia de XNUMX μs .
Con un rendimiento de escritura máximo de 4K, el P4800X tuvo una mejor actuación, terminando en segundo lugar con un rendimiento máximo de aproximadamente 554K IOPS y una latencia de solo 155 μs.
Cambiando a cargas de trabajo secuenciales, en nuestra lectura de 64K vimos un patrón similar a la lectura de 4K. El P4800X comenzó con una latencia mucho más baja que las otras unidades antes de aumentar a aproximadamente 35 40,558 IOPS y alcanzar un máximo de 2.53 394 IOPS o XNUMX GB/s con una latencia de XNUMX μs. Esto colocó a la unidad en el cuarto lugar general.
Para la escritura de 64K, el P4800X quedó en segundo lugar con un rendimiento máximo de aproximadamente 34,700 2.17 IOPS o 380 GB/s con una latencia de XNUMX μs antes de caer ligeramente.
Con nuestra carga de trabajo de SQL, vemos que el P4800X salta al frente por un amplio margen con una puntuación máxima de 286,548 111 IOPS con una latencia de solo XNUMX μs.
En nuestro SQL90-10, el P4800X continuó su reinado con una puntuación máxima de 276,530 114 IOPS con una latencia de XNUMX μs.
Manteniéndose en el primer lugar en SQL 80-20, el P4800X alcanzó un máximo de aproximadamente 266 111 IOPS con una latencia de aproximadamente XNUMX μs antes de una pequeña caída.
Pasando a nuestras cargas de trabajo de Oracle, el P4800X ocupó el segundo lugar con una puntuación máxima de casi 248 127 IOPS y una latencia de XNUMX μs.
En Oracle 90-10, la P4800X superó a las demás unidades con un rendimiento máximo de 276,703 79 IOPS con una latencia de solo XNUMX μs.
Nuevamente en Oracle 80-20, vimos al P4800X al frente con 265,769 IOPS y una latencia de solo 82 μs.
A continuación, cambiamos a nuestra prueba de clones VDI, Full Clone (FC) y Linked Clone (LC). Para VDI FC Boot, el P4800X comenzó extremadamente fuerte antes de saltar y ocupar el tercer lugar con un rendimiento máximo de 167,856 199 IOPS y una latencia de XNUMX μs.
Con el inicio de sesión inicial de VDI FC, el P4800X volvió a ocupar el tercer lugar con 108,159 274 IOPS y una latencia de XNUMX μs.
Para VDI FC Monday Login, el P4800X saltó al segundo lugar con un rendimiento máximo de 97,198 163 IOPS y una latencia de XNUMX μs.
Pasando a VDI LC Boot, el P4800X pudo ocupar el primer lugar con una puntuación de 93,095 171 IOPS y una latencia de XNUMX μs.
El inicio de sesión inicial de VDI LC obtuvo otro primer puesto para el P4800X con una puntuación de 66,463 118 IOPS y una latencia de XNUMX μs.
Finalmente, nuestra prueba VDI LC Monday Login colocó al P4800X en segundo lugar con 67,085 235 IOPS con una latencia de XNUMX μs.
Conclusión
Intel Optane SSD DC P4800X es otra unidad lanzada con la tecnología 3D XPoint de Intel. Como su nombre lo indica, la unidad está diseñada específicamente para el centro de datos y viene en factores de forma comunes U.2 y AIC HHHL. Uno de los inconvenientes que se hace evidente de inmediato es que la unidad solo se ofrece en capacidades de 375 GB y 750 GB. Esto limita sus casos de uso por un lado, pero por otro lado, sus casos de uso están orientados predominantemente hacia cargas de trabajo y aplicaciones donde la baja latencia es primordial frente a la capacidad. En este sentido, la tecnología Optane ha demostrado ser líder en la industria tanto en cargas de trabajo empresariales como de usuarios finales.
La pequeña capacidad del P4800X es la razón por la que tenemos un pequeño agujero en nuestro aluvión normal de puntos de referencia. La capacidad de la unidad no era lo suficientemente grande para ejecutar SQL o Sysbench, por lo que están ausentes de esta revisión de una sola unidad. En la primera carga de trabajo de análisis de aplicaciones que pudimos ejecutar, Houdini by SideFX, el P4800X fue el mejor en general con 1,520.4 segundos. En nuestro VDBench, el P4800X dominó en todos los ámbitos en colas de baja profundidad. El rendimiento de gama alta fue más mixto con el P4800X, donde algunos productos NVMe tradicionales lo superaron en rendimiento. Sin embargo, superó a otros en áreas como SQL y Oracle 90-10 y 80-20. Los puntos destacados del P4800X incluyen más de medio millón de IOPS en ambas pruebas de 4K, 2.53 GB/s en lectura de 64 K y 2.17 GB/s en escritura de 64 K. En las tres pruebas de SQL, el P4800X tenía más de un cuarto de millón de IOPS y 250 4800 IOPS o más en nuestras pruebas de Oracle. Pero aparte del rendimiento máximo, Intel Optane P4800X tenía latencias extremadamente bajas. En cada prueba, la latencia comenzó muy baja, por lo general mucho más baja que todas las demás unidades. Y en algunos casos, el P79X tuvo un rendimiento máximo con una latencia tan baja como 90 μs en Oracle 10-82 y 80 μs en Oracle 20-XNUMX.
Para cargas de trabajo de baja latencia, actualmente no hay nada que se acerque al Intel Optane SSD DC P4800X. Si bien hay áreas en las que los productos NVMe tradicionales pueden superarlo en ancho de banda general e IOPS, en términos generales, el P4800X no encajaría en esos casos de uso en función de sus métricas de precio/capacidad. Sin embargo, es emocionante pensar en las posibilidades de la tecnología Intel Optane una vez que las unidades empresariales alcanzan los puntos de mayor capacidad; especialmente algo en la clase de 2 TB que sigue siendo un favorito para los proveedores de arreglos, a pesar de que los SSD SAS de 30 TB están comúnmente disponibles. En nuestro caso de uso específico en torno a vSAN, el P4800X ofrece el rendimiento más rápido posible para la capa de caché de escritura. Para cualquiera que desee aprovechar al máximo vSAN, el P4800X es el estándar de facto.
Página del producto Intel P4800X
Suscríbase al boletín de StorageReview