Se sabe que los profesionales creativos, los científicos de datos y otros con aplicaciones de uso intensivo de datos invierten de forma extravagante en sus estaciones de trabajo. Y por una buena razón, estas plataformas están diseñadas para ejecutar tareas rápidamente, creando valor comercial inmediato. Todo este trabajo crea un nuevo problema para el almacenamiento. O no hay suficiente flash rápido en las estaciones de trabajo, o la complejidad del hardware/software lo hace insostenible. Si bien hay varias formas de solucionar el problema, esta es la forma más fácil de resolver el problema, con 30.72 TB de flash empresarial y una sola ranura PCIe.
Se sabe que los profesionales creativos, los científicos de datos y otros con aplicaciones de uso intensivo de datos invierten de forma extravagante en sus estaciones de trabajo. Y por una buena razón, estas plataformas están diseñadas para ejecutar tareas rápidamente, creando valor comercial inmediato. Todo este trabajo crea un nuevo problema para el almacenamiento. O no hay suficiente flash rápido en las estaciones de trabajo, o la complejidad del hardware/software lo hace insostenible. Si bien hay varias formas de solucionar el problema, esta es la forma más fácil de resolver el problema, con 30.72 TB de flash empresarial y una sola ranura PCIe.
Al evaluar las opciones de almacenamiento, a los profesionales no les faltan opciones. La mayoría de las compilaciones premium de Lenovo, Dell, HP y otros incluyen un grupo de ranuras M.2 con algunas otras opciones para HDD y SSD. Sin embargo, los M.2 son generalmente pequeños y superan los 4 TB en la mayoría de los configuradores de estaciones de trabajo. Y si bien puede obtener un par de M.2 en un solo sistema, muchos conjuntos de datos de trabajo se expanden más allá de cualquiera de estas unidades, lo que significa que debe entrar en juego una solución RAID de software.
Alternativamente, los usuarios pueden implementar una tarjeta RAID estándar, pero incluso entonces, la mayoría de los equipos de estaciones de trabajo no están configurados con un montón de bahías SSD de 2.5″. Incluso si lo hicieran, la mayoría de las tarjetas RAID limitarán las capacidades de rendimiento de flash y agregarán una cantidad decente de complejidad al sistema. Sin embargo, si la resiliencia de los datos es crítica, todavía tienen un lugar.
Los usuarios de estaciones de trabajo también pueden optar por el almacenamiento conectado a la red, o si se sienten aventureros y tienen soporte de TI, pueden colocar una tarjeta Fibre Channel para obtener una conexión de baja latencia a un arreglo. NAS claramente puede proporcionar almacenamiento "ilimitado" a través del cable, pero el rendimiento no coincidirá con NVMe local. También está el aspecto del costo de dedicar una cantidad significativa de almacenamiento a un usuario de escritorio desde un arreglo all-flash. Y aunque FC es definitivamente viable en algunos casos, hay problemas de soporte de cableado físico que abordar, agravados por el hecho de que muchas computadoras de escritorio no viven en o cerca del centro de datos donde generalmente residen los conmutadores FC.
Con la serie de sistemas AMD Threadripper que hemos visto en el laboratorio recientemente, decidimos explorar opciones alternativas para ver qué tan fáciles y confiables pueden ser los SSD empresariales locales en una estación de trabajo moderna y premium.
Lenovo ThinkStation P620 + SSD Solidigm P5316 de 30.72 TB
Los Lenovo ThinkStation P620 fue una de las primeras plataformas AMD Threadripper, actualizada el verano pasado con soporte para el procesador AMD Ryzen Threadripper PRO 5995WX. Este silicio es el sueño de un profesional, ya que ofrece hasta 64 núcleos y 128 hilos. El P620 también admite hasta dos GPU NVIDIA A6000, lo que significa que está listo para comenzar a trabajar.
Incluso con toda esta potencia, el P620 tiene la típica mezcolanza de soporte de disco que se encuentra en casi todas las estaciones de trabajo, y cada una de las opciones viene con cierto nivel de compromiso como se articuló anteriormente. Optamos por una solución muy simple, colocar un Tarjeta adaptadora PCIe de $20 y Solidigmo P5316 SSD de 30.72 TB. Para ser justos, estas unidades, en una cantidad de una, tienen un precio de venta de alrededor de $ 3000. Dicho esto, las compilaciones de Threadripper con una sola A6000 tienden a rondar los $ 15, por lo que una inversión razonable en almacenamiento puede estar justificada para algunos.
Es una pena que las estaciones de trabajo de gama alta, en su mayor parte, aún no hayan encontrado una excelente manera de adoptar flash empresarial. Una preocupación principal al pasar a SSD empresariales es el enfriamiento, una preocupación legítima. El consumo de energía de una SSD empresarial es mucho mayor que el de una unidad de cliente típica, lo que significa más calor. Si no se trata el calor, la unidad reducirá el rendimiento para mantenerse en línea. Sin embargo, ese es el mejor de los casos; vemos que las unidades desaparecen regularmente si no se tiene en cuenta la refrigeración adecuada.
En cada uno de los sistemas Threadripper que hemos visto, la refrigeración es un factor fundamental en el diseño del sistema. Lenovo ofrece pasos para las velocidades de los ventiladores de enfriamiento que los usuarios querrán usar en los casos en que ambas GPU funcionen o cuando se realicen cálculos extensos durante un período prolongado. Teníamos curiosidad entonces; si colocamos un SSD empresarial en el P620 y dejamos que haga lo suyo durante el fin de semana, ¿qué sucedería?
500 mil millones Pi más tarde
En el caso de esta prueba, aterrizamos en el cálculo de Pi, ya que tiende a tener un gran impacto combinado con la CPU y nuestro almacenamiento recién agregado. Configuramos y-cruncher para calcular 500 mil millones de lugares de Pi, algo que esperábamos que tomara alrededor de un día de trabajo continuo según las ejecuciones anteriores. Pensamos que esto era suficiente para poner la unidad en un estado de esfuerzo suficiente para que la capacidad del P620 para enfriarla, o no, se hiciera evidente.
Veintitrés horas y 42 minutos después, teníamos nuestro cálculo de Pi completo. Por cierto, el tiempo es bastante respetable; nuestra ejecución de servidor más rápida de este cálculo en una caja AMD Genoa de doble procesador se encuentra en menos de 8 horas. Para la versión de procesador único Threadripper de silicio AMD, aproximadamente un día es bastante respetable.
Sin embargo, es importante destacar que la unidad nunca estuvo cerca de la aceleración térmica. En su punto máximo, nos mantuvimos por debajo de los 50 °C, muy por debajo del límite de 70 °C de la hoja de especificaciones.
Reflexiones Finales:
Dejando a un lado los cálculos de Pi, vale la pena señalar algunos puntos clave. Primero, en términos de la construcción general del sistema, agregamos un SSD empresarial a una estación de trabajo, ocupando una sola ranura. Eso deja espacio para el A6000 en nuestro sistema, más uno más si el caso de uso lo requiere. Alternativamente, puede colocar más de uno de estos SSD en caso de que haya una necesidad de capacidad masiva.
En segundo lugar, nuestra solución es simple y ampliamente compatible. No hay necesidad de hardware adicional que no sea el sled PCIe, y Windows o Linux lo verán como una sola unidad, lo que significa que no se necesita RAID de software u otros trucos. Esta es una nota importante, estamos tratando con estaciones de trabajo que tienen una inversión material en ellas, y los sistemas deben estar en línea y funcionando para proporcionar un retorno de esa inversión.
Por último, el rendimiento nativo del SSD único será más rápido que las opciones de almacenamiento en red. Para Ethernet, necesitaría una conexión de 100 GbE para superar la velocidad del rendimiento de lectura de NVMe Gen4 local, y Fibre Channel necesitaría más de dos enlaces de 32 Gb. También existe una preocupación por el costo y la proximidad con estas opciones de almacenamiento compartido que pueden superar el costo del flash QLC local solo en costos de infraestructura.
No hemos cubierto mucho terreno nuevo aquí, la ranura PCIe de la estación de trabajo ha sido durante mucho tiempo la forma de obtener más almacenamiento en un sistema. Dicho esto, a menudo se combina con SSD M.2 que comprometen la capacidad, la resistencia y la complejidad necesarias para presentar el almacenamiento al sistema. No todas las estaciones de trabajo necesitan 30 o más terabytes de almacenamiento rápido y sencillo. Aún así, para aquellos que lo hacen, estamos muy impresionados con la capacidad de las últimas estaciones de trabajo, como la P620, para manejar los requisitos de enfriamiento para mantener estos SSD felices de manera adecuada.
Interactuar con StorageReview
Boletín informativo | Canal de YouTube | Podcast iTunes/Spotify | @Instagram | Twitter | @TikTok | RSS Feed