Apenas pasa una semana sin que tengamos noticias de un proveedor de TI sobre el impacto que tienen sus soluciones en las organizaciones que están involucradas en inteligencia artificial, aprendizaje profundo, aprendizaje automático o inteligencia de punta. Sin embargo, el problema es que faltan conocimientos materiales sobre cómo estas soluciones afectan el desempeño de cada una de estas tareas. Recientemente, decidimos ver si podíamos hacer algo al respecto asociándonos con byteLAKE, un creador de soluciones de IA y HPC con sede en Polonia. El objetivo principal es evaluar el impacto del almacenamiento y la GPU en las cargas de trabajo de IA.Apenas pasa una semana sin que tengamos noticias de un proveedor de TI sobre el impacto que tienen sus soluciones en las organizaciones que están involucradas en inteligencia artificial, aprendizaje profundo, aprendizaje automático o inteligencia de punta. Sin embargo, el problema es que faltan conocimientos materiales sobre cómo estas soluciones afectan el desempeño de cada una de estas tareas. Recientemente, decidimos ver si podíamos hacer algo al respecto asociándonos con byteLAKE, un creador de soluciones de IA y HPC con sede en Polonia. El objetivo principal es evaluar el impacto del almacenamiento y la GPU en las cargas de trabajo de IA.
Impacto del almacenamiento en la IA
Inicialmente, queríamos explorar una noción popular de que el almacenamiento local afecta el rendimiento de los modelos de IA. Tomamos uno de los Dell EMC PowerEdge R740xd servidores en nuestro laboratorio, configurados con dos CPU Intel Xeon Gold 6130 con 256 GB de DRAM. Ejecutamos la prueba byteLAKE AI usando tres alternativas de almacenamiento local diferentes. Para la prueba usamos un legado KIOXIA PX04S SSD junto con el mucho más rápido, Samsung 983ZET y Intel® Optane® 900P.
Durante el benchmark, analizamos el desempeño del proceso de aprendizaje de IA. En las pruebas, ejecutamos el proceso de aprendizaje para un escenario del mundo real. En este caso, las pruebas fueron parte del procedimiento de entrenamiento en uno de los productos byteLAKE: Guardia EWA. Se basa en el último YOLO (You Only Look Once), que es un modelo de detección en tiempo real de última generación. El modelo consta de una sola capa de entrada, 22 capas de convolución, 5 capas de agrupación, 2 capas de enrutador, una sola capa de reorganización y una sola capa de detección.
Como métrica básica de rendimiento, hemos utilizado el tiempo de ejecución del entrenamiento para 5000 épocas. Los puntos de referencia se repitieron tres veces para cada configuración de almacenamiento y los valores promedio se presentan a continuación.
Resultados:
- KIOXIA 98h 24m
- Samsung 98h 44
- Información 98h 42
Como queda claro en los datos, el almacenamiento local no tuvo impacto en el rendimiento. Las pruebas variaron desde un SSD SATA hasta el último y mejor Optane, sin impacto alguno. Dicho esto, el almacenamiento puede desempeñar un papel más importante cuando se trata de la entrada y salida de datos, pero computacionalmente para la IA, en este caso no hubo impacto.
Impacto de la GPU y el almacenamiento en la IA
Con los datos de almacenamiento disponibles, agregamos un solo NVIDIA T4 al PowerEdge para medir el impacto de una GPU en la IA. Para esta prueba, también ejecutamos las mismas tres configuraciones de almacenamiento.
Resultados:
- KIOXÍA 4h 30
- Samsung 4h 28m
- Inteligencia 4h 27m
Como era de esperar, la GPU tuvo un impacto, un impacto exponencial de hecho, impulsando una mejora de 22x. Con la GPU acelerando el rendimiento general de la IA, se pensó que el almacenamiento más rápido podría tener un impacto. Sin embargo, ese no fue el caso, ya que la unidad SATA estaba en línea con el NVMe de alta velocidad.
Conclusiones
En esta prueba, encontramos que el uso de dispositivos de almacenamiento más rápidos no mejora el rendimiento del aprendizaje. La razón principal aquí es una estructura compleja del modelo de IA. El tiempo de aprendizaje es más largo que el tiempo de lectura de datos. Dicho de otra manera, el tiempo de aprendizaje usando el lote actual de imágenes es más largo que el tiempo necesario para leer el siguiente. En consecuencia, las operaciones de almacenamiento están ocultas detrás de los cálculos de IA.
Al agregar NVIDIA T4, se pensó que un procesamiento más rápido por parte de la IA induciría al almacenamiento a tener un impacto en el rendimiento. Este no fue el caso en esta prueba, ya que incluso con el T4, el modelo de IA todavía tenía un componente de aprendizaje más pesado y no requería que el almacenamiento fuera particularmente rápido.
Si bien se necesita más trabajo para probar más a fondo el impacto de componentes y sistemas específicos en la IA, creemos que estos datos iniciales son útiles y un buen punto de partida para la conversación. Necesitamos datos de aplicaciones para poder comprender mejor dónde están las palancas correctas desde el punto de vista de TI y dónde el gasto presupuestario puede producir los resultados más impactantes. Por supuesto, esto también depende en gran medida de dónde se lleve a cabo esta actividad, ya sea en el centro de datos o en el perímetro. Por ahora, damos la bienvenida al compromiso de byteLAKE y otros en la punta de la lanza de IA para ayudar a proporcionar datos útiles para ayudar a responder estas preguntas apremiantes.
Esta es nuestra primera prueba de IA, pero no la última. Mariusz Kolanko, cofundador de byteLAKE, indicó que han estado trabajando en un producto llamado Paquete CFD (AI para Computational Fluid Dynamics “CFD” para acelerar los solucionadores) donde el proceso de aprendizaje profundo necesita una gran cantidad de datos para cada época de entrenamiento. De hecho, este modelo puede generar una mayor carga en el almacenamiento para entrenar modelos en el área de Big Data y podría tener un impacto en el rendimiento de los propios procesos de aprendizaje profundo. En última instancia, como con cualquier aplicación, es fundamental comprender las necesidades de la aplicación para asignar los recursos adecuados del centro de datos. Claramente, la IA no es una aplicación única para todas las aplicaciones.
Más información sobre byteLAKE
Interactuar con StorageReview
Boletín informativo | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | Facebook | RSS Feed