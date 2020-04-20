Quizás su organización haya decidido recientemente comprar nodos y dar sus primeros pasos con la inteligencia artificial (IA). Hay muchos aspectos de su infraestructura de TI y del escenario tecnológico que debe analizar a medida que se prepara para las cargas de trabajo de IA, incluidos, y quizás especialmente, sus sistemas de almacenamiento. La IA está impulsada por los datos, y la forma en que se almacenan sus datos puede afectar significativamente el resultado de su proyecto de IA. No solo eso, sino que las cuatro etapas diferentes de la IA (ingesta, preparación, entrenamiento e inferencia) tienen cada una necesidades y requisitos de almacenamiento distintos.
Desafortunadamente, algunas organizaciones se centran en la parte de computación de la IA y pasan por alto la parte de almacenamiento. Este enfoque singular puede, y a veces lo hace, conducir a la interrupción o al fracaso completo de los proyectos de IA. Se necesitan grandes cantidades de datos para facilitar la etapa de entrenamiento de la IA. Estos datos deben ingerirse, almacenarse y prepararse para que puedan “alimentarse” a la etapa de entrenamiento. Sin la capacidad de ingerir, almacenar y consumir los datos necesarios para el entrenamiento, el proyecto correrá el riesgo de fracasar.
Los proyectos de IA requieren una infraestructura de almacenamiento con un excelente rendimiento, escalabilidad y flexibilidad. La buena noticia es que los sistemas de almacenamiento actuales pueden diseñarse específicamente para satisfacer las necesidades de los proyectos de IA. Dos grandes ejemplos de esto son algunas de las supercomputadoras más poderosas del mundo, Sierra y Summit.
Ahora, veamos algunos requisitos.
Los requisitos para cada etapa del pipeline de IA deben revisarse para la carga de trabajo esperada de su aplicación de IA. Las cargas de trabajo varían, pero algunas empresas que usan grandes conjuntos de datos pueden entrenarse durante largos periodos. Una vez que se realiza el entrenamiento, esos datos a menudo se mueven fuera de las plataformas de almacenamiento crítico para prepararse para una nueva carga de trabajo. La gestión manual de datos puede ser un desafío, por lo que es aconsejable anticiparse al considerar cómo se colocan los datos en el almacenamiento y a dónde irán una vez que se complete el entrenamiento. Encontrar una plataforma que pueda mover datos automáticamente por usted lo acerca un paso más a una gestión de almacenamiento eficiente y capaz para la IA.
Después de revisar las implicaciones de sus propias necesidades de carga de trabajo, puede decidir qué tecnologías de almacenamiento funcionan mejor para su infraestructura de cómputo de IA y proyecto.
Ingesta de datos.Los datos sin procesar para las cargas de trabajo de IA pueden provenir de una variedad de fuentes de datos estructuradas y no estructuradas, y necesita un lugar muy confiable para almacenar los datos. El medio de almacenamiento podría ser un lago de datos de alta capacidad o un nivel rápido, como almacenamiento flash, especialmente para análisis en tiempo real.
Preparación de datos.Una vez almacenados, los datos deben estar preparados ya que están en un formato “bruto”. Los datos deben procesarse y formatearse para su consumo en las fases restantes. El rendimiento de E/S de archivos es una consideración muy importante en esta etapa, ya que ahora tiene una mezcla de lecturas y escrituras aleatorias. Tómese el tiempo para averiguar cuáles son las necesidades de rendimiento de su pipeline de IA. Una vez formateados los datos, se introducirán en las redes neuronales para su entrenamiento.
Entrenamiento e inferencia. Estas etapas son muy intensivas en cómputo y generalmente requieren la transmisión de datos a los modelos de entrenamiento. El entrenamiento es un proceso iterativo, que requiere configuración y restablecimiento, que se utiliza para crear los modelos. La inferencia se puede considerar como la suma de los datos y el entrenamiento. Las GPU en los servidores y su infraestructura de almacenamiento de información se vuelven muy importantes aquí debido a la necesidad de baja latencia, alto rendimiento y tiempos de respuesta rápidos. Sus redes de almacenamiento deben diseñarse para manejar estos requisitos, así como la ingesta y preparación de datos. A escala, esto pone a prueba muchos sistemas de almacenamiento, especialmente los que no están preparados para cargas de trabajo de IA, por lo que es importante considerar específicamente si su plataforma de almacenamiento puede manejar las necesidades de carga de trabajo de acuerdo con sus objetivos comerciales.
Considere también: ¿su infraestructura de almacenamiento escala fácilmente? ¿Puede ampliar el sistema de almacenamiento a medida que crecen sus necesidades de datos? Estas son preguntas muy importantes que tienen un efecto directo en sus necesidades de infraestructura de IA.
Asegúrese de poder ampliar su infraestructura de almacenamiento con una interrupción mínima o nula de sus operaciones de producción, manteniendo el ritmo del crecimiento de los datos en su negocio. Sea lo suficientemente flexible como para considerar diferentes configuraciones de almacenamiento para las diferentes necesidades de la infraestructura de IA.
Una planeación cuidadosa, adaptando sus requisitos de servidor y modelado de IA a la infraestructura de almacenamiento, le ayudará a sacar el máximo partido a sus inversiones y a lograr el éxito en sus proyectos de IA.
Estas recomendaciones son solo un punto de partida. Tenga siempre en cuenta que si su organización no cuenta con la experiencia necesaria para diseñar e implementar la infraestructura de almacenamiento de IA correcta, debe trabajar con su proveedor para que le ayude a preparar sus sistemas de almacenamiento para la IA.
Y si tiene preguntas o busca ayuda para planificar y preparar un proyecto de IA con IBM Storage, no dude en ponerse en contacto con IBM Systems Lab Services.
Desbloquee más valor de negocio al incorporar IA a las cargas de trabajo de misión crítica en IBM® z17.
IBM® Z es una familia de infraestructura moderna impulsada por el procesador IBM® Telum que ejecuta sistemas operativos empresariales y software IBM Z, lo que brinda una mayor precisión, productividad y agilidad de la IA.
IBM z17 integra IA avanzada en la nube híbrida, optimizando el rendimiento, la seguridad y la toma de decisiones donde residen los datos críticos.
Descubra cómo puede salvaguardar los datos de su organización frente a las ciberamenazas y garantizar una rápida recuperación durante acontecimientos críticos.
Utilice marcos y herramientas de código abierto para aplicar IA y machine learning a sus datos empresariales más valiosos en mainframes IBM zSystems.
IBM proporciona soluciones de infraestructura de IA para acelerar el impacto en toda su empresa con una estrategia híbrida por diseño.
Desbloquee el valor de los datos empresariales con IBM Consulting y cree una organización impulsada por insights que ofrezca ventajas empresariales.
Potencie sus cargas de trabajo de IA con una infraestructura optimizada para el rendimiento, la confiabilidad y la integración de la nube híbrida, creada para las demandas empresariales reales.