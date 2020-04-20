Quizá su organización haya decidido recientemente comprar nodos de cómputo y dar los primeros pasos con la inteligencia artificial (IA). Hay muchos aspectos de su infraestructura de TI y su panorama tecnológico que debe analizar mientras se prepara para las cargas de trabajo de IA, incluidos, y quizás especialmente, sus sistemas de almacenamiento. La IA se basa en los datos y la forma en que se almacenan sus datos puede afectar significativamente al resultado de su proyecto de IA. No solo eso, sino que las cuatro etapas diferentes de la IA (ingesta, preparación, entrenamiento e inferencia) tienen cada una necesidades y requisitos de almacenamiento distintos.
Desafortunadamente, algunas organizaciones se centran en la parte de computación de la IA y pasan por alto la parte de almacenamiento. Este enfoque singular puede provocar, y a veces lo hace, la interrupción o el fracaso total de los proyectos de IA. Se necesitan cantidades masivas de datos para facilitar la fase de entrenamiento de la IA. Hay que ingerir, almacenar y preparar estos datos para que puedan "alimentar" en la fase de entrenamiento. Sin la capacidad de ingerir, almacenar y consumir los datos necesarios para el entrenamiento, el proyecto correrá el riesgo de fracasar.
Los proyectos de IA exigen una infraestructura de almacenamiento con un rendimiento, una escalabilidad y una flexibilidad excelentes. La buena noticia es que los sistemas de almacenamiento actuales pueden diseñarse específicamente para satisfacer las necesidades de los proyectos de IA. Dos buenos ejemplos de ello son algunos de los superordenadores más potentes del mundo, Sierra y Summit.
Ahora, veamos algunos requisitos.
Los requisitos para cada etapa del pipeline de la IA deben revisarse para la carga de trabajo esperada de su aplicación de IA. Las cargas de trabajo varían, pero algunas empresas que usan grandes conjuntos de datos pueden entrenar durante largos periodos de tiempo. Una vez finalizado el entrenamiento, esos datos suelen moverse fuera de plataformas de almacenamiento crítico para prepararse para una nueva carga de trabajo. La gestión manual de los datos puede ser un reto, por lo que es aconsejable pensar con antelación a la hora de considerar cómo se colocan los datos en el almacenamiento y adónde irán una vez finalizado el entrenamiento. Encontrar una plataforma que pueda mover datos automáticamente por usted le acerca un paso más a una gestión eficiente y capaz del almacenamiento para IA.
Después de revisar las implicaciones de sus propias necesidades de carga de trabajo, puede decidir las tecnologías de almacenamiento que mejor funcionan para su infraestructura de cómputo de IA y proyecto.
Ingesta de datosLos datos sin procesar para las cargas de trabajo de IA pueden provenir de diversas fuentes de datos estructurados y no estructurados, y necesita un lugar muy fiable para almacenar los datos. El medio de almacenamiento podría ser un data lake de alta capacidad o un nivel rápido, como el almacenamiento flash, especialmente para análisis en tiempo real.
Preparación de los datos. Una vez almacenados, los datos deben prepararse, ya que se encuentran en formato "en bruto". Los datos deben procesarse y formatearse para su consumo en las fases restantes. El rendimiento de entrada/salida de archivos es una consideración muy importante en esta etapa, ya que ahora tiene una mezcla de lecturas y escrituras aleatorias. Tómese el tiempo para averiguar cuáles son las necesidades de rendimiento de su pipeline de IA. Una vez formateados los datos, se introducirán en las redes neuronales para su entrenamiento.
Entrenamiento e inferencia. Estas etapas son muy intensivas en computación y, por lo general, requieren la introducción de datos en los modelos de entrenamiento. El entrenamiento es un proceso iterativo, que requiere ajustes y reajustes, que se utiliza para crear los modelos. La inferencia se puede considerar como la suma de los datos y el entrenamiento. Las GPU de los servidores y su infraestructura de almacenamiento adquieren una gran importancia debido a la necesidad de baja latencia, alto rendimiento y tiempos de respuesta rápidos. Sus redes de almacenamiento deben estar diseñadas para gestionar estos requisitos, así como la ingesta de datos y la preparación. A escala, esto estresa a muchos sistemas de almacenamiento, especialmente a los que no están preparados para las cargas de trabajo de la IA, por lo que es importante considerar específicamente si su plataforma de almacenamiento puede manejar las necesidades de carga de trabajo en línea con sus objetivos empresariales.
También considere lo siguiente: ¿su infraestructura de almacenamiento escala fácilmente? ¿Puede ampliar el sistema de almacenamiento a medida que crecen sus necesidades de datos? Estas son preguntas muy importantes que tienen un efecto directo en sus necesidades de infraestructura de IA.
Asegúrese de poder escalar su infraestructura de almacenamiento con mínima o ninguna interrupción en sus operaciones de producción, manteniendo el ritmo del crecimiento de los datos en su empresa. Sea lo suficientemente flexible como para considerar diferentes configuraciones de almacenamiento para las distintas necesidades de la infraestructura de la IA.
Una planificación cuidadosa, adaptando sus requisitos de servidor y modelado de IA a la infraestructura de almacenamiento, le ayudará a sacar el máximo partido a sus inversiones y a lograr el éxito en sus proyectos de IA.
Estas recomendaciones son solo un punto de partida. Tenga siempre en cuenta que, si no tiene la experiencia en su organización para diseñar e implementar la infraestructura de almacenamiento adecuada para IA, debería trabajar con su proveedor para ayudar y preparar sus sistemas de almacenamiento para la IA.
Y si tiene preguntas o busca ayuda para planificar y preparar un proyecto de IA con IBM Storage, no dude en contactar con IBM Systems Lab Services.
Desbloquee más valor empresarial incorporando la IA a las cargas de trabajo de misión crítica en IBM z17.
IBM Z es una familia de infraestructura moderna impulsada por el procesador IBM Telum que ejecuta sistemas operativos empresariales y software IBM Z, lo que ofrece una mayor precisión, productividad y agilidad de IA.
El IBM z17 integra IA avanzada en la nube híbrida, lo que optimiza el rendimiento, la seguridad y la toma de decisiones allí donde residen los datos críticos.
Descubra cómo puede salvaguardar los datos de su organización frente a las ciberamenazas y garantizar una rápida recuperación durante acontecimientos críticos.
Utilice marcos y herramientas de código abierto para aplicar la IA y el machine learning a sus datos empresariales más valiosos en mainframes IBM® zSystems.
IBM ofrece soluciones de infraestructura de IA para acelerar el impacto en su empresa con una estrategia de diseño híbrida.
Desbloquee el valor de los datos empresariales con IBM Consulting y cree una organización impulsada por conocimientos que ofrezca ventajas empresariales.
Potencie sus cargas de trabajo de IA con una infraestructura optimizada para el rendimiento, la fiabilidad y la integración de la nube, construida para las demandas reales de las empresas.