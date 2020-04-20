Talvez sua organização tenha decidido recentemente comprar nós de computação e comece a usar a inteligência artificial (IA). Há muitos aspectos da sua infraestrutura de TI e do cenário tecnológico para examinar enquanto se prepara para as cargas de trabalho de IA, incluindo, e talvez especialmente, seus sistemas de armazenamento. A IA é impulsionada por data, e como seus dados são armazenados pode afetar significativamente o resultado do seu projeto de IA. Além disso, os quatro estágios diferentes da IA (ingestão, preparação, treinamento e inferência), cada um com necessidades e requisitos de armazenamento diferentes.
Infelizmente, algumas organizações se concentram no lado computacional da IA e ignoram o lado do armazenamento. Esse foco singular pode, e às vezes leva, à interrupção ou ao fracasso completo dos projetos de IA. São necessárias grandes quantidades de dados para facilitar o estágio de treinamento de IA. Esses dados precisam ser ingeridos, armazenar e preparados para que possam ser "alimentos" ao estágio de treinamento. Sem a capacidade de ingestão, armazenar e consumir os dados necessários para o treinamento, o projeto estará em risco de falhar.
Projetos de IA exigem uma infraestrutura de armazenamento com excelente desempenho, escalabilidade e flexibilidade. A boa notícia é que os sistemas de armazenamento de hoje podem ser desenvolvidos especificamente para atender às necessidades dos projetos de IA. Dois grandes exemplos disso são alguns dos supercomputadores mais poderosos do mundo, Serra e Summit.
Agora, vamos ver alguns requisitos.
Os requisitos de cada estágio do pipeline de IA precisam ser avaliados para a carga de trabalho esperada da sua aplicação de IA. As cargas de trabalho variam, mas algumas empresas que utilizam grandes conjuntos de dados podem treinar por longos períodos. Concluído o treinamento, esses dados geralmente são migrados para fora das plataformas de armazenamento crítico para se preparar para uma nova carga de trabalho. Gerenciar dados manualmente pode ser um desafio, portanto, é prudente pensar no futuro ao considerar como os dados são colocados no armazenamento e para onde irão após a conclusão do treinamento. Encontrar uma plataforma que possa migrar dados automaticamente para você coloca você um passo mais perto do gerenciamento de armazenamento eficiente e capaz para IA.
Depois de avaliar as implicações de suas próprias necessidades de cargas de trabalho, você pode decidir sobre as tecnologias de armazenamento que funcionam melhor para sua infraestrutura de computação de IA e projeto.
Ingestão de dados. Os dados brutos para cargas de trabalho de IA podem vir de uma variedade de fontes de dados estruturadas e não estruturadas, e você precisa de um local muito confiável para armazenar os dados. O armazenamento pode ser um data lake de alta capacidade ou uma camada rápida, como armazenamento flash, principalmente para análise em tempo real.
Preparação de dados. Depois de armazenados, os dados devem ser preparados, pois estão em um formato "bruto". Os dados precisam ser processados e formatados para consumo pelas fases restantes. O desempenho de E/S de arquivos é uma consideração muito importante neste estágio, pois agora você tem uma mistura de leituras e gravações aleatórias. Reserve um tempo para descobrir quais são as necessidades de desempenho para seu pipeline de IA. Depois que os dados são formatados, eles são alimentados nas redes neurais para treinamento.
Treinamento e inferência. Esses estágios são muito intensivos em computação e geralmente exigem dados de streaming para os modelos de treinamento. O treinamento é um processo iterativo, exigindo configuração e redefinição, que é usada para criar os modelos. A inferência pode ser considerada como a soma dos dados e do treinamento. As GPUs nos servidores e sua infraestrutura de armazenamento tornam-se muito importantes aqui devido à necessidade de baixa latência, alta taxa de transferência e tempos de resposta rápidos. Suas redes de armazenamento precisam ser projetadas para lidar com esses requisitos, bem como com a ingestão de dados e a preparação. Em escala, isso enfatiza muitos sistemas de armazenamento, especialmente aqueles não preparados para cargas de trabalho de IA. Por isso, é importante considerar especificamente se sua plataforma de armazenamento pode lidar com as necessidades de cargas de trabalho de acordo com seus objetivos de negócios.
Considere também: sua infraestrutura de armazenamento é facilmente dimensionada? Você pode expandir o sistema de armazenamento à medida que suas necessidades de dados aumentam? Essas são perguntas muito importantes que têm efeito direto nos requisitos de sua infraestrutura de IA.
Certifique-se de que você pode dimensionar sua infraestrutura de armazenamento com o mínimo de nenhuma interrupção em suas operações de produção, acompanhando o crescimento dos dados em seus negócios. Tenha flexibilidade o suficiente para considerar diferentes configurações de armazenamento para as diferentes necessidades da infraestrutura de IA.
O planejamento cuidadoso, combinando os requisitos do servidor de IA e de modelagem com a infraestrutura de armazenamento, ajudará você a aproveitar ao máximo seus investimentos e a levar ao sucesso em seus projetos de IA.
Estas recomendações são apenas um ponto de partida. Lembre-se sempre de que, se sua organização não tem o conhecimento necessário para projetar e implementar a infraestrutura de armazenamento de IA correta, você deve trabalhar com seu fornecedor para ajudar e ajudar a preparar seus sistemas de armazenamento para IA.
E se você tiver dúvidas ou precisar de suporte para planejar e se preparar para um projeto de IA com o IBM Storage, não hesite em entrar em contato com o IBM Systems Lab Services.
Libere mais valor comercial levando a IA para as cargas de trabalho de missão crítica no IBM z17.
IBM Z é uma família de infraestrutura moderna, com tecnologia do processador IBM Telum, que executa sistemas operacionais corporativos e software IBM Z, proporcionando maior precisão em IA, produtividade e agilidade.
O IBM z17 integra IA avançada à nuvem híbrida, otimizando desempenho, segurança e tomada de decisões onde os dados críticos estão armazenados.
Saiba como proteger os dados da sua organização contra ameaças cibernéticas e garantir a recuperação rápida em eventos críticos.
Use frameworks e ferramentas de código aberto para aplicar IA e aprendizado de máquina aos dados empresariais mais valiosos em mainframes IBM zSystems.
A IBM oferece soluções de infraestrutura para IA que aceleram o impacto em toda a sua empresa com uma estratégia híbrida por design.
Libere o valor dos dados empresariais com a IBM® Consulting, construindo uma organização orientada por insights que proporciona vantagem comercial.
Impulsione suas cargas de trabalho de IA com uma infraestrutura otimizada para desempenho, confiabilidade e integração com nuvem híbrida, criada para as demandas reais das empresas.