Libérez les données et développez de nouveaux éclairages métier

À mesure que les entreprises cherchent à accélérer leur transformation numérique, elles doivent, pour prendre des décisions efficaces, analyser et tirer parti de la vaste quantité de données qui sont devenues disponibles. En tirant parti de l'analyse basée sur le cloud avec un stockage cloud persistant et évolutif, les entreprises peuvent débloquer leurs données et développer de nouveaux éclairages métier.

À l'aide d'IBM Cloud™ Object Storage, les entreprises peuvent créer un référentiel de données centralisé, tirant parti d'un stockage économique et évolutif qui permet de collecter et stocker des quantités de données pratiquement illimitées de n'importe quel type, depuis n'importe quelle source. Les données restent dans leur format natif et n'ont pas besoin d'être déplacées à l'intérieur ou hors d'IBM Cloud Object Storage : au contraire, le lac de données basé IBM Cloud Object Storage est le magasin de données persistant pour l'analyse.
IBM Cloud Object Storage est intégré à IBM Analytics Engine, IBM Watson ® Studio, IBM Cloud SQL Query et d'autres services IBM Cloud pour fournir des solutions d'analyse de données et de business intelligence en libre-service qui vont bien au-delà de l'évolutivité, de la sécurité et de la rentabilité des solutions traditionnelles.

Cas d'utilisation communs

Déplacer les données des clusters HDFS vers IBM Cloud Object Storage

Libérez de l'espace sur les clusters Hadoop coûteux en migrant efficacement de grandes quantités de données de Hadoop vers IBM Cloud Object Storage.

Interroger les données en place

Utilisez-le comme espace de travail actif pour une plage de cas d'utilisation d'analyse de big data avec une fonctionnalité de requête en place qui vous permet d'exécuter des analyses directement sur vos données au repos.

Exécuter Apache Spark Analytics directement sur les données stockées dans le stockage d'objets

Utilisez-le comme une couche de stockage permanent évolutif et à faible coût pour analyse avec une connexion optimisée à Apache Spark.

Stocker les données pour des modèles de formation d'IA

Accélérez les flux de travaux d'apprentissage automatique et en profondeur nécessaires pour injecter l'IA dans votre entreprise. Créez et entraînez des modèles d'IA, et préparez et analysez des données, dans un environnement intégré unique.

Créer et analyser des pipelines IoT

Stockez des quantités massives de données IoT à faible coût ; les cadres d'analyse peuvent accéder directement aux données. Les pipelines de données peuvent être facilement configurés et gérés pour générer des données prêtes pour l'analyse.

Principales fonctionnalités

Déplacer facilement les données des clusters HDFS vers IBM Cloud Object Storage

Libérez de l'espace sur les clusters Hadoop coûteux à l'aide d'IBM Big Replicate pour déplacer efficacement les données entre les clusters de données Hadoop et IBM Cloud Object Storage, en offrant une réplication continue avec une cohérence de données garantie. Vous pouvez également utiliser IBM Cloud Object Storage Distributed Copy (DistCp), outil open source, pour migrer de grandes quantités de données de Hadoop vers IBM Cloud Object Storage.

Interroger les données en place

IBM Cloud SQL Query est un service entièrement géré qui permet aux développeurs d'analyser et de transformer des données stockées sur plusieurs fichiers en plusieurs formats à l'aide d'instructions ANSI SQL. Le service peut interroger des fichiers CSV, Parquet, JSON et ORC stockés dans IBM Cloud Object Storage sans avoir besoin de déplacer ou de transformer les données au préalable. IBM Cloud SQL Query utilise Apache Spark, moteur de traitement de données open source, rapide, extensible et en mémoire optimisé pour une analyse des données ponctuelle à faible latence.

Exécuter l'analyse Apache Spark

IBM Cloud Object Storage offre une connectivité optimisée aux services Apache Spark pour stocker les données provenant de sources multiples et en tirer rapidement des informations. L'utilisation d'IBM Cloud Object Storage avec l'analyse Spark peut complètement découpler les niveaux de calcul et de stockage, permettant aux utilisateurs de stocker les données dans une couche de stockage d'objets et de créer des clusters de nœuds de traitement selon les besoins des utilisateurs. Avec ce modèle, le calcul et le stockage peuvent évoluer (et être achetés) indépendamment, ce qui permet de réduire les coûts de calcul à zéro lorsqu'aucun travail n'est en cours d'exécution. Les informations sont conservées dans IBM Cloud Object Storage et les données peuvent être reingérées pour analyse ultérieure.

Stocker les données pour les flux de travaux d'apprentissage automatique et d'apprentissage en profondeur Watson

Watson Studio est une plateforme de cloud hybride, basée sur le meilleur des outils open source et IBM, qui permet d'analyser les données et de les utiliser pour créer et déployer des modèles d'IA. IBM Cloud Object Storage est intégré à Watson Studio on IBM Cloud. Lorsqu'un projet d'apprentissage automatique est créé dans Watson Studio, une instance d'IBM Cloud Object Storage est créée automatiquement pour accélérer le traitement des données requis pour entraîner et déployer des modèles d'apprentissage automatique et d'apprentissage en profondeur.

Effectuer une reconnaissance et une gouvernance de données intelligentes

Une fois que vos données sont dans IBM Cloud Object Storage, elles peuvent être gérées avec le Watson Knowledge Catalog, à l'aide de profileurs de données qui segmentent et protègent les données, ce qui permet une meilleure gouvernance des données avec, par exemple, des informations identifiables personnellement ou d'autres données privées. En mettant en œuvre un catalogue de métadonnées, Watson Knowledge Catalog possède une compréhension fondamentale de ce que sont les données et des politiques de données applicables, puis met en œuvre ces politiques. Le Watson Knowledge Catalog comprend une reconnaissance intelligente des données et est intégré à Watson Studio pour permettre une transition fluide de la "recherche" à "l'utilisation" de l'information dans votre entreprise.

Créer et analyser facilement des pipelines de données IoT

Le stockage d'objets est parfaitement adapté pour stocker des quantités massives de données IoT à faible coût et permettre aux cadres d'analyse d'accéder directement aux données. IBM Cloud fournit des services basés sur Apache Kafka et Apache Spark, y compris IBM Events Streams et Spark en tant que service, respectivement. Les pipelines de données d'IBM Event Streams vers le stockage d'objets peuvent être facilement configurés et gérés de manière à générer des données prêtes à l'analyse, qui peuvent être analysées directement par Watson en utilisant Spark en tant que service. De plus, la plateforme Watson IoT peut être utilisée pour capturer des données de périphérique IoT et les envoyer à IBM Event Streams.

Études de cas

Des données rentables, sécurisées et toujours disponibles

Collecte et ingestion simples des données

IBM propose une variété de moyens pour intégrer vos données dans IBM Cloud Object Storage, y compris des fonctions de transfert de données haut débit Aspera intégrées de manière native pour un transfert rapide des données sur le réseau. En outre, des services tels qu'IBM Event Streams permettent d'ingérer facilement des données en temps réel. IBM Big Replicate peut déplacer efficacement les données entre les clusters de données Hadoop et IBM Cloud Object Storage, en offrant une réplication continue, et IBM Cloud Object Storage Distributed Copy (DistCp), outil open source, peut être utilisé pour la migration de grandes quantités de données de Hadoop vers IBM Cloud Object Storage.

Économie et souplesse

Grâce à IBM Cloud Object Storage, les entreprises peuvent créer un référentiel de données centralisé, tirant parti d'un stockage économique et évolutif qui permet de collecter et stocker des quantités pratiquement illimitées de données de n'importe quel type, depuis n'importe quelle source.Les données sont stockées dans leur format natif et ne nécessitent pas de transformations en amont.

Disponibilité permanente

IBM Cloud Object Storage est conçu pour aider les spécialistes des données, les analystes métier et les développeurs d'applications dans vos organisations à accéder facilement aux données avec une disponibilité pratiquement inégalée. Cette solution est conçue pour offrir une durabilité de 99,999999999 % (11 neufs), et la disponibilité est assurée grâce à une technologie brevetée dans laquelle les données sont chiffrées et distribuées sur plusieurs unités dans plusieurs centres de données IBM.

Haute sécurité

IBM Cloud Object Storage sécurise les données à l'aide du chiffrement automatique côté serveur et offre des options de chiffrement avec des clés gérées par IBM Key Protect (système de gestion des clés) ou le chiffrement avec des clés que vous gérez. L'intégration avec IBM Identity and Access Management garantit des contrôles d'accès granulaires jusqu'au niveau du compartiment de données et en fonction du rôle utilisateur.