Libérez les données et développez de nouveaux éclairages métier

Avec IBM Cloud® Object Storage, les entreprises peuvent créer un référentiel de données centralisé afin de tirer parti d'un stockage économique et évolutif qui permet de collecter et stocker des quantités de données pratiquement illimitées de tout type, depuis n'importe quelle source. Les données restent dans leur format natif et n'ont pas besoin d'être déplacées à l'intérieur ou hors d'IBM Cloud Object Storage ; le lac de données IBM Cloud Object Storage constitue le magasin de données persistant pour l'analyse.
IBM Cloud Object Storage est intégré à IBM Analytics Engine, IBM Watson ® Studio, IBM Cloud SQL Query et d'autres services IBM Cloud pour fournir des solutions d'analyse de données et de business intelligence en libre-service qui vont bien au-delà de l'évolutivité, de la sécurité et de la rentabilité des solutions traditionnelles.

Cas d'utilisation courants

Déplacer les données des clusters HDFS vers IBM Cloud Object Storage

Libérez de l'espace sur les clusters Hadoop coûteux en migrant efficacement de grandes quantités de données depuis Hadoop vers IBM Cloud Object Storage.

Interroger les données en place

Utilisez comme espace de travail actif pour une plage de cas d'utilisation d'analyse de big data avec une fonctionnalité de requête en place qui permet d'exécuter des analyses directement sur les données au repos.

Exécuter Apache Spark Analytics directement sur les données stockées dans le stockage d'objets

Utilisez comme une couche de stockage permanent évolutif et à faible coût pour analyse avec une connexion optimisée à Apache Spark.

Stocker les données pour des modèles de formation d'IA

Accélérez les flux de travaux d'apprentissage automatique et en profondeur nécessaires pour injecter l'IA dans votre entreprise. Créez et entraînez des modèles d'IA, et préparez et analysez des données, dans un environnement intégré unique.

Créer et analyser des pipelines IoT

Stockez des quantités massives de données IoT à faible coût ; les cadres d'analyse peuvent accéder directement aux données. Les pipelines de données peuvent être facilement configurés et gérés afin de générer des données prêtes pour l'analyse.

Références client : Skåne University Hospital

Pour Skåne University Hospital, IBM Cloud Object Storage permet de collecter et de conserver le plus d'informations chirurgicales possible, car il est fiable, rentable, disponible à l'échelle mondiale, et surtout, il offre une capacité presque illimitée.

Principales fonctionnalités

Déplacer facilement les données des clusters HDFS vers IBM Cloud Object Storage

Libérez de l'espace sur les clusters Hadoop coûteux à l'aide d'IBM Big Replicate pour déplacer efficacement les données entre les clusters de données Hadoop et IBM Cloud Object Storage, en offrant une réplication continue avec une cohérence de données garantie. Vous pouvez également utiliser IBM Cloud Object Storage Distributed Copy (DistCp), un outil open source, pour faire migrer de grandes quantités de données depuis Hadoop vers IBM Cloud Object Storage.

Interroger les données en place

IBM Cloud SQL Query est un service entièrement géré qui permet aux développeurs d'analyser et de transformer des données stockées sur plusieurs fichiers de plusieurs formats à l'aide d'instructions ANSI SQL. Ce service peut interroger des fichiers CSV, Parquet, JSON et ORC stockés dans IBM Cloud Object Storage sans avoir besoin de déplacer ou de transformer les données au préalable. IBM Cloud SQL Query utilise Apache Spark, un moteur de traitement de données open source, rapide, extensible et en mémoire, optimisé pour une analyse des données ponctuelle à faible latence.

Exécuter l'analyse Apache Spark

IBM Cloud Object Storage offre une connectivité optimisée aux services Apache Spark pour stocker les données provenant de sources multiples et en tirer rapidement des éclairages. L'utilisation d'IBM Cloud Object Storage avec l'analyse Spark peut complètement découpler les niveaux de calcul et de stockage, ce qui permet aux utilisateurs de stocker les données dans une couche de stockage d'objets et de créer des clusters de nœuds de traitement selon les besoins des utilisateurs. Avec ce modèle, le calcul et le stockage peuvent évoluer (et être achetés) indépendamment, ce qui permet d'obtenir des coûts de calcul nuls, lorsqu'aucun travail n'est en cours d'exécution. Les éclairages sont conservés dans IBM Cloud Object Storage et les données peuvent être réingérées pour une analyse ultérieure.

Stocker les données pour les flux de travaux d'apprentissage automatique et d'apprentissage en profondeur Watson

IBM Watson Studio est une plateforme de cloud hybride, basée sur les meilleurs outils open source et IBM, qui permet d'analyser les données et de les utiliser pour créer et déployer des modèles d'IA. IBM Cloud Object Storage est intégré à IBM Watson Studio on IBM Cloud. Lorsqu'un projet d'apprentissage automatique est créé dans IBM Watson Studio, une instance d'IBM Cloud Object Storage est créée automatiquement afin d'accélérer le traitement des données requis pour entraîner et déployer des modèles d'apprentissage automatique et d'apprentissage en profondeur.

Effectuer une reconnaissance et une gouvernance de données intelligentes

Une fois que vos données sont dans IBM Cloud Object Storage, elles peuvent être régies via Watson Knowledge Catalog, à l'aide de profileurs de données qui segmentent et protègent les données, ce qui permet une meilleure gouvernance. L'implémentation d'un catalogue de métadonnées permet à IBM Watson Knowledge Catalog d'avoir une compréhension poussée du type des données et des politiques qui peuvent leur être appliquées. Il implémente ensuite ces dernières. IBM Watson Knowledge Catalog inclut une reconnaissance intelligente des données ; il est intégré à IBM Watson Studio pour permettre une transition transparente de la "recherche" vers "l'utilisation" de l'information dans votre entreprise.

Créer et analyser facilement des pipelines de données IoT

Le stockage d'objets est conçu pour stocker des quantités massives de données IoT pour un faible coût. Les structures d'analyse peuvent accéder directement aux données. IBM Cloud fournit des services basés sur Apache Kafka et Apache Spark, y compris IBM Events Streams et Spark en tant que service, respectivement. Les pipelines de données d'IBM Event Streams vers le stockage d'objets peuvent être facilement configurés et gérés de manière à générer des données prêtes à l'analyse, qui peuvent être analysées directement par IBM Watson en utilisant Spark en tant que service. De plus, la plateforme IBM Watson IoT peut être utilisée pour capturer des données de périphérique IoT et les envoyer à IBM Event Streams.

Études de cas

Des données rentables, sécurisées et toujours disponibles

Collecte et ingestion simples des données

IBM propose différents moyens pour intégrer vos données dans IBM Cloud Object Storage, y compris des fonctions intégrées de transfert de données haut débit Aspera de manière native pour un transfert rapide des données sur le réseau. En outre, des services tels qu'IBM Event Streams permettent d'ingérer facilement des données en temps réel. IBM Big Replicate peut déplacer efficacement les données entre les clusters de données Hadoop et IBM Cloud Object Storage, en offrant une réplication continue, et IBM Cloud Object Storage Distributed Copy (DistCp), outil open source, peut être utilisé pour la migration de grandes quantités de données depuis Hadoop vers IBM Cloud Object Storage.

Économie et souplesse

Grâce à IBM Cloud Object Storage, les entreprises peuvent créer un référentiel de données centralisé, tirant parti d'un stockage économique et évolutif qui permet de collecter et stocker des quantités pratiquement illimitées de données de tout type, depuis n'importe quelle source. Les données sont stockées dans leur format natif et ne nécessitent pas de transformations en amont.

Disponibilité permanente

IBM Cloud Object Storage est conçu pour aider les spécialistes des données, les analystes métier et les développeurs d'applications dans vos entreprises à accéder facilement aux données avec une disponibilité pratiquement inégalée. Cette solution est conçue pour offrir une durabilité de 99,999999999 %* ; la disponibilité est assurée grâce à une technologie brevetée dans laquelle les données sont chiffrées et distribuées sur plusieurs unités dans plusieurs data centers IBM.

*Sur la base d'une analyse interne IBM de données client.
Les résultats individuels des clients varient.

Haute sécurité

IBM Cloud Object Storage sécurise les données à l'aide du chiffrement automatique côté serveur et offre des options de chiffrement avec des clés gérées par IBM Key Protect ou le chiffrement avec des clés que vous gérez. L'intégration avec IBM Identity and Access Management garantit des contrôles d'accès granulaires jusqu'au niveau du compartiment de données et en fonction du rôle utilisateur.