Scatena i dati e sviluppa nuovi insight di business

Mentre le aziende cercano di accelerare la loro trasformazione digitale, devono analizzare e sfruttare la vasta quantità di dati che è diventata disponibile, al fine di produrre un processo decisionale efficace. Facendo leva sull'analytics basata sul cloud, con storage cloud scalabile e persistente, le aziende possono sbloccare i dati e sviluppare nuovi insight di business.
Utilizzando IBM Cloud™ Object Storage, le organizzazioni possono creare un repository di dati centralizzato, sfruttando storage economico e scalabile che permette di raccogliere e immagazzinare quantità praticamente illimitate di dati di qualsiasi tipo, da qualsiasi origine. I dati rimangono nel formato nativo e non devono essere spostati in e fuori da IBM Cloud Object Storage; piuttosto, il data lake basato su IBM Cloud Object Storage è l'archivio dati persistente per l'analytics.
IBM Cloud Object Storage è integrato con IBM Analytics Engine, IBM Watson® Studio, IBM Cloud SQL Query e altri servizi IBM Cloud per fornire analytics dei dati self-service e soluzioni di business intelligence che vanno ben oltre la scalabilità, la sicurezza e l'economicità delle soluzioni tradizionali.

Casi di utilizzo comuni

Sposta i dati dai cluster HDFS a IBM Cloud Object Storage

Libera spazio su cluster Hadoop costosi migrando in modo efficiente grandi quantità di dati da Hadoop a IBM Cloud Object Storage.

Esegui query dei dati sul posto

Utilizzalo come area di lavoro attiva per una serie di casi di utilizzo di analytics di big data con funzionalità di query dei dati sul posto che consentono di eseguire l'analytics direttamente sui tuoi dati a riposo.

Esegui l'analytics Apache Spark direttamente sui dati memorizzati nello storage oggetti

Utilizzalo come livello di storage persistente, scalabile, economico per l'analytics con connettività ottimizzata a Apache Spark.

Memorizza i dati per i modelli di addestramento dell'AI

Accelera i flussi di lavoro di machine e deep learning necessari per incorporare l'AI nella tua azienda. Crea e addestra modelli di AI, prepara e analizza i dati in un unico ambiente integrato.

Crea e analizza le pipeline IoT

Memorizza enormi quantità di dati IoT a basso costo, e i framework di analytics possono accedere direttamente ai dati. Puoi facilmente configurare e gestire le pipeline di dati per generare dati pronti per l'analytics.

Funzioni principali

Sposta facilmente i dati dai cluster HDFS a IBM Cloud Object Storage

Libera spazio su cluster Hadoop costosi utilizzando IBM Big Replicate per spostare efficientemente i dati tra i cluster di dati Hadoop e IBM Cloud Object Storage, ottenendo così una replica continua con congruenza dei dati garantita. Puoi anche utilizzare IBM Cloud Object Storage Distributed Copy (DistCp), uno strumento open source per la migrazione di grandi quantità di dati da Hadoop a IBM Cloud Object Storage.

Esegui query dei dati sul posto

IBM Cloud SQL Query è un servizio completamente gestito che consente agli sviluppatori di analizzare e trasformare i dati memorizzati su più file in più formati utilizzando le istruzioni SQL ANSI. Il servizio può eseguire query ai file CSV, Parquet, JSON e ORC memorizzati in IBM Cloud Object Storage senza dover prima spostare o trasformare i dati. IBM Cloud SQL Query utilizza Apache Spark, un motore di elaborazione dei dati in-memory open source, veloce ed estendibile, ottimizzato per l'analisi dei dati ad hoc e con bassa latenza.

Esegui l'analytics Apache Spark

IBM Cloud Object Storage offre una connettività ottimizzata ai servizi Apache Spark per memorizzare i dati da più origini e ottenere rapidamente gli insight da essi. L'utilizzo di IBM Cloud Object Storage con l'analytics Spark può separare completamente i livelli di computing e storage, consentendo agli utenti di memorizzare i dati in un livello di storage oggetti e di velocizzare i cluster di nodi di computing come e quando gli utenti ne hanno bisogno. Con questo modello, il computing e lo storage possono essere scalati (e essere acquistati) in modo indipendente, riducendo a zero i costi di computing quando non ci sono lavori in esecuzione. Gli insight persistono in IBM Cloud Object Storage, e i dati possono essere re-inseriti per future analisi.

Memorizza i dati per i flussi di lavoro di machine learning e deep learning Watson

Watson Studio è una piattaforma cloud ibrida, che si basa sui migliori strumenti IBM e open source, per analizzare i dati e utilizzarli per creare e distribuire modelli di AI. IBM Cloud Object Storage è integrato con Watson Studio su IBM Cloud. Quando un progetto di machine learning viene creato in Watson Studio, viene creata automaticamente un'istanza di IBM Cloud Object Storage per accelerare la gestione dei dati richiesti per l'addestramento e la distribuzione dei modelli di machine e deep learning.

Sfrutta rilevamento e governance dei dati intelligenti

Una volta che i dati sono in IBM Cloud Object Storage, possono essere governati con Watson Knowledge Catalog, utilizzando profilatori di dati che segmentano e proteggono i dati, consentendo una migliore governance di dati come informazioni personali identificabili o altri dati privati. Implementando un catalogo di metadati, Watson Knowledge Catalog è in grado di comprendere correttamente i dati e quali politiche possono applicarvisi e quindi implementa tali politiche. Watson Knowledge Catalog include il rilevamento intelligente dei dati ed è integrato con Watson Studio per consentire una transizione diretta dalla fase di rilevamento alla fase di utilizzo delle informazioni nell'intera azienda.

Crea e analizza facilmente le pipeline di dati IoT

Lo storage di oggetti è particolarmente adatto alla memorizzazione di enormi quantità di dati IoT a basso costo e consentendo ai framework di analytics di accedere ai dati direttamente. IBM Cloud fornisce servizi basati su Apache Kafka e Apache Spark, tra cui IBM Events Streams e Spark as a service rispettivamente. Puoi facilmente configurare e gestire le pipeline di dati da IBM Event Streams allo storage oggetti, per generare dati pronti per l'analytics, che possono essere analizzati direttamente da Watson utilizzando Spark as a service. Inoltre, Watson IoT Platform può essere utilizzato per catturare i dati dei dispositivi IoT e inviarli a IBM Event Streams.

Case study

Storage economico, efficiente e con dati sempre disponibili

Raccolta e acquisizione dei dati semplice

IBM offre una varietà di modi per inserire i dati in IBM Cloud Object Storage, incluse funzioni di trasferimento dati ad alta velocità Aspera integrate nativamente per trasferire rapidamente i dati sulla rete. Inoltre, servizi come IBM Event Streams semplificano l'acquisizione dei dati in tempo reale. IBM Big Replicate può spostare efficientemente i dati tra i cluster di dati Hadoop e IBM Cloud Object Storage, ottenendo così una replica continua, e IBM Cloud Object Storage Distributed Copy (DistCp), uno strumento open source, può essere utilizzato per migrare grandi quantità di dati da Hadoop a IBM Cloud Object Storage.

Flessibile ed economico

Utilizzando IBM Cloud Object Storage, le organizzazioni possono creare un repository di dati centralizzato, sfruttando storage economico e scalabile che permette di raccogliere e immagazzinare quantità praticamente illimitate di dati di qualsiasi tipo, da qualsiasi origine. I dati sono memorizzati nel formato nativo e non richiedono trasformazioni iniziali.

Disponibilità costante

IBM Cloud Object Storage è stato progettato per aiutare i data scientist, gli analisti di business e gli sviluppatori di app dell'azienda ad accedere facilmente ai dati con disponibilità praticamente ineguagliata. È progettato per fornire il 99,999999999% (11 nove) di durabilità, e la disponibilità è assicurata con una tecnologia brevettata in cui i dati sono codificati e distribuiti tra più dispositivi in più strutture di data center IBM.

Estremamente sicuro

IBM Cloud Object Storage protegge i dati utilizzando la codifica lato server automatica e offre opzioni di codifica con chiavi gestite da IBM Key Protect (sistema di gestione chiavi) o di codifica con chiavi gestite da te. L'integrazione con IBM Identity and Access Management garantisce controlli di accesso granulari fino al livello di bucket di dati e in base al ruolo utente.