Раскройте потенциал своих данных и получайте новую бизнес-информацию

Ускорение цифровой трансформации требует анализа и использования огромных объемов данных, которые сегодня доступны для принятия эффективных бизнес-решений. С помощью облачной аналитики и облачного хранилища данных компании могут раскрыть потенциал своих данных и получить новую ценную информацию.
IBM Cloud™ Object Storage дает организациям возможность создать централизованное, экономически эффективное, масштабируемое хранилище данных, позволяющее собирать и хранить практически неограниченные объемы данных любого типа из любых источников. Данные остаются в исходном формате и не требуют перемещения в хранилище IBM Cloud Object Storage и из него; вместо этого озеро данных IBM Cloud Object Storage играет роль постоянного хранилища данных для аналитики.
IBM Cloud Object Storage интегрируется с IBM Analytics Engine, IBM Watson® Studio, IBM Cloud SQL Query и другими услугами IBM Cloud. Это дает возможность самостоятельно анализировать данные и пользоваться решениями для управленческой аналитики, значительно превосходящими традиционные решения с точки зрения масштабируемости, безопасности и экономической эффективности.

Популярные варианты использования

Перемещение данных из кластеров HDFS в IBM Cloud Object Storage

Освободите место в дорогих кластерах Hadoop путем эффективного переноса больших объемов данных из Hadoop в IBM Cloud Object Storage.

Запрос данных на месте

Пользуйтесь хранилищем в качестве активной рабочей области для анализа больших данных: поддержка локальных запросов позволяет анализировать данные непосредственно в хранилище.

Операции Apache Spark Analytics непосредственно над данными в хранилище объектов

Пользуйтесь в качестве экономичного масштабируемого хранилища данных для аналитики с оптимизированным подключением к Apache Spark.

Хранение данных моделей обучения ИИ

Ускоряйте машинное обучение и глубокое обучение, необходимое для интеграции ИИ в ваш бизнес. Создавайте и обучайте модели ИИ; готовьте и анализируйте данные в единой интегрированной среде.

Создание и анализ конвейеров IoT

Храните огромные объемы данных IoT с минимальными затратами и прямым доступом инструментов аналитики к данным. Оцените простоту создания конвейеров данных, позволяющих генерировать данные, готовые к анализу.

Ключевые функциональные возможности

Простое перемещение данных из кластеров HDFS в IBM Cloud Object Storage

Освободите место в дорогих кластерах Hadoop, пользуясь IBM Big Replicate для эффективного перемещения данных между кластерами Hadoop и IBM Cloud Object Storage с непрерывной репликацией и гарантированной согласованностью данных. Также можно пользоваться IBM Cloud Object Storage Distributed Copy (DistCp) — инструментом с открытым исходным кодом для переноса больших объемов данных из Hadoop в IBM Cloud Object Storage.

Запрос данных на месте

IBM Cloud SQL Query — это полностью управляемая служба, позволяющая разработчикам анализировать и трансформировать данные, хранящиеся в разных файлах и разных форматах, с помощью запросов ANSI SQL. Служба может выполнять запросы к файлам CSV, Parquet, JSON и ORC, хранящимся в IBM Cloud Object Storage, без необходимости заблаговременно перемещать и преобразовывать данные. Служба IBM Cloud SQL Query использует Apache Spark — быстрый расширяемый модуль с открытым исходным кодом для обработки данных в оперативной памяти, оптимизированный для минимизации задержек и специального анализа данных.

Анализ Apache Spark

IBM Cloud Object Storage предлагает оптимизированное подключение к Apache Spark для хранения данных из разных источников и быстрого извлечения ценной информации. Применение IBM Cloud Object Storage с аналитикой Spark позволяет полностью развязать уровни вычислений и хранения данных. Пользователи получат возможность хранить данных на уровне объектов и запускать вычислительные кластеры по собственному усмотрению. Данная модель позволяет масштабировать (и приобретать) вычислительные ресурсы и ресурсы хранения независимо друг от друга, сокращая расходы на вычислительные ресурсы до нуля в периоды, когда не выполняются задания. Информация хранится в IBM Cloud Object Storage, а данные можно повторно принимать для будущего анализа.

Хранение данных для заданий машинного обучения и глубокого обучения Watson

Watson Studio — это гибридная облачная платформа на базе лучших решений с открытым исходным кодом и инструментов IBM. Она предназначена для анализа данных и применения данных для создания и развертывания моделей ИИ. Услуга IBM Cloud Object Storage интегрирована с Watson Studio в IBM Cloud. При создании проекта машинного обучения в Watson Studio автоматически создается экземпляр IBM Cloud Object Storage для ускорения обработки данных, необходимых для обучения и развертывания моделей машинного и глубокого обучения.

Умное обнаружение данных и управление данными

После того как ваши данные окажутся в IBM Cloud Object Storage, ими можно будет управлять с помощью Watson Knowledge Catalog. Для этого можно будет пользоваться профилировщиками данных, обеспечивающими сегментацию и защиту персональных данных и других конфиденциальных данных для повышения качества управления. Благодаря каталогу метаданных Watson Knowledge Catalog получает фундаментальное представление о том, что представляют собой имеющиеся данные и какие политики могут применяться к ним, и развертывает соответствующие политики. Watson Knowledge Catalog располагает средствами умного обнаружения данных и интегрирован с Watson Studio для обеспечения прозрачного перехода от поиска информации к ее использованию в масштабах всего бизнеса.

Простота создания и анализа конвейеров данных IoT

Хранилище объектов идеально подходит для размещения больших объемов данных IoT с минимальными затратами и прямым доступом средств анализа. IBM Cloud предлагает услуги на базе Apache Kafka и Apache Spark, включая IBM Events Streams и Spark в форме услуги соответственно. Оцените простоту создания и эксплуатации конвейеров данных из IBM Event Streams в хранилище объектов. Такие конвейеры могут применяться для создания готовых к анализу данных, которые Watson может анализировать непосредственно в хранилище с помощью Spark как услуги. Кроме того, платформой Watson IoT можно пользоваться для захвата данных устройств IoT и их отправки в IBM Event Streams.

Примеры использования

Недорогие в обслуживании, защищенные и всегда доступные данные

Простота сбора и приема данных

IBM предлагает разнообразные способы загрузки данных в IBM Cloud Object Storage, включая интегрированные средства высокоскоростной передачи данных Aspera для быстрого перемещения данных по сети. Кроме того, такие службы, как IBM Event Streams, упрощают прием данных в реальном времени. IBM Big Replicate может эффективно перемещать данные между кластерами Hadoop и IBM Cloud Object Storage с непрерывной репликацией. При этом IBM Cloud Object Storage Distributed Copy (DistCp), инструмент с открытым исходным кодом, может применяться для переноса больших объемов данных из Hadoop в IBM Cloud Object Storage.

Экономическая эффективность и гибкость

IBM Cloud Object Storage дает организациям возможность создать централизованное, экономически эффективное, масштабируемое хранилище данных, позволяющее собирать и хранить практически неограниченные объемы данных любого типа из любых источников. Данные хранятся в исходном формате и не требуют заблаговременного преобразования.

Постоянная доступность

IBM Cloud Object Storage помогает организовать удобный доступ к данным с практически неограниченной доступностью для специалистов по наукам о данных, бизнес-аналитиков и разработчиков приложений. Данная услуга обеспечивает надежность хранения на уровне 99,999999999% (11 девяток), а доступность обеспечивается запатентованной технологией шифрования данных с последующим распределением на несколько устройств в нескольких ЦОД IBM.

Высокая безопасность

IBM Cloud Object Storage защищает данные с помощью автоматического серверного шифрования. Ключами шифрования можно управлять самостоятельно или с помощью системы управления ключами IBM Key Protect. Интеграция с IBM Identity and Access Management обеспечивает детальный контроль доступа на уровне ролей пользователей вплоть до контейнеров данных.