SPSS Modeler ヒモトク

データ資源のマネタイズを加速〜 Hortonworks Data Platformと IBM Analyticsのコラボレーション

記事をシェアする:

データ資源のマネタイズを加速〜 HDPと IBM Analyticsのコラボレーション

Hortonworks Data Platform(以下、HDP)に格納しているデータはそのままでも様々なデータ処理が可能ですし、みなさんもこれまでビッグデータを十分活用されていたことと思います。
それに加えて本年より、HortonworksとIBMのアライアンス締結によって、 「データサイエンス」の活用能力が飛躍的に高まりました。市場から高い評価を受けている、幅広いIBM Analytics製品がHDPに対応したことで、データサイエンティストやデータエンジニアのタスクが強力にサポートされます。本ページではIBM製品によるデータサイエンス機能の強化について、わかりやすく簡潔にご説明したいと思います。

(1)Data Science Experience

Data Science Experience(以下、DSX)はその名の通り、データサイエンティストのための強力な分析基盤です。DSXがその効果を特に発揮する利用シーンとして、分析データが膨大なビッグデータに及ぶ場合や、複数のデータサインティストと関連するメンバーがチームとしてデータサイエンスに取り組む場合などがあります。

IBM Data Science Experience画面イメージ IBM Data Science Experience画面イメージ

[メリット1]  クラスタ構成済みのSpark環境がすぐに利用できる

データ分析に利用されているデファクト的なオープンソース・ソフトウエアとしてPythonやRがありますが、分析やモデリングを行う際に取り扱うデータ量が、1台のサーバーでは処理しきれないビッグデータに達することがあります 。このような場合、PythonやRをOS上で動かす代わりに、Apache Sparkを利用した並列処理プラットフォームでPython、Rを利用する こと が解決策となります。インメモリー処理による分散並列実行によって 高速にデータ処理できますし、SparkMLを利用したビッグデータに対する機械学習ライブラリーが利用できるようになります。大量データの集計も、Spark SQLを使って手軽に行えます。
ただ留意すべき点は、通常そのようにクラスタ構成が必要となるビッグデータ対応のSpark環境を準備するには、分析者自身では対応が難しいということです。システム基盤担当にシステム基盤の設計・構築・運用を委ねる必要があり、利用できるようになるまで時間と労力がかかります。これに対して、IBMのDSXを利用すれば、IBM Cloud上にクラスタ構成済みのSparkと運用環境がすでに用意されていますので、分析者が必要な時にすぐに利用開始できます。オンプレミス環境を利用される場合も、ローカル版のDSXを利用することで同様な構成がすぐに使用できるので、データサイエンティストの要望に迅速に応えていくことができます。

[メリット2] エンタープライズユースのためのプロジェクト資産管理機能

これまでは分析データ資産や分析データを属人的に管理していることが多く、データ活用の妨げになることがありました。DSXではデータサイエンティストを含めて企業内で組織的な基盤活用 が実現でき、ガバナンスとデータ活用促進を両立させることができます。また分析資産の管理はDSX内だけで行うのではなく、アプリケーションエンジニアとの連携や既存のプロジェクト管理体系のために、外部のGithubと連携していくことも可能です。

[メリット3]  機械学習の生産性を高める

様々なモデリング手法を利用者が知らなくても機械学習ができるよう、IBM Machine Learningという機能で自動モデリングを実現しています。また今後の機能追加として、SPSS Modelerのようなユーザーインタフェースを提供する SPSS Modeler Canvas や、IoTからのデータをリアルタイムに分析していくためのSpark Streaming 機能の追加が予定されています(現在ベータ提供中)。オープンソース・ソフトウエアのスキルと能力を活かしながら、DSXならではの生産性の高い機械学習環境を利用できます。
DSXで機械学習したモデルは、自動的にBluemixのWebAPI機能でマイクロサービス化されます。アプリケーションからすぐに利用できる形でモデルをデプロイできることも、DSXならではの特徴です。

DSXに関心を持っていただけた方は、こちら(英語)から申し込みしていただければ、すぐに無料で全機能を1ヶ月間利用できます。これを機会に一度お試しされることをオススメします。

 

(2) アイコン操作だけでデータ分析ができるSPSS Modeler

国内外で長年に渡り多くのデータサイエンティストが利用しているIBM SPSS Modeler。皆さんはSPSS ModelerがHadoopで動くことをご存知でしょうか?もちろんHDPでもSPSS Modelerを使ってビッグデータのデータ分析が可能です。SPSS Modeler上でアイコンをブロックのように繋いでいくだけで、HDP内に蓄えられたビッグデータにアクセスし、集計、データ加工、データモデリング可能をHDP上で行えます。Hadoopのスキルがない分析ユーザーについても、手軽にHDPを使ってみることができます。
これまでSPSS Modelerに触れてみたことがない方は、デスクトップ版のトライアルプログラムが用意されていますので試用してみてください。こちらのページから申し込みしていただければ、すぐに開始できます。

More SPSS Modeler ヒモトク stories

【2月,3月開催】IBM SPSS Modeler 無料体験セミナー(AIT主催)

アナリティクス, イベント・セミナー

AITのSPSS体験セミナーは、ほぼ毎月実施させていただいております。のべ1000名以上のユーザー様にご参加い ...続きを読む


【リレー連載】わたしの推しノード – SPSS Modelerノード総選挙結果をヒモトク

Data Science and AI, IBM Data and AI, SPSS Modeler ヒモトク...

2019年11月に日本アイ・ビー・エム本社でIBM SPSS Modelerユーザーイベントを開催しました。短 ...続きを読む


AI & データ関連Webセミナーのご案内

IBM Data and AI, IBM Watson Blog, アナリティクス...

自席からご参加いただけるWebセミナーです!開催当日は、チャットでQ&Aも行えます。開催翌日からは、録 ...続きを読む