技術文書一覧

  • spacer 製品、トピックスやコンテンツ・タイプでフィルターをかける

    (0 製品)

    (37 トピック)

    (0 インダストリー)

    (4 種類)

クラウド・プラットフォーム IBM Bluemixで次のアプリを開発しましょう。

1 - 106 件のうちの 100 件 | 次へ 概要の表示 | 概要の非表示 検索結果に登録(RSS)

結果の表示
タイトル none 種類 none 日付 down
初めての IoT アプリを構築する
Bluemix 上で Node-RED と Twilio を利用して、皆さん初めての IoT アプリを構成してください。この記事では、リモート・サーバーを監視し、ユーザーにコンピューターまたは IT ネットワークがダウンしているかどうかを通知する、完全な IoT ソリューションを作成します。
記事 2017/6/15
エンタープライズデータウェアハウスと Apache Spark 統合の価値
現在のデータ分析プラットフォームの多くはリレーショナルデータ(構造化データ)を管理するデータウェアハウス(DWH)が主流であり、多くのユーザーは BI、分析アプリケーションから DWH に蓄積されたデータから新たな知見や洞察を得てビジネス上の意思決定を行っています。しかしここ数年の流れより、ビジネス事業部門のユーザーが、R や Python、Spark といったオープンソースのアナリティクス、ビックデータ技術を分析プロジェクトで活用するケースが増えてきています。ビジネスの現場ではより他社との差別化を図る上でデータ分析の重要性が増していることから、データ分析環境自体もより迅速に提供される必要性がでてきています。ただこれらの要求に対し、IT 部門が適切に応えることができないと、ユーザーが個別の分析環境を持つことで、データのサイロ化が急増し、データに対する制御が失われていく危険性があることも事実です。
記事 2017/6/14
オープンソースDBのクラウドサービス「IBM Compose」 よくある質問
オープンソースDBのクラウドサービス「IBM Compose」に関するよくあるご質問とその回答をまとめました。
記事 2017/6/09
Watson Discovery を利用してニュースを探索し、さまざまな洞察を引き出す
Watson Discovery サービスを利用すると、ビッグデータからさまざまな洞察を引き出すことができます。このチュートリアルに従って、Bluemix 上で Discovery インスタンスをセットアップして、Watson News コレクションに対して一般的なクエリーを実行する方法を学んでください。
記事 2017/5/25
DB2 LUW V11.1 速習講座(ハンズオン付き)
DB2 11.1の機能をご紹介する講義資料&ハンズオン資料です。既にデータベース製品のスキルをお持ちの方を対象に、ハンズオンで体感いただきながら速習する内容です。
記事 2017/4/28
DB2 pureScale をクラウド環境で動かしてみよう
この記事では、だれでも利用できるクラウド環境上で、テストや評価の目的に特化した DB2 pureScale を構築する手順を説明します。
記事 2017/4/18
dashDB Local FAQ
dashDB Local は、分析用に設計された Docker コンテナで提供される DWH ソフトウェアアプライアンスです。コンテナベースの SDE (Software Defined Environment) 環境として提供されるため、プライベートクラウドの物理、仮想環境へ迅速かつ簡易に配置でき、高速性と柔軟性、簡易性を合わせ持つ次世代の分析ソリューションです。
記事 2017/4/12
データのバランスを調整して、より現実に即した統計モデルを生成し、より正確な結果を出す
サンプルのストリームとデータ・セットをダウンロードして、SPSS Modeler を使用してどのようにしてデータのバランスを調整するのかに習熟してください。この記事では、重み付け、バランス調整、ブースティング、集約、バランス・ノード、および動的ノードについて解説し、ビジネス目標に応じてどのようにデータ・セットのバランス調整方法を使い分けるかについて説明します。
記事 2017/3/10
Jupyter で BigInsights の pyspark を実行する
IBM InfoSphere BigInsights は、100%オープンソースの IOP をベースに IBM の SQL ソリューションを含む IBM の Hadoop ソリューションです。BigInsights の IOP は Spark を含んでおり、Spark を利用して Hadoop に貯めたデータの分析や機械学習の実行が可能です。本稿では、IBM BigInsights に Jupyter を導入して Spark から利用する方法を記述します。
記事 2017/3/02
ハイブリッド・データウェアハウス
データウェアハウスは、もはや一種類で全ての要件を満たす時代ではなくなりました。 サービスレベルやそれを満たすことの重要性、必要な柔軟性のレベル、ソリューションのコスト、分析ワークロードに必要な制御等の要素を考慮する必要があります。
記事 2017/2/21
Hadoop および Spark プロジェクトのプラットフォームとして IBM Open Platform を選択する
IBM Open Platform (IOP) の詳細を学んでください。IOP には、Hadoop、Spark、ビッグデータに関する IBM の深い専門知識によって支えられた一連のオープンソース・コンポーネントが組み込まれています。私たちが最良の組み合わせだと確信するコンポーネントの数々からなる IOP は、最も一般的なビッグデータの使用ケースを網羅した、包括的な機能を提供します。それぞれのコンポーネントについて調べ、その価値を見出してください。
記事 2017/1/19
Spark と Bluemix を使用して位置データをクレンジングしてから視覚化する
屋内位置データの精度を高めるには、Spark と Bluemix 上の Spark ノートブックを使用してデータをクレンジングしてから視覚化するという方法があります。この記事では、簡潔なチュートリアルに従ってサンプル・ノートブックをダウンロードし、独自のノートブックを作成し、サンプル位置データを処理するにはどのようにするのかを練習できます。
記事 2016/12/08
電気通信業界とメディア/エンターテイメント業界でのコグニティブ・コンピューティング
企業内でのコグニティブ・コンピューティングの重要性はますます高まってきています。シリーズ第 1 回となるこのチュートリアルで、企業固有の環境でコグニティブ・ソリューションを設計および実装するにはどのようにするのかを学んでください。
記事 2016/12/08
業界向けコグニティブ・ソリューションの使用例
企業内でのコグニティブ・コンピューティングの重要性はますます高まってきています。シリーズ第 2 回となるこのチュートリアルでは、コグニティブ・プラットフォームを構築することで実現可能なソリューションを理解できるよう、コグニティブの成功事例をいくつか取り上げて詳しく説明します。
記事 2016/12/08
会話式チャットボットの設計課題
チャットボットでの会話を設計する際に直面する主な問題を把握し、メッセージング・プラットフォーム、対話のタイプ、そしてユーザー入力と応答について調査して、どのようにしてチャットボットを成功に導くのかを学んでください。
記事 2016/11/10
画像からテキストを抽出して感情を分析する
このチュートリアルの手順に従えば、Twitter からデータを取得し、そのデータから Tone Analyzer、Visual Recognition、Alchemy などの IBM Watson サービスを利用してコグニティブ・インサイトを引き出すためのアプリを簡単に構築できます。わずか数分で、ツイートに組み込まれた画像を分析する Python アプリを作成し、Bluemix 上で稼働状態にすることができるのです。
記事 2016/11/03
Java Streams, Part 1: java.util.stream ライブラリー入門
このシリーズでは、Java 言語アーキテクトである Brian Goetz が、Java SE 8 で導入された Java Streams ライブラリーの詳細を解説します。この java.util.stream パッケージは、ラムダ式の威力を利用することによって、コレクションや配列などのさまざまなデータ・セットに対し、関数形式のクエリーを簡単に実行できるようにします。
記事 2016/10/27
Java Streams, Part 5: 並列ストリームのパフォーマンス
この全 5 回からなるシリーズ「Java Streams」の最終回となるこの記事では、前回の記事を引き継いで、並列処理の効率性に影響を与える要因について説明し、それらの概念を Streams ライブラリーに当てはめて考えます。一部のストリーム・パイプラインが他のパイプラインよりも並列化になぜすぐれているのかを明らかにし、独自のストリーム・コードを使用して並列化効率をどのように分析するのかを紹介します。
記事 2016/10/27
Java Streams, Part 4: 並行処理から並列処理へ
この全 5 回からなるシリーズ「Java Streams」の第 4 回では、並列処理の効率性を決定付ける要因を特定し、歴史的および技術的観点から説明します。並列実行を目的とした Streams ライブラリーを最適に利用するには、これらの決定要因を理解することが基礎となります (次回の記事で、今回説明する原則をそのまま Streams に当てはめます)。
記事 2016/10/27
Java Streams, Part 3: Streams の内幕
このシリーズでは、Java 言語アーキテクトである Brian Goetz が、Java SE 8 で導入された Java Streams ライブラリーの詳細を解説します。この java.util.stream パッケージは、ラムダ式の力を利用することによって、コレクションや配列などのさまざまなデータ・セットに対し、関数型スタイルのクエリーを簡単に実行できるようにします。今回の記事で、クエリーを微調整して可能な限り効率化するにはどのようにするのかを学んでください。
記事 2016/10/27
Java Streams, Part 2: Streams を使用した集約
このシリーズでは、Java 言語アーキテクトである Brian Goetz が、Java SE 8 で導入された Java Streams ライブラリーの詳細を解説します。この java.util.stream パッケージは、ラムダ式の威力を利用することによって、コレクションや配列などのさまざまなデータ・セットに対し、関数型スタイルのクエリーを簡単に実行できるようにします。今回の記事では、java.util.stream パッケージを使用して、どのようにして効率的にデータを集約および要約するのかを学んでください。
記事 2016/10/27
Watson Analytics でグラフを作ってみよう!
Watson Analytics には分析や予測のための様々な機能がありますが、それに加えて手軽な操作で視覚的に美しいグラフを表現してくれるのも大きな特徴です。本記事では、Watson Analytics 付属のサンプルデータを用いてグラフの作成を行います。グラフを作る際に様々な項目を設定していきますが、その都度 Watson Analytics がリアルタイムでダイナミックにグラフを自動生成してくれますので、その様子を眺めているだけでも楽しめます。是非 Watson Analytics に登録してご自身で体験してみてください!
記事 2016/10/21
コグニティブ・コンピューティングと IBM Watson を利用してカスタマー・エクスペリエンスを改善する
架空の銀行が IBM Watson サービスを利用してロイヤルティー・プログラムを強化する事例を紹介します。この事例では、いくつかの鍵となるサービスに注目し、顧客のパーソナリティーに関するインサイトを引き出せるようにします。そして、その結果に基づいて顧客の行動や好みを予測し、プログラムの特典をパーソナライズすることを可能にします。さらに、ライブ・チャット内で Tone Analyzer を利用することで、カスタマー・サービス担当者が顧客の口調をより正確に理解できるようにするとともに、顧客への返答を入力する際に自分自身の口調も調整できるようにします。
記事 2016/10/20
Twitter 資格情報を取得する
このチュートリアルの手順に従えば、Twitter からデータを取得し、Tone Analyzer、Visual Recognition、Alchemy などの IBM Watson サービスを利用してこのデータからコグニティブ・インサイトを引き出すためのアプリを簡単に構築できます。
記事 2016/9/08
ツイートに組み込まれた画像を分析して分類および認識する
このチュートリアルの手順に従えば、Twitter からデータを取得して、そのデータから Tone Analyzer、Visual Recognition、Alchemy などの IBM Watson サービスを利用してコグニティブ・インサイトを引き出すためのアプリを簡単に構築できます。わずか数分で、ツイートに組み込まれた画像を分析する Python アプリを作成し、Bluemix 上で稼働中の状態にすることができるのです。
記事 2016/9/08
ツイートのテキストから感情を分析する
このチュートリアルの手順に従えば、Twitter からデータを取得したうえで、Tone Analyzer、Visual Recognition、Alchemy などの IBM Watson サービスを利用してデータから コグニティブ・インサイトを引き出すアプリを簡単に構築できます。テキストをセンテンス・レベルまで分析することによって、テキストに込められた感情を掘り下げることができます。このチュートリアルでは、分析結果を共有するために感情を棒グラフで表現しています。
記事 2016/9/08
D3 および Angular を使用したカスタム・データ視覚化
D3.js ライブラリーを使用してカスタム・データ視覚化を作成し、作成した視覚化を AngularJS アプリに統合します。
チュートリアル 2016/8/25
Watson Language Translation サービスを利用してテキストを翻訳する
IBM Watson Language Translation サービスでは、REST API としてドメインに特化した翻訳を提供しており、このサービスを利用することで、サポートしているある言語から別の言語へテキストを変換することができます。さらにこのサービスは、こうしたモデルをカスタマイズまたはトレーニングするための API や、テキストの言語を識別するための API も提供しています。
記事 2016/8/04
Watson Tradeoff Analytics を利用してフライト検索アプリを開発する
Bluemix 上で IBM Watson Tradeoff Analytics を利用して、ユーザーが旅行をする上で最も便利なフライトを選択できるよう支援するアプリを作成する方法を学んでください。
記事 2016/7/28
Bluemix 上の Spark を利用して、ブラウザー内で気象データを分析する
Apache Spark は、まったく新しい機能の数々をデータ・サイエンティスト、ビジネス・アナリスト、アプリケーション開発者に初めて利用できるようにする、次世代の分散データ処理エンジンです。Analytics for Apache Spark は IBM Bluemix に用意されている一般的なツールと連動することから、この Analytics for Apache Spark を使用することで、瞬く間にこの Apache Spark の能力をフル活用できるようになります。このチュートリアルでは、Spark API を使用する IPython Notebook を利用して、実際の気象に関するロー・データを分析する方法を紹介します。この例をベースとして使用すれば、Bluemix 上の他のアナリティクスも簡単に利用することができます。
記事 2016/7/14
プロ・ゴルフとプロ・テニスのためのプレディクティブ・クラウド・コンピューティング: 第 3 回 処理中のビッグデータ
ゴルフのメジャー・トーナメントやテニスのグランド・スラム・トーナメントでは、歴史的なスポーツ・イベントの情報をリアルタイムで提供しており、ファンはそのようにして提供されるコンテンツに夢中になっています。各トーナメントで提供されるコンテンツには、ストリーミング配信される動画、ゲームの統計情報、スコア、画像、試合日程、テキストが含まれます。このシリーズのこれまでのチュートリアルでは、プレディクティブ・クラウド・コンピューティング (PCC) によってトーナメントの人気を前もって予測することで、必要に応じて自動的に共有コンピューティング・リソースが割り当てられるようにする方法を説明するとともに、高可用 (HA) 環境にデプロイされている BigEngine アプリケーションの概要を説明しました。今回のチュートリアルでは、IBM がプロ・ゴルフ・トーナメントとプロ・テニス・トーナメントのプレゼンテーション用に導入したストリーミング・コンピューティング・アーキテクチャーの概要について説明します。具体的には、IBM InfoSphere Streams の使用法と、Java 言語でサポートされた SPL (Streams Processing Language) のカスタマイズについて説明します。また、Streams の要素の処理における UIMA PEAR ファイルの実装と、この実装によってスポーツ・ソーシャル・スコアボードのアノテーションを提供する方法についても説明します。チュートリアル全体を通して、いくつかの例と具体的なサンプル・コードが参考に示してあります。
記事 2016/6/09
プロ・ゴルフとプロ・テニスのためのプレディクティブ・クラウド・コンピューティング: 第 2 回Web アプリケーションの設計
ゴルフのメジャー・トーナメントやテニスのグランド・スラム・トーナメントでは、歴史的なスポーツ・イベントの情報をリアルタイムで提供しており、ファンはそのようにして提供されるコンテンツに夢中になっています。各トーナメントで提供されるコンテンツには、ストリーミング配信される動画、ゲームの統計情報、スコア、画像、試合日程、テキストが含まれます。このシリーズの第 1 回では、プレディクティブ・クラウド・コンピューティング (PCC) によってトーナメントの人気を前もって予測することで、必要に応じて自動的に共有コンピューティング・リソースが割り当てられるようにする方法を説明しました。今回のチュートリアルでは、高可用 (HA) 環境にデプロイされている BigEngine アプリケーションの概要を説明します。具体的には、Maven を使用したプロジェクトのパッケージ化とビルド、Quartz ジョブ・スケジューリングの実装を中心としたアーキテクチャーの決定、そして選択した API について説明します。さらに、IBM WebSphere Application Server Liberty Profile 上でどのように BigEngine がビルドおよびデプロイされているかについても説明します。このチュートリアル全体を通し、サンプル・コードのリストで具体的なプログラミングの例を説明します。
記事 2016/6/09
プロ・ゴルフとプロ・テニスのためのプレディクティブ・クラウド・コンピューティング: 第 1 回 紹介
ゴルフのメジャー・トーナメントやテニスのグランド・スラム・トーナメントでは、歴史的なスポーツ・イベントの情報をリアルタイムで提供しており、ファンはそのようにして提供されるコンテンツに夢中になっています。各トーナメントで提供されるコンテンツには、ストリーミング配信される動画、ゲームの統計情報、スコア、画像、試合日程、テキストが含まれます。このチュートリアルでは、プレディクティブ・クラウド・コンピューティング (PCC) によってトーナメントの人気を前もって予測することで、必要に応じて自動的に共有コンピューティング・リソースが割り当てられるようにする方法と、そうすることでスポーツ関連の顧客がコンピューターの処理を待つために費やす 1 日あたりの時間が大幅に節約されていることを説明し、さらにはスポーツ関連のビッグデータがインフラストラクチャーに与える影響についての重要な統計情報を提供します。
記事 2016/6/09
DB2 on Cloud 上でシャドー表を構築してみた
当記事は DB2 のクラウド製品の DB2 on Cloud にシャドー表を構築します。今回は DB2 on Cloud へ導入する方法をお話いたしますが、オンプレミス版にも同様の手順でシャドー表の構築が可能です。
記事 2016/4/06
リアルタイム・データ・ストリームにおいて複合イベントを検出する
Streaming Analytics サービスを利用する Bluemix スターター・アプリと、リアルタイム・データ・ストリームから複合イベントを検出する IBM Streams アプリケーションを入手して、実行し、拡張してください。
記事 2016/3/31
まさにお買い得な developerWorks Premium でクラウド・プロジェクトを活性化してください
この新しい developerWorks Premium メンバーシップ・プログラムに多少の投資をするだけで、時間と (もちろん) お金の点で、非常に大きなメリットを得ることができます。具体的には、クラウド・プロジェクトをサポートする強力なツールを利用できることや、スキルを構築するのに役立つ学習リソースの宝庫にアクセスすること、業界でネットワークを広げて強化できるイベントの割引を受けること、認定試験を無料で受けられること、その他さまざまなものが挙げられます。
記事 2016/3/31
IBM Data Server Manager 利用ガイド
当資料では、Date Sever Manager (以降、DSM) の導入や利用を検討されている方を対象に、DSM の概要および基本的な運用、インフラ管理のポイントを解説したものです。Data Server Manager を利用される際に、是非お役立てください。
記事 2016/3/30
インメモリー・スピードの Aerospike でビッグデータ・アナリティクスの需要に対応する
最近では、個人のユーザーや企業が抱く多様な期待に応えるために、ハイパフォーマンスかつエンタープライズ・クラスのリアルタイム・ワークロードを、クラウド環境でホストする風潮が高まっています。「瞬時に」検知して応答しなければならないビッグデータ・アプリケーションやコンテキスト駆動型アプリケーションに対し、以前のコストのほんの一部でインメモリー・データベースならではのパフォーマンスを提供するのが、Aerospike です。このキー・バリュー型ストアの Aerospike は、オープンソースのリアルタイム NoSQL データベースとして世界規模のスケーラビリティーを備えており、その動作にはエンタープライズ・グレードの信頼性があります。クラウドはやがて、採算が合うと同時に、プロセス・インテンシブなアプリケーションやデータ・インテンシブなアプリケーションを提供できる環境になる運命にあります。この記事では、IBM SoftLayer クラウド上の Aerospike プラットフォームがビッグデータ・アナリティクスをはじめとする要求の厳しいアプリケーションを根本から変える仕組みを紹介します。
チュートリアル 2016/2/18
クラウド・アプリケーションのゼロ・ダウンタイムを実現するために ScaleBase でデータベースを自動スケーリングする
クラウドは、Web スケールかつエンタープライズ・グレードの非常にエラスティックなアプリケーションを、「使用した分だけ支払う」という形でホストして提供するための中核的な IT インフラストラクチャーになってきています。そんな中、新興企業も既存の業界の巨大企業も、高いスケーラビリティーを備えたミッション・クリティカルなアプリケーションに伴う厄介な課題に直面しています。その課題とは、バックエンド・データベースはトランザクション型アプリケーション、対話型アプリケーション、およびコラボレーション型アプリケーションのあらゆるタイプに不可欠なモジュールであり、データ・ストレージ・システムとデータ管理システムは、新たなニーズを満たすよう意識的に適応させなければなりませんが、従来のデータベースではクラウド・スケールのアプリケーションには対応しきれないというものです。ScaleBase は、革新的で高いスケーラビリティーを備えた、ゼロ・ダウンタイムを実現するクラウド・スケールのデータベース・ソリューションです。この記事では、ScaleBase を準備して IBM SoftLayer にマイグレーションする方法を説明し、サンプル・アプリケーションを用いて、ScaleBase がオンライン、オフプレミス、オンデマンドのクラウド環境でどのように機能するかを明らかにします。
記事 2016/2/11
IBM developerWorks Premium の紹介
Govind Baliga が彼の developerWorks Premium ダッシュボードにサインインして、このアカウントによってもたらされる特典、リソース、機会のすべてを探っていきます。彼が素晴らしい特典を紹介する動画を見てください。
記事 2016/1/28
シングルページ・アプリケーションのエクスペリエンスを最適化する
この記事では、IBM Tealeaf Document Object Model (DOM) Capture and Replay がどのように機能することで、Tealeaf で分析を行う作業者とその管理者が、シングルページ・アプリケーション (SPA) での顧客のエクスペリエンスを理解、管理、最適化するために利用可能な、高い忠実度の視覚化を実現するのかを説明します。さらに、SPA が台頭してきたことと SPA がもたらすメリットについて、SPA がキャプチャー & リプレイ・ソリューション・プロバイダーにもたらす技術的な影響および課題と同様に説明します。Tealeaf で分析を行う作業者向けに提供する一連のベスト・プラクティスには、SPA 用の Tealeaf DOM Capture and Replay ソリューションを構成して実装するための手順も含まれています。
記事 2016/1/28
Bluemix 上で Insights for Twitter サービスを利用して Twitter 検索エンジンを作成する
このチュートリアルでは、Insights for Twitter サービスを利用して、RESTful API と広範な機能を備えた問い合わせ言語でサポートされる、独自の Twitter 検索エンジンを作成する方法を説明します。
記事 2016/1/07
IBM Bluemix 上の AlchemyAPI サービスを利用してメモを分析する
Bluemix の AlchemyAPI と IBM DevOps Services を利用して、自然言語処理プログラムを迅速かつ容易に開発、ビルド、デプロイする方法を学んでください。
記事 2015/11/19
米国で暮らすのに最適な場所はどこかを決めるためのアプリを作成する
このチュートリアルでは、IBM Bluemix 上で IBM Watson Tradeoff Analytics サービスを利用して米国で暮らすのに最適な場所をお薦めするアプリケーションを作成する方法を紹介します。
記事 2015/11/05
よりスマートな健康管理用ウェアラブル端末を作成する: パート 3 ウェアラブル端末のアプリに Watson サービスを実装する
連載の最終回となるこのパート 3 の記事では、コグニティブ・コンピューティングと、その中で Watson が果たす役割を探るとともに、IBM Watson Tradeoff Analytics サービスを利用してサンプル・フィットネス・アプリケーションをセットアップします。このサービスを選んだ理由は、このサービスはウェアラブル端末のユーザーが複数の基準を基に意思決定を行えるようサポートし、さまざまなオプションの間のトレードオフを示してくれるからです。この記事のサンプル・アプリケーションでは、ユーザーの耐久トレーニングと、筋力トレーニング、減量との間のバランスを取ることができます。また、運動と食事の両方のデータに基づくアドバイスをするために、IBM Watson Tradeoff Analytics サービスを利用してアドバイスを視覚的に示すこともできます。
記事 2015/11/05
SOA からコグニティブ・サービスに至るまでのサービス・コンポジションの進化を見ていく
最近では、開発者がまったく新しいタイプのコグニティブ・コンピューティング・サービスを利用して、多種多様なサービス・コンポジションを作成できるようになっており、サービス・コンポジションを作成する上での可能性は無限に広がっています。しかし、SOA (Service-Oriented Architecture) のサービスが登場して間もない頃は、このような状況だったわけではありません。この記事では、サービス・コンポジション開発の歴史を振り返り、現在の状況に至るまでにどれだけ進化したのかを明らかにします。
記事 2015/10/29
IBM SoftLayer の中で VoltDB データベースを使用してリアルタイムのアナリティクスを実行する
データは、企業が綿密に練った計画を、自信を持って明確な形で推進するために利用する、戦略的資産です。データ駆動型の経営によって、企業はビジネスで発生するあらゆる類の予期せぬ難題や変化に対処することができます。その具体的な方法は、分散されたさまざまなソースから体系的に抽出したデータをすべて収集し、IT 対応のより深いアナリティクス・プロセスを適用して実用的な洞察を引き出すというものです。前例のない膨大な量のデータが取り込まれるようになっている今、データ・アナリティクスを行うための従来のプラットフォームやインフラストラクチャーは制約に直面しており、私たちにはビッグデータとファストデータに対応できる、堅牢でレジリエンシーを備えたアルゴリズムとエンド・ツー・エンドのソリューションが必要です。いくつかの製品ベンダーにより、取り込んで統合されただけのデータを価値ある情報へとスムーズに格上げできるようにするビッグデータ・アナリティクス・システムが提供されています。その中から、この記事では VoltDB が SoftLayer クラウド内でハイパフォーマンスのリアルタイム・ビッグデータ・アナリティクスを可能にする仕組みを説明します。
記事 2015/10/29
ユーザー作成辞書ファイルを IBM SPSS Modeler Text Analytics に取り込む方法
IBM SPSS Modeler Text Analytics の日本語版には、基本語彙や時事用語など一般に用いられている単語のほか、感性分析のための辞書が製品にビルトインされています。それゆえ、ユーザー側で特に辞書を作らなくとも、ある一定水準の抽出結果を得ることができます。 その一方、固有の言い回しや用語についてはうまく認識されないケースがあります。調査・研究・業務などに特化したユーザー独自の用語リストが手元にあるならば、これを IBM SPSS Modeler Text Analytics のテンプレートエディターに取り込むことによって、抽出精度をさらに向上させることができます。 本稿は、テンプレートエディターに取り込む手順を解説するとともに、日本語を扱う上での幾つかの留意点を示します。また、内容を修正したファイルを再度取り込む場合など、さまざまなケースを想定して解説を行います。
記事 2015/10/22
NoSQL データベースから SQL レポートを作成する
IBM Bluemix のサービスを利用して、Cloudant NoSQL データベースに保管されている JSON データから SQL ベースのレポートを生成してください。
記事 2015/10/22
サービスとしてのデータ・インテグレーションとデータ・アナリティクス、第 1 回: DataWorks
データ・インテグレーションの専門家のほとんどは、ソースからターゲットへのデータのロードやマイグレーションは時間がかかる上に面倒な作業であるのが普通だと考えています。しかし IBM Bluemix DataWorks サービスを利用すると、さまざまなソースからさまざまなターゲットへのデータのロードやマイグレーションを容易に行うことができます。IBM DataWorks サービスには DataWorks API と DataWorks Forge が含まれているため、開発者は DataWorks サービスを利用することで、さまざまなターゲットへのマイグレーションをシームレスに行えるほか、データのロード、クレンジング、プロファイリングを行うこともできます。DataWorks Forge は主に知識労働者のために設計されており、データの選択、視覚化、さらにはデータの品質を強化、改善した後で使用するための準備などを支援します。このチュートリアルは、サービスとしてのデータ・インテグレーションとデータ・アナリティクスについて説明する連載の第 1 回です。
チュートリアル 2015/10/22
よりスマートな健康管理用ウェアラブル端末を作成する: パート 1 健康管理にウェアラブル端末とコグニティブ・コンピューティングを利用するメリットを調べる
この記事では、健康管理分野における現在のウェアラブル・コンピューティングのトレンドについて詳しく見ていき、現在のハードウェア・オファリングで実現できることと、これらのハードウェア・オファリングにはない分析機能で実現できることの間にあるギャップを探ります。ウェアラブル端末メーカーは、Watson のようなコグニティブ・コンピューティング・プラットフォームを利用することで、製品を市場に出すまでの時間をどのようにして縮めることができるのか、また現在のウェアラブル端末の貧弱なオファリングと、ウェアラブル端末の可能性とのギャップを Watson はどのようにして埋めることができるのか、といったことも見ていきます。
記事 2015/10/15
よりスマートな健康管理用ウェアラブル端末を作成する: パート 2 Watson サービスを利用したコグニティブ・アプリケーションを設計する
この記事では、堅牢なコグニティブ・コンピューティング・プラットフォームである IBM Watson を、皆さんのウェアラブル・プロジェクトで利用するとよい理由を説明します。また、Watson をウェアラブル・プロジェクトに統合する方法についても説明します。
記事 2015/10/15
ビッグデータ環境でセンチメント分析を行う
政府の政策に関する世論や見解が Twitter やニュース・フィードでインターネット全体に拡散しています。人々は至るところで使われている携帯端末から、自分の見解を素早く簡単に表現できるからです。センチメント分析は、これらの各種ソース (ツイート、RSS フィード、モバイル・アプリなど) から収集したデータに対して実行することができます。収集したデータは、集約、変換、またはフォーマット設定しなおしてから HDFS (Hadoop 分散ファイル・システム) に保管することができます。このデータは、保管されているデータ (データ・レイク) として、あるいは転送されているデータ (データ・ストリーム) として、処理して分析することができます。
記事 2015/10/01
複雑なデータ・セットの予測アナリティクス・モデルを開発する
このチュートリアルでは、クラウド内で組み込みインデータベース・アナリティクスを提供するデータ・ウェアハウジング・サービス、IBM dashDB を取り上げます。IBM Bluemix を利用してクラウド上で dashDB のインスタンスを作成する方法、R アナリティクス機能を利用してデータ・セットに対する予測モデルを開発する方法、そして R の Shiny アプリケーションを利用してインタラクティブかつ堅牢な手段による視覚化と予測結果の生成を行う方法を紹介します。ここでは Kaggle データ・サイエンス・コンペティションをサンプル・データとして使用します。
記事 2015/9/03
心で念じてラジコン・カーを動かす
Muse ウェアラブル端末から脳波データを抽出し、現実の世界でアクションを行う方法を学んでください。ここでは、ラジコン・カーを動かします。この記事では、ハードウェアの側面およびソフトウェアの側面から Arduino とラジコン・カーのリモコンを扱う方法、そしてリアルタイムでの脳波の動きを確認するために Bluemix を使用して Node.js Web アプリケーションを作成する方法を説明します。
記事 2015/7/30
dashDB サービスを利用して、Ruby でビジネス・インテリジェンスおよびアナリティクス・サービスを作成する
IBM Bluemix で利用可能な dashDB サービスは、ビジネス・インテリジェンスとアナリティクス・タスクに対応した、アジャイルかつ強力で使いやすいプラットフォームを提供します。エンタープライズ規模で管理されるこのサービスには、最適化された列編成のインメモリー BLU Acceleration データウェアハウス・テクノロジーが採用されています。この記事では、dashDB サービスをアプリケーションに組み込むのがいかに簡単であるか、またそうすることでアプリケーションに専念できることを実際の例で説明します。
記事 2015/7/23
IBM Analytics for Hadoop サービスを使用した Big SQL アプリを作成する
IBM InfoSphere BigInsights Enterprise Edition のクラウド・ベースのインスタンス上で実行されて IBM Analytics for Hadoop サービスを使用するサンプル・アプリケーションを作成し、ソーシャル・メディア・データを IBM Watson ブランドのグローバル・カバレッジとして公開してください。また、Big SQL (IBM の Hadoop ベースのプラットフォームに対する SQL インターフェース) を使用してデータを照会し、そのデータを読み取る Java アプリケーションを格納した WAR ファイルをデプロイしてください。ユーザー向けに作成するこのサンプル・アプリケーションは、データに対するクエリーを動的に実行することができます。
チュートリアル 2015/7/23
コードを 1 行も作成せずにソーシャル・データを収集して分析する
ソーシャル・データを分析することで、どれほどの情報が得られるか考えたことはありますか?こんなこと聞きましたが、行動には移さないでください。ソーシャル・データの分析に必要なものを作成するだけの十分な時間やリソースがあるわけではないからです。このチュートリアルでは、IBM Bluemix™ の Node-RED ワークフロー・エディターを使用すれば、ソーシャル・データのフィード (Twitter フィード) を取り込んで、そのデータから HDFS (Hadoop Distributed File System) ファイルを作成するのが以下に簡単であるかを明らかにします。また、IBM Analytics for Hadoop サービスを利用してデータを分析し、要約チャートを生成する方法も説明します。不明なデータ・セットをいかに簡単に実用的な情報に変えられるかを知って驚くはずです。
記事 2015/7/23
Bluemix と Cloudant を利用して、証券取引委員会へ提出する財務データの保管用にエンタープライズ規模のデータベースを構築する
現在、インターネット上には大量の非構造化データと半構造化データが氾濫しています。ほぼあらゆる形のコンテンツを動的にロードできる NoSQL データベースを使用すると、非構造化データや半構造化データは、極めて簡単にアクセス可能な形になります。このチュートリアルでは、米国の証券取引委員会で使われる eXtensible Business Reporting Language (XBRL) フォーマットで、データ・セットを作成または複製する方法を取り上げます
記事 2015/7/23
Bluemix の Time Series Database サービスを利用してホーム・モニタリング・データを処理する
Bluemix 上で Time Series Database サービスを利用して、データの作成、保管、分析を行う方法を学んでください。
記事 2015/7/23
Bluemix の Analytics for Hadoop サービス, Part 1: Bluemix の Analytics for Hadoop サービス: サインインしてサービスを利用する
無料の IBM Bluemix アカウントにサインアップし、Bluemix にログインして Hadoop for Analytics サービスを起動してください。
チュートリアル 2015/7/23
Java、Weka、そして dashDB サービスを利用してデータ・マイニング・アプリケーションを構築する
dashDB サービス (以前は Analytics Warehouse サービス、または BLU Acceleration サービスと呼ばれていました) は、IBM Bluemix 上でデータウェアハウジングとアナリティクスをサービスとして提供します。開発者は、クラウド内で提供される、極めて高速に動作する IBM BLU データベースのテクノロジーを利用して重要な分析アプリケーションを開発し、デプロイすることができます。IBM BLU 列指向データベースを活用し、Weka 統計分析ツールを使用してデータ・マイニング・アプリケーションを開発する方法を学んでください。
記事 2015/7/16
Node.js と dashDB サービスを利用して公共交通機関のシミュレーターを開発する
この記事では、IBM DevOps Services、IBM Bluemix™、dashDB (以前は Analytics Warehouse または BLU Acceleration と呼ばれていました) などのクラウド・サービスを利用して、公共交通機関のシミュレーターを開発する方法を紹介します。JavaScript の知識をある程度持ち合わせている開発者や、クラウド・サービスを使い始めたい開発者は、データ分析およびデータ・ストリームを対象とした単純ながらも有用なアプリケーションを開発する方法を学ぶことができます。
記事 2015/7/16
テクノロジーの世界で活躍する女性たち: インパクトを与える
IBM developerWorks のシリーズ第一弾となるこの動画では、IBM の著名な女性テクニカル・リーダーたちが、さまざまな技術トピックについて、自らの経験と洞察を語っています。
記事 2015/7/09
サイバー・フィジカル・システムとスマート・シティ
現代の都市環境は、サイバー・フィジカル・システム (CPS) とスマート・シティに関する課題を数多く抱えています。この記事では CPS について紹介した後、このテクノロジーを使用した実際の例を取り上げます。また、スマート・シティが近い将来に直面するであろう社会的な問題と技術的な問題についても説明します。
記事 2015/6/25
IBM Watson Developer Cloud Visual Recognition で物体認識させる
画像などの中から物体を検出することを物体認識と言います。今回は IBM Watson Developer Cloud が Bluemix 上で提供しているサービスの一つ Visual Recognition を用いて、物体認識を行ってみましたので、その方法を簡単に紹介します。
記事 2015/6/18
既存の RDBMS に Hadoop を統合する
リレーショナル・データベース管理システム (RDBMS) に Apache Hadoop を統合する方法を学んでください。半構造化データと非構造化データが短期間で大量に生成されるこの時代、組織はこの RDBMS と Apache Hadoop を統合した設計手法を実装するようになっています。この手法が特に役立つのは、すでに RDBMS に多額の投資を行っているものの、ソーシャル・メディアのようなソースから非構造化データを Hadoop システムに取り込んで分析する潜在能力を活用したいという組織です。
記事 2015/6/18
Bluemix のアナリティクス・サービスを利用してテキスト・アナリティクスを実行する
このチュートリアルでは、IBM Bluemix 上で Analytics for Hadoop サービスと dashDB サービス (旧 Analytics Warehouse サービス) を利用して、テキスト・アナリティクスを実行する方法を説明します。プロセスの大半は、Eclipse IDE および BigInsights プラグインがインストールされたクライアント・マシン上で行います。目的のテキストを抽出した後は、dashDB に組み込まれた R を使用して結果のグラフをプロットします。
記事 2015/5/07
編集チームが選ぶ Bluemix チュートリアル・トップ 10 ― 2015 年冬
この 1 年での Bluemix の進化は信じられないほどです! IBM は Bluemix を公開して以来、ユーザーが夢見るほぼあらゆる種類のアプリケーションを作成、デプロイ、実行、管理するために使用できる新しいサービスおよびランタイム (IBM によるもの、サード・パーティーによるもの、オープンソースのもの) を多数発表してきました。developerWorks では、編集チームがクラウドおよびサービスの一流のエキスパートと密接に協力して、Bluemix とそのサービスによって実現できる内容や、それを迅速かつ容易に実現する方法などを紹介するために、クイックスタート、チュートリアル、動画、デモなどで構成されるライブラリーを大量に作成してきました。このような豊富な情報を提供するなかで、さまざまな Bluemix ソリューションを説明するチュートリアルの中から編集チームが気に入ったものを定期的にハイライトすると参考になるのではないかと考えました。
記事 2015/5/07
IBM IoT Foundation と IBM Bluemix を使用して独自のウェアラブル端末を作成する
ウェアラブル端末に接続し、その端末からクラウドに対してセンサー・データの送信を行う、ハイブリッド・モバイル・アプリを作成してください。このチュートリアルの自分で作成する粋なプロジェクトでは、IBM Bluemix、IBM Internet of Things (IoT) Foundation、Apache Cordova、および WICED Sense Development Kit を使用します。
チュートリアル 2015/5/07
ELK スタックを使用して IBM Bluemix のアプリのログを一元管理する
IBM の次世代クラウド・プラットフォームである IBM Bluemix を利用すると、開発者はクラウド・アプリケーションを迅速に作成し、デプロイ、管理することが可能になります。クラウドの性質を持つ Bluemix では、アプリケーションのログ・ファイルを自動的に永続化することはありませんが、Bluemix のアプリケーションのログを外部のログ管理サービスに出力することはできます。この機能を ELK スタックのコンポーネント (Elasticsearch、Logstash、および Kibana) と組み合わせると、一元管理された永続ログ用の場所を提供できるだけでなく、ログ・データの分析や可視化を行うことができます。この記事では、Bluemix を使い慣れていて Linux の基礎知識がある中級レベルの開発者を対象としており、はじめに ELK スタックについての簡単な背景知識を説明してから、コンポーネントをインストールして構成するプロセスを順番に説明します。
チュートリアル 2015/4/16
IBM Bluemix 上で Embeddable Reporting サービスを利用することで IBM Cognos を活用する
Bluemix 上で Embeddable Reporting サービスを利用することで、Cognos を活用するのがいかに容易であるかを学んでください。このチュートリアルでは、Embeddable Reporting サービスを利用して Bluemix 上でゼロからアプリを作成、開発、そしてデプロイする手順を紹介します。
チュートリアル 2015/4/16
実際に使われている用語を IBM Watson Content Analytics で見つけて使用する
この記事では、IBM Watson Content Analytics (WCA) の言語分析機能を利用してドメイン固有の用語を調査し、ユーザーが「実生活」で使っている語彙の傾向を反映したドメイン辞書を作成します。さらに、完成した辞書を WCA Studio で使用して概念アノテーターを作成します。
記事 2015/3/19
ウェアラブル端末と Bluemix を連携させる
ここのところ、ウェアラブル・テクノロジーを採用した端末の人気が非常に高くなっています。これらの端末は人間の生活をより良いものにすることができ、技術的な観点ではビッグ・データの大きな牽引役にもなっています。この記事では、現在市場に出ているいくつかのウェアラブル端末について調査した結果を示すとともに、Bluemix のサービスを利用してこれらのウェアラブル端末とやりとりする方法を紹介します。
記事 2015/3/12
Open Web Analytics を Web サイトにデプロイする
主要なオープンソース Web アナリティクス・オファリングの 1 つに、Open Web Analytics (OWA) があります。この記事では、IBM Bluemix の IBM Platform as a Service (PaaS) 上に OWA をデプロイするためのステップバイステップの手順を示します。Bluemix 上にホストされた Web アプリケーションならびに Bluemix 外部でホストされている Web アプリケーションからは、有用なメトリックの統計情報 (Web サイトのトラフィック、ショッピング・カートの更新状況、購入につながるページ・ビューなど) を盛り込んでカスタマイズできるレポートを作成することができます。
チュートリアル 2015/2/19
Bluemix 上でエンタープライズ・サプライチェーン・アプリケーションを作成する
このチュートリアルでは、Bluemix 上のクラウド・サービスを利用してエンタープライズ・データおよびプロセスを統合する Node.js アプリケーションを作成する方法を紹介します。このアプリケーションは、Bluemix 上の Business Rules サービス、dashDB サービス、カスタム・クラウド・サービスを利用するサプライチェーン・アプリケーションで、IBM Worklight Server、ビジネス・プロセス管理 (BPM)、コンテンツ管理 (CM)、そして企業のバックエンド・システムに接続するための API プラットフォームと統合されています。
チュートリアル 2015/1/15
Bluemix の Analytics for Hadoop サービス: BigInsights の Web コンソールをナビゲートする
IBM InfoSphere BigInsights の Web コンソールを使用してサービスの状況を確認し、システムのヘルスを表示し、ビッグ・データ環境の状況をモニタリングしてください。
チュートリアル 2015/1/08
Bluemix の Analytics for Hadoop サービス: BigSheets を使用してデータを探索する
複数のソースから収集したデータをモデル化、フィルタリング、結合することや、このデータをグラフにすることができるスプレッドシート風のツールである、IBM BigSheets アプリケーションを使用して、ビッグ・データの分析および精査を即座に行ってください。
チュートリアル 2015/1/08
Bluemix の Analytics for Hadoop サービス: InfoSphere BigInsights にデータをロードする
InfoSphere BigInsights Hadoop 環境にデータをロードし、利用可能な選択肢を把握して、手元のデータを短時間で確認してください。
チュートリアル 2015/1/08
Bluemix の R カスタム・ビルドパックを使用して #Bluemix のセンチメント分析を行う Shiny アプリケーションを作成する
Twitter 上のエンティティーの人気を分析し、R を使用してツイートのセンチメント分析を行う Shiny アプリケーションを作成してください。また、カスタム・ビルドパックを使用して IBM Bluemix 上で R を実行する方法を学んでください。そして、アプリケーションをカスタマイズして、クラウド内に保管されているデータに対して、あらゆる種類の複雑な分析を実行してください。
記事 2014/12/11
BIRT ビューアーを Java および Java EE による Web アプリケーションと統合する
この記事では、BIRT (Business Intelligence and Reporting Tool) レポート・ビューアーを、Java および Java EE (Java Platform, Enterprise Edition) によるカスタム Web アプリケーションと統合する方法を説明します。さらに、カスタム Web アプリケーションの中で BIRT レポート・ビューアー・アプリケーションの機能を利用する方法についても説明します。
チュートリアル 2014/12/11
Bluemix を使用して Oculus Rift のゲーム・データを分析する
インタラクティブなユーザー環境は、デジタル・ゲームをベースにした学習を、魅力的で効率的なものにします。収集されたデータは、ゲーム開発者がゲームの教育的価値を高めるために役立てることが可能です。Oculus Rift バーチャル・リアリティー機器から収集されたデータを Bluemix サーバーに対してストリーミングして分析する方法を理解してください。Bluemix アプリケーションは、ユーザーの頭の動きなど、Rift からの全データを保管します。このデータを分析することで、学習速度に関する洞察を得ることができます。
チュートリアル 2014/11/20
SoftLayer クラウドでマッピング機能と地理空間解析機能を使えるようにする
GIS と地理空間解析についての概要、Esri の製品である ArcGIS と Esri のマップ・アプリケーション、そしてこのアプリケーションを SoftLayer クラウド上にデプロイする方法を理解してください。
記事 2014/11/06
MapReduce バージョン 1 から YARN へのアジャイルなマイグレーションによる YARN Hadoop クラスターの堅牢化
developerWorks のチュートリアル「MapReduce バージョン 1 から YARN への単一ノード・クラスターのアジャイルなマイグレーション」では、Hadoop クラスター上で MRv1 パッケージをアンインストールして YARN パッケージをインストールし、必要な YARN デーモンを起動して、必須の構成設定を構成することで、クラスターによって Java の MapReduce ジョブが正常に実行されるようにするプロセスを説明しました。今回のチュートリアルでは、YARN Hadoop クラスターについての説明をさらに展開し、Hadoop クラスターをより堅牢かつ機能的なものにするための、さらに 3 つの機能を説明に含めるようにします。今回のチュートリアルでは、YARN Hadoop クラスターについての説明をさらに展開し、これまで説明した機能に加えて Hadoop クラスターをより堅牢かつ機能的なものにするための 3 つの機能を説明に含めるようにします。
記事 2014/11/06
クラウド・デプロイメントにおける Hadoop
Hadoop とクラウドは理想的な組み合わせのように思えます。Hadoop もクラウドもともに、柔軟で分散された処理とストレージから構成され、柔軟なインスタンス・システムと結び付いています。また、Hadoop とクラウドはデータ要件と処理要件に応じて Hadoop クラスターを拡張または縮小することができます。その一方で、こうした柔軟性によって管理やスケジュールに関する各種さまざまな問題が引き起こされます。この記事では、これらの問題をはじめとする、柔軟性が引き起こすあらゆる問題を取り上げると同時に、クラウド・ベースの Hadoop デプロイメントにおける課題と利点を説明します。
記事 2014/10/09
IBM PureApplication System における WebSphere eXtreme Scale ベースのキャッシュ・サービスを探る
クラウド・エンタープライズ・アプリケーションのパフォーマンスとスケーラビリティーの問題に対処するには、キャッシュ・サービスがソリューションとしてよく使われます。この記事では、IBM PureApplication System のクラウド・システムに用意されている 3 つのキャッシュ・サービスについて探ります。対象とするのは、組み込みキャッシュ・サービス、WebSphere eXtreme Scale をベースにクラスターで仮想システム・パターンを使用して作成するキャッシュ・サービス、そして同じく WebSphere eXtreme Scale をベースに仮想システム・パターンとコア OS イメージを使用して作成するキャッシュ・サービスです。
記事 2014/10/02
データウェアハウスの強化: 第 1 回 ビッグデータとデータウェアハウスの強化
現在のデータウェアハウス用のツールとテクノロジーでは、新しいデータ・ソースや分析ワークロードがエンタープライズ・データウェアハウスにもたらす負荷に対処しきれません。組織がこうした負荷に対処する目的で、既存のデータウェアハウス・ソリューションを強化するには、従来のデータウェアハウスのコンテキストの中でビッグデータ・テクノロジーを実装しなければなりません。この連載では、従来のデータウェアハウスを扱っているデータウェアハウス・アーキテクトと情報アーキテクトを対象に、従来のテクノロジーとビッグデータ・テクノロジーを融合させて、既存のデータウェアハウスの有効性を最大限に高め、強化する方法を説明します。
記事 2014/9/25
データウェアハウスの強化: 第 4 回 初期データ探索にビッグデータ・テクノロジーを使用する
データウェアハウスの目標は、企業内に存在するデータと限定された外部データを使用して、ビジネスの洞察を引き出すことです。従来の環境では、データのボリュームは数テラバイト程度に制限され、扱うデータは主にオペレーショナル・データとトランザクション・データとなります。既存のデータウェアハウスには制約が伴うことから、非構造化データを分析に使用することはできません。そこでこの記事では、ビッグデータ・テクノロジーを使用して、これまで分析に使用できなかったデータからもより有効なビジネスの洞察を引き出せるように、既存のデータウェアハウスを徐々に拡張する方法を検討します。
記事 2014/9/25
データウェアハウスの強化: 第 3 回 ビッグデータ・テクノロジーをアクティブ・アーカイブに適用する
ビッグデータ・テクノロジーを使用すると、エンタープライズ・データウェアハウス内のデータを対象としたアクティブ・アーカイブをセットアップすることができます。この記事では、データウェアハウス内の履歴データ用にアクティブ・アーカイブを構築するには、Hadoop をベースとしたビッグデータ・ソリューションが、いかに理想的なプラットフォームであるかを説明し、アクティブ・アーカイブを設計するために使用できるアーキテクチャー、ツール、手法を取り上げます。
記事 2014/9/25
データウェアハウスの強化: 第 2 回 ビッグデータ・テクノロジーをソース・データのランディング・ゾーンとして使用する
多種多様なソースからのデータを取り込んで処理し、処理したデータを既存のデータウェアハウスやその他のリポジトリーに転送するために、Hadoop 環境をランディング・ゾーンとして使用してください。この記事では、ランディング・ゾーンを実装するさまざまな方法のシナリオを探ります。さらに、ランディング・ゾーンのアーキテクチャー、そしてランディング・ゾーンとしての Hadoop 環境を各種の環境に統合するためのツールと手法についても説明します。
記事 2014/9/25
DIY: Bluemix、Cloudant、Raspberry Pi を使用してリモート監視アプリを構築する
単純な監視システムを構築するために、Raspberry Pi デバイスのカメラ・モジュールで撮影した写真を Cloudant へ送信する IBM Bluemix アプリケーションを作成し、それらの写真を Web ページに表示するために Node.js を使用する方法を学んでください。
記事 2014/8/28
MapReduce バージョン 1 から YARN への単一ノード・クラスターのアジャイルなマイグレーション
YARN は、Hadoop クラスターの処理プラットフォームのアーキテクチャーを完全に作成し直したものであり、Hadoop の最初のバージョンに用意された従来の MapReduce エンジンに比べ、コンピューテーションを遥かにスケーラブルで、効率的かつ、柔軟に行えるようにしています。2013年 10月以降、YARN は実用に耐えるものと見なされており、現在は、Yahoo!、Spotify、eBay、Xing、Allegro をはじめとする多くの企業が本番環境で使用しています。この記事では、Hadoop クラスターを MapReduce Version 1 (MRv1) から YARN にアジャイルな手段でマイグレーションする方法を説明します。
記事 2014/7/17
Python、SciKit、およびテキスト分類を利用して行動プロファイルを作成する
顧客がこれまで購入した商品に関する説明のテキスト属性に基づいて、顧客の行動プロファイル・モデルを作成する方法を学んでください。SciKit は、モデルの作成と評価をするための強力な Python ベースの機械学習パッケージです。この SciKit を利用して、モデルを作成し、シミュレートした顧客の商品購入履歴にそのモデルを適用する方法を学んでください。この記事のサンプル・シナリオでは、各顧客が購入する特定の商品とそれに対応するテキストの商品説明を基に、個々の顧客に音楽リスナーのプロファイルを割り当てるモデルを作成します。
記事 2014/7/17
Hadoop と Hiveを使用してマシン・データを抽出する
マシン・データにはさまざまなフォーマットがあり、その量も大量です。気象センサー、フィットネス・トラッカー、さらには空調装置でさえも大量のデータを生成します。これらのデータには是が非でもビッグ・データ・ソリューションが必要ですが、どのデータが重要なのかを判断するにはどうすればよいのでしょう?また、その情報のうち、どれだけの割合が有効なのか、レポートに含める価値があるのか、あるいはアラート状況を検出するのに役立つのか、といったことを判断するにはどうすればよいのでしょう?この記事では、大量のマシン・データ・セットを利用するためのサポートをビッグ・データ・ソリューションと Hadoop で行う場合の課題とソリューションのいくつかを説明します。
記事 2014/7/03
YARN の紹介
Apache Hadoop は、ビッグ・データを処理するのに最もよく使われているツールの 1 つです。ここ数年の間、多くの企業が本番環境に Hadoop をデプロイして功を奏してきました。Hadoop は信頼性、スケーラビリティー、コスト効果に優れたソリューションであると見なされていますが、大規模な開発者コミュニティーによって常に改善が続けられています。その結果、Apache Hadoop 2.0 には YARN (Yet Another Resource Negotiator)、HDFS 統合、可用性に優れた NameNode などの革新的な機能が用意されています。これらの機能により、Hadoop クラスターの効率性、処理能力、信頼性には、これまで以上に大幅な改善がもたらされます。この記事では、以前のバージョンの Hadoop 分散処理層に勝る、YARN の利点を説明します。
記事 2014/6/26
曖昧で不確かなデータの実用的なデータ・マイニング
ビジネスで生成される非公開データにしても、Web で生成される公開データにしても、生成されるデータの量は次第に増加しています。この状況のなか、データ・マイニングの注目度と有用性が高まりつつありますが、従来のデータ・マイニングは、ある種の不確かさと曖昧さを処理するには適していません。そこで役立つのが、ファジィ集合論です。
記事 2014/6/26
Hadoop のためのワークフロー管理エンジン Oozie の実用的なアプリケーション
Apache Oozie は、Apache Hadoop エコシステムの中で中心的な役割を果たすコンポーネントの 1 つです。開発者は Oozie を使用して、e-メール通知の反復ジョブをスケジューリングしたり、Java、UNIX シェル、Apache Hive、Apache Pig、Apache Sqoop などの各種プログラミング言語で作成された、繰り返し発生するジョブをスケジューリングしたりすることができます。この記事では、特定のビジネス・シナリオに対処する、Oozie フレームワークの実用的なアプリケーションをいくつか紹介します。この記事で取り上げるトピックの対象読者は、ビッグ・データ・テクノロジーに現在取り組んでいるか、このテクノロジーに興味を持っているソリューション・アーキテクト、技術アーキテクト、コンサルタント、データ・サイエンティスト、技術リーダー、開発者です。
記事 2014/6/19
Hadoop データのセキュリティーと Sentry
ビッグ・データを利用して可能なことについての洞察では、プライバシーの懸念がビッグ・データを悪く言う人々にとって最大の焦点となってきました。しかしこの議論には、Apache Hadoop ではデータの保護を行えるということが抜け落ちています。Sentry は、粒度の細かい権限付与フレームワークを使用することで Hadoop 内のデータを保護することを目的としたソリューションです。この記事では Sentry について詳しく探るとともに、法規制が適用される業界で Sentry を使用してビッグ・データ・アプリケーションに対する制御を行う方法を紹介します。
記事 2014/6/12
Hadoop で CombineFileInputFormat を使用して小さい圧縮ファイルを処理する
この記事では、gzip (デフォルトのコーデック) ファイルの中身を実行時に読み取るために、CombineFileInputFormat を拡張して実装する方法を、詳細な例を用いて説明します。Mapper が使用するデータの量を HDFS 内のファイルのブロック・サイズとは無関係にするために、MapReduce フレームワーク内で CombineFileInputFormat を使用する方法を学んでください。
記事 2014/6/12
マシン・データ・アナリティクス
サイバー世界における物理セキュリティーを強化し、セキュリティー・システムを増やすという取り組みから、その難題を克服することにフォーカスした成長産業が生まれました。画像を利用したセキュリティー・システム用のカメラは、これまで使われていた有線のアナログ TV カメラから、機能豊富な高精細デジタル・カメラへと急速に置き換わっています。アナログ・カメラに比べると、デジタル・カメラはより柔軟で賢く、クラウド・サービスやデータ・アナリティクス機能とより緊密に統合されます。この記事では、ドロップイン型のセキュリティー・モニターについて説明します。このセキュリティー・モニターをクラウド・ベースのデータ・アナリティクス機能と組み合わせれば、電力インフラやネットワーク・インフラが整備されていないエリアでも、簡単にモニター機能をデプロイすることができます。
記事 2014/5/15

1 - 106 件のうちの 100 件 | 次へ 概要の表示 | 概要の非表示 検索結果に登録(RSS)