機械学習とは

機械学習は、システムが明示的なプログラミングではなく、データから学習することを可能にするAIの形式です。しかし、機械学習は単純なプロセスではありません。アルゴリズムがトレーニング・データを取り込むことによって、そのデータを基にしてさらに正確なモデルを作成できるようになります。機械学習モデルは、データを使用して機械学習アルゴリズムをトレーニングするときに生成される出力です。トレーニング後、モデルに入力を提供すると、出力が得られます。例えば、予測アルゴリズムは、予測モデルを作成します。その後、予測モデルにデータを提供すると、モデルをトレーニングしたデータに基づいた予測が得られます。

機械学習のイラスト

反復学習

機械学習では、モデルの実装前にデータ・セットでトレーニングできます。いくつかの機械学習モデルは、オンラインで継続しています。このオンライン・モデルの反復プロセスによって、データ・エレメント間で行われる関連付けのタイプが改善されるようになります。これらのパターンや関連性は、複雑さやサイズのせいで、人間の観察では見落とされやすかったかもしれません。モデルは訓練された後、リアルタイムで使用してデータから学習することができます。精度の向上は、機械学習の一部であるトレーニング・プロセスと自動化の成果です。

機械学習のコンテキストにおけるビッグデータ

機械学習では、データの適切なセットを学習プロセスに適用する必要があります。組織は、機械学習の手法を使用するためのビッグデータを持っていなくてもかまいません。しかし、ビッグデータがあれば、機械学習モデルの精度を向上させることができます。ビッグデータを使用することで、データを仮想化できるようになりました。そのためオンプレミスでもクラウドでも、効率的でコスト効果の高い方法でデータを保管できるようになりました。さらに、ネットワーク速度と信頼性の向上により、許容できる速度で大量のデータを管理することに関連する他の物理的制約もなくなりました。これに加えて、コンピューター・メモリーの価格と精巧さの変化の影響があり、今では企業がたった5年前には考えられなかったような方法でデータを活用できるのを想像できるようになりました。

機械学習へのアプローチ

予測モデルの精度を向上させるためには、機械学習の手法が必要です。対処するビジネス上の問題の性質に応じて、データのタイプとボリュームに基づいたさまざまなアプローチがあります。このセクションでは、機械学習のカテゴリーについて説明します。

監視される学習

監視される学習は通常、確立されたデータのセットと、そのデータが分類される方法の確実な理解から始まります。監視される学習は、分析プロセスに適用できる、データのパターンを見つけることを目的とします。このデータには、データの意味を定義するラベル機能があります。例えば、何百万もの動物を区別する機械学習アプリケーションを、画像と記述に基づいて作成できます。

監視されない学習

監視されない学習は、問題が大量のラベルなしデータを必要とする場合に使用されます。例えば、Twitter、Instagram、Snapchatなどのソーシャル・メディア・アプリケーションには、すべて大量のラベルなしデータがあります。このデータの背後にある意味を理解するには、検出したパターンまたはクラスターに基づいてデータを分類するアルゴリズムが必要です。監視されない学習は反復プロセスを行い、人間の介入なしにデータを分析します。これは電子メールのスパム検出技術で使用されます。正当なEメールとスパムのEメールには変数が多すぎて、分析者が大量の迷惑メールをタグ付けすることはできません。その代わりに、クラスタリングと関連付けに基づいた機械学習による分類が、不要なEメールを識別するために適用されます。

強化学習

強化学習は行動学習モデルです。アルゴリズムは、データ分析からフィードバックを受け取り、ユーザーを最適な結果に導きます。システムがサンプル・データ・セットを使用して訓練されていないため、強化学習は他のタイプの監視される学習と異なります。むしろ、システムは試行とエラーを通じて学習します。したがって、決定の成功が続くと、それが目の前の問題を最もよく解決するので、その結果プロセスが強化されます。

ディープ・ラーニング

ディープ・ラーニングは、反復する方法でデータから学習するために連続層にニューラル・ネットワークを組み込んだ、機械学習の特定の方法です。ディープ・ラーニングは、非構造化データからパターンを学習しようとするときに、特に便利です。ディープ・ラーニングの複雑なニューラル・ネットワークは、人間の脳の仕組みを模倣するよう設計されているため、うまく定義されていない抽象概念や問題を処理するようにコンピューターを訓練することができます。平均的な5歳の子どもは、先生の顔と交通指導員の顔の違いを簡単に認識できます。それに対して、コンピューターは誰が誰なのかを判別するために多くの作業をしなければなりません。ニューラル・ネットワークとディープ・ラーニングは、画像認識、スピーチ、およびコンピューター・ビジョンのアプリケーションでよく使用されます。

機械学習のグラフィック

ビジネス・ニーズへの機械学習の適用

機械学習は、ビッグデータを活用しようとしている企業に潜在的な価値を提供し、行動、好み、またはお客様の満足度の微妙な変化をよりよく理解するのに役立ちます。ビジネス・リーダーは、組織や業界内で起きている多くのことが、照会では把握できないということを察知し始めています。知っている質問ではなく、データの隠れたパターンや埋もれた異常が、役立ったり妨げとなったりするのです。

全体が機能する仕組み

機械学習の利点は、アルゴリズムやモデルを活用して結果を予測できることです。秘訣は、作業を行うデータ・サイエンティストが確実に、適切なアルゴリズムを使用し、最も適切な(正確でクリーンである)データを取り込み、最も優れたパフォーマンス・モデルを使用するようにすることです。これらすべての要素が合わされば、モデルを継続的にトレーニングし、データから学習することによって結果から学習することができます。モデリング、モデルのトレーニング、およびテストによってこのプロセスを自動化することが、ビジネスの変化をサポートするための正確な予測につながります。

人工知能

製品

IBM Watson Studio

優れたオープン・ソース・ツールを使用して、チームがデータ・ソリューションを探索、モデル化、実装するためのコラボレーティブな機械学習プラットフォームを提供する、オンプレミス、プライベートまたはパブリックのクラウドのソリューションです。

IBM Machine Learning for z/OS

エンタープライズ・データから隠れた価値を引き出す、オンプレミスの機械学習ソリューション。IBM z Systems®データを使用して、高精度の自己学習モデルを作成、導入、管理するために、データを素早く取り込んで変換します。

IBM SPSS® Modeler

テキスト分析や地理空間分析、最適化など、幅広いアルゴリズムと機能を備え、大規模に洞察を導入するための、あらゆるスキル・レベルのユーザー向けのグラフィカル分析プラットフォームです。

IBM Watson Explorer

すべてのデータから実用的な洞察へのアクセスをユーザーに提供し、より優れたビジネス成果を達成するのに役立つ、機械学習を採用したコンテンツ分析とコグニティブ検索プラットフォームです。

導入事例

Ahusが高品質の医療を提供するための新しい洞察をWatson Explorerで取得

Akershus University Hospital(Ahus)は、パートナーのCapgemini社と協力してWatson Explorerを使用し、数千の放射線情報を分析してチームがベスト・プラクティスに従っていることを確認し、高い医療水準を維持しています。

リアルタイム・コンテンツ分析により、コール・センターがお客様にサービスを効果的に提供

みずほ銀行は、IBM Watson Explorerのリアルタイムの自然言語処理機能を使用して、お客様との効果的な対話を促進し、お客様への対応時間を短縮しています。

リソース

IBM Watson Studioでお客様のチャーンを予測するための機械学習モデルを構築する方法について、ガイド付きツアーをご覧ください。

その他の機械学習およびディープ・ラーニングのアプリケーションのチュートリアルをご確認ください。

Watson Studioの試用版を無料で開始しましょう。