機械学習

menu icon

機械学習

このページでは、機械学習の定義、仕組み、手法、実用事例、課題について概説します。

機械学習とは

機械学習は、人工知能(AI)を支える技術の一つです。大量のデータを分析し、繰り返し学習することで、パターンやルールを発見し、アルゴリズムやモデルを自動的に構築します。

IBMには、機械学習における豊富な経験の蓄積(英語)があります。 IBMで活躍したアーサー・サミュエルは、チェッカーのゲームに関する研究(PDF, 481KB, 英語)(IBM外部へのリンク)で、「Machine Learning」(機械学習)という用語を作り出したことで知られています。 チェッカーのマスターを自称していたロバート・ニーリーは、1962年にIBMの7094コンピューターと対戦し、コンピューターに負けました。 今日可能になっていることに比べれば、この功績はともすると些細なことのように見えますが、これは、人工知能の分野における重要なマイルストーンと見なされています。 その後数十年の間に、ストレージと処理能力の技術発展により、Netflixのレコメンデーション・エンジンや自動運転車など、今日よく知られている革新的な製品が実現されています。

機械学習は、成長するデータサイエンス分野の重要な構成要素です。 統計的手法を使用することにより、アルゴリズムは分類や予測を行うようにトレーニングされ、データ・マイニング・プロジェクトにおける重要な洞察を示しています。 これらの洞察はその後、アプリケーションやビジネス内の意思決定を促進し、理想的には主要な成長指標に影響を与えることとなります。 ビッグデータが拡大し、成長し続けるにつれて、データサイエンティストに対する市場の需要は高まるでしょう。データサイエンティストには、ビジネス上の最も重要な問いの特定、さらにはその問いに答えるためのデータの特定を支援することが期待されています。

ディープ・ラーニングと ニューラル・ネットワーク

ディープ・ラーニングと機械学習は区別なく使用される傾向があるので、両者のニュアンスの違いに注目する価値があります。 機械学習、ディープ・ラーニング、ニューラル・ネットワークは、すべて人工知能の一分野です。 ただし、ディープ・ラーニングは実際には機械学習の一分野であり、ニューラル・ネットワークはディープ・ラーニングの一分野となります。

ディープ・ラーニングと機械学習の違いは、それぞれのアルゴリズムがどのように学習するかです。 ディープ・ラーニングは、プロセスの特徴量抽出の部分の多くを自動化します。これにより、手動による人間の介入が一部不要となり、より大規模なデータ・セットの使用が可能となります。 ディープ・ラーニングは、Lex FridmanがMITでの講義(00:30)(IBM外部へのリンク)で述べているように、「拡張性の高い機械学習」と考えることができます。 従来の「ディープではない」機械学習は、人間の介入にもっと依存しながら学習します。 さまざまなデータ入力の違いを理解するための一連の特徴量は、専門家が決定します。通常、学習にはより構造化されたデータが必要です。

「ディープな」機械学習では、アルゴリズムに情報を提供するために、ラベル付きデータ・セットを利用できます(教師あり学習とも呼ばれます)。ただし、必ずしもラベル付きデータ・セットが必要なわけではありません。 非構造化データを生の形式(テキスト、画像など)で取り込むことができ、さまざまなカテゴリーのデータを互いに区別する一連の特徴量を自動的に判別することができます。 機械学習とは異なり、データを処理するために人間の介入は必要ないので、機械学習をより興味に沿う方向へ拡張することができます。 ディープ・ラーニングとニューラル・ネットワークは、主に、コンピューター・ビジョン、自然言語処理、音声認識などの分野での進歩の加速に貢献していると言われています。

ニューラル・ネットワーク、または人工ニューラル・ネットワーク(ANN)は、1つの入力層、1つ以上の隠れ層、1つの出力層を含む、ノードの層で構成されます。 各ノード(人工ニューロン)は別のノードに接続し、関連する重みとしきい値を持ちます。 個々のノードのいずれかの出力が、指定されたしきい値を超えると、そのノードがアクティブ化されて、ネットワークの次の層にデータが送信されます。 それ以外では、データはネットワークの次の層に渡されません。 ディープ・ラーニングの「ディープ」とは、ニューラル・ネットワークの層の深さを指します。 入力と出力を含めて4層以上で構成されるニューラル・ネットワークは、ディープ・ラーニング・アルゴリズムまたはディープ・ニューラル・ネットワークと見なすことができます。 2層または3層しかないニューラル・ネットワークは、単なる基本的なニューラル・ネットワークです。

ブログ記事「AI、機械学習、ディープ・ラーニング、ニューラル・ネットワークの相違点」で、これらのさまざまな概念がどのように関連しているかについて、詳細をお読みください。

仕組み

カリフォルニア大学バークレー校(IBM外部へのリンク)は、機械学習アルゴリズムの学習システムを3つの主要な部分に分けています。

  1. 意思決定プロセス: 一般に、機械学習アルゴリズムは、予測または分類を行うために使用されます。 ラベル付きまたはラベルなしの入力データに基づき、アルゴリズムがデータのパターンに関する推定値を生成します。
  2. 誤差関数: 誤差関数は、モデルの予測の評価に役立ちます。 既知の例があれば、誤差関数は比較によりモデルの精度を評価することができます。
  3. モデル最適化プロセス: モデルとトレーニング・セットのデータ・ポイントの適合性に改善の余地があれば、既知の例とモデル推定値の間の不一致を減らすように重みが調整されます。 アルゴリズムは、この評価と最適化のプロセスを繰り返し、精度のしきい値に達するまで重みを自律的に更新します。

手法

機械学習は、3つの主要なカテゴリーに分類されます。

教師あり機械学習

教師あり学習(教師あり機械学習とも呼ばれる)は、データの分類または結果の予測を正確に行うために、ラベル付きデータ・セットを使用して、アルゴリズムのトレーニングを行います。 入力データがモデルに提供されると、モデルが適合するまで重みが調整されます。 これは、モデルが過剰適合または過小適合を確実に回避するための相互検証プロセスの一部として行われます。 教師あり学習は、受信トレイとは別のフォルダーにスパムを分類するなど、組織が実際に直面するさまざまな問題を大規模に解決するのに役立ちます。 教師あり学習で使用される手法には、ニューラル・ネットワーク、単純ベイズ、線形回帰、ロジスティック回帰、ランダム・フォレスト、サポート・ベクター・マシン(SVM)などがあります。

教師なし学習

教師なし学習(教師なし機械学習とも呼ばれる)は、機械学習アルゴリズムを使用して、ラベルなしデータ・セットを分析し、クラスター化します。 これらのアルゴリズムは、人間の介入を必要とせずに、隠れたパターンやデータのグループ化を発見します。 情報の類似点と相違点を発見することができるため、探索的データ分析、クロスセル戦略、顧客セグメンテーション、画像・パターン認識における理想的なソリューションとなります。 また、次元削減のプロセスを通じてモデル内の特徴量の数を減らすためにも使用されます。主成分分析(PCA)と特異値分解(SVD)は、このための2つの一般的なアプローチです。 教師なし学習で使用される他のアルゴリズムには、ニューラル・ネットワーク、k平均法、確率的クラスタリング手法などがあります。

半教師あり学習

半教師あり学習は、教師あり学習と教師なし学習の折衷案です。 トレーニング中は、比較的少量のラベル付きデータ・セットを使用することで、より大量のラベルなしデータ・セットの分類と特徴量抽出をガイドできます。 半教師あり学習は、教師あり学習アルゴリズムをトレーニングするのに十分なラベル付きデータがない(または十分なデータにラベルを付ける余裕がない)という問題を解決できます。

これらのアプローチの違いを深く掘り下げるには、「教師あり学習と教師なし学習の相違点」をご確認ください。

強化学習

強化機械学習は、行動機械学習モデルです。教師あり学習に似ていますが、アルゴリズムに対し、サンプル・データを使用したトレーニングは行われません。 このモデルは、試行とエラーを通じて学習します。 決定の成功が続くとそのプロセスが強化されていき、所定の問題に最適な推奨事項または方針を策定できるようになります。

2011年にジェパディ!の対戦に勝利したIBM Watson®システムは、良い例を示しています。 このシステムは、回答を試すかどうか、ボード上でどのマスを選択するか、そして賭けの程度(特に独占的に回答権が与えられるデイリー・ダブル)を決定するために、強化学習を活用しました。

強化学習についての詳細はこちらをご覧ください。

活用事例

ここでは、日常的に遭遇する可能性のある機械学習の例をいくつか挙げます。

音声認識:自動音声認識(ASR)、コンピューター音声認識、またはSpeech to Textとしても知られており、自然言語処理(NLP)を使用して、人間の音声を文書形式に処理することができます。 多くのモバイル・デバイスでは、音声認識機能がシステムに組み込まれており、音声検索(Siriなど)や、 テキスト・メッセージ送信のアクセシビリティー強化に活用されています。

カスタマー・サービス:カスタマー・ジャーニーにおいて、担当者がオンライン・チャットボットに置き換わっています。 チャットボットは、さまざまなトピック(配送など)に関するよくある質問(FAQ)に答えたり、製品のクロスセルやサイズの提案をユーザーに対して行ってパーソナライズされたアドバイスを提供したりすることで、Webサイトやソーシャル・メディア・プラットフォームにおけるカスタマー・エンゲージメントについての考え方を変革しています。 例としては、仮想エージェントがあるe-コマース・サイトのメッセージング・ボット、 SlackやFacebook Messengerなどのメッセージング・アプリケーション、仮想アシスタントと音声アシスタントによって通常行われるタスクなどがあります。

コンピューター・ビジョン:このAI技術により、コンピューターとシステムは、デジタル画像、動画、その他のビジュアル入力データから意味のある情報を導き出し、それらのデータに基づいてアクションを実行することができます。 コンピューター・ビジョンは、推奨事項を提供できるという点において、画像認識タスクとは区別されます。 畳み込みニューラル・ネットワークを活用するコンピューター・ビジョンには、ソーシャル・メディアにおける写真のタグ付け、ヘルスケアにおける放射線画像分析、自動車産業における自動運転車などに応用されています。

レコメンデーション・エンジン:AIアルゴリズムで過去の消費行動データを活用することで、より効果的なクロスセル戦略の策定に使用できる、データの傾向を発見するのに役立ちます。 これは、オンライン小売業者のチェックアウト処理中に、関連のある追加の推奨事項を顧客に提示するために使用されます。

自動株式取引:株式ポートフォリオを最適化するために設計された、AI主導型の高頻度取引プラットフォームは、人間の介入なしに、1日に数千件または数百万件の取引を行います。

課題

機械学習技術の進歩に伴い、物事が便利になったことは確かです。 しかし、ビジネスの中で機械学習を実装することで、AI技術を取り巻く多くの倫理的懸念も生じています。 懸念には次のようなものがあります。

シンギュラリティー(技術的特異点):

このトピックは多くの人々の注目を集めていますが、研究者の多くは、AIが近い将来あるいはすぐにでも人間の知性を超えるという考えには懸念を示していません。 これは超知能とも呼ばれ、スウェーデン人の哲学者ニック・ボストロムは「科学的創造性や一般的な知恵、社会的スキルなどを含む事実上すべての分野において、最も優秀な人間の脳を大幅に上回る知性」と定義しています。「強いAI」と超知能は社会の中で目前に迫っているわけではないものの、その考えは、自動運転車のような自律システムの活用を検討する上で、いくつかの興味深い疑問を投げかけるものとなっています。 自動運転車が自動車事故に巻き込まれることは決してないと考えるのは非現実的ですが、そのような状況では誰が責任を負うのでしょう? それでも自動運転車を追求すべきでしょうか。それとも、このテクノロジーの統合を制限して、ドライバーの安全を高める半自動運転車にとどめるべきでしょうか? その最終的な答えはまだ出ていませんが、新しい革新的なAI技術の発展に伴い、この種の倫理的な議論が行われています。

仕事へのAIの影響:

人工知能に関する世間の認識の多くは、人の仕事がなくなるのではという点に集中していますが、この懸念はおそらく捉え直されるべきです。 破壊的な新しいテクノロジーが登場するたびに、特定の職務に対する市場の需要は変化を遂げます。 例えば自動車業界の場合、GMを始めとする多くのメーカーが、グリーン・イニシアチブに合わせて電気自動車の生産に焦点を当てるようシフトしています。 エネルギー産業が無くなることはありませんが、エネルギー源は燃料から電気へとシフトしています。 人工知能もこれと同様に、求められる仕事内容を他の分野へとシフトさせるものと捉える必要があります。 データが日々増大し、変化するのに伴い、これらのシステムの管理を支援する担当者が必要になるでしょう。 カスタマー・サービスのように、仕事に対する需要の変化によって影響を受ける可能性が最も高い業界においても、より複雑な問題に対処する人材は依然として必要です。 人工知能の重要な側面と雇用市場へのその影響は、市場で求められるこうした新しい分野に個人が移行するのを後押しすることになるでしょう。

プライバシー:

プライバシーは、データ・プライバシー、データ保護、データ・セキュリティーの文脈で議論される傾向があり、こうした懸念が、政策立案において近年さらなる前進を遂げることへとつながりました。 例えば、2016年には、欧州連合と欧州経済領域内の人々の個人データを保護するためにGDPR法が策定され、自身の個人データをより細かく管理できるようになりました。 米国では、個々の州がカリフォルニア消費者プライバシー法(CCPA)などの政策を策定しており、これによって、企業はデータの収集について消費者に通知することが求められます。 こうした最近の法律により、企業は個人を特定できるデータ(PII)をどのように保存し使用するかを、再考せざるを得なくなりました。 その結果、セキュリティーに関する投資は、監視やハッキング、サイバー攻撃の脆弱性や機会を排除しようとする企業にとって、ますます優先度が高くなっています。

バイアスと差別:

多くのインテリジェント・システム全体でのバイアスと差別の事例は、人工知能の使用に関して多くの倫理的問題を提起しました。 トレーニング・データ自体がバイアスに寄与する可能性がある場合、バイアスや差別をどのように防ぐことができるのでしょうか? 企業は通常、自社の自動化の取り組みに関して善意の目的を持っていますが、Reuters社(IBM外部へのリンク)は、AIを採用実務に組み込むことでもたらされる、いくつかの予期しない結果に着目しています。 Amazon社は、プロセスを自動化し簡素化する取り組みの中で、求人中の技術職への応募者の性別に対して、意図せずバイアスをかけてしまい、最終的にそのプロジェクトを打ち切らなければならなくなりました。 このような出来事が表面化する中、ハーバード・ビジネス・レビュー誌(IBM外部へのリンク)は、ある職種の候補者を評価する際にどのデータを使用できるかなど、採用実務におけるAIの活用を巡って、他にも鋭い問題提起を行っています。

バイアスや差別は、人事業務に限ったことではありません。顔認識ソフトウェアからソーシャル・メディアのアルゴリズムまで、多くのアプリケーションで見受けられます。

企業がAIのリスクを認識するようになるにつれて、AIの倫理と価値に関するこの議論も活発になっています。 例えば、昨年、IBMのCEOのArvind Krishnaは、IBMが汎用的な顔認識と分析のための自社製品を廃止したことを伝え、「IBMは、他のベンダーが提供する顔認識テクノロジーを含むあらゆるテクノロジーを、大規模監視、人種プロファイリング、基本的人権と自由に対する侵害、または、当社の価値観と信頼性と透明性の原則と一致しない目的のために使用することに断固反対し、容認しません」と強調しました。

これについて詳しくは、IBMの方針についてのブログで、「顔認識技術の輸出管理のための精密な規制方法」に関するIBMの見解をご覧ください。

説明責任

AIの実践を規制する重要な法律がないため、倫理的なAIが実践されることを保証する実際の施行メカニズムはありません。 企業がこれらのガイドラインを順守する現在のところの動機は、非倫理的なAIシステムを使えば収益に悪影響が及ぶという点にあります。 このギャップを埋めるために、倫理的枠組みが登場しています。これは、社会におけるAIモデルの構築と配布を管理することを目的とした、倫理学者と研究者の間のコラボレーションの一環です。 しかし、現時点では、これらはあくまでガイドに過ぎず、調査(IBM外部へのリンク)(PDF、984 KB)では、責任の分散と潜在的な結果に対する先見性の欠如という組み合わせから、こうした枠組みが必ずしも社会への危害の防止に役立つとは限らないことが示されています。

AI倫理に関するIBMの立場について詳しくは、こちらをご覧ください。

機械学習とIBM Cloud

IBM Watson Machine Learningは、機械学習のライフサイクルをエンドツーエンドでサポートします。 これは、さまざまなオファリングでご利用可能で、お客様のデータが存在する場所ならどこでも機械学習モデルを構築して、ハイブリッド・マルチクラウド環境のあらゆる場所に導入できます。

IBM Cloud Pak for Data上のIBM Watson Machine Learningは、企業のデータサイエンスとAIのチームが、データとAIのためのクラウドネイティブなプラットフォームのどこでも、より迅速にAIの開発と導入ができるよう支援します。 IBM Cloud環境のマネージド・サービスであるIBM Watson Machine Learning Cloudは、デスクトップ上での実験から、実動ワークロード向けのデプロイメントまで、モデルを移動するための最速の方法を提供します。 機械学習の実装の拡大を検討している小規模のチームは、IBM Watson Machine Learning Serverを、どのプライベートクラウドにもパブリッククラウドにも簡単に導入できます。

開始するには、IBMidを登録し、IBM Cloudのアカウントを作成してください。