機械学習（ML）とは| IBM

機械学習、深層学習、ニューラル・ネットワークの違い

深層学習と機械学習は同じ意味で使用される傾向があるため、この2つの用語のニュアンスの違いに注目すべきでしょう。機械学習、深層学習、ニューラル・ネットワークはすべて人工知能の下位分野です。ただし、ニューラル・ネットワークは実際には機械学習の下位分野であり、深層学習はニューラル・ネットワークの下位分野です。

深層学習と機械学習の違いは、各アルゴリズムの学習方法にあります。「深層」機械学習は、教師あり学習とも呼ばれるラベル付きデータセットを使用してアルゴリズムに情報を提供できますが、必ずしもラベル付きデータセットを必要とするわけではありません。深層学習は、非構造化データを生の形式（テキストや画像など）で取り込むことができ、さまざまなカテゴリーのデータを区別する特徴を自動的に特定できます。これにより、人間の介入の一部を排除し、より大きなデータセットの活用が可能になります。Lex Fridman氏がこのMIT講義（ibm.com外部のリンク）で述べたように、深層学習は「スケーラブルな機械学習」と考えることができます。

従来の（「非深層」）機械学習は、学習するために人間が介入する必要があります。人間の専門家は、データ入力（取り込んだデータ）間の違いを理解するための一連の特徴を決定し、通常、より多くの構造化されたデータが学習に必要になります。

ニューラル・ネットワーク、または人工ニューラル・ネットワーク（ANN）は、入力層、1つ以上の隠れ層、および出力層を含むノード層で構成されます。各ノード、つまり人工ニューロンは別のノードに接続され、関連付けられた重みとしきい値を持ちます。個々のノードのいずれかの出力が、指定されたしきい値を超えると、そのノードがアクティブ化されて、ネットワークの次の層にデータが送信されます。それ以外の場合、そのノードによってデータがネットワークの次の層に渡されることはありません。深層学習における「深層」とは、ニューラル・ネットワークの層の数を指します。4層以上で構成されるニューラル・ネットワーク（入力層と出力層を含む）は、深層学習アルゴリズム（深層ニューラル・ネットワーク）と考えることができます。3層しかないニューラル・ネットワークは、単なる基本的なニューラル・ネットワークです。

深層学習とニューラル・ネットワークは、コンピューター・ビジョン、自然言語処理、音声認識などの分野での進歩を加速させていると考えられています。

さまざまな概念がどのように関連しているかを詳しく知るには、ブログ記事「AI vs. Machine Learning vs. Deep Learning vs. Neural Networks: What’s the Difference?」を参照してください。

教師あり機械学習

教師あり学習は、教師あり機械学習とも呼ばれ、その定義は、ラベル付きデータセットを使用して、データの分類や正確な結果予測を行うアルゴリズムをトレーニングすることとされています。入力データがモデルに取り込まれると、モデルはデータが適切に適合するまでそのデータの重み付けを調整します。これは、モデルが過剰適合や不足適合を回避するよう相互検証プロセスの一部として行われます。教師あり学習は、受信トレイとは別のフォルダーにスパムを分類するなど、組織が実際に直面するさまざまな問題を、大規模に解決するのに役立ちます。教師あり学習で使用される手法には、ニューラル・ネットワーク、ナイーブ・ベイズ、線形回帰、ロジスティック回帰、ランダム・フォレスト、サポート・ベクター・マシン（SVM）などがあります。

教師なし機械学習

教師なし学習（教師なし機械学習とも呼ばれます）では、機械学習アルゴリズムを使用して、ラベルのないデータセット（クラスターと呼ばれるサブセット）を分析およびクラスター化します。これらのアルゴリズムは、人間の介入を必要とせずに、隠れたパターンやデータのグループを見つけます。この方法では、情報の類似点と相違点を発見できるため、探索的なデータ分析、クロスセル戦略、顧客セグメンテーション、画像とパターンの認識に最適です。また、次元縮小のプロセスを通じてモデル内の特徴の数を減らすためにも使用されます。主成分分析（PCA）と特異値分解（SVD）はそのための2つの一般的なアプローチです。教師なし学習で使用される他のアルゴリズムには、ニューラル・ネットワーク、K平均クラスタリング、確率的クラスタリングの手法などがあります。

半教師あり学習

半教師あり学習は、教師あり学習と教師なし学習間のバランスの取れた中間となります。トレーニング中は、ラベル付きの小さいデータセットを使用して、ラベルのない大きいデータセットから分類と抽出を導きます。半教師あり学習は、教師あり学習アルゴリズムに必要なラベル付きデータが足りないという問題を解決できます。十分なデータにラベルを付けるのにコストがかかりすぎる場合にも役立ちます。

これらのアプローチの違いを詳しく知りたい方は、「教師あり学習と教師なし学習の違いとは（Supervised vs. Unsupervised Learning: What's the Difference?）」をご覧ください。

強化機械学習

強化機械学習は、教師あり学習に似た機械学習モデルですが、アルゴリズムはサンプル・データを使ってトレーニングされません。このモデルは、試行錯誤しながら学習していきます。一連の成功事例が強化され、特定の問題に対する最善の提言や方針が策定されます。

Jeopardy!で優勝したIBM® Watsonシステム2011年のチャレンジがその好例です。このシステムは強化学習を使用して、いつ回答（または質問）を試みるべきか、ボード上のどのマスを選択するべきか、特にデイリーダブルでいくら賭けるべきかを学習しました。

強化学習の詳細はこちら

一般的な機械学習アルゴリズム

多くの機械学習アルゴリズムが一般的に使用されており、次のようなものがあります。

ニューラル・ネットワーク
線形回帰
ロジスティック回帰
クラスタリング
決定木
ランダム・フォレスト

ニューラル・ネットワーク

ニューラル・ネットワークは、膨大な数の処理ノードがリンクされているため、人間の脳の働きをシミュレートします。ニューラル・ネットワークはパターン認識に優れており、自然言語翻訳、画像認識、音声認識、画像作成などのアプリケーションで重要な役割を果たします。

線形回帰

このアルゴリズムは、異なる値間の線形関係に基づいて数値を予測するために使用されます。たとえば、この技術を使用して、その地域の過去のデータに基づいて住宅価格を予測することができます。

ロジスティック回帰

この教師あり学習アルゴリズムは、質問に対する「はい／いいえ」の答えのようなカテゴリー応答変数の予測を行います。スパムの分類や生産ラインの品質管理などの用途に活用できます。

クラスタリング

クラスタリング・アルゴリズムは教師なし学習を使ってデータのパターンを特定し、それをグループ化できます。コンピューターは、人間が見落としたデータ項目間の違いを特定することでデータサイエンティストを支援できます。

決定木

決定木（デシジョン・ツリー）は、数値の予測 (回帰問題) とデータのカテゴリー分類の両方に使用できます。決定木は、樹形図で表すことができる、リンクされた意思決定の分岐シーケンスを使用します。決定木の利点の1つは、ニューラル・ネットワークのブラックボックスとは異なり、検証と監査が容易であることです。

ランダム・フォレスト

ランダム・フォレストでは、機械学習アルゴリズムが多数の決定木の結果を組み合わせて、値またはカテゴリを予測します。

機械学習アルゴリズムの長所と短所

予算、必要な速度と精度のニーズに応じて、各アルゴリズムの種類（教師あり、教師なし、半教師あり、強化）にはそれぞれ長所と短所があります。たとえば、決定木アルゴリズムは、数値の予測（回帰問題）とデータのカテゴリー分類の両方に使用されます。決定木は、樹形図で表すことができる、リンクされた意思決定の分岐シーケンスを使用します。決定木の主な利点は、ニューラル・ネットワークよりも検証と監査が容易であることです。欠点は、他の決定予測因子よりも不安定になる可能性があることです。

全体として、機械学習には、企業が新たな効率化のために活用できる多くの利点があります。そのような利点には、人間がまったく気付かない可能性のある膨大な量のデータ内のパターンや傾向を識別する機械学習があります。また、この分析には人間の介入はほとんど必要なく、関心のあるデータセットを入力し、機械学習システムに独自のアルゴリズムを組み立てて改良させるだけで、時間の経過とともにより多くのデータ入力によって継続的に改善されます。お客様とユーザーは、モデルがその人との経験ごとにより多くのことを学習するため、よりパーソナライズされたエクスペリエンスを享受できます。

欠点としては、機械学習には、正確で偏りのない大規模なトレーニング・データセットが必要になることです。GIGOは、ガベージイン/ガベージアウト（ごみを入れたらゴミが出てくる）という有効因子です。十分なデータを収集し、そのデータを実行するのに十分な堅牢性を備えたシステムを持つことも、リソースの浪費になる可能性があります。また、機械学習は、インプットによっては誤りが生じやすい場合があります。サンプルが小さすぎると、完全に間違っているかミスリードを生じさせる完全に論理的なアルゴリズムが生成される可能性があります。予算の無駄遣いや顧客の不満を避けるため、組織はアウトプットの信頼性が高い場合にのみ、その回答に基づいて行動すべきです。

現実世界における機械学習のユースケース

ここでは、日常的に遭遇する可能性のある機械学習の例をいくつかご紹介します。

音声認識：自動音声認識（ASR）、コンピュータ音声認識、または音声テキスト変換とも呼ばれ、自然言語処理（NLP）を使用して人間の音声を書面形式に変換する機能です。多くのモバイル・デバイスは、Siriなどの音声検索を実行したり、テキストメッセージのアクセシビリティを向上させるために、音声認識をシステムに組み込んでいます。

カスタマー・サービス：オンライン・チャットボットは、カスタマー・ジャーニーでの人間のエージェントに取って代わり、Webサイトやソーシャル・メディア・プラットフォーム全体での顧客エンゲージメントに対する考え方を変えています。チャットボットは、配送などのトピックに関するよくある質問（FAQ）に答えたり、ユーザーに合わせたアドバイス、製品のクロスセル、サイズの提案を提供したりします。たとえば、eコマース・サイトのバーチャル・エージェント、SlackやFacebook Messengerを使用したメッセージング・ボット、通常はバーチャル・アシスタントや音声アシスタントによって実行されるタスクなどがあります。

コンピューター・ビジョン：このAIテクノロジーにより、コンピューターはデジタル画像、ビデオ、その他の視覚入力から意味のある情報を抽出し、適切なアクションを実行できるようになります。畳み込みニューラル・ネットワークを活用したコンピューター・ビジョンは、ソーシャル・メディアでの写真のタグ付け、医療での放射線画像処理、自動車業界での自動運転車などに応用されています。

レコメンデーション・エンジン：AI アルゴリズムは、過去の消費行動データを使用して、より効果的なクロスセル戦略の開発に使用できるデータ傾向を発見するのに役立ちます。レコメンデーション・エンジンは、オンライン小売業者がチェックアウトの過程で顧客に適切な商品を推薦するために使用されます。

ロボティック・プロセス・オートメーション（RPA）：ソフトウェア・ロボティクスとしても知られるRPAは、インテリジェントな自動化テクノロジーを使用して、反復的な手作業を実行します。

自動株式取引：株式ポートフォリオを最適化するように設計された AI 主導の高頻度取引プラットフォームは、人間の介入なしで 1 日に数千、さらには数百万の取引を実行します。

不正アクセス検知：銀行やその他の金融機関は機械学習を使用して疑わしい取引を見つけることができます。教師あり学習では、既知の不正取引に関する情報を使用してモデルをトレーニングできます。異常検出は、異常に見え、詳細な調査に値する取引を特定できます。

機械学習の課題

機械学習テクノロジーが発展するにつれて、私たちの生活は確かに楽になりました。しかし、機械学習を企業に導入すると、AIテクノロジーに関する倫理的な懸念も数多く生じます。以下に例を挙げます。

技術的特異点

このテーマは世間の注目を集めていますが、多くの研究者は、近い将来にAIが人間の知能を超えるという考えには関心がありません。技術的特異点は、強力なAIまたは超知性とも呼ばれます。哲学者のNick Bostrumは、超知性を「科学的創造性、一般常識、社会的スキルなど、事実上あらゆる分野で最高の人間の脳を大幅に上回る知性」と定義しています。超知性が社会に差し迫ったものではないという事実にもかかわらず、自動運転車のような自律システムの使用を考えるとき、超知性の考え方はいくつかの興味深い疑問を提起します。無人運転車が事故を起こさないと考えるのは非現実的ですが、そのような状況では誰が責任を負うのでしょうか。それでも自動運転車を開発すべきでしょうか、それともこのテクノロジーを人々の安全な運転を支援する半自動運転車に限定すべきでしょうか。これについてはまだ結論が出ていませんが、新しい革新的なAIテクノロジーの発展に伴い、この種の倫理的議論が起こっています。

AIが雇用に与える影響

人工知能に対する一般的なイメージは、雇用の減少が中心となっていますが、このような懸念は見直すべきでしょう。破壊的創造をもたらす新しいテクノロジーが登場するたびに、特定の職務に対する市場の需要が変化していることがわかります。たとえば、自動車業界に目を向けると、GMなど多くのメーカーが、環境への取り組みに合わせて電気自動車の生産に注力するよう移行しています。エネルギー産業は消滅しませんが、エネルギー源は燃料経済から電気へ移行しつつあります。

同様に、人工知能によって仕事の需要は他の分野にシフトするでしょう。AIシステムの管理を支援する人が必要になります。カスタマー・サービスなど、求人需要の変化の影響を最も受けやすい業界では、より複雑な問題に対処する人材が今後も必要となるでしょう。人工知能とその雇用市場への影響に関する最大の課題は、需要の高い新しい役割に人々が移行できるようにすることです。

プライバシー

プライバシーは、データ・プライバシー、データ保護、およびデータ・セキュリティの関連で議論される傾向があります。プライバシーにまつわるこのような懸念から、近年、政策立案者はより一段の進歩を遂げることができました。たとえば、2016年には、欧州連合と欧州経済地域の人々の個人データを保護するためのGDPR法が制定され、個人がデータをより細かく管理できるようになりました。米国では、2018年に導入されたカリフォルニア州消費者プライバシー法（CCPA）などの政策が各州によって策定されており、企業はデータ収集について消費者に通知することが義務付けられています。このような法律により、企業は個人を特定できる情報（PII）の保存方法と使用方法を再考せざるを得なくなりました。その結果、企業は監視、ハッキング、サイバー攻撃の脆弱性や機会を排除しようと努めており、セキュリティーへの投資の優先順位が高まっています。

偏見と差別

多くの機械学習システムにおける偏見や差別の事例により、人工知能の使用に関する多くの倫理的問題が提起されています。トレーニング・データ自体が偏った人間のプロセスによって生成される可能性がある場合、偏見や差別からどのように保護できるでしょうか？企業は通常、善意をもって自動化に取り組んでいますが、ロイター通信（ibm.com外部のリンク）は、採用業務にAIを取り入れることで生じる予期せぬ結果のいくつかを取り上げています。Amazonは、プロセスを自動化し簡素化する取り組みの中で、技術職の求職者に対して意図せず性別による差別を行ってしまい、最終的にプロジェクトを中止せざるを得なくなってしまいました。Harvard Business Review（ibm.com外部のリンク）は、役職の候補者を評価する際にどのようなデータを使用可能にすべきかなど、採用業務におけるAIの使用についてほかのも鋭い疑問を提起しています。

偏見や差別は人事部門に限ったことではなく、顔認識ソフトウェアからソーシャル・メディア・アルゴリズムまで、さまざまなアプリケーションで見つかります。

企業がAIのリスクをより認識するようになるにつれて、AIの倫理と価値に関する議論もより活発になっています。たとえば、IBMは汎用の顔認識および分析製品を廃止しました。IBMのCEO、Arvind Krishnaは、「IBMは、他のベンダーが提供する顔認識技術を含むいかなる技術も、大量監視、人種プロファイリング、基本的人権と自由の侵害、または当社の価値観や信頼と透明性の原則に合致しない目的に使用することに断固として反対し、容認しません」と書いています。

説明責任

AIの活用を規制する重要な法律がないため、倫理的なAIの活用を保証する実質的な強制メカニズムはありません。企業に倫理的な縛りを課す現在の動機は、非倫理的なAIシステムが最終利益に与える悪影響です。このギャップを埋めるために、倫理学者と研究者の協力の一環として、社会におけるAIモデルの構築と配布を管理するための倫理フレームワークが登場しました。しかし、現時点では、これらはあくまでもガイドに過ぎません。いくつかの調査（ibm.com外部のリンク）では、責任の分散と潜在的な結果への先見性の欠如が組み合わさることにより、社会を棄権にさらす可能性があることが示されています。

AI倫理に関するIBMの姿勢の詳細を読む

機械学習に適したAIプラットフォームの選び方

間違ったシステムを使用するとコストが上昇したり、他の貴重なツールやテクノロジーの使用が制限されたりする可能性があるため、プラットフォームの選択は難しくなる場合があります。AIプラットフォームを選択するために複数のベンダーを検討する場合、機能が多いほど優れたシステムであると考えがちです。確かにそうかもしれませんが、検討する担当者はまず、AIプラットフォームが組織に何をもたらすのかをよく考える必要があります。どのような機械学習機能を提供する必要があり、それを達成するためにはどのような機能が重要なのでしょうか？1つの機能が欠けていると、システム全体の有用性が損なわれる可能性があります。ここでは、考慮すべき機能をいくつか紹介します。

MLOpsの機能システムには次の機能が搭載されていますか。
- 管理を容易にするための統一されたインターフェース
- ローコードおよびノーコード機能を使用してモデルを迅速に作成するための自動機械学習ツール
- 最適化モデルの選択と展開を簡素化するための意思決定の最適化
- データとAIの統合スタジオ上で、ビジュアル・データサイエンスをオープンソース・ライブラリーやノートブック・ベースのインターフェースと組み合わせるためのビジュアル・モデリング
- 初心者がすぐに始められる自動開発と、より高度なデータサイエンティストが実験できる自動開発
- 実世界のデータがすぐに入手できない場合に使用する、実世界のデータの代替または補足としての合成データ生成
生成AI機能システムには次の機能が搭載されていますか。
- トレーニングされたデータに基づいてテキスト、画像、その他のコンテンツを生成できるコンテンツ生成機能
- 顧客の苦情を評価して分類したり、顧客のフィードバックの裏にある感情を分類したりするなど、書面によるインプットを読み取って分類するための自動分類
- 密集したテキストを高品質の要約に変換し、財務報告書から重要なポイントを取得し、会議の記録を生成できる要約生成機能
- 複雑な詳細を分類し、大きな文書から必要な情報をすばやく引き出すためのデータ抽出機能