AI

AIの1年を振り返って:IBM ResearchによるAI関連の論文および未来予測を紹介

記事をシェアする:

Dario Gil

著者:Dario Gil
COO and VP of AI and Quantum, IBM Research

IBM Researchは70年以上にわたって、未来を創出し、探求し、思い描いてきました。人工知能(AI)という分野が生まれて以来、私たちはその領域を切り拓き続けてきました。かの有名な1956年のダートマス会議でこの分野が発足したとき、私たちはその場所に立っていたのです。それからわずか3年後、草創期のコンピューターのパイオニアであり、IBMの一員でもあったアーサー・サミュエル(Arthur Samuel)が、機械学習という用語を創り出しました。それ以来、私たちが常に目を向けてきたのは、この分野が次に行き着く先であり、また私たちがどうやってそこに到達するのかということでした。

本日、私たちは2018年を振り返り、AIの未来をプレビューするためのページを公開しました。ここでは、IBM Researchによって今年公開されたAI関連の論文を100本選んで紹介しています。これらの論文を執筆したのは、IBM Researchの世界12か所の研究所に所属する、才能豊かな研究者および科学者たちです。ここで見られる科学的な進展は、今後求められる一連の基本的なAI技術を発明するという使命を私たちが果たす上で、中心的な役割を担っています。これらのAI技術は、今日の「狭い」AIの時代から、新しい「広い」AIの時代に私たちを導いてくれます。AIの開発者、導入企業、エンドユーザーの間で、AI技術の可能性を解き放つことができるのは、その新時代においてなのです。広いAIは、さまざまな課題において、より広範な学習と推論を行い、様々なモダリティや領域の情報を統合する能力を持つと同時に、説明可能性、安全性、公平性、監査性、拡張性が向上しているという特徴を有するでしょう。

ここでは、今年の研究の一部を3つの領域から紹介します。その3つとは、AIの進展、AIのスケーラビリティー、そしてAIへの信頼です。その後、焦点を未来に合わせ、将来の予測もいくつかご紹介します。

AIの進展

  • IBM Research AIのプロジェクト・ディベートの画像人の発言を真に理解するAIIBM Research のAIチームは議論的な内容に対する聴解機能の実現を発表しました。IBM Researchの研究であるProject Debaterから生まれたこの機能は、音声を理解するAIの現在の機能を拡張し、質問応答という単純な課題を越えて、人間が議論を行っている場面で機械がそれをよりよく理解できるようにしています。
  • 1を聞いて10を知る:今日のAI手法は多くの場合、画像認識モデルを正確にトレーニングするために、数千から数百万のラベル付きイメージを必要とします。IBM Research のAIチームは新しく「few-shot learning(少ない学習データ数による学習手法)」を開発しました。この手法では、新しいオブジェクトをたった1つのサンプルから正確に認識することができ、追加のデータやラベル付けは必要ありません。この機能により、データに制約のある領域に向けたAIの適用可能性が広がります。
  • 生徒が教師役になる:3人寄れば文殊の知恵とは言いますが、AIエージェントも2つ集まれば良い結果が生まれるようになりました。IBMの研究者チームは今年、このタイプとして初となるフレームワークとアルゴリズムを発表し、互いに教え合うための学習を行って、1つのチームとして作業にあたるAIエージェントを実現しました。知識を交換することで、エージェントは以前の手法と比べ学習時間を大幅に短縮でき、一部のケースにおいては、既存の手法が上手くいかない箇所でも、学習によって連携することが可能です。
  • 質問応答:IBM Research のAIチームはオープンドメインの質問応答(QA)手法を大幅に強化し、その詳細を公表しました。そこで用いられたのは、より正確な解答を提示するために、多数の文章でエビデンスの再ランク付けと集約を行う新手法です。研究チームは、公開されているオープンドメインの質問応答データセット上で、それまで最先端であった手法を大きく改良することに成功しました。

AIへの信頼

  • バイアスの排除に向けた研究AIシステムは、意思決定支援に用いられることが多くなっていますが、公正かつ公平であることが不可欠です。しかし、AIシステムの学習に用いられるデータは、統計的学習手法が収集・要約した社会や組織固有のバイアスおよび相関を含んでいることが多いため、バイアスの排除は容易ではありません。IBM Research のAIチームは、バイアスの排除に向けた新たなアプローチとして、学習されるAIアルゴリズムのバイアスを可能な限り削減するように学習データを変換するという方法を概説しました。この手法を2つの大規模パブリック・データセットに適用したところ、システムの精度をあまり低下させることなく不要な集団差別を大幅に減らすことができました。
  • 「ブラック・ボックス」の打破:ディープ・ニューラル・ネットワークは、いろいろな意味でブラック・ボックスです。たとえネットワークが正しい決定に達するとしても、その決定が下された理由が理解しがたいことがよくあります。この説明可能性の本来的な欠如は、AIシステムに対するユーザーの信頼を阻む障壁となるほか、潜在的故障モードの推論を困難にさせます。こうした問題に対処するために、IBM Research のAI科学者たちはProfWeightという新しい機械学習方法論を開発しました。これは、ディープ・ネットワークを精査し、元のネットワークと類似した性能を達成できる単純なモデルを構築するというものです。この単純なモデルは、複雑さを削減することで、元のネットワークの仕組みや特定の決定に至った理由についての知見を提供することができます。この方法論を2つの大規模データセットでテストしたところ、ProfWeightモデルは高いレベルの精度を維持しながら説明が付きやすい決定に達することができました。
  • 敵対的攻撃の予測:現在最先端とされている機械学習モデルは、かつてないほどの予測精度を達成することができますが、「敵対的サンプル」と呼ばれる綿密に計算された悪意のある入力には驚くほどだまされやすいという弱点もあります。例えば、ハッカーが気付かれないように画像を改変し、それによってディープ・ラーニング・モデルをだまして、攻撃者が望むカテゴリーに画像を分類させることが可能です。この種の新たな攻撃は、音声認識から自然言語処理までのさまざまなタスクにわたって日々開発されています。これらの攻撃からの防衛に向けた重要なステップとして、IBM Research のAIチームは攻撃に対するニューラル・ネットワークの頑強性の評価に使用することができる、攻撃に依存しない新しい頑強性評価基準「CLEVER」(Cross Lipschitz Extreme Value for nEtwork Robustness)を提案しました。CLEVERスコアは、ディープ・ネットワーク・モデルをだます攻撃を成功させるのに必要な最小の攻撃「強度」を評価し、それによってAIモデルのセキュリティーについての推論を容易にし、運用システムにおける攻撃の検知や防御に方向性を与えます。

AIのスケーラビリティー

  • 8bit精度が学習を加速:ディープ・ラーニング・モデルは極めて強力ですが、その学習には膨大な計算リソースが必要です。IBMは2015年、正確性を損なわずに16bit精度(より一般的に用いられている32bit精度の半分)でディープ・ラーニング・モデルの学習を行う方法について述べた、画期的な論文を発表しています。今回、IBMの研究者チームは初めて、ディープ・ラーニング・モデルをわずか8bitの精度で学習する機能を実現しました。しかも画像、音声、テキストといったAIデータセットの主要カテゴリーすべてにおいて、モデルの精度は完全に保たれています。これらの手法はディープ・ニューラル・ネットワーク向けの学習時間を今日の16bitシステムと比べて2~4倍短縮します。以前は、学習のための精度をこれ以上減らすのは不可能と見なされていましたが、私たちはこの8bitの学習プラットフォームが、何年か後には広く受け入れられる業界標準になるのではないかと考えています。
  • ニューラルネットに関するブロック上の新手法:層が極めて深いニューラル・ネットワークにおける推論を加速する新手法BlockDropは、ディープ・ネットワークのどの層、すなわち「ブロック」を選んで省くべきか学習し、精度を保ちながら全体の計算量を減らします。BlockDropを利用すれば、平均20%の推論の高速化が実現でき、一部の入力に対してはこれが36%にまで達します。しかも、ImageNetでのTop-1 Accuracyは変わらずに保たれています。
  • デザインの省力化:IBMの研究者チームはニューラル・アーキテクチャーの新しい探索手法を開発しました。ニューラル・ネットワークのデザインに費やされる労力を削減するこの手法は、「ニューロセル」と呼ばれるニューラル・アーキテクチャーの反復的なパターンを定義します。「ニューロセル」は続いて進化的プロセスにより改善されます。この進化的プロセスは、画像分類タスクにおいて最高レベルの予測精度を達成するニューラル・アーキテクチャーをデザインすることができます。しかも、その際に人間の介入は必要ありません。一部のケースでは以前の手法に比べ、ニューラル・アーキテクチャーの探索で50,000倍の高速化が実現しています。

2018年は大きな前進が見られましたが、2019年もAI業界にはさらなる進歩がもたらされることがわかっています。以下は私たちが注目している3つのトレンドです。

  • 相関が因果関係へと代わっていく:夜明けの鶏の鳴き声は日の出の「原因」ではありませんが、スイッチをオンにすることは照明点灯の原因であることを、私達は誰もが知っています。私たちの日々の活動や判断には世界の因果構造に関するこうした直感力が不可欠ですが、現在のAI手法はそのほとんどが根本的に相関に基づいており、因果関係に対する深い理解が欠けています。新たな因果推論手法により、データから因果構造を推論し、介入を効率的に選択して推定上の因果関係を検証し、因果構造の知識を利用してより良い決定を行うことが可能になります。2019年は、因果モデリング手法がAI分野の主役として躍り出ることが予想されます。
  • 信頼できるAIが注目を集める:2018年は、多くの組織が倫理諮問委員会の設置により、情報漏洩や消費者のプライバシーに対する懸念に対応しました。また、「信頼の柱」(アルゴリズムの公正性、説明可能性、堅牢性、透明性)への研究投資が盛んになっているほか、社会的利益のためのAIの展開に向けた取り組みも増えています。2019年はこれらの努力がAI技術の開発、トレーニング、展開において中心的役割を果たすようになるでしょう。特に、この分野における研究の進歩を実際の製品やプラットフォームに生かすことに主眼を置きながら、さまざまな意見や視点によって技術の進歩を導くために、技術チームにおける多様性とインクルージョン(包含)の促進にも重点が置かれることが予想されます。
  • 量子コンピュータIBM Q量子がAIの助けになり得る:2019年は量子実験および量子研究の牽引に加え、量子コンピューティングがAIモデルの学習および実行において果たし得る役割についての新たな研究が加速することが予想されます。量子アルゴリズムの根幹は、制御可能なもつれと干渉による指数関数的に広大な量子状態空間の利用です。量子コンピューティングは、IBMがクラウドで提供する量子コンピューティング・サービスを通じてすでに数千の組織で利用されていますが、AI問題の複雑化が進むにつれて、AIの計算タスクに対するアプローチのあり方を変革する可能性を秘めています。

※この記事は米国時間2018年12月13日に掲載した ブログ(英語)の抄訳です。

More AI stories
2019年8月14日

清水エスパルスが“デジタル変革”でJリーグを制覇する日

デジタルのパワーを当たり前のように浴びた消費者は、一方でリアルな「体験」により価値を見出し始めた。ライブやスポ […]

さらに読む

2019年8月6日

「卓越したデリバリ」と呼ばれる組織が実践している、AI時代のプロジェクト品質管理

著者:吉田 裕美子 理事:Quality Leader、グローバル・ビジネス・サービス事業本部 私はQuali […]

さらに読む

2019年8月5日

IBM BlueHub 第6期スタート:過去採択2社に聞く、ITの巨人と事業を創出し、得たものとは?

IBM BlueHubは日本IBMが推進しているスタートアップとの共創プログラムです。テクノロジーとオープン・ […]

さらに読む