IBM Research

IBM Molecule Generation Experience(MolGX)新たなマテリアル・デザインをAIとハイブリッドクラウドで高速化

記事をシェアする:

過去数十年を振り返ってみると、化学は有用な新材料の発見について大きな成果を上げてきました。ポリマーの分野だけを見ても、熱可塑性プラスチックや構造ポリマーに関する最近の発展は、新しい塗料や衣料繊維、写真フィルムといった多くの用途に多大な影響を与えています。こうした例からも、化学が日々の生活に欠かせない材料にどれだけ貢献しているかが示されています。

新たな材料の発見は、工業製品の発展や進歩の原動力になっています。組織工学、創薬、地球に優しいサステナブル材料の発見などの領域において、まだ発見されていない化合物は無数に存在しています。しかし、化合物空間―すなわちあらゆる材料構造の設計の組み合わせの可能性は極めて広大なので、人間の専門家ではそのごく一部分さえ探索し尽くすことができません。化合物空間とは、とりわけ化学者ならば名前を聞くだけで怖気づくほどのものなのです。

しかし人工知能(AI)が、化合物空間に秘められた無限の可能性への扉を開いてくれるとしたらどうでしょう?これは、東京基礎研究所に所属する筆者とその研究チーム(濱利行、徐祥瀚、岸本章宏)が、新たな分子構造のデザイン・プロセスの自動化手法を発見する試みに乗り出した際、自分たち自身に行った問いかけでした。私たちはIBM Molecule Generation Experience(MolGX)を発表しました。これはIBM Cloudを基盤とするAIを活用した分子逆設計プラットフォームで、新たな分子構造を迅速かつ多様に自動でデザインします。「逆設計」により、目標特性を持ち得る材料のデザインを試みます。

MolGXはIBMのAccelerated discovery strategy(発見を加速させる戦略)の一つで、この戦略はAI、ハイブリッドクラウド、自動化、そしてゆくゆくは量子コンピューティングで科学の方法論を強化することを目指しています。MolGXの目標は新材料の発見スピードを10倍から100倍、あるいはそれ以上に高めることです。

加速する発見の図

分子の構造と特性の列挙された構造化データは、IBM Deep Searchにより抽出され、AIを使ったシミュレーションにより補完された後、MolGXに統合されて生成AIのトレーニングに使われます。MolGXは、分子の線形表記をBrCCOC1OCCCC1のような文字列で表現するSMILES記法(simplified molecular-input line-entry system)をサポートしています。MolGXで生成された候補分子は、化学反応や逆合成経路を予測するIBM RXN for Chemistry、およびロボットで化学合成を自動化するIBM RoboRXNに受け渡すことができます。

開発手法に革新をもたらす

新たな材料の開発は、追求する問題の性質や研究の手法に応じてさまざまな道筋をたどります。新たな材料発見のブレイクスルーは純然たる偶然、トライ・アンド・エラー、既存システムからの類推によるデザインなどによってもたらされてきました。こうした方法論もこれまで大いに役立ってきた一方で、現在は新材料に関する課題、要件、需要、問題がより複雑になってきています。私たちがパンデミックや気候変動といったグローバルな問題に直面する中、新しい医薬品や材料のデザインや開発を分子スケールから巨視的スケールの最終製品までをとても速く達成することについて、ますます必要性と緊急性が高まりつつあります。

私たちがMolGXの開発で目指したのは、最先端の分子生成AIモデル技術を通じて分子の逆設計を加速することでした。皆さんも、実在しない風景や人物画のリアルなイメージを描けるAIエンジンについて耳にしたことがあるかもしれません。それらは生成モデルと呼ばれますが、この技術を私たちは架空のものを作り出すのに使うのではなく「水溶性」や「熱しやすさ」といった必要な化学特性をもつ分子を自動生成することに応用しました。この自動生成は「データセットの観察と選択」「化学特性を予測するAIモデルの学習」「学習したモデルをベースとした分子構造の設計」というシンプルな3つのステップで達成されます。

私たちは日本IBMの東京ラボGarageチーム(古郷誠、本江巧、藤枝久美子)と協力することで、MolGXをIBM Cloudで大人数のアクセスに対して拡張可能にし、一般ユーザーを想定した分かりやすいユーザー・インターフェースを開発しました。高度なITスキルを持たない方を含め、基本的にはどのような方でも、AIの基本を学びながら最先端のマテリアル・インフォマティクスを体験できるようになっています。

また私たちは、化学の専門家や産業応用向けのプロフェッショナル・バージョンも作成しました。このバージョンは、結果のエクスポート、モデリングのカスタマイズ、データのアップロードといった実用的な多くの機能が追加されており、組み込みのデータセット以外での材料探索を行うことができます。

MolGXは開発手法に革新をもたらすことで、新材料の開発期間を短縮し、固定観念にとらわれない新材料のイノベーションを可能にします。

デザイン・エクスペリエンスを加速する

このAIを活用した分子逆設計のプラットフォームはすでに展開が始まっていて、材料を製造している企業でテストされています。その一社であるIBMでは、これを新しい光酸発生剤の開発に応用しました。光酸発生剤は電子機器製造の分野における重要な材料です。

このプラットフォームは主に3つのメリットを企業に提供します。まず、データ駆動ではなくアルゴリズムベースのエンコーディングと構造生成プロセスを特徴とするため、大規模なデータセットの事前トレーニングは必要とされず、そのタスクに伴う多大なトレーニングコストも不要です。次に、特徴空間・構造の生成プロセスなどが人間の化学者にとって完全に解釈可能であるため、分子構造についての化学的な知見を容易に導入することができます。最後に、階層的なデータ構造と明瞭なUIにより、柔軟かつ直感的なワークフローが提供されます。

MolGXのプロフェッショナル・バージョン[*1]は追加機能を持ち、すでに長瀬産業株式会社が提供するサービス「TABRASA(タブラサ)」として展開され、長瀬産業株式会社が保守・管理するIBMのクラウド環境で稼働しています。糖分子や色素分子の逆設計は、人間の化学者のパフォーマンスと比べて数十倍以上の速度で実行されました。さらに、化学的合理性を損なわずに分子構造の多様性を拡張することもできました。

このように加速されたスピードでどれだけの新たな材料を発見でき、どれだけの問題が解決できるか、想像してください。グローバルな問題に対処するための新たな材料の発見は、持続可能な未来の実現に向けた方策の1つとなります。例えば、二酸化炭素を速やかに吸収できる特性を持っていたり、エネルギーをロスすることなく太陽光を電力に変換できたりする新たな材料を生み出せるかもしれません。材料の特性は、それを構成する分子の形状によって決まりますが、分子の形状にはほとんど無限のパターンがあるため、新たな材料の開発には少しも無駄にできないほどの膨大な時間がかかります。MolGXはAIとハイブリッドクラウドを利用して、よりスピードとコスト効率に優れた方法でマテリアル・デザインを最適化できるテクノロジーであり、昨今はこのようなテクノロジーへの需要が高まっています。私たちが開発したプラットフォームは、環境や社会に多大なインパクトを与える革新的材料の発見がAIと最先端のデータ処理テクノロジーによってどのように加速されるかを示す、絶好の例と言えます。

現在、MolGXの無料体験版は組み込みのデータセットを使って利用できます。IBM リサーチはデータのアップロード、結果のエクスポート、モデリングのカスタマイズといった追加機能を含む無制限のプロフェッショナル・バージョンもライセンス付きで提供しています。

[*1] Takeda S., Hama T., Hsu H. et al.
Molecular Inverse-Design Platform for Material Industries.
KDD ’20: Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, August 2020 Pages 2961–2969


※このBlogは、原文「IBM Molecule Generation Experience: Supercharging new materials design with AI and Hybrid Cloud」の抄訳です。

武田 征士
著者:武田 征士
東京基礎研究所 マテリアル・ディスカバリー プロジェクト・リーダー
More IBM Research stories
2021年4月13日

ウイルスの設計図を解明せよ!――IBM Research 新型コロナウイルスのゲノム変異解析への挑戦

新型コロナウイルス感染症(COVID-19)の流行開始から1年。時間の経過とともに、ウイルスのゲノムは新たな変異を蓄えて進化を続けています。最近では、変異株に関する報道を目にする機会も多くなりました。ゲノムとは遺伝子(g […]

さらに読む

2021年2月18日

ガジェットをより持続可能なものにする材料の発見をIBMが推進

ここにも、あそこにも。原子はあらゆるところに存在します。 原子が多いほど分子は複雑になり、実現可能な分子構成はほぼ無限大に見えます。つまり、材料発見には長い時間と費用、手間のかかる試行錯誤のプロセスが必要で、しかも成功は […]

さらに読む