Data Science and AI

ロボットが絵画する日 〜Vol.2 AI編〜

記事をシェアする:

第1回の概要+ロボティックス編に続き、今回はAI編をお届けします。

 

# ロボットアート・プロジェクトとは

「もし未来の世界でロボットが絵を描いているとしたら、どんな姿になるのだろう?」

ロボットアート・プロジェクトは、人間の画家のように筆を取り、色を混ぜて、絵を描く、そんなロボットのシステムを開発するプロジェクトです。いまは開発途中であり、最終的には自らテーマを考え、それを表現していく「創造する主体」を作ることが目標です。

オープンイノベーションの文脈を踏まえたコミュニティー活動であり、メンバーは日本IBMに限らず様々な会社や個人で構成されています。企画側の目標としては、国内外の美術館でのデモの展示を目指して活動しています。

3月中旬にはサウス・バイ・サウスウエスト (英語、外部ページ)という米国テキサス州で開催される大規模イベントにオンライン出展し、EngadgetやForbs、Liberty Timesなどの様々な海外メディアでも紹介されました。

 

図 ロボットの外観

ロボットの外観

 

# AIアルゴリズム

今回はロボットの頭脳にあたる部分を紹介します。現時点では、人が描くテーマを指定すると、AIは「もっともそのテーマらしい」と自身が判断するストロークの集まりを生成します。例えば、「カエル」というテーマを与えるとカエルを構成するストロークが生成されます。ポイントとして、ストロークで構成された画像は、既存の画像ではなくAIが生成した全くのオリジナルであることです。

過去のロボット画家にはランダムの描画であったり、既存の画像を絵として描くものがありましたが、ストロークで構成されたオリジナルの絵を実際に描くロボットは調査した限り他にはありません。

 

AIによって生成されたストロークの描画シミュレーション

AIによって生成されたストロークの描画シミュレーション

 

入力するテーマは様々なものが可能です。例えばホットドッグのような身近なものもあれば、迷路(Maze)のようなテーマもあります。AIにテーマの基となる画像のデータセット(=教師データ)を学習させることで、様々な作品を作ることが可能です。

1つのテーマを入力した際にAIが生成したストロークによって構成された画像

1つのテーマを入力した際にAIが生成したストロークによって構成された画像

 

創造は既知のモノの組み合わせから生まれる、と言われますが、このAIの特徴は複数のテーマを混ぜ合わることが可能な点です。例えばバナナとパイナップルを混ぜ合わせた絵を作成することができます。様々な異なる組み合わせにより、人にとって新たなインスピレーションに繋がる作品が生まれます。

2つのテーマを入力した際にAIが生成したストロークによって構成された画像

2つのテーマを入力した際にAIが生成したストロークによって構成された画像

 

これらの作品を作る実行環境はIBMのGPU搭載のPowerサーバーを利用しています。Powerサーバーは強力な処理能力が特徴であり、今回のような様々な実験が必要とされるAIプロジェクトにおいて、トライ・アンド・エラーの時間短縮に貢献します。

AIには様々なパラメータがあり、例えばストロークの数は30本~300本のように自由に指定ができます。興味深い点としては、少ないストローク数の時に描かれる絵はより抽象画になり、ストローク数が多い場合は具象画になります。

現時点では人間がテーマを与える必要があるため、ロボットが真に創造的とは言い難いのが実情です。今後は、ロボットが自らのモチベーションでテーマを選び、絵を描く「創造する主体」を目指していく予定です。

今回の記事でも前回に引き続きインタビュー形式を通して、メンバーの視点からプロジェクトの裏側もお見せできればと考えております。アルゴリズムの開発に携わっている邱さんと森國さん (外部ページ)にお話を伺いました。

 

# 描画AIアルゴリズム開発 邱さん

Q. 普段はどんなことをされているのでしょうか?
邱さん:大学の時では4足災害対応ロボットの制御ソフトウェアの開発に携わり、IBMに入社してからはGBS(グローバル・ビジネス・サービス)という組織でデータサイエンティストの仕事をしていました。機械学習、Pythonによるデータ分析の技術を駆使して、お客様のビジネスの課題を解決する仕事です。
これまでには、エンジニアとして携わった世界初の議事録スマート・スピーカーである「Integrated Spatial Assistant Console」はCES 2021 Innovation Award (英語、外部ページ)を受賞しました。
また、開発に貢献したカメラによる顧客動作・属性識別ソリューション(SHOPPER ANALYSIS USING AN ACCELERATION SENSOR AND IMAGING BACKGROUND)では特許を取得しています。
2021年04月よりIBM Research Tokyoに異動し、よりリサーチの分野に集中していきます。

Q. プロジェクトに参加したきっかけを教えてください。
邱さん:頼さんからロボットアート・プロジェクトのメンバー募集があり、面白そうであることかつ異なる分野での経験が詰めそうと思い参加いたしました。

Q. どんなことに取り組んでいたのでしょうか?
邱さん:ロボットアームが実際に描く際に物理的制約(ストロークの数、筆幅、色変えの数など)を考慮したアルゴリズム、複数テーマの絵を生成する実装を担当しています。

複数テーマ生成の開発初期のテスト出力

複数テーマ生成の開発初期のテスト出力

 

Q. 難しい部分はありますか?
邱さん:技術的な観点では、実際に絵を描くときの物理的な制限を考慮した上でのストローク生成が難しかったです。例えば、シミュレーション環境では数千本のストロークが簡単に描けますが、現実のロボットアームでは描く時間による制限がありストロークの数を多くできないことが挙げられます。他にも塗り重ねの回数の制限、筆の太さの制限といった、実環境ならでの課題がありました。
ワークロードの観点では、普段の業務で取り組んでいるプロジェクトもあるため時間を見つけて活動を両立させる部分が難しかったです。

Q. 参加して良かったと思う点はどちらですか?
邱さん:ロボットアートは新しい取り組みですので刺激を受ける点と、素晴らしいメンバーと共にチャレンジできる点だと思います。

 

# 描画AIアルゴリズム研究 森國さん

Q. 普段はどんなことをされているのでしょうか?
森國さん:私は早稲田大学大学院の工学研究科修士課程を修了した後、現在はIBM Research Tokyoで研究者として仕事しています。機械学習や深層学習の手法を活用して画像認識、異常検出、音声分析の分野での研究と開発に携わっています。

Q. プロジェクト参加を決めたきっかけはどこにありましたか?
森國さん:プロジェクトリーダーの頼さんから、IBM Research部門向けにロボットアート・プロジェクトを紹介するプレゼンテーションがありました。私のバックグラウンドもロボット工学であったため、プロジェクトのアイデアに興味を惹かれて、ワクワクしたため早速参加しました。

Q. これまで取り組んでこられたことはどういった領域ですか?
森國さん:私はシステムのストローク生成部分に取り組んできました。特に、シミュレーションと現実の描画の間のギャップを克服するために、効率的なストローク・プランニングと最適化方法の開発に取り組んでいます。

人物画を例にどのように現実の描画品質を上げるかのディスカッションメモ

人物画を例にどのように現実の描画品質を上げるかのディスカッションメモ

 

Q. 何が特に難しかったのでしょうか?
森國さん:ストロークによる描画アルゴリズムはこれまで複数の先行研究と進歩がありましたが、そのほとんどは、実世界と異なるグラフィカルエンジンまたはカスタムレンダラーで実装されてきました。例えば、シミュレーション環境内では、色の切り替え、重色、数千のストロークによる描画が簡単に行われます。しかし、実世界のロボットがそうするのは難しいだけでなく、湿り、滴り、混ざり合いなど、シミュレーションでは考慮されていない他の物理的要因が多くあります。

Q. 参加して良かったと思う点はなんでしょうか?
森國さん:私は機械学習/深層学習の分野に関わり始めた時に、同時に強化学習にも興味がありました。このプロジェクトでは強化学習を実験する機会がある点が良かったです。刺激的でワクワクするサイドプロジェクトに参加できてとても幸運と思います。また、他のメンバーと出会い、人から学ぶことも素晴らしい経験です。

 

# 終わりに

さて、AI編いかがでしたでしょうか。
次回はアート/SXSWレポート編になります。お楽しみに!

 

<執筆者>

 

 

邱 昊翔 / Haoxiang Qiu
IBM Research – Tokyo

 

 

 

 

森國 秀 / Shu Morikuni
IBM Research – Tokyo
LinkedIn (外部ページ)

 

 

 

頼 伊汝 / Yiru Lai
日本IBM Technology

 

More Data Science and AI stories

IBM watsonx Assistantは生成AIでコンテンツを対話型の回答に変える

IBM Data and AI, IBM Watson Blog, 人工知能

watsonx Assistantは対話型検索を提供し、企業固有のコンテンツに基づいた対話型の回答を生成して、顧客や従業員の質問に対応します。対話型検索は生成AIを使用することで、人間の作成者が手作業で回答を書いたり更新 ...続きを読む


信頼できる AI の基盤: ガバナンスの効いたデータと AI、AI 倫理、およびオープンで多様なエコシステム

IBM Cloud Blog, IBM Data and AI, IBM Watson Blog...

2021年5月27日 By Kelly Churchill (英語)   世界中の企業が、AI への信頼構築が AI テクノロジーの幅広い導入への鍵となることに気付いています。企業は、AI への信頼と AI ア ...続きを読む


IBM Watsonで、データ、モデル、プロセスに対する信頼をどのように築くのか

IBM Cloud Blog, IBM Data and AI, IBM Watson Blog...

  2021年4月21日 By Seth Dobrin (英語) IBMの最高AI責任者として、私は組織と協力して、AIに対する包括的なアプローチを確実のものにする立場にあります。私たちは、企業のAI戦略立案、 ...続きを読む