S
Smarter Business

1→10のサイバーボッチャを支える「愛」あるAIが、社会を変える

post_thumb

取材・文:五十嵐 大、写真:山﨑美津留

五輪開催を2年後に控え、ある課題解決に向けてまい進する企業がある。株式会社ワントゥーテン(以下、1→10)。現在、彼らが注力しているのは、パラスポーツを周知し、エンターテインメントとして知ってもらう取り組みだ。

2018年6月11日に開催された「Think Japan IBM Code Day」で、同社は「サイバーウィル」「サイバーボッチャ voice support edition(仮称)」という2つのサイバースポーツの体験ブースを出展し、大きな話題を集めた。

取り組みの根底にあるのは、パラスポーツが置かれている現状への危機感。その問題に対するアプローチとして、AIをどのように昇華させているのか。同社の代表取締役であり、東京オリンピック・パラリンピック競技大会組織委員会のアドバイザーも務める澤邊芳明氏(ワントゥーテン)をはじめ、プロデューサーの川副信雄氏(ワントゥーテンデザイン)、UXライターの牧 詩織氏(ワントゥーテンロボティクス)、エンジニアの飯塚正幸氏(ワントゥーテンデザイン)の4名に話を伺った。

 

パラスポーツをエンターテインメントで盛り上げたい

――サイバーウィルやサイバーボッチャなど、パラスポーツにテクノロジーを掛け合わせようと思ったきっかけについて教えてください。

澤邊 最初にアイデアとして生まれたのが、「サイバーボッチャ」でした。着想自体は3年ほど前から持っていて、具体的にビジョンが見えてきたのは2年前です。

私は18歳で怪我して、20歳頃までリハビリをつづけていました。その中で、サイバーボッチャの元となる「ボッチャ」というパラスポーツを体験する機会があったんです。ジャックボールと呼ばれる目標球に向けて、赤・青のボールを投げ合い、いかに近づけられるかを競うスポーツで、実際にプレイしていただくとわかるのですが純粋に面白く、エンターテインメントとして可能性を秘めていると直感しました。

その後、起業し、会社がテクノロジーとクリエイティブを主な事業として成長を遂げるなかで、ボッチャでなにかできないかとアイデアを温めていたのです。

1→10代表取締役の澤邊芳明氏

1→10代表取締役の澤邊芳明氏

――ボッチャが着想のきっかけだったのですね。

澤邊 そもそも、パラスポーツというものはカテゴリー分けも複雑で、一体どんな競技があるのか知られていません。理解を得られても共感が得られないから、試合会場に人が集まらないのです。私は、そんな状況を打破して、先進国としてもっとパラスポーツを盛り上げていきたい。そこで浮かんだのが、パラスポーツにテクノロジーを掛け合わせて、子どもから大人まで、どんな人でも楽しめる「パラスポーツエンターテインメント」を生み出すことでした。

キーワードは、パラスポーツの「ナイトエンターテインメント」化です。お酒を飲みながらダーツやビリヤードに興じるように、もっとカジュアルにパラスポーツを楽しめる状況をつくれないかと考えています。その流れでサイバーウィルが生まれ、その後、サイバーボッチャが実現しました。

サイバーウィル

サイバースポーツの第1弾として発表した「サイバーウィル」は、ヘッドマウントディスプレイを装着し、VRで近未来の東京を駆け抜ける

――「サイバーボッチャ voice support edition(仮称)」がそなえる「アナウンス」と「ヘルパー」機能について教えてください。

川副 ボッチャは、プレイヤーが投げたボールの距離の計測にメジャーとコンパスが使われるのですが、そうしたアナログ的な部分をデジタル技術で自動的に計測できるようにしたのがサイバーボッチャです。

「アナウンス」機能は、視覚障がいがある人でもサイバーボッチャのゲーム進行を理解できるよう、voice support edition(仮称)として音声による「実況機能」を追加したものです。さらに試行錯誤するなかで、例えば「左に1歩、前に3歩進んだ位置をイメージして、投球してください」などという風に、視覚障がい者もゲームに参加できる音声サポートを搭載すれば、サイバーボッチャは一層ユニバーサルなスポーツになるのではないかと「ヘルパー」機能を開発しました。

1→10プロデューサーの川副信雄氏

1→10プロデューサーの川副信雄氏

――音声による実況機能を搭載するにあたって、工夫した点を教えてください。

川副 「アナウンス」と「ヘルパー」機能を行う「サイバーボッチャ voice support edition(仮称)」にIBM WatsonのAPIを使っているのですが、AIを使ってゲームの戦局をどのように発話させるかに苦心しました。具体的には、「Speech to Text (STT)」で発話内容を認識させ、「Watson Assistant」を活用して返答する内容を決めて、「Text to Speech (TTS))を使って音声で返答するという仕組みになっています。

また、サイバーボッチャの発話機能には、画像認識機能も活用しています。プレイヤーの目の前にあるスクリーンには、頭上から撮影したコート上の状況が随時投影されているのですが、そこから読み取れる戦局データを音声に変換できないかと考えました。白、赤、青のボールを認識させ、それぞれのボールがある座標のデータを取り、そのデータを音声に変換するという流れです。

バーのような暗所でもシステムがボール位置を的確に把握できるよう照射される白い光は、「ゲーム演出」としての効果も

バーのような暗所でもシステムがボール位置を的確に把握できるよう照射される白い光は、「ゲーム演出」としての効果も

 

人間にとって、AIはどんな存在であるべきか

――発話機能で使われるAIの「キャラクター性」にもこだわりがあるとお聞きしました。

 AIの音声アナウンスはどうしても機械的で、ロボット感が強くなりがちです。私たちは、発話機能を持つAIがプレイヤーにとって「親しみやすい存在」であってほしいと考え、キャラクター(性格)付けを行いました。イメージとしてはホテルのコンシェルジュのように、的確な実況にお茶目さもプラスして、プレイヤーと一緒に楽しんだり喜んだりするようなキャラクターにしました。

具体的には、声の高さや速さを変えることで発話に抑揚を付けて、感情が感じられるようにしました。このような仕様が実現できたのは、Watson APIのTTSで「SSML」という音声合成のためのマークアップ言語を用いて発話をチューニングできたことが大きいです。

1→10 UXライターの牧 詩織氏

1→10 UXライターの牧 詩織氏

川副 一般的に、現在のAIはこうした感情面には配慮されないケースがまだまだ多いです。しかし、弊社には「ワントゥーテンロボティクス」というAIやロボットの会話に特化したチームがいて、これまでに蓄積されたノウハウを生かせました。

 当初のサイバーボッチャではいかにもロボットという印象を受けるアナウンスも検討していましたが、やっぱり一緒に盛り上がった方が楽しいのではないかと考えて、感情豊かで人間らしいキャラクターを目指して開発を進めました。

澤邊 もう少しファンキーなキャラクターでも良かったくらいだね(笑)。

川副 ナイトエンターテインメントとして開発しましたしね(笑)。それに加えて、ゲームの戦局をどう理解して発話させるのかという「会話制御エンジン」の部分にも、大変な苦労がありました。

――具体的にどのような苦労があったのですか?

飯塚 ボッチャは、ゲームが始まったシーン、対戦するチームが先攻後攻を選んでいるシーンなど、想定されるいくつかの戦局があります。機械学習で戦局をどのように捉えさせるのかが難しかったです。最初は想像していたよりもエラーが多くて、人力で調整しつつ、なるべく早くテスト環境に持っていけるように尽力しました。

1→10エンジニアの飯塚正幸氏

1→10エンジニアの飯塚正幸氏

川副 会話制御エンジンを作り上げるには、通常は基礎構築だけで2カ月くらいかかるんですが、サイバーボッチャについてはかなりアジャイルな開発だったと思います。まずは音声データだけを作って、翌週にはシステムを組み込んで、その次の週には完全に統合してという流れで進めていきました。

飯塚 会話制御エンジンのメインとなる部分は1週間くらいでできあがって、完成までにかかったのはトータルで4週間くらいだったと記憶しています。

――「Think Japan IBM Code Day」で「サイバーボッチャ」の展示も行われましたが、どのような反応がありましたか?

川副 みなさんボッチャを楽しむというよりも「新しいナイトスポーツ」を楽しんでいるという印象でしたね。

飯塚 セッション後のパーティーのときは、お酒を飲みながら盛り上がっていましたよね。

澤邊 やはり、音声による実況があるのとないのとでは盛り上がりが違う。実況がないとゲームとして面白くても、どうしても地味な印象になってしまう。voice support edition(仮称)は障がいの有無に関わらずゲームに参加できるだけでなく、ゲーム自体を盛り上げる要因にもなっているのもポイントですね。

取材チームもゲームを体験。光と音がゲームを絶妙に盛り上げる

取材チームもゲームを体験。光と音がゲームを絶妙に盛り上げる

 

「愛」あるAIが、社会を変える

――本プロジェクトを通して、AIが障がいのある人たちの生活をどのように変えていくと感じていますか?

澤邊 IBMが研究・開発に取り組んでいる「視覚アシスト技術」(画像認識によって目の前の状況を解析し、音声でアナウンスする技術。参考記事はこちら)は、視覚障がい者に対する大きな可能性を秘めた技術だと確信しています。いわば、AIが盲導犬の代わりにもなり得るのです。

また、視覚障がい者は単なる視覚情報だけでなく、感情に訴えかけるような情報も求めている。たとえば「前方から40歳の男性が歩いてきました」と説明されるよりも、「前方から40歳の男性が笑顔で歩いてきました」という方がより情報としての価値は高いですし、そうした情報を提供できれば、より豊かな生き方ができるはず。

こうしたサポートをAIが進歩して行えるようになれば、次のイノベーションが起こると考えています。

川副 まさにIBMはAIを「Augmented Intelligence(拡張知性)」だと提唱していますが、それと同じように、AIが人の捉える情報をさらに拡張させるイメージですよね。

澤邊 あえてカッコよく言葉にするなら、AIにも「愛」が必要ってことだよね(笑)。

「愛」あるAIが、社会を変える

 チャットボットを例にとるとわかりやすいのですが、ツールとのやりとりはまだまだ楽しいものではありません。だから、情報を機械的にアウトプットするだけのAIに感情を持たせることができれば、友人との会話のように楽しいものに変わると思うんです。

澤邊 人工知能は、特定の課題に対する最適解をいち早く答えるものです。たとえば、カーナビは目的地までの最短ルートを教えてくれるシステムですが、目的地に向かうまでに寄り道したいと考えるのもまた人間です。AIには、今後そうした情緒が求められるようになるのではないでしょうか。

――最後に、2020年に向けて今後の展望を教えてください。

澤邊 いろいろな意味で、この2年間が勝負だと考えています。日常生活の中に溶け込ませ、パラスポーツ体験を広く提供したい。それができればパラスポーツがエンターテインメントになって、世界的にもっと評価されるはず。その結果、2020年以降もずっと愛されるカルチャーのひとつになるのではないかと思っています。