T
THINK Watson

最強のチームはAIが作る!? Watsonの性格分析ツール開発秘話

post_thumb

取材・文:阿部欽一、写真:佐坂和也


ビジネスにおける「データ」の重要性が高まる今、企業は顧客をより深く理解し、一人ひとりに最適な対応が求められるようになってきている。IBMでは、顧客の属性や行動履歴などとは別の切り口で顧客を知るための取り組みとして「IBM Watson(以下、Watson)」のAPIの一つ「IBM Watson Personality Insights」(以下、Personality Insights)」を公開している。
これは、文章を解析して書き手の性格(パーソナリティー)を推定するもので、職業や地位とは異なる「その人に固有の、持続的な感情面の傾向、性質」を導き出すことができる。Personality Insightsがビジネスへの活用においてどんな可能性を秘めているのか。日本語版Personality Insightsの研究開発に取り組む東京基礎研究所の那須川哲哉氏と上條浩一氏に話を聞いた。

 

日本アイ・ビー・エム株式会社 東京基礎研究所 主席研究員の那須川哲哉氏と、同東京基礎研究所の上條浩一氏

日本アイ・ビー・エム株式会社 東京基礎研究所 主席研究員の那須川哲哉氏(右)、同東京基礎研究所の上條浩一氏(左)

 

文章の特徴に、その人の性格が反映される

──「Personality Insights」の日本語化にあたり、お二人が担った役割について教えてください。

那須川:Personality Insightsは、テキストから性格を推定するWatsonのAPIで、現在は英語、スペイン語、アラビア語、日本語に対応しています。IBMに入社以来携わってきた自然言語処理の研究の経験をベースに、2015年8月頃から開始された日本語化のプロジェクトで、主に自然言語処理の領域の研究に参画しました。

上條:主にデジタルコンテンツやIoTに関する研究などに携わってきました。本プロジェクトでは、言語処理領域は那須川さんで、私は主に統計に基づく分析モデルの開発に取り組みました。

──Personality Insightsは「ソーシャルメディアへの書き込みや、フリーテキストから書き手の性格特性を推定するシステム」とありますが、具体的には「性格特性」としてどのような内容が推定されるのでしょうか?

那須川:大別すると3タイプあり、まずは「Personality(性格・個性)」です。これは、心理学の分野で世界的なスタンダードとなっている「ビックファイブ」と呼ばれる指標を使います。具体的には、「好奇心の強さ(Openness to experience)」「勤勉さ(Conscientiousness)」「外交的(Extraversion)」「人当たりの良さ(Agreeableness)」「繊細さ(Neuroticism)」という5つの軸で性格を推定します。

ビッグファイブのほか、ビジネス領域で役に立つ指標として「Needs(欲求)」に関する12の評価軸、「Values(価値観)」に関する5つの評価軸も導入し、何を求める傾向にあるか、何に価値を見出す傾向にあるかを推定しています。

一般的に「性格分析」と聞いてイメージするのは、いわゆる「人相学」や「骨相学」「血液型性格分類」などが代表的なものだったと思います。しかし、これらはすべて、統計的には「根拠がない」ということが明らかになっています。その点、Personality Insightsは、統計に基づく科学的なアプローチで性格を分析しようとする取り組みだと位置づけることができます。

──なぜ、テキストからその人の性格が分かるのでしょうか?

那須川:上述したビッグファイブで捉える内容は、いわばその人が「持って生まれた」特徴で、環境によって大きく変わることが無いようです。このビッグファイブという世界標準の指標が確立された結果、性格に関する研究が科学的に行えるようになりました。

性格分析について語るIBM那須川哲哉氏

ビッグファイブの測定には、いわゆる心理テストを用います。「人生を楽しんでいる」「他人にあまり興味がない」などの質問項目に対して、「当てはまる」「まったく当てはまらない」などの5段階で回答していくものです。こうした心理テストを通じて測定されたビッグファイブの結果と、その人が書いた文章の特徴に相関関係があることが、10年くらい前からさまざまな研究で明らかになってきたんです。

──つまり「文章の特徴に、その人の性格が反映される」ということでしょうか?

那須川:そうです。特に興味深いのが、その人が「何について書いているか」ではなく「どんな書き方をするか」という特徴が性格特性と結びついているということです。

私たちはどんな特徴要素が性格と相関関係にあるかを明らかにするため、日本語の特徴要素を90ほどのカテゴリーに分類しました。分類に際しては、英語をはじめとして多様な言語で実績のある「LIWC(Linguistic Inquiry and Word Count)」という言葉の分類体系をベースに、日本語に特有の要素を加えました。LIWCで考慮するのは、大きく分けると4タイプの特徴です。

1つ目は「言語的特徴」です。例えば、代名詞をどの程度使うか。さらに、代名詞の中でも一人称の表現である「自分」や「私」を多用するのか、あるいは「お前」や「あなた」といった二人称なのか、「あいつ」や「彼」などの三人称なのかを考慮します。また「否定形」をよく使うか、「同意の表現」が多いかといった特徴を見ていきます。

2つ目は「心理作用」です。同じ事象であっても、それをポジティブに表現するか、ネガティブに表現するか、「見る」や「聞く」という知覚プロセスを表現するかなどです。

3つ目は「相対性」。具体的には未来志向なのか過去志向なのか、あるいは空間を認識する際に「上」に着目するか、「下」に着目するかといった点です。そして、4つ目は「関心の対象」です。これは、よく言及する話題が仕事か、勉強か、趣味か、あるいは宗教か、といったことです。

これらをベースに、さらに日本語特有の要素として、助詞の使い方、字種(漢字、ひらがな、カタカナ、アルファベット)などを考慮に入れ、関西大学社会学部心理学専攻教授の北村英哉先生の協力のもと、全部で約90カテゴリーを整備しました。そして、これらのカテゴリーの使用頻度と、その人の性格の相関関係を分析するモデルを構築したのです。

 

「僕」を多用しがちな人は好奇心が強い。開発を通じて得られた知見とは?

──分析モデルの構築で難しかったのはどんなところでしょうか?

那須川:最も大変だったのが、データの収集です。解析に必要なテキストは、少なくとも3,500単語、理想的には6,000単語以上と見積もっていました。そこで、Twitterユーザーに性格診断アンケートに協力して欲しいと呼びかけました。そして、アンケートの回答とともに、回答者の許諾を得てツイートのデータを収集、蓄積し、ツイートのテキストから、上述した各表現カテゴリーの表現がどの程度の頻度で出現するかという割合と、性格診断結果との相関を分析し、テキストから性格を推定することにつなげていきました。

──どの程度のデータ量から、分析モデルを開発しましたか?

上條:当初は、300人〜500人くらいのサンプル量で開発をスタートしました。日本語版のリリース時には、6000人〜7000人のデータがあり、現在はもっと多いデータが集まっています。

分析アルゴリズムは、アンケートの回答結果を正解データとして、回答者のツイートデータを学習モデルで分析し、予測値と正解データとの誤差から学習モデルを更新していく機械学習のアルゴリズムです。例えば、「外向性の高い人は、一人称を使いやすい」などのように、カテゴリーの内容と回答者の性格の相関関係を回帰分析していきます。

そして、相関のあるカテゴリーの変数が正解データに近づくように「重みづけ」をします。この「重みづけ」ができると、その後はアンケートを取らなくても(新たに正解データを入力しなくても)書き手のテキストのみから、ある程度の誤差の範囲内で相関性を分析し、性格が推定できるようになるのです。

分析モデル構築について語るIBM上條浩一氏

──データがどんどん蓄積されていけば、分析結果の誤差も少なくなり、精度が上がる?

上條:そうですね。最初の300ユーザーは、IBMの社員を中心に協力してもらいました。そのため、年齢層はTwitterユーザーの年齢分布に比べると高い傾向にありましたが、その後、一般公開を経て、2016年9月時点で1630人のアンケートデータが集まりました。結果、若い層が増加したことで、データを取得した年齢層もTwitterユーザーの年齢分布に近づいていきました。

データを取得した年齢層が偏ってしまうと、導き出される診断結果も変化していきます。今後もデータが増えることで学習モデル自体が更新されていくため、分析結果が変わっていく可能性はあります。つまり、同じデータを分析しても、昨日と今日とでは結果が変わる可能性があるということです。

──研究、開発の過程で得られた知見や発見には、どんなものがありましたか?

那須川:あるタイプの言葉が多く含まれていると「外向性が高い」などのように、日本語の特徴要素と性格特性の相関が可視化されていくことで得られた発見が数多く存在します。今回の分析によって初めて分かったということが多く、協力してくださった北村先生も、例えば、性格と助詞の相関関係が高いことに驚いていました。

具体的には、Twitterのアカウントを複数持っている人がいます。俗に「裏アカウント」などと呼ばれていますが、裏アカウントは趣味専用というように、投稿内容や発信者のキャラクターまで変えている人がいます。しかし、ある人の通常アカウントと裏アカウントをPersonality Insightsで分析してみたところ、どちらもほぼ同じ性格という診断結果が導き出されました。

──投稿内容や言葉遣いが異なっても、性格分析的には同じ結果が出るということでしょうか?

那須川:そうです。特に、言葉遣いについては、今回の分析モデルとして構築した特徴要素の90カテゴリーの中に、「敬語」や「丁寧語」「乱暴な言葉遣い」という要素を入れていないため、例えば敬語を使うように意識して書き直しても結果は変わらないだろうと思います。また、地域による言葉の表現の違いなども、特徴要素の分布には反映されないだろうと考えています。テキストから性格を分析する際、重要な材料となるのは助詞や否定形の使い方などですので、どのような内容が書いてあるかよりも、どう書いてあるかで分析結果が決まってくるということです。

──ほかに、研究の過程で得られた知見や発見はありますか?

那須川:代表的なところでは、例えば、「僕」を多用しがちな人は好奇心が強い傾向があり、「ひらがな」を多用する人は比較的おおざっぱな傾向が強いことなども面白い発見の一つです。また「格助詞」を多用する人は、冷静で、繊細で、好奇心が高い傾向があるという発見もありました。

 

性格を科学的に分析するアプローチで、新たな驚きや発見を提供

──Personality Insightsのビジネスへの活用については、どんなことが考えられますか?

那須川:個人的には、性格が似ている人というのは、相性がいいという実感があります。また、あくまで性格を元に判断するため、人種、国籍を問わずにビジネスパートナーや営業担当者などをマッチングするサービスや、チームビルディングなどの人材活用という面で可能性があると考えています。チームを組織する際は、多様性を重視して、あえて価値観の違うメンバーを組み入れるという使い方もできます。

──これまで勘や経験で分類、推定していたものを、よりデータに基づいて科学的に行えるようになるのですね。

上條:カナダの大学で、修士、博士課程へ進む学生とアドバイザーの教授とのマッチングに活用している事例もあります。また、人のマッチングだけでなく、モノとのマッチングも可能です。例えば、こういう性格の人は、こういう商品を好むというような結果から買い物のアドバイスを送ったり、顧客にパーソナライズされた効果的なアプローチ方法を考えたりという活用法も考えられます。

──今の「データ活用」マーケティングは、顧客属性や行動履歴をベースに次の行動を予測するものですが、これをより多角的に、精度を高く提示できるかもしれないと。

上條:性格は、持続的で環境によって変わることはありません。そこをうまく活用して、より効率性が高く、効果の高いマーケティングができるかもしれません。米国ではパーソナライズされたショッピングの推奨、健康管理に関するアドバイザーなど、主にマーケティングやマッチングでの先進事例があります。

那須川:日本でも、技術者向けの人材派遣事業を手がける会社が、Watsonとの対話を通じて集めたテキストから技術者の性格を推定し、適切な仕事、案件を紹介するマッチングサービスをスタートさせました。

──最後に、今後のPersonality Insightsの可能性についてお聞かせください。

上條:今は英語、スペイン語、アラビア語、日本語に対応していますが、これをワールドワイドに言語に関係なく使えるようにしたいです。そして、「性格分析」は「占い」などの類ではなく、統計的に根拠のあるものだという理解が広がっていき、ロボットなどの技術と組み合わせ、高齢化などの社会課題の解決に貢献するようなイノベーションを起こしていきたいです。

那須川:Personality Insightsは、これまで勘や経験で行っていたことを、より効率化したり、新たな付加価値を生み出したりするデジタル変革の一翼を担うテクノロジーだと考えています。性格分析を科学的なアプローチで行うことが当たり前の世の中になって、新たな驚きや発見を提供していけるように、さらに発展させていきたいですね。

IBM Alert Notification
スタッフがすべての重大な IT アラートの通知を受け取ることができます
無料評価版はこちら