Open for Data フォーラム

原田 博植 氏 インタビューPart3:データサイエンスの“勘所”とは何かどこまで要件定義を徹底したかが成否を分ける

記事をシェアする:

原田 博植 氏
株式会社グラフ 代表取締役社長CEO/株式会社CAMPFIRE 執行役員CIO/社団法人丸の内アナリティクス 代表理事

シンクタンク、外資ITベンチャー、リクルートにて、アナリストとして、データ分析を基軸とした事業推進に従事。データサイエンス組織を立ち上げ、多事業のマネタイズに貢献。2014年に業界団体「丸の内アナリティクス」を設立し主宰。2015年10月にデータサイエンティスト・オブ・ザ・イヤーを受賞。早稲田大学創造理工学部招聘教授。現在は経済産業省の「第四次産業革命に向けた競争政策の在り方に関する研究会」の委員を務める。

データサイエンスのノウハウはビジネス現場の“ぶつかり稽古”で磨かれる

――丸の内アナリティクス、そして株式会社グラフと原田さんの幅広い活動を伺ってきました。今回はさらに内容を掘り下げて、原田さんの考えるデータサイエンスの“勘所”についてお話を聞かせていただければと思っています。早速ですが、昨今のデータサイエンスに関して感じておられるトレンドの変化のようなものはありますか。
 
原田 大いにあります。たとえば企業が収集するデータ量は、ビッグデータが叫ばれ始めた頃よりさらに爆発的に増えつつあります。IoTのセンシング・データに代表されるように、リアルとバーチャルの両方の世界から大量のデータが流入してきます。

では、そうした大量のデータをどう扱っていくのか――。私たち自身もデータサイエンスというきれいな言葉を使っていますが、実際には“ぶつかり稽古”とでも言うような泥臭い取り組みの繰り返しとなります。要はビジネスの現場でどんなデータに接してきたかという経験によって、ノウハウやアルゴリズムも磨かれていきます。その意味で丸の内アナリティクスは事例を共有することを重視していますし、グラフでもできるだけ多くのお客様の課題に対応していきたいと考えています。

ディープ・ラーニングの適用事例に見るプロジェクト成功のポイントとは

 
――机上で理論を研究するだけではデータサイエンスは成り立たないわけですね。その意味ではディープ・ラーニングのような新しい技術も、ビジネスの現場で積極的に実践していく必要があるのでしょうね。
 
原田 そのとおりです。ディープ・ラーニングについては、すでにグラフとして携わっているさまざまなお客様案件でも活用しています。
 
――可能な範囲でけっこうですので、事例を紹介していただけますか。
 
原田 たとえば旅行関係のお客様案件では、旅程表に記された内容を分解し、そのパーツをもとに、旅行客に対してより良いエクスペリエンスを提供するための支援を行いました。詳しい内容はお話しできませんが、さまざまなメディアのWebサイトとAPI連携し、得られた膨大な関連コンテンツに対してテキスト・マイニングを行うことで、旅行客が望んでいると思われる情報を抽出して提供します。また、このシステムは旅行中のその人の行動をずっと追いかけており、たとえば観光名所の写真を撮ったなら、ディープ・ラーニングの学習モデルを適用して即座に言語化(メタデータ化)し、位置情報と紐づけておすすめの周辺施設やお土産を案内するなど、タイムリーなレコメンドを行います。
 
――成功要因はどこにあったのでしょうか。
 
原田 この事例に限ったものではなく、端的に言えばあらゆるデータサイエンスの成否は、要件定義が事前にどこまで厳密にできていたかで決まると考えています。繰り返しますが、私たちが携わっているデータサイエンスはアカデミズムの研究開発ではなく、あくまでもお客様の課題ありきで始まります。

目的を達成するために、たとえばカマで草刈りするのか、それともクワで土を掘り起こすのか、極端なことを言えばお客様にとって途中の手段は何でもかまいません。より重要なのは、どれくらいのスピードで結果を得られるのか、そのノウハウを一般化して社内で共有できるのかといったことです。ディープ・ラーニングにしても、テキスト・マイニングにしても、そういう冷静な目で見て判断する必要があります。

どこにどんなテクノロジーを活用するのが適切なのか、お客様の側で見極めることはできませんので、すべての責任をデータサイエンティストが背負うという覚悟を持って案件に臨まなければなりません。要件定義が大切と申し上げたのは、そういう意味です。

さまざまなテクノロジーに対して謙虚な姿勢を持つことが大切

――データサイエンスの勘所が非常によく理解できました。そうしたデータサイエンスのプロフェッショナルを目指す方に向けて、何か参考になりそうな書籍などがあれば、ぜひご紹介いただけないでしょうか。
 
原田 データサイエンスのスキルアップに直接役立つ教科書というわけではありませんが、個人的にとても興味深く読んだ書籍として、マット・リドレーの『赤の女王―性とヒトの進化』や『やわらかな遺伝子』をおすすめしたいと思います。
『赤の女王―性とヒトの進化』は、人間とは何か、人間はいかに進化してきたのかを、進化生物学に基づいて答えを探っていくもの。『やわらかな遺伝子』は、ゲノム解析が進むにつれ、明らかになってきた遺伝子のはたらきを解き明かすものです。
 
――原田さんが興味を持たれたのは、どんなところですか。
 
原田 これは予てより実感を伴って主張していることですが、遺伝子とは40億年もの歴史を経て情報を蓄積し、最適化されてきたデータベースだと感じています。それに比べるとディープ・ラーニングをはじめとするAIも、産業革命以降のたかだか百数十年で確立された技術の延長線上にあるコンピューターとアルゴリズムでしかありません。遺伝子の中には、まだ人類にとって未知の本能や直感のようなものが隠匿されているとすれば、そのようなものに現在のAIで太刀打ちできるはずがありません。私たちがやらなければならないのは、少しでもそこに近づくための努力です。そういったことに思いを馳せていると、自ずとテクノロジーに対して謙虚になれるのではないでしょうか。
 
――なるほど。データサイエンティストもともすればテクノロジーに振り回されがちになるだけに、ときに謙虚さを取り戻すことは大切なポイントですね。多くの示唆に富んだお話をありがとうございました。
 

 

More Open for Data フォーラム stories

身近な疑問をヒモトク#05-コロナ禍の教育現場。データでリモート授業をサポートできないか?

Data Science and AI, SPSS Modeler ヒモトク, アナリティクス...

みなさん、こんにちは。AITの西村です。 今回はMicrosoft Teams for Educationのログを利用した教育現場への活用方法についてご紹介します。 学校ではオンライン授業も一般的になりました。対面に比べ ...続きを読む


ブログで学ぶSPSS_Modeler #05- LightGBMや地図表示!拡張ノードでPythonやRの機能を取り込む

Data Science and AI, SPSS Modeler ヒモトク, アナリティクス...

    みなさん、こんにちは。IBMの河田です。SPSSやWatson Studioのテクニカル・セールスをしています。   さて今回は、Modelerの中でPythonやRを使うことができ ...続きを読む


SPSS Modeler の歩き方 2022 春〜データ活用のためのガイドブック〜

Data Science and AI, SPSS Modeler ヒモトク, アナリティクス...

みなさんこんにちは。IBMの京田です。 SPSS Modelerの快適な旅をお楽しみいただくためのツアーガイドを担当します!   2022年の旅程表 本年も春と秋にユーザーイベントを実施します。加えて毎月目的別 ...続きを読む