Client Engineering

Kaggle形式分析コンペ @日立 協創の森から(データサイエンティスト技術交流会)

記事をシェアする:

「悔しい…。最初は軽い気持ちで参加したけれど、やっぱりコンペが始まったらすっかり本気になっていた。次の機会に絶対リベンジしたい!」

「レベル高すぎますよ! これで勝てないなんて…。まあでも、普段とはまったく違うやり方を体験できたのは、自分の今後のキャリアにも良い影響を与えてくれると思います。」

「合格発表を待っているような気分だったけど、自分たちが優勝との発表を聞いて一気に疲れが吹き飛びました。やったー!」

晴々しい顔と悔しげな顔が並ぶ、表彰式後の競技会参加者たち。左より山口 武彦(IBM)、渡邉 理沙(日立)、Melvin Tah Kok Wai(IBM)、諸橋 政幸(日立)、細野 友基(IBM)、田村 孝(IBM)、幸左 絵美(日立)、奥田 太郎(日立)、八幡 晃一郎(日立)、岡田 拓也(IBM)、胡 鑫龍(IBM)、田中 聡一朗(日立)(敬称略)

 

あなたがデータサイエンスに興味を持っていれば、おそらくは「Kaggle(カグル)」というAIコンペティション(競技会)、あるいはデータ分析のプラットフォームの名前は聞いたことがあるだろう。もしかしたら、すでにユーザー登録を済ませこれまでに何度か競技会に参加しているかも。いやひょっとしたら、世界ランキングに名を連ねているという人も中にはいるかも…?

なにしろ、Kaggleは世界で最も有名で、登録ユーザー数もすでに1000万人は優に超えているという、世界最大のAI競技会プラットフォームだ。

 

そのKaggleと同様の分析コンペティション形式を用いた、日立製作所と日本IBMの技術交流会が、日立の研究開発拠点「協創の森」で先日行われた。

2社の本格的な技術交流会は今回がまだ2回目で、「両社が共に学び合うこと」を目的としていることから、今回は直接的な「日立vs IBM」という形式を避け、両社から2名ずつ、計4名からなるデータサイエンティストとデータ・エンジニアから成る3つのチームの対抗戦として約7時間のスプリント競技会の形式で実施された。

実行準備チーム内では「混成チームとしてしまうと和気あいあいとし過ぎてしまうのではないか。勝負に身が入らないのでは技術交流にならないのではないか?」という声もあったというが、冒頭で紹介した声をお読みいただけば、それが懸念であったことは明らかだろう。

黙々と作業に取り組むデータスペシャリストたち

実際の分析コンペティションは、以下の要領で行われた。

 

Kaggle形式分析コンペ課題概要

インターネットに接続され、サイバーフィジカルシステム(CPS)を実装する、浄水工場に対してのサイバー攻撃判別システムの構築。具体的には下記3要件を満たすモデルの構築。

  1. サイバー攻撃をリアルタイム判別
  2. 複数種類の攻撃について発生検知
  3. サイバー攻撃の種類を判別できる

 

上記課題にあるCPSとは、「物理世界(フィジカル空間)で収集されたビッグデータを、仮想世界(サイバー空間)に蓄積して分析・予測・分類などを行い、物理世界へフィードバックして活用・価値創造を行う」こと。そして今回の「サイバー攻撃判別モデル」作成に使用されるデータは、研究用に収集されたものだ。

そしてこの課題の真の目的は「より安全・堅牢なCPSの実現」に貢献することだ。課題の「浄水工場」は一例であり、自動運転や交通機関の運行最適化など、実社会においてCPS実装が暮らしの中のさまざまな場面で進む中、「より安全・堅牢なCPSの実現」が意味するのは「より安全・堅牢な現実世界」に他ならない。

「悪意ある攻撃の迅速な検知・判別」は、以下観点から私たちの日常生活を守るのである。

  1. サイバー攻撃をリアルタイム判別 → 攻撃を即座に判別し、社会への影響を未然に防ぐ
  2. 複数種類の攻撃について発生検知 → 多様な攻撃についても判別できる
  3. サイバー攻撃の種類を判別できる → アラートを受けた管理者の適切な判断を支援する

 

Kaggle形式分析コンペの様子と最終結果

「それでは皆さん、作業をスタートしてください。」

今回のコンペティションにおけるルールや使用できるデータ種別や取り扱い可能範囲など、攻撃判別モデル構築上のレギュレーション説明の後、上記の掛け声でスプリント競技会はスタートした。

合計12名のデータスペシャリストたちは、3チームそれぞれがチーム戦略とその進め方について言葉を交わし手短に打ち合わせを行うと、すぐに作業を進めていった。

午後、昼食もそこそこに、すぐにモデリング作業を再開するメンバーたち

 

スプリントの多くの時間が黙々と作業に充てられる中、時おりどよめきや歓声が上がる。それは決まって、それぞれのチームがその時点におけるサイバー攻撃判別モデルを途中経過として提出し、それが採点されスコアとともにチームの順位が発表されるときだ。

「えー、どうしてこれしか精度が上がらないんだ!?」

「やっぱりオーバーフィッティングだったってことだよね、この結果は。」

「きたーっ!」

一通りの盛り上がりの後、すぐにチームは作業へと戻っていく。

 

予測結果提出と採点スコア表示が何度か繰り返されながら、各チームはモデル精度向上施策を積み上げていき、ついにワーク終了と最終提出期限の17時となった。

そして最終順位が発表され、表彰式、優勝チームによる解法発表、交流会総評の言葉でこの日の共創イベントは幕を閉じた。

表彰式でメダルを授与されるチームBの4名

 

参加者&主催チームのコメント

ここからは、表彰式前後に聞いた参加者の声とランダムに、そして今回の日立製作所と日本IBMの技術交流会を企画したチームの言葉を紹介する。

 

参加者Aさん(IBM): 私が参加しているIBMのプロジェクトでは、データサイエンティストは1〜2名ということが多いんです。なので今日のように、こうして4人でチームを組み、それぞれのアプローチや取り組み方の違いを直接目にして会話できる機会はとても貴重だし、なによりも楽しかったです!

 

参加者Bさん(日立): 私はAさんと逆で、参画しているプロジェクトにデータサイエンティストが多数いて、自分の役割がはっきりしないと感じることもあったんです。でも今回、役割分担を明確にして取り組むことの意義と強みを明確に感じることができました。この経験は業務にも活かせそうです。

 

参加者Cさん(IBM): 別の会社のデータサイエンティストと一緒に分析作業を行うことなんてめったにないことで、それ自体が貴重な経験でした。今回は短期決戦でしたが今後はもう少し長い期間でのコンペにして、より多面的な戦術とそれを可能にする深いコミュニケーションが取れたらもっと良い技術研鑽になりそうな気もしています。とはいえ、今日の経験はモチベーションアップに間違いなくつながりましたね。またこういう機会があれば参加したいです!

 

参加者Dさん(日立): 普段、限られた顔ぶれの中で仕事をしていると、どうしても「常識が狭くなっていく」感覚がありました。そんな中で新しい人たちと新しいアプローチで共同作業をすることが、自分の世界が拡がるのを感じました。またキャリアについても、自社内で考えたり相談したりするだけではなく、今後は「仲間」として社外の人にも相談できるようになりました。これは自分にとってはとても心強いことです。

 

企画チームEさん(IBM): 一口に「データサイエンティスト」と言っても、人それぞれでその強みは異なります。そしてまた、IBMには出身国や業務経験が多様なデータサイエンティストが揃っており、それもあってアプローチの取り方も本当に多様です。その多様性が自分たちの個性であり強みであることを、参加者は今日それを改めて実感できたんじゃないかと思います。また、次回が楽しみです。

 

企画チームFさん(日立): 日立グループには数千人のデータサイエンティストがいますが、それでもグループの全社員数から見れば、まだまだマイノリティであり、社内におけるプレゼンスを上げていく必要があると感じています。今日のような取り組みが社内外に伝わっていくことで、「社会課題解決」にデータサイエンティストがどれだけ重要な役割を担っているか、それをもっと知ってもらえるといいですね。

 


最後に、今回の企画の後援者である日本IBM テクノロジー事業本部 クライアント・エンジニアリンング事業部担当 執行役員 村澤 賢一のメッセージを紹介する。今後同様の企画に興味をお持ちの方は、ぜひご連絡いただきたい。

 

交流会の企画自体も今日の課題設定も、本当にとても良かった。参加者関係者すべての人にとってよい1日になったのではないでしょうか。

現代に残された社会課題の多くは、業界内外を問わずに手をつなぎ共創していかなくては取り組めない規模となっています。その中でも、データサイエンティストは「OT」と呼ばれる現場の設備・機器からのデータを、「IT」のど真ん中で受け止め、柔らかくつなぎ合わせていく実践者たちであり、彼らの活躍がそのまま社会生活の質としなやかさに直結するものです。

今日は、私たちIBM Client Engineering事業部のデータサイエンティストたちが日立様の胸をお借りさせていただき、とても良い経験ができました。そして今後も、日立様との2社間に閉じることなく、共に正面から社会課題に立ち向かおうという同じ志を持つ企業の方たちと、より広く強く柔軟に手をつないでいきたいと考えています。技術交流や研鑽会にご興味をお持ちの方にはぜひお気軽に連絡いただきたいですね。

自作のキャンディツリーを手に参加者の激励に現れたIBM執行役員の村澤

懇親会にて「最大の功労者!」「いよっMVP!」というチームメンバーからのはやし声に応える、日立の幸左さん

 

TEXT 八木橋パチ

問い合わせ情報

この記事を読んだあなたへのおすすめ

塚脇和生: シニアリーダーこそ率先して価値観を変えていくべき(前編) | #1 Unlock

Automotive 2030:2030年 自動車業界の将来展望

Automotive 2030:2030年 自動車業界の将来展望

More Client Engineering stories

法務・AIリスクのスペシャリスト三保友賀が語る「ダイバーシティ」 | インサイド・PwDA+7(後編)

Data Science and AI, IBM Sustainability Software

日本IBMにて法務、特にAI倫理・リスクのスペシャリストとして、そして同時にLGBTQ+コミュニティー*1やPwDAコミュニティー*2のアライとして積極的に活動している三保友賀さんにお話を伺いました。 前編での法務・AI ...続きを読む


ジェネレートするAI。クリエートする人類 。 | Think Lab Tokyo 宇宙の旅(THE TRIP)

IBM Data and AI, IBM Partner Ecosystem, IBM Sustainability Software

その日、船長ジェフ・ミルズと副船長COSMIC LAB(コズミック・ラブ)は、新宿・歌舞伎町にいた。「THE TRIP -Enter The Black Hole-」(以下、「THE TRIP」)と名付けられた13度目の ...続きを読む


法務・AIリスクのスペシャリスト三保友賀が語る「ダイバーシティ」 | インサイド・PwDA+7(前編)

Data Science and AI, IBM Sustainability Software

日本IBMにて法務、特にAI倫理・リスクのスペシャリストとして、そして同時にLGBTQ+コミュニティー*1やPwDAコミュニティー*2のアライとして積極的に活動している三保友賀さんにお話を伺いました。 <もくじ> 企業内 ...続きを読む