IBM Cloud Blog

AIとクラウドの透明性と信頼性を追求するIBM

記事をシェアする:

本記事は、日本アイ・ビー・エム 瀬川喜臣と安田智有によるSoftBank World 2019 講演「AI、クラウドの信頼性・透明性」の講演レポートです。


AIの信頼性・透明性

2019年7月18日、SoftBank World 2019の講演において、ソフトバンクグループの孫正義会長兼社長は、「日本はいつの間にかAI後進国になってしまった」と語りました。これは、AI懐疑派に言及する文脈での言葉ではありましたが、様々なメディアが「日本はAI後進国」との見出しで報じたので、ご覧になった方が多いと思われます。そして、日本のビジネス現場は、誰もが「AI活用が進んでいる」と同意できる進捗状況ではないことも事実だと思います。

AI活用を検討するにあたり最初に課題として挙げられるのが、検証やPoC(Proof of Concept : 概念実証)を実施する際に必要となる「AI活用のスキル」と「AIのための学習用データ」です。ただ、無事に検証やPoCを終えても、AIの本番業務への適用に踏み切れないことが課題となってきています。

講演するIBM瀬川の画像

日本IBM 瀬川喜臣

「AIの判定にバイアス(偏り)は無いか。差別的な判定をしていないか。これを問われたときに、説明できない場合があるのです。これが、AIを本番で使う段階の課題です」と、IBM Watsonのソリューション・アーキテクトである瀬川は語りました。

企業のミッション・クリティカルなアプリケーションでAIを活用する場合、AIの信頼性と透明性が担保されることが重要です。AIの判定に偏りが発生した時に、AIモデルを作成する際に用いた元のデータを精査することは簡単ではありません。そもそも、「誰」が「どのデータ」を使ってAIモデルを作ったのかがわからなくなっている場合も多いでしょう。

「この課題を解決するために、AIモデルの監視、バイアスの検出、トレーサビリティーの確保を一箇所で行えるWatson OpenScaleをIBMは提供しています」

そして、瀬川は、Watson OpenScaleとIBM Cloud Pak for Dataを用いて、「バイアスの可能性を発見」や「AIモデルの元となったデータの特定」、「類似データを用いた信頼性の確認」を、インドのヘルスケア企業であるiKureの事例で説明しました。

以下の画像は、「バイアスの可能性を発見」について、ダッシュボードにアラートが表示された例です。赤い点線で囲んであるAIモデルに不公平な判定がありそうだと指摘されました。
バイアスの可能性があるAIモデルをアラートで知らせている画面

 

次の画像は、左側で公平性を示す評価軸の値が低下している箇所を時間軸で特定。右側は詳細を確認した結果で、今回のアラートが、赤い点線で囲んである“High Risk”判定の割合が高いことについてのものであったことが判明しました。バイアスの可能性の発生タイミングを特定して詳細を確認する画面

 

「AIモデルの元となったデータの特定」を行っているのが、以下の画像です。画像を縮小しているので、数字が判別できない状態ですが、学習データの母数に著しい差があります。この母数の差が、公平性を欠いているとみなされました。AIモデルの元となったデータを特定している画面

 

以下の画像では、「類似データを用いた信頼性の確認」を行っています。AIモデルの元となったデータと類似したデータを探す。そして、GUIによるドラッグ&ドロップ操作でAIモデルのフローを修正し、類似データを用いた信頼性の検証を行った結果です。赤い点線で囲んである“High Risk”判定は、左右どちらも高めに出ました。

今回の場合、他のデータを試した場合でも同様の結果となったことから、AIが差別的な判定をしていないことが証明できました。よって、安心してこのAIのモデルを使い続ける、という決断ができました。

デモを終えた瀬川は、以下のように述べて講演を締めくくりました。
「AIモデルの監視、バイアスの検出、データの特定、類似データによる信頼性の確認、といった作業は、本来であれば、別々の場所に存在しているデータ、AIモデルを作成した担当者、AIモデルの作成で用いたツールを用いて行わなくてはなりません。しかし、全てが一箇所にまとまっていて一連の作業が行えるWatson OpenScaleを活用いただくことで、そのような課題は解消できます。外部に対する説明責任などの観点でAIの本番へのデプロイを躊躇していた皆様に、Watson OpenScaleを活用いただければと思います」

*本記事で紹介したWatson OpenScaleとCloud Pak for Dataのデモ説明映像が、Webセミナーポータル -Think Digital- (要、登録) でご覧いただけます。Webセミナーポータルにログイン後、Think Summit ゼネラル・セッション視聴をクリック。そして、遷移した画面で「開く」をクリックすると再生リストが開きます。その再生リストのうち、「IBMコーポレーション ゼネラル・マネージャー IBM Data and AI担当 ロブ・トーマス」の映像において、再生開始位置 17分9秒から約10分間が瀬川によるWatson OpenScaleとCloud Pak for Dataのデモ説明映像となります。

クラウドの信頼性・パフォーマンス

講演レポート『スポーツ・エンタテインメントのDXを支えるIBMの技術』でも言及されているように、新しいテクノロジーはクラウドで生まれ、新しいアプリケーションはインターネット上に公開されます。DDoS(分散型サービス妨害)攻撃に代表されるような多種多様な攻撃への対応とセキュリティーの確保が、クラウドに不可欠となっています。

インターネット側にサービスを露出すると、様々な攻撃の対象となります。IBMのクラウド・マイスターである安田は次のような例を紹介しました。

「10Gbpsのポートを持つWebサーバーに対して、どういうトランザクションや攻撃があったかをCloudflare(クラウドフレア)社が公開している資料で確認したところ、10Gbpsを超えるトランザクションが、NTP 攻撃やSSDP攻撃を含む様々な攻撃によって発生していました」

サイバー攻撃のボリュームを説明する図

画像左端の小さな円が、Webサーバーが持つポート性能 10Gbps。性能を遥かに超える攻撃が発生していることが分かります。

このような攻撃を防ぎ、自社サイトやサービスを守るためには、DDoSの防御や、WAF(Web Application Firewall)の導入、最新の暗号化方式の採用などが不可欠です。

「Webシステムのセキュリティ強化に関心がある皆様に、自信を持ってお勧めしているのが、IBM CloudのCloud Internet Services(以後、略称の CIS で記述)というサービスです」

例えば、WAFは、本来であれば設定が複雑ですが、CISであればIBM Cloudの管理ポータルのセキュリティーに関する設定画面で、1クリックでオンにできます。

以下の画像は、WAFがオフの状態ではSQLインジェクションを防げなかったWebサイトが、WAFをオンにするだけでSQLインジェクションを防御できることを、安田がデモ実演した際の画面の推移をまとめたものです。(SQLインジェクション:アプリケーションが想定しないSQL文を実行させてデータベースを不正に操作する攻撃方法)

WAFのオンとオフの状態を比較する図

クリックで拡大表示

「WAFやDDoS防御で重要なことは、ルールを最新の状態に保つことです。CISのOEM供給元であるCloudflareは、一日あたり3,000億リクエストを処理しています。この大量なトランザクションから、DDoS攻撃のトレンド、セキュリティー・ブリーチのトレンドなどをいち早く検知するとともに、得られた知見をマネージドのDDoS防御やWAFのルールとして適用しています。その結果、Webサイトやアプリケーションが最新のDDoS攻撃に対応できていなくても、常に最新のルールを適用しているCISで防御できるのです。これが、CISが安心である理由となります」

講演するIBM安田の画像

日本IBM 安田智有

ただ、クラウドに求められるのは信頼性だけではありません。Webサイトにアクセスできなかったり、Webアプリケーションからの応答が遅い、という事態が起こらないようにする必要があります。当然のことではありますが、パフォーマンスもクラウドに求められます。

「HTMLやPDFといったスタティックなコンテンツを配信するサイトを持たれている場合、キャンペーンなど短期間に激しく大量のアクセスが発生してもパフォーマンスを維持したい、という課題があります。CISは、このような課題を解決し、Webシステムのパフォーマンス向上に役立ちます」

CISが提供するCDN(Content Delivery Network)の機能が、パフォーマンスにどのように寄与するのか。安田は、IBM Cloudの東京リージョンに設置している2コアのWebサーバーを用いて検証した例を紹介しました。

 

CISの高速性を説明する図 その1

「Webサーバーに対して、1秒毎に100ユーザーが10秒間、合計1,000人がWebサイトにアクセスします。そして、Webサイトの表示を1,000人全員が完了するまでの時間を測定しました。

CIS無しの結果は、所要時間は32秒で、半数がタイムアウトしてコンテンツを正しく表示できませんでした。2コアのサーバーなので処理が追いつかないのです。CISを適用すると、所要時間は13秒で1,000人全員にWebサイトが表示されました」

CISの高速性を説明する図 その2

「ブラジルにあるPCにリモートデスクトップでログインして、先程のWebサイトにアクセス。Pingが返ってくるまでの所要時間と、100MBのファイルのダウンロード所要時間を、CISの有無で比較しました。

Pingに関して、ブラジルは日本から見て地球の裏側にあたるので280ミリ秒。100MBのファイルのダウンロード所要時間は10秒でした。これに対して、CISを適用するとPingが2ミリ秒で、ダウンロードは1秒です。結果を疑いたくなるくらいに速いですよね」

CISのOEM供給元であるCloudflareは最速のDNSである(1.1.1.1)を利用するとともに、世界中に180以上の拠点を持ち、それぞれの拠点に静的コンテンツをキャッシュしています。そして、リスエスト処理を実行したユーザーから一番近いサイトが応答することにより高速処理を実現します。

「合計1,000人によるWebサイトへのアクセス検証」では、東京にあるCloudFlareの拠点にWebコンテンツがキャッシュされているため、CISを適用した場合は1,000人全員へのWebサイト表示を短時間で実現しました。「ブラジルからのPingやファイル転送の検証」においては、リスエスト処理を実行した場所から一番近いサンパウロにあるCloudFlareの拠点が応答することで高速処理を実現しました。

安田は、以下のように述べて講演を締めくくりました。
「CISをお勧めするのは、ご紹介してきた全ての機能がオールインワンで提供されるからです。CISは、月額約3万円の定額制で基本機能をご利用いただけるスタンダードプランから、細かな設定が可能な従量課金型のエンタープライズプランまで、要件に応じてお選びいただけます。クラウドの信頼性とパフォーマンスを重視されるお客様は、ぜひ、CISをご検討ください」

*本記事にて画像で紹介したWAFの設定など、CISによるセキュリティーの強化は、以下の動画でわかりやすく紹介されています。


関連情報


More IBM Cloud Blog stories

マルチクラウドとは何か

IBM Cloud Blog, クラウドサービス

マルチクラウドとは、一時点で複数のクラウド環境を利用するクラウド活用法です。主に複数のクラウド・ベンダーから提 ...続きを読む


IBM Cloudカタログの通貨別料金変更のお知らせ

IBM Cloud Blog, IBM Cloud News, IBM Cloud アップデート情報...

IBM Cloudカタログの通貨別料金変更のお知らせ   米ドル以外の各国通貨利用時の価格差の軽減の ...続きを読む