IBM ESSの導入によって処理速度が大幅に向上することがわかりました。そして何よりもデータの安全性を担保する独自の仕組み、End-to-end checksumが魅力でした

—国立遺伝学研究所 DDBJセンター システム管理部門長 特任准教授 博士(理学) 小笠原 理氏,

Business Challenge

DNAの塩基配列データは日本、米国、欧州3極のいずれかのデータベースに登録されると、3極共通のデータベースとして運用され、世界の共有財産として研究に活用されています。日本のデータベースであるDDBJ(DNA Data Bank of Japan)を維持管理し、研究のために提供することと、解析のためのコンピューター・リソースなどデータ解析環境を提供する責務を担っているのが国立遺伝学研究所に設置されたDDBJセンターです。次世代シーケンサーによるDNAデータの量の拡大、政府が進める生命科学事業へのコンピューター・リソースの提供、DDBJセンターの解析環境の強化などもあって、容量や性能を容易に拡張可能なストレージ基盤の整備と運用ルールの確立が必要とされていました。

Tranformation

DDBJセンターは、次世代のストレージ基盤について2015年ごろから検討を開始し、2016年には仕様を固め、2017年夏ごろに入札を行いました。アクセス頻度が低いデータもオンラインであること、データが確実に保全されていること、構築時の容量が30PBで拡張性に富み、大きなデータを高速に扱えることという条件を満たすものとして、IBMが提案したIBM ESSによる階層型ストレージ・システムが選定されました。階層型ストレージ・システム導入によって、処理速度が大幅に向上することに加えて、大容量のファイルを転送する際に、小さな単位に分割してブロック単位ごとに整合性をチェックしてデータの安全性を担保し、かつ転送速度も落とさない「End-to-end checksum」機能が高く評価されました。

Benefits

IBM ESSとテープ・ライブラリーは2018年1月に搬入され、セットアップと性能確認が行われた後、3月から稼働を開始しました。半年ほどでデータを移行する予定で、移行によって容量に余裕ができ、ストレージがボトルネックになっている現状が解消されることが期待されています。DDBJが取り組むゲノム研究に関するデータが増え続けていることに加えて、研究領域も発展しており、今後は多様なデータにも対応していかなければなりません。さらに、顕微鏡写真のような画像データもアーカイブして、海外の計算拠点とデータ転送したいというニーズへの対応も検討されています。また、今後、小型シーケンサーによるDNA分析が広がっていくと、それに応じた解析サービスが必要になると考えられます。新ストレージ基盤には、国内外の遺伝学研究者向けのクラウドセンターとしてサービス拡充の契機となり、生命科学の解明に貢献することが期待されています。

 

当事例に関する図表を含めた詳細な情報は、下記「PDFダウンロード」よりご覧いただけます。

Solution Category

  • Systems Hardware