IBM Research

ウイルスの設計図を解明せよ!――IBM Research 新型コロナウイルスのゲノム変異解析への挑戦

記事をシェアする:

新型コロナウイルス感染症(COVID-19)の流行開始から1年。時間の経過とともに、ウイルスのゲノムは新たな変異を蓄えて進化を続けています。最近では、変異株に関する報道を目にする機会も多くなりました。ゲノムとは遺伝子(gene)と染色体(chromosome)から合成された言葉で、DNA(デオキシリボ核酸)やRNA (リボ核酸)が持つ遺伝情報を意味します。つまりゲノムは、その「もの」の形質や性質を決める設計図とも言えます。変異によって遺伝的要素が多様化することで、治療薬やワクチンの開発ならびに有効性などに多大な影響が発生する一方、変異を早急に捉えることができれば効果的な対策へつながるかもしれません。

IBM Researchでは、新型コロナウイルスのゲノム変異について、モニタリング、解析、情報提供などの活動をCOVID-19の流行初期から行い、現在も継続しています。2021年に入り日本国内のゲノム情報が多く公開されたことを受け、日本における新型コロナウイルスのゲノムの解析を行い、研究成果を公開しました。このブログでは、IBM Researchにおける新型コロナウイルスのゲノム解析の取り組みと、ゲノムが持つ膨大な情報を私たちの日常にどのように役立てられるかを紹介します。

ゲノム解析でみえた日本国内での変異の実態

IBM Researchは、日本における新型コロナウイルスのゲノムを解析した研究成果を2021年3月にプレプリントとして「medRxiv」に公開しました。2021年1月に公開された日本国内のゲノムは、国内感染者数の5%程度をカバーしており、多くは2020年までに採取されたものでした。解析の結果、どのような変異型を持つウイルスが、どのようなタイミングで日本に流入し、どのように進化していったかが明らかになりました。

 

2020年の年末にかけて日本国内で流行した新型コロナウイルスは、およそ11のタイプに分類されました。そのうち5つは、日本国内で独自に進化した変異型です。国内の新型コロナウイルスの90%以上が、D614Gと203_204delinsKRというゲノム変異をもった「D614G_KR」というタイプでした。この「D614G_KR」は、昨年の3月頃に国内に入ってきており、その後、新たな変異を獲得しました。そして、2020年末には3つのタイプへと変異し国内に広がっていることがわかります。

 

ウイルスに蓄積されたゲノムの変異情報を解析することで、感染元となる(親になる)ウイルスが海外由来どうかを調べることができます。解析の結果、少なくとも115回はウイルスが海外から流入してきたことがわかりました。また、空港における検疫の強化後に日本国内に入り込んできたと考えられる新型コロナウイルス株も、12個発見しました。

この12の新型コロナウイルス株のうち4つはN501Yの変異を持つイギリス変異株(B.1.1.7)、1つはワクチンの効果が弱まると言われているE484K変異を持つ由来不明株(R.1)です。2021年3月に公開した論文では、こうした海外からの新たな変異株が国内に入り込んだ要因として空港検疫の唾液抗原検査への検査体制切り替えの影響についても議論をしています。

由来不明株(R.1)については、イギリスで2020年11月中旬に単発の報告が確認されていますが、同時期にイギリスで行われたゲノム解析ではR.1株は見つかっていません。こうした背景から、由来不明株については、ゲノムを使った検査があまり行われていない国で進化し、検疫をすり抜けて持ち込まれた可能性が示唆されました。

新型コロナウイルスのゲノムとは

ところで、新型コロナウイルスのゲノム変異とは、そもそもどのようなものなのでしょうか。新型コロナウイルスの設計図は、「A」「U」「G」「C」のいずれかの文字が連なり、全長が約3万文字となるゲノムです。1文字ごとに4パターンなので2bit、そして3万文字ですので、7.5KB(キロバイト)程度の非常に小さな情報伝達物質と考えられます。

このゲノムは、ウイルスの増殖や感染の過程で一定の割合で誤りが生じます。そして、その結果、設計図となる文字の書き換え、つまり、ゲノム変異が生じます。2020年の研究では、新型コロナウイルスは、概ね月2.5文字のペースでゲノム変異が生じると考えられています(詳細はこちら)。

既に一年以上が過ぎた現在、武漢で発生した当時の新型コロナウイルスと比べて、30を超えるゲノム変異が蓄積していることになります。この30という数は、あくまでもウイルス1個あたりの変異の数です。実際には、感染者数と感染者の体内にあるウイルスの掛け合わせの数だけ、ゲノム変異のパターンが試行されていることになります。

こうしたパターンの繰り返しの中で、新たな変異をもったウイルスが急増し、新しい性質を持った変異株として認知されていきます。

遺伝子変異をいち早く捉え、役立てる

IBM Researchは、新型コロナウイルスのゲノム変異に着目した研究を感染流行が大きくなる前の2020年1月から開始し、その研究成果を論文として公開してきました。特に、WHO Bulletinにて発表した論文は、新型コロナウイルスのゲノム解析を目的としたソフトウェア等の環境が整備されない状況下において、1万を超えるゲノムを医療・製薬の研究者が把握しやすいアミノ酸レベルの変異で解析し整理したものでした。この論文には大きな反響が寄せられ、現在までに200件近く引用されています。

SARS-CoV-2 Variant Browser

SARS-CoV-2 Variant Browser デモサイト

研究成果を論文として発表するだけではなく、ここで得られた知見を医療・製薬を含む多くの関係する方々に活用いただき、今後新たに現れる変異についても考察できる環境を作ることも重要です。そこでデジタル変革のための共創を支援するIBM Garageと協力し、最新の新型コロナウイルスの変異状況を可視化するウェブ・アプリケーション「SARS-CoV-2 Variant Browser」を開発。医療研究者への情報提供とモニタリングの体制を整えました。「SARS-CoV-2 Variant Browser」は、IBM ResearchのCOVID-19ソリューションであるIBM Functional Genomics Platformでも公開しています。 このアプリケーションの開発秘話や経緯については、IBM Garageメンバーの声も合わせてこちらの記事で紹介しています。

科学の力で未知の課題に挑む

現在、活発に議論されている変異株以外にも、注意すべき新型コロナウイルスの変異株が多く出現し続けています。私たちは、海外で進化した変異株の国内への持ち込みだけでなく、新型コロナウイルスの国内での独自の進化や既存のPCR検査でウイルスが検出できなくなる変異リスクなどと対峙しなければなりません。一方、新型コロナウイルスのゲノムの変異情報は、今回の取り組みのようにデータを適切に解析し必要な形に情報を処理することにより、感染経路の推測といった感染症対策にも活かすことができます。

IBM Researchでは2020年に「科学の緊急性」というイニシアティブを立ち上げています。今回の新型コロナウイルスのゲノム解析における一連の取り組みは、まさにその一例と言えるでしょう。もちろん人類が直面している喫緊の課題は、新型コロナウイルスだけではありません。IBM Researchは、COVID-19への取り組みを継続するとともに、他の重要な科学的課題にも取り組み続けていきます。

著者プロフィール

徳増 玲太郎 IBM東京基礎研究所
徳増 玲太郎
IBM東京基礎研究所

ライフサイエンス・ヘルスケア、特にゲノム分野のAIソリューションなどの製品に関わる研究開発を担当。IBM東京基礎研究所 ヘルスケア・リサーチ部門にて、グローバルのIBM Research部門と協業し本プロジェクトをリード。

工藤 道治 Michiharu Kudoh IBM東京基礎研究所
工藤 道治
IBM東京基礎研究所

IBM東京基礎研究所にて、ヘルスケア・リサーチのシニアマネージャーとしてAI技術をヘルスケア・医療分野に応用する研究チームを率いる。電子カルテ・データなどから将来の疾病悪化を予測するAIモデル構築やCOVID-19向けソリューション開発を推進。

小山 尚彦 Takahiko Koyama IBM TJワトソン研究センター
小山 尚彦
IBM TJワトソン研究センター

IBM Researchにおけるゲノム医療研究を立ち上げ、がん診断支援ソリューションの研究開発のリードを経て現在もIBM TJワトソン研究センターにてゲノム研究を推進。日本では京都大学iPS細胞研究財団との共同研究等を実施している。新型コロナの研究では、いち早くゲノム解析ツールを開発し複数の論文を公開。

 
※編集:髙橋志津、黒澤巧、芋岡祥子

More IBM Research stories
2021年10月19日

令和3年度 産業標準化事業表彰を受賞!

産業標準化事業表彰(経済産業大臣表彰)受賞について 日本アイ・ビー・エム株式会社(以下、日本IBM)が、令和3年度産業標準化事業表彰 経済大臣表彰を受賞したことが、経済産業省より発表されました。本表彰は国際標準化機構(I […]

さらに読む

2021年10月6日

コンテナ環境に適応し進化を続けるJavaエコシステム

Javaは業務システムの開発言語として重要な言語であり、ソフトウェア資産の活用の観点から今後も使われ続けると考えられています。一方、コンテナやサーバーレスなどクラウド技術の普及により、Java VM上で実行されるJava […]

さらに読む

2021年10月6日

量子プログラミング・コンテスト開催

量子コンピューターの将来の産業応用にむけて 量子コンピューターを使うと何ができるのでしょうか?産業界で活躍するITエンジニアやAIエンジニア、データサイエンティストの方々の中には、まだ量子という新しいテクノロジーを実際の […]

さらに読む