国立研究開発法人 科学技術振興機構

新型コロナウイルス(SARS-CoV-2)および新型コロナウイルス感染症(COVID-19)に関する研究データ・リソース

2020年3月3日(最終更新日:2020年3月12日)
NBDC

いま、新型コロナウイルス(SARS-CoV-2)および同ウイルスによる新型コロナウイルス感染症(COVID-19)の研究が世界各地で急ピッチに進められ、関連するデータが続々と登録・共有・公開されています。このような迅速なデータ公開が可能なのは、データ公開のための情報基盤が、日頃、綿々と維持され、今回のような事態に対して弾力的に対応可能な組織体制が構築されているからです。

この記事では、同じくデータ公開のための情報基盤の構築・維持を地道に行うNBDCのスタッフとして、そうした研究に従事する皆さまへの尊敬の念を込め、新型コロナウイルスに関連して現在公開されている研究データやwebリソースを紹介します。

なお、この記事は「自分や家族が感染していないか」や「どのように予防できるか」といったことはお伝えしていません。 新型コロナウイルス感染症の詳しい情報や予防方法は、厚生労働省のウェブサイトなどをご覧ください。

新型コロナウイルス(SARS-CoV-2)の研究データ一覧

ゲノム配列情報 SARS-CoV-2 (Severe acute respiratory syndrome coronavirus 2) Sequences | Genbank
タンパク質の立体構造データ 新型コロナウイルスの構造情報 | PDBj

新型コロナウイルス(SARS-CoV-2) のゲノム情報について

2020年2月4日、生命情報・DDBJセンターは、ゲノム配列とその他関連情報が、アメリカNCBIが運営するGenBank から公開されていることを発表しました(新型コロナウイルスの配列と関連情報)。

また、同じ発表のなかで、一部のSARS-CoV-2配列データはGISAIDイニシアチブにより共有されることがある、としています。GISAIDイニシアチブは、研究者の国際的な協調による研究の迅速化を目的とした取り組みです。インフルエンザウイルスの配列情報やヒトに感染するウイルスに関連した医療データ・臨床データを、論文発表に先だって世界中のGISAIDメンバーとして登録されている研究者間で共有します。

GISAIDは限定された研究者向けのデータですが、GenBankに登録されたデータはどなたでもダウンロードすることができます。 例えば、自分のパソコン上で、今回の新型コロナウイルス(SARS-CoV-2)、2002年から2003年にかけて猛威を振るった重症急性呼吸器症候群(SARS)の原因となったコロナウイルス(SARS-CoV)、2012年に初めて確認された中東呼吸器症候群(MERS)の原因となったコロナウイルス(MERS-CoV)とのゲノム配列の違いを閲覧・比較することもできます。

データを閲覧・比較するには、以下の講義資料も参考になります。SARSウイルス(SARS-CoV)のゲノム配列データを題材として 「MEGA」という世界的に有名な解析ソフトウェアを用いてウイルスの分子系統樹を描いたものです。

ただ、6年も前で情報が古くなっています。特に、MEGAの最新バージョンは10(MEGA X)であるところ、本資料ではバージョン6を用いており、画面や手順が異なる場合があるのでご注意ください。

DBCLSが、NBDCとの共同研究の一環で運営する「統合TV」には、MEGAの開発者である首都大学東京(東京都立大学)の田村教授による、MEGAを用いた分子系統樹の推定についての講義動画(日本語)が掲載されています。

また、MEGAは公式ページでマニュアル、チュートリアル動画など(英語)を数多く提供していますので、合わせてご参照ください。

新型コロナウイルス(SARS-CoV-2) が持つタンパク質立体構造データについて

2020年2月5日、wwPDBは、新型コロナウイルスが持つプロテアーゼと呼ばれるタンパク質の立体構造を公開したことを発表しました(wwPDB 新型コロナウイルスプロテアーゼの構造が公開されました | PDBj)。2月26日にはウイルス表面のスパイクタンパク質の構造データが公開されるなど、毎週データが公開されています。

また、3月11日には、wwPDBのアジア代表で、大阪大学蛋白質研究所が運営するPDBjが、SARS-CoV-2の特集ページを公開しました(大阪大学プレスリリース「新型コロナウイルスの蛋白質構造情報を集約して 3/11 から公開」)。

ウイルスのプロテアーゼやスパイクタンパク質は、細胞に感染する際に重要な役割を担う分子です。
コロナウイルスプロテアーゼについては、PDBjが運営する「今月の分子」(「Molecule of the Month」の翻訳)にて、詳しく紹介されています

タンパク質立体構造は創薬研究の基盤となる重要なデータです。そのリポジトリは国際的な枠組みであるwwPDBにより、日米欧の三極体制下で運営でされています。日本の代表は大阪大学蛋白質研究所が運営するPDBjです。今回公開されたデータは中国の研究グループが決定したもので、wwPDBが定める地域分担に基づき、PDBjが登録作業を実施しました。

新型コロナウイルス感染症(COVID-19)に関するWebリソース一覧

NBDCが4省連携の枠組みで運営する「Integbioデータベースカタログ」(以下、「カタログ」と略します)では、国内外の研究用データベース情報を整理・発信しています。
新型コロナウイルス関連では、次のようなデータベースが登録されています。

名称(カタログへのリンク) 分類 概要(カタログより転載。末尾の「コメント」は本記事用に追記したもの。)
感染症 画像・映像アーカイブ 日本語・研究者向け

国立感染症研究所の所有する病原体や感染症研究関連の画像や映像を閲覧できるサイトです。病原体の電子顕微鏡写真が掲載されています。

コメント:国立感染症研究所で分離に成功した新型コロナウイルスの電子顕微鏡写真があります。研究用材料(ウイルス、細胞)提供に関する情報も記載されています。

病原体検出マニュアル 日本語・医療者向け

感染症法に基づいて感染症の報告がなされる際の検査の標準化のために、国立感染症研究所と全国地方衛生研究所の共同作業で作成された検出マニュアルです。感染症ごとに検出マニュアルをPDFファイルから閲覧出来ます。

コメント:新型コロナウイルスについては、2月4日公開後、5回更新されています(2020年2月28日時点でVer.2.7)。

感染症の情報 (疾患名で探す) 日本語・医療者・一般向け

感染症の情報を疾患名から検索できるデータベースです。感染症の基本情報から、最新の疫学情報を世界保健機構(WHO)、 アメリカ合衆国・疾病対策センター(CDC)、国際獣疫事務局(OIE)などから邦訳も含めて得ることができます。本サイトとともに「感染源や特徴で探す」 も提供されています。

コメント:新型コロナウイルスに関する情報は、特設ページが用意されています。

BEI Resource Repository 英語・研究者向け

カテゴリーA、B、および C の優先病原体、新興感染症病原体、非病原性微生物および研究コミュニティに関連する他の微生物学的材料を研究するための試薬、ツールおよび情報を提供するリポジトリ。

コメント:新型コロナウイルス研究材料の提供に関する情報が掲載されています。

Virus Pathogen Database and Analysis Resource 英語・研究者向け

複数のウイルスファミリーのデータと分析ツールを提供する統合リポジトリです。アレルギー・感染症研究所(NIAID)のバイオインフォマティクスリソースセンター(BRC)プログラムの支援を受けています。配列レコード、遺伝子およびタンパク質のアノテーション、3Dタンパク質構造、免疫エピトープの位置、臨床およびサーベイランスのメタデータおよび比較ゲノム解析から導かれた新規データを含む様々なタイプの情報を収録しています。ウイルス学研究コミュニティに対するサービスとして、優先度の高い病原体やその他のウイルスの診断、予防、治療法の開発を手助けするべく、無料で提供されています。

コメント:新型コロナウイルス特設ページ

新型コロナウイルス感染症(COVID-19)の治療薬 候補に関する情報

現時点で、新型コロナウイルス感染症(COVID-19)の治療薬はなく、候補薬に効果があるかについて研究が進められている状況です。
KEGG MEDICUSを用いると、そうした医薬品の情報を検索することができます。ここでは、治療薬の候補としてメディアでも取り上げられている2つの薬に関するデータを紹介します。

医療用医薬品 : アビガン https://www.kegg.jp/medicus-bin/japic_med?japic_code=00066852
KEGG DRUG: レムデシビル https://www.kegg.jp/dbget-bin/www_bget?dr_ja:D11472

KEGG MEDICUSについて

KEGG MEDICUSは京都大学の金久實特任教授が開発・運用するデータベースで、ヒトゲノム、病原体ゲノム、様々なメタゲノムなどのシークエンス解読と有効利用を促進する統合リソースです。

KEGG MEDICUSでは、国内外の他のデータベースの関連情報へのリンクも整備されていて、例えば米国PubChem、欧州ChEMBL、大阪大学LigandBoxの関連ページへ直接アクセスすることができます。

コロナウイルス関連の研究情報を広く調べる

NBDCが運営する「生命科学データベース横断検索」は、多種多様なデータベースを横断的に検索できるサービスです。 例えば、「コロナウイルス」「2019-nCoV」などで検索すると、上記のようなWebリソース中で掲載されている内容を横断的に直接検索することができます。

「コロナウイルス」でキーワード検索すると「ウイルス図鑑」やJ-STAGEの文献、JSTシソーラスなどがヒットします。 このうち「ウイルス図鑑」では、コロナウイルスの名前の由来などが記載されています

更新情報

2020年3月12日:PDBjによる特集ページ開設を受け、立体構造データに関する記載を修正・追記。合わせて一部文言を修正。

お問い合わせ・ご意見

本ページの内容やNBDCが運営するWebサービスのお問い合わせ、研究データ・データベースなどに関するご相談などお気軽にお寄せください。