国立研究開発法人 科学技術振興機構

TogoVarでタンパク質立体構造上のバリアントの位置を閲覧可能に

  • 更新情報
  • TogoVar
  • その他
  • 研究開発・連携
2024年12月17日

ライフサイエンス統合データベースセンター (DBCLS) は、2024年12月3日、TogoVar に新機能を追加するとともに2種のデータを新規収載したことを報告しました。概要は以下の通りです。

1. 遺伝子ページにて、ミスセンスバリアントのタンパク質の立体構造上の位置が閲覧できるようになりました。立体構造データはPDB (Protein Data Bank) の実測データだけではなく、AlphaFold の予測データを選択することもできます。

図1:新たに追加された「Protein structure」(例:BRAF:p.V600E) 。 BRAFはプロテインキナーゼの一種で、活性型RASと結合することで活性化し、MEKのリン酸化を通じて細胞増殖を促進する。いろいろな種類のがんでBRAFの点変異が知られ、阻害薬も開発されている。a) タンパク質立体構造ビューアの右側のプルダウンメニューから「All variant with clinical significance」を選択すると、臨床情報のあるバリアントの位置が赤く強調表示される。同メニューから任意のバリアントのみを選択し、表示させることもできる。なお、構造データが表示されるまで読み込みに数十秒かかる場合がある。 b)左のプルダウンメニューでは、複数の構造データがPDBへ登録されている場合にどれを表示するか選択できる。AlphaFoldによる予測構造データも選択可能。PDBの実測データは大阪大学のPDBjから、AlphaFoldの予測データはEMBL-EBIのAlphaFold DBから取得している。

2. MGeND から提供を受けた、各バリアントの臨床的意義情報を収載しました。MGeND (Medical Genomics Japan Variant Database) のデータには、日本人由来のバリアント情報が7万件超含まれます。MGeNDでは、がん、希少・難治性疾患、感染症、認知症、難聴などの病原性が解析され、MGeNDに含まれるバリアントのうち0.9万件がPathogenic(病原性あり)となっています。こうしたMGeNDの情報が、TogoVarに既収載のClinVar由来の情報約294万件とあわせて情報探索できるようになりました。

図2:新たに追加された「Clinical significance MGeND」。TogoVarトップページの「Clinical significance」列にClinVar由来の情報とともに掲載されている。MGeND由来の情報の場合、Mマークが表示される。b)「Advanced search」では表示するデータをMGeNDだけ、CliVarだけに絞り込みできる。

3.NBDCヒトデータベース/JGAに寄託された全ゲノム配列を再解析し、アレル頻度やジェノタイプ数を集約した「JGA-WGS」を新規収載しました。サンプルサイズは78件、バリアント数は約2,082万件です。
データの解析手法や利用条件などは以下に記載されています。

本開発は、ライフサイエンスデータベース統合推進事業の一環で DBCLS が実施する基盤技術開発プロジェクトの一環で行われました。

AJACSウェビナー

染色体高次構造の基礎、Hi-C解析手法の原理と実践的な解析の流れまでを解説!
データ解析講習会:AJACS「Hi-C解析を知って・学んで・使う」 は2025年1月16日開催です。