国立研究開発法人 科学技術振興機構

TogoVar に AlphaMissense データを掲載 膨大な病原性予測データを 既報の情報とともに検索

  • 更新情報
  • TogoVar
  • その他
  • 研究開発・連携
2024年2月29日

ライフサイエンス統合データベースセンター (DBCLS) は、2024 年 2 月 28 日、「TogoVar」収載のミスセンスバリアントのうち約 462 万件につき、「AlphaMissense」の病原性予測値が新たに閲覧できるようになったと発表しました。臨床的に確かめられた疾患情報とあわせて表示・検索することが可能です。疾患研究、創薬研究等へのさらなる貢献が期待されます。

図:画面右側の「Statistics / Filters」にて「AlphaMissense」の「Unassigned」のチェックを外すと、AlphaMissense の病原性スコアが割り当てられているバリアントのみが表示される。ラベルの背景が黄色のものが「Likely pathogenic」、黄土色が「Ambiguous」、緑色が「Likely benign」である。なお、画像は開発中のもので、本番環境と異なる場合がある。

TogoVar は、2018 年 6 月に提供を開始しました。バリアントとバリアントに関係する既報の疾患情報などを、国内外の様々なプロジェクトと連携して整理し、ワンストップで検索することができます。バリアント情報としては NBDC ヒトデータベース/JGA に加え、gnomAD、ToMMo 等、バリアント関連情報としては ClinVar、GWAS Catalog、HGNC symbol report、PubTator Central、PubMed 等、国内外から様々なデータを統合しています。

AlphaMissense は、GoogleDeepMind 社が 2023 年 9 月に発表した、単一アミノ酸置換の病原性予測ツールです。DeepMind 社は、Science 誌に掲載された AlphaMissense の論文「Accurate proteome-wide missense variant effect prediction with AlphaMissense」において、公共データベース UniProt、GENCODE、ClinVar 等のデータを用い、ヒト体内に存在するタンパク質の単一アミノ酸置換のうち、理論上考えられる全てに対応するミスセンスバリアント約 7,100 万件の病原性を予測しました。その結果、全体のうち 32% (約 2,300 万) は病原性がある可能性が高く、57% (約 4,000 万件) は病原性のない可能性が高いと予測され、またその予測精度が既存の予測ツール (PolyPhen、SIFT など) を上回ったと報告しています。

今回、上記の約 7,100 万件のデータのうち TogoVar 収載のミスセンスバリアントと対応する約 1,712 万件につき、AlphaMissense の病原性予測値を閲覧できるようになりました。約 1,712 万件の 9 割強にあたる約 1,596 万件のバリアントは病原性の有無が ClinVar に登録されていません。AlphaMissense のデータは あくまで予測値であることに注意する必要があるものの、臨床的に確かめられた情報を補完し、世界中の研究者による遺伝性疾患の解明や治療薬の開発を一層加速させると期待されます。

また、今回の更新にあわせ、Genome Aggregation Database (gnomAD) のデータが、v.3.1.2 (2021 年 10月) から v4.0.0 (2023 年 11 月) へ更新されました。

本開発は、ライフサイエンスデータベース統合推進事業の一環で DBCLS が実施する基盤技術開発プロジェクトの一環で行われました。

AJACSウェビナー

染色体高次構造の基礎、Hi-C解析手法の原理と実践的な解析の流れまでを解説!
データ解析講習会:AJACS「Hi-C解析を知って・学んで・使う」 は2025年1月16日開催です。