タンパク質に関する立体構造や遺伝子変異などの統合ポータルの開発等を報告するPDBjの論文が公開
- その他
- ファンディング
- 統合化推進プログラム
大阪大学 蛋白質研究所 栗栖 源嗣 教授らの研究グループは、2025年2月20日、科学雑誌Protein Scienceに、日本蛋白質構造データバンク(PDBj)のアップデートに関する論文 を発表しました。
タンパク質が生体内においてどのような形状を取るかについては、世界中の研究グループによってさまざまな生物種やタンパク質を対象にして研究されており、その研究結果である立体構造データは蛋白質構造データバンク(Protein Data Bank:PDB)に登録されて全世界に公開されています。こうした立体構造データは、基礎生物学のみならず、創薬などの応用分野においても盛んに活用されています。PDBj は、米国、欧州の各拠点と連携し、全PDBデータの公開およびアジア地区で解析された全てのタンパク質立体構造データの登録処理をおこなうとともに、タンパク質立体構造データを検索、可視化、解析するための独自のサービスとツールを開発・提供しています。
今回公開された論文内で報告されたアップデートの一つは、2024年11月公開の「UniProt統合ポータル」です。このポータルサイトでは、UniProtに登録されたアミノ酸配列(UniProt ID)ごとにPDBの立体構造データと、jMorp (Japanese Multi Omics Reference Pannel)やMGeND (Medical Genomics Japan Variant Database)などに由来する遺伝子変異情報、相互作用情報などが1ページにまとめられており、任意のタンパク質の立体構造に関する情報を包括的に閲覧できます。このページに表示される各立体構造データには独自の品質評価スコアが付けられており、どの構造データを選んだら良いかを判断する際の参考にすることができます。また、アミノ酸配列ビューアでは遺伝子変異情報が表示され、任意のアミノ酸残基を選ぶと立体構造ビューアでその位置を確認することができます。そのため、例えば、疾患に関わる遺伝子変異がタンパク質の機能に与える影響の推測などに役立てることができます。
本論文では他にも、PDBに加えてUniProtKB/Swiss-ProtやAlphaFold DBのデータに対してもアミノ酸配列の類似性検索ができる「Sequence Navigator Pro 」、分子動力学法やディープラーニング等に基づいた計算データを受け入れるアーカイブ「BSM-Arc(Biological Structural Model Archive) 」、X線回折等によって得られた回折像のアーカイブ「XRDa(Xtal Raw Data Archive) 」の公開についてを報告しています。
PDBjは「統合化推進プログラム」の研究開発課題「蛋白質構造データバンクのデータ駆動型研究基盤への拡張」の一環として開発・運営されています。
詳細は、研究論文「Protein Data Bank Japan: Improved tools for sequence-oriented analysis of protein structures 」をご覧ください。

図1: 新しいポータルサイトのぺージには、PDBjのトップページ の検索ウインドウにUniProt IDを入力して検索するとアクセスできる。UniProt IDごとにページが割り振られており、そのUniProt IDに紐づくPDBjで開発された2次データベースを含む、様々な情報がまとめられている。
(1) 立体構造データ一覧パネルには、UniProt IDに紐づくPDB IDの一覧と各データの品質評価スコアが表示されている。図2に示すように任意のPDB IDをクリックすると当該立体構造データに関連するデータを閲覧できる。 (2) 立体構造ビューア・パネルでは、PDBjで開発したMolmilを用いてPDB構造を閲覧できる(図4も参照のこと)。(3)アミノ酸配列情報パネルでは、UniProt由来のデータとjMorpに基づく遺伝子変異情報を閲覧できる。(4) 遺伝子変異一覧パネルには、当該タンパク質の遺伝子変異が一覧になっており、jMorpの各詳細ページへのリンクが付いている。このほか、(5) 選択された立体構造における、他のタンパク質・化合物との相互作用情報、(6) 構造データの品質を示す検証レポートなども一元的に閲覧できる。
本図は、例としてUniProtID:P20813のページを示した(https://pdbj.org/uniprot/P20813/)。本ページにアクセスすると、デフォルトではPDB ID:5ufgのデータが表示される。したがって「https://pdbj.org/uniprot/P20813/」と「https://pdbj.org/uniprot/P20813/5ufg/」では同じ情報が表示される。

図2:立体構造データ一覧パネルにおいて任意の立体構造データをクリックすることで、当該立体構造エントリーに関連するデータを閲覧できる。各立体構造には品質評価スコアが振られている。この数値は「分解能」や「全長配列のうち立体構造情報が存在する割合」などに基づいて算出されている。
本図では、PDB ID:5udaをクリックした場合を示した。「https://pdbj.org/uniprot/P20813/」から「https://pdbj.org/uniprot/P20813/5uda」へ移動する。

図3:アミノ酸配列データ・パネルで任意のアミノ酸残基をクリックすると、立体構造ビューア・パネルで構造上のアミノ酸残基の位置が表示される。本図では、例として、PDB ID:5ufgでARG262をクリックした場合を示した。

図4:立体構造ビューア・パネルでは、立体構造をリボンモデル含むさまざま形式で表示できるほか、PDBjが開発・提供しているPromode Elastic、eF-site、Dynamics DBのデータを重ね合わせて表示できる。また、利用可能な場合は AlphaFoldの予測構造データも表示可能(AlphaFold DB は、欧州EBIがGoogle DeepMind社と共同で開発・提供するWebサービス)。