プロテオームリソースの国際コンソーシアムProteomeXchange(PXC)の10年

  • その他
  • ファンディング
  • 統合化推進プログラム
2022年11月29日

プロテオームデータベースの国際的な枠組みである「ProteomeXchangeコンソーシアム(PXC)」が設立から十周年を迎えたことを踏まえ、2022年11月12日、Nucleic Acid ResearchにこれまでのPXC の10年間の活動と成果をまとめた論文が掲載されました。

本論文では、PXCの発足からの経緯、PXCへの登録データセット数の推移、オープンサイエンスの推進に向けたPXCの取組みなどを概括しています。

PXCは、2022年6月現在、6つのリポジトリデータベースから構成されています。2012年に欧州のPRIDEと米国のPeptideAtlasにより設立され、その後、MassIVE(米国)、jPOST(日本)、iProX(中国)、Panorama Public(米国)が加わりました。jPOSTは、「統合化推進プログラム」の研究開発課題「プロテオームデータベースの機能深化と連携基盤強化」において、京都大学 大学院薬学研究科の石濱 泰教授らが開発・運用しています。PXCの主要加盟リポジトリの一つとして、PXCにおいて重要な役割を果たしていると論文内で言及されています。

PXCに登録されるデータセット数は年々増加し続けています。2022年6月の時点でPXCに登録されているプロテオームデータセット数は34,233ですが、そのうち直近3年間に登録された数は20,062(58.6%)に上りました。

PXCではFAIR原則に準拠したオープンサイエンスを推進しています。設立以降、リポジトリに登録するデータ様式の統一、再解析データの登録方法の共通化、各機関が公開しているすべてのリソースを検索できる共通ポータルProteomeCentralの構築、URLから一意の特定のスペクトラム情報を指定する規格化されたUniversal Spectrum Identifier(USI)の開発に取り組みました。また、PXリソースのペプチド・タンパク質配列データをUniProt KnowledgeBase(UniProtKB)や neXtProtなどのタンパク質知識ベースへと統合したほか、リン酸化などの翻訳後修飾の情報をUniProtKB に提供するためのデータパイプラインの開発やファイル形式・ガイドラインを策定するなどの取り組みが行われました。これらにより、特にプロテオミクスの専門家ではない生命科学者がプロテオミクスデータへ容易にアクセスしたり、他のオミクスデータとともに統合利用したりしやすくなりました。

jPOSTでは独自の活動にも取り組んでおり、登録されたデータを統一手順で再解析するためのワークフローを開発し、ヒト、マウス、大腸菌、SARS-CoV-2等のデータセットをjPOSTdbから公開したことや、データジャーナルJournal of Proteome Data and Methods(JPDM)を創刊し、高品質なデータを正確なメタデータとともにデータ産生者から直接収集する体制を構築したことなどが、論文内で紹介されています

詳細は、原著論文およびjPOSTからのお知らせをご覧ください。

データ解析ウェビナー:AJACS

「ChatGPT等の生成AIツールを研究活動に活用する注意点を知って・学んで・使う」2024年6月20日開催! オンライン受講登録を受付中