膨大なMAG由来タンパク質の配列を高速検索する新しいウェブサーバー「PZLAST-MAG」が公開
- その他
- ファンディング
- 統合化推進プログラム
2026年5月6日、情報・システム研究機構 国立遺伝学研究所の森宙史准教授らは、微生物のメタゲノム由来のゲノム配列(MAG: Metagenome-Assembled Genomes (※1) )にコードされているタンパク質配列を超高速で類似性検索できる新しいウェブサーバー「PZLAST-MAG 」を公開したことを、科学誌「Bioinformatics Advances」 に掲載しました。PZLAST-MAGでは、さまざまな環境由来のMAGを収載したデータベース「Microbiome Datahub 」の21万件以上のMAGにコードされている約4億配列のタンパク質配列(約1000億アミノ酸)を検索対象とし、高い精度を保ちながら短時間で大規模検索を行うことができます。
環境中のマイクロバイオーム(微生物群集)から直接DNA配列を解読するメタゲノム解析技術の発展により、培養困難な微生物のMAGが爆発的に増加しています。しかしながら、大規模なMAGにコードされているタンパク質配列に対して、高速かつ正確に類似性検索できるツールは限られており、また類似性が認められたタンパク質群の分類学的および生態学的な背景を理解することは、決して容易なことではありませんでした。
PZLAST-MAG は、ショートリードのメタゲノムデータから予測されたタンパク質配列の高速類似性検索用ツールとして開発したPZLAST をもとに、MAG由来のほぼ全長タンパク質配列に対する大規模な類似性検索をサポートするように拡張したもので、Microbiome Datahubに収載されているMAG由来タンパク質配列に対して、超高速かつ高い精度で配列類似性検索を行うことができます。また、検索した類似配列を単に表形式でのアライメントとして結果表示するだけにとどまらず、ヒットしたタンパク質のMAG全体にわたる系統発生的分布のほか、Microbiome Datahubに収載されているメタデータを活用して、環境オントロジーMEO(Metagenome/Microbes Environmental Ontology (※2) )に基づく生息環境の分布、およびゲノムにおける複数クエリの共起パターンを可視化して提示します。これらの機能により、多様な微生物系統にわたる機能的に重要な遺伝子の相同遺伝子探索を迅速に行うだけでなく、同時に、それらの分類学的および生態学的な背景を容易に理解することができるようになりました。。
詳細については論文 をご覧ください。
<Microbiome Datahub の収載データ数(2026年6月現在)
- MAG: 218,248 MAGs
- メタゲノムBioProject:102,174プロジェクト
- 収載されている環境の数:123カテゴリー
- MAG由来タンパク質配列:454,799,346タンパク質
PZLAST-MAGは、JST統合化推進プログラムの研究開発課題「マイクロバイオーム研究を先導するハブを目指した微生物統合データベースの特化型開発」(研究代表者:森 宙史 国立遺伝学研究所 准教授) の一環で開発しています。
図 PZLAST-MAG の Web インターフェースと出力の可視化の概要
(A) PZLAST-MAG のトップページ。ユーザーはジョブごとに最大 10,000 個の配列を送信できる。
(B) 表形式の結果表示。各行は 1 つのヒットを表し、ペアワイズ アライメントを表示できる。
(C) ヒットの系統樹分布。赤い円は、一致したタンパク質が由来する系統を示す。
(D) MEO クラスに基づく類似タンパク質の環境分布。棒グラフで表示される。
(E) 同じ MAG 内の複数のクエリからの相同タンパク質の共起をまとめた完了表。
用語解説
※1 MAG (Metagenome-Assembled Genomes): 微生物群集を培養することなく、サンプル中のDNAを混合物として抽出し、塩基配列を網羅的に解読して得られたメタゲノムをアセンブルし、得られたコンティグ配列から配列の連続塩基組成や配列の相対存在量等の情報をもとに配列をクラスタリング(binning)して得られた仮想的なゲノム配列。
※2 MEO (Metagenome/Microbes Environmental Ontology) :微生物の生息環境に関するメタデータを記述し整理するためのオントロジー。