Microbiome Datahubの利活用事例:化学合成独立栄養細菌が持つCO₂固定経路の有無をゲノムから高精度に予測するツール「AutoFixMark」の開発
- その他
- ファンディング
- 統合化推進プログラム
2026年2月11日、国立遺伝学研究所の森 宙史 准教授らは、自身らが開発しているMicrobiome Datahubを活用して、化学合成独立栄養細菌が持つCO₂固定経路の有無をゲノムから高精度に予測するツール「AutoFixMark」を開発したことを国際的な科学データ誌「Scientific Data」に発表しました。また2月12日、情報・システム研究機構 国立遺伝学研究所、同 データサイエンス共同利用基盤施設 ライフサイエンス統合データベースセンター(DBCLS)、独立行政法人 製品評価技術基盤機構(NITE)は、本研究成果についてプレスリリースを行いました。
微生物によるCO₂固定は、炭素が制限された環境で微生物が生息するために不可欠なプロセスであり、地球全体の炭素循環において重要な役割を果たしています。化学合成独立栄養細菌は、多様なCO₂固定経路を持ち、カルビン・ベンソン回路(CBB回路)をはじめとする7種類の経路が知られています。しかし、これらの経路に関わる酵素遺伝子は多様な系統の細菌に存在しており、一部の酵素については複数の経路に関わってもいるため、ゲノム情報だけでどの経路を持っているかを正確に推定することは困難でした。細菌用の既存の代謝経路予測ツール(METABOLICやgapseqなど)は一般的な代謝経路の予測には有用ですが、多様なCO₂固定経路、特に比較的最近発見されたいくつかの経路の予測では、精度に課題がありました。
そこで、森准教授らは、経路特異的なマーカー遺伝子の定義と予測ルールを構築し、予測ツール「AutoFixMark」を開発するとともに、高品質なベンチマークデータセットを構築してその性能評価を行うことで、既存のツールでは予測が困難だったCO₂固定経路(例えば「ジカルボン酸/4-ヒドロキシ酪酸回路」や「還元的グリシン経路」など)を、高い精度で予測できることに成功しました。
AutoFixMarkの開発においては、森准教授らが開発しているデータベースMicrobiome Datahubに収載している微生物ゲノムのデータが活用され、KEGG Orthology予測ツールKofamScanを使ってゲノムごとの酵素遺伝子リストが作成されました。
MAG(Metagenome Assembled Genome)(※1)は、培養が困難な微生物のゲノムをも明らかにすることができ、微生物の多様性を解析する上で重要な手がかりとなることから、近年注目を集めています。Microbiome Datahub には、公共データベースから公開されているデータを元に構築され、品質管理を行った上で高品質なMAGデータ 22万件について、その配列情報、由来した系統やサンプル等のメタデータ、同定されたオーソログ情報、予測された機能や表現型などの情報が掲載されています。本研究で開発したAutoFixMarkを用いてMicrobiome Datahubに収載されたMAGデータやSAG(Single Amplified Genome)(※2)データに対してCO₂固定経路の予測を行うことで、多様な微生物系統におけるCO₂固定経路の分布や進化履歴を推定し、その結果をMicrobiome Datahubに掲載していく計画だと森准教授は述べています。
Microbiome Datahubは、JST統合化推進プログラムの研究開発課題「マイクロバイオーム研究を先導するハブを目指した微生物統合データベースの特化型開発」(研究代表者 森 宙史 国立遺伝学研究所 准教授)の一環で開発・提供しています。
<Microbiome Datahubの収載データ数(ver.1.0)>
- MAG: 218,248 MAGs
- メタゲノムBioProject: 102,174プロジェクト
- MAG由来タンパク質配列: 454,799,346タンパク質
用語解説
※1 MAG(Metagenome Assembled Genome): 土壌や糞便など、単離操作を経ていないサンプルから得られたゲノムデータ(メタゲノム)を再構成して得られた配列のうち、単一分類群に帰属された微生物ゲノム配列を指します。特に培養が困難な微生物の同定に有用で、微生物の多様性や微生物叢と環境との相互作用の理解に役立つほか、新規遺伝子の情報源としても注目されています。
※2 SAG(Single amplified genome): 1つの微生物細胞から単離されたDNAから決定された微生物ゲノム情報を指します。多様な環境の微生物叢の個々の微生物のゲノムを網羅的に解析するシングルセルゲノム解析の中核技術であり、培養が難しい微生物や、環境中の稀少な微生物の遺伝子を特定・研究するのに有効とされています。
関連リンク
- 論文「A curated resource of chemolithoautotrophic genomes and marker genes for CO₂ fixation pathway prediction」| Scientific Data
- プレスリリース「化学合成独立栄養細菌が持つCO₂固定経路の有無をゲノムから高精度に予測するツール「AutoFixMark」を開発」 | 国立遺伝学研究所
- ソフトウエア AutoFixMark
- データベース Microbiome Datahub
- マイクロバイオーム研究を先導するハブを目指した微生物統合データベースの特化型開発- 採択課題 | NBDCサイト
課題概要や報告書などを掲載しています。