KEGG Syntaxの論文公開 ~KEGGの情報に基づいて様々な生物種のゲノムを多角的に比較・解析し、系統関係を理解するための解析ツール~

  • その他
  • ファンディング
  • 統合化推進プログラム
2026年6月5日

2026年5月21日、京都大学 化学研究所の金久 實 特任教授らは、生物群をKEGGで定義しているKO(KEGG Orthology)の組み合わせによって特徴づけ、それらの生物群の類似度を比較するツールKEGG Syntax (Synteny and taxonomy) を開発し、科学雑誌「Protein Science」に発表しました。

KEGGのウェブツールとしては、遺伝子やタンパク質のリストをKEGGの代謝パスウェイやネットワークマップ上に自動的にマッピングして可視化・解析するためのツールKEGG Mapper が実装されています。KEGG Mapperがゲノム情報から生命システムの機能情報を解読するためのツール群であるのに対し、今回、新たに開発・実装されたKEGG Syntax は、KEGGのKO(KEGG Orthology)やVOG(Virus Ortholog Group)などの情報を使って、複数の生物種やウイルス間で遺伝子の並び順の類似性(シンテニー)や遺伝子の保存されたセットを比較・分析するためのツール群となっています。

KEGG Syntaxは以下の3つのツールから構成されています。1つめは「Genome Alignmentツール」で、KOやVOGを使って類似する遺伝子の並び順を比較し、Goad-Kanehisaアルゴリズムによる遺伝子類似度尺度を用いた配列比較によって、2つのゲノムの類似する遺伝子の並び順をアライメントします。これにより、2つのゲノム間で局所的に類似した遺伝子順序を持つすべての「Syntenic regions」を見つけ出すことができます。2つめは「Genome similarityツール」で、KO配列で特徴付けられたゲノムの類似性を比較することでその類似性を評価します。ここでは、生物またはウイルスのゲノムは、KOまたはモジュールの構成(固有のセット)によって特徴付けられ、類似したゲノムおよび生物群を迅速に特定するための簡便な3種類のゲノム類似性指標が導入されています。3つめは「Taxonomy Mappingツール」で、オーソログ(KOのK番号)やモジュールのM番号の組み合わせ組成などに基づいてBrite階層形式の分類ファイルにマッピングし、その進化的な関係性をKEGG分類ブラウザでデンドログラム(樹形図)として可視化します。これらを使ってさまざまな生物のゲノムを多角的に比較・分析することで、KOやVOGなどの保存された遺伝子、モジュールや保存された遺伝子順序を含む保存された遺伝子セットに基づき、生物、生物群、ウイルスの系統関係から生命の全体像を探ることができます。

また、これらのツールを使ってユーザーデータの解析もできるようになっており、一連のKO(K番号)をクエリとしてさまざまな類似度指標を用い類似するKEGG生物またはKEGG生物群を検索することができる「KO composition analysisツール」と、KOがゲノム内の順序付けられた遺伝子セットに関連付けられている場合、KOの並び順(遺伝子順序)とKEGG生物とのアライメントに基づいて保存されたシンテニーを特定する「KO sequence analysisツール」が提供されています。

詳細は、掲載論文「KEGG Syntax for comparison of organisms, organism groups, and viruses by conserved gene repertoires」をご覧ください。

KEGG Syntax は「統合化推進プログラム」の研究開発課題「ヒトゲノム・病原体ゲノムと疾患・医薬品をつなぐ統合データベース 」(研究代表者:金久 實 京都大学 化学研究所 特任教授)の一環として開発・運営されています。

図1 Genome Alignmentツールの使用例

大腸菌(eco)とサルモネラ菌(stm)のゲノムにおける遺伝子順序を、Genome Alignmentツールを使ってKO配列とVOG配列の両方で比較した例。(a) VOG配列(下)では5つの遺伝子からなる局所的なアライメントが、KO配列(上)ではこの5遺伝子セグメントを含むより長いアライメントがそれぞれ示されている。(b) 事前に計算されたVOGアライメントデータセットから、この5遺伝子セグメントはクレブシエラファージにも見られることがわかった。KEGGゲノムブラウザを用いて、ファージゲノムを含む3つのゲノムを、eco:B3064、stm:STM3208、vg:55812000の3つの遺伝子をアライメントすることで比較した。遺伝子(ボックス)の色分けは、KOの機能カテゴリーを示している。

図2 Taxonomy Mappingツールを用いた使用例

Taxonomy Mappingツールは、個々の生物を比較するだけでなく、KO構成を統合した生物群を比較し、結果として得られる類似性デンドログラムを表示する。ここに示されているデンドログラムは、6つの最上位グループと34の第二階層の真核生物グループ間の類似性関係を示している。色分けは最上位グループに基づいている。これらのデンドログラム(樹形図)は、真核生物と原核生物の区別(あるいは細菌と古細菌の類似性)と、動物、植物、菌類以外の真核生物(総称して原生生物と呼ばれる)の多様性を示している。

NBDCメルマガ

「NBDCメルマガ」NBDCの講習会・研究費公募・成果情報などを月1回お届けします。