【統合化推進プログラム】2023年度の新規採択研究開発課題を決定しました

その他
ファンディング
統合化推進プログラム
公募情報

2023年4月3日

統合化推進プログラムにおいて、5件の研究開発課題を決定しました。

今回、将来性を重視した、独自性の高い構想を持つ統合データベースの発掘・育成を目的として、試行的開発を含む萌芽的なデータベースの研究開発提案を対象とした「育成型」を新設し、従来の「本格型」とともに募集を行いました。

本プログラムの研究開発提案を2022年12月6日から2023年1月23日までの間に募集したところ、「育成型」には26件、「本格型」には6件の応募がありました。合計32件の応募は本プログラムとしては過去最多です。研究総括が研究アドバイザーなどの協力の下、書類選考と面接選考を実施し、「育成型」で3件、「本格型」で2件の新規研究開発課題を選定しました。

各研究開発課題は2023年4月1日より開始し、「育成型」は最長3年間、「本格型」は最長5年間にわたって実施します。なお、「本格型」については第5年次に実施する事後評価の結果に基づき、研究開発期間を最長5年間延長する場合があります。

採択課題一覧は以下の通り。

■区分A（育成型）：新たなデータベースの構築を目指す萌芽的な研究開発

研究開発課題	対象とする主なデータベース	研究代表者（所属機関・役職）	概要
非モデル植物のための遺伝子ネットワーク情報活用基盤	ATTED-II	大林武（東北大学・教授）	高速シークエンサー技術により、人類が多大な恩恵を受けている多様な非モデル植物のゲノム配列解析とトランスクリプトーム解析^注）が進んだ。一方で、それらの遺伝子機能の情報は常に不足しており、モデル植物からの適切な情報転移の仕組みが欠かせない。そこで、これまでに開発してきた植物の遺伝子共発現データベースであるATTED-IIを元に、遺伝子共発現ネットワークを非モデル植物研究に利用するための基盤を構築する。この目的達成のために、情報提供元となるモデル植物の遺伝子共発現情報の強化と、非モデル植物への情報転移の仕組みを構築する。本開発によって幅広い対象の植物科学研究を促進し、植物科学を基礎とする食糧、環境、工業、エネルギー問題の解決に寄与する。注）DNAマイクロアレイやRNA-seq等によって得られる網羅的な遺伝子発現情報を解析すること。
日本人塩基配列情報の公開可能なゲノム・オミクス情報基盤による双方向型研究教育データベース開発と国際連携	Japanese Open Genome Omics Platform^※	長﨑正朗（京都大学・特定教授）	ヒトゲノムには複雑な構造を持つ多型領域（構造多型）が10-20パーセント程度含まれ、多様な疾患の原因にもなっている。これらの構造の把握には塩基配列レベルでの解析が必要だが、ヒトゲノム情報の塩基配列レベルでの公開は、個人情報保護の観点からほとんどのケースで困難となっている。そこで、塩基配列レベルで公開でき、構造多型の理解を可能にする長鎖型シークエンスに基づく日本人100検体の全ゲノム情報と、構造多型のアノテーション（データに対して、メタデータと呼ばれる情報タグを付与する作業）を可能とするオミクス情報を整備し、ポータル上で公開する。また、ヒトゲノム長鎖型構造多型情報解析規格の統一を進めている組織、CoLoRSとの国際連携を通じ、国外の約2000検体の統計情報との統合を目指す。これにより、希少疾患から多因子疾患までの構造多型の理解に役立つ日本人ゲノムの情報基盤を構築する。
空間オミックスデータ解析用データベースの開発	Spatial Genomics Atlas of Cells and Tissues^※	Vandenbon Alexis （京都大学・准教授)	空間トランスクリプトーム解析は、対象とする組織の構造を保持したまま遺伝子発現情報を捕捉する測定技術であり、組織内の細胞の空間的配置と遺伝子発現が、細胞の機能や疾患状態とどのように関連しているかを明らかにすることができる。本研究開発では、主要なプラットフォームで取得されたさまざまな組織の空間トランスクリプトームの公開データを容易に閲覧できるデータベースを提供する。RNA-seqなどで明らかにした組織全体における仮説の検証や、空間トランスクリプトームの解析から得られる新たな仮説の立案を、誰にでも平易にできるようにする。

※データベース名が変更になる可能性があります。

（研究代表者氏名の五十音順）

（所属機関、役職は2023年3月時点）

■区分B（本格型）：国際的なデータ基盤となりうる本格的な統合データベースの研究開発

研究開発課題	対象とする主なデータベース	研究代表者（所属機関・役職）	概要
jPOST prime：コミュニティ連携を基盤とするプロテオームデータベース環境の実現	Japan Proteome Standard Repository/Database (jPOST)	石濱泰（京都大学・教授）	日本内外に散在する種々のプロテオーム情報を標準化・統合・一元管理し、多彩な生物種・翻訳後修飾・発現量も含めたデータリポジトリ、再解析およびデータベース部からなるプロテオーム統合データベース、jPOSTの拡充を進める。開発チームと連携ユーザーが一体となり、プロテオームデータサイエンスリソースとしての双方向利活用環境"jPOST prime"を実現し、データサイエンス研究者とデータベース研究者を融合させる。生命科学、情報科学、臨床、工学、食品分野などへ応用が可能であり、特に疾病マーカー開発や創薬標的探索研究に資する基盤構築を目指す。ProteomeXchange Consortium（PXC）、HUPOｰプロテオミクス標準化イニシアティブ、グローバル・バイオデータ連合（GBC）を通じた国際連携のさらなる強化を図る。
次世代低分子マススペクトルデータベース　シン・マスバンクの構築	Shin-MassBank^※	松田史生（大阪大学・教授）	低分子化合物の実測マススペクトル（横軸に検出された分子の質量（重さ）、縦軸にその分子の量を示す検出強度が得られる質量分析の結果）の世界標準データベースであるMassBankのデータ拡充体制を刷新し、生体由来スペクトルを追加するパイプラインを構築する。生データのリポジトリとなるMB-POSTには質量分析計から得た生スペクトルデータを収集し、MassBankには、レコードフォーマットに基づきメタデータを付与した高品質な実測マススペクトルを収集する。ヒトサンプルの高精度マススペクトルライブラリーをMassBank Human、予測マススペクトルをMassBank in silicoとしてデータベース化し、検索機能を提供することで、MassBankのヒット率を向上させる。構造アノテーションの精度不足を解決し、プロテオミクスとの連携でマルチオミクス研究に対応する。ユーザー主導の開発体制で、生物学者などのユーザーニーズを満たす次世代型データベースを構築する。

※データベース名が変更になる可能性があります。

（研究代表者氏名の五十音順）

（所属機関、役職は2023年3月時点）

研究総括による今回の公募の総評は以下の通り。

統合化推進プログラムは、公共データの利活用によるバイオデータサイエンスの健全な発展のため、その基盤となるデータベースの統合化に取り組んできました。2011年に始まった本プログラムは、2022年から4期目に入り、今回が4期の第2回募集となりました。

今回の募集では、初めての試みとして、AとBの2つの区分を設けました。区分Aは、新たに設けた「育成型」で、斬新なデータベース構築を目指す萌芽的な研究開発が対象です。区分Bは、従来と同規模の「本格型」で、国際的なデータ基盤となる本格的なデータベースの研究開発が対象です。区分Aへの反響は大きく、募集説明会への参加者も前回から倍増し、さまざまなお問い合わせも頂きました。結果的に、区分Aに26課題、区分Bに6課題の応募がありました。

これらの32課題について、8名のアドバイザーと3名の外部評価者の協力の下、厳正かつ公平に選考を進めました。区分Aでは、提案の独自性・挑戦性を重視しつつ、将来の波及効果や利用者目線を中心に評価を行いました。区分Bについては、国際的なプレゼンス、利用者目線、研究ニーズや実験技術の新しい動向への対応を重視しました。書面審査で選考した区分Aの7課題と区分Bの4課題について対面で面接選考を実施し、最終的に区分Aで3課題、区分Bで2課題を採択しました。

区分Aの採択課題のうち、一般公開可能な日本人ゲノム配列を長鎖型シーケンス情報に基づいて整備することによって構造多型の理解促進を目指す提案と、空間トランスクリプトームデータに対するユーザーニーズに応えようとする提案は、いずれも最近の技術動向を反映したものであり、特色あるデータベースの構築に取り組みます。もう1課題は、遺伝子共発現データベースのデータ拡充と機能強化によって非モデル植物の遺伝子ネットワーク理解の推進を目指す提案で、実績あるデータベースを起点にした、新たな展開が期待されます。

区分Bでは、前期までの研究開発によって世界有数のリポジトリを構築し、国際連携の中で独自の存在感を発揮するに至ったプロテオームのデータベースを採択しました。今期は、新しいコミュニティー連携の仕組みによるデータサイエンス用リソースとしての利活用促進とさらなる高度化を進めます。もう1課題は、オミクス連携を念頭に、代謝物のマススペクトルデータベースの次世代化に取り組む提案を採択しました。ともに質量分析データを扱うことから、両課題間には特に密接な連携と相乗効果が期待されます。

限られた予算の枠内では不採択とせざるを得なかった課題の中にも、有望な提案や興味深い提案が多数ありました。区分Aには、幅広い分野からの応募があり、医学系の提案が目立ちましたが、思いも寄らなかったような分野の提案も含まれていました。バイオサイエンスの裾野の広さと独自性の高いデータベースの豊かなシーズを実感し、育成型の意義を改めて認識させられました。残念だったのは、ユニークなコンテンツを持ちながらデータベース化の戦略に問題が残る提案が、少なからず見受けられた点です。効果的な育成には、魅力的なコンテンツを有する研究者とデータベース構築の専門家を橋渡しする仕組みが必要かも知れません。区分Bの不採択課題には、提案内容と予算規模・支援期間のバランスや新規開発要素という面で疑問が残った提案や、十分に魅力的な研究開発項目を含みながらも課題全体の構成では採択課題に及ばないと判断された提案が含まれていました。

データベースにもライフステージがあり、各ステージに即した支援が必要であるというのが、アドバイザーと私の共通認識です。育成型の新設によって、データベース支援のあるべき姿に向けた第一歩を踏み出すことができました。しかし、両区分の審査を通して感じたのは、維持・継続を主眼とする適正規模の支援の必要性です。支援体制の充実を実現してゆくには、データベース統合の重要性に対する理解の広がりが欠かせません。そのためにも、本プログラムの課題には、各データベースの開発を着実に進めるのみならず、相互の連携をさらに密にして統合的な利活用性を高め、バイオデータサイエンスへの貢献を最大化して頂きたいと思います。

【統合化推進プログラム】2023年度の新規採択研究開発課題を決定しました

NBDCメルマガ