【統合化推進プログラム】3件の2024年度研究開発課題を決定

その他
ファンディング
統合化推進プログラム
公募情報

2024年4月1日

NBDCは、統合化推進プログラムにおける3件の研究開発課題を新規決定しました。

今回の募集では、将来性を重視した、独自性の高い構想を持つ統合データベースの発掘・育成を目的として、試行的開発を含む萌芽的なデータベースの研究開発提案を対象とした「育成型」の研究開発提案を募集しました。「育成型」は前回の募集で新設した区分です。募集期間は2023年12月15日から2024年1月23日までで、応募件数は15件でした。研究総括が、研究アドバイザーの協力のもとで書類選考と面接選考を実施し、新規研究開発課題を選定しました。

各研究開発課題は2024年4月1日より開始し、最長3年間にわたって実施します。

採択課題一覧は下表の通り。

研究開発課題	主な対象データベース	研究代表者 (機関・役職)	概要
AI駆動型データキュレーションによる持続可能な中分子相互作用統合データベースの開発	MIIDB-AI	池田和由 (理化学研究所上級研究員)	中分子（ペプチド、非ペプチド、核酸など）の相互作用データベース「MIIDB-AI」を構築する。大規模なリガンド結合部位類似性データに基づいて公開データから中分子の標的相互作用部位を特定し、AlphaFoldや大規模言語モデルなどのAI技術を活用して、高い精度で効率よく標的とリガンド間の相互作用を予測し収載する。特に創薬が困難なタンパク質間相互作用（PPI）やタンパク質分解誘導の標的分子の情報を集約して収載する。中分子のバイオ・創薬研究の知識基盤データベースの構築により、未開拓の化合物空間から新規の中分子医薬品候補を効率良く見つけ出すことを可能にすることで、次世代医薬品開発への貢献を目指す。
細胞レベルの機能・表現型と遺伝子発現を関連付ける「Cell IO」データベースの開発	Cell IO^※	尾崎遼 (筑波大学准教授)	細胞型を主語にした細胞の機能と表現型を整理したデータベース「Cell IO（セル・アイオー）」を構築する。ヒト、マウス、ラットの1細胞トランスクリプトームデータと紐づく細胞の機能・表現型と摂動情報を整理し、再利用可能な形で提供する。また文献から細胞の機能に関する情報を抽出し、由来サンプル、機能・表現型、摂動の種類、生物種などのメタデータを整理することで、検索やデータの統合を容易にする。遺伝子発現を細胞の機能・表現型として解釈したり予測できるようになることで、オミクスデータから細胞の機能や表現型を予測したり、AIを使って細胞を所望の機能や表現型を示す状態に制御する研究などに貢献する。
創発的再解析のためのメタボローム統合データベース	integMET^※	早川英介 (理化学研究所研究員)	公開されているメタボロームデータから代謝物の変動傾向とメタデータの類似度に基づいて知識ネットワークとして整備したデータベース「integMET」を構築する。ネットワーク構造に付随する研究情報を機械可読性のある形で紐付けることにより、機械学習やAIに活用可能な仕組みを作り上げる。ネットワークとして体系化されたメタボロミクスデータを、実験セット横断的に再解析することで、個別データの解析からは分からなかった代謝と生命現象との関係を俯瞰的に理解できるようになる。研究リソースに制限されない大規模データ解析やデータサイエンス研究への応用など、分野横断的な新しい研究・知見の創発につながるデータベースを目指す。

※データベース名が変更になる可能性があります。

（研究代表者氏名の五十音順）

（所属機関、役職は2024年3月時点）

研究総括による今回の公募の総評は以下の通り。

研究総括：伊藤隆司 (九州大学教授)

統合化推進プログラムは、公共データの利活用によるバイオデータサイエンスの健全な発展のため、その基盤となるデータベースの統合化に取り組んできました。2011年に始まった本プログラムは、2022年から4期目に入り、2023年からは従来規模の「本格型」に加えて「育成型」の支援も開始しました。「本格型」については、第3期までと同様、第4期の最初の2年間に課題募集を行いました。一方「育成型」については、昨年に続いて、今回、2024年開始の課題の募集を行いました。

「育成型」は、斬新なデータベース構築を目指す萌芽的な研究開発を対象としています。応募時点ではデータベースの実績を問わず、構想の独自性・挑戦性と将来的な波及効果といった観点を中心に選考を行うところが、「育成型」の最大の特徴です。既存のデータベースであっても、機能拡張・新展開の部分に上記の特徴が認められるものは、「育成型」の支援対象となります。

「育成型」のいわば「2期生」を募った今回の募集には、15件の応募がありました。前回よりも応募件数は減ったものの、いずれ劣らぬ粒ぞろいの提案が集まりました。8名のアドバイザーの先生方とともに、上記の観点から厳正かつ公平に選考を進めました。書面審査に基づく合議によって選考した7課題について、対面で面接選考を実施し、最終的に3課題を採択しました。

採択課題のうち、新たな創薬モダリティとして注目を集めている中分子化合物の相互作用を扱う課題と、1細胞トランスクリプトームデータに基づいて細胞レベルの機能・表現型と遺伝子発現の間をつなごうとする課題は、ともに最近の研究動向を踏まえた提案です。もう1課題は、メタボロミクスデータの研究横断的な統合再解析に、代謝物の変動パターンやメタデータの類似性という新しい切り口から取り組む提案です。いずれの課題も独自性・将来性に富むとともに挑戦的要素も大きく、これから3年間の成果が非常に楽しみです。

予算の関係で不採択とせざるを得なかった提案の中にも、十分に魅力的で有望なものが多数ありました。思いも寄らぬ内容にアドバイザーの評価が二分された提案や、既存データベースの重要な機能拡張が着実に見込まれるが斬新さにおいては採択課題に及ばないと判断された提案などが、それらの例にあたります。いずれもが興味深い内容であっただけに、構想を強化した上での再挑戦が期待されるところです。

今回の選考にあたって特に印象的だったのは、生成AI・大規模言語モデルを何らかの形で研究開発に利用する提案が9件（60％）に及んだという点です。AIがデータベースの在り方に大きな変革を惹き起こすことは、間違いありません。AIは、データベース構築における強力なアシスタントとなるのみならず、統合的なデータベース検索のイメージを一変させるでしょう。AI時代のデータベースの作り方と使われ方に関しては、統合化推進プログラムの各課題が考えを巡らせ、さまざまな取り組みを開始しています。今回採択した3課題も含む本プログラムの課題が、アイデア・経験・ノウハウを共有しながら、バイオデータベースの変革において先導的な役割を果たしてくれることを期待しています。そのためにも、本プログラムは、今後も「育成型」を活用して、バイオデータサイエンスの推進に貢献するポテンシャルを有する斬新なデータベースを見いだし、支援していく所存です。次回の募集には、これまで以上に多様な層の研究者から、一段とユニークな提案が数多く寄せられることを期待しています。

【統合化推進プログラム】3件の2024年度研究開発課題を決定

NBDCメルマガ