統合化推進プログラムにおける3件の研究開発課題を新規決定
- その他
- ファンディング
- 統合化推進プログラム
- 公募情報
2025年4月1日、ライフサイエンスデータベース統合推進事業の統合化推進プログラム (DICP) において3件の研究開発課題を新たに決定し、プレスリリースをおこないました。各課題は2025年4月1日から最長3年間にわたって実施されます。
今回の募集では、前回に引き続き、「育成型」の研究開発提案を対象としました。育成型は、(1) 新たなデータベースの構築、(2) 構築中のデータベースの一般公開、(3)公開済みデータベースの国際的な地位確立など、データベースを育て拡張する研究開発課題を支援するものです。
今回の募集期間は2024年12月20日から2025年1月27日までで、応募件数は25件にのぼりました。応募提案の選考は、研究総括が研究アドバイザーおよび外部評価者の協力の下で書類選考と面接選考がおこなわれました。
研究総括は、プレスリリースの総評のなかで、応募提案の研究分野の多様化と各提案の質の向上が特に印象的であったと述べ、選考が難航したと振り返っています。また、AI時代におけるデータベースの在り方につき、本プログラムの参画者が互いにさまざまな視点から議論し、具体的な取り組みを進めていることを踏まえ、バイオデータベースの変革をリードしていく期待を述べています。
採択課題は下表の通りです。
研究開発課題 | 対象とする主なデータベース | 研究代表者 (所属機関・役職) | 概要 |
---|---|---|---|
大規模言語モデルを活用した病的スプライシング変異データベースの自律的構築 | SSCV DB |
白石 友一 |
公共のトランスクリプトームデータからスプライスサイト生成変異(SSCV)を同定・収載した「SSCV DB」を発展させ、大規模言語モデルを用いて病的可能性を予測し、疾患との関連性情報を提供する。また、公共のトランスクリプトームデータから自動的にSSCVを検出し、データベースを自動更新するパイプラインを開発する。遺伝性疾患やがん発生の原因ともなるSSCVの同定は、従来のゲノム解析では難しく見落とされがちだったが、本データベースによりSSCVと疾患との関連性を明らかにすることで、SSCVの検出による疾患診断法やSSCVを標的とする核酸医薬の研究開発などへの寄与を目指す。 |
4Dゲノム状態の理解と可視化を支援するデータベースの構築 | PHi-C database |
新海 創也 |
独自に開発した解析手法(PHi-C)を用いて、公共の3次元ゲノム構造データ(Hi-Cデータ)に対し、動的な3次元ゲノム構造(4Dゲノム状態)を網羅的に解析・可視化する「PHi-C database」を構築する。GPUサーバーを用いてPHi-C計算の高速化と大規模化を進め、複数のHi-Cデータを直感的に比較・理解できる4Dゲノム情報の統合的可視化基盤を実現する。本データベースを通じて、真核生物における生命現象の解明に不可欠な細胞核内におけるゲノムDNAの動的な高次構造情報を提供し、シミュレーションや理論解析、ゲノム統合解析を通じた新たな仮説の創出や知識発見への貢献を目指す。 |
化合物と個体をつなぐ毒性病理画像データベースCuraToxiiの開発 | CuraToxii |
水野 忠快 |
毒性病理の専門家の連携に基づいて収集・体系化した毒性病理画像のデータベース「CuraToxii」を構築する。毒性病理画像およびメタ情報の提供のほか、深層学習モデルの開発や毒性評価への応用を支援するためのベンチマークデータセットの構築、リーダーボード機能、動的データ取得機能などを実装し、利便性を高める。本データベースによって毒性病理画像のファイル容量に起因する操作性の低さやデータ入手性の悪さといった既存の課題を解決し、化合物が個体に与える影響の理解に重要な情報を提供する。医薬品安全性評価の効率化・高度化とともに、化合物-個体の関係性理解深化に基づく創薬研究の加速化などへの貢献を目指す。 |
※データベース名は変更の可能性があります。
(研究代表者氏名の五十音順)
(所属機関、役職は2025年3月時点)
研究総括による今回の公募の総評は以下の通り。
研究総括:伊藤 隆司 (九州大学 教授)
統合化推進プログラムは、公共データの利活用によるバイオデータサイエンスの健全な発展のため、その基盤となるデータベースの統合化に取り組んできました。2011年に始まった本プログラムは、2022年から4期目に入り、2023年からは従来規模の「本格型」に加えて「育成型」の支援も開始しました。
「育成型」は、斬新なデータベース構築を目指す萌芽的な研究開発を対象としています。その最大の特徴は、応募時点ではデータベースの実績を問わず、構想の独自性・挑戦性と将来的な波及効果といった観点を中心に選考を行う点にあります。既存のデータベースであっても、機能拡張・新展開の部分に上記の特徴が認められれば、支援対象となります。
今回で3回目となる「育成型」の課題募集には、25件の応募がありました。7名のアドバイザーの先生方と共に、5名の外部評価者から頂戴した11件の評価も参考にしながら、厳正かつ公平な選考を実施しました。書面審査に基づく合議を経て7課題を選出し、その後、対面での面接審査を行い、最終的に3課題を採択しました。
採択された課題は、いずれも独自性と将来性に富み、挑戦的な取り組みです。公共データからスプライシング異常を独自手法で収集したデータベースを大規模言語モデルによる疾患との関連付けによって高度化する課題や、医薬品開発に不可欠でありながら取り扱いの難しい毒性病理画像の利活用を促進するデータベースの構築は、ともに医学分野の重要課題に正面から取り組むものです。また、核内高次構造データに独自手法を適用し、その動的側面を解明する課題は、基礎研究の色彩が強いものの、こうして高度化されたデータの提供がもたらす波及効果に期待が寄せられます。これらの研究が今後3年間でどのような成果を生み出すのか、非常に楽しみです。
一方で、不採択課題の中にも、極めて魅力的で有望なものが多数ありました。前回応募時の評価コメントに真摯に対応し、研究計画を着実にブラッシュアップした提案も見受けられ、限られた採択枠の中で選外とせざるを得ないことを心苦しく感じました。また、アドバイザーの評価を二分した課題の中には、リスクを取ってでも挑戦してみたいと思わせるものもありました。今後の予算増額による採択枠拡充の必要性を改めて痛感しました。
今回特に印象的だったのは、応募分野の広がりと提案の質の向上です。分野の拡大に伴い、より専門性の高い視点を確保するため、外部有識者の先生方のご意見を頂きました。提案の質の向上は喜ばしいことでしたが、選考を一層難しくする要因ともなりました。また、大規模言語モデルや生成AIを活用した提案が前回に引き続いて今回も急増しており、生成AIがデータベースの構築と維持のみならず、その利活用においても不可欠な要素となりつつあることを改めて実感しました。AI時代におけるデータベースの在り方については、本プログラムの各研究課題がさまざまな視点から議論を深め、具体的な取り組みを進めています。今回採択された3課題を含め、本プログラムがアイデアやノウハウを共有しながら、バイオデータベースの変革をリードしていくことを期待しています。
今後も本プログラムは、「育成型」の枠組みを活用し、バイオデータサイエンスの発展に貢献する斬新なデータベースを発掘・支援していきます。次回の募集では、さらに多様な研究者から、よりユニークで挑戦的な提案が寄せられることを心待ちにしています。