国立研究開発法人 科学技術振興機構

統合化推進プログラムの新たな挑戦―新設した「育成型」にかける想いと今後の展望 (トーゴーの日シンポジウム2023)

先行研究の調査にも自ら得た実験データの考察にも、あるいは研究論文の再現性を担保するためにも、公共データベースは欠かすことができません。

NBDCの公募型研究支援制度である「統合化推進プログラム」では、こうした公共データベースの開発を支援してきました。「トーゴーの日シンポジウム2023」(2023年10月5日開催) では、「統合化推進プログラムの新たな挑戦」と題し、本プログラムの研究総括である伊藤隆司氏 (九州大学 教授) にプログラム運営方針や今後の展望をご講演いただきました。

講演者

伊藤隆司氏の顔写真

伊藤 隆司
NBDC統合化推進プログラム 研究総括
九州大学 大学院医学研究院教授

広範なユーザーの知識発見の支援、国際的なプレゼンス、新たな動向への対応、「つなぐ」から「使う」へ

講演スライド1枚目。統合化推進プログラム。2011年に第1期が開始  (トーゴーの日シンポジウムも)。過去3期で計31課題を支援。2022年に第4期が開始。広範なユーザーの知識発見の支援。国際的プレゼンス。新しい動向。「つなぐ」から「使う」へ。研究アドバイザー8名の氏名および所属・役職一覧。岩崎  渉 東京大学  大学院新領域創成科学研究科  教授。鎌田  真由美  京都大学  大学院医学研究科  准教授。坂井  寛章 農業・食品産業技術総合研究機構  高度分析研究センター  ユニット長。清水  佳奈 早稲田大学  理工学術院  教授。瀬々  潤  (株)ヒューマノーム研究所  代表取締役社長。馬場  健史  九州大学  生体防御医学研究所  教授。山本  一夫  千葉大学  大学院医学研究院  特任教授。吉田  哲郎  アクセリード(株)  新技術評価リード。

九州大学の伊藤です。統合化推進プログラムについて少しご紹介をさせていただきます。

このプログラムは2011年に第1期が始まりました。この「トーゴーの日シンポジウム」という名称でシンポジウムが始まったのもこの年であったと記憶しています。これまでの3期を通じて31件の課題を支援しており、昨年から第4期に入っております。今ここに挙げた8名のアドバイザーの先生方のご協力を得ながら、第4期を進めているところです。

本プログラムはデータを統合していくために始まったプログラムですが、第4期ではそれに加え、広範なユーザーの知識発見を支援してもらえるようなデータベースの開発をお願いしています。それぞれの研究コミュニティに立脚していただくことは絶対に必要ですが、そこに閉じずに、そのコミュニティ以外の人が、そのコミュニティのデータを自分の研究に使う際の入り口となるようなデータベースを作っていただきたいと考えています。

それから、国際的なプレゼンスを示してくださいということ。これは国際連携の一翼をしっかりと担っていただく、あるいは他の国には全く例がないような突出したものを作ってくださいと話しています。

それから、先ほどの山西先生、岡田先生のご講演にもありましたように、近年、様々な新しい動向が出てきています。データベースを使うところでもAIが非常に重要になってきていますが、データベースそのもののあり方にもこれから色々な影響を与えてくるだろうと思いますので、そうした新しい動向への対応ということにも気を使っていただきたいと申し上げています。

こうして「データをつなぐ」ということを10年間ずっとやってきているわけですけれども、つなげてきたデータをいかに使うかというところにも、少しシフトしていく必要があるだろうと考えております。

2022年度採択6件――バイオイメージ、マイクロバイオーム、転写制御基盤など

講演スライド2枚目。統合化推進プログラム(2022年度採択課題)。採択課題6件の課題名、代表者名、代表者の所属・役職が書かれている。バイオイメージングデータのグローバルなデータ共有システムの構築  大浪修ー(理化学研究所・チームリーダー)  SSBDデータべース。統合的な転写制御データ基盤の構築  粕川雄也  (理化学研究所・チームリーダー)  INTRARED。ヒトゲノム・病原体ゲノムと疾患・医薬品をつなぐ統合データベース  金久實  (京都大学・特任教授)。KEGG  MEDICUS。異分野融合を志向した糖鎖科学ボータルのデータ拡充と品質向上  木下聖子  (創価大学・教授)。GlyCosmosPortal。蛋白質構造データバンクのデータ駆動型研究基盤への拡張  栗栖源嗣  (大阪大学・教授)。PDBj。マイクロバイオーム研究を先導するハプを目指した微生物統合データベースの特化型開発  森宙史  (国立遺伝学研究所・准教授)。Microbiome  Datahub。

このスライドには、2022年度に採択させていただいた6つの研究課題を示しました。このうち3件は継続の課題(開発対象とするデータベースは同一で、研究開発内容が異なる課題)、新たに始まったのが3課題です。そのうち大浪先生のイメージングデータは、以前にも支援させていただいていたデータベースです。これらのうち、新しく採択した課題について、少しだけご紹介させていただきます。

講演スライド3枚目。2022年度採択課題:SSBDデータべース(大浪)。4つの画像が掲載されている。(1) 2021年にNature Methodsに掲載されたホワイトペーパーの画面キャプチャ。(2) SSBDに掲載されている画像の例。 (3) SSBD:database、SSBD:repository の掲載データの経年変化グラフ。(4) SSBDデータベースのエコシステムの図説。レポジトリ、付加価値データベース、画像解析、画像撮影の4つの要素間でのデータのやりとりが記載されている。

大浪先生の「SSBDデータベース」は、バイオイメージデータという非常に大きなテーマを扱っています。国際的な連携の一角を担い、リーダーシップを取りながら進めておられ、大きな成果を期待しているところです。

講演スライド4枚目。2022年度採択課題:Microbiome  Datahub(森)。MicrobeDB.jpをマイクロバイオームに特化した統合DBに作り変える。爆発的なデータの増加に対応し、いち早くデータを収録。マイクロバイオームデータに特化した検索機能やUI。様々な解析ワークフローに対応したデータ解析機能の実装。爆発的な勢いで増加するマイクロバイオームデータをいち早く収録し、検索・解析可能な統合DBとして、MicrobeDB.jp  をマイクロバイオーム研究の国際的なデータハブへ発展させる。Encyclopedia  的な  MicrobeDB.jp  から目的指向性の強い  Microbiome  Datahub  へ。

これは森先生の「Microbiome Datahub」というデータベースです。これまで、遺伝研の黒川先生が「MicrobeDB.jp」という微生物ゲノムのエンサイクロペディア的な統合データベースを作ってこられました。このデータベースを足がかりに、いま非常に注目されているマイクロバイオーム、特にマイクロバイオームデータから作られる MAG (メタゲノム・アッセンブルド・ゲノム) に中心を置き、そこに特化した目的志向性の強い統合データベースを作るということで、森先生に頑張っていただいているところです。

講演スライド5枚目。2022年度採択課題:INTRARED(粕川)。INTRARED  の画面キャプチャ画像の下に「トランス因子とシスエレメントのデータ統合による相乗効果」と書かれている。

それから粕川先生の「INTRARED」。今日この後ご本人からご紹介がありますが、これは先ほどのご講演の中にも出てきていた沖先生のChIP-Atlasと粕川先生たちが作られるシスエレメントデータベースのfanta.bioの間に、非常に大きな相乗効果があるだろうということを期待しています。遺伝子転写発現制御の統合的なデータ基盤が我が国でできあがることを期待しています。

2023年度採択① プロテオーム、メタボローム

講演スライド6枚目。統合化推進プログラム(2023年度採択課題)。「jPOSTprime:コミュ二ティ連携を基盤とするプロテオームデータベース環境の実現」石濱泰(京都大学・教授)。jPOST。「次世代低分子マススペクト丿レデータベースシン・マスパンクの構築」松田史生(大阪大学・教授)。ShinーMassBank。

このスライドには、今年度、従来と同様の「本格型」として採択した2課題を示しました。1つがプロテオームのデータベース、もう1つがメタボロームのデータベースで、奇しくもどちらも質量分析のデータを扱うデータベースとなりました。jPOSTは、石濱先生を中心に非常に大きな成果をすでに挙げておられるデータべースです。

講演スライド7枚目。2023年度採択課題:Shin-MassBank(松田)。Shin-MassBank (シン・マスパンク) 1.MB-POST Modification of jPOST repository. Raw spectra data repository. Reprocessing pipeline. High quality mass spectral library of human metabolites. Averaging for noise reduction. In silico predicted mass spectral DB. Structural annotation + Manual curation. 4.MassBank. Measured mass spec DB. Spectra data. Multiomics research. Data-driven science. Finding Known-unknowns. Partial elucidation. Novel functions for mass spec analysis. Improved hit rate Cataloging. Fundamental of LS.

松田先生のShin-MassBankは、以前からあったMassBankの機能をさらに拡張していこうとするもので、新たにレポジトリMB-POSTを作り、様々な研究も加えながら、最終的にはMassBankのヒットレートを上げていこうというものです。質量分析のコミュニティ全体でサポートする形でこのShin-MassBankを進めていただくということになっております。

2023年度採択② 新たな挑戦の第一歩としての「育成型」公募 3件採択

講演スライド8枚目。統合化推進プログラム(2023年度採択課題)。育成型3件の課題名、代表者名、代表者の所属・役職、データベース名が書かれている。課題情報の下には「統合化推進プログラムの新たな挑戦の第一歩」と書かれている。非モデル植物のための遺伝子ネットワーク情報活用基盤。大林 武 (東北大学・教授)。ATTED-II。日本人塩基配列情報の公開可能なゲノム・オミクス情報基盤による双方向型研究教育データベース開発と国際連携向上。長﨑 正朗 (九州大学・教授)。Japanese Open Genome Omics Platform。空間オミックスデータ解析用データベースの開発。Alexis Vandenbon (京都大学・准教授)。Spatial Genomics Atlas of Cells and Tissues。

2023年度の採択で一番強調したいのは、ここに挙げた「育成型」です。

今回、「育成型」を初めて公募し、この枠で、大林先生、長﨑先生、Vandenbon先生の3つのデータベースを採択させていただきました。今日は、後程、大林先生からご紹介があるかと思います。

講演スライド9枚目。図が2つ掲載されている。(1)「統合化推進プログラム  2024年度公募実施予定」と書かれたウェブページの画面キャプチャ画像。(2)  「新たなデータベース構築の第一歩を支援」と書かれた公募予告のフライヤー。

今日、申し上げたいことは、実はこの「育成型」が、統合化推進プログラムにおける新たな挑戦の第1歩であるということです。一歩は踏み出したんですけどそこで止まってしまってはいけないので、次も是非、「育成型」の公募を継続したいと考えております。すでに予告は出しておりますし、予告チラシは、今日の会場に置いてあるかもしれません。ぜひ、皆さんの積極的な応募を期待しております。さらに言うと、お近くの方にもぜひ拡散していただければよろしいかなと思います。

データベースの「ライフステージ」 維持・継続に主眼を置いた支援も必要

講演スライド10枚目。ライフステージに応じたDB支援の複線化。試験的支援による発掘・育成。本格的支援による成長・確立。別枠の支援による維持・継続。データベース・アーカイブ。

こうしたことを考えていますのは、この統合化推進プログラムに関わってきますといくつか感じることがあるからです。1つは、これまで本格的な支援でデータベースをしっかりと育てて確立してきましたが、やはり新しいものを掘り出して育て上げるフェーズも必要だという風に考えています。もう1つ考えているのは、データベースにはやはり「ライフステージ」みたいなものがあるということです。非常にできあがってきたデータベースは維持・継続が非常に大切になってくるので、そちらに主眼を置いたようなサポートの仕方があっても良いでしょう。また、データベースのアーカイブという考え方は、すでにもう行われていることです。

講演スライド11枚目。スライド8枚目に、テキストが追加されている。「試験的支援による発掘・育成」の横に「昨年度開始の育成型」。「本格的支援による成長・確立」の横に「従来からの本格型」。「別枠の支援による維持・継続」の横に「データ更新の代行?」。「データベース・アーカイブ」の横に「永代供養」。また、「別枠の支援による維持・継続」の文字が目立つように赤くなっていて、一番下に「統合化推進プログラムの新たな挑戦における次の一歩」と書かれている。

ということで、昨年度始めた「育成型」、従来からやってきた「本格型」、それにデータ更新の代行と言ったら変ですけれども、「維持を中心としたような支援」があっても良いのではないかということを考えています。そして、現時点で無いのはここだということで、次の一歩というのは、こういうところになると思っております。

バイオデータリソースの維持は国際的にも大きな課題 国際動向を見極めつつの支援策検討が必要

講演スライド12枚目。「バイオデータリソースのサステナビリティ。世界共通の課題」というタイトルで、GLOBAL  BIODATA  Coalitionのウェブサイトの画面キャプチャ画像が掲載されている。その画像の上に「世界中のライフサイエンスおよび生物医学研究にとって長期的な持続性が重要と考えられる37リソースを認定」「日本が関与するものとしては、DDBJ、PDB、PXCが選定」と書かれている。

バイオデータリソースのサステイナビリティというのは、日本だけの問題ではなく国際的にも大きな問題です。「Global Biodata Coalition」という取り組みが始まり、昨年、維持するべき「グローバル・コア・バイオデータリソース」というものが認定されました。統合化推進プログラムに関係するものとしては、栗栖先生のやっておられますPDBj、石濱先生のやっておられますjPOSTがそれぞれメンバーとして加わっておられるwwPDBとProteomeXchange Consortiumが選定されました。こういった国際的な動向も見ながら、こういったデータベースをきっちりサポートしていくということを考える必要もあるだろうと感じています。

公共データの利活用環境整備が、研究の多様性確保につながり、生命科学の未来を創る

講演スライド13枚目。我が国のバイオサイエンスの状況。研究環境の格差が拡大し、研究の機会均等性の喪失。先端研究手法・先端機器へのアクセシビリティには大きな格差。研究(者)の多様性の喪失。現行の科学政策に適応した研究者のみが繁栄、それ以外は絶滅の危機?。研究(者)多様性保全策としての公共データの統合的利活用環境。研究環境に恵まれない研究者にとっての生存戦略のひとつ。公共性に富む本プログラムのもうひとつの意義。

ちょっと話題を変えてバイオサイエンスの状況を考えてみますと、次々と先端的な研究手法やすごい機器が出てくるんですが、いずれも高額で、そのアクセシビリティには実際大きな格差が生じています。つまり、研究環境の格差は拡大し、機会均等性が失われつつあるような気がいたします。現行の科学政策あるいはトレンドに適応した研究者のみが繁栄し、それ以外のinterestに基づいて研究している方が下手すると絶滅しかねない、研究者・研究の多様性が失われつつあるのではないかという危惧を持っております。こうした多様性がなくなったところに進化はないということは、生命に関わる方々は深く認識しておられるところだと思います。

この多様性の保全策として1つ、この公共データの統合的な利活用環境を整えるということは大切なことではないかと考えています。それが研究環境に恵まれない研究者にとっての1つの生存戦略になり得るのではないかという期待をしています。今日の山西先生や岡田先生のご講演では、公共のデータを上手に使うといかに素晴らしいことができるかという非常に良い例を聞かせていただいたような気がいたします。より多くの研究者の方々がこういったことをより敷居が低くできるような環境を提供するというところが、我々の1つの目的、存在意義かもしれないということを考えております。

「水を飲んだら井戸を掘ってくれた人のことを思え」――データベースの構築・維持を評価する枠組みが必要

講演スライド14枚目。DBを評価する風土・文化の醸成にご協力を。データベースの基本は「小確幸」(© 村上春樹)。無駄な研究活動の回避という見えない貢献。データベースの構築と維持は工ッセンシャルワーク。出口しか評価しない風土・文化からの脱却(飲水思源)。評価軸も複線化が必要。

最後に、データベースというのはある意味、本当にインフラもインフラです。データベースの基本、私は目立つ成果というよりも「小確幸」、これは村上春樹の言葉だそうですけれども「小さな確かな幸せ」だと思うんですね。ちょっと調べてみたいことからタタタタタッと繋がっていろんなことが分かる、そのおかげでどれぐらいの無駄な研究活動が回避されているかというところに想像力を働かせるべきだと思います。「派手なジャーナルに出ました、パチパチ」、これはナントカでも分かることなんですけれども、想像力を働かせるところが人間の人間たる所以ではないかと思います。データベースの構築と維持というのは、まさにエッセンシャルワークだと思います。したがって、こういったところをきちんと評価する仕組みが必要で、誰が見ても分かる出口しか評価しない風土や文化から脱却する必要があると思います。

データベースは「水」だと言いましたけれども、中国の古い言葉には「飲水思源」、水を飲んだら井戸を掘ってくれた人のことを思え、という言葉があるんだそうです。まさにこういうマインドセットが必要ではないかと考えております。そういった意味では評価軸というのも複線化する必要があると常々考えています。

このようなことを考えておりますので、皆さんのご賛同が得られてご協力がいただけるとありがたいなと考えております。私からは以上です。

「トーゴーの日シンポジウム2023」について

「トーゴーの日シンポジウム2023」は、生命科学研究が変わりゆくなかでのデータベースの役割を議論として、2023年10月5日、日本科学未来館にて開催しました。
各ご講演者の講演資料、動画はシンポジウム特設サイトからご覧いただけます。

開催概要

  • 名称
    トーゴーの日シンポジウム2023
  • 日時
    2023年10月5日 (木) 14:00~17:55
  • 会場
    日本科学未来館 7階 未来館ホール (東京都江東区青海2丁目3-6)
  • 主催
    国立研究開発法人科学技術振興機構 (JST)
  • 後援
    内閣府・文部科学省
  • ハッシュタグ
    #togo2023
  • ウェブサイト

AJACSウェビナー

染色体高次構造の基礎、Hi-C解析手法の原理と実践的な解析の流れまでを解説!
データ解析講習会:AJACS「Hi-C解析を知って・学んで・使う」 は2025年1月16日開催です。