国立研究開発法人 科学技術振興機構

ポスター発表

タイムテーブル

14:20~15:20 ポスター発表 第1部
15:25~16:25 ポスター発表 第2部
16:30~17:30 ポスター発表 第3部
番号 タイトル
代表発表者(所属)
1 第1部 NBDCの提供するサービスの紹介 動画あり
井手 隆広(NBDC)
2 第2部 MEDALS:データ活用に向けた再構築連携
福井 一彦(産総研)
3 第3部 DDBJサービスの統合化を目指して
藤澤 貴智(遺伝研)
4 第1部 統合データベース探索フレームワークTogoDXの開発とその応用
高月 照江(DBCLS)
5 第2部 TogoID: データベース統合の基盤となるID変換サービス
池田 秀也(DBCLS)
6 第3部 より繋がりやすいRDFデータの構築に向けて
山本 泰智(DBCLS)
7 第1部 SPARQL support の機能開発
守屋 勇樹(DBCLS)
8 第2部 食品オントロジーの構築
樋口 千洋(NIBIOHN)
9 第3部 Yevis: 再利用性の高いワークフローを共有するためのレジストリ構築システム
大田 達郎(DBCLS)
10 第1部 MicrobeDB.jpからMicrobiome Datahubへ: 微生物・植物・メタボロームのデータ統合と統合微生物データベースの再構築
藤澤 貴智(遺伝研)
11 第2部 微生物研究管理プラットフォームを活用した住環境マイクロバイオームのメタ解析
伊藤 光平(BIOTA)
12 第3部 MBGD 2022: 大規模な微生物オーソログデータベースの効果的な活用に向けて
内山 郁夫(NIBB)
13 第1部 NITE 新システムのご紹介 ~「ScreenHit」と「cereco」~
大塚 梨沙(NITE)
14 第2部 DBRP(生物資源データプラットフォーム)のアップデート
八塚 茂(NITE)
15 第3部 植物ゲノム情報ポータルサイト「Plant GARDEN」の改訂(2022年度・第2四半期版)
市原 寿子(かずさ研)
16 第1部 植物ゲノム統合データベースPlant GARDEN、微生物、メタボローム統合データベース間の連携検索システムの開発
平川 英樹(かずさ研)
17 第2部 理研BRC植物バイオリソースRDFデータの作成とその運用
櫛田 達矢(理研)
18 第3部 Pedigree Finder Ontology (PFO) の開発
鐘ケ江 弘美(農研機構)
19 第1部 深層学習のための病害虫被害画像データベースの構築
岩崎 亘典(農研機構)
20 第2部 日本人ゲノムバリアント統合データベースTogoVarの機能拡張
三橋 信孝(DBCLS)
21 第3部 ゲノム編集メタデータベースの開発 -文献からの情報抽出-
鈴木 貴之(広島大)
22 第1部 マウスゲノム多型データベースMoG+の高度化とその利用
高田 豊行(理研)
23 第2部 MOCCS-DB: ヒト転写因子認識配列の多様性データベース
田原沙絵子(筑波大)
24 第3部 RNAseqChef: 遺伝子発現変動を自動的に可視化するRNA-seq統合解析ツール
衛藤 貫(熊本大)
25 第1部 遺伝子共発現データベースCOXPRESdb
大林 武(東北大)
26 第2部 Linked Open Data を利用したアラインメントビューアの開発
藤 博幸(関西学院大)
27 第3部 天然変性タンパク質データベース:IDEAL 動画あり
安保 勲人(前橋工科大)、佐久間 航也(名古屋大)
28 第1部 蛋白質構造データバンク(PDB)およびBMRB、EMDB 動画あり
工藤 高裕(大阪大)
29 第2部 電子顕微鏡生データアーカイブ EMPIAR の紹介
常住 規代(大阪大)
30 第3部 jPOST:「コミュニティ・ベース論文調査」によるメタデータキュレーションの加速
吉沢 明康(富山国際大)
31 第1部 GlycoNAVI: やさしい糖鎖データ検索のための統合化 動画あり
山田 一作(野口研)
32 第2部 糖鎖構造の編集やデータベース検索が可能なウェブインターフェイスGlycanBuilder2-webの開発
土屋 伸一郎(野口研)
33 第3部 LM-GlycomeAtlas Ver.2.1:レクチンを利用した組織グライコーム・データベースのアップデート
岡谷 千晶(産総研)
34 第1部 UniCarb-DR: MIRAGE ベースのグライコミクス MS/MS スペクトルデータリポジトリ
高橋 悠志(創価大)
35 第2部 糖鎖構造抽出ソフトウェアを用いた化合物データベースとの連携
松原 正陽(野口研)
36 第3部 ウイルスタンパク質のKOとオーソログクラスター
金 昭(京都大)
37 第1部 糖鎖関連データベースの連携強化 動画あり
藤田 典昭(産総研/創価大)
38 第2部 メタボローム統合データベースMetaboBank
長崎 英樹(かずさ研)
39 第3部 二次代謝物データベースKNApSAcK family DBの開発とデータサイエンス
金谷 重彦(奈良先端科学技術大)
40 第1部 jMorp: Japanese Multi Omics Reference Panel
田高 周(東北大)
41 第2部 オミクスデータ科学を支えるMS-DIALワークベンチの開発 動画あり
津川 裕司(東京農工大)
42 第3部 SSBD:database/repository バイオイメージングデータのグローバルなデータ共有 動画あり
糸賀 裕弥(理研)
43 第1部 BD-zarr: 生命現象の時空間動態データを記述するための次世代フォーマットの開発 動画あり
京田 耕司(理研)
44 第2部 DDrare Update ~難病・希少疾患創薬データベースの更新~
坂手 龍一(NIBIOHN)
45 第3部 小児慢性特定疾病児童等および指定難病患者データベースの連結による利活用推進研究
山﨑 千里(NIBIOHN)
46 第1部 文献およびゲノム解析データベースを利用したヒト疾患原因変異の解析例 動画あり
鴨下 信彦(自治医科大)
47 第2部 PubCaseFinder 2022 update: 全ゲノム解析の社会実装に向けたVirtual Gene Panel構築機能の提案
申 在紋(DBCLS)
48 第3部 症例情報管理システムの構築と公開
地引 芳乃(明治大)
49 第1部 PubMedによる指定難病と他疾患との創薬研究動向の比較
平田 誠(NIBIOHN)
50 第2部 難病における臨床試験中の治療薬と疾患遺伝子のパスウェイ解析
田辺 麻央(NIBIOHN)
51 第3部 リン酸化活性測定をもとにした薬剤応答データベースPhosprofの開発
鍵和田 晴美(産総研)
52 第1部 SIP由来バイオデータのポータル構築とRDFアクセス制御
畠中 秀樹(DBCLS)
53 第2部 TogoTV: バイオインフォマティクスツールとデータベースの動画教材・資料および生命科学イラストのためのポータルサイト
小野 浩雅(DBCLS)
54 第3部 研究データ管理の知識情報を共有するRDMkit-jpの開発
大波 純一(NII)
55 第1部 バイオサイエンスデータベースの俯瞰調査
NBDC事業推進部 研究開発推進グループ

NBDCの提供するサービスの紹介

番号 1
第1部
発表者 ○井手 隆広(NBDC)、眞後 俊幸(NBDC)、建石 由佳(NBDC)、宮崎 敦子(NBDC)、 片山 俊明(DBCLS)、川島 秀一(DBCLS)、畠中 秀樹(NBDC/DBCLS)、栗原 英輔(日立製作所)、左近 雪絵(日立製作所)、杉崎 太一朗(三井情報)
要旨

JST/NBDC事業推進部では、生命科学分野におけるデータベースの統合と利用促進のために下記のサービスを提供している。

  • Integbioデータベースカタログ:国内で産出された生命科学分野におけるデータベースを調査・収録し、世界中の主要なライフサイエンスデータベースと共に基本情報を提供している。
  • 生命科学系データベースアーカイブ:国内で産出された生命科学分野のデータベースを保管し、長期間・安定的に公開するサービスである。現在、153件のデータベースが利用でき、その一部では簡単な検索ができる。
  • 生命科学データベース横断検索:生命科学分野の公開データベース、文献、特許情報を含む760を超えるデータベースに対する全文検索サービスである。
  • NBDC RDFポータル:RDF形式のライフサイエンスデータベースを集め、SPARQL言語による検索とデータセットのダウンロードを提供している。
発表資料

NBDCの提供するサービスの紹介(PDF:1.24MB)

動画

NBDCの提供するサービスの紹介|JST Channel

MEDALS:データ活用に向けた再構築連携

番号 2
第2部
発表者 雨宮 崇之(産総研)、鍵和田 晴美(産総研)、福西 快文(産総研)、○福井 一彦(産総研)
要旨

産業技術総合研究所では、省庁間連携の一環として生命科学系データベースの統合に向けたポータルサイトであるMEDALSの運用を行っている。MEDALSではデータベースの利活用を目的として、データの統一化のため経済産業省関連プロジェクトにより構築されたデータベースの再構築(RDF化)に取り組んでいる。ここでRDF化されたデータは、生命科学系データベース アーカイブやRDFポータルで公開されているデータベースに組み込まれSPARQL検索を可能としている。またMEDALSでは、便覧や成果等を整理し、カタログや横断検索の連携を行いライフサイエンス分野における研究開発の促進に資するデータベースや解析ツールの情報配信を行っている。加えて分子プロファイリングに基づく薬剤変動関連のデータベース構築や情報統合DBサイトなどで公開してきた解析ワークフローサービスをデータ再構築連携に取り入れ、データベースとツールの連携に取り組んでいる。この解析ではデータベースのRDF化に伴い、開発した高度な解析ツール群を広く利用可能とするために、セマンティック技術に対応したフレームワークを用い、NBDCのエンドポイントと連携可能なWEBインターフェイスを用いたワークフローの開発を実施している。

発表資料

MEDALS:データ活用に向けた再構築連携(PDF:1.63MB)

動画 なし

DDBJサービスの統合化を目指して

番号 3
第3部
発表者 ○藤澤 貴智(遺伝研)、小笠原 理(遺伝研)、中村 保一(遺伝研)、有田 正規(遺伝研)
要旨

DDBJセンターは、 国立遺伝学研究所スーパーコンピュータの計算機リソースを利用して国内外の生命科学研究から産出されるデータの収集・共有を行うと共に、解析プラットフォームを提供している。また、NCBI、EBI と共同運営する国際塩基配列データベース INSDCを中心にデータベースの構築・運用をしている。DDBJセンターが提供するデータベース・レポジトリは、塩基配列データ(DDBJ)、新型シークエンスサーが産出するデータ(DRA)、機能ゲノミクスデータ(GEA)、研究プロジェクト・サンプル情報のメタデータ(BioProject・BioSample)、メタボローム研究データ(MetaboBank)と多様なデータ種別を扱っている。また、NBDCと共同でヒト制限公開データベース(JGA)も運用している。これらの各データベースは異なる開発時期、異なる仕様・実装のシステムで構成されたデータベースのため、運用コストの増大が大きな課題である。
我々は、課題解決のためデータベース機能のマイクロサービス化を目指してこれまでにおいてユーザ認証機能および検索機能についてサービスの統合化を一部実施した。本発表では、2022年6月にリリースしたゲノム等の大規模配列登録システムを中心に報告するとともにデータ登録インターフェースおよびメタデータ登録形式の仕様について議論する。

発表資料

DDBJサービスの統合化を目指して(PDF:4.46MB)

動画 なし

統合データベース探索フレームワークTogoDXの開発とその応用

番号 4
第1部
発表者 池田 秀也(DBCLS)、井手 隆広(NBDC)、大田 達郎(DBCLS)、小野 浩雅(DBCLS)、片山 俊明(DBCLS)、川島 秀一(DBCLS)、申 在紋(DBCLS)、〇高月 照江(DBCLS)、建石 由佳(NBDC)、千葉 啓和(DBCLS)、豊岡 理人(NBDC/現:富山国際大)、内藤 雄樹(DBCLS)、仲里 猛留(DBCLS/現:NITE)、信定 知江(NBDC/現:理研)、藤原 豊史(DBCLS)、三橋 信孝(DBCLS)、箕輪 真理(DBCLS)、守屋 勇樹(DBCLS)、山本 泰智(DBCLS)、八塚 茂(NBDC/現:NITE)、五斗 進(DBCLS)
要旨

TogoDX (Togo Data eXplorer) は、知識グラフ化された様々なデータベースを統合的に探索するためのフレームワークである。データ間のつながりを整理したID関係に基づいてさまざまなデータベースを統合している。TogoDXでは、データベースが持つ多様な属性によって絞り込みを行い、データサイエンスに有用なデータを柔軟に抽出する新しい仕組みの提供を目指している。この仕組みを利用して構築された、TogoDX/Human (https://togodx.dbcls.jp/human/) は、国内外のデータベースから収集・統合したヒトに関する情報をワンストップで探索することができるアプリケーションである。現在、遺伝子、タンパク質、化合物、疾患などの多様なデータベースに由来する50以上の属性を用いて、データの探索が行える。各属性は階層分類または連続値分布として可視化されており、利用者は全データを俯瞰しながら興味ある属性を用いてデータを絞り込んだり、IDリストを入力することで、各属性におけるIDの分布を把握することができる。絞り込まれた結果表示では、そのIDに関連する情報を容易に確認できるほか、属性情報をダウンロードしてさらなる統合解析に利用することができる。本発表では、活用事例や課題などについて、実際のアプリケーションを示しながら議論したい。

発表資料

統合データベース探索フレームワークTogoDXの開発とその応用(PDF:1.63MB)

動画 なし

TogoID: データベース統合の基盤となるID変換サービス

番号 5
第2部
発表者 ○池田 秀也(DBCLS)、千葉 啓和(DBCLS)、藤原 豊史(DBCLS)、五斗 進(DBCLS)、井手 隆広(NBDC)、川島 秀一(DBCLS)、箕輪 真理(DBCLS)、三橋 信孝(DBCLS)、守屋 勇樹(DBCLS)、内藤 雄樹(DBCLS)、仲里 猛留(DBCLS)、信定 知江(NBDC)、大田 達郎(DBCLS)、小野 浩雅(DBCLS)、申 在紋(DBCLS)、高月 照江(DBCLS)、建石 由佳(NBDC)、豊岡 理人(NBDC)、山本 泰智(DBCLS)、八塚 茂(NBDC)、片山 俊明(DBCLS)
要旨

TogoID (https://togoid.dbcls.jp/) は、生命科学分野におけるデータベース(DB)のID間の変換を行うことができるWebアプリケーションである。
遺伝子、タンパク質、化合物、疾患、遺伝子多型といった幅広いカテゴリーに渡る65種(2022年7月時点)のIDを対象としている。カテゴリー内でのIDの変換のみならず、関連する他のカテゴリーのIDへの変換も可能である。ID間の意味的な関係は、新規に開発したオントロジーで記述している。
Webインタフェース上では、変換されたIDをクリップボードへ直接コピーしたり、変換前後のID対応の一覧をCSV形式でダウンロードしたりすることができる。またAPIも提供しており、他のアプリケーションからのID変換にも利用することができる。
ID間の対応関係は、各DBのRDFデータ、API、フラットファイルからの抽出によって整備しており、GitHubレポジトリ(https://github.com/dbcls/togoid-config)で管理・公開している。対象DBのIDに関するメタデータや、IDペアの更新方法、頻度などを管理することで、最新のID間の対応関係を得られるようにしている。
ID間の対応関係を整備することはDB統合の基本であり、本サービスはDB間をまたいだ知識発見の基盤となるものである。

発表資料

TogoID: データベース統合の基盤となるID変換サービス(PDF:1.58MB)

動画 なし

より繋がりやすいRDFデータの構築に向けて

番号 6
第3部
発表者 ○山本 泰智(DBCLS)、藤澤 貴智(遺伝研)
要旨

多くの生命科学分野のデータが知識グラフとして表現されている。知識グラフでは様々な概念を示す識別子としてURIを用いるが、複数主体による分散的な構築体制などに起因して、同一概念を表すべきURIに様々な種類の表記揺れが生じる。この結果、繋がるべきデータが繋がらない事態が発生し、知識グラフの本来の価値が発揮されなくなる。この問題に対処するために、URIのキュレーションを支援するアプリケーションを提案する。これは、RDFデータを入力として受け付け、ShEx形式のRDFスキーマおよびURIの表記揺れ情報を出力する。RDFスキーマは、与えられたRDFデータを解析して自動生成されるほか、表記揺れについては、互いに綴りが類似した異なるURIなどの事例を抽出する。利用者は結果を確認しながら、自身のRDF生成プログラムなどを適宜修正し、新たな版のRDFデータを生成する。この作業を繰り返して所望の結果が得られれば、生成されたスキーマはRDFデータの更新が必要な際に、更新結果を検証するために利用できる。以上、提案アプリケーションにより、自身の生成したデータを確認しやすい環境を構築でき、知識グラフの価値を高められる。

発表資料

より繋がりやすいRDFデータの構築に向けて(PDF:2.53MB)

動画 なし

SPARQL support の機能開発

番号 7
第1部
発表者 ○守屋 勇樹(DBCLS)
要旨

SPARQL クエリ記述のための支援機能を有した SPARQL クエリエディタ・クライアントである SPARQL support (https://sparql-support.dbcls.jp/) のアップデートについて報告する。
エンドポイントにロードされた RDF データを検索するためには SPARQL クエリが用いられる。さまざまな機関が作成した RDF データを組み合わせることで複雑なグラフパターンの検索も可能である反面、クエリ自体も複雑になることが多い。また、異なる機関のデータを統合して扱う性質上、データ構造変更の情報共有がスムーズに行われない場合にそれまで運用していたクエリが機能しなくなることも多く、その際のクエリの原因特定作業も煩雑になりがちである。そこで、クエリを書き換えることなくクエリ内の部分的なパターン検索することでデバッグ作業の負担を軽減する機能を開発した。ポスターでは、RDF データを視覚的に探索する Endpoint btowser との連携や、近年追加した機能についても紹介する。

発表資料

SPARQL support の機能開発(PDF:2.1MB)

動画 なし

食品オントロジーの構築

番号 8
第2部
発表者 〇樋口 千洋(NIBIOHN)、櫛田 達矢(理研)、畠中 秀樹(DBCLS)、長尾 知生子(大阪大/NIBIOHN)、荒木 通啓(NIBIOHN)、水口 賢司(NIBIOHN/大阪大)
要旨

国立研究開発法人 医薬基盤・健康・栄養研究所は、健康増進法に基づき、国民の健康増進の総合的な推進を図るための基礎資料とするため、「国民健康・栄養調査」を実施している。現時点での最新版は令和元年11 月に実施した調査結果を取りまとめたものであるが、ここに別表として国民健康・栄養調査食品群を掲載している。これは日本国内の食品を穀類、イモ類などの大分類、 米・加工品、小麦・加工品などの中分類、米、米加工品などの小分類に分類し、それぞれの食品名を記した内容になっている。
これを元にしてオントロジーをOWLで記述し、BioPortalにFGNHNSとして公開した。今後は国内の他の食品情報との統合および概念階層の再編および欧米の食品オントロジーであるFoodon との連携を図っていく。

発表資料

食品オントロジーの構築(PDF:0.7MB)

動画 なし

Yevis: 再利用性の高いワークフローを共有するためのレジストリ構築システム

番号 9
第3部
発表者 末竹 裕貴(東京大)、○大田 達郎(DBCLS)
要旨

様々なワークフローシステムの開発により、バイオインフォマティクスのデータ解析の移植性が向上した。ワークフローを共有することで、研究者は高度なプログラミングの必要なく、高品質の解析手法に容易にアクセスすることができる。しかし、公開されたワークフローは、必ずしも再利用性が保証されているとは限らない。そのため、再利用可能な形でワークフローを共有するための仕組みが必要とされている。本発表では、ワークフローの検証・テストを自動的に行うワークフローレジストリ構築システム、Yevisを紹介する。システムは我々が定義した再利用性の要件に基づいてワークフローの検証・テストを行う。Yevisレジストリは、GitHubのプルリクエストを通じてワークフローの登録を受け付け、その後、自動検証およびテストがGitHub上で行われる。システムの手順に従うことで、再利用可能なワークフローの条件を満たしながらレジストリを運用することが誰にでも可能となる。このシステムは、ワークフローを共有したいが、レジストリをゼロから構築・維持するための専門知識がない個人、またはコミュニティにとって特に有用である。

発表資料

Yevis: 再利用性の高いワークフローを共有するためのレジストリ構築システム(PDF:0.39MB)

動画 なし

MicrobeDB.jpからMicrobiome Datahubへ: 微生物・植物・メタボロームのデータ統合と統合微生物データベースの再構築

番号 10
第1部
発表者 〇藤澤 貴智(遺伝研)、平川 英樹(かずさ研)、守屋 勇樹(DBCLS)、信定 知江(NBDC)、金谷 重彦(奈良先端科学技術大)、有田 正規(遺伝研)、田畑 哲之(かずさ研)、磯部 祥子(かずさ研)、 東 光一(遺伝研)、中村 保一(遺伝研)、松井 求(東京大)、山田 拓司(東京工業大)、内山 郁夫(NIBB)、黒川 顕(遺伝研)、森 宙史(遺伝研)
要旨

我々は、これまで微生物データの統合化、高度実用化を推進し、フルRDFによる微生物統合データベースMicrobeDB.jpを構築してきた。2021年度、微生物、植物およびメタボローム関連RDFによるデータ統合を発展させるため、植物統合データベースPlant GARDEN、メタボロームレポジトリMetaboBankと連携して、NBDCおよびDBCLSによって開発されたデータベース探索のためのフレームワークTogoDXおよびRDFポータルおよびTogoGenomeのRDFも活用してTogoDX-TPPを構築した。さらに連携検索システムを開発し、検索性を高度化することで、微生物、植物、およびメタボロームのRDFによるデータ統合を発展させた。本発表では、TogoDX-TPPおよび連携検索システム構築におけるRDFによるデータ統合について発表するとともに、今年度から開発着手したマイクロバイオーム研究を先導するハブを目指した微生物統合データベースMicrobiome Datahubの検索機能について進捗報告する。

発表資料

MicrobeDB.jpからMicrobiome Datahubへ: 微生物・植物・メタボロームのデータ統合と統合微生物データベースの再構築(PDF:1.42MB)

動画 なし

微生物研究管理プラットフォームを活用した住環境マイクロバイオームのメタ解析

番号 11
第2部
発表者 ○伊藤 光平(BIOTA)
要旨

ハイスループットシーケンス技術の進歩により、あらゆる環境中のマイクロバイオームが明らかになった。公共データベース上に蓄積しているマイクロバイオームデータを統合的に解析することはプロジェクト間のマイクロバイオームの系統組成や多様性の比較を実現し、新たな考察を行うことを可能にする。しかしこのようなメタ解析には標準的な解析手法が確立していないこと、異なる実験手法から得られたデータを用いることによるバッチ効果の存在など、多くの問題が指摘されている。Gonzalezらによって開発された微生物研究管理プラットフォームQiita [1]では、メタデータや解析ワークフローの標準化、生データや中間ファイルへの容易なアクセス、解析内容の記録・追跡によって、一貫性のある解析が実行可能である。
本研究では、Qiitaを用いて世界中の住環境マイクロバイオームのメタ解析を実施した。このメタ解析により、住環境ごとのマイクロバイオームの系統組成、多様性の差異について明らかにした。室内に比べ屋外では微生物の系統的多様性が高い傾向があった。緑地においては、土壌、植生などに多様な細菌が生息しているからだと考えられた。一方で室内は系統的多様性が低くヒト関連細菌が占有していることから、病原性細菌との接触や伝播の危険性が懸念される。また、屋外環境から植生や土壌由来の細菌を取り込むことで室内のマイクロバイオームの系統的多様性を高められると考えられる。
また、この解析結果を日本科学未来館の常設展示「セカイは微生物に満ちている」にて展示し、一般向けに広く科学コミュニケーションを図っている[2]。

参考文献
[1] Qiita: rapid, web-enabled microbiome meta-analysis
https://qiita.ucsd.edu/
[2] ビジョナリーラボ「セカイは微生物に満ちている」
https://www.miraikan.jst.go.jp/exhibitions/future/visionarieslab/

発表資料

微生物研究管理プラットフォームを活用した住環境マイクロバイオームのメタ解析(PDF:3.75MB)

動画 なし

MBGD 2022: 大規模な微生物オーソログデータベースの効果的な活用に向けて

番号 12
第3部
発表者 ○内山 郁夫(NIBB)、三原 基広(ダイナコム)、西出 浩世(NIBB)、千葉 啓和(DBCLS)、高柳 正彦(ウェブブレイン)、髙見 英人(東京大)
要旨

微生物比較ゲノムデータベースMBGDは、オーソログ解析に基づいて微生物ゲノムの比較解析を行うためのデータベースである。最新の2022年版では15397の微生物ゲノム(1444属4747種)を含んでおり、階層的なオーソログ構築手法を用いてこれらの間で網羅的なオーソログ解析を行った結果、100万を超えるオーソロググループに分類されている。この大規模なオーソログデータを効果的に活用するための改良もいくつか行っている。利用者ゲノムを解析するためのMyMBGDモードでは、選択した生物種間で新規にオーソログ解析を行う従来のモードに加えて、標準オーソログテーブルに対するMMSeqs検索に基づいて高速なオーソログ割り当てモードを選択可能とし、特に後者は新規ゲノムのアノテーションを効率的に行う手段としても使えるようにした。また、利用者が表現型などに基づいて系統プロファイルを指定して、それと類似したパターンを持つオーソロググループを検索する系統プロファル解析の機能も新たに利用可能とした。このほか、種内および近縁種間でシンテニーの保存性を見るコアゲノムアライメントの表示機能にも改良を加えている。

発表資料

MBGD 2022: 大規模な微生物オーソログデータベースの効果的な活用に向けて(PDF:8.15MB)

動画 なし

NITE 新システムのご紹介 ~「ScreenHit」と「cereco」~

番号 13
第1部
発表者 ○大塚 梨沙(NITE)、黄地 祥子(NITE)、牧山(片野)葉子(NITE)、宮澤 せいは(NITE)、佐藤 元(NITE)、八塚 茂(NITE)、市川 夏子(NITE)
要旨

NITEでは、特定のメンバー間でのみデータの閲覧や共有ができるシステムを構築することで協調領域でのデータの利活用を目指している。
NEDOバイオものづくりプロジェクト※と内閣府戦略的イノベーション創造プログラム(SIP)スマートバイオ産業・農業基盤技術プロジェクトに参画しており、昨年度から各々のプロジェクトで「ScreenHit」と「cereco」の開発を始めている。
「ScreenHit」とは、NEDOバイオものづくりプロジェクトで得られた探索情報と微生物株情報、ゲノムデータや実験データを含む微生物の関連情報を格納し、本プロジェクトに参画するユーザーに認証付きで閲覧させるシステムである。本プロジェクトでは、微生物を活用したバイオ由来製品の社会実装を加速させ、新たな製品・サービスを創出することによるバイオ産業の活性化等を介したカーボンリサイクルの実現を目指しており、本システムを通じて、得られたデータ収集の効率化や利活用促進を期待している。
「cereco」とは、食品産業界においてしばしば検出される食中毒の原因となるセレウス菌と食中毒の原因とならないその近縁種の識別同定をMALDI-TOF MSの質量分析結果を用いて簡易的に識別するシステムである。今年度、認証システムやセレウス菌とその近縁種の情報の追加などをおこない、次年度以降の本格運用、利用者の募集を目指している。
※ 正式名称:NEDO「カーボンリサイクル実現を加速するバイオ由来製品生産技術の開発」プロジェクト

発表資料

NITE 新システムのご紹介 ~「ScreenHit」と「cereco」~(PDF:1.72MB)

動画 なし

DBRP(生物資源データプラットフォーム)のアップデート

番号 14
第2部
発表者 ○八塚 茂(NITE)、木村 明音(NITE)、北橋 優子(NITE/現:三井情報)、牧山(片野)葉子(NITE)、大塚 梨沙(NITE)、稲井田 和夫(NITE)、伊藤 絵理子(NITE)、阿部 純平(NITE)、中谷 諒介(NITE)、佐藤 元(NITE)、市川 夏子(NITE)
要旨

NITEバイオテクノロジーセンター(NBRC)は、生物資源データのプラットフォームとして「DBRP」(https://www.nite.go.jp/nbrc/dbrp/)を公開している。
DBRPにはNBRC、企業、地方公共団体、大学等が保有する微生物に関連したデータを掲載している。
昨年から今年にかけては、NBRC株の免疫活性データ、特許関連データ、鳥取大学のTUFC菌株(きのこ)のデータ、味の素株式会社の16S rDNA配列データ等を新規公開または追加した。
機能面では、画面やインタフェースの一新、数の多いNBRC株をアルファベット順に分類、全文検索機能、検索結果の絞り込み機能等を追加した。
DBRPは国内の生物資源の関連データを集約し利活用を促進することで、産業界におけるイノベーションの創出やソリューション提供につなげることを目指している。

発表資料

DBRP(生物資源データプラットフォーム)のアップデート(PDF:3.03MB)

動画 なし

植物ゲノム情報ポータルサイト「Plant GARDEN」の改訂(2022年度・第2四半期版)

番号 15
第3部
発表者 ○市原 寿子(かずさ研)、平川 英樹(かずさ研)、山田 学(かずさ研)、小原 光代(かずさ研)、山下 サマッチャヤー(かずさ研)、白澤 沙知子(かずさ研)、戸田 陽介(かずさ研)、中村 保一(かずさ研/遺伝研)、七夕 高也(かずさ研)、田畑 哲之(かずさ研)、磯部 祥子(かずさ研)
要旨

近年、多数の植物種のゲノム配列が次々に決定され、また、一つの植物種でも品種やアセンブリバージョンの異なる多数のゲノムが公開されている。Plant GARDEN(Genome And Resource Database Entry; https://plantgarden.jp)は、多数の研究機関から公開されている多種のゲノムデータを一元化し、目的の情報へ簡単にアクセスできるように開発された植物ゲノムポータルサイトである。ゲノム、遺伝子の配列情報、文献からキュレーションされたDNAマーカー、QTL、連鎖地図、遺伝子機能センテンスの情報、SRAデータから算出された塩基多型の情報、及び、これらを用いてユーザーが保有する情報を解析するためのツールを提供している。
文献に由来するコンテンツの効率的な更新、拡充のため、キュレーション情報の共有に際し、担当者間の記述表現の揺らぎやミスを最小限に抑えるためのデータ入力システムを構築した。また、これまでのパソコン用に加え、タブレット端末からのアクセスに適したタブレット端末用インターフェースを開発し、2022年5月に公開した。本発表では、これらをはじめとした開発状況を紹介する。

発表資料

植物ゲノム情報ポータルサイト「Plant GARDEN」の改訂(2022年度・第2四半期版)(PDF:3.39MB)

動画 なし

植物ゲノム統合データベースPlant GARDEN、微生物、メタボローム統合データベース間の連携検索システムの開発

番号 16
第1部
発表者 〇平川 英樹(かずさ研)、藤澤 貴智(遺伝研)、守屋 勇樹(DBCLS)、信定 知江(NBDC)、長崎 英樹(かずさ研)、森 宙史(遺伝研)、福島 敦史(京都府立大)、Andrea Ghelfi(遺伝研)、市原 寿子(かずさ研)、中村 保一(遺伝研)、金谷 重彦(奈良先端科学技術大)、有田 正規(遺伝研)、黒川 顕(遺伝研)、田畑 哲之(かずさ研)、磯部 祥子(かずさ研)
要旨

植物と微生物との相互作用や植物が産生する様々な二次代謝産物との関連性から新たな知見を見出すことを目的として、植物ゲノム統合データベースPlant GARDEN(https://plantgarden.jp)と微生物ゲノム統合化データベースMicrobeDB.jp、メタボローム統合データベースMetaboBank間でRDFによるデータ連携を進めており、2020年からトーゴーの日において進捗状況を発表してきた。2021年度の統合推進化プログラムの追加実施予算にて、一般ユーザにとって敷居が高いSPARQL言語を入力することなくSPARQL検索できるシステムの開発を検討していたところ、2021年10月にTogoDX/humanがDBCLSから公開された。そこで、TogoDXシステムに植物、微生物、メタボローム3者のコンテンツを格納したTogoDX-TPPを新たに構築し、さらに検索の効率化を図るため、TogoDX-TPPにおいてどのattributeにユーザが求めるデータが格納されているかを予め検索し、そこからTogoDX-TPPに検索を投入する連携検索システムを開発した。本発表では、現在の開発状況について発表する。

発表資料

植物ゲノム統合データベースPlant GARDEN、微生物、メタボローム統合データベース間の連携検索システムの開発(PDF:2.48MB)

動画 なし

理研BRC植物バイオリソースRDFデータの作成とその運用

番号 17
第2部
発表者 ○櫛田 達矢(理研)、臼田 大輝(理研)、桝屋 啓志(理研)
要旨

理化学研究所バイオリソース研究センター(BRC)は、総合的なバイオリソースセンターとして、シロイヌナズナなど31植物種の種子、培養細胞、遺伝子材料の開発、収集、保存、提供などの業務を行なっている。当センターでは、これらバイオリソースの利用拡大に向けて、セマンティックウェブの標準書式であるResource Description Framework (RDF) 形式によるデータ整備、検索システムの開発、運用を進めている。RDFデータは、バイオリソースの汎用的なデータスキーマであるBiological Resource Schema Ontology (BRSO) に準拠し、NCBI Taxonomy(例、obo:NCBITaxon_3702)、Gene(例、ncbigene:820887)、Nucleotide(例、nucleotide:AF37539)やTAIR Locus(例、ensembl.plant:AT3G16400.1)などのURIを用いて構築している。現在、NCBI GeneとUniProt間のリンク情報の追加、リテラルで記述されている表現型の用語のPlant Trait Ontologyなどへのマッピングや関連付けを進めており、今後、Plant GARDEN、Orthologous Matrix (OMA)、Rhea、KNApSAcK、Reactomeなどの外部機関が提供するデータセットとの統合を行う予定である。これら理研BRCのバイオリソースデータは、バイオリオースメタデータベースのSPARQLエンドポイント(https://knowledge.brc.riken.jp/sparql)および、理研BRCのトップページ(https://brc.riken.jp/)から検索可能である。

発表資料

理研BRC植物バイオリソースRDFデータの作成とその運用(PDF:1.01MB)

動画 なし

Pedigree Finder Ontology (PFO) の開発

番号 18
第3部
発表者 〇鐘ケ江 弘美(農研機構)、川島 秀一(DBCLS)
要旨

育種データを整理・活用するためには、データ間の相互運用性を高める必要がある。具体的には、データを記述する際に、各専門分野における統制語彙であるオントロジーを活用することが効果的である。そこで、育種情報を効率的・横断的に利用するために、様々な作物の育種情報に記載されている項目を抽出し、育種のために必要とされている情報のリストを作成し、系統のメタデータの記述に必要となる概念を整理した。育種関連の用語を整理するために「育種(Breeding)」という概念を導入し、OWLを用いて品種・系統および品種間の関係を表現した。育種方法についてはCrossBreeding、MutationBreeding、SelectionBreedingの3つに分類し、交雑育種に用いた親の系統、突然変異育種に用いた変異誘発手法も記述出来るようにPedigree Finder Ontology (PFO; https://github.com/dbcls/pfo) を整備した。PFOを活用したデータ処理の効率化・AI適用の加速化の例として、系譜情報グラフデータベース「Pedigree Finder」についても紹介する。

発表資料

Pedigree Finder Ontology (PFO) の開発(PDF:0.91MB)

動画 なし

深層学習のための病害虫被害画像データベースの構築

番号 19
第1部
発表者 ○岩崎 亘典(農研機構)、井上 康宏(農研機構)、光永 貴之(農研機構)、下田 武志(農研機構)、大西 純(農研機構)、津田 新哉(法政大)、彌冨 仁(法政大)、鍵和田 聡(法政大)、岡 美佐子(高知県農業技術センター)、下元 満喜(高知県農業技術センター)、山脇 美樹(高知県農業技術センター)、野口 佳奈(高知県農業技術センター)、酒井 宏(群馬県農業技術センター)、池田 健太郎(群馬県農業技術センター)、三木 静恵(群馬県農業技術センター)、横山 薫(群馬県農業技術センター)、星野 啓佑(群馬県農業技術センター)、谷口 高大(群馬県農業技術センター)、星野 航佑(群馬県農業技術センター)、菊池 優以(群馬県農業技術センター)、新井 美優(群馬県農業技術センター)、川部 眞登(富山県農林水産総合技術センター)、西村 麻実(富山県農林水産総合技術センター)、八重樫 元(富山県農林水産総合技術センター)、金城 雄司(富山県農林水産総合技術センター)、青木 由美(富山県農林水産総合技術センター)、向井 環(富山県農林水産総合技術センター)、西野 実(三重県農業研究所)、徳丸 晋(京都府農林水産技術センター)、北澤 勝好(京都府農林水産技術センター)、岩川 秀行(京都府農林水産技術センター)、門馬 悠介(京都府農林水産技術センター)、松田 浩(鹿児島県農業開発総合センター)、中西 善裕(鹿児島県農業開発総合センター)、西 八束(鹿児島県農業開発総合センター)、和山 亮介(ノーザンシステムサービス)
要旨

我が国における多様な環境や営農形態、熟練農業者の減少、さらには植物防疫担当者の減少等により、ICT 技術を活用した病害虫防除の効率化が強く求められている。なかでも深層学習による病害虫の画像識別は有効な技術であると考えられるが、そのためには正確かつ大量の病害虫被害画像を集めることが必要である。そこで著者らは農林水産省人工知能未来農業創造プロジェクト「AI を活用した病害虫識別技術の開発」において、主要野菜で発生する重要病害虫による時系列被害の電子画像を収集し、病害虫被害画像データベースを構築した。対象作物は、トマト、イチゴ、キュウリ、ナスを対象とし、日本各地の 24 府県で、異なる環境、作物、病害虫の画像を収集した。画像の撮影に当たっては、単離、同定した病原菌や害虫を用いて接種試験を行い、被害画像を撮影した。収集した被害画像については、対象作物、部位、病害虫のメタデータを付与するとともに、以下の Web ページにてオープンデータ(CC BY 4.0)として公開した。 https://www.naro.affrc.go.jp/org/niaes/damage/

発表資料

深層学習のための病害虫被害画像データベースの構築(PDF:3.46MB)

動画 なし

日本人ゲノムバリアント統合データベースTogoVarの機能拡張

番号 20
第2部
発表者 ◯三橋 信孝(DBCLS)、川嶋 実苗(NBDC)、片山 俊明(DBCLS)、川島 秀一(DBCLS)、守屋 勇樹(DBCLS)、豊岡 理人(富山国際大)
要旨

TogoVarでは様々な日本人集団のアレル頻度(ToMMo、HGVD、GEM-J WGA、NBDCヒトデータベースの個人ゲノムを解析したJGA-NGSおよびJGA-SNP)とThe Genome Aggregation Database (gnomAD) の外国人集団のアレル頻度が比較可能な形で整理されており、研究者は効率的に情報収集できる。最近公開したアドバンスト検索では、ANDおよびOR演算子が入れ子になった複雑な検索式をGUIでわかりやすく作成できる。これを用いて、複数の日本人集団の少なくとも1つ以上の集団で頻度が高く、かつgnomADでの頻度が低いといった、日本人集団に特徴的なバリアントを1回の検索で抽出できるようになった。アレル頻度に加え、疾患名やClinical significance、Molecular consequenceなども条件として指定できる。なお、指定した疾患のサブカテゴリの疾患も疾患オントロジー(Mondo)を用いて自動的に検索される。また、各遺伝子および疾患に関連するバリアントのアレル頻度、GWAS Catalog、ClinVarおよび文献情報をそれぞれ1画面に集約したページをメタスタンザを利用して実装し公開した。

発表資料

日本人ゲノムバリアント統合データベースTogoVarの機能拡張(PDF:1.82MB)

動画 なし

ゲノム編集メタデータベースの開発 -文献からの情報抽出-

番号 21
第3部
発表者 ◯鈴木 貴之(広島大)、坊農 秀雅(広島大)
要旨

ゲノム編集技術の発展により、さまざまな生物種の遺伝子をターゲットとした研究が世界中で行われ、研究成果が文献として発表されている。ゲノム編集によって研究された遺伝子(過去のターゲット遺伝子)の情報は、品種改良などゲノム編集の社会応用に有益である。しかし、文献内の生物種、遺伝子名やゲノム編集手法などの記載は表記揺れが多いために、既存のデータベースでは網羅的または高精度な検索が困難である。現状において、過去のターゲット遺伝子について詳しく知るためには論文を1つずつ読み進める必要がある。
上記のような問題を解決するため、私たちは過去のターゲット遺伝子の網羅的なデータベース構築を目指している。ゲノム編集の社会応用に向けた研究において有益なメタデータを、文献の文字列を解析することにより自動抽出してデータベース化するシステムを開発する。さらにはそれらメタデータとgene2pubmedの情報を利用して、それぞれの過去のターゲット遺伝子の研究され具合を示す数値を計算する。本研究によって、今までアクセスしづらかった既存の知識(ゲノム編集事例のない遺伝子や機能研究の浅い遺伝子など)を効率的かつ網羅的に得ることができる。

発表資料

ゲノム編集メタデータベースの開発 -文献からの情報抽出-(PDF:0.74MB)

動画 なし

マウスゲノム多型データベースMoG+の高度化とその利用

番号 22
第1部
発表者 ◯高田 豊行(理研)、臼田 大輝(理研)、櫛田 達矢(理研)、城石 俊彦(理研)、桝屋 啓志(理研)
要旨

生物のゲノム情報は、生物多様性や進化、さらには様々な生命現象の理解ばかりでなく、医学生物学研究の戦略立案や、その効果的な遂行のために欠かせないものになっている。実験動物マウスのゲノムは、これまでの研究により、複数の亜種に由来するゲノム配列が、モザイク状に分布していることが明らかになっている。我々は、このモザイクゲノムの起源となる全ての亜種を含む野生マウス由来の10種の近交系統の全ゲノム情報をMoG+(モグ プラス: https://molossinus.brc.riken.jp/mogplus/)から公開している。MoG+では、複数亜種のゲノムに観察される塩基多型やアミノ酸置換情報をウエット研究者が簡単に探索できる。さらにMoG+は、遺伝子名を利用した疾患モデルマウスの検索機能などが搭載され、検索により理研BRCから入手可能なマウス系統を調べることができる。なおMoG+では、令和4年度より、統合化推進プログラム「統合的な転写制御データ基盤の構築」に関わる活動として、包括的なマウス種内多型情報の整備を進めている。

発表資料

マウスゲノム多型データベースMoG+の高度化とその利用(PDF:2.28MB)

動画 なし

MOCCS-DB: ヒト転写因子認識配列の多様性データベース

番号 23
第2部
発表者 〇田原 沙絵子(筑波大)、土屋 貴穂(筑波大)、松澤 亮輔(筑波大)、尾崎 遼(筑波大/理研)
要旨

転写因子は特定の塩基配列を認識してDNAと結合し、遺伝子発現を調節する。単独のChIP-seq実験からでも複数の転写因子認識配列が得られることがある一方、認識配列の多様性に着目した転写因子認識配列データベースは存在しなかった。そこで我々は、転写因子認識配列の多様性に着目したウェブデータベース“MOCCS-DB”を開発した。MOCCS-DBでは、10,534のヒトChIP-seqサンプルを解析したデータを収集し、興味のある転写因子の認識配列を、結合特異性のスコアの付随したk-merとして複数得ることができる。また、転写因子認識配列の細胞型ごとの特異性をヒートマップで表示したり、2つの転写因子間あるいは細胞型間で結合特異性に差がある認識配列(Differentially-binding k-mer)を調べることができる。さらに、認識配列が類似する転写因子を細胞型ごとに調べたり、転写因子認識配列上の一塩基多型が影響を与える転写因子・細胞型を予測する機能も備えている。MOCCS-DBは、転写因子認識配列の多様性に関して複数の観点から検索・解析できるデータベースとなっている。本発表では、MOCCS-DBの機能や応用例に関して発表する。

発表資料

MOCCS-DB: ヒト転写因子認識配列の多様性データベース(PDF:3.34MB)

動画 なし

RNAseqChef: 遺伝子発現変動を自動的に可視化するRNA-seq統合解析ツール

番号 24
第3部
発表者 〇衛藤 貫(熊本大)、中尾 光善(熊本大)
要旨

RNAシーケンス(RNA-seq)は網羅的な遺伝子発現変動解析(DEG解析)に不可欠なツールである。原著論文で使用されたRNA-seqのデータセットは誰でも再利用できるようにGene Expression Omnibus(GEO)に集約されている。現在、数万以上のデータセットが再解析可能な状態にあり、一般的に利用される組織・細胞株のデータも豊富にあるので、分子生物学の研究を進める上で有益な情報が得られる可能性を秘めている。しかしながら、DEG解析は煩雑で時間も要するために、短時間で再現性のあるデータ解析をするためにはバイオインフォマティクスの専門知識が求められる。
そこで本研究では、専門的知識不要で再現性のあるデータ解析が可能となるウェブツールの開発を目指した。RNAseqChef(RNA-seq data Controller highlighting gene expression feature)は、RNA-seqにより得たカウントデータを自動的に解析・可視化するウェブアプリである。既存のウェブアプリと異なり、単一のデータセットの解析だけでなく、複数のデータセットの結果を統合解析することも可能である。また、RNA-seq以外のオミクス解析(ChIP-seqやATAC-seqなど)で得た遺伝子セットをインプットとすることで、発現変動遺伝子のエピゲノム情報の抽出・解析なども可能である。本ポスター発表では、RNAseqChefの機能・使用方法を紹介する。

発表資料

RNAseqChef: 遺伝子発現変動を自動的に可視化するRNA-seq統合解析ツール(PDF:3.18MB)

動画 なし

遺伝子共発現データベースCOXPRESdb

番号 25
第1部
発表者 ○大林 武(東北大)、小舘 俊(東北大)、火原 日美子(東北大)、加賀谷 祐輝(パデュー大)、木下 賢吾(東北大)
要旨

遺伝子共発現データベースCOXPRESdb(https://coxpresdb.jp)は、公共のトランスクリプトームデータに基づく遺伝子共発現情報を提供するデータベースであり、ヒト、マウスをはじめとする動物10種と酵母2種を対象としている。使いやすいデータベースを構築する観点からは、共発現情報の「全体像の把握」「個別の吟味」「二次利用」といった機能が重要になる。(1)全体像の把握に関しては、COXPRESdb v7.1よりRNAseqとマイクロアレイを統合した種を代表する共発現情報の提供を開始した。これにより、生物種間比較などのより高次の解析を行いやすくなった。COXPRESdb v8.1からはGlobal Viewerの提供を始めた。これは各生物種における共発現関係をUMAPを用いて一枚の図にしたものであり、ゲノムを構成する遺伝子の全体像の把握が容易になる。また、共発現遺伝子リストのエンリッチメント解析機能も、遺伝子リストの傾向を把握するのに有用である。(2)個別の共発現関係の吟味については、COXPRESdb v8.0から、着目する遺伝子ペアが論文で言及されているか判断する自作ツールのCoexPubを組み込んだ。(3)データの二次利用を促進するため、バルクダウンロード、API、RDFでのデータ提供を行なっている。

発表資料

遺伝子共発現データベースCOXPRESdb(PDF:6.07MB)

動画 なし

Linked Open Data を利用したアラインメントビューアの開発

番号 26
第2部
発表者 ◯藤 博幸(関西学院大)、山口 敦子(東京都市大)
要旨

相同なアミノ酸配列のマルチプルアラインメントからは、そのタンパク質の機能や構造についての情報を得ることができる。その処理にあたって、各タンパク質の既知情報を配列に対応づけることにより、配列情報のみを使用するより詳細な情報を得ることができる。例えば、酵素のアラインメントが与えられた時、基質特異性の異なるグループが含まれていれば、その情報を踏まえてアミノ酸配列を比較することで、基質特異性の違いに関与するアラインメントサイトを見出せる。我々は、このような処理を容易に行えるように、Linked Open Dataからタンパク質のGO情報や機能部位情報を収取するためのツールPSurferを組み込んだアラインメントビューアを開発している。GO情報は、NJ法による系統樹の周辺に同心円の形で描画すことで可視化している。今回、この同心円をクリックすることで、そこに表示されているGO情報に基づきグループを選択し、各グループの保存度スコアや機能差を表すスコアのプロファイルの作成や、スコア上位のアミノ酸の立体構造へのマッピングを実行できるようにした。

発表資料

Linked Open Data を利用したアラインメントビューアの開発(PDF:4.27MB)

動画 なし

天然変性タンパク質データベース:IDEAL

番号 27
第3部
発表者 ○安保 勲人(前橋工科大)、○佐久間 航也(名古屋大)、嘉戸 裕美子(名古屋大)、坂本 盛宇(ホロニクス)、細田 和男(東京都市大)、鹿間 周子(名古屋大)、大安 裕美(名古屋大)、高木 大輔(ホロニクス)、山口 敦子(東京都市大)、畠中 秀樹(DBCLS)、小池 亮太郎(名古屋大)、廣明 秀 一(名古屋大)、福地 佐斗志(前橋工科大)、太田 元規(名古屋大)
要旨

タンパク質の鎖の中で立体構造を形成しない部分を天然変性領域といい、天然変性領域を有するタンパク質を天然変性タンパク質という。天然変性タンパク質は生体内でシグナル伝達・転写調節といった重要な役割を担っている。我々は天然変性タンパク質データベース:IDEAL(http://www.ideal.-db.org)を開発・運営している。 IDEALでは、実験的に確認された天然変性領域および天然変性領域中の相互作用部位(Protean Segment: ProS)の情報を論文から収集している。最新版は2021年10月に公開され、現在も新規エントリのアノテーションが着々と進んでいる。昨年からのアップデートとして、天然変性・ProS予測プログラムであるNeProcを公開した。IDEALウェブサイトにアクセスし、アミノ酸配列のfastaファイルをアップロードするだけで容易に天然変性予測を利用することができる。加えてリン酸化に起因する生物学的イベントをグラフ表現したインターフェースの実装を進めており、次回リリース時に公開する予定である。また、欧州でのELIXIRへの参画を通じ、欧州拠点の天然変性タンパク質データベースDisProtとのデータ共有計画も進行している。2022年8月現在、IDEALのエントリ数は1,110であり、非冗長な13,097の天然変性領域、706のProSが収録されている。全データはウェブサイトからアクセス可能であるとともに、機械可読なXML・RDF形式でも公開している。

発表資料

天然変性タンパク質データベース:IDEAL(PDF:1.76MB)

動画

天然変性タンパク質データベース:IDEAL|JST Channel

蛋白質構造データバンク(PDB)およびBMRB、EMDB

番号 28
第1部
発表者 ○工藤 高裕(大阪大)、池川 恭代(大阪大)、Bekker Gert-Jan(大阪大)、山下 鈴子(大阪大)、岩田 武史(大阪大)、横地 政志(大阪大)、宮ノ入 洋平(大阪大)、児嶋 長次郎(大阪大/横浜国立大)、藤原 敏道(大阪大)、栗栖 源嗣(大阪大/蛋白質研究奨励会)
要旨

タンパク質、核酸、糖鎖などの生体高分子の立体構造情報は Protein Data Bank(PDB)として集積され、2022年5月には公開している構造データ件数は19万件を超えた。PDBjは、国際的組織であるwwPDBの一員として、共通の登録システム「OneDep」の開発とこのシステムを使った登録・検証・アノテーション処理を実施している。また構造データの公開、および独自のサービス・ツールや二次DBの提供、セマンティック化も行っている。wwPDBでは、構造データに加え、構造解析の実験手法に特化したデータのデータベースも合わせて構築しており、NMRについてはBiological Magnetic Resonance Data Bank(BMRB)、電子顕微鏡についてはElectron Microscopy Data Bank(EMDB)の登録および公開を行っている。PDBjのBMRBjグループではBMRBの運営に参画し、NMRデータ登録者とのコミュニケーションの円滑化、NMR実験データの可視化を推進している。EMDBについては、データの参照を支援するウェブサービスEM Navigatorを提供している。

発表資料

蛋白質構造データバンク(PDB)およびBMRB、EMDB(PDF:1.89MB)

動画

蛋白質構造データバンク(PDB)およびBMRB、EMDB|JST Channel

電子顕微鏡生データアーカイブ EMPIAR の紹介

番号 29
第2部
発表者 ○常住 規代(大阪大)、中根 崇智(大阪大)、川端 猛(大阪大/現:東北大)、栗栖 源嗣(大阪大)
要旨

EMPIAR(Electron Microscopy Public Image Archive、電子顕微鏡公開画像アーカイブ)は、電子顕微鏡を用いた構造生物学の生データを公開する公共データベースで、2022年7月現在、2PBを超えるデータが格納されています。PDBjでは欧州バイオインフォマティクス研究所(EBI)と学術協定を締結し、アジア地区の拠点としての活動を行っています。
電子顕微鏡の生データは、解析手法の開発や検証作業の促進など構造情報の向上に役立つもので、これまでもEMPIAR 上の生データを使って多くの新手法が開発され、分解能向上に寄与してきました。またEMPIARは、立体再構成後のマップが収録された Electron Microscopy Data Bank (EMDB) の元となる実験データで相補的な役割を果たしています。
EMPIARに登録されるデータは大きいので、登録時の転送に時間がかかり登録者の負担が大きくなります。 そこでPDBj ではHDD の送付による登録支援も行い、より多くの皆様に電子顕微鏡画像の生データを提供いただくための活動を行っています。今回は数十TBにも及ぶ登録データの登録方法について紹介するとともに、2PBを超える大容量データの保存、バックアップ、公開方法の概要を説明します。さらに、今秋リニューアル予定の新 Web ページについても紹介予定です。

発表資料

電子顕微鏡生データアーカイブ EMPIAR の紹介(PDF:2.73MB)

動画 なし

jPOST:「コミュニティ・ベース論文調査」によるメタデータキュレーションの加速

番号 30
第3部
発表者 ○吉沢 明康(富山国際大)、守屋 勇樹(DBCLS)、小林 大樹(新潟大)、Chih-Hsiang Chang(熊本大)、奥田 修二郎(新潟大)、田畑 剛(京都大)、河野 信(富山国際大/DBCLS)、幡野 敦(新潟大)、高見 知代(新潟大)、松本 雅記(新潟大)、山ノ内 祥訓(熊本大)、荒木 令江(熊本大)、岩崎 未央(京都大)、杉山 直幸(京都大)、福島 敦史(京都府立大/理研)、田中 聡(Trans-IT)、五斗 進(DBCLS)、石濱 泰(京都大)
要旨

プロテオーム統合データベースjPOSTでは、生データを再解析することによって同定結果の品質向上を図っている(トーゴーの日シンポジウム・ポスター・2017年59)。実際に、COVID-19研究の公開データを再解析する比較研究によって、同定ペプチド数65%増加などの効果を確認している(同2021年35)。
この再解析には正確なメタデータが不可欠である。jPOSTのメタデータはMAGE-TABのIDFとSDRFの両方に相当する情報をカバーする詳細なものであるが(同2021年36)、再解析には人間によるキュレーションが必要である(同2017年58)。このためにデータジャーナルJPDMを創刊し詳細情報収集(同2019年352020年53)も行っているが、多くのデータセットについてはキュレーションによる情報追加が依然必要である。
そこで(a)再解析用キュレーションの加速 (b)キュレーション半自動化のためのトレーニングデータセット蓄積 (c)学生・若手研究者のトレーニング を目的とした、「論文の下読み・情報抽出によるメタデータ作成補助」企画を開始し、日本プロテオーム学会を通じて担当者を募集、メタデータの作成を加速した。本発表ではこの取り組みについて発表する。

発表資料

jPOST:「コミュニティ・ベース論文調査」によるメタデータキュレーションの加速(PDF:2.78MB)

動画 なし

GlycoNAVI: やさしい糖鎖データ検索のための統合化

番号 31
第1部
発表者 ○山田 一作(野口研)、松原 正陽(野口研)、土屋 伸一郎(野口研)、木下 聖子(創価大)
要旨

糖鎖研究において糖鎖は名称、略号、記号など多様な方法により記述されている。これらは糖鎖の研究者であれば各々の分野においては理解できる。しかし、略号で糖鎖を理解している研究者が、化学構造式で描かれた糖鎖構造を同じ糖鎖であるかを判断することは容易ではない。そのため、これらのデータを繋げることは研究者が糖鎖を理解するために有益となり得る。そこで、糖鎖の略号や構造式などを、1)我々の開発してきた糖鎖構造の線形文字列表記法WURCSへと変換、2)得られたWURCSを国際糖鎖構造リポジトリGlyTouCanに登録しアクセッション番号を付与、3)これらのデータのRDF化 を実施した。この結果、例えば「LewisY」などの略号から糖鎖構造の検索、他のRDFデータと統合化し、糖鎖の画像や、立体構造、結合タンパク質などの情報の取得を実現した。これらのRDFデータはGlycoNAVI(https://glyconavi.org)や、日本糖鎖科学ポータルGlyCosmos(https://glycosmos.org)で利用している。

発表資料

GlycoNAVI: やさしい糖鎖データ検索のための統合化(PDF:1.63MB)

動画

GlycoNAVI: やさしい糖鎖データ検索のための統合化|JST Channel

糖鎖構造の編集やデータベース検索が可能なウェブインターフェイスGlycanBuilder2-webの開発

番号 32
第2部
発表者 ○土屋 伸一郎(野口研)、木村 直貴(野口研)、松原 正陽(野口研)、木下 聖子(創価大)、山田 一作(野口研)
要旨

糖鎖構造編集ソフトのGlycanBuilder2は、哺乳類だけでなく微生物や植物由来の糖鎖構造の編集に対応している。また、このソフトウェアで編集した糖鎖構造を、WURCSやGlycoCTなどの糖鎖テキストへ変換する機能も実装されている。一方で、編集した糖鎖構造を検索する機能は実装されていない。また、GlycanBuilder2はスタンドアロンで動作するため、ソフトウェアを実行するための環境設定が必要だった。このソフトウェアは実験系の研究者を主な対象としているため、利用者が実行環境を設定してソフトウェアを利用することは容易ではなかった。本研究では、GlycanBuilder2にデータベース検索機能を実装してウェブアプリ化し、検索用インターフェイスとして容易に導入可能にすることを目的とした。まず、ウェブサイトで動作するGlycanBuilder2-webを開発し、環境設定をせずにソフトウェアを利用できるようにした。さらに、GlycanBuilder2-webで糖鎖構造を編集し、GlyCosmosやGlyTouCan、GlycoNAVIなどのデータベースに登録されている糖鎖構造を検索する機能を実装した。以上の結果から、糖鎖構造の編集やデータベース検索に対応したウェブインターフェイスGlycanBuilder2-webの提供を可能にした。現在、このソフトウェアは、糖鎖構造の編集機能を用いた検索インターフェイスとしてGlyCosmosで利用されている。

発表資料

糖鎖構造の編集やデータベース検索が可能なウェブインターフェイスGlycanBuilder2-webの開発(PDF:3.23MB)

動画 なし

LM-GlycomeAtlas Ver.2.1:レクチンを利用した組織グライコーム・データベースのアップデート

番号 33
第3部
発表者 〇岡谷 千晶(産総研)、藤田 典昭(産総研)、曽我部 勇(創価大)、荒川 康一(創価大)、板倉 陽子(東京都健康長寿医療センター研究所)、豊田 雅士(東京都健康長寿医療センター研究所)、安形 清彦(産総研)、富永 大介(産総研)、木下 聖子(創価大)、久野 敦(産総研)
要旨

レクチンマイクロアレイ(LMA)は、試料中の糖タンパク質上糖鎖の構造的特徴を迅速かつ簡便に取得する糖鎖解析技術である。本技術をレーザーマイクロダイセクションと組合せることで、組織切片上の微小領域に発現する糖タンパク質の糖鎖プロファイリング法を確立した[1,2]。本手法を用いることで、糖タンパク質上糖鎖の空間的発現情報を組織学的観察と紐づけた「組織グライコームマップ」が作成可能となった。そこで、データの視覚的理解と利活用促進のため、我々は新規データベース「LM-GlycomeAtlas」を開発した[3]。Ver.2.0では、マウス組織切片の切出し画像および対応するLMAデータに加え、組織染色画像データを表示可能とした[4]。本発表では、Ver.2.0のインターフェースを活用し、加齢に伴う心臓における糖鎖変化を示すデータを追加したので報告する。現在Ver.2.1として、計14組織由来の計523のLMAデータおよび計42の組織染色画像データを糖鎖科学ポータルGlyCosmosにて公開している(https://glycosmos.org/lm_glycomeatlas/index)。今後、LMAに限らず、レクチンを活用した糖鎖解析手法(Lectin-based Multimodality)のデータを表示するツールとして、本データベースを拡張させていきたい。

参考文献:
[1] Zou et al. Sci Rep. 7:43560 (2017).
[2] Nagai-Okatani et al. Methods Mol Biol. 2460:161-80 (2022).
[3] Nagai-Okatani et al. Molecules. 24:2962 (2019).
[4] Nagai-Okatani et al. J Proteome Res 20:2069-75 (2021).

発表資料

LM-GlycomeAtlas Ver.2.1:レクチンを利用した組織グライコーム・データベースのアップデート(PDF:1.64MB)

動画 なし

UniCarb-DR: MIRAGE ベースのグライコミクス MS/MS スペクトルデータリポジトリ

番号 34
第1部
発表者 ○高橋 悠志(創価大)、奥田 修二郎(新潟大)、塩田 正明(創価大)、木下 聖子(創価大)
要旨

UniCarb-DR(https://unicarb-dr.glycosmos.org)はグライコミクスの分野における質量分析実験から得られたMS/MSスペクトルデータを研究者が投稿できる国際データリポジトリである。実験データはMIRAGE(Minimum Information Required for a Glycomics Experiment)と呼ばれる定性的・定量的な報告のためのガイドラインに則って投稿され、インターネット上で公開されている。ユーザーはウェブブラウザから各スペクトルデータを閲覧できるほか、文献情報や糖鎖構造中に含まれる単糖の組成情報などといった様々な条件でスペクトルデータの検索を行うことができる。
近年、UniCarb-DRでは同じくMIRAGEベースのグライコミクスデータリポジトリであるGlycoPOSTとの連携の強化が行われてきた。これまでにユーザーのログインシステムが統一されたほか、現在データ投稿のためのワークフローの統合が進められている。本発表ではUniCarb-DRの各機能を紹介するとともに、GlycoPOSTとの連携の成果についても紹介する。

発表資料

UniCarb-DR: MIRAGE ベースのグライコミクス MS/MS スペクトルデータリポジトリ(PDF:2.8MB)

動画 なし

糖鎖構造抽出ソフトウェアを用いた化合物データベースとの連携

番号 35
第2部
発表者 ○松原 正陽(野口研)、木下 聖子(創価大)、山田 一作(野口研)
要旨

我々はこれまで、糖鎖構造を一意な文字列で表すための表記法WURCS、および国際糖鎖リポジトリGlyTouCanを開発し、国内外の糖鎖関連データベース連携を進めてきた。特に生物学と化学の分野間の連携のために、化学構造式で記述された糖鎖構造をWURCSに変換するためのソフトウェアを開発し、これまでにタンパク質構造データベースPDBに登録されている糖鎖構造の連携が実現した。一方、化合物データベースPubChemの構造には、PDBのように、構造中の糖鎖の有無が明示されていない。そこで我々は、構造式から糖鎖構造を判別するためのルール、およびそれに基づいて糖鎖を機械的に抽出するソフトウェアを開発した。
本ソフトウェアは、化合物に含まれる炭素鎖について、単糖骨格としてふさわしいかどうかをいくつかの条件に基づいて判別し、グリコシド結合などで繋がったそれらを糖鎖として抽出、WURCSとして出力する。現在、本ソフトウェアはPubChemによって、一部の化合物エントリーへのWURCSの追記や、GlyTouCanとの連携に利用されている。今後は引き続きPubChemと協働してソフトウェアの改良を進めるとともに、糖脂質など複合糖質にかかわる他の化合物データベースとの連携を進める予定である。

発表資料

糖鎖構造抽出ソフトウェアを用いた化合物データベースとの連携(PDF:1.71MB)

動画 なし

ウイルスタンパク質のKOとオーソログクラスター

番号 36
第3部
発表者 〇金 昭(京都大)、古道 美穗(京都大)、金久 實(京都大)
要旨

KEGG NETWORKデータベースでは、シグナル伝達や代謝をはじめとしたヒト生体内の様々な分子ネットワークが、遺伝子バリアント、ウイルスその他の病原体、環境因子などによりどのようなゆらぎを受け、どのような疾患に関連するかの知識を集約している。基本的にはヒト遺伝子ID(hsa ID)で表現されたネットワークであるが、病原体タンパク質はKO(KEGG Orthology)のID(K番号)で表現され、特定の実験データに基づく知識を一般化できるようにしている。しかしウイルスでは実験データ自体が少ないことから、KOとして定義できるものも少ない。またポリメラーゼやペプチダーゼのように比較的保存されているものもあるが、一般にウイルスタンパク質は多様かつユニークである。そこでこれまでのように実験的に調べられた個々のウイルスタンパク質によるゆらぎだけでなく、計算手法を用いてウイルスタンパク質全体を網羅的に解析することにより、ゆらぎの可能性の範囲を調べるアプローチをとることとした。具体的にはKEGGに含まれるウイルスタンパク質を配列類似性でグループ化したviral Ortholog Cluster (vOC) を作成する。クラスタリングの手法はまだ改良の余地があるが、vOCの最初のバージョンとKOとの対応について報告する。

発表資料

ウイルスタンパク質のKOとオーソログクラスター(PDF:3.05MB)

動画 なし

糖鎖関連データベースの連携強化

番号 37
第1部
発表者 ○藤田 典昭(産総研/創価大)、新町 大輔(産総研/創価大)、富永 大介(産総研)、安形 清彦(産総研/創価大)、岡谷 千晶(産総研)、成松 久(産総研)、木下 聖子(創価大)、久野 敦(産総研)
要旨

我々のグループでは、糖鎖関連遺伝子(GGDB)、レクチン(LfDB)、糖タンパク質(GlycoProtDB) 、糖鎖と感染症(PACDB)や糖鎖疾患遺伝子(GDGDB)といった糖鎖関連データベース(DB)やレクチンマイクロアレイデータの可視化ツール(LM-GlycomeAtlas)を開発し、GlyCosmos PortalとAsian Community of Glycoscience and Glycotechnology(ACGG)-DBで公開している。これらの糖鎖関連DBはセマンティックウェブ化と連携強化を進めることで、ユーザーにとって使いやすいDBの開発を進めてきた。
例えば、各DBの共通言語である糖鎖構造に、共通のID(GlyCosmos GlycansやGlyTouCan ID)を紐づけることにより、DB間の相互連携を促進した。また、GGDBとGDGDB間で共通した糖鎖関連遺伝子の横断や、LfDBとGlycoProtDB間で共通したレクチンの横断も可能にした。LM-GlycomeAtlasについては、Ver.2.0のインターフェースを活用し、Ver.2.1として新規データを追加公開した。さらに、GlycoProtDBについては、糖鎖構造の多様性を可視化するビューワーを新たに搭載し、糖鎖付加部位特異的グライコーム解析法(Glyco-RIDGE法)により取得したデータを表示可能とした。今後は、外部からのデータ登録を可能とするリポジトリシステムの開発を進める予定である。

発表資料

糖鎖関連データベースの連携強化(PDF:2.83MB)

動画

糖鎖関連データベースの連携強化|JST Channel

メタボローム統合データベースMetaboBank

番号 38
第2部
発表者 ○長崎 英樹(かずさ研)、荒 武(かずさ研/京都大)、福島 敦史(京都府立大/理研)、高橋 みき子(理研)、大澤 祥子(かずさ研)、小林 紀郎(理研)、藤澤 貴智(遺伝研)、時松 敏明(遺伝研)、福田 亜沙美(遺伝研)、櫻井 望(遺伝研)、諏訪 和大(リオレクト)、金谷 重彦(奈良先端科学技術大)、平川 英樹(かずさ研)、有田 正規(理研/遺伝研)
要旨

多様な代謝物をより多く同定することを目指すメタボローム解析から得られるデータは、分析装置による実験生データ、解析手法や設定を記載したメタデータなど多種多様である。メタボロームデータ統合化に向けてMetaboBankでは以下の開発を行っている。1)データレポジトリとしてBioProject、BioSample等DDBJメタデータとの連携、登録フォーマットMAGE-TABの整備、データ登録作業のシステム化。 2)メタボローム関連データベースKNApSAcK、MassBankのデータ移設、英国MetaboLightsのメタデータ追加、かずさDNA研、理研からの植物メタボロームデータのデータ移行と再解析。3) Resource Description Framework (RDF) によるデータアーカイブ化、2次データベースMetaboBank Wikiの構築。
2018年より開発が進めてられているMetaboBankは現在Ver2となり以下のサイトよりデータ公開と一般からのメタボロームデータの登録受付を開始している(https://mb2.ddbj.nig.ac.jp)。

発表資料

メタボローム統合データベースMetaboBank(PDF:5.19MB)

動画 なし

二次代謝物データベースKNApSAcK family DBの開発とデータサイエンス

番号 39
第3部
発表者 〇金谷 重彦(奈良先端科学技術大)、 森田 晶(奈良先端科学技術大)、有田 正規(遺伝研)、時松 敏明(遺伝研)、児玉 悠一(遺伝研)、藤澤 貴智(遺伝研)、荒 武(京都大)、高橋 みき子(理研)、長崎 英樹(かずさ研)、櫻井 望(遺伝研)、平川 英樹(かずさ研)
要旨

KNApSAcK Family DB(http://www.knapsackfamily.com/KNApSAcK_Family/)は、二次代謝物における多様な情報を、科学論文をもとに統合整理したデータベースである。KNApSAcK Core DBにおいて現在までに、KNApSAcK Core DBには、141,486組み合わせの生物種と代謝物の関係が蓄積されており、メタボロミクスならびに二次代謝物研究に関わる様々な分野で活用されるにいたっている。このように二次代謝物についての多様な情報を集積し公開する一方で、これらのデータを活用した体系的理解とマイニングを目指したデータサイエンスを展開している、ポスター発表においては、現在のKNApSacK family DB構築の進捗ならびに、分子コンボリューション・ニューラルネットワークなどの深層学習ならびに、機械学習を活用した解析例についても報告する。

[1] Shigehiko Kanaya et al,, Databases for Natural Product Research, Comprehensive Natural Products III (2021)

発表資料

二次代謝物データベースKNApSAcK family DBの開発とデータサイエンス(PDF:4.01MB)

動画 なし

jMorp: Japanese Multi Omics Reference Panel

番号 40
第1部
発表者 〇田高 周(東北大)、 菱沼 英史(東北大)、 井上 仁(東北大)、 青木 裕一(東北大)、 岡村 容伸(東北大)、 川嶋 順子(東北大)、 大槻 晃史(東北大)、 田口 恵子(東北大)、 菅野 貴成(東北大)、 元池 育子(東北大)、 勝岡 史城(東北大)、 小柴 生造(東北大)、 木下 賢吾(東北大)
要旨

東北メディカル・メガバンク機構では東北メディカル・メガバンク事業におけるコホート調査に参加いただいた方のゲノムおよび他のオミックスデータを解析し、その一部を統計情報としてJapanese Multi Omics Reference Panel (jMorp) データベースにて公開している。2022年8月時点では、ゲノムデータとして、日本人3人のde novoアセンブルによって得られた日本人基準ゲノム配列 JG2 や、約38,000人の短鎖全ゲノム解析結果から構成されるSNV/INDEL頻度パネル・HLA頻度パネル、長鎖全ゲノム解析による構造多型頻度パネルなどを格納している。また、メタボロームデータとして、ハイスループットのNMRと高感度のMSを駆使し、合計900以上の代謝物の濃度分布を収録している。その他にも、jMorpはメタゲノム解析結果やファーマコゲノミクス関連情報等も有し、セントラルドグマの枠を超えた情報をカバーし、日本人集団の多様性を俯瞰することが可能である。このような情報は疾患バイオマーカーの探索や、疾患予防や早期診断を行う際に有用な情報源になり得る。今後、解析サンプル数や同定物質、また掲載データの種類を増加することでパネルの精度向上・充実を目指す。

発表資料

jMorp: Japanese Multi Omics Reference Panel(PDF:1.9MB)

動画 なし

オミクスデータ科学を支えるMS-DIALワークベンチの開発

番号 41
第2部
発表者 ◯津川 裕司(東京農工大)、松沢 佑紀(東京農工大)、西田 孝三(東京農工大)、竹田 浩章(東京農工大)
要旨

質量分析はメタボローム、リピドーム、プロテオーム、グライコーム計測において必須の装置である。昨今、このような質量分析データのリポジトリ開発が進み、研究者らが自由に再解析する環境が整いつつある。我々は、その大規模かつ特殊性の高い質量分析オミクスデータを円滑にプロセシングすることに加え、今まで未知分子としてデータの中に埋もれていた未利用データをアノテーションするMS-DIALソフトウェアの開発を行っている(Nature biotechnology 38, 1159-1163, 2020)。本発表では、現在取り組んでいるMS-DIALワークベンチの概要、ならびにオミクスデータの再解析により捉えた新たな知見に関する実例を紹介する。

発表資料

オミクスデータ科学を支えるMS-DIALワークベンチの開発(PDF:1.26MB)

動画

オミクスデータ科学を支えるMS-DIALワークベンチの開発|JST Channel

SSBD:database/repository バイオイメージングデータのグローバルなデータ共有

番号 42
第3部
発表者 ○糸賀 裕弥(理研)、王 放放(理研)、山縣 友紀(理研)、京田 耕司(理研)、遠里 由佳子(理研/立命館大)、大浪 修一(理研)
要旨

SSBDデータベース(https://ssbd.riken.jp/)は、バイオイメージング分野におけるデータの共有と再利用のためのサービスである。2019年より、論文で使用したあらゆるイメージングデータを共有するリポジトリSSBD:repositoryと、最先端のイメージング技術で取得した再利用性の高いイメージングデータに豊富なメタデータを付加して共有する高付加価値データベースSSBD:databaseの二階層の仕組みに移行した。多くの学術誌で義務化が進む論文の一次データの公開においてイメージングデータの公共リポジトリとしてSSBD:repositoryが利用可能であり、永続的なアクセスを可能とするDOIを、NBDCの協力のもとで発行している。これまでに、SSBD:repositoryでは8TBを超えるイメージングデータと関連データが、SSBD:databaseでは6,798セット(10.2TB)の画像データと696セット(344GB)の生命動態定量データが、オープンデータの適切な公開のためのFAIR原則に則り共有されている。現在、イメージングデータのグローバルな共有と再利用を目指して、日米欧を拠点としたシステムの構築が進められている。SSBD:repositoryと欧州・BioImage Archiveが公共リポジトリ層を担い、SSBD:databaseと欧州・Image Data Resourceが高付加価値データベース層を担う。米国でも、それぞれの層を担う仕組みの構築が検討されている。グローバルなデータ共有システムにより、統一された検索・アクセス方法・フォーマットでのバイオイメージングデータの再利用が期待できる。今後は、空間情報を含むオミクスデータなどを受け入れるほか、データベースの機能性・使用性の向上などを計画している。

発表資料

SSBD:database/repository バイオイメージングデータのグローバルなデータ共有(PDF:2.25MB)

動画

SSBD:database/repository バイオイメージングデータのグローバルなデータ共有|JST Channel

BD-zarr: 生命現象の時空間動態データを記述するための次世代フォーマットの開発

番号 43
第1部
発表者 〇京田 耕司(理研)、ホー ケネス(フランシス・クリック研究所)、糸賀 裕弥(理研)、大浪 修一(理研)
要旨

バイオイメージ・インフォマティクス技術の発展により、さまざまな生命現象に対するタイムラプス顕微鏡画像から、分子や細胞、個体の位置やかたちの変化などの時空間動態を、座標情報として定量的に計測できるようになった。我々はこれまでに、定量データを統一的に記述することができるBiological Dynamics Markup Language (BDML)/BD5を開発してきた。近年、バイオイメージング分野において、データ共有および解析のための基盤がクラウド環境へ対応されはじめている。本研究では、クラウド環境に適したZarrを基盤とした定量データの次世代フォーマットBD-zarrの開発を行う。同じくZarrを基盤とした画像データの次世代フォーマットとの親和性を高めることにより、クラウド環境での画像および定量データ解析の効率化をはかる。さらに定量データを利活用するための解析ライブラリを開発することにより、バイオイメージングデータを利用した生命現象の時空間動態の理解を促進することを目指す。

発表資料

BD-zarr: 生命現象の時空間動態データを記述するための次世代フォーマットの開発(PDF:1.43MB)

動画

BD-zarr: 生命現象の時空間動態データを記述するための次世代フォーマットの開発|JST Channel

DDrare Update ~難病・希少疾患創薬データベースの更新~

番号 44
第2部
発表者 ○坂手 龍一(NIBIOHN)、宇佐美 祐子(NIBIOHN)、田辺 麻央(NIBIOHN)、深川 明子(NIBIOHN)、木村 友則(NIBIOHN)
要旨

DDrare(Database of Drug Development for Rare Diseases)[1]は、厚生労働省の指定難病及び対応する希少疾患を対象に、臨床試験から抽出した開発薬物とその標的遺伝子/パスウェイの情報を格納している。最新の2022年3月データ版では、デザイン&ユーザーインターフェースを一新するなど、2018年の正式公開以降、最大の更新を行った。①Disease、Drug、Target Gene/Pathwayの各情報をさらに直感的にわかりやすくするため、ページ構成や遷移を見直し。②新設のDisease detailsページでサブ疾患や、対応する小児慢性特定疾病などを表示。③疾患群ごとに疾患を表示。④KEGG DRUG[2]を追加し、3種類のDrug検索結果を切替え表示可能に(Description in Trials / DrugBank / KEGG DRUG)。⑤Target GeneとTarget Pathwayを切替え表示可能に(Pathway / Gene)。また、臨床試験などのデータ更新と、疾患名と薬物名のオントロジー及びテキストマイニングの改良を行った。DDrareにより疾患横断的な創薬状況の時系列変化を追うことができるため、我々はドラッグ・リポジショニングに関する研究[3, 4]や、製薬企業との創薬標的探索の共同研究も行っている。引き続き、データ品質の向上、有用情報の追加、検索速度の改善(アクセス数増加への対応)などを実施していく計画である。

[1] DDrare:https://ddrare.nibiohn.go.jp
[2] KEGG DRUG:https://www.kegg.jp/kegg/drug/
[3] Sakate and Kimura. Sci Rep. 2021
[4] Sakate and Kimura. Drug Discov Today. 2022

発表資料

DDrare Update ~難病・希少疾患創薬データベースの更新~(PDF:3.37MB)

動画 なし

小児慢性特定疾病児童等および指定難病患者データベースの連結による利活用推進研究

番号 45
第3部
発表者 ○山﨑 千里(NIBIOHN)、坂手 龍一(NIBIOHN)、村井 英継(NIBIOHN)、盛一 享德(国立成育医療研究センター)、木村 友則(NIBIOHN)
要旨

小児慢性特定疾病児童等データベース(小慢DB)と指定難病患者データベース(難病DB)のデータ登録は平成29年度より開始され、令和元年度に審査開始されデータ提供がスタートした。それぞれの運営機関である国立成育医療研究センターと医薬基盤・健康・栄養研究所においては、将来の更なる利活用促進を目指し検討を進めている。一方、難病対策委員会・小慢専門委員会において難病対策及び小児慢性特定疾病対策に関する見直しの議論も進んでいる。
本研究では小慢DB/難病DBの利活用により期待される効果、ならびにデータベース連結を推進するための検討を行ったので報告する。
【謝辞】本研究は、厚生労働科学研究費・難治性疾患政策研究事業課題番号21FC1018の支援を受けて行われた。

発表資料

小児慢性特定疾病児童等および指定難病患者データベースの連結による利活用推進研究(PDF:0.48MB)

動画 なし

文献およびゲノム解析データベースを利用したヒト疾患原因変異の解析例

番号 46
第1部
発表者 ○鴨下 信彦(自治医科大)、平本 貴史(自治医科大)、柏倉 裕志(自治医科大)、早川 盛禎(自治医科大)、大森 司(自治医科大)
要旨

ヒトの疾患変異・バリアントは、配列情報とゲノム・遺伝子上の位置情報に重きが置かれ、頻度情報は必ずしも十分に活用されない。私たちは、一塩基置換の一つであるナンセンス変異について、分布に加えて頻度が重要と考え、文献検索により患者変異を、ゲノム解析データベースより健康人中のバリアントを入手し、位置情報に加えて頻度を解析した。文献データベースはPubMedとHGMD (Human Gene Mutation Database)、ゲノム解析データベースは解析数の多いjMorp38K、gnomAD v3.1.2を用いた。対象遺伝子には、原発性高アンモニア血症の原因となる、尿素サイクル関連8遺伝子を使用した。変異・バリアントの各8割・7割強は、頻度数2以下で、翻訳領域内に散在し、位置情報が重要であった。変異の2割弱は、塩基置換が好発する特定コドンと健康人中の高頻度バリアントに由来し、今後定時的に頻度情報を記録することが重要と考えられた。集団遺伝学の観点からは、詳細な臨床記録とjMorp38Kの存在から、日本では世界でもたぐい稀なレベルの解析が加えられていた。日本人集団のバリアントアレル頻度と患者変異の出現度数の間には相関が認められた。

発表資料

文献およびゲノム解析データベースを利用したヒト疾患原因変異の解析例(PDF:1.36MB)

動画

文献およびゲノム解析データベースを利用したヒト疾患原因変異の解析例|JST Channel

PubCaseFinder 2022 update: 全ゲノム解析の社会実装に向けたVirtual Gene Panel構築機能の提案

番号 47
第2部
発表者 ○申 在紋(DBCLS)、山口 敦子(東京都市大)、武藤 勇(ビッツ)、張 昊(ビッツ)、才津 浩智(浜松医科大)、藤原 豊史(DBCLS)
要旨

難病領域の全ゲノム解析(WGS)推進が検討される中で、大量のバリアントを効率良く解釈するためのデータベースが求められている。近年、疾患に関連する遺伝子セットをVirtual Gene Panel(VGP)と定義し、バリアントの解釈に用いる試みがGenomics Englandの10万ゲノムプロジェクトを中心に始まっている。しかし、VGPを収載するGenomics EnglandのPanelAppデータベースは、人手で構築されているため、精度が高い反面、構築に手間がかかり、332件のみの収載に留まっている。そこで本研究では、オントロジーを用いることでVGPを自動構築する機能をPubCaseFinder(https://pubcasefinder.dbcls.jp)に追加し、評価用の症例データセットを用いて同機能のバリアント解釈精度を評価した。その結果、1万件以上の信頼性の高いVGPを利用することができ、またバリアントの解釈に有用であることが示された。本発表では、PubCaseFinderに追加したVGP自動構築機能の詳細と、バリアント解釈の評価結果について報告する。

発表資料

PubCaseFinder 2022 update: 全ゲノム解析の社会実装に向けたVirtual Gene Panel構築機能の提案(PDF:0.85MB)

動画 なし

症例情報管理システムの構築と公開

番号 48
第3部
発表者 ◯地引 芳乃(明治大)、浅野 由衣(Swallow Design Studio)、仁宮 洸太(東京大/国立保健医療科学院)、申 在紋(DBCLS)、佐々木 貴規(明治大)、菊池 敦生(東北大学病院)、藤原 豊史(DBCLS)
要旨

希少・遺伝性疾患の種類は10,000疾患以上、患者数は世界全体で4億人と推定され、非常に多くの方に関わる疾患領域であり、個別化医療や基礎医学研究の早期推進が期待されている。ゲノム解析が普及する中で蓄積されている患者のゲノムバリアント情報と臨床情報とを合わせた症例情報は、今後の個別化医療および研究推進に不可欠なリソースであり、GA4GHの主要プロジェクトであるMatchmaker Exchange(MME)では、98カ国の12万症例を集積し共有している。しかし、MMEで共有されている症例は欧米が中心であり、日本およびアジアの症例はごく僅かである。その原因の一つとして、症例情報を構造化データとして蓄積するためのシステムの整備が欧米に比べ遅れていることが挙げられる。
そこで本研究では、アジアを中心とした症例情報の集積・共有体制の構築の実現を目指し、ゲノムバリアント情報と臨床情報を構造化データとして保管できる症例情報管理システムの構築を目的とした。本システムの特徴として、詳細な表現型情報の入力支援機能、表現型情報共有に最適なPhenopackets形式への対応、表計算ソフトと同様のインターフェースでの症例一覧管理機能などが挙げられる。また、本システムはブラウザの機能で動作するため、症例情報はサーバに送られることなく、利用者のローカルPC上で管理できる。
本発表では症例情報管理システムの機能や今後の拡張性について報告し、トーゴーの日に合わせて公開するデモバージョンを紹介する。

発表資料

症例情報管理システムの構築と公開(PDF:2.11MB)

動画 なし

PubMedによる指定難病と他疾患との創薬研究動向の比較

番号 49
第1部
発表者 ○平田 誠(NIBIOHN)、坂手 龍一(NIBIOHN)
要旨

厚生労働省の指定難病の創薬については、他疾患で開発された薬剤の適応拡大であったり、逆方向の適応拡大であったりすることがある。そうした適応拡大については、それら疾患間の関連性についても情報が得られるものと考えられる。そこで我々は、PubMed全論文のタイトルと要旨をテキストマイニングにより解析し、疾患(指定難病、他疾患)と薬物とが共起する論文を抽出して、研究動向を分析した。指定難病はDDrare[1]、他疾患はMalaCards[2]から、薬物はDrugBank[3]からリストを作成し、共起関係における頻出語の影響は、IDF(Inverse Document Frequency)値を算出して除去した。その結果、PubMed約3,400万論文のうち、約9,100薬物について約1,100万論文が得られた。そのうち指定難病332疾患について約36万論文、他疾患約10,000疾患について約517万論文が得られた。薬物についてみると、指定難病と他疾患とで4,800薬物が共有されていた。1,000薬物について時系列での論文数の変化をみると、約92.6%の薬物で他疾患の方が指定難病より先に論文報告され、逆は約1.5%のみであった。疾患間での論文数の時系列変化、及び疾患ごとの薬物の論文数の時系列変化について解析した結果を報告する。

[1] DDrare:https://ddrare.nibiohn.go.jp
[2] MalaCards:https://www.malacards.org
[3] DrugBank:https://go.drugbank.com

発表資料

PubMedによる指定難病と他疾患との創薬研究動向の比較(PDF:2.13MB)

動画 なし

難病における臨床試験中の治療薬と疾患遺伝子のパスウェイ解析

番号 50
第2部
発表者 ○田辺 麻央(NIBIOHN)、坂手 龍一(NIBIOHN)、木村 友則(NIBIOHN)
要旨

創薬においては、薬剤と標的、疾患遺伝子等の関連を分子ネットワークの中で捉える必要性がある。難病の創薬情報データベースであるDDrare [1] では、指定難病の臨床試験から抽出した薬物の標的をPathway map (KEGG PATHWAY)に紐付けている。KEGGにはKEGG NETWORK [2]もあり、これは分子間相互作用・反応ネットワークの中で、基本的な単位となる部分を変異情報を含めて定義したデータベースである[Network (1380)]。今回、難病の薬剤の作用機序をより詳細に特定するため、標的をPathway mapのみならず Network 上にもマッピングした。さらに、各疾患の疾患遺伝子についても、疾患の発症機序や、その治療薬との関係を調べるため、同様のマッピングを行った。その結果、ある疾患における薬剤の標的と、疾患遺伝子の両方を含む Pathway mapの数は233、Networkの数は166であった。全ヒトPathway map数347の67.1 %において、疾患遺伝子のある mapが薬物の標的となっていた。一方、Networkでは 12.0 %が同様であった。この結果から、Networkの方がより詳細・精密な、標的と疾患遺伝子との関係情報が得られるものと考えられる。

[1] DDrare:https://ddrare.nibiohn.go.jp
[2] KEGG NETWORK:https://www.kegg.jp/kegg/network.html

発表資料

難病における臨床試験中の治療薬と疾患遺伝子のパスウェイ解析(PDF:0.51MB)

動画 なし

リン酸化活性測定をもとにした薬剤応答データベースPhosprofの開発

番号 51
第3部
発表者 〇鍵和田 晴美(産総研)、福井 一彦(産総研)
要旨

細胞は様々な刺激に呼応してシグナル伝達経路を制御し適切な細胞応答を導き出す。タンパク質リン酸化はシグナル伝達の主要な担い手である。我々はこれまでに、プロテインアレイを用いてリン酸化活性を測定し、その結果をもとにパスウェイ解析を行って細胞応答を評価する系を構築してきた。今回我々は、この系を用いて新たに94薬剤に対する細胞応答を解析した結果を収集し、データベースPhosprofを作成した。Phosprofは次の4つの項目から構成される。1) ’Signature Protein’ 薬剤投与によって特にリン酸化度の変化が大きいタンパク質をパスウェイマップ上で色付け表示した。マップ上の各分子はさらに配列やdisorder scoreなどの情報にリンクさせた。2) ‘Pathway’ パスウェ解析の結果を、階層マップ上に色付け表示した。階層化して表示することで、機能的に近いパスウェイどうしをグループ化してとらえることができる。3) ’Compare Pathway’ 複数の薬剤間でのパスウェイ解析結果をベン図として表示した。薬剤間で共通して変化の大きいパスウェイや、各薬剤に特徴的なパスウェイを検索できる。4) ’Drug Search’ 測定した94薬剤以外の化合物について、分子類似性の高い薬剤の’Signature Protein’結果を参照できる。このようにPhosprofは細胞応答から各薬剤の特性を調べるツールとして活用が期待される。

発表資料

リン酸化活性測定をもとにした薬剤応答データベースPhosprofの開発(PDF:1.86MB)

動画 なし

SIP由来バイオデータのポータル構築とRDFアクセス制御

番号 52
第1部
発表者 ○畠中 秀樹(DBCLS)、斉藤 恭一(日立製作所)、宗像 善久(日立製作所)、野口 栄紀(日立製作所)、栗原 英輔(日立製作所)、大久保 克彦(日立製作所)、箕輪 真理(DBCLS)、五斗 進(DBCLS)
要旨

本年度は戦略的イノベーション創造プログラム「スマートバイオ産業・農業基盤技術」(SIPスマートバイオ)の最終年度にあたる。そのため我々は、参加機関や協力企業などからの各種データの受け取り、カタログ整備、データポータルサイトの設置を進めている。
また、それら各種データが物質生産や育種などの検討へ活用されるのを支援する目的で、これまで開発してきた酵素反応RDFを中心とするウェブツールを用い、上述の各種データと既存のバイオRDF(Resource Description Framework)データの連携を検討している。
この連携において、クローズドデータを例えば品種や系統などの単位で柔軟にオープンデータと組み合わせられるように、我々はRDFストアにグラフ単位のアクセス制御を適用し、ウェブツールとの間で認証の連携を行えるようにした。この仕組みを用いて、一部のデータを閲覧権限を持つユーザのみが表示でき、オープンなRDFデータと組み合わせて解析できる環境を用意し、ユーザから好意的なフィードバックをいただいた。同様の仕組みを他のデータにも適用する予定である。

発表資料

SIP由来バイオデータのポータル構築とRDFアクセス制御(PDF:0.35MB)

動画 なし

TogoTV: バイオインフォマティクスツールとデータベースの動画教材・資料および生命科学イラストのためのポータルサイト

番号 53
第2部
発表者 ○小野 浩雅(DBCLS)、池田 秀也(DBCLS)
要旨

TogoTV (https://togotv.dbcls.jp/) は、生命科学分野の有用なデータベース(DB)やウェブツールの動画マニュアルや講演・講義動画、イラスト、講習資料などを紹介するポータルサイトである。TogoTVでは、研究者や技術者、それらを志す初学者が研究に役立つリソースに到達し、さらにそれらを使いこなすためのさまざまな情報を作成し、整理している。これまで、動画数2,000本以上、イラスト数1,200本以上を公開してきたが、コンテンツ数の増加に伴いウェブサイトの構成や動線に多くの課題が見受けられるようになってきたため2020年11月にウェブサイトリニューアルを行った。日本人類遺伝学会(JSHG)との連携・協働が実現し、専門家による紹介ツールの選定や詳細なレビューを経た動画コンテンツは2022年7月時点で8本を数え、「疾患に関連するバリアントや遺伝子発現の情報を調べる」にまとめられている。イラストについても連携・協働が行われ、専門家によるイラスト候補の推薦や詳細なレビューを経たイラスト計31本が作成・公開されている。このような各専門分野の学会との連携は、これまで以上に高品質なコンテンツを提供することに直結しているため、今後も多くの協働が実現するよう進めていく予定である。

発表資料

TogoTV: バイオインフォマティクスツールとデータベースの動画教材・資料および生命科学イラストのためのポータルサイト(PDF:8.86MB)

動画 なし

研究データ管理の知識情報を共有するRDMkit-jpの開発

番号 54
第3部
発表者 〇大波 純一(NII)、南山 泰之(NII)、古川 雅子(NII)
要旨

近年、日本国内でも研究データ管理(RDM)の機運が高まりつつあり、第6期科学技術・イノベーション基本計画においても、機関ごとのデータポリシー策定や研究計画段階でのデータマネジメントプラン(DMP)作成が急務とされている。しかしこのようなRDMに関する初心者向けの平易な表現や、ベストプラクティスの共有は国内で十分に行われているとは言い難い。一方欧州では、生命科学系リソースを共有する政府間組織ELIXIRが2021年より「RDMkit」を公開し、実務的なRDMの知識共有を実践していた。そこでRDMに関する基盤を国内に提供している国立情報学研究所オープンサイエンス基盤研究センターでは、RDMkitの情報を再構築し、日本語の説明や国内で利用可能な基盤を取りまとめて、新たに「RDMkit-jp」として2022年10月より公開する予定である。このサイトではRDMやDMP、識別子といった研究データ管理のために必要な語句の解説から、実際に研究データを扱う際の手順やツール情報を、関係する役割や研究データのライフサイクルごとに閲覧することができる。データを生成する研究者や研究データ管理者のみならず、学生にもアクセスし易いRDMkit-jpの情報は、日本の研究環境改善に寄与できるものと考えられる。

発表資料

研究データ管理の知識情報を共有するRDMkit-jpの開発(PDF:1.92MB)

動画 なし

バイオサイエンスデータベースの俯瞰調査

番号 55
第1部
発表者 〇NBDC事業推進部 研究開発推進グループ
要旨

バイオサイエンスデータベース(以下、バイオDB)整備政策立案の基礎資料とするため、世界の動向と日本の立ち位置を明らかにすることを目的に、世界のバイオDBの整備状況を調査・分析した。
NAR、FAIRsharing、Integbio、Database Commons、Web of Scienceを用いてDBリストを作成し、調査時点でアクセス可能だった3,881件について、Species、Data Type、Number of Data elements、Data Domain Classification、Type of Database、Access Type、Functional Classification、Development Year、Last Known Updated Date、Funding Source、Country of Originなどの情報を取得。これらをカテゴリごと、期間ごとにまとめるとともに、その現状と動向を分析した。
2000年以降、バイオDBの開発数は年々増加してきたが、ここ3年は若干鈍化傾向が見られた。新規に開発されたDB数で日本は世界2位だったが、被引用数では世界トップ131 DB中、日本のDBは1DBに留まった。日本のトップ30 DBでは、かずさDNA研、京大、理研、農研機構、東大の上位5機関が7割を占めた。モデル生物種から非モデル生物種、単一生物種から複合生物種といったバイオDBの多様化・多機能化が進むとともに、生物種やデータ種を超えたデータ統合が進んでいることが明らかとなった。分野別ではヒト、健康医療分野のDBが急増していた。海外と比較すると、日本は植物、昆虫、無脊椎動物に強みがあると思われた。

発表資料

バイオサイエンスデータベースの俯瞰調査(PDF:2.13MB)

動画 なし

※「発表者」のうち代表発表者については、氏名の前に「○」が付きます。

注意事項

  • ポスターデータの著作権は、別途記載がない限り、発表者・発表者の所属機関に帰属します。
  • ポスターデータの利用許諾条件は CC BY です。CC BY は、国際的非営利組織クリエイティブ・コモンズが提唱するライセンス形態のひとつで、「クレジットを表示すること」を条件に著作者の許諾を得ずに著作物を自由に利用してよいという意思表示です。詳細は、CC BYのコモンズ証をご参照ください。
ページの上部に戻る

お問い合わせ・ご意見

本ページの内容や本事業の一環として運営するWebサービスのお問い合わせ、研究データ・データベースなどに関するご相談などお気軽にお寄せください。