【18】BioSamplePlus: BioSampleメタデータのオントロジーマッピングとRDF化
発表者
○池田秀也(DBCLS)、藤澤貴智(遺伝研)、川島秀一(DBCLS)、大田達郎(DBCLS)
※氏名の前の「○」は、代表発表者であることを表します。
DOI
概要
DDBJ BioSample、NCBI BioSample、EBI BioSamplesは、実験に用いられた生物学的サンプルのメタデータのデータベースであり、相互にデータを交換して運用している。サンプルの特徴を記述したメタデータは、サンプルに紐付いた様々な分子データやオミクスデータを検索・解析する際の重要な情報源である。しかしながらその記述の多くは投稿者の裁量に委ねられたフリーテキストとなっており、再利用性を低下させる要因となっている。我々は、ヒト由来サンプルのメタデータをオントロジーにマッピングしRDF化したデータセットBioSamplePlusを作成した(NBDC RDF Portal https://integbio.jp/rdf/ より公開準備中)。オントロジーマッピングを自動で行うためのツールとして、MetaSRAプロジェクト[1] が作成し公開しているパイプラインに独自の改良を加え、従来より高精度かつ高速なマッピングを実現した。付与されたオントロジーに基づく検索によって、テキストに基づいた検索と比較して高い網羅性で同一性質のサンプルを抽出することが可能になった。今後はマウスやその他の主要なモデル生物にも対象を拡張する予定である。
- [1] Bernstein M. N. et al. doi: 10.1093/bioinformatics/btx334
発表資料
- BioSamplePlus: BioSampleメタデータのオントロジーマッピングとRDF化(PDF:0.91MB)
注意事項
ポスターや発表スライド等の著作権は、別途記載がない限り発表者・発表者の所属機関に帰属します。
ポスター・スライド内の図や文言を転用する際には、著作者と話し合っていただくよう お願いいたします。