DBCLSのウェブサービス「TogoVar」の論文が公開されました
- 更新情報
- TogoVar
- その他
- 研究開発・連携
NBDCの実施事業における連携機関であるライフサイエンス統合データベースセンター(DBCLS)の研究グループが執筆した「TogoVar」の論文が、2022年12月12日付けで Human Genome Variation誌に掲載されました。
TogoVarは、日本人ゲノム配列の個人による違い(バリアント)とそれに関係する疾患情報などを収集・整理したデータベースです。2018年に公開し、2022年11月1日に提供者がNBDCからDBCLSへ変わったあとも開発・提供が続けられています。
本論文は、TogoVarの初の論文です。データの由来や処理方法、システム構成、利用方法などについて紹介しています。また、TogoVarへのデータ統合の結果分かったこと、現時点における課題と今後の開発予定について述べています。
TogoVarは、DBCLSがこれまで取り組んできたRDF関連技術を用いて複数のデータベース由来のデータを統合しています。また、DBCLSが開発・提供するRDFの利用を効率化するためのミドルウェア群を用いることで、TogoVarの初期の開発コストを大きく削減しました。例えば、インターフェイスにはSPARQL クエリを用いて RDF データベースから取得した情報を可視化する「TogoStanza」を使用しています。また、SPARQL クエリの実行と結果の後処理には「SPARQList」を使用しています。
RDFデータのデータベース管理システムとして OpenLink Software社が提供する Virtuoso を用いているほか、RDFの欠点を補うため、検索エンジンの Elasticsearch を併用することでキーワード検索を実現しています。
詳細は、原著論文およびDBCLSの新着情報をご覧ください。