世界中の研究開発者と松江で合宿 ~BioHackathon2018参加報告~

2019年5月17日
信定 知江(NBDC)

2018年12月9日から15日に島根県松江市で開催されたNBDC/DBCLS BioHackathon 2018に参加してきました。NBDC/DBCLS BioHackathonは、バイオインフォマティクスに関連する仕事をしている研究開発者が一堂に会して1週間にわたり議論を行うことで、効率的に開発を進め、技術開発や情報交換を行う場です。国内外から124名が集まり開発と議論に没頭しつつ親交を深めました。

議論と親交を深める5日間

スケジュールの1日目はシンポジウム、2日目からの5日間は朝から夜までホテルの大広間で議論と開発、最終日にはまとめの会を行いました。私は2日目から6日目まで参加しました。
ホテルの場所は目の前に宍道湖を望む気持ちの良い立地です。期間中はあいにくの天気が続きましたが、朝食時に雲の切れ間からつかの間見えた、朝日に照らされた宍道湖は素晴らしいものでした。

会場前に立てられたBioHackathon2018の看板

会場となったホテル一畑

島根県松江市といえば、一般的にはこの宍道湖(またはしじみ)を思い浮かべる方も多いと思いますが、インフォマティクスに携わる人が思い浮かべるのはプログラム言語の一つRubyとその開発者まつもとゆきひろ(通称Matz)氏かもしれません。開催者の主要メンバーが以前からご縁があり、また今回はまつもと氏の地元での開催ということで、開発2日目には氏の特別講演が行われました。講演では、Rubyの開発についてはもとよりRubyの今後やその他の言語のことなどについてもお話されました。またご自身の趣味や仕事に対する考え方など会場からの質問にも非常に気さくに答えてくださり、楽しくわかりやすいお話を伺うことができました。

BioHackathonで参加者が取り組んだプロジェクトは、各種データ整備やツール開発など、各々が普段から取り組んでいる仕事上多岐に渡ります。BioHackathonのページから、各プロジェクトの内容が整理されたスライドも見られますのでご興味がありましたらご覧ください。

生命科学データベースのFAIR度を計るには?

私が取り組んだのは、生命科学系データベースについて各データベースがどの程度FAIR原則に沿っているか(FAIR度)をスコアで表示するための指標(FAIR metrics)を検討することです。(FAIR原則については以前のブログをご覧ください)

私はNBDCでIntegbioデータベースカタログというサービスを担当しており、世界に数多ある生命科学系データベースの所在や内容に関する説明などの情報を整理し公開しています。1つ1つのデータベースを見るにつけ、データベースごとにその形式が様々で、例えばデータの利用許諾、連絡先が書かれているかどうか、といった基本的な「データベースについての情報」があるかどうかすら違いがあることに気づかされます。今、データベースはただ閲覧されるだけの存在に留まらず、その収録データは活用され、さらに新たな研究の芽となることが求められています。そのためにはどのようにデータが利用できるかといった利用許諾はもちろん、データがどのような条件で得られたものか、どのような解析をされたのか、などの由来情報も欠かせない情報となります。このような情報があると、そのデータベースはより「FAIR」であって、新たな発見につながることが期待できると言うことができます。

FAIR metricsについては、FAIR原則の提唱を行なった論文の著者の一人でもあるスペイン CBGP UPM-INIAのMark D. Wilkinson博士がFAIR度測定のためのツール開発に取り組んでおり、今回のBioHackathonでもその改良を行うということで参加されていました(Mark博士は第1回BioHackathonから参加されています!)。私はまずMark博士が作成された測定に使う項目(Access Protocol、Use FAIR Vocabulariesなど)の内容や意図を理解することから始め、バイオ分野のデータベースのFAIR度を測定するための項目としてどのようなものが必要で、具体的な入力値としてはそれぞれどのようなものが入り得るかを検討しました。検討にあたっては、データベースの扱う領域(ゲノム、遺伝子発現、タンパク質など)によってデータベースの構成が異なる部分があることを考慮して、各領域からそれぞれ典型的な構成のデータベースを取り上げました。作成したFAIR metricsについてMarkさんからは、測定対象としてデータベースと収録データの2種類があり、混ざってしまう部分を整理するようにアドバイスを受けました。今後の検討課題として取り組んでいきたいと思います。

Integbioデータベースカタログで紹介している各データベースにFAIR metricsによる評価を付与するかどうかはまだ検討段階ではありますが、少なくともFAIRの考え方に沿った情報提供は利用者がデータベースの利用を判断する際に重要な情報となりうると考えています。

私はBioHackathonへの参加は初めてだったのですが、このようにメールなどではなく直接議論しながらまとまった期間に集中して1つの仕事に取り組むことができ、とても貴重な時間を過ごすことができました。

会場に集まって議論する参加者たち

ホテルの大広間で5日間、朝から夜まで開発と議論に没頭

エクスカーション

尚、海外からもたくさんの方が参加されていましたので、中日の午後には希望者を募った出雲大社でのエクスカーションが開催されました。出雲大社にお参りする前に出雲大社や出雲周辺の歴史を紹介した博物館を見学しましたが、様々な歴史研究における仮説が丁寧に展示されていてとても興味深く、その後お参りした出雲大社の荘厳な佇まいは圧巻でした。海外から来た方と一緒にお参りしたので英語での説明には四苦八苦しましたが、古事記の世界の一端に触れられた気がして、日本の歴史ももう少し(海外から来た方に説明できる程度には)勉強し直したいと思うようになり、こちらも良い経験となりました。

著者紹介

信定 知江(のぶさだ ともえ)

ウェットの研究室を経て現在NBDC研究員。Integbioデータベースカタログを担当。癒しは本と植物。

cc by Licensed under a Creative Commons 表示4.0国際 license
©2019 信定 知江(国立研究開発法人科学技術振興機構バイオサイエンスデータベースセンター)

お問い合わせ・ご意見

本ページの内容やNBDCが運営するWebサービスのお問い合わせ、研究データ・データベースなどに関するご相談などお気軽にお寄せください。