国立研究開発法人 科学技術振興機構

BioHackathon 2018 Parisに参加して

2019年4月1日
大波 純一(NBDC)

NBDCの大波です。

2018年11月12日~16日に「BioHackathon 2018 Paris」がフランスで開催され、NBDCからは私を含む3名の研究員が参加しました。

「バイオハッカソン」とは、生命科学系データベースやバイオインフォマティクスに関する技術開発や議論を行う場として、日本では2008年から毎年開催されているイベントの一つです。近年はNBDCとDBCLSが共催し、世界中から100名以上の研究者や技術者が参加して泊まり込みでプロジェクトに取り組む、生命情報学の発展に欠かせないイベントとなっています1

今回のBioHackathon 2018 Paris(以下、BHと呼称)は日本でのイベントとは別に、ヨーロッパの「ELIXIR」という組織が日本のバイオハッカソンから影響を受けて開催しました。ELIXIRは2014年に設立されたヨーロッパの政府間国際組織で、生命科学系研究リソースを適切に統合し共有できるようにするため、23か国180の研究機関が参画して様々な共有基盤を提供しています2

BioHackathon 2018 Parisの案内表示

BioHackathon 2018 Parisの案内表示
テーマロゴの形は、データの統合利用やオープンデータでも良く利用されるJSONフォーマットやDNAの構造を想起させるものでした。参加者にはこのロゴをあしらったピンバッジとTシャツが配布されました。

ELIXIRは、自身が提供するバイオインフォマティクスリソースのポータルサイトとして「bio.tools」を公開しています。私たちは近年NBDCで、バイオインフォマティクスで利用するツールを定義する構造化データの在り方について検討を行ってきましたので、「bio.tools」と私たちの検討内容の関係性について議論するため、担当する3名の研究員がBHに参加しました。本記事では参加者目線でイベントの概要についてレポートさせていただきます。

BioHackathon 2018 Parisの概観

BHは5日間に渡って開催されましたが、初日は各プロジェクトの代表者が計画の内容について発表するシンポジウムでした。残りの4日間は朝9時から夜7時までひたすらプロジェクトを遂行し、セーヌ川沿いの静かな環境で課題に取り組むことができました(下記画像参照)。

会場周辺の風景

会場周辺の風景
会場は写真左奥の林の中にありました。町の中心地から離れておりとても静かな場所でした。

プロジェクトは事前に募集があった29課題に分かれて実施され、最初に取り組みたいメンバーが集まって議論を行い、毎日最後に代表者は発表を行って進捗を全員で共有しました。このような進め方やイベント開催地の環境は、日本のバイオハッカソンと良く似ていました。またSlackチャンネルやGoogle docs、GitHubを利用した情報共有や成果物管理も上手く機能していて、ELIXIRの組織としての盤石さも感じることができました。

イベントの参加者は約150名でほとんどがヨーロッパの方でしたが、アメリカや東南アジアからの参加者も数名いて(参考:参加者の出身地がチェックされた世界地図)、日本からもDBCLS、NBDCのメンバーを中心に約10名が参加しました。参加募集サイトが満席で閉じるまでの時間はかなり短かったようで、この分野への関心の高さがうかがえました。

私たちが取り組んだプロジェクトについて

NBDCメンバーは「Putting structured data into individual entry pages in biological database(生命科学系データベースの個別エントリーページへの構造化データの付与)」という課題タイトルで、バイオインフォマティクスツールの構造化データの在り方について議論を行いました。

進捗発表を行う筆者

進捗発表を行う筆者

初日のシンポジウムでは当センターの櫛田達矢研究員と八塚茂研究員が、プロジェクトの概要について発表を行いました(発表資料)。始めに、海外のGoogle検索結果で採用されつつあるマークアップスキーマによる構造化データの記述方法(参考)について説明しました。そして、このような構造化データをアプリケーションごとに記述し、Webサイトに埋め込む手順については十分なコンセンサスが得られていないため、その議論や構造化データ作成のための基盤が必要であることを示しました。

ちなみに、NBDCと共同で研究を行っている医薬基盤・健康・栄養研究所(NIBIOHN)では、このようなマークアップの有用性に早くから注目し、連携している横断検索システムにおいて検索結果に表示するための構造化データを付与する手順を提案していました。このカスタマイズを実施したお陰で、NBDCの横断検索の結果から生物分類や更新日などの情報が見やすく表示されるようになっています。

また、DBCLSメンバーが多く参画したプロジェクト「Application of RDF-based models and tools for enhancing interoperable use of biomedical resources」では、DBCLS特任助教の片山俊明氏が発表を行いました(発表資料)。その中で課題の内容以外に日本のバイオハッカソンの歴史にも言及し、1か月後に島根県松江市で開催される次のハッカソンにも引き続き参加してほしいと提案されていました(下記画像参照)。発表後、氏のこれまでの日本のバイオハッカソンの立ち上げおよびオーガナイズの功績を顕彰する目的で、運営事務局からロダンの「考える人」を模したトロフィーが授与されました。

シンポジウムで発表する片山俊明氏

シンポジウムで発表する片山俊明氏

bio.toolsメンバーと共同作業

2日目からは各課題に興味があるメンバーが集い、プロジェクトを開始しました。嬉しいことにbio.tools運用メンバーの一人の方も興味を持ってくださり、我々と共に議論を進めることになりました。最終的にこのチームでは、ツールデータの比較や調査を行い、適切な検索結果の表示方法の提案やメタ情報の分類、メタ情報の記述に用いられるスキーマオントロジーの選定、モックアップの作成を実施しました。

さらにbio.toolsメンバーの協力が得られたことで、実データとしてbio.toolsのデータをAPI経由で取得することができました。そしてbio.tools由来のデータを検索結果に表示するためのスクリプトを組んで、ハッカソンらしいことができたことも僥倖でした。最終日には成果物や実施項目のまとめをドキュメント化する「Writeathon」を実施し、無事に予定していた課題の達成に漕ぎ着けることができました。

感想

このイベント中、他の参加者とは食事の際などにいろいろな話ができましたが、それ以外にも、マオリ族のダンスであるハカ(Hacka)を皆で踊るもう一つの「BioHackathon」イベントに関連する絵画を描く会など様々なサイドイベントも開催されていました(残念ながら、NBDCメンバーは参加しませんでしたが・・・)。バイオとは?研究者が必要とする情報とは?オープンなデータとは?といった根源的な議論もできる雰囲気もあり、参加者間の親密なコラボレーションや深く課題を推し進めるパワーになっていたように思います。「懇親」といえば「飲みニケーション」ばかり想像していた筆者にとって良い刺激になりました。

この後、2018年12月に日本でもバイオハッカソンが開催され、多くの参加者がディープで充実した日々を過ごしました。海外からも高い評価を受ける日本のバイオハッカソンについて興味を持たれた方は、公式ページもどうぞご覧ください。

引用文献

  1. T. Katayama et. al. " BioHackathon series in 2011 and 2012: penetration of ontology and linked data in life science domains ". Journal of Biomedical Semantics. 2014, 5:5. DOI:10.1186/2041-1480-5-5
  2. L. C. Crosswell and J. M. Thornton. "ELIXIR: a distributed infrastructure for European biological data". Trends in biotechnology. 2012, 30, 5, p.241. DOI:10.1016/j.tibtech.2012.02.002

著者紹介

大波 純一(おおなみ じゅんいち)

NBDCの横断検索担当。ペットのロシアリクガメと共に堅実なデータアクセス基盤構築を目指しています。好きな動物:プロングホーン。最近の趣味は御朱印集め。

cc-by Licensed under a Creative Commons 表示4.0国際 license
©2019 大波 純一(国立研究開発法人科学技術振興機構バイオサイエンスデータベースセンター)

AJACSウェビナー

染色体高次構造の基礎、Hi-C解析手法の原理と実践的な解析の流れまでを解説!
データ解析講習会:AJACS「Hi-C解析を知って・学んで・使う」 は2025年1月16日開催です。