国立研究開発法人 科学技術振興機構

FORCE2018参加報告 ~オープンサイエンスの未来を考える会合に参加して~

2018年12月11日
大波 純一(NBDC)

NBDCの大波です。

2018年10月10日~12日に、カナダのモントリオールでFORCE2018が開催されました。FORCE2018はFORCE11の開催する年次会合であり、主にオープンサイエンスについて幅広い議論がなされました。

FORCE11は研究者、図書館員、アーキビスト、出版関係者、ファンディング機関関係者等から構成されているコミュニティであり、情報技術を効果的に使って学術コミュニケーションに変革をもたらすことを目的としています。データ共有の基準の一つであるFAIR原則(Findable(見つけられる)、Accessible(アクセスできる)、Interoperable(相互運用できる)、Reusable(再利用できる))は、このコミュニティがきっかけとなって生み出されました*1

NBDCではFAIR原則に関する文書*1を公開したこともあり、これまで進めてきた研究データ公開の方法に関してより幅広い知見を得るため、本会合に参加してきました。

会場に掲示されたFORCE2018の案内

FORCE2018の案内ボード
初日のみコンコーディア大学とマギル大学の2か所で開催された。

FORCE2018のセッション

FORCE2018では最大3件のセッションが並行して開催されました。各セッションはキーノートスピーチのような講演から、対面式のテーブルにおける少人数の会議、サービスのデモや、チームを組んで行うワークショップなど、多様な場が提供されていました。

初日のPre-conferenceでは単発的な14件のセッションが、Main conferenceでは約60件のセッションが開催されました。全体の参加者は223人、日本人は確認できた範囲では4人でした(下記写真参照)。

参加者の集合写真

参加者の顔ぶれ
© Ian Mulvany licensed under Creative Commons 表示2.0 一般

今回参加したセッションの一部を紹介します。

Better Metadata: How Metadata 2020 is working to help organizations invest in the connections between research 発表資料

Metadata 2020というコミュニティのセッションでした。この団体では各種メタデータの利用拡大のための推薦や定義の設定を行ったり、ベストプラクティスの共有や研究者とのコミュニケーションを仲介する役割を果たしているとのことでした。

さらにこのセッションでは、Metadata2020の理念をベースにしたボードゲームの体験会が実施されました。参加者は4人ずつのチームに分かれ、FとAとIとRを独自のルールで交互に獲得していく「Metadata game」(下記画像参照)に取り組みながら、保有するレポジトリをFAIRにしていくシミュレーションを実施しました。

このようなゲーム形式での取り組みはFORCE2018の中でも独特でしたが、FAIRを十分に知らない初学者への啓蒙としては有効だと感じました。

マス目に色が塗られたゲームボード

筆者チームのMetadata gameのゲームボード
4名1チームでチーム内の合計が高得点になることを目指す。1つのプロジェクトのFAIR要件が4名で分担して達成されると高得点(下段の6点の部分)になる。

Engaging researchers in data management by focusing on reproducibility of results

CuRe (Curating for Reproducibility) コンソーシアムの理念を元にした、研究者とデータの専門家の協業による「研究再現性の確保」に関するセッションでした。

学術出版社の投稿データポリシー設定が研究再現性の確保に有効という話(CuRe standard)から始まり、実際の取り組み方(CuRe workflow)として、コーネル大学のCISER(The Cornell Institute for Social and Economic Research)部門が取り組んでいる、Results Reproduction (R-Squared)と呼ばれる手法について解説がありました。これは決められたフレームワークに従って人間がチェックボックスにチェックを入れて確認を行うことで、再現性を担保するものでした。管理の仕方(CuRe management)としては、イェール大学で採用されているデータキュレーションツールであるYARD(Yale Application for Research Data)が紹介されました。さらに、ソースコードの品質を示すバッジ画像も紹介されました。

最後に、「再現性確保が研究者にもたらす利益は何か」や「再現性確保のためのパッケージ化された手法がどこまで必要か」が参加者によって討論されました。

Making Science Transparent By Default

Open Science Frameworkと呼ばれる研究ワークフロー共有基盤を利用して、ハンズオンで研究プロジェクト情報を登録し、その効果を確かめるという内容でした。

研究データやプレプリント、レビューについても一か所に情報を集めることができ、多様なレポジトリや基盤との連携が可能となっていたことから、進行中のプロジェクトからの移行もし易いのではと思われました。Frameworkの内容はポスターでも発表されていました。

Could open be the yellow brick road to innovation in genomics in North America? 発表資料

本会合のスポンサーの一つであり会場にもなっているマギル大学の方による発表でした。

イノベーションや特許、共有の在り方について定義を噛み砕いていき、SGC(Structural Genomics Consortium)やSage Bionetworksの例を読み解きながら、異なる分野間での共同研究や基礎研究、オープンサイエンスの重要性について理解を深める場でした。

医学におけるイノベーションへのYellow Brick Road(成功に至る道)についてというタイトルでしたが、他の分野においても参考になる内容だったと思います。

Citation not found: The case of non-canonical URLs 発表資料

ワシントンでコンサルティング業務を行っているThunken社による、「引用のためのURIやID」に関する発表でした。

始めにオルトメトリクス指標の課題として、サンプリングの網羅性が不十分で、多様な情報が含まれていないためにバイアスがあることを挙げていました。また、DOIはWeb上に大量に存在する文書を全て網羅できないので引用IDとして適切ではないと指摘していました。そして彼らが提唱する「Cobaltmetrics」サービスでは、世の中に存在する全てのURI、URL、PIDの情報を辿ることができるようにすることを提案していました。

Cobaltmetricsでは新たなIDを作ったり新たなスコアを付けたりすることなく、完全な引用情報を調査することができるとのこと。さらにURLの不安定性についても対応を行っており、特にリダイレクトで別のURLに移動するような「短縮URL」については短縮URLを提供しているステークホルダーと協調し、停止しているSci-Hub URLやリンク切れのURLについてもサポートしているとのことでした。このようなCobaltmetricsのURI情報を利用して、次世代のオルトメトリクスのような指標を構築することができるだろうと発表していました(発表資料20ページ目)。

Engaging Academia with Japan-wide Data Platforms and RDM Charter

以前からFORCE11の会議に参加されている*2、国立情報学研究所オープンサイエンス基盤研究センターの船守美穂准教授のセッションでは、「日本におけるオープンサイエンスや研究データ管理の現状」について報告と議論がなされました。導入では日本の地理的な位置や文化的な成り立ちを紹介し、その上で情報学研究所の取り組みや日本国内でのオープンサイエンスに関する政策や基盤について対応状況が報告されました。

個人的には今回のような欧米人を中心としたコミュニティにおいて、日本人が多数積極的に参加するのは言語的、習慣的に難しい面が多いものの、本発表の盛況や質問の活発さを見るに、欧米人からの日本のオープンサイエンスや環境に対する興味はかなり大きいように感じられました。

この他、FORCE2018ではポスターセッションも開催され、NBDCからも1件のポスターを発表しました。主に日本におけるライフサイエンス分野の研究データの公開について紹介を行い、数人の図書館員や研究者と議論を実施することができました(下記画像中央部参照)。

これらのポスターも含めた発表資料は、FORCE2018の事務局よりCERNが運用するZenodoレポジトリに投稿するようアナウンスされていました。

講堂に掲示された発表ポスター

ポスターセッションの様子
69枚のポスターがMain conferenceの講堂を囲む形で配置された。

全体として

FAIR原則については、今回の会議の中では既に常識レベルの語句となっており、改めてFAIRの名目で何かをするといったセッションは少なかったと思います。一方FAIR原則を生んだ後のFORCE11がさらに何を目指すかという観点では、オープンサイエンスが対象とする分野が広いことから、全体のテーマを包含するような具体的な目標は見えませんでした。

ライフサイエンス分野の参加者は確認した範囲ではほとんどいませんでしたが、図書館員や情報技術者の方は多く見かけました。

各セッションが短いせいか通常の国際会議よりも早口の方が多いように思われ、キャッチに苦労しましたが、世界中のどこよりもオープンサイエンスに積極性を持って関わる人々が集まる場でしたので、お互いの立場の理解も早く、深い議論ができたと考えています。

市民科学としての立場から議論する方も多かったものの、本会議に対する協賛団体はとても多く、Closing セッションでは新たにカリフォルニア大学が3年間の協賛に加わることが発表され歓声が上がっていました。

日本国内で「オープンサイエンス、市民科学、国策、図書館、出版社」といった切り口で議論をする場はまだ少ない状況ですので、本会議はJST/NBDCにとって多様な価値観に触れて考える良い機会になったと考えています。

紅葉した街の風景

秋めくモントリオール市
外の木々は色づき始めており肌寒く感じましたが、会場内は活発な議論で熱気にあふれていました。

参考資料

*1データ共有の基準としてのFAIR原則 NBDC 研究チーム2018年4月19日
https://doi.org/10.18908/a.2018041901

*2 FORCE11参加報告:学術情報流通とe-サイエンスの未来 国立情報学研究所 船守美穂 2017年11月28日
https://researchmap.jp/?action=cv_download_main&upload_id=153785

著者紹介

大波 純一(おおなみ じゅんいち)

NBDCの横断検索担当。ペットのロシアリクガメと共に堅実なデータアクセス基盤を目指しています。好きな動物:プロングホーン。最近の趣味は御朱印集め。

cc by Licensed under a Creative Commons 表示4.0国際 license
©2018 大波純一(国立研究開発法人科学技術振興機構バイオサイエンスデータベースセンター)

AJACSウェビナー

染色体高次構造の基礎、Hi-C解析手法の原理と実践的な解析の流れまでを解説!
データ解析講習会:AJACS「Hi-C解析を知って・学んで・使う」 は2025年1月16日開催です。