国立研究開発法人 科学技術振興機構

FAIR原則入門 ~FAIR原則とは? どうすれば対応できるのか?~

2018年7月17日(最終更新日:2018年7月18日)
NBDC

2018年4月にFAIR原則の翻訳と概要をNBDCのサイトから公開したところ、様々な反響をいただきました。その中で「FAIR原則が何なのかまだよく分からない」、「FAIR原則にどう対応すれば分からない」といった声も聞かれました。

そこで、本記事ではあらためてFAIR原則について説明し、どのようにすればFAIR原則に対応できるかについて提案してみたいと思います。

NBDCが作成したFAIR原則の日本語訳がFORCE11に正式版として採用されました。正式版は以下のページをご覧ください(2020年2月21日追記)。

「FAIR原則(ふぇあげんそく)とは何ですか?」

図1
FAIR guiding principles for data resources © 2016 SangyaPundir licensed under Creative Commons 表示 - 継承
4.0 国際 (https://commons.wikimedia.org/wiki/File:FAIR_data_principles.jpg)を改変

「FAIR」は、2016年頃から特に欧州のオープンデータ・オープンサイエンス関係の人々の間で盛んに唱えられている標語です。Findable(見つけられる)、Accessible(アクセスできる)、Interoperable(相互運用できる)、Reusable(再利用できる)の頭文字を取って、データ共有のあるべき姿を短くまとめたものです。

「FAIR」という単語は、日本でもフェアプレイ、フェアトレード等のように使われる、「合理的な、適切な、公正な、平等に扱う、好ましい」などの意味を持ちます。このためFAIR原則は、「データをフェアに扱おう!」というポジティブな印象もあって瞬く間に広まりました。

すでに、いくつかの研究資金を提供する機関が、研究データを扱う際の基準として「FAIR原則に従うこと」をガイドラインで推奨しています。

「どうすればFAIR原則に従ったことになりますか?」

例えば自分が実験で得たデータを、研究室のサーバに置いて外部からアクセスできるようにしたとします。では、「このデータはFindable(見つけられる)で、Accessible(アクセスできる)で、Reusable(再利用できる)なので、FAIR原則にだいたい従っている」と言えるのでしょうか?

図2
Togo Picture Gallery © 2016 DBCLS TogoTV licensed under Creative Commons 表示4.0 国際 (http://togotv.dbcls.jp/togopic.2017.26.html) を改変

残念ながら、答えはNOです。

その理由は、FAIR原則がF、A、I、Rの4項目だけでなく更に細分化された項目(F1、F2......)から構成されていて、それぞれに従っていないと十分FAIR原則に沿っているとは言えないからです。

例えばFの1つ目の項目を見てみましょう。

F1. (meta)data are assigned a globally unique and eternally persistent identifier.

訳:「F1. (メタ)データが、グローバルに一意で永続的な識別子(ID)を有すること。」

※(原文)https://www.force11.org/group/fairgroup/fairprinciples
 (訳文)http://doi.org/10.18908/a.2018041901

この文章を読んですぐに理解できるのは、「データ」や「情報」について詳しい知識をお持ちの方に限られるのではないでしょうか。語句レベルでは以下のような解釈となります。

(メタ)データ  ⇒ データ及びメタデータ両方について

グローバルに一意 ⇒ 他の実体と重複しないこと

永続的な     ⇒ 将来に渡って継続して利用し続けられる見通しがついていること

識別子(ID)    ⇒ ある実体を他の実体から区別するために用いられる文字列

これを読むとFAIR原則に沿うのは容易ではないのか......とがっかりされるかもしれません。確かに永続性を担保し、他と重複しないIDを作る方法を用意するのは、一般的な研究者やデータ生産者には若干ハードルが高いように思います。

しかし既存のサービスを利用すれば実現可能です。例えばNBDCには「生命科学系データベースアーカイブ」というサービスがあり、生命科学関連のデータの寄託を受け付けています。

そこで寄託を受けたデータは、NBDCが「メタデータとデータ」を整理し、DOI(Digital Object Identifier)と呼ばれる「グローバルに一意で」「永続的な」「識別子」をNBDCが代行してデータセットに付与し、公開します。これでFAIR原則のF1に沿った対応を実施したことになります。

取り組んでみませんか?

FAIR原則はF1を含めて15件もの項目がありますが、それぞれについて適切な対応が検討されています。FAIRなデータを提供するのは簡単ではありませんが、フェアな研究環境と未来のために、皆様の周りでデータの公開に詳しい方と話してみたり、データ公開を担っている機関に相談されてみたりしてはいかがでしょうか。

もちろん、NBDCでも皆様のデータをFAIRにするためのサポートを行っており、「アーカイブ」にご寄託いただくと上記でご紹介したF1以外にも満たせる項目がいくつもありますし、それ以外の様々なサービスでもFAIR原則への対応を実施しています。FAIR原則への対応やデータの寄託に関するご相談がありましたら、NBDCへ気軽にお問合せ下さい。

図3

cc-by Licensed under a Creative Commons 表示4.0国際 license
©2018 国立研究開発法人科学技術振興機構バイオサイエンスデータベースセンター

トーゴーの日シンポジウム2024「AI + ロボティクス + データベースが変える生命科学」

トーゴーの日シンポジウム2024「AI + ロボティクス + データベースが変える生命科学」。2024年10月5日(土) 品川ザ・グランドホールにて開催。一般参加登録受付中。