国立研究開発法人 科学技術振興機構

FAIR原則(「THE FAIR DATA PRINCIPLES」和訳)

2019年11月26日(更新:2019年12月19日)

本ドキュメントは、FORCE11が策定・公開する「THE FAIR DATA PRINCIPLES」の正式な日本語版です。(2020年2月21日)

前文

データ集約型科学の大いなる挑戦の1つは、課題解決に適した科学データや関連するアルゴリズム、ワークフローを発見し、それらに接続して、統合、解析し、人間や機械の円滑な知識発見を助けることである。ここでFAIRについて説明する。FAIRとはデータを「Findable(見つけられる)」、「Accessible(アクセスできる)」、「Interoperable(相互運用できる)」、「Reusable(再利用できる)」にするための一連の原則のことを指す。この「FAIR」という言葉は、2014年にオランダのローレンツセンターで開かれたワークショップで生み出され、2016年に「FAIR原則」として公開された。

これら15の原則に基づき、FAIRの達成レベルを測るために14項目の基準が定義された。FAIRの最新の進展の様子は、GO-FAIRのサイトから確認することができる。

FAIRの15個の原則

To be Findable:(見つけられるために)

  • F1. (メタ)データが、グローバルに一意で永続的な識別子(ID)を有すること。
  • F2. データがメタデータによって十分に記述されていること。
  • F3. (メタ)データが検索可能なリソースとして、登録もしくはインデックス化されていること。
  • F4. メタデータが、データの識別子(ID)を明記していること。

To be Accessible:(アクセスできるために)

  • A1. 標準化された通信プロトコルを使って、(メタ)データを識別子(ID)により入手できること。
    • A1.1 そのプロトコルは公開されており、無料で、実装に制限が無いこと。
    • A1.2 そのプロトコルは必要な場合は、認証や権限付与の方法を提供できること。
  • A2. データが利用不可能となったとしても、メタデータにはアクセスできること。

To be Interoperable:(相互運用できるために)

  • I1. (メタ)データの知識表現のため、形式が定まっていて、到達可能であり、共有されていて、広く適用可能な記述言語を使うこと。
  • I2. (メタ)データがFAIR原則に従う語彙を使っていること。
  • I3. (メタ)データは、他の(メタ)データへの特定可能な参照情報を含んでいること。

To be Re-usable:(再利用できるために)

  • R1. メタ(データ)が、正確な関連属性を豊富に持つこと。
    • R1.1 (メタ)データが、明確でアクセス可能なデータ利用ライセンスと共に公開されていること。
    • R1.2 (メタ)データが、その来歴と繋がっていること。
    • R1.3 (メタ)データが、分野ごとのコミュニティの標準を満たすこと。

訳者:NBDC研究員(大波純一、八塚茂、 信定知江、箕輪真理、三橋信孝、畠中秀樹)

cc-by Licensed under a Creative Commons 表示4.0国際 license ©2019 国立研究開発法人科学技術振興機構バイオサイエンスデータベースセンター

日本語訳(本ページ)の引用例

FORCE11: THE FAIR DATA PRINCIPLES (2016). https://www.force11.org/group/fairgroup/fairprinciples, NBDC研究チーム(訳), "FAIR原則(「THE FAIR DATA PRINCIPLES」和訳)" (2019). https://doi.org/10.18908/a.2019112601

NBDCメルマガ

NBDCの講習会・研究費公募・成果情報など、ライフサイエンスの研究者・技術者・支援者の皆さまに毎月お届けします。