FAIR原則(「THE FAIR DATA PRINCIPLES」和訳)
注
本ドキュメントは、FORCE11が策定・公開する「THE FAIR DATA PRINCIPLES」の正式な日本語版です。(2020年2月21日)
前文
データ集約型科学の大いなる挑戦の1つは、課題解決に適した科学データや関連するアルゴリズム、ワークフローを発見し、それらに接続して、統合、解析し、人間や機械の円滑な知識発見を助けることである。ここでFAIRについて説明する。FAIRとはデータを「Findable(見つけられる)」、「Accessible(アクセスできる)」、「Interoperable(相互運用できる)」、「Reusable(再利用できる)」にするための一連の原則のことを指す。この「FAIR」という言葉は、2014年にオランダのローレンツセンターで開かれたワークショップで生み出され、2016年に「FAIR原則」として公開された。
これら15の原則に基づき、FAIRの達成レベルを測るために14項目の基準が定義された。FAIRの最新の進展の様子は、GO-FAIRのサイトから確認することができる。
FAIRの15個の原則
To be Findable:(見つけられるために)
- F1. (メタ)データが、グローバルに一意で永続的な識別子(ID)を有すること。
- F2. データがメタデータによって十分に記述されていること。
- F3. (メタ)データが検索可能なリソースとして、登録もしくはインデックス化されていること。
- F4. メタデータが、データの識別子(ID)を明記していること。
To be Accessible:(アクセスできるために)
- A1. 標準化された通信プロトコルを使って、(メタ)データを識別子(ID)により入手できること。
- A1.1 そのプロトコルは公開されており、無料で、実装に制限が無いこと。
- A1.2 そのプロトコルは必要な場合は、認証や権限付与の方法を提供できること。
- A2. データが利用不可能となったとしても、メタデータにはアクセスできること。
To be Interoperable:(相互運用できるために)
- I1. (メタ)データの知識表現のため、形式が定まっていて、到達可能であり、共有されていて、広く適用可能な記述言語を使うこと。
- I2. (メタ)データがFAIR原則に従う語彙を使っていること。
- I3. (メタ)データは、他の(メタ)データへの特定可能な参照情報を含んでいること。
To be Re-usable:(再利用できるために)
- R1. メタ(データ)が、正確な関連属性を豊富に持つこと。
- R1.1 (メタ)データが、明確でアクセス可能なデータ利用ライセンスと共に公開されていること。
- R1.2 (メタ)データが、その来歴と繋がっていること。
- R1.3 (メタ)データが、分野ごとのコミュニティの標準を満たすこと。
訳者:NBDC研究員(大波純一、八塚茂、 信定知江、箕輪真理、三橋信孝、畠中秀樹)
Licensed under a Creative Commons 表示4.0国際 license ©2019 国立研究開発法人科学技術振興機構バイオサイエンスデータベースセンター
日本語訳(本ページ)の引用例
FORCE11: THE FAIR DATA PRINCIPLES (2016). https://www.force11.org/group/fairgroup/fairprinciples, NBDC研究チーム(訳), "FAIR原則(「THE FAIR DATA PRINCIPLES」和訳)" (2019). https://doi.org/10.18908/a.2019112601