国立研究開発法人 科学技術振興機構

JOSS2021 参加報告 - データのFAIR度を測定する取り組み

2021年9月27日
信定 知江(NBDC)

NBDC研究員の信定です。

先日登壇したJOSS2021 内のセッション「FAIRなデータキュレーションの実践」の概要と、当該セッション内で私が紹介したFAIR度の測定に関する欧州・米国の取り組みを報告します。

JOSSについて

JOSS(Japan Open Science Summit)は、オープンサイエンスをテーマとした日本最大のカンファレンスで、今年は2021年6月14日(月)〜 19 日(土)の6日間、オンラインで開催されました。今回で3回目の開催です。研究分野や機関でのデータ管理から政策・ポリシーまで、幅広い話題について議論がなされました。

「FAIRなデータキュレーションの実践」セッションの概要

以下、私が登壇した「FAIRなデータキュレーションの実践」セッションについて、ご紹介します。

本セッションは、JOSS2021の5日目午後に、1時間半の枠で開催されました。国立情報学研究所オープンサイエンス基盤研究センターの南山泰之先生をオーガナイザーとして、4題の講演とディスカッションという構成でした。FAIR原則を題材に、実際にデータをどうキュレーションすべきかについて理解を深める場とするためのセッションでした。

まず、国立研究開発法人農業・食品産業技術総合研究機構の川村隆浩先生からバイオ分野について、東京大学社会科学研究所の三輪哲先生から社会科学分野について、それぞれデータ整備の現状とFAIR化への取り組みのご紹介があり、次に私の方からFAIR度の測定について、最後に国立情報学研究所の大波純一先生からディスカバリーサービスについて紹介がなされました。

その後、国立研究開発法人科学技術振興機構の小賀坂康志さんが加わり、全体のディスカッションが行われました。視聴者からFAIRの概念や理念に関する質問を受けたあと、最後に、登壇者がFAIRなキュレーションを行うモチベーションについて一人ずつ述べ、セッションが終わりました。

講演概要 - データのFAIR度を測定する、とはなにか?

上記セッションにて、私は、「FAIR Evaluation - FAIR度の測定」というタイトルで講演しました。以下、講演内容を簡単にご紹介します。

FAIR原則はデータ公開の適切な実施方法を現したものですが、やや抽象的で多様な解釈を受けやすい面があります。したがって、ある公開データあるいはデータ公開基盤(両者をあわせて「デジタルリソース」といいます)がFAIR原則をどの程度満たしているか、すなわちFAIR度を測定する(FAIR Evaluation)ための基準が必要です。

講演では、FAIR Evaluationに初期から取り組んでいるヨーロッパのグループによる「FAIR Evaluation Services」の内容を例に挙げながら、FAIR Evaluationの概要について紹介しました。FAIR Evaluation Servicesでは、デジタルリソースについてどの程度FAIR原則に沿ったものであるかを、ユニークIDを持つか、メタデータが整備されているか、利用許諾が明示されているかなど、項目ごとに判定することを提案しています。また、指標をユースケースに当てはめた判定結果を閲覧したり、自身のデータを判定したりすることができるウェブサイトを構築しています。

また、講演では名前の紹介程度しか触れられませんでしたが、アメリカのグループも「FAIRshake」という活動を通じてFAIR Evaluationに取り組んでおり、ウェブサイトを構築しています。FAIRshakeも、根本的な考え方はFAIR Evaluation Servicesと同じです。

なお、FAIR Evaluation Services、FAIRshakeのどちらも論文を発表しています(下記)。FAIR Evaluationに興味のある方は、まずこれらの論文を見ていただくと、FAIR Evaluationの基本的な考え方が掴めると思います。

  1. Evaluating FAIR maturity through a scalable, automated, community-governed framework
  2. FAIRshake: Toolkit to Evaluate the FAIRness of Research Digital Resources

論文でも言及されていますが、FAIR Evaluationは、デジタルリソースの学術的価値を判定するものではない、ということに注意が必要です。FAIR Evaluationとは、あくまで、デジタルリソースの公開のされ方が望ましい状態かを当該リソース作成者が知り、より利用されやすくするにはどのように改善すればよいか、に気付きを与えるものです。

所感

私自身はJOSSに参加したのは初めてだったのですが、参加者の専門がバラエティに富んでいることに驚きました。本セッションも、研究者だけではなく、図書館員や出版社の方々に多くご参加いただきました。登壇者の発表内容から、日本でも、個々の専門分野のデジタルリソース構築においてFAIRが意識されるようになったと知ることができ、感慨深く感じました。

FAIR Evaluationの詳細は、登壇をきっかけに調べたのですが、その過程で、私がNBDCで運用を担当する「Integbioデータベースカタログ」が、データベース情報の収集・公開を通じて、各データベースのFAIR度を上げ、ひいては研究コミュニティに貢献しうることを、あらためて実感することができました。

ご自身のデータを公開される方は、一度FAIR Evaluationにどのような項目があるかを確認してみてはいかがでしょうか? データ公開を通じてご自身の研究のプレゼンスをより高めたり、研究コミュニティへ貢献したりするためのヒントが得られるかもしれません。

cc by Licensed under a Creative Commons 表示4.0国際 license
©2021 信定 知江(国立研究開発法人科学技術振興機構バイオサイエンスデータベースセンター)

AJACSウェビナー

染色体高次構造の基礎、Hi-C解析手法の原理と実践的な解析の流れまでを解説!
データ解析講習会:AJACS「Hi-C解析を知って・学んで・使う」 は2025年1月16日開催です。