国立研究開発法人 科学技術振興機構

DBCLSのソフトウェア「Yevis」の論文が掲載されました 自動テスト機能を持つワークフロー公開基盤

  • その他
  • 研究開発・連携
2023年3月8日

NBDCが連携するライフサイエンス統合データベースセンター(DBCLS)の大田 達郎 特任助教らは、データ解析用のワークフロー公開基盤ソフトウェア「Yevis」に関する論文を、2023年2月22日、GigaScience誌に掲載しました。本ソフトウェアを通じて信頼のおける「ワークフロー」の公開を促進し、オープンサイエンスの前進に貢献します。

生命医科学分野、特にゲノム科学分野におけるデータ解析では、様々なソフトウェアを組み合わせて実行することが一般的です (様々なソフトウェアを組み合わせた一連の処理を「ワークフロー」と呼びます)。こうしたワークフローを共有することで、コンピューターに係る専門知識がなくとも高品質の分析手法を利用することができます。しかし、共有・公開したワークフローの信頼性を保証し続けるには多くの労力を要します。

ワークフロー公開基盤はすでにいくつも存在しますが、ワークフローの公開の容易さとワークフローの信頼性担保の方法は様々です。また、ワークフローの公開のしやすさと公開されたワークフローの動作保証は、しばしばトレードオフの関係にあります。たとえば、「WorkflowHub」や「Dockstore」では、ワークフローの投稿者が動作を保証する義務を課されることはありません。公開はしやすく、色々なワークフローが共有される可能性が高まりますが、実際には動作しないワークフローが含まれる可能性があります。いっぽう、「nf-core」では、ワークフローの投稿者はnf-coreの運営コミュニティに参加し、動作テストに取り組む必要があります。公開されるワークフローの信頼性は高まりますが、全てを維持することは難しく、より汎用的なワークフローの維持が優先される傾向があります。

「Yevis」は、独自のレジストリを新たに構築したい研究コミュニティ、あるいは個人としてワークフローを共有したい研究者のためのソフトウェアです。ソースコード共有およびソフトウェア開発サービス「GitHub」と研究データ公開リポジトリ「Zenodo」を利用するため、ウェブアプリケーションを構築・保守するための体制がない場合には特に有用です。また、ワークフローを自動で動作検証・テストする機能を有しており、ワークフローの公開と維持にかかる労力を低減することができます。

大田特任助教らは、「Yevis」のテスト機能開発の実装に先立ち、自動検証・テストをするための技術要件を定義し、本論文内で紹介しています。これは可用性、有効性、追跡可能性の3つに分類される、11個の要件から構成されています。

詳細は、原著論文および掲載誌ブログ「GigaBlog」のインタビュー記事をご覧ください。

AJACSウェビナー

染色体高次構造の基礎、Hi-C解析手法の原理と実践的な解析の流れまでを解説!
データ解析講習会:AJACS「Hi-C解析を知って・学んで・使う」 は2025年1月16日開催です。