国立研究開発法人 科学技術振興機構
ポスター発表

【51】国際タンパク質命名ガイドラインに準拠したタンパク質名提案システムへの取り組み

発表者

○藤澤貴智(遺伝研)、李慶範(遺伝研)、山本泰智(DBCLS)

※氏名の前の「○」は、代表発表者であることを表します。

DOI

doi:10.18908/togo2020.p051

概要

DDBJとライフサイエンス統合データベースセンター(DBCLS)では、INSDCへ配列データを登録する際に必要となるアノテーションを査定する作業の効率化を目指したTogoAnnotatorの開発を継続して進めており、DBCLSからサービスとして公開している。
本発表では、国際タンパク質命名ガイドラインへの準拠に対する取り組みについて報告する。ガイドラインの各項目についてデータ検証ルールを定義し、ガイドラインに準拠するためのルールをまとめたチェックリストを作成した。また、一般的な修飾語、標準的な科学的略語、化学記号など、各ルールに必要な用語のリストを作成し、それらがガイドラインに適合しているかどうかを判定するための正規表現パターンを設計した。その結果、多くのガイドラインルールについては、正規表現マッチによってガイドラインに準拠しているかどうかの判断が可能となった。一方で、遺伝子名、タンパク質ファミリー、タンパク質名を考慮した機能アノテーションの判定や生物種特有のアノテーションを考慮して実現するためには、いくつかの問題を解決する必要があり、現在のガイドラインに準拠していないルールと必要なデータベースリソースについても議論する。

発表資料

注意事項

ポスターや発表スライド等の著作権は、別途記載がない限り発表者・発表者の所属機関に帰属します。
ポスター・スライド内の図や文言を転用する際には、著作者と話し合っていただくよう お願いいたします。

ページの上部に戻る

お問い合わせ・ご意見

本ページの内容やNBDCが運営するWebサービスのお問い合わせ、研究データ・データベースなどに関するご相談などお気軽にお寄せください。