国立研究開発法人 科学技術振興機構

2006年度 ライフサイエンスDB統合の進め方へのユーザー評価の結果とその対応

H18年度末にH19年度以降の統合DBの進め方について、製薬企業を中心に約60名の生命科学関係者に意見を伺い H19年度開発の参考にいたしました。

各サービスに対する評価と対応

戦略立案

該当サービス H18年度成果に対するご評価 H19年度に実施した対応内容
- このまま推進 (含むご意見) 5件 ○研究管理
我が国の科学の様子が見やすくなることは、利用法によっては表面的な客観情報を使った研究管理につながりかねません。しかしながら(1)このような情報が一部に独占されていないこと、(2)別の解釈をゆるす十分な情報も公開されていることが満たされれば、科学管理的情報も個々の利用者の研究計画立案やコミュニケーションに有用であると考えておりますので、そのような内容を提供できるように今後も心がけてまいります。

○永続化
運営委員会を組織し、内閣府や他省庁の担当官の方々とも密に意見交換を行いました。運営委員会作業部会の記録も公開しました。

○拡充
H19年度には分担機関、補完課題が加わり、化合物、医療などそれぞれの得意分野での新規開発が開始されましたので、中核機関ではサービス項目を増やさずに質的な充実にとりくみました。
ご意見のみ 3件
要改善 or 保留 (含むご意見) 2件
詳細はこちら

統合化

該当サービス H18年度成果に対するご評価 H19年度に実施した対応内容
DNAバンク・GEO目次 このまま推進 (含むご意見) 5件 統合ホームページ上で稼働するすべてのサービスと連携して一括検索が可能なシステムを構築しました。さらに文献データベースとの統合の一環として、用語検索でヒットした特許配列に関して米国、欧州、および日本の特許庁が公開している情報へリンクし、利用者が特許文書を閲覧できる仕組みを開発しました。一方、DNAバンク全体に対して類似性検索を行うとヒト遺伝子などでは通常数百から数千件におよぶ類似配列が結果として得られます。そこで、これらの各配列の帰属を明瞭に表現するために、類似性検索であがってくる多数の配列をプロジェクト単位にまとめプロジェクト分類で展開するシステムも開発しました。また、バンク目次では分類を完全2元分類にし、全文検索を実装しました。
ご意見のみ 1件
要改善 or 保留 (含むご意見) 0件
詳細はこちら
ポリゴンマン
(名称が "BodyParts3D"に変更になりました)
このまま推進 (含むご意見) 1件 ポリゴンマン辞書の要素を、GUI上で組み合わせて3次元人体地図情報を生成するアナトモグラフィシステムを開発しました。このシステムは、ポリゴンマン辞書の閲覧・検索と解剖学要素の選択、各解剖学要素の表示形式の設定、フォーカスや視点の設定、生成した3次元人体地図情報の保存が可能なシステムです。さらに、辞書としての有用性を向上させるために、心臓や腹腔などを詳細化しました。
また、人体の3Dモデルの詳細部分に対して、解剖学の専門家(常勤)と医者がアノテーションを実施して、解剖学オントロジーを構築しました。
ご意見のみ 0件
要改善 or 保留 (含むご意見) 0件
詳細はこちら
解剖分類タガー このまま推進 (含むご意見) 0件 <今後、優先度を考慮しながら検討してまいります。>
ご意見のみ 1件
要改善 or 保留 (含むご意見) 0件
詳細はこちら
学会要旨検索 このまま推進 (含むご意見) 13件 完全公開を目指し学術会議やいくつかの学会にコンタクトしましたが、公開することで起こる責任問題などに心配が集中し、学会側の承諾が得られませんでした。学会毎の制度改正や著作権問題のクリアには時間がかかるため、まずは非公開で検索利用可能なシステムを開発し、ユーザからのご意見を今回のように伺いましたところ、賛同意見が非常に多くありました。今後はいただいたご評価を参考に、個別の学会との交渉を進め、完全公開に向けて推進してまいります。
ご意見のみ 3件
要改善 or 保留 (含むご意見) 0件
詳細はこちら
辞書 このまま推進 (含むご意見) 7件 ○辞書システムの設計
専門用語辞書システムの設計については、ライフサイエンス分野で重要となる類似語の効率よい検索手法に関する検討を行い、同義な用語の関係を記述できる機能をもつ辞書システムを設計し実装しました。専門用語解析技術の開発については、複数の類似の用語が並列表現として出現する場合の高精度な抽出手法を開発して,医療分野の文献を用いて評価しました。専門用語タグ付け手法の設計については、専門用語辞書の充実を目標に、テキストへのタグ付け手法を設計しました。実際の用語の抽出はWikipediaを対象とし,文書オブジェクト構造を利用した用語獲得手法を提案しました。

○辞書の収集
日本語キーワードでの検索を可能にするための辞書を収集し、京都大学のライフサイエンス辞書、JSTの科学技術対訳辞書、遺伝子名称シソーラス辞書並びに生物学名日本語一般名対応辞書を用いた検索システムへ適用しました。
ご意見のみ 3件
要改善 or 保留 (含むご意見) 0件
詳細はこちら
遺伝子名称シソーラス このまま推進 (含むご意見) 1件
ご意見のみ 4件
要改善 or 保留 (含むご意見) 0件
詳細はこちら
受け入れテンプレート このまま推進 (含むご意見) 0件 ○受け入れテンプレート
受け入れを容易にするためにテンプレートDBを作成しました。これを用いることで、ユーザはウェブブラウザを用いて、エクセル表やCSVファイルを読み込み、関係データベースを簡単に構築できます。さらに、横断検索のためのGUIも自動生成されるため、データ読み込み後すぐにウェブ公開できます。また、ウェブサービス(SOAP/WSDL)による検索APIも自動生成されます。

○受け入れ作業
cDNA関連のDBとして、BodyMap、HGPD(Human Gene Protein Database)、FLJ Human cDNA DB(スプライシングバリアントDB)とFLJ-DB(ヒト完全長cDNA)、DBTSS 、及びMiBASE(トマトEST DB)とKafTom(トマト全長cDNA DB)の受け入と連係方法を検討しました。また、理研補完課題のテーマに関連したDBとして、KATANA(シロイヌナズナDB)の受け入と連係方法を検討しました。なお、BodyMapについては、上記のテンプレートを用いた受け入を試行しました。
ご意見のみ 1件
要改善 or 保留 (含むご意見) 0件
詳細はこちら
全般 このまま推進 (含むご意見) 2件 <種々のご意見を、今後の開発の参考とさせていただきます。>
ご意見のみ 4件
要改善 or 保留 (含むご意見) 0件
詳細はこちら

ポータル

該当サービス H18年度成果に対するご評価 H19年度に実施した対応内容
DB横断検索 このまま推進 (含むご意見) 0件 利用者の方々の統合DBのイメージにあるような複数のDBの横断検索を開発しました。日本語の文献や特許と分子データの横断検索により、従来の分子データの検索に無い、新たな価値を生み出す可能性があると考えております。

検索対象としては、平成19年度中に20程度の代表的なDBを掲載しました。平成20年度中には我が国の関連DBの大部分と海外の主要DBを掲載する計画です。

またDBに対する検索を横断的に実現するために、植物、生物、国外、医学薬学の各データベースの巡回収集システムを開発し、国内外の主要なDBの収集システムを構築して、横断検索に搭載しました(検索対象DB数は33サイト、H20年7月現在)。
ご意見のみ 0件
要改善 or 保留 (含むご意見) 1件
詳細はこちら
Webリソースポータル このまま推進 (含むご意見) 3件
ご意見のみ 0件
要改善 or 保留 (含むご意見) 0件
詳細はこちら
ポータル・WingPro このまま推進 (含むご意見) 5件 ○統合ホームページサイトの運用
各参画機関で作成されるウェブコンテンツ、各種ツールの集約のためにヒアリングを行い、情報交換の手法について検討し、横断検索を中心にAPIを開発しました。安定的なサービスの実現のためにサーバ設計や外部サーバからの機能の移転などを行ないました。

○日本語文献
初年度より準備を続けていた和文解説記事「蛋白核酸酵素」全文検索サービスを公開することが可能となりました。さらに文科省「ゲノム」研究報告書、特許公報も和文有用文書として公開しました。
日本語文献の検索システム(蛋白質核酸酵素全文検索・新聞見出し配信・学会要旨統合検索・学協会検索)を構築の際には、別途収集した辞書を適用しています。
ご意見のみ 5件
要改善 or 保留 (含むご意見) 2件
詳細はこちら
施設名称辞書 このまま推進 (含むご意見) 1件 今後、国内の学会や協会、研究施設などもID化し、データベースとともに全てを関係付けてまいります。
ご意見のみ 0件
要改善 or 保留 (含むご意見) 0件
詳細はこちら
生物アイコン このまま推進 (含むご意見) 1件 引き続き、ご利用いただけます。
ご意見のみ 0件
要改善 or 保留 (含むご意見) 0件
詳細はこちら
統合TV, 教材 このまま推進 (含むご意見) 0件 平成19年7月の公開以降、9ヶ月間に59個の動画コンテンツを作成しました。これまでに訪問数30,423を数える人気サイトに育っています。また、平成20年度からの本格的運用に備えて計算機環境を整備しました。
ご意見のみ 1件
要改善 or 保留 (含むご意見) 0件
詳細はこちら
全般 ○利便性の向上
DBの所在が分からない、どう使ったらいいか分からないというユーザからの2つの大きな要望に対して、生命科学データベースカタログと統合TVを開発し、公開しました。

○ご意見収集方法
利用者の意見集約の方法について検討し、データベースカタログ並びに統合TVやブログなどのコメント欄を開設しました。

国際連携

該当サービス H18年度成果に対するご評価 H19年度に実施した対応内容
BioHackathon2008 このまま推進 (含むご意見) 1件 国内外の研究機関等関係者との連絡調整の一環として、平成20年2月11日~15日の5日間、ウェブサービスの統合を目指した現状調査・情報交換および技術開発を目的として、産業技術総合研究所生命情報工学研究センターの協力のもと、国際ワークショップ BioHackathon 2008 を開催しました。

また、本会議での議論を反映して、TogoWSに機能追加を行ないました。ワークフロー技術を用いた統合DB環境の構築については、配列解析を対象としたプロトタイピングを行ないました。
ご意見のみ 1件
要改善 or 保留 (含むご意見) 0件
詳細はこちら
辞書 このまま推進 (含むご意見) 1件 遺伝子辞書はあらゆるID系列に、解剖辞書はFMAに、医学用語はICDなど、標準的な体系との対応を常にとるように拡充しました。
ご意見のみ 0件
要改善 or 保留 (含むご意見) 0件
詳細はこちら
遺伝子名称シソーラス このまま推進 (含むご意見) 0件
ご意見のみ 0件
要改善 or 保留 (含むご意見) 1件
詳細はこちら

人材養成

該当サービス H18年度成果に対するご評価 H19年度に実施した対応内容
長浜バイオ大でのシニアと学部生の共同アノテーション このまま推進 (含むご意見) 0件 ○教育プログラムの実施及び内容の公開
教育/人材育成の各参画機関において作成された教育プログラムを集約したウェブサイトMotDBを公開するとともに、統合データベース講習会(2月25日於長浜バイオ大、3月5日於JST)を開催しました。

○アノテーションにおける問題点の調査
基盤技術開発、統合DBの開発・運用並びに人材育成の観点から、アノテーションにおける問題点の調査を行い、求められるアノテーションとは、(1)信頼性:専門家による判断の根拠がたどれる、(2)持続性:次の更新が期待できる、(3)網羅性:全ゲノム、全知識など大きな対象に、(4)再利用可能性:第3者にとって高度なアノテーションの起点となりうる、などであると結論付けました。以上に基づいてアノテーションに必要な辞書やツールの開発、モデル的にいくつかの専門的アノテーションを実施し、統合DB開発におけるアノテーションの質や量の改善と統一化、支援促進の仕組みを開発しました。

○シニアの活用
遺伝子ファミリー別アノテーション:配列に注釈付けがされていない微生物メタゲノムを材料に遺伝子ファミリー単位で横断注釈付けを行ないました。H19年度はtRNA群を対象に人材育成の一環として、シニア研究者(退官教授)と学生の共同作業として行ないました。
ご意見のみ 1件
要改善 or 保留 (含むご意見) 0件
詳細はこちら

その他

該当サービス H18年度成果に対するご評価 H19年度に実施した対応内容
全般 このまま推進 (含むご意見) 2件 <種々のご意見を、今後の開発の参考とさせていただきます。>
ご意見のみ 1件
要改善 or 保留 (含むご意見) 0件
詳細はこちら

トーゴーの日シンポジウム2024「AI + ロボティクス + データベースが変える生命科学」

トーゴーの日シンポジウム2024「AI + ロボティクス + データベースが変える生命科学」。2024年10月5日(土) 品川ザ・グランドホールにて開催。一般参加登録受付中。