国立研究開発法人 科学技術振興機構
ポスター発表

【28】Linked Open Dataと配列データを組み合わせた配列分類手法

発表者

◯藤 博幸(関西学院大)、山口敦子(東京都市大)

※氏名の前の「○」は、代表発表者であることを表します。

概要

近年、タンパク質のアミノ酸配列や立体構造データが大量に蓄積され、それらからのデータマイニングの大きな基盤が形成されてきている。一方、そのようなデータの大量性は、従来のアラインメントや系統樹から、それらのデータの持つ意味の把握やそれに基づく知識抽出を困難にしている。この問題を解決するために、新たなアラインメントビューアの開発を行なっている。このビューアの大きな特徴の一つは、Linked Open Dataを探索し、そこから得られた情報を系統樹や配列の上に可視化できる点にある。今回、ビューアの新機能として、これらのLOD情報とアラインされている配列情報を組み合わせて、配列をクラスタ分類する手法を開発した。LOD情報の内、分子機能、生物学的プロセス、細胞の構成要素から、Jaccaed係数あるいはSinpson係数に基づく距離行列を、また生物の階層情報からはハミング距離に基づく距離行列を作成した。これらを、配列間距離の距離行列と組み合わせて3階のテンソルを構築し、テンソル分解を行なった。分解した結果をXmeans法でクラスタ数まで含め、自動分類できるようにした。本手法について議論する。

発表資料

注意事項

ポスターや発表スライド等の著作権は、別途記載がない限り発表者・発表者の所属機関に帰属します。
ポスター・スライド内の図や文言を転用する際には、著作者と話し合っていただくよう お願いいたします。

ページの上部に戻る

お問い合わせ・ご意見

本ページの内容やNBDCが運営するWebサービスのお問い合わせ、研究データ・データベースなどに関するご相談などお気軽にお寄せください。