【26】診療録からの症状半自動抽出システム「POET」の開発
発表者
○地引芳乃(明治大)、土肥栄祐(新潟大)、仁宮洸太(NIPH、東京大)、建石由佳(NBDC)、山本泰智(DBCLS)、佐々木貴規(明治大)、藤原豊史(DBCLS)
※氏名の前の「○」は、代表発表者であることを表します。
DOI
概要
近年ゲノム解析が臨床現場で普及し、構造化データであるゲノム情報が蓄積されている。他方、臨床現場では非構造化データである診療録が中心として利用されており、両者の情報は結びついていない。ゲノム情報の更なる利活用のため、診療録から臨床的意義のあるデータを構造化した形で自動抽出する技術が現在求められている。
本研究では、診療録から患者の症状及び所見を半自動的に抽出するPOET(Phenotype Ontology Extractor from Text)を開発し、ゲノム情報と診療録を組み合わせた活用を可能にするシステムの提供を目的とした。
現在POETは構造化データであるHuman Phenotype Ontology(HPO)の日本語訳を採用し、入力した診療録から完全一致した症状を抽出している。しかし現状は、多彩な症状表現に対応した語が数多く不足している。そこで、万病辞書(38万語)等の複数の医学用語辞書を活用し、HPO日本語拡張版を作成した。定量的な性能評価のため32件の症例報告を使い、臨床医とPOETの症状抽出結果を比較した。
本発表では、開発したPOET(https://pubcasefinder.dbcls.jp/text2hpo)および比較結果の詳細と、そこから発見された問題点について報告する。
発表資料
- 診療録からの症状半自動抽出システム「POET」の開発(PDF:2.52MB)
ライトニングトーク
注意事項
ポスターや発表スライド等の著作権は、別途記載がない限り発表者・発表者の所属機関に帰属します。
ポスター・スライド内の図や文言を転用する際には、著作者と話し合っていただくよう お願いいたします。