国立研究開発法人 科学技術振興機構

第10回「ゲノムと疾患・医薬品の統合データベース」

2012年8月23日
金久 實(京都大学化学研究所)

はじめに

1990年代に国際共同プロジェクトとして行われたヒトゲノム計画の大きな目的は,ヒトの疾患における遺伝要因を明らかにし,診断・治療・予防につながる新しい方法論を開拓することであった.2003年には全ゲノムのDNA塩基配列の決定が終了し,ヒトゲノム解読宣言がだされた.そののちも,国際HapMap計画,がんゲノム計画,ゲノムワイド関連解析(genome-wide association study:GWAS)といったさまざまなプロジェクトが行われ,多くの病因遺伝子が明らかにされてきた.また,おもな感染症を網羅する病原微生物の全ゲノム配列の決定がすでになされており,近年は,個人ゲノムの解析やヒトの体内に常在する細菌集合体のメタゲノム解析などもさかんに行われるようになってきた.ただ残念ながら,ヒトゲノム計画が当初の期待どおり,さまざまな疾患の診断・治療・予防につながったとはいいがたい状況はつづいている.それは,ヒトの生体は複雑なシステムであり,個々の遺伝子や分子のはたらきだけで理解できるような単純なものではないからであろう.このような現状にバイオインフォマティクス,とくに,データベースの技術がどのように貢献できるかを紹介したい.

研究者コミュニティーと一般社会との統合

ヒトゲノム計画は当初の目的とは別に,塩基配列の決定(シークエンシング)などハイスループットな実験技術の継続的な進歩という大きな波及効果をもたらした.ハイスループットな実験技術は大型プロジェクトだけでなく個々の研究室でも手軽に利用できるようになり,大量の実験データを活用することでさまざまな分野における研究に新たな展開が生まれている.ただ,この恩恵は国際的にみてもいまだ研究者コミュニティーにかぎられており,一般社会にまで到達していないのが現状である.その大きな理由は,そもそも"ヒト"をどのようにとらえるかにギャップがあるからだと考えている.研究者にとりヒトは生物種のひとつあるいは個体の集団を表現した概念的なものであり,医療関係従事者にとっては具体的な患者さんの集団であり,一般の人々にとっては自分自身であり特定の個人である.次世代シークエンサーをはじめとした実験技術の進歩により研究者側のもつヒトの情報は膨大なものとなり,一方,Webには一般の人々を対象とした医薬品や疾患の情報が氾濫している.しかしながら,両者の情報の肥大化は別個に進行しているためそこには大きなギャップが存在し,一般の人々が最先端の正確かつ有益な情報を得ることは困難である.

日本人は米国人と比べると"自分で自分を守る意識が低い"といわれている.これはたとえば,医者からもらった薬に自分の体内でどのような作用および副作用のあるのかを知りたい,あるいは,自分のゲノムを調べてどのような疾患の危険性がひそんでいるのかを知りたい,といった意識である.ただ,世界的にみても,このような疑問に答えることのできるリソースはきわめて不十分である.ゲノムに関連した研究の成果を社会に還元する形態のひとつはもちろん,新たな診断法や治療法を医療関係従事者に提供することであるが,もうひとつは,自分自身を客観的かつ科学的にながめ"自分の健康は自分で守る"ための適切なリソースを一般の人々に提供することである.筆者らは,このような観点から研究者コミュニティーと一般社会との架け橋となる統合データベース,KEGG MEDICUS(URL:http://www.kegg.jp/kegg/medicus/,または,http://www.genome.jp/kegg/medicus/)の構築を行っている.

KEGG MEDICUSの医薬品情報

KEGG(Kyoto Encyclopedia of Genes and Genomes,URL:http://www.kegg.jp/)とは,京都大学と東京大学の金久研究室(URL:http://www.kanehisa.jp/ja/)が開発しているゲノム解読の国際標準リソースである[1].KEGG MEDICUSは,KEGGの疾患情報(KEGG DISEASE)と医薬品情報(KEGG DRUG)とを中核とし,さまざまな外部のデータベースとの統合を行っている(表1).これにより,研究者コミュニティーに対しては研究成果の実用化を促進し,医療関係従事者や一般社会の人々に対しては疾患や医薬品についての科学的な理解を深める役割をはたす(図1).

図1.KEGG MEDICUSは最先端のゲノム研究と一般社会との架け橋をめざした統合リソースである

じつは,このような概念をもつ統合データベースとして,筆者らは2007年にゲノムネット医薬品データベースを開発し[2],ゲノムネットサービス(URL:http://www.genome.jp/ja/)の一部として提供してきた.ゲノムネット医薬品データベースは,日本医薬情報センターから提供されたわが国の医療用医薬品(処方薬)および一般用医薬品(大衆薬あるいはOTC薬)の添付文書の情報に,KEGG DRUGの情報を付加したかたちで一般に公開しているものである.これに対し,現在,開発中のKEGG MEDICUSの医薬品情報は,KEGG DRUGを中核とし,わが国の医薬品の添付文書だけでなく,米国の医薬品の添付文書や医薬品の副作用の情報との統合化も進めている.KEGG DRUGでは,すでに日本,米国,欧州の承認薬を化学構造と成分の観点から一元的に集積し対応づけを行っていること,ターゲットや代謝酵素をはじめとした分子間相互作用ネットワークの情報をとくにKEGG PATHWAYと対応づけて蓄積していること,効能や効果に関する情報をKEGG BRITEの医薬品分類の階層として蓄積していることから,これらの付加情報にも容易にアクセスできるようにしている.

2012年1月現在,KEGG MEDICUSのWebサイトにおいて医薬品情報の検索を行うと,KEGG DRUG日本語版,わが国の医療用医薬品の添付文書,一般用医薬品の添付文書が一括して検索され,タブで区別して結果が表示されるようになっている.また,個々の医療用医薬品の添付文書は対応するKEGG DRUGの情報とタブで切り替えて閲覧することができるようになっている.ここで,医薬品情報には以下の4つの階層が内在していることに注意されたい.個々の商品のレベル,複数の商品をまとめた添付文書のレベル,同一の化学構造により各社の販売する医薬品をまとめたKEGG DRUGエントリーのレベル(D番号とよぶ識別子がついている),塩や水和状態の違いなど化学構造の細かな違いをまとめた有効成分のレベル(国により,実質的に同じ医薬品の化学構造でも微妙に異なるケースがある),である.なお,ゲノムネット医薬品データベースは,2012年4月よりKEGG MEDICUSの医薬品情報に一本化する予定である.

KEGG MEDICUSの疾患情報

現在,KEGG MEDICUSのWebサイトにおいて疾患情報は,KEGG DISEASE日本語版と医療情報システム開発センターの標準病名がICD(International Classification of Diseases)の国際疾病分類をとおして統合したかたちで検索できるようになっている.KEGG DISEASEは疾患と遺伝子・ゲノム情報とをつなぐことを目的としたデータベースであり,ヒトゲノムにおける遺伝要因と疾患との関連,および,病原体ゲノムと感染症疾患との関連を蓄積している.前者については,OMIM(Online Mendelian Inheritance in Man)という国際的によく知られたデータベースが存在するが[3],これは読んで理解するための記述的なデータベースであり,ゲノムなどの大量データとの統合による計算処理には利用できない.そこで筆者らは,遺伝子・分子リストとよぶ計算処理の可能な表現を用いてデータベース化を行っている[4].また,研究者コミュニティーのためのものではあるが,疾患別の入口としてKEGG Cancer(がん)やKEGG Pathogen(感染症)の開発も進めている(図1).とくに,がんにおいては遺伝子発現や体細胞変異が診断や治療につながることから,がんゲノム計画において大量のデータが蓄積されており,KEGG CancerではCOSMIC(Catalogue of Somatic Mutations in Cancer)データベース[5]より取得した遺伝子変異データとの統合がなされている.

個別化医療とお薬手帳

ヒトゲノム解読の意義として個別化医療(personalized medicine)という言葉が使われるようになり,個人の遺伝子の情報がわかれば,そこから最適な治療法を選択して提供することが可能になるとされている.ただ,個々人に最適な治療を提供するのは医療の基本であり,当然,従来からも行われていたはずである.また,遺伝子の情報がすべてを明らかにするわけではないので,ヒトゲノム解読の意義は従来の検査に遺伝子情報の検査を加味することができるようになったと理解すべきであろう.最近では,イメージングなどほかの計測技術の進歩もめざましく,今後はさまざまな情報を統合処理したかたちで個別化医療が進んでいくものと思われる.

現在,公開中のゲノムネット医薬品データベースでは,簡単なお薬手帳も提供している.一般に,お薬手帳は個人が服用している薬を記録して,相互作用や重複投与を防止し,アレルギーや病歴を知ることに使われる.広い意味での個別化医療のツールでもある.ゲノムネット医薬品データベースのお薬手帳では記録をブラウザーのCookie情報にもたせ,医薬品間の相互作用を調べる機能をもっている.そのもととなるデータは,併用禁忌や併用注意に関与する医薬品間の相互作用を添付文書から抽出し,代謝酵素やターゲットの重複といった分子メカニズムとともにデータベース化している[6].2011年度中に新しいお薬手帳(仮に,KEGG MEDICUS My Medication Listとよんでいる)を開発し,利用者が付加情報を入力でき,個人情報をサーバーに蓄積せず自分自身で管理できるようなツールを公開する予定である.

おわりに

東日本大震災では,家屋も病院も津波で流されたことで多くの人々が自分の飲んでいた薬がわからないという状況におちいったことは衝撃であった.最先端の研究者のいう個別化医療とはあまりにも大きなギャップがあったからである.今後は,お薬手帳の電子化をはじめ,個人が情報を管理するPHR(personal health record)の考え方が広まっていくだろう.そこに個人のゲノム情報やイメージングのデータといった最先端の技術による大量の計測データが含まれるようになるかもしれない.KEGG MEDICUS My Medication Listは,将来的には個人のゲノム情報や生活習慣なども含めた統合検索および解析につながる,その第一歩にしたいと考えている.

参考文献

  1. Kanehisa, M., Goto, S., Sato, Y. et al.: KEGG for integration and interpretation of large-scale molecular data sets. Nucleic Acids Res., 40, D109-D114 (2012)
  2. 橋本浩介, 五斗 進, 金久 實: KEGG GLYCANデータベースと糖鎖インフォマティクス. 蛋白質 核酸 酵素, 53, 1698-1702 (2008)
  3. Amberger, J., Bocchini, C. A., Scott, A. F. et al.: McKusick's Online Mendelian Inheritance in Man (OMIM). Nucleic Acids Res, 37, D793-D796 (2009)
  4. Kanehisa, M., Goto, S., Furumichi, M. et al.: KEGG for representation and analysis of molecular networks involving diseases and drugs. Nucleic Acids Res, 38, D355-D360 (2010)
  5. Forbes, S. A., Bindal, N., Bamford, S. et al.: COSMIC: mining complete cancer genomes in the Catalogue of Somatic Mutations in Cancer. Nucleic Acids Res, 39, D945-D950 (2011)
  6. Takarabe, M., Shigemizu, D., Kotera, M. et al.: Network-based analysis and characterization of adverse drug-drug interactions. J. Chem. Inf. Model., 51, 2977-2985 (2011)

↑ 押下で本文に戻ります。

表説明

表1 KEGG MEDICUSでの疾患情報および医薬品関連情報の統合

カテゴリ データベース名 内容
疾患情報 KEGG DISEASE 遺伝要因が既知の疾患と病原体ゲノムが既知の感染症疾患
医薬品情報 KEGG DRUG 日米欧の承認薬を化学構造で一元管理,標的や薬物代謝の知識を集約
医薬品添付文書 JAPIC 日本の医療用医薬品と一般用医薬品の添付文書の情報
DailyMed 米国の医療用医薬品と一般用医薬品の添付文書の情報
医薬品分類 ATCなど 世界保健機関のATC分類,日本の薬効分類,米国薬局方の分類ほか
疾患分類 ICDなど ICD-10国際疾病分類,日本の感染症分類ほか
標準病名 MEDIS MEDIS電子カルテやレセプト電算処理に用いられるICD-10対応標準病名マスター
医薬用語集 MedDRA 医薬品の承認プロセスなどに用いられる国際医薬用語集
生体システム情報 KEGG PATHWAY 生体システムの機能を分子間相互作用および反応ネットワークとして知識を集約
KEGG BRITE 生体システムの機能に関連したさまざまな階層分類
遺伝子情報 KEGG GENES 全塩基配列の決定されたゲノムの情報とそこに含まれる遺伝子カタログの情報
化合物情報 KEGG COMPOUND 生体システムの機能に関与する生体内および生体外の化合物の情報

JAPIC:日本医薬情報センター,ATC:Anatomical Therapeutic Chemical classification,ICD:International Classification of Diseases,MEDIS:医療情報システム開発センター,MedDRA:Medical Dictionary for Regulatory Activities.

本文に戻る

cc-by
Licensed under a Creative Commons 表示2.1日本 license ©2012 金久 實(京都大学化学研究所)

なお、本記事は細胞工学2012年3月号掲載の原稿を改変したものです。

AJACSウェビナー

染色体高次構造の基礎、Hi-C解析手法の原理と実践的な解析の流れまでを解説!
データ解析講習会:AJACS「Hi-C解析を知って・学んで・使う」 は2025年1月16日開催です。