国立研究開発法人 科学技術振興機構

招待講演・発表

10:35~10:50 ChIP-Atlasをつないで使う
10:50~11:05 【ユーザー発表①】核酸医薬およびゲノム編集医療の現状と安全性評価
11:05~11:20 【開発者から】GGGenome&CRISPRdirect:塩基配列検索およびゲノム編集のためのウェブツール
11:20~11:35 【ユーザー発表②】PGDBjデータベースの利用「栽培イチゴのゲノム解析・育種用選抜DNAマーカー開発」
11:35~11:50 【開発者から】植物ゲノムポータルサイト・PGDBjとPlant GARDENの紹介
11:50~12:30 【招待講演①】データ科学によるバイオ研究の新展開への期待
13:40~14:20 【招待講演②】人工知能技術を用いた新しい価値の創出
16:55~17:10 【ユーザー発表③】jPOSTデータベースの利用「ストレス耐性作物の作出を目指したプロテオミクス解析」
17:10~17:25 【開発者から】プロテオームデータベースjPOSTの挑戦
17:25~17:40 メタボロームから見る物質合成

口頭発表

ChIP-Atlasをつないで使う

発表者

沖 真弥

九州大学大学院医学研究院 講師

要旨

ゲノムに結合する様々なタンパク質の結合や分布を調べるため、これまでに約10万件ものChIP-seq データが報告されている。しかしそれらを利活用するためには非常に複雑で大規模な計算処理が必要なため、その多くが利活用されずに死蔵されているのが現状である。そこで我々は既報のChIP-seq データを網羅的に収集、計算、統合し、その解析結果をChIP-Atlas というウェブサービスとして公開している[1]。これにより、興味のゲノム領域における転写因子結合や修飾ヒストンの分布が視覚的に理解できるため、遺伝子制御ネットワークの解明や、エンハンサー領域の同定に活用できる。

またこれらのデータをフル活用した、転写因子結合のエンリッチメント解析も可能であるため、各種組織で特異的に発現する遺伝子のマスター制御因子の特定や、疾患と関連するnoncoding SNP に対する転写因子結合プロファイリングが可能である[2]。ChIP-Atlas で解析されたタンパク質-ゲノム結合データは全てテキスト形式で公開されているため、その他のオミクスデータベースやウェブツールとの連携が容易におこなえる。

本発表会ではChIP-Atlas について説明した上で、その「つなぎかた」について活用事例を交えながら紹介したい。

参考文献

[1]S. Oki et al., EMBO Rep., 19(12), e46255 (2018)
[2]S. Oki et al., bioRxiv, 262899 (2018)

発表資料

動画

ユーザー発表①

核酸医薬およびゲノム編集医療の現状と安全性評価

発表者

井上貴雄

国立医薬品食品衛生研究所遺伝子医薬部第2室 室長

要旨

近年、核酸医薬やゲノム編集を用いた医療技術の開発が大きく進展している。これらのモダリティは蛋白質を標的とする従来の医薬品とは異なり、RNA あるいはDNA のレベルで生体を制御できる点が大きな特色である。作用機構としては、これまでの医薬品では難しかった「疾患の原因となる分子をなくす」あるいは「機能的な分子を発現させる」ことが可能であり、特にアンメットメディカルニーズの高い遺伝性疾患や難治性疾患の領域での応用が注目されている。

核酸医薬はオリゴ核酸で構成され、遺伝子発現を介さず直接生体に作用する医薬品の総称であるが、特にRNA を標的とするアンチセンス医薬やsiRNA 医薬の開発が進んでいる。核酸医薬はこれまで生体内における安定性や有効性に課題があったが、修飾核酸技術や薬物送達技術が進展したことで状況は一変しており、局所投与のみならず、全身投与でも高い効果を発揮する候補品が次々と開発されている。核酸医薬は抗体医薬と同様に高い特異性と有効性が期待される一方で、低分子医薬と同じく化学合成により製造することができる。また、核酸モノマーが連結した共通の構造を有すること、有効性の高いシーズ(核酸配列)を短期間で取得できることなどから、一度開発スキームが完成すれば、創薬標的が変わって、迅速に開発を進めることが可能である。実際に、これらの利点が実用化という形で顕在化してきており、2019年8 月現在、9 つの核酸医薬が上市されているほか、200近い開発品目で臨床試験が行われている。

ゲノム編集治療は遺伝子治療の一種であり、DNA の二本鎖切断とその後のDNA 修復機構を利用することにより、遺伝子の「破壊」あるいは「置換」を行うことが可能である(通常の遺伝子治療は遺伝子の「補充」である)。代表的なゲノム編集ツールはオリゴ核酸により特定のDNA 配列を認識するCRISPR/Cas9システムであり、その簡便さからCRISPR/Cas9を用いたゲノム編集治療の開発が爆発的に進んでいる。ゲノム編集治療は、造血幹細胞やT 細胞等に対して体外でゲノム編集を施し、患者の体内へ投与する ex vivo ゲノム編集治療と、患者の体内へ直接ゲノム編集ツールを導入する in vivo ゲノム編集治療に分類され、2019年3 月時点でそれぞれ31件および6 件の臨床試験が行われている。現状では承認例がないが、今後、臨床開発がさらに加速していくと考えられる。

以上に述べた核酸医薬ならびにゲノム編集治療では、オリゴ核酸がRNA あるいはDNA と相補的に結合することで標的配列を認識するが、標的配列と似た配列を有するRNA/DNA 領域と結合することで想定外の作用を引き起こす可能性がある。この現象は「オフターゲット効果」と呼ばれており、その安全性評価法の整備ならびに安全性の判断基準の確立が求められている。本発表では核酸医薬やゲノム編集治療の開発動向を紹介すると共に、そのオフターゲット効果の安全性評価におけるDNA/RNA データベースおよび配列検索アルゴリズムの重要性に触れたい。

開発者から ~11

GGGenome&CRISPRdirect:塩基配列検索およびゲノム編集のためのウェブツール

発表者

内藤雄樹

情報・システム研究機構ライフサイエンス統合データベースセンター 特任助教

要旨

高速塩基配列検索ソフトウェアGGGenome(https://GGGenome.dbcls.jp/)およびCRISPR-Cas9によるゲノム編集のためのガイドRNA 設計ソフトウェアCRISPRdirect(https://crispr.dbcls.jp/)を紹介する。GGGenome(ゲゲゲノム)は、ゲノムや転写産物などの塩基配列を高速に検索することができるツールである。十数塩基程度の短い配列の検索にも対応しており、ミスマッチや挿入・欠失を含む配列であっても検索漏れがないため、核酸医薬品やCRISPR-Cas9のガイドRNA の特異性を確認するためにも役立つ。CRISPRdirect は、GGGenome による塩基配列検索を利用することにより、特異性の高いガイドRNA を簡便に設計できるツールである。GGGenome およびCRISPRdirect は、各種の実験動植物や作物など約350種のゲノムに対応し、他のデータベースやソフトウェアとも容易に連携できるようAPIを提供している。

発表資料

動画

ユーザー発表② ~11

PGDBjデータベースの利用「栽培イチゴのゲノム解析・育種用選抜DNAマーカー開発」

発表者

和田卓也

福岡県農林業総合試験場生産環境部バイオテクノロジーチーム 専門研究員

要旨

本発表ではPGDBj(Plant Genome Database Japan)とPlant GARDEN(Genome And Resource Database ENtry)に登録されている栽培イチゴ(Fragaria×ananassa)SSR マーカーおよびゲノムシーケンス情報を利用した、育種に応用可能なDNA マーカー開発状況について紹介する。

福岡県農林業総合試験場では平成14年にイチゴの新品種「福岡S6号」(商標名:あまおう)を育成した。本品種は、大玉、果実色の赤さ、濃厚な食味を特徴として高い評価を得ており、首都圏を中心に販売がされているが、その特徴に寄与するゲノム領域は明らかでない。イチゴの品種開発にあたっては、①優良な親系統の選定 ②親系統の交配後の集団からの優良個体の選抜 が極めて重要であるが、果実形質の選抜に利用可能なDNA マーカーはほとんどないことから、イチゴ育種家は新品種開発に多くの労力を要している。

本研究チームでは、イチゴの果実形質に寄与するゲノム領域を同定するにあたって、多様な遺伝的背景を基に解析することを目的として、栽培イチゴのMAGIC 集団(Multi-parent Advanced Generation Inter-Cross Population)を育成した(Wada et al. 2017)。同集団の遺伝子型の取得にあたっては、PGDBj およびPlant GARDEN に登録されている、豊富なSSR マーカー情報を用いた。果実形質の評価は5 か年(2013~2017)にわたって実施した。果実形質値の相関分析を行ったところ、果実色が最も遺伝的寄与が高く、環境変動の影響を受けにくいことが示唆された(Wada et al. 2017)。そこで、果実色に関して、GWA 解析(Genome Wide Association Study)を行ったところ、野生イチゴFragaria vesca の第1 、2 、7 染色体に相当する領域に有意なQTL が検出された(Wada et al. 投稿中)。特に形質値への寄与が大きいと考えられた第2 染色体のQTL について、PGDBj に登録されているゲノムシーケンス情報をもとにプライマーを設計し、QTL 近傍マーカーのアンプリコンシーケンスをMiSeq にて実施した。アンプリコンの塩基配列を比較して再度プライマーを設計し、育種選抜で使用可能なDNA マーカーを開発した。現在、開発マーカーの有効性の確認を実施している。

発表資料

動画

開発者から

植物ゲノムポータルサイト・PGDBjとPlant GARDENの紹介

発表者

磯部祥子

かずさDNA研究所植物ゲノム・遺伝学研究室 室長

要旨

PGDBj(Plant Genome DataBase Japan, http://pgdbj.jp)は植物ゲノム統合ポータルサイトとして開発され、現在緑色植物40種とラン藻213種のオルソログ、65植物種約26万件のDNA マーカー、45種約1 万6 千件のQTL 情報を2011年より公開している。一方、次世代型シーケンサー(NGS)の普及に伴い、多種多様な植物の全ゲノム配列解析が実施されている。

そこで様々な植物種でアセンブルされた全ゲノム配列を基軸として、これまで収集したマーカーやQTL 情報に加え、遺伝子情報やリシーケンスデータ、SNPs 情報などを格納した新たなデータベース「Plant GARDEN」を構築した(https://plantgarden.jp/)。

現在、β版として日本語および英語版を公開している。Plant GARDEN では各植物で公開されているゲノムワイド多型情報をゲノムブラウザ上に集約させ、さらに、複数植物間での遺伝子配列の類似性に基づいたデータリンク基盤を構築することで、ゲノムを横断的に比較する。また、ユーザーがNGS データを投入しSNP 解析を実施できるカスタム型多型検出システムも開発中である。さらに、ゲノム配列等を対象とする専門家だけでなく、より幅広いユーザーにゲノム情報に触れてもらうため、できるだけ平易で直観的にデータ検索ができるインターフェースの開発に努めた。現在、2020年3 月に完全版を公開することを目標に、インターフェースの改良や検索機能の拡張を行っている。

発表資料

動画

招待講演①

データ科学によるバイオ研究の新展開への期待

発表者

篠崎一雄

理化学研究所環境資源科学研究センター センター長

要旨

21世紀に入り、ゲノム科学が大きく発展しました。特にゲノムシークエンス技術の急速な発展により、多くの生物のゲノム解析が進展して、バイオサイエンスの方法論を大きく変えることになりました。同時にトランスクリプトーム解析も大きく進展しました。また、質量分析技術の大きな進歩によりプロテームやメタボロームの網羅的な解析が進んでいます。モデル生物を利用して次々と重要な遺伝子の機能、制御ネットワークの研究が大きく発展しました。このような多層の異なる情報をつなぐオミックス解析技術も進展して、遺伝子の機能解析や制御ネットワークの解析に利用されています。

遺伝子機能に関する多様なデータベースが作られて利用されてきました。これらの情報のハブとなるサイトも確立し、国際的には個別のモデル生物ごとにゲノム機能解析のためのデータベース、バイオリソースなどの情報が集約されて研究者に広く利用されています。一方、日本では、データベースの統合に向けてナショナルバイオサイエンスデータベースセンターが設立されて、国内のデータベースの統合と利用を組織的に推進してきました。これまでのバイオ研究の成果を集約してデータを生かすことに大きな貢献を果たしています。

2010年代初頭に情報科学分野で大きなパラダイムシフトが起きました。機械学習に加えて、深層学習が大きく進展して人工知能の技術に大きく発展しました。また、コンピューターの性能向上により大量の情報を解析し利用する技術が大きく発展しています。特に人工知能の囲碁プログラムが人間のトップ棋士を次々と破って社会に大きなインパクトを与えたことは記憶に新しいことです。その後のインターネット関連の情報産業の大きな発展により情報科学は各分野で大きな変革を迫っています。さらに同じ時期にゲノム編集技術が開発され、遺伝子の解析や改変に大きな技術革新をもたらしました。このような背景で遺伝子やゲノム解析に大量の情報を処理するためにバイオインフォマティクスが並行して進んできました。また、個体レベルでの表現型解析に関しては画像解析技術の急速な発展により情報解析技術を応用してより複雑な統合解析ができるようになりました。

一方、地球規模での様々な課題、例えば環境変動、食料、貧困、高齢化、海洋汚染など問題が顕在化しています。このような背景で、国際連合では2015年にSustainable Development Goals(SDGs)を採択して地球規模での課題解決を訴えており世界各国で取り組んでいます。SDGs の目標達成には、持続的なバイオ分野での技術革新が求められています。バイオ分野では医療・創薬分野、農林水産分野、工業生産分野での様々なデータの利用展開が期待されています。このためにバイオ分野での多量なデータを利用した情報科学、データ科学の新たな発展が求められています。この流れは、最近の内閣府の「バイオ戦略2019」でも取り上げられてバイオテクノロジーの新たな展開として期待されています。本講演ではバイオとデジタルの融合により期待される新たなバイオ研究に関して考えてみたいと思います。

発表資料

動画

招待講演②

人工知能技術を用いた新しい価値の創出

発表者

浦本直彦

三菱ケミカルホールディングス Chief Digital Technology Scientist /人工知能学会 会長

要旨

現在の人工知能の研究開発とその活用の広がりは、過去に例をみないスピードで社会に浸透しつつあり、様々な産業分野での取り組みが既に始まっている。既存の業務プロセスの自動化や最適化に始まり、人工知能技術とビジネスモデルを組み合わせた新しい価値の創造、汎用人工知能の研究開発など、技術の深化と応用の広がりの両輪を回すエコシステムが、産官学を巻き込んで動き始めている。

一方で、人工知能技術が、より複雑でクリティカルな場面で活用されるようになることで生じる課題に対し、きちんと向き合う必要性が出てきている。例えば、現在の人工知能技術の中心となる統計的機械学習(深層学習を含む)は、大量のデータから帰納的に規則性を見出したり予測を行う技術である。しかし、データが少なければその能力を十分に発揮することができないし、過去に起こっていない事象を予測することはそもそもできない。例えば製造業の現場では、データがあるといっても、年代ごとにデータの取り方が違っていたり、正解データを得ることが難しいことが日常的に起こる。
この問題に対し、少ないデータで、あるいは訓練データなしで精度の高い学習を行うための研究開発が活発に進められている。本講演では、強化学習、転移学習、半教師付き学習、敵対的生成ネットワークなどこの分野での主要なトピックを概観する。

多段のニューラルネットワークに基づく深層学習では、なぜその結果が出力されたのかを理解するための根拠を知ることが難しい。ブラックボックス最適化のモデルであり、人間の認知能力を超える多次元のパラメーターを最適化しているため、そもそも説明性を求める必要がないという議論もある一方で、安全性が重視される工場の生産工程における予兆検知に人工知能技術を適用する場合、判断の根拠を求められることが多い。深層学習における説明性の問題も、現在活発に議論されているトピックの一つである。この問題は、より広く捉えると人間と計算機システムの間でどのように信頼(Trust)を確保するかという問題に行き着くだろう。また、アルゴリズムの説明性だけではなく、データの品質も大きな問題となり、本講演の中で議論したい。

統計的機械学習を用いた計算システムは、もちろん人間が開発するソフトウエアあるいはハードウエアシステムであることには変わりないが、それらの設計、開発、運用、そして品質保証といったライフサイクルのあり方が変わる可能性がある。また、学習モデルや訓練データの改ざんなど新しいタイプの攻撃手法も出てきている。システムの開発指針や品質管理のためのガイドライン作成、その背後にある開発・使用における倫理の問題も現在活発な議論の対象になっている。

人工知能技術は、新しい計算システムのパラダイムを切り開き、社会に対してこれまでにない価値創造を行う可能性に満ちている。現実的な課題とそれに対するチャレンジを積み重ねながら、健全な発展に開発者、利用者両方の立場から、貢献していきたい。

発表資料

動画

ユーザー発表③

jPOSTデータベースの利用「ストレス耐性作物の作出を目指したプロテオミクス解析」

発表者

小松節子

福井工業大学環境情報学部 教授

要旨

温室効果ガスの排出は、地球温暖化を引き起こし、降水量や降雨パターンを大きく変動させ、干ばつや洪水による作物の収量低下を招く。特にイネ以外の多くの作物において、湿害の発生機構は複雑で、収量や品質の低下につながる深刻な問題である。作物の中でダイズは、ゲノム上遺伝子重複が多いために、多数の遺伝子の中から、耐湿性に関与する鍵となる因子を決定することは困難である。そこで、耐湿性ダイズの作出を目指して、冠水抵抗性突然変異ダイズ系統の探索および化学物質添加による冠水抵抗性付与ダイズの選抜を行った。

様々な条件で選抜された冠水抵抗性を示すダイズ素材を用いて、質量分析基盤無標識比較プロテオミクス解析、RNA シーケンシングを用いたトランスクリプトミクス解析、質量分析を基盤としたメタボロミクス解析を行い、オミクスデータを統合し鍵となる冠水抵抗性機構を解析した。得られた質量分析生データ等はjPOST データベースへ格納すると同時に、構築したSoybean Proteome Database (http://proteome.dc.affrc.go.jp/Soybean/[1]において公開している。

まず初めに、ダイズ遺伝子発現の包括的な研究の促進に資するため、機能解明研究に広く利用可能なダイズプロテオームデータベースを構築・公開した。本データベースは、2008年に公開し、その後改良を重ね、電気泳動を基盤にしたプロテオミクスと質量分析計を基盤にしたプロテオミクス解析技術を用いて得られたダイズタンパク質データを統合した[1]。ダイズのさまざまな生育時期の各種器官と細胞内小器官から得られたタンパク質データ、さらに、湿害下のダイズで変動するタンパク質データを提供している。

さらに、冠水抵抗性を示すダイズ素材を用いて、プロテオミクス解析、トランスクリプトミクス解析、メタボロミクス解析を行い、データを統合し鍵となる冠水抵抗性機構を解析した。その結果、hexokinaseとphosphofructokinase の制御下で糖代謝系が関与していることを示唆した。さらに、統合オミクス解析で重要因子とされたfructose の添加により、冠水下でダイズの生長を制御できることを明らかにした[2-3]。以上、未同定のタンパク質の多い作物において、本アプローチは、機能性タンパク質の同定において、有用な手段のひとつとなると考えられる。

参考文献

[1]Komatsu S et al., J Proteomics, 163: 52-66(2017)
[2]Wang X et al., Plant Mol. Biol., 94: 669-685(2017)
[3]Wang X et al., Int. J. Mol. Sci., 19: 1301(2018)

発表資料

動画

開発者から

プロテオームデータベースjPOSTの挑戦

発表者

石濱 泰

京都大学大学院薬学研究科 教授

要旨

日本内外に散在している種々のプロテオーム情報を標準化・統合・一元管理し、多彩な生物種・翻訳後修飾・絶対発現量も含めた横断的統合プロテオームデータベースを開発すべくjPOST(Japan ProteOme STandard Repository/Database)プロジェクトは2015年に産声を上げた。すでに確立した国際標準リポジトリおよび他のプロテオームデータ基盤にはない精度の高いデータ標準化機能を深化させ、より幅広いプロテオームデータの受け皿となる機能を現在開発している。

さらに、他のオミクスとのデータ連携により、シグナル伝達ネットワークや代謝ネットワーク等へのマッピングを通じ、生体分子による細胞機能、生命機能の解明に直接結びつくような解析ツールの提供を目指している。ゲノム変異情報を積極的に利用したプロテオゲノム解析や、腸内細菌叢等の多生物がおりなすメタプロテオーム解析から算出するデータも扱うとともに、メタボロミクス、グライコミクス等についてもその情報を取り込みながら解析可能なツールを開発し、幅広く生命科学研究者に利活用されるデータベースを現在鋭意構築中である。本発表では、他の公共データベースとの更なる連携の可能性やそこから生まれるシナジー効果、現状の問題点やユーザー側からのニーズなどについて、特に農作物分野における連携を例に議論したい。

発表資料

動画

口頭発表

メタボロームから見る物質合成

発表者

有田正規

国立遺伝学研究所生命情報・DDBJセンター センター長

要旨

生合成産物をゲノム情報から予測するアプローチはゲノム・マイニングと呼ばれ、とりわけ微生物の二次代謝産物予測に役立ってきた。ゲノム情報が溢れる現在は高スループットの検出系として質量分析計を用いた新規代謝物の予測が当たり前になっている。こうしたゲノム- メタボローム統合解析を通じ、これまで知られていなかった様々な代謝物が見つかっている。

例えばヒト細胞や微生物において、通常の一次代謝物がメチル化あるいは糖付加された物質。高等動物では薬物代謝として知られてきた反応ではあるが、構造がデータベース中に存在しないものがエピメタボライト等の名称で報告されている。従来の概念における代謝物の一部かもしれないが、今後重要な生理活性が見つかる可能性を秘めている。他にも、植物二次代謝物として多くのアシル化や糖付加体が報告されている。更にはペプチドの代謝物も多く見いだされている。従来は細菌や真菌における非リボソームペプチドがよく研究されていたが、最近は真菌や植物までがリボソームペプチドからRiPP と呼ばれる生理活性物質を生成することがわかってきた。これらの新規構造を予測するには、メタボローム解析における化合物ライブラリ充実が必須である。可能な構造変化を反映した理論スペクトルライブラリを用意することで、ノンターゲット解析結果から新規構造を見いだせるようになった。つまり既存のメタボローム情報から新たな発見ができる基盤、質量分析インフォマティクスが整ったのである。

統合化推進プログラム「物質循環を考慮したメタボロミクス情報基盤」では、質量分析インフォマティクスを実現するためのメタボローム・リポジトリ(MetaboBank)や解析ツールを開発している。初期データはかずさDNA 研究所および理化学研究所環境資源科学研究センターが保有する植物メタボロームであり、メタデータは既にhttp://metabobank.riken.jpから公開している。今後はヒトなど植物以外のデータにも拡張し、欧米のMetaboLights, Metabolomics Workbench に比肩する恒久リポジトリとしてサービスを開始する予定である。またMetaboBank のデータ解釈を容易にするメタ代謝マップの作成も進めている。生物種を超えて合成されるアルカロイドから作成を開始し、現在はKNApSAcK のCob-Web データベースとして公開している。

発表資料

動画

ページの上部に戻る

データ解析ウェビナー:AJACS

メタゲノム解析のトレンドと公共データの使いこなし方を解説!
データ解析講習会:AJACS「MAGを知って・学んで・使う」(2024年7月25日・オンライン) 受講登録を受付中