NGSハンズオン講習会2016カリキュラム
日程
PC環境の構築
7月19日 | 10:30-18:15 | Bio-Linux8とRのインストール状況確認 |
第1部(農学生命情報科学特論I)
7月20日 | 10:30-18:15 | 統計解析 ゲノム解析、塩基配列解析 |
7月21日 | 10:30-18:15 | 統計解析 トランスクリプトーム解析1 |
7月22日 | 10:30-18:15 | 統計解析 トランスクリプトーム解析2 |
第2部
7月25日 | 10:30-18:15 | NGS解析 NGS解析基礎 [初級・中級] |
7月26日 | 10:30-18:15 | NGS解析 ゲノムReseq、変異解析 [初級・中級] |
7月27日 | 10:30-18:15 | NGS解析 RNA-seq [初級・中級] |
7月28日 | 10:30-18:15 | NGS解析 ChIP-seq [初級・中級] |
第3部(農学生命情報科学特論II)
8月1日 | 10:30-18:15 | NGS解析 Linux環境でのデータ解析:JavaやRの利用法 [初級・中級] |
8月2日 | 10:30-18:15 | NGS解析 Linux環境でのデータ解析:マッピング、トリミング、アセンブリ [初級・中級] |
8月3日 | 10:30-18:15 | NGS解析 クラウド環境との連携、ロングリードデータの解析 [初級・中級] |
8月4日 | 10:30-18:15 | NGS解析 トランスクリプトームアセンブリ、発現量推定 [初級・中級] |
講義内容・動画・資料
※一部資料は、東京大学・門田 幸二准教授が運営する「(Rで)塩基配列解析)」にリンクしています。当該ページの内容は、本ページでのお知らせすることなく更新される事がありますのでご留意ください。
Bio-Linux8とRのインストール状況確認
- Bio-Linux8(第2部および3部で利用するovaファイル)の導入確認
- 共有フォルダ設定完了確認
- 基本的なLinuxコマンドの習得状況確認
- R本体およびパッケージのインストール確認
- 講師指定の事前予習内容の再確認
- 講習会期間中に貸与されるノートPCを用いた各種動作確認
ゲノム解析、塩基配列解析
門田 幸二
- NGS解析手段、ウェブツール(DDBJ Pipeline)との連携
- k-mer解析(k個の連続塩基に基づく各種解析)の基礎と応用
- 塩基ごとの出現頻度解析(k=1)、2連続塩基の出現頻度解析(k=2)
- 塩基配列解析を行うための基本スキルの復習や作図
- de novoアセンブリ時のエラー補正やゲノムサイズ推定の基本的な考え方
トランスクリプトーム解析1
門田 幸二
- カウントデータ取得以降の統計解析(RNA-seq)
- サンプル間クラスタリング、結果の解釈
- 発現変動解析(反復あり2群間比較)
- 分布やモデル、実験デザイン
- 反復なし2群間比較(TCC, DESeq2)、および結果の解釈
トランスクリプトーム解析2
門田 幸二
- 反復あり3群間比較(TCCによるANOVA的な解析)
- デザイン行列、post-hoc test
- 遺伝子間クラスタリング(MBCluster.Seq)
- 反復あり3群間比較(EBSeqやbaySeqによる発現パターン分類)
- 反復なし3群間比較(TCC)、および結果の解釈
- (データの正規化、TCC正規化を組み合わせた各種解析)
NGS解析基礎
山口 昌雄、窪川 美雪
- ファイル形式
- 可視化 (IGV)
- quality check
- マッピング
- アセンブル
ゲノムReseq、変異解析
山口 昌雄、三澤 拓真
代表的なパイプラインについての実習:ゲノムReseq、変異解析
RNA-seq
山口 昌雄、尾上 広祐
代表的なパイプラインについての実習
ChIP-seq
山口 昌雄、久保 竜一
代表的なパイプラインについての実習
Linux環境でのデータ解析:JavaやRの利用法
門田 幸二
- 日本乳酸菌学会誌のNGS連載第4回の復習(特にFastQCとFaQCs)
- 乳酸菌連載第5回(W13-2まで)
- paired-endファイルのアダプター除去(FaQCs)
- Javaプログラムの設定と実行(Rockhopper2)
- Linux環境でのRの利用法(対話モードとバッチモード)
Linux環境でのデータ解析:マッピング、トリミング、アセンブリ
門田 幸二
- NGS連載第5回(残り)、第6回(W10-6まで)
- RパッケージQuasRを用いたRNA-seqデータのマッピング
- 末端塩基のトリミング(Biostringsとfastx_trimmer)
- トリミング前後のde novoアセンブルとマッピング結果の評価
- Illumina MiSeqデータの特徴と前処理(FastQCとFaQCs)
- de novoゲノムアセンブリ(Velvet)
クラウド環境との連携、ロングリードデータの解析
門田 幸二
- NGS連載第6回(残り)、ゲノムサイズ推定(KmerGenie)
- 配列長によるフィルタリング(Pythonプログラム実行と改変)
- DDBJ Pipeline (VelvetとPlatanus;エアーハンズオン)
- ロングリード(PacBio)データと公共DB
- ファイル形式(sra, FASTQ, bax.h5)、SRA Toolkit、FastQC
- DDBJ Pipeline (HGAP;エアーハンズオン)
トランスクリプトームアセンブリ、発現量推定
門田 幸二
- de novoトランスクリプトームアセンブリ(TrinityとBridger)
- 前処理(アダプター除去やトリミング)との組合せによる性能比較
- 発現量推定(TIGAR2)