【講座主旨】
深層学習モデルを用いて、ヒトとウイルス間のタンパク質相互作用(Human-Virus
Protein-Protein Interaction (HV-PPI))を予測する。ウイルスは、ヒト(宿主)細胞表面上の特定のタンパク質に結合
し、細胞内に侵入する。侵入後ウイルスは、ヒトの転写・翻訳・ゲノム複製などに関わるタンパク質
をハイジャックしながら増殖し、ヒト細胞を死滅させる。すなわち、ヒトとウイルス間のタンパク質
相互作用が、ウイルス感染症では決定的役割を果たす。深層学習モデルを開発して、コンピュータ上
で新型コロナウイルスを含むウイルス群とヒトのタンパク質相互作用を発見し、抗ウイルス治療薬の
開発を加速する。
【講座内容】
1.新型コロナ治療薬の開発戦略
2.深層学習によるDNA配列・タンパク質(アミノ酸配列)の解析
2.1.ゲノム生物学
2.2.配列データを解析する機械学習
・Random forest, Support
vector machineなど
2.3.配列データを解析する深層学習
・Convolutional Neural
Network,
・Recurrent Neural Network
(RNN), Transformer
3.アミノ酸配列のエンコード法
3.1.物理化学、進化、構造情報に基づくエンコード
3.2.言語学的アプローチによるエンコード
・Word2vec/Fasttext
・Bidirectional Encoder
Representations from Transformers(BERT)
4.タンパク質間相互作用の予測
4.1. Word2vecとLSTMを用いた予測
4.2. Word2vec とCross Attention
(Transformer Encoder)を用いた予測
5.抗コロナウイルス活性をもつペプチドの探索
・Word2vecを用いた機械学習
・Word2vecを用いた深層学習
6.ゲノム解析における言語学的アプローチの期待
【質疑応答】
|