|
【講座主旨】
化学・創薬科学分野の研究開発には、膨大な費用と時間が必要とされるため、効率的に進めるべく変革が求められています。そのためには、化学分野のデータに機械学習をはじめとした情報学の手法を適用するケモインフォマティクスが注目されています。これにより、特性の予測や有望な条件の探索ができれば、膨大な時間や費用を削減しながら、新しい物質の開発に向けたヒントを得ることが期待されています。
本セミナーでは、より有効な実験条件を効率的に探索するための基本的な統計手法として、まず分散分析について解説します。それから、近年注目されているベイズ最適化を用いた実験計画について講義を行います。そして、複数特性に対して最適化を目指す方法についても、概要を紹介します。
実際に業務で化合物の特性を予測できることを目指してデモンストレーションを行います。デモンストレーションはGoogle
Colaboratoryを使い、本セミナーで使用したコードとデータの例は配布いたします。
【講座内容】
1.化学分野におけるデータ活用
2.実験計画における考え方
3.分散分析
4.最適な実験条件の探索
5.線形モデル
6.応答局面法
7.ガウス課程回帰モデル
8.ベイズ最適化
9.デモンストレーション:ガウス課程回帰
10.多目的最適化
11.デモンストレーション:多目的最適化
12.まとめ
【質疑応答】
◆◆講師プロフィール◆◆◆
専門分野:ケモインフォマティクス、バイオインフォマティクス
学位:博士(理学)
略歴・活動・著書など:
理化学研究所、医薬基盤・健康・栄養研究所を経て現職。データから医薬品候補を探索する手法の開発を目指した研究、データサイエンス教育に従事。
・『まるっと解説 Python×ケモインフォマティクス データ収集から予測・生成まで』, 科学情報出版,
江崎 剛史、池田 和由、清水 祐吾
・『ケモインフォマティクスにおけるデータ収集の最適化と解析手法』, 技術情報協会, 担当執筆分:第2章5節「「線形回帰分析」と「非線形回帰分析」によるデータ解析での留意点」
pp.10-20,江崎 剛史
・『Pythonではじめる異常検知入門 ―基礎から実践まで―』, 科学情報出版, 江崎 剛史,
李 鍾賛(編:笛田 薫)
|