【習得できる知識】
・マテリアルズ・インフォマティクス(MI)の基礎知識
・機械学習(ML)を行う前に必要な、実験データの活用できる形での記録
・MIで話題に上がる商用・オープンソフトウェアの概要
【講座の趣旨】
材料研究では、初期の探索段階のデータを再利用できる形で記録することは少なく、担当者のメモ程度にしか残さないことがよくあります。理由は、プロジェクト毎に扱う材料の種類や特性が異なる、部署が異なると扱う材料が異なるためデータを共有することに価値を見出せない、などです。
データ活用に主眼を置くマテリアルズ・インフォマティクス (MI) では、実験条件や結果などのデータを機械学習でモデル化し、これから作る材料の特性を予測することで、効率的な研究スタイルを誰もが実行できるようにすることが目的になります。そのためには担当者や部署ごとに異なるデータの記録を、活用可能な定型データとして入力・蓄積し、機械学習などの計算手法をツール毎ではなく共通の仕組みで使えることが重要になります。
本講演では、材料研究での一般的な課題を確認し、製薬研究を例に商用パッケージソフトを活用したインフォマティクス基盤構築について説明します。
1.マテリアルズ・インフォマティクスの現在地
1.1 MI向けソフトウェアの歴史
1.2 企業研究における一般的なMIの課題
1.3 データ駆動型研究
2.データの記録
2.1 付番管理
2.2 電子実験ノート/ELN
2.3 Excel
2.4 データの収集・加工・蓄積 (ETL)
2.5 アイデア・着想の記録
2.6 データ参照・計算システム
3.データの活用
3.1 一般的なデータ
3.1.1 数字
3.1.2 文字
3.1.3 画像
3.1.4 時系列データなど
3.2 有機材料
3.3 無機材料
4.データ駆動型研究の実現のために
4.1 商用パッケージソフトか自社開発か
4.2 製薬研究で使うソフト
4.3 ソフトウェアベンダーの事情
【質疑応答】
|