|
【10:00〜11:30】
【第1部】化学プロセスにおけるスペクトルデータ解析の基礎と実践
東京科学大学 総合研究院 化学生命科学研究所 准教授 安藤 康伸 氏
|
|
【講座主旨】
データ科学によって化学プロセスデータの利活用を促進し、研究・開発を加速することを目指すプロセス・インフォマティクスやケモインフィマティクスが高い注目を集めています。特に、反応プロセス環境や物質・材料の状態をモニターするためには欠かすことができないスペクトル解析に目を向けると、スペクトルデータを大量に取得できる装置環境が整ってきているとはいえ、複雑な形状をとるものや、フィッティングにかかる手間などから網羅的に解析・情報抽出を実施することが困難になってきています。本講演は、このようなスペクトルデータ解析の課題に注目をし、取得したスペクトルデータからの情報抽出のための機械学習活用について、「分類」「低次元化」「回帰」「ピーク検知」といった視点から、機械学習の数理的な側面も交えながら基礎的な内容を紹介します。
【講座内容】
1.化学プロセスデータに対する機械学習の基礎
1)機械学習の基礎
2)機械学習応用の流れと課題設定の重要性
3)代表的な機械学習応用事例の紹介
4)化学プロセスデータの特徴と注意点
5)情報科学市民権
6)材料科学の立場として忘れてはいけないこと
2.スペクトルデータの低次元化とクラスター解析
1)高次元データとしてのスペクトルと低次元化の重要性
2)分類:教師あり学習と教師なし学習
3)特徴空間と類似度
4)特徴空間の解釈性と表現性
5)主成分解析によるスペクトルの低次元化
6)k-means法によるスペクトルの分類
7)階層的クラスタリングによるスペクトルの分類
3.予測(回帰):予測モデルとモデル選択
1)予測・モデル選択の応用例
2)モデル推定の種類(最尤法, MAP推定, ベイズ推定)
3)確率論的にみた回帰と正則化
4)非線形モデリングの困難
a)マルコフ連鎖モンテカルロ法によるパラメータ最適化
b)情報量基準によるモデル選択
c)解析事例
4.スペクトル解析のためのEMアルゴリズムによるピーク検知
1)ピーク検知のための処理フロー
2)非線形最小二乗法の困難
3)回帰と分布推定の違い
4)ガウス分布の最尤推定
5)EMアルゴリズムによる最尤推定
6)スペクトル解析のための改良EMアルゴリズム
7)解析事例
|
|
|
【12:15〜13:45】
【第2部】プロセスインフォマティクスを成功に導く前処理の重要性とその実践法
積水化学工業(株) 先進技術研究所 情報科学推進センター センター長 兼 MI推進グループ長 新明
健一 氏
|
|
【講座主旨】
素材・材料開発における製造プロセスの最適化は、材料開発において高品質な製品を効率的に生産するために欠かすことはできない。プロセスインフォマティクスは、材料の化学反応や物理的変化を適切に制御し、理想的な材料特性を作りこむための技術であり、材料開発の効率化、製品の品質向上、品質ばらつきの低減、生産コストの削減に直結する。
製造プロセスは、原料の種類や投入手法、反応条件など多くの制御因子が互いに複雑に関係しあっており、適切な制御は容易ではない。従来の原因解明型の管理方法では、課題の再発や新たな課題の発生が避けられないことが多く、これを解決するためにインフォマティクス技術の活用が進められている。
通常、製造プロセスで扱われるデータは、因子が複雑で、膨大である。これらデータの前処理、可視化が、プロセスインフォマティクスを有効に活用するための重要なポイントであり、製造プロセスの最適化の成否を左右する。
本講演では、当社が実際に取り組んだ製造プロセスの最適化に関する事例を紹介し、製造プロセスにおけるデータの前処理、可視化の重要性やデータ解析の手法などの具体的な進め方について説明する。また、世界中で活発に取り組みが進められている実験自動化・自律化への期待とその実現に向けた当社の取り組みについても紹介する。
【講座内容】
1.はじめに
・当社R&Dの目指す姿
・素材・材料開発へのインフォマティクス活用とその期待
2.反応制御におけるインフォマティクス活用
・材料開発における反応プロセス制御の重要性
・反応プロセス制御の課題とインフォマティクス活用
3.事例から見る反応プロセスへのインフォマティクス活用
・テーマ概要 複数の反応プロセスからなる原料の品質設計
・データ可視化の重要性
・データ解析は反応プロセスのどこまで考慮するか
・反応プロセスを制御するための特徴量側の工夫
4.実験自動化の現状と期待
・実験自動化・自律化へ期待すること
・MIと実験自動化の融合による自律的な開発サイクル
まとめ
【質疑応答】
|
|
|
【14:00〜15:30】
【第3部】プロセスデータにおける変数選択とモデル最適化の実践
(株)構造計画研究所 IoEビジネス部 知能情報工学室長 滝 勇太 氏
|
|
【講座主旨】
プロセスインフォマティクスでは,製造装置の構成や運転条件など膨大な組み合わせの中から,目標性能を達成する最適プロセス条件を,情報技術を用いて高速に見出し,開発時間を大幅に短縮することを目的の一つとする。このような文脈では,データから有用な情報を引き出すために機械学習モデルを構築し,それを用いてプロセスの予測や制御,異常検知などを行うケースが多い。その際,モデルの入力となる説明変数の選択とモデルのハイパーパラメータ(学習アルゴリズムの設定値)の最適化は,モデル精度・汎化性能や解釈性に直結する重要な課題である。このセッションにおいては,説明変数選択とハイパーパラメータ最適化について説明する。
【講座内容】
1.基本概念と仕組み
1.1 説明変数選択の手法
1.2 ハイパーパラメータ最適化の手法
2.実務における手順や手法の選定基準と制約条件下での運用方法
2.1 モデル開発の基本手順
2.2 手法選定のポイントと制約への対応
【質疑応答】
|
|
|
【15:45〜17:15】
【第4部】小規模データに強いモデル構築の進め方
静岡大学 学術院工学領域 化学バイオ工学系列 講師 村上 裕哉 氏
|
|
【講座主旨】
近年、新聞・テレビ・ウェブメディアなどのあらゆる場面で「機械学習」や「AI」という言葉を見聞きする機会が飛躍的に増えました。しかし、一口にAIと言っても、その内部には目的や構造の異なる多彩なアプローチが存在します。本講演では、その広大なAIの世界の中でも特に存在感を放つ「ニューラルネットワーク」にスポットを当て、仕組みと現場での活用テクニックを平易に解説します。ニューラルネットワークは“万能関数”とも称され、画像認識から自然言語処理まで幅広いタスクをこなせる一方で、その万能性ゆえに学習データへ過度に適合する「過学習」に陥りやすいという課題を抱えています。特にデータ量が限られる環境では、モデルの特性を理解したうえで、正則化や転移学習、モデル構造の制約といった工夫を組み合わせることが不可欠です。講演では「実務でニューラルネットワークを使ってみたいが、どこから手を付ければよいか分からない」と感じる初学者を主対象に、まず利点と弱点を整理し、その後CNN・RNN・GNNなど構造の異なるネットワークを例示しながら、それぞれがどのようなシーンで効果を発揮するかを紹介します。参加者が自身の課題に合ったモデルを選び、適切なパラメータ設定と評価方法を検討できるようになることをゴールとしています。講演内では化学工学分野におけるニューラルネットワークの活用事例も紹介する予定です。
【講座内容】
◆機械学習の基礎とニューラルネットワークの概要
(1)機械学習の基本と従来手法との違い
(2)ニューラルネットワークの仕組み
(3)誤差逆伝播法
◆ニューラルネットワークの特徴
(1)全結合型ニューラルネットワーク
(2)時系列データ用のニューラルネットワーク
(3)多次元データ用のニューラルネットワーク
◆限られたデータへの応用
(1)小規模データへの対応手法の概要
(2)制約条件の付与
(3)転移学習の活用
【質疑応答】
|
|
|