機械学習 スペクトル セミナー
                  
マテリアルズ・インフォマティクスによる 材料開発と活用集
分離プロセスの最適化とスケールアップの進め方
 
<セミナー No007113>

☆ データサイエンス入門者にも分かるように、易しく解説!データ解析の流れが一気通貫でわかる!
☆ ピーク検知のフロー、スペクトル解析に適したアルゴリズムとは

機械学習を用いた

分析スペクトルデータ解析の進め方

〜ピーク検知・スペクトル判断のフローから、収集すべきデータ要件まで〜


■ 講師
【第1部】 

産業技術総合研究所 統合シミュレーション実験検証チーム 主任研究員 安藤 康伸 氏

【第2部】 高エネルギー加速器研究機構 物質構造科学研究所 准教授 小野 寛太 氏
【第3部】 名古屋大学 工学研究科 准教授 藤原 幸一 氏
■ 開催要領
日 時

2020年7月14日(火)10:00〜17:30

会 場 [東京・五反田] 日幸五反田ビル 8階 技術情報協会 セミナールーム
聴講料

聴講料 1名につき55,000円(消費税抜き/昼食・資料付き)
〔1社2名以上同時申込の場合1名につき50,000円〕
〔大学、公的機関、医療機関の方には割引制度(アカデミック価格)があります。
詳しくはお問い合わせください〕

※定員になり次第、お申込みは締切となります。

■ プログラム

【10:00〜12:00】  

【第1部】機械学習を用いたスペクトルデータ解析の基礎

産業技術総合研究所 統合シミュレーション実験検証チーム 主任研究員 安藤 康伸 氏

 

【講座主旨】

近年、各種スペクトルの取得コストが低くなり大量のデータ取得が可能となった。しかしながら、スペクトル解析のためのデータ処理技術は十分進展しておらず、全てのデータを効率に解析して情報を獲得することが困難であった。講演者は機械学習を用いたスペクトル解析技術を開発することでこの問題に取り組んでいる。本講演では、機械学習を物質科学に適用する概要をまず解説し、機械学習を用いたスペクトル解析の新技術について、特に「分類」「低次元化」「モデリング」の三つに注目した解説を行う。

【講座内容】

1. マテリアルズ・インフォマティクス概要
 (1)AI for Materialsとマテリアル・ゲノムプロジェクト
 (2)機械学習の基礎
 (3)代表的な機械学習応用事例の紹介
 (4)物質・材料データの特徴と注意点

2.分類:スペクトルデータの低次元化とクラスター解析
 (1)高次元データとしてのスペクトルと低次元化の重要性
 (2)分類:教師あり学習と教師なし学習
 (3)主成分解析によるスペクトルの低次元化
 (4)k-means法によるスペクトルの分類

3.データ解析:スペクトル解析のためのEMアルゴリズムによるピーク検知
 (1)ピーク検知のための処理フロー
 (2)非線形最小二乗法の困難
 (3)EMアルゴリズムによる最尤推定
 (4)スペクトル解析のための改良EMアルゴリズム
 (5)解析事例

【質疑応答】


【12:45〜14:45】

【第2部】 機械学習によるスペクトルデータ解析の事例

高エネルギー加速器研究機構 物質構造科学研究所 准教授 小野 寛太 氏

 

【講座主旨】

従来のスペクトルデータのデータ解析では、スペクトルから所望の物理量を推定するために、計測したスペクトルについて、予め様々な条件でシミュレーションしたスペクトル、あるいは過去の実験データや文献のスペクトルと目視で見比べ、熟練した人間の判断により、計測されたスペクトルとどれが似ているか判断していた。このため解析結果に研究者の主観や思い込みなどのバイアスが含まれる可能性があり、物理量の推定結果が解析した人間に依存してしまうといった問題が生じる。また、データ解析には人間による判断が必要であるため、場合によってはスペクトル1件の解析に数時間以上を要することもあり、研究における大きな時間的ボトルネックとなっていた。近年、機械学習を用いてスペクトルデータ解析を行う研究が注目されている。本講演では、機械学習を用いたスペクトルのデータ解析について実例を交えながら基礎から応用まで紹介する。

【講座内容】

・スペクトル計測とは

・スペクトルから所望の物理量を推定するには

・スペクトルデータ解析に用いる機械学習

・次元削減の方法

・次元削減とスペクトルデータ解析

・スペクトルの間の類似度(距離尺度)

・類似度とスペクトルデータ解析

・応用例:X線スペクトルのデータ解析

【質疑応答】


【15:00〜17:30】

【第3部】 機械学習によるスペクトル検量線構築とスペクトル波数選択

名古屋大学 工学研究科 准教授 藤原幸一 氏

 

【講座主旨】

近赤外分光(near-infrared spectroscopy; NIRS)スペクトルから検量線を構築するには,少数の潜在変数で線形回帰モデルを構築できる部分的最小二乗法(partial least squares; PLS)が用いられることが多い.一般に入力変数の数を増加させるにつれ,検量線のモデル構築用サンプルに対するフィッティング性能は向上するが,推定値と物理的に関係のない波数まで検量線の入力変数として用いると,未知サンプルに対する予測性能は低下する.検量線設計では適切な入力波数の組み合わせを選択する必要があるが,しばしば入力変数選択は試行錯誤に頼らざるを得ないため,負担の大きな作業といえる.そこで講座では,検量線の予測精度改善および設計効率化のため,システマティックな入力変数選択手法を紹介する.

【講座内容】

1.スペクトルデータ解析と機械学習

2.機械学習による検量線構築
 2.1 主成分分析
 2.2 重回帰分析
 2.3 部分的最小二乗法(PLS)

3.入力波数選択
 3.1 スパースモデリング
 3.2 変数間の相関関係に基づくクラスタリング
 3.3 変数クラスタリングによる入力波数選択
 3.4 応用例の紹介

【質疑応答】


機械学習 スペクトル 解析 セミナー