【講演趣旨】
近年、マテリアルズ・インフォマティクス(MI)は各所で導入・検討が進められています。一方で、現場の実課題においてどうMIを適用していけばよいのかといった悩みもよく聞かれるようになりました。本セミナーでは、MIの教科書として執筆した著書「マテリアルズ・インフォマティクス実践ハンドブック」を題材とした座学(MIを現場で進める上での考え方や知識など)とハンズオン(AIフレンドリーなデータへの整形や各タスクにおけるPythonコードの実行など)を扱います。これらを通じて、明日から使えるMIのスキルを身に着けることをめざします。
【講演項目】
1日目
<座学>
1.MI概論
2.機械学習概論
3.材料開発におけるデータの特性の理解
4.データ分析のフロー
5.テーブルデータ分析(基本編)
<ハンズオン>
・仮想の材料開発テーマを題材としたテーブルデータ分析のハンズオン
‐要件整理、タスク設計
‐AIフレンドリーなデータへの整形
‐EDA(探索的データ解析, Exploratory Data Analysis)
‐機械学習モデルの構築
‐次実験条件候補の検討
【質疑応答】
2日目
<座学>
1.画像データ分析
2.テキストデータ分析
3.有機材料の材料構造データ分析
4.無機材料の材料構造データ分析
5.スペクトルデータ分析
6.時系列データ分析
7.生成AIと従来AIの使い分け
8.テーブルデータ分析(応用編)
9.さらなるMIスキル向上に向けての指針
<ハンズオン>
・画像データ分析のハンズオン
‐分類
‐セグメンテーション
・テキストデータ分析のハンズオン
‐テキストデータのベクトル化・マッピング
‐生成AI(LLM*1)+RAG*2
・材料構造データ分析のハンズオン
‐有機材料
‐無機材料
・スペクトルデータ分析のハンズオン
・時系列データ分析のハンズオン
・テーブルデータ分析のハンズオン(応用編)
‐パレート解を考慮した次実験条件候補の検討
‐ベイズ最適化 など
【質疑応答】
*1:大規模言語モデル、Large Language Models
*2:検索拡張生成、Retrieval-Augmented Generation
補足事項)
ハンズオンなどの状況を鑑みて1日目で予定している内容を2日目で扱う場合や内容の一部を割愛させていただく場合があります。
Pythonによるハンズオンでは、Google Colabを利用します。
事前にご自身のGoogleアカウントをご準備いただき当日ご使用のPCで実行できるようご準備をお願いします。
また、2日目は生成AI(LLM)+RAGのハンズオンを予定しています。事前にHuggingFaceへ登録を行い、
https://huggingface.co/google/gemma-2-2b-jpn-it
にアクセスしてログインし、ライセンス認証を行うようにしてください。
また、HuggingFaceのトークンをhttps://huggingface.co/settings/tokens
から事前に取得し、手元に控えておくようにお願いします。
セキュリティ上の関係で企業PCでGoogle Colabが使用できない場合は、ハンズオンは私用PCをご使用ください。
また、ハンズオンは講師の方に実行画面を投影して頂きますので、そちらをご覧ください。
ご不明な点がございましたら、お気軽に弊社までお問い合わせください。
|