HPythonによる実験データ処理実務|Excelデータ整理・自動化【化学・材料研究者向け】

                  
マテリアルズインフォマティクスによる高分子材料の開発
化工計算によるプロセス設計とスケールアップ
<セミナー No609166(アーカイブ配信)>
【 アーカイブ配信】 (2026年9月9 Live配信の録画配信です)

Excelで行っていた実験データ処理をPythonへ
 ―AI時代に求められる、データ整理・前処理・自動化を実践的に学ぶ

欠損値処理、複数シート・複数ファイルの統合もPythonで効率化
 ―実験データ処理実務を演習を通じて習得する


化学・材料研究者のための
Excel×Pythonデータ処理実務


■ このセミナーで学べること

・医薬品・化学・材料系の実験データを格納したExcelファイルをPythonで処理するための基礎知識
・インフォマティクス(CI/MI)の入力データとして適合する「構造化データ」とデータ形式のルール
・手入力のExcelシートに発生する空欄(欠損値)や重複データを検出し、除外・置換する処理手法
・1つのExcelファイル内の複数シート、および複数ファイルに分散した実験データの自動一括読み込みと統合手法
・処理・集計したデータのExcelファイル(.xlsx)への書き出しと、定型解析業務をスクリプト化する手順

■ 講師

滋賀大学 データサイエンス学部 准教授 博士(理学) 江崎 剛 氏

■ 開催要領
日 時

【アーカイブ(録画)配信】
  2026年9月18日(金)まで申込み受付(視聴期間:9/18〜9/28)

受講方法

Zoomを利用したアーカイブ配信  ※会場での講義は行いません
 セミナーの接続確認・受講手順は「こちら」をご確認下さい。

聴講料

聴講料 1名につき49,500円(消費税込/資料付き)
〔1社2名以上同時申込の場合のみ1名につき44
,000円〕
〔大学、公的機関、医療機関の方には割引制度があります。詳しくは上部の「アカデミック価格」をご覧下さい〕

■ プログラム

【講座主旨】

本講座は、医薬品・化学・材料系の研究開発者を対象に、これまでExcelで行っていた実験データの管理やデータ整理をPython(Pandas)に置き換え、業務の効率化を図るための入門講座です。
近年、ケモインフォマティクス(CI)やマテリアルズインフォマティクス(MI)の導入が進んでいますが、解析ツールやアルゴリズムにデータを投入する前段階として、機械が読み込める「構造化データ」へと整理(前処理)する実務が必要となります。本講座では、数式や統計学の解説ではなく、手元のExcel形式の実験データをPython(Pandas)を用いて利活用できる形式に整える具体的なコード記述と手順を解説します。
なお、講義内では、実務で頻出するデータ構造(化合物ID、反応条件、物性値など)を再現した演習用の疑似データを使用しながら、具体的なデータ解析手順やエラーへの対処法を説明します。 複数の実験条件が記録されたExcelデータの読み込みから開始し、手入力に伴う空欄(欠損値)の検出・処理、日付やロットごとに分かれた「複数シート・複数ファイル」の自動一括統合、条件ごとの集計(平均・最大・最小など)を解説します。最終的に、整理後のデータをExcel形式で出力し、日常の定型解析業務を自動化するための一連のプログラム構成の習得を目指します。

【講座内容】

◆CI/MI推進におけるPython活用と実験データの利活用
 ・化学・材料研究におけるデータ処理をPythonへ移行する目的
 ・インフォマティクス(CI/MI)の入力データとして必要なデータ形式
 ・開発環境「Google Colaboratory」の基本操作と演習の準備

◆実験Excelデータの読み込みとデータフレーム形式への整理
 ・実験データの読み込み
 ・行名・列名による指定やデータ抽出
 ・数値データに応じた昇順・降順の並び替え

◆手入力Excelに生じるデータ欠損・重複への対処
 ・Excelシート内の空欄の検出方法と除外
 ・空欄データへの置換・穴埋め処理
 ・系列や条件ごとの平均値・最大値・最小値の自動集計

◆シート別・ファイル別に分かれた「大量データの一括処理」
 ・「実験日別」「ロット別」に分かれた複数シートおよび複数ファイルのディレクトリ構造
 ・複数シート(または複数ファイル)の自動読み込み
 ・読み込んだ複数の実験データの結合・統合

◆データの可視化とExcelへの書き出し処理
 ・実験データの傾向を把握するための可視化
 ・整理・集計したデータをExcel形式で保存
 ・日常の定型処理を自動化するためのプログラム構成と運用の進め方

【質疑応答】


◆◆講師プロフィール◆◆◆

専門分野:ケモインフォマティクス、バイオインフォマティクス
略歴・活動・著書など:
理化学研究所、医薬基盤・健康・栄養研究所を経て現職。データから医薬品候補を探索する手法の開発を目指した研究、データサイエンス教育に従事。
・『まるっと解説 Python×ケモインフォマティクス データ収集から予測・生成まで』, 科学情報出版, 江崎 剛史、池田 和由、清水 祐吾
・『Pythonではじめる異常検知入門 ―基礎から実践まで―』, 科学情報出版, 江崎 剛史, 李 鍾賛(編:笛田 薫)
・Data curation in cheminformatics: importance and implementation, Tsuyoshi Esaki, Kazuyoshi Ikeda, J. Cheminform., 18: 43, 2026