第1節 MIにおけるデータの記録と蓄積、加工およびその活用
1.MIにおけるデータ記録・活用の課題
1.1 データがない
1.2 データが活用できる形になっていない
1.3 データがあっても活用できない
1.4 活用できる人が少ない
2.データの記録
2.1 どのようにデータを記録したら活用しやすいか
2.2 化合物登録システム
2.3 MIでの付番管理
2.4 アッセイデータ登録システム
2.5 MIでの評価結果の管理
2.6 アイデア・着想の記録
3.データの活用
3.1 特徴量の抽出
3.2 化学構造式
3.3 画像処理
3.4 スペクトルデータ
第2節 材料系自然言語処理システム構築へ向けたMaterialBERTの作成
1.様々な科学技術分野のBERT
2.材料分野におけるいくつかのBERT
2.1 学習に使用するデータ
2.2 用いる語彙辞書
2.3 初期パラメータ
2.4 学習条件
2.5 評価の仕方
3.MaterialBERTの作成
3.1 学習データ
3.2 語彙辞書
3.3 使用したBERTモデル
3.4 学習曲線
4.MaterialBERTの評価
4.1 単語ベクトル
4.1.1 材料の種類の分類
4.1.2 単体元素とその化合物
4.1.3 有機化合物とその誘導体
4.1.4 有機−無機複合化合物
4.2 CoLA
第3節 論文から材料データを抽出するための技術開発
1.ポリマー論文における指示表現の認識
1.1 指示表現単語辞書の作成
1.2 辞書を用いた指示表現の自動認識と必要技術の検討
1.3 本技術検討のまとめ
2.材料論文の文分類
2.1 深層学習用データの作成
2.2 文分類の深層学習
2.3 文ベクトルの可視化
2.4 未知文書での文分類
2.5 本技術検討のまとめ
第4節 公開データに基づいたMaterials Informaticsによるバイオマス由来プラスチック向けの添加剤探索
1.研究手法
1.1 添加剤の探索方法
1.2 分子シミュレーションによるメカニズム解析方法
1.3 実験による添加剤効果の実証方法
2.結果と考察
2.1 添加剤の探索結果
2.2 分子シミュレーションによる解析結果
2.3 実験による添加剤効果の実証結果
第5節 高分子材料オントロジー構築に向けた知識グラフからの概念階層抽出
1.高分子材料オントロジー構築に向けた知識グラフからの概念階層抽出
1.1 オントロジー
1.2 知識グラフとLOD(Linked Open Data)
1.3 RDFを用いた知識グラフの表現
2.知識グラフからの概念階層抽出
2.1 Wikidata(ウィキデータ)
2.2 知識グラフにおける概念階層の表現
2.3 知識グラフからの概念階層の抽出
2.3.1 SPARQLクエリを用いた概念階層の抽出
2.3.2 ダウンロードしたRDFファイルからの概念階層の抽出
3.高分子材料オントロジー構築に向けた概念階抽出
3.1 対象領域に応じた概念階層抽出
3.2 高分子材料に関する概念階層の抽出例
第6節 言語情報処理による金属材料の腐食機構の予測
1.言語情報処理による金属材料の腐食機構のAI予測
1.1 入出力データ(変数)
1.2 AI手法
1.2.1 ルールベースドシステム(RBS:Rule Based System)
1.2.2 機械学習
2.解析結果
3.課題と方策
3.1 装置材料の界面と化学環境
3.2 置材料に必要な化学環境の形式知化
3.2.1 Smiles表記
3.2.2 腐食に関係する化学組成
第7節 自然言語処理AIによる創薬研究の高効率化
1.創薬研究における課題とAI活用
2.創薬研究における自然言語処理AI
3.様々な創薬シーンにおける効率化の事例
3.1 論文検索:発見型概念検索「KIBIT Amanogawa」
3.2 新規創薬標的探索:独自のネットワーク作成「KIBIT Cascade Eye」
3.3 Drug Repositioning:「二次元マッピング解析」と「多面的解析」
3.3.1 注目遺伝子と疾患の関係性を可視化「二次元マッピング解析」
3.3.2 注目遺伝子の適応症候補を客観的・網羅的に評価「多面的解析」
第8節 自然言語AIを活用した創薬標的探索研究と着想支援
1.利用ニーズに合わせた自然言語処理技術(NLP)の活用
2.自然言語AIを活用した創薬標的探索
2.1 機械学習による標的予測ツールの開発
2.2 創薬標的探索研究におけるAI開発の障害
3.知識グラフによる標的探索と予測
4.創薬標的探索:アイデア着想の起点、および創薬仮説生成
4.1 着想を支援するAIの開発
4.2 標的予測、着想、創薬仮説生成のギャップ
第9節 創薬研究における生成AIの活用事例
1.SMILESによる化学構造の文字列表現
2.Motif2Molによる化学構造の生成
2.1 拡張ATP結合モチーフ
2.2 Motif2Molのアーキテクチャ
2.3 Motif2Molによるキナーゼ阻害剤の生成
第10節 自然言語処理技術を用いた人工遺伝子クラスターの設計に向けて
1.生物のゲノム情報には、進化の過程が軌跡として残されている
1.1 オペロン形成過程仮説の実験的検証
1.2 ゲノムに見られるオペロン形成進化過程
1.3 遺伝子クラスター進化過程のゲノムへの投影と学習
2.ゲノム情報への自然言語処理アルゴリズムの適用
2.1 遺伝子内機能ドメイン領域のトークン化
2.2 自然言語における単語とタンパク質ドメインの比較
2.3 データ準備プロセス
2.4 使用したモデルアーキテクチャ
2.5 訓練済みモデルの検証方法
2.5.1 BGC内のトークン予測タスク
2.5.2 BGCの化合物クラス予測タスク
3.自然言語モデルはゲノム上の機能ドメイン間の関係性を学習することができる
3.1 Lossの収束
3.2 生合成遺伝子クラスター内のドメイン予測性能評価
3.3 生合成遺伝子クラスターの生合成クラス予測タスク
3.4 訓練済みモデルによる新規生合成遺伝子クラスターの提案
第11節 テキストマイニングを用いた医学系文献データベース情報の解析と研究動向の分析
1.テキストマイニングによる医学系文献データベース情報の解析方法
1.1 分析対象とする文献データベースと対象文献の選定
1.2 分析データの取得と成形
1.3 医学系文献データベース情報の解析に用いるテキストマイニング分析方法
1.3.1 形態素解析
1.3.2 頻度解析
1.3.3 頻出語の推移データ
1.3.4 共起ネットワーク/ことばネットワーク
1.3.5 階層的クラスター分析
1.3.6 特徴語分析
1.3.7 対応分析
1.4 文献データベース情報を研究に用いる際の倫理的配慮
2.テキストマイニングを活用した文献データベース解析の実践事例
2.1 国内外の研究動向を探る
2.1.1 Global trend of decision support over
medical care (医療をめぐる意思決定支援の世界的潮流)
2.2 研究動向を比較する
2.2.1 Literature Research on Dysphagia in
Japan: Overview of Studies from 1982 to 2017
by Article Title (日本の嚥下障害に関する文献研究 -論文表題にみる過去36年間の研究テーマの概観)
2.2.2 Transition and trend of study on domestic
and overseas anorexia and dysphagia(摂食・嚥下障害に関する国内外の研究の変遷と傾向)
2.2.3 Literature research using text mining
analysis: priority of Japanese oncology nursing
in the article title (日本のがん看護研究表題に見る研究主題の優先性)
2.3 属性別の研究動向を探る
2.3.1 Literature Research on Dysphagia in
Japan: Overview of Studies from 1982 to 2017
by Article Title (日本の嚥下障害に関する文献研究 -論文表題にみる過去36年間の研究テーマの概観)
2.3.2 「看護実践能力」に関連した研究動向と看護政策−医中誌を用いた過去44年間の量的・質的分析−
2.4 研究動向と社会的背景
2.4.1 健康増進に関する調査研究の歴史的変遷: ヘルスプロモーションの可視化
2.4.2 日本のメンタルヘルスの研究動向 ―各年代における労働政策との関連―
3.医学系文献データベース情報を用いた調査研究の利点と課題,今後の展望
3.1 利点
3.2 課題と限界
3.3 今後の展望
第12節 テキストマイニングを活用した医療機器分野の研究動向の分析
1.医療機器分野を巡る動向
2.方法
2.1 分析対象
2.2 データの処理
2.3 分析方法
3.結果
3.1 全期間における分析結果
3.2 年代別の分析結果
3.3 所属機関別の分析結果
第13節 自然言語処理と深層学習を用いた匂い印象予測
1.匂い印象予測の原理
2.匂い印象予測の計算機実験
3.自然言語処理を用いた匂い印象予測
第14節 ChatGPTを用いた研究データの作成とその再現性
1.類似学会の研究分野・スコープの差異の可視化
1.1 ChatGPTに入力したプロンプトと得られた回答
1.2 回答の再現性を高める工夫
1.3 作成したデータの解析
1.3.1 主成分分析による次元削減と各主成分の解釈
1.3.2 論文の研究内容の差異の可視化
1.3.3 各学会の研究分野とスコープの差異の可視化
2.e-learning教材と学習項目の適合性評価
2.1 ChatGPTに入力したプロンプトと得られた回答
2.2 教材の記述とChatGPTによる回答の比較
3.ChatGPTが学習したデータに基づく研究データの作成
3.1 ChatGPTに入力したプロンプトと得られた回答
3.2 2022年の出来事に基づく各国の位置関係の可視化
第15節 自然言語処理を用いた学術テキストの分類と活用
1.導入
1.1 学術分野を分類する意義
1.2 自然言語処理を用いた試み
1.3 自然言語処理の可能性
2.BERTを用いた学術分野の分類
2.1 実施内容
2.2 モデル構築環境の整備
2.3 機械学習プログラム
2.3.1 コーディング技術の習得
2.3.2 ベースとなるコードおよび自然言語処理モデルの取得
2.3.3 コードの改変
2.3.4 ファインチューニング用のコードを実行する
2.4 推定精度の検証
2.4.1 単一テキストの判定
2.4.2 複数課題での判定
2.5 ウェブアプリケーションの構築
2.5.1 ウェブサーバの準備
2.5.2 サーバに配置するファイルの準備
2.5.3 Webアプリケーションの運用
3.結果
3.1 推定精度の指標
3.2 推定結果
4.考察
4.1 自然言語処理の活用
4.2 生成AIの活用
4.3 研究支援の未来
第16節 自然言語処理による研究者の感情分析
1.分析の概要
2.時点間・属性別の比較分析
2.1 共起ネットワーク
2.2 属性別の比較分析(DB2020)
3.感情分析
3.1 指数を用いた傾向分析
3.2 感性に関する分析
3.3 資源配分に関する分析
|