[スポンサーリンク]

分析化学

PythonとChatGPTを活用するスペクトル解析実践ガイド

[スポンサーリンク]

概要

ケモメトリクスと機械学習によるスペクトル解析を、Pythonの使い方と数学の基礎から実践まで一気通貫で解説。サポートページのソースコードですぐに始められる。
プログラムの解説動画を購入者限定で無料公開。(引用:講談社サイエンティフィック

対象者

  • スペクトルを取り扱う研究者,データサイエンティスト
  • 意欲ある大学生

目次

第1章 スペクトル解析の基礎知識
1.1 機器分析
1.2 分光分析とスペクトル
1.3 スペクトル解析
1.4 従来のスペクトル解析とPythonによるスペクトル解析
1.5 Pythonを使用する利点
1.6 機械学習とケモメトリクスのスペクトル解析への適用
1.6.1 機械学習とは
1.6.2 ケモメトリクスとは
1.6.3 ケモメトリクスと機械学習の違い
1.6.4 スペクトル解析における相関と因果の区別の重要性
1.6.5 検量線と検量モデル
1.7 相関と因果
1.8 ノーフリーランチ定理
コラム1:公理と定理

第2章 Pythonプログラミングの導入と基礎
2.1 Python(Jupyter Notebook)の環境構築
2.2 GitHubからのデータのダウンロード
2.3 Pythonプログラミング入門
2.3.1 キーボードショートカットとMarkdown
2.3.2 変数の取り扱い
2.3.3 リスト
2.3.4 タプル
2.3.5 bool型
2.3.6 if文
2.3.7 for文
2.3.8 関数の定義
2.4 ライブラリ
2.4.1 ライブラリとは
2.4.2 ライブラリのインストールとインポート
2.4.3 Pythonとライブラリのバージョンについて
2.4.4 ライブラリの利用方法

第3章 Pythonで理解する基礎統計
3.1 平均,分散,標準偏差
3.2 正規分布
3.3 データフレームの取り扱い
3.3.1 データフレームの作成
3.3.2 インデックスがないデータ
3.3.3 インデックスもカラム名もないデータ
3.3.4 データフレームの操作
3.4 pandasで正規分布を理解する
3.4.1 平均値と標準偏差の計算
3.4.2 ヒストグラムと正規分布のグラフの作成
3.4.3 Zスコアを用いた統計的指標の計算
3.5 母集団と標本,偶然誤差と系統誤差
3.6 点推定
3.7 区間推定
3.7.1 母集団の分散が既知の場合の信頼区間の求め方
3.7.2 母集団の分散が未知の場合の信頼区間の求め方
3.7.3 母集団の信頼区間の推定
3.8 対応のあるt検定
3.9 対応のないt検定
3.10 相関係数とp値

第4章 Pythonで理解する線形代数
4.1 行列の基本演算
4.1.1 行列の和,差,積
4.1.2 単位行列と逆行列
4.1.3 Pythonを用いた行列の基本演算
4.2 逆行列で連立方程式を解く
4.2.1 逆行列を用いた連立方程式の解き方
4.2.2 Pythonによる行列を用いた連立方程式の解き方
4.2.3 逆行列が求まらない連立方程式
4.2.4 単回帰分析(最小二乗法)
4.2.5 Python による単回帰分析(最小二乗法)
4.3 DataFrame(pandas)とndarray(NumPy)の関係
コラム2:バタフライ効果(グーテンベルグ・リヒター則と偶然性)

第5章 ChatGPTの効果的な使い方
5.1 ChatGPTの概要
5.2 ChatGPTの機能
5.2.1 プラグイン
5.2.2 ウェブブラウジング
5.2.3 Advanced data analysis
5.2.4 DALL‒E画像生成
5.2.5 MyGPTs
5.3 プロンプトエンジニアリング
5.3.1 プログラムの理解
5.3.2 プログラムのデバッグ
5.3.3 プログラムの更新
5.3.4 プログラムの生成
コラム3:社会学(相関と蓋然性)

第6章 ケモメトリクスの基礎知識
6.1 ランベルト・ベール則
6.2 古典的最小二乗(CLS)法
6.2.1 ランベルト・ベール則を拡張する
6.2.2 純スペクトル行列を解く(CLS 法)
6.2.3 CLS法の問題点
6.2.4 CLS法の実装
6.3 逆最小二乗(ILS)法
6.3.1 ILS法の特徴
6.3.2 ILS法の計算と欠点
6.3.3 ILS法の実装

第7章 ケモメトリクスの基礎知識:応用編
7.1 主成分分析(PCA)
7.1.1 PCAの概念
7.1.2 ローディングの性質
7.1.3 PCAローディングの性質をPython確認する
7.1.4 PCAと固有値問題(特異値分解)
7.1.5 中心化と標準化がローディングに与える影響
7.1.6 中心化と標準化がローディングに与える影響をPythonで確認する
7.1.7 スコアとローディングによるスペクトルの再構築
7.1.8 スコアとローディングによるスペクトルの再構築をPythonで確認する
7.1.9 主成分回帰(PCR)と最適な主成分数の決定(バリデーション)
7.1.10 クロスバリデーションとテストセット
コラム4:正確度と精度
7.2 部分的最小二乗回帰(PLS回帰)
7.2.1 PLS回帰の概要
7.2.2 ウェイトローディングとローディングの違い
7.2.3 ウェイトローディングとローディングの違いをPythonで確認する
7.3 スペクトル分解としてのケモメトリクス
コラム5:医療と治験

第8章 スペクトルデータの前処理
8.1 スペクトルデータの一括読み込み
8.2 横軸の間隔が異なるスペクトル
8.3 行方向(試料方向)の前処理
8.3.1 中心化と標準化
8.3.2 乗算的散乱補正(MSC)
8.4 列方向(波長方向)の前処理
8.4.1 スムージング,一次微分,二次微分による前処理
8.4.2 スムージング,一次微分,二次微分による前処理の実行
8.4.3 標準正規変量(SNV)による前処理の実行
8.5 前処理の関数のモジュール化
コラム6:ビッグデータとGAMAM

第9章 機械学習の基礎知識
9.1 クラスタリング
9.2 k近傍法
9.3 決定木をベースとしたアルゴリズム
9.3.1 ランダムフォレスト
9.3.2 勾配ブースティング
9.3.3 Pythonによる実践
9.4 重回帰分析(最小二乗法,最小絶対値法,リッジ回帰,ラッソ回帰)
9.5 サポートベクトルマシン(SVM)
9.5.1 SVMの損失関数
9.5.2 SVM(ハードマージン)の条件
9.5.3 SVM(ソフトマージン)の条件
9.5.4 主問題と双対問題(カーネル化と非線形判別分析)
9.5.5 SVM による非線形判別分析の実践
9.5.6 サポートベクトル回帰(SV回帰)
9.5.7 スペクトルに現れる非線形項
9.6 ニューラルネットワーク(NN)
Appendix SVM の主問題から双対問題への変換

第10章 スペクトル操作の実践
10.1 スペクトルデータの読み込み
10.2 箱ひげ図による目的変数の分布の把握
10.3 スペクトル表示
10.4 ピーク検出
10.5 相関スペクトル
10.6 ベースライン補正
10.7 カーブフィッティング
10.8 ヒートマップによるスペクトル表示

第11章 ケモメトリクスと機械学習の実践
11.1 アウトライヤーの検出と除去
11.2 各モジュールでの標準化自由度
11.3 PLSウェイトローディング,ローディング,回帰係数
11.4 ウェイトローディングと寄与率
11.5 GridSearchCVによるクロスバリデーション
11.6 パイプイラインを用いたモデルの最適化

第12章 ハイパースペクトルイメージング解析
12.1 RGB画像とハイパースペクトルイメージング(HSI)
12.2 NIR‒HSIデータの構造と読み込み
12.3 画像とスペクトルの抽出
12.4 木材試料領域のスペクトルと画像を抽出
12.4.1 任意の波長領域でのHSIとスペクトルの抽出
12.4.2 試料領域の抽出
12.5 PLS回帰を用いた目的変数の予測値の空間分布を可視化
12.6 HSIデータ解析への畳み込みニューラルネットワーク(CNN)の適用

あとがき
索引

・全320ページ

内容

様々な科学的機器を駆使して物質の物理的・化学的な分析を行うことを機器分析といいます。その中でも物質の光の吸収・放出を測定する分光分析は,物質の特性や濃度を把握するために,化学・生物・物理など多くの分野において活用されています。

分光分析においては,光の波長や周波数に応じた物質の応答(吸収・発光)の分布を考えることが多く,これは物質固有の特性を反映します。
このような分布をスペクトルと呼び,皆さんも1度は見たことのあるものだと思います (図1) 。

図1. オクタンのIRスペクトル(SDBSより引用)

単純な物質のスペクトルであればスペクトル測定装置に付属する専用のソフトウェアを用いて解析を行うだけで十分だと思われます。
多くの場合,専用のソフトウェアにはピークピッキング,カーブフィッティング,スペクトル分解といった基本的な解析機能を搭載しているためです。

しかしながら,複雑なスペクトルデータの解析や,大量のデータを扱う場合には,従来のソフトウェアでは対応できないことがあります。
これを補うためのソフトウェアも販売されてきましたが,新しい手法やアルゴリズムの適用にはアップデートが必要なことが多く,研究の妨げになることが多いです。

そのためスペクトルに対してケモメトリクスや機械学習を適用することで,定量・分類を皆さん自身の力で行うことが必要となり,本書はそれらの理論と実践の両方を丁寧に解説してくれます。

構成

皆さん自身がプログラムを駆使して解析を自由自在にできるようになるためには

  • プログラミング(Python)
  • 統計
  • ケモメトリクスと機械学習
  • スペクトル
  • 試料

などについて学ぶ必要があります。
本書では以上の内容を,初学者の人でも分かるように,丁寧な図解付きでプログラミングや統計学について解説してくれます。
私は主成分分析についてなんとなくの雰囲気を知っているだけで,自分でプログラミングすることはできない状態でしたが,本を読みながら基礎となる理論とプログラムの実装の仕方を学ぶことでしっかりを身につけることができました。

ChatGPTを活用しよう

プログラムを扱う上で今やChatGPTなどの大規模言語モデル (LLM) に基づく対話型生成AIは必須のツールとなりました。
本書ではChatGPTの概要から機能,そしてプロンプトエンジニアリングまで解説してくれます。
(ChatGPTに質問する文章のことをプロンプトと言い,これを工夫して目的の応答を得ること目指すことをプロンプトエンジニアリングと言います。)

例えば逆最小二乗 (ILS) 法によって,ある混合物の吸収スペクトルデータと既知の濃度データから,成分ごとの濃度を予測することプログラムを作成することを考えます。

何も考えずにChatGPTに対してプロンプトを投げて,プログラムを出力してもらうと,回答が間違える場合や,希望の回答が得られない場合があります。
本書では,そのようなミスを少なくするために,プロンプトの作成の仕方から学びます

また,希望の回答が得られた場合であっても,出力されたコードを正しく理解する必要があり,時間がかかってしまいます。
ChatGPTから出力されたコードでなくとも,他の人が作成したコードを理解することは難しいことが多いです。
そのような時でもChatGPTを活用することで,プログラムを素早く理解することができ,本書ではその方法についても学びます。

最後に,実際にコードを動かすと少々のデバッグ (プログラムのエラーや不具合を特定し,修正すること) が必要になることが多いです。
デバッグは非常に煩雑な作業ですが,適切なプロンプトを作成することで,ここでもChatGPTは強力な味方になってくれます。

本書ではILS法だけでなく,多くの手法や問題を取り上げながら,その1つ1つのプログラムの実装の仕方やChatGPTの使い方について解説してくれます。

関連書籍

関連記事

  1. ついにシリーズ10巻目!化学探偵Mr.キュリー10
  2. 毎年恒例のマニアックなスケジュール帳:元素手帳2023
  3. Cooking for Geeks 第2版 ――料理の科学と実践…
  4. 化学探偵Mr.キュリー7
  5. 【書籍】合成化学の新潮流を学ぶ:不活性結合・不活性分子の活性化
  6. 基礎講座 有機化学
  7. 【書籍】『これから論文を書く若者のために』
  8. セレンディピティ:思いがけない発見・発明のドラマ

注目情報

ピックアップ記事

  1. 【21卒イベント 大阪開催2/26(水)】 「化学業界 企業合同説明会」
  2. ジブロモインジゴ dibromoindigo
  3. 均一系水素化 Homogeneous Hydrogenaton
  4. 不均一系触媒を電極として用いる電解フロー反応を実現
  5. 【11月開催】第十三回 マツモトファインケミカル技術セミナー   二酸化炭素を原料とした有機化学物質の合成における有機金属化合物触媒の利用
  6. 有機化学命名法
  7. 分子間エネルギー移動を利用して、希土類錯体の発光をコントロール!
  8. picoSpin世界最小NMRシステムの販売開始
  9. 音声入力でケムステ記事を書いてみた
  10. 第98回日本化学会春季年会 付設展示会ケムステキャンペーン Part II

関連商品

ケムステYoutube

ケムステSlack

月別アーカイブ

2025年3月
 12
3456789
10111213141516
17181920212223
24252627282930
31  

注目情報

最新記事

乙卯研究所 2025年度下期 研究員募集

乙卯研究所とは乙卯研究所は、1915年の設立以来、広く薬学の研究を行うことを主要事業とし、その研…

次世代の二次元物質 遷移金属ダイカルコゲナイド

ムーアの法則の限界と二次元半導体現代の半導体デバイス産業では、作製時の低コスト化や動作速度向上、…

日本化学連合シンポジウム 「海」- 化学はどこに向かうのか –

日本化学連合では、継続性のあるシリーズ型のシンポジウムの開催を企画していくことに…

【スポットライトリサーチ】汎用金属粉を使ってアンモニアが合成できたはなし

Tshozoです。 今回はおなじみ、東京大学大学院 西林研究室からの研究成果紹介(第652回スポ…

第11回 野依フォーラム若手育成塾

野依フォーラム若手育成塾について野依フォーラム若手育成塾では、国際企業に通用するリーダー…

第12回慶應有機化学若手シンポジウム

概要主催:慶應有機化学若手シンポジウム実行委員会共催:慶應義塾大学理工学部・…

新たな有用活性天然物はどのように見つけてくるのか~新規抗真菌剤mandimycinの発見~

こんにちは!熊葛です.天然物は複雑な構造と有用な活性を有することから多くの化学者を魅了し,創薬に貢献…

創薬懇話会2025 in 大津

日時2025年6月19日(木)~6月20日(金)宿泊型セミナー会場ホテル…

理研の研究者が考える未来のバイオ技術とは?

bergです。昨今、環境問題や資源問題の関心の高まりから人工酵素や微生物を利用した化学合成やバイオテ…

水を含み湿度に応答するラメラ構造ポリマー材料の開発

第651回のスポットライトリサーチは、京都大学大学院工学研究科(大内研究室)の堀池優貴 さんにお願い…

実験器具・用品を試してみたシリーズ

スポットライトリサーチムービー