[スポンサーリンク]

その他

Rではじめるケモ・マテリアルズ・インフォマティクスープログラミング・ノックで基礎を完全習得ー

[スポンサーリンク]

[amazonjs asin=”4764906546″ locale=”JP” title=”Rではじめるケモ・マテリアルズ・インフォマティクスープログラミング・ノックで基礎を完全習得ー”]

概要

【化学×デジタル人材になるための、標準かつ必須教科書!】
本書は新化学技術推進協会で開催されている「化学×デジタル人材育成講座」の講義資料を基に、ものづくりの現場において役立つRプログラミングを習得することを目指して構成されている。準備編、統計・検定編、機械学習編、より高度な機械学習編の4部構成で順に学びながら、100本以上のプログラム演習を通してケモ・マテリアルズ・インフォマティクスの基礎を理解する。初学者のために陥りがちなトラブル対策や使用する関数を一覧で掲載するなど、痒いところに手が届く充実の一冊。(引用:近代科学社

対象者

機械学習に興味があり、研究現場で得られたデータの解析に挑戦している研究者・技術者。Rの使い方をゼロから習得する入門書というよりは、幅広い手法を勉強する本であるため、Rやその他の言語でプログラミングを少しでも経験してから読むと効果的に内容が身に付くかと思います。

目次

第I部 準備
第1章 ケモ・マテリアルズ・インフォマティクス事始め
 1.1 ケモ・マテリアルズ・インフォマティクスとは?
 1.2 R プログラミングを活用できる場面
 1.3 R 言語とプラットフォームのインストール
第2章 データハンドリング~Rプログラミングの基礎事項~
 2.1 事前学習
 2.2 外部ファイルとの間のデータの入出力
 2.3 ベクトル・行列・リストの操作と応用
 2.4 グラフィックスを用いたデータの可視化
 2.5 まとめ

第II部 統計・検定
第3章 離散型データ(計数データ)の分析
 3.1 事前学習
 3.2 二項分布とそれを利用した検定
 3.3 超幾何分布とそれを利用した検定
 3.4 ポアソン分布
 3.5 まとめ
第4章 連続型データ(計量データ)の分析
 4.1 事前学習
 4.2 正規分布の特性と応用
 4.3 カイ二乗分布の特性と応用
 4.4 t 分布の特性と応用
 4.5 t 分布を利用した2 組のデータの比較
 4.6 ノンパラメトリック統計検定
 4.7 分割表を利用した独立性の検定・適合性の検定
 4.8 サンプル数に応じた検定手法の選択
 4.9 まとめ

第III部 機械学習で始めるデータマイニング ―データに潜む相互関係を見つけ予測・発見につなげよう―
第5章 データに潜む類似度・距離の分析―相関・距離・クラスターの視点から―
 5.1 事前学習
 5.2 相関分析
 5.3 主成分分析・多次元尺度構成法・自己組織化マップ
 5.4 クラスター分析
 5.5 まとめ
第6章 データに潜む変数間の関係をモデル化する手法―回帰分析の視点から―
 6.1 事前学習
 6.2 線形重回帰分析
 6.3 部分最小二乗法(PLS)
 6.4 正則化を利用した回帰(正則化最小二乗法)
 6.5 まとめ
第7章 識別・分類・認識に役立つモデル化手法―教師あり機械学習の視点から―
 7.1 事前学習
 7.2 教師なし学習
 7.3 判別分析
 7.4 k 最近傍法(kNN 法)
 7.5 ナイーブベイズモデル
 7.6 決定木モデル
 7.7 ニューラルネットワークモデル
 7.8 サポートベクトルマシーン
 7.9 アンサンブル学習とランダムフォレストモデル
 7.10 まとめ

第IV部 より高度な機械学習
第8章 化学情報処理―化学構造の解析とその応用―
 8.1 事前学習
 8.2 化学構造の表記法
 8.3 rcdk パッケージの応用
 8.4 ChemmineR・ChemmineOB パッケージの応用
 8.5 まとめ
第9章 深層学習(ディープラーニング)
 9.1 事前学習
 9.2 ニューラルネットワークの基本要素
 9.3 ニューラルネットワークの構築
 9.4 実データによる学習
 9.5 畳み込みニューラルネットワーク
 9.6 まとめ

解説

本書は、データサイエンスや計算化学に関するセミナーを開催している新化学技術推進協会が監修しており、化学×デジタル人材育成講座の1日の講義を1章にまとめた構成になっています。まえがきで強調しているのは、本書は大学の教科書のスタイルはとっておらず、読者がまず慣れてすぐ現場で活用できるようにしたことであり、実際に本章を見ていくとそれを強く感じることができます。

次に各章の内容を見ていきますが、第1章は、ケモ・マテリアルズ・インフォマティクス事始めとして、ケモ・マテリアルズ・インフォマティクスの概念や歴史、Rの統合開発環境であるRStudioのインストール方法や簡単な使い方が解説されています。分量は、20ページほどですが、材料設計手法の変遷やRプログラミングの活用方法が簡潔にまとめられており、Rのビギナーだけでなく、すでに使い慣れている人にとっても有用な情報が盛り込まれています。第2章のRプログラミングの基礎事項では、Rプログラミングの基礎文法を学習します。基礎といってもある程度プログラミングが慣れている人向けの基礎であり、ビギナー書で取り扱う1から4章ぐらいまでの内容がこの章に凝縮されています。久しぶりにプログラミングに手を付けると、いろいろな関数を忘れてしまってなかなかスクリプトを完成させられないことがあります。そんな時にこの2章は大変有用で、例えば頻繁に使うエクセルデータの入出力は、2章の5ページ目にすぐ登場するため、すぐに関数名と使い方を再確認することができます。その他、行列の取り扱いや様々なグラフの作り方もこの章を読むと習得・再確認することができます。

第3章と4章は統計・検定ということで、データの傾向を統計学的に捉える方法が紹介されています。第3章は、コインの裏表やさいころの目、成功・失敗といった離散型データについて取り扱い、第4章は身長や体重、収率のような連続型データについて解説されています。取り扱われている内容は言葉の難しさが理解の壁となって、いろいろな資料を見ても内容の習得がなかなかできていませんでしたが、どちらの章でも最後のまとめで分布や検定の違いをグラフや表で表現されており、自分の中で理解が大きく進みました。

第5章から機械学習の内容に入りますが、まず相関や距離・クラスターについて紹介されています。具体的には相関分析から主成分分析、クラスター分析と論文で一般的に使われる分析方法が紹介されています。本章では各分析のスクリプトの書き方だけでなく、それぞれに合ったグラフの作り方も同時に解説されていて、効果的に可視化する方法を確認することができます。第6章は回帰分析の内容で、重回帰モデルから部分最小二乗法(PLS)、リッジ回帰、ラッソ回帰までをカバーしています。一つの章で、多重共線性や過学習にどう対応するかまで解説している点は、自分のデータセットを使い方ながら学習する上では有用な構成になっていると思います。第7章では、様々なモデル化の手法を紹介しています。紹介されているモデル化手法の中で、ニューラルネットワークモデルは画像認識などにおいてよく使われていますが、難しいという思い込みがありなかなかチャレンジできていませんでした。一方、本書では特別なものは感じさせず淡々とスクリプトが解説されており、容易にモデルを作ることができます。

第8章は化学情報処理ということで、Rでの構造式の取り扱い方法を紹介しています。すでに統計手法やモデル化手法は、第7章までに紹介されているため、本章では構造式の取り込み方法からデータ形式の変換を中心に解説されています。ニューラルネットワークモデル同様、敷居の高さを感じていましたが、どのパッケージの使えば構造式を取り扱うことができるかがわかり、そして章の最後に登場する化合物の分類の例で化学構造の分析であっても難しくはないことを実感しました。第9章はディープラーニングの紹介であり、RからKerasを呼び出す形でモデルを実装する方法が解説されています。この章はどちらかというと紹介の面が大きいですが、それでも実例の一つであるpKaの予測は、自分で動かしてみたいと思うような展開になっています。

一通りの章を見ていきましたが、順番に読んでいく必要はなく、自分の課題に応じて該当する章のみを読んで内容を習得することができます。また特に課題が無くて漠然と機械学習に興味がある方にとっても、例題のデータセットが化学に近い題材であるため、読み進めることができる内容だと思います。スクリプトは出版社のウェブサイトからダウンロードすることができ、本書に入る前の基礎的な内容をまとめたRプログラミング超入門やコラムなどもサポート情報として同様にダウンロードできます。また、環境設定についても付録で解説されており、上手く動作環境が作れないときに大きな助けになります。入門書としてはやや高価ですが、すぐにデータの分析・解析で使用できるような構成になっており、ネットで調べながらプログラムを作っていくよりかは効率的に各手法を習得することができるかと思います。

機械学習関連のケムステ書籍紹介

Avatar photo

Zeolinite

投稿者の記事一覧

ただの会社員です。某企業で化学製品の商品開発に携わっています。社内でのデータサイエンスの普及とDX促進が個人的な野望です。

関連記事

  1. 有機合成のナビゲーター
  2. 生体分子反応を制御する: 化学的手法による機構と反応場の解明
  3. Metal-Organic Frameworks: Applic…
  4. セールスコピー大全: 見て、読んで、買ってもらえるコトバの作り方…
  5. 料理と科学のおいしい出会い: 分子調理が食の常識を変える
  6. 二次元物質の科学 :グラフェンなどの分子シートが生み出す新世界
  7. 創薬化学―有機合成からのアプローチ
  8. ヒューマンエラーを防ぐ知恵 増補版: ミスはなくなるか

注目情報

ピックアップ記事

  1. 特許の関係を「地図」に ベンチャー企業が作成
  2. ケネディ酸化的環化反応 Kennedy Oxydative Cyclization
  3. MEDCHEM NEWS 32-3号「シン・メディシナルケミストリー」
  4. 酵素を模倣した鉄錯体触媒による水溶液中でのメタンからメタノールへの選択的な変換を達成!
  5. フェニル酢酸を基質とするC-H活性化型溝呂木-Heck反応
  6. 実験の再現性でお困りではありませんか?
  7. 生化学実験:プラスチック器具のコンタミにご用心
  8. 第37回ケムステVシンポ「抗体修飾法の最前線 〜ADC製造の基盤技術〜」を開催します!
  9. 安藤弘宗 Hiromune Ando
  10. 生物のデザインに学ぶ-未来をひらくバイオミメティクス-に行ってきました!

関連商品

ケムステYoutube

ケムステSlack

月別アーカイブ

2022年10月
 12
3456789
10111213141516
17181920212223
24252627282930
31  

注目情報

最新記事

植物由来アルカロイドライブラリーから新たな不斉有機触媒の発見

第632回のスポットライトリサーチは、千葉大学大学院医学薬学府(中分子化学研究室)博士課程後期3年の…

MEDCHEM NEWS 33-4 号「創薬人育成事業の活動報告」

日本薬学会 医薬化学部会の部会誌 MEDCHEM NEWS より、新たにオープン…

第49回ケムステVシンポ「触媒との掛け算で拡張・多様化する化学」を開催します!

第49回ケムステVシンポの会告を致します。2年前(32回)・昨年(41回)に引き続き、今年も…

【日産化学】新卒採用情報(2026卒)

―研究で未来を創る。こんな世界にしたいと理想の姿を描き、実現のために必要なものをうみだす。…

硫黄と別れてもリンカーが束縛する!曲がったπ共役分子の構築

紫外光による脱硫反応を利用することで、本来は平面であるはずのペリレンビスイミド骨格を歪ませることに成…

有機合成化学協会誌2024年11月号:英文特集号

有機合成化学協会が発行する有機合成化学協会誌、2024年11月号がオンライン公開されています。…

小型でも妥協なし!幅広い化合物をサチレーションフリーのELSDで検出

UV吸収のない化合物を精製する際、一定量でフラクションをすべて収集し、TLCで呈色試…

第48回ケムステVシンポ「ペプチド創薬のフロントランナーズ」を開催します!

いよいよ本年もあと僅かとなって参りましたが、皆様いかがお過ごしでしょうか。冬…

3つのラジカルを自由自在!アルケンのアリール–アルキル化反応

アルケンの位置選択的なアリール–アルキル化反応が報告された。ラジカルソーティングを用いた三種類のラジ…

【日産化学 26卒/Zoomウェビナー配信!】START your ChemiSTORY あなたの化学をさがす 研究職限定 キャリアマッチングLIVE

3日間で10領域の研究職社員がプレゼンテーション!日産化学の全研究領域を公開する、研…

実験器具・用品を試してみたシリーズ

スポットライトリサーチムービー

PAGE TOP