[スポンサーリンク]

ケムステしごと

【化学×AI・機械学習クラウド】実験科学者・エンジニア自身が実践するデータサイエンス/データケミカル株式会社

[スポンサーリンク]

 

化学のAI・機械学習プラットフォーム「Datachemical LAB」

高機能性材料を研究・開発・製造する際、化学・化学工学データを活用してデータ解析・機械学習を行い、分子・材料・プロセスの設計やプロセス管理を効率化することが一般的となっています。しかし、自身の手で実際にデータ解析・機械学習ができなければ、実験科学者にとっては絵に描いた餅に過ぎません。これまで、データ解析・機械学習をするためには、Python をはじめとするプログラミング言語を用いてプログラムを書く必要があり、実験科学者・エンジニアの大きな壁になっていました。
このような状況で、プログラミングなしでデータ解析・機械学習ができるクラウドサービス Datachemical LAB が登場し、ウェブブラウザ (Chrome, Safari, Edge, Firefox など) 上の直感的な操作のみで、化学・化学工学のデータ解析・機械学習が可能になりました。Datachemical LAB を使うことで、実験科学者・エンジニア自身の手で、データ解析・機械学習に基づいた分子・材料・プロセスの設計ができるようになりました。
Datachemical LAB では主に以下の内容を実施できます。

  • 現状のデータセットを解析する最適な回帰モデル・クラス分類モデルの構築
  •  複数の目的変数 y を同時に考慮したモデルの構築
  •  ダブルクロスバリデーションによる少ないサンプルのデータセットの解析
  •  構築されたモデルに基づいた、モデルの適用範囲を考慮した分子設計・材料設計・プロセス設計
  •  ベイズ最適化による外挿探索および設計
  •  仮想的なサンプル (実験条件・合成条件・製造条件・評価条件・プロセス条件など) の自動生成
  •  化学構造の自動生成
  •  化学構造の数値化 (分子記述子・フィンガープリントの計算)
  •  効果的な機械学習が可能になるような最初の実験条件を決める実験計画法
  •  ベイズ最適化に基づく適応的実験計画法
  • 数理モデルの直接的逆解析に基づく適応的実験計画法
  • データセットにおける欠損値の自動的補完
  •  データセットの低次元化・見える化・可視化
  •  特徴量設計・特徴量変換・特徴量選択
  •  高分子や合金等の材料に対する特徴量の計算
  •  ソフトセンサーによるリアルタイム予測
  •  モデルの予測精度を維持する適応的ソフトセンサー
  •  プロセスのモニタリングおよび異常検出

例えば下図では、一般的なモデル(a)と比較して、Datachemical LAB で提案されたモデル(b)により、的確に目的変数 y を予測できています。このような分子・材料・プロセスの設計に用いるモデルを、Datachemical LAB では自動的に最適化できます。

Datachemical LAB による数理モデルの自動的な最適化

数理モデルの直接的逆解析

分子・材料・プロセスの設計に必要なことは 物性・活性・特性などの目的変数 y の目標値から、それを実現するための実験条件・製造条件・プロセス条件などの説明変数 x を導くことです。x と y との間で構築された数理モデル y=f(x) において、理想の y からそれを達成する x の予測は、x を入力して y を予測する順解析とは逆に、y を入力して x を予測することです。しかし、これまでの逆解析は、x の仮想サンプルを大量に生成し、それらをモデルに入力して y を予測し、予測値が良好なサンプルを選択する、すなわち順解析を膨大に繰り返す擬似的な逆解析にすぎませんでした。これでは、人が設定した x の探索範囲における y の予測にすぎず、当初想定しない条件でこそ発現する新機能の探索にはまったく対応できません。また、x の数に対して指数関数的に解空間が増大するため、x が高次元になると網羅的な逆解析は不可能です。
そこで、y の値から x の値を直接的に予測する、すなわち数理モデルを真の意味で逆解析する手法が開発され、Datachemical LAB に実装されました。この手法を直接的逆解析法と呼びます。直接的逆解析法では、x と y との間の関係を同時確率密度関数として複数の正規分布の重ね合わせで表現することで、確率の乗法定理とベイズの定理から、y が与えられた際の x の事後確率密度関数を計算できます。この関数により、y の目標値から確率の高いx の値を直接予測できます。直接的逆解析法は、モデルを真の意味で逆解析できるため、大量の仮想サンプルを生成する必要がなく、膨大な解空間でも即時的に y から x を計算できます。また、変数間の確率分布に基づいた予測をするため、合理的な x の提案となります。
直接的逆解析法により様々な材料設計を達成し、例えば熱電変換材料の実験データを用いた直接的逆解析により、熱伝導率・電気伝導率・ゼーベック係数のすべてが既存の材料を超越する熱電変換材料の実験条件 (各元素の配合割合や合成温度など) の提案に成功しました。さらに、生体材料の実験データとして実験条件や材料特性、そして動物実験後の骨形成率を用いて、骨形成率が既存のデータを超えるための材料特性の条件、およびその材料特性を達成するための実験条件を、それぞれ直接的逆解析で予測することを達成しました。なお、熱電変換材料および生体材料それぞれ、材料の実験条件と材料特性との間の本質的な関係 (特性発現のメカニズム) は複雑でしたが、数理モデルの直接的逆解析を可能にしました。これより、他の材料においても直接的逆解析法が効果的に機能すると考えられます。さらに下図より、数理モデルの直接的逆解析を適応的実験計画法に応用することで、ベイズ最適化と比較して実験回数を約3分の1に抑え、既存の y を大きく上回る実験条件を設計できることを確認しました。

直接的逆解析法による実験回数の削減および既存データを超越するyの実現

 

Datachemical LAB により実験科学者やエンジニアが実験・製造に集中できるようになりました

実験データ・製造データを扱ったり、数理モデルを構築したり、モデルに基づいて予測したり、新たな分子・材料・プロセスを設計したりするには、データ解析・機械学習の知識・知見・技術が必要です。データは嘘をつきませんが、誤ったデータ解析・機械学習によって人が嘘をついてしまうこともあります。さらに、実際にデータ解析・機械学習をするためには、Python をはじめとするプログラミングを学ぶ必要があります。データ解析・機械学習の他に、自身で実験・製造をする人にとっては、勉強・仕事・業務の時間が増えることになり、データ解析・機械学習を実践的に行うのは、かなりハードルが高いものでした。
しかし、Datachemical LAB がデータ解析・機械学習のハードルを大きく下げました。プログラミングのハードルは 0 になり (プログラミング不要)、データ解析・機械学習で人が嘘をつけないような仕組みがあるため、安心して結果を解釈できます。もちろんデータを準備することは必要ですが、データさえあればモデル構築や構築したモデルによる予測、そして分子・材料・プロセスの設計を自動的に行なってくれます。
Datachemical LAB ができるまでは、新たにデータ解析・機械学習を始める人にとって、その勉強やプログラミングなどが律速 (ボトルネック) になっていました。データ解析・機械学習は実験・製造をサポートする位置づけのため、データ解析・機械学習がボトルネックになるのはおかしな話です。
Datachemical LAB がデータ解析・機械学習のハードルを大幅に下げ、データ解析・機械学習を気軽に、プログラミングの勉強をすることなく行えるようになったことで、データ解析・機械学習ではないこと、すなわち本職の実験や製造に集中できるようになりました。ボトルネックが変わったといえます。
もちろん、Datachemical LAB の導入にはコストがかかります。ただ、そのコストによって実験科学者やエンジニアの方々の時間 (プログラミングを身につけたりデータ解析・機械学習を勉強したりする時間) を何時間も何日も、節約することができます。さらに、Datachemical LAB によるデータ解析・機械学習の活用により、例えばベイズ最適化や直接的逆解析などで、材料開発にかかる日数を何日も効率化することができることを考えると、Datachemical LAB の導入は非常に効果的といえます。
実験科学者やエンジニアがデータ解析・機械学習をしつつも、実験や製造に集中するため、Datachemical LAB は不可欠です。

Datachemical LAB による、次の効果的な実験条件・製造条件の提案

 

関連記事

Avatar photo

webmaster

投稿者の記事一覧

Chem-Station代表。早稲田大学理工学術院教授。専門は有機化学。主に有機合成化学。分子レベルでモノを自由自在につくる、最小の構造物設計の匠となるため分子設計化学を確立したいと考えている。趣味は旅行(日本は全県制覇、海外はまだ20カ国ほど)、ドライブ、そしてすべての化学情報をインターネットで発信できるポータルサイトを作ること。

関連記事

  1. NIMSの「新しいウェブサイト」が熱い!
  2. ケムステVシンポまとめ
  3. 最近の有機化学論文2
  4. 【消臭リキ】マッチでトイレで消臭トライ 
  5. 2つのアシロイン縮合
  6. 有機合成化学協会誌2024年7月号:イミン類縁体・縮環アズレン・…
  7. おまえら英語よりもタイピングやろうぜ ~上級編~
  8. プロドラッグの活性化をジグリシンが助ける

注目情報

ピックアップ記事

  1. アステラス製薬、過活動膀胱治療剤「ベシケア錠」製造販売承認取得
  2. クリック反応を用いて、機能性分子を持つイナミド類を自在合成!
  3. クラウド版オフィススイートを使ってみよう
  4. ヒドロホルミル化反応 Hydroformylation
  5. 「抗菌」せっけん、効果は「普通」…米FDA
  6. 東レ先端材料シンポジウム2011に行ってきました
  7. ストックホルム国際青年科学セミナー・2018年の参加学生を募集開始
  8. ルイスペア形成を利用した電気化学発光の増強
  9. ケムステVシンポ「最先端有機化学」開催報告(前編)
  10. 分子の動きを電子顕微鏡で観察

関連商品

ケムステYoutube

ケムステSlack

月別アーカイブ

2023年9月
 123
45678910
11121314151617
18192021222324
252627282930  

注目情報

最新記事

第50回Vシンポ「生物活性分子をデザインする潜在空間分子設計」を開催します!

第50回ケムステVシンポジウムの開催告知をさせて頂きます!2020年コロナウイルスパンデミッ…

有機合成化学協会誌2024年12月号:パラジウム-ヒドロキシ基含有ホスフィン触媒・元素多様化・縮環型天然物・求電子的シアノ化・オリゴペプチド合成

有機合成化学協会が発行する有機合成化学協会誌、2024年12月号がオンライン公開されています。…

「MI×データ科学」コース ~データ科学・AI・量子技術を利用した材料研究の新潮流~

 開講期間 2025年1月8日(水)、9日(木)、15日(水)、16日(木) 計4日間申込みはこ…

余裕でドラフトに収まるビュッヒ史上最小 ロータリーエバポレーターR-80シリーズ

高性能のロータリーエバポレーターで、効率良く研究を進めたい。けれど設置スペースに限りがあり購入を諦め…

有機ホウ素化合物の「安定性」と「反応性」を両立した新しい鈴木–宮浦クロスカップリング反応の開発

第 635 回のスポットライトリサーチは、広島大学大学院・先進理工系科学研究科 博士…

植物繊維を叩いてアンモニアをつくろう ~メカノケミカル窒素固定新合成法~

Tshozoです。今回また興味深い、農業や資源問題の解決の突破口になり得る窒素固定方法がNatu…

自己実現を模索した50代のキャリア選択。「やりたいこと」が年収を上回った瞬間

50歳前後は、会社員にとってキャリアの大きな節目となります。定年までの道筋を見据えて、現職に留まるべ…

イグノーベル賞2024振り返り

ノーベル賞も発表されており、イグノーベル賞の紹介は今更かもしれませんが紹介記事を作成しました。 …

亜鉛–ヒドリド種を持つ金属–有機構造体による高温での二酸化炭素回収

亜鉛–ヒドリド部位を持つ金属–有機構造体 (metal–organic frameworks; MO…

求人は増えているのになぜ?「転職先が決まらない人」に共通する行動パターンとは?

転職市場が活発に動いている中でも、なかなか転職先が決まらない人がいるのはなぜでしょう…

実験器具・用品を試してみたシリーズ

スポットライトリサーチムービー

PAGE TOP