[スポンサーリンク]

ケムステニュース

最少の実験回数で高い予測精度を与える汎用的AI技術を開発 ~材料開発のDX:NIMS、旭化成、三菱ケミカル、三井化学、住友化学の水平連携で実現~

[スポンサーリンク]

国立研究開発法人物質・材料研究機構(NIMS)、旭化成株式会社、三菱ケミカル株式会社、三井化学株式会社、住友化学株式会社は、化学マテリアルズオープンプラットフォーム(化学MOP)からなる水平連携において、強度や脆さといった材料物性を機械学習で予測する際に、材料の構造から得られる情報を有効に活用し、少ない実験回数で、予測値と実値の誤差を小さくできる(予測精度の高い)AI技術を開発しました。高分子材料をはじめとした材料開発の強力なツールになると期待されます。 (引用:10月25日住友化学プレスリリース)

今回紹介するのは、NIMSと化学メーカー4社が共同で発表した機械学習に関する論文です。

まず研究の背景ですが、マテリアルサイエンスにおいて機械学習を活用して様々な成果が報告されており、物性予測において機械学習の回帰モデルは強力なツールとなっています。機械学習の予測を使ってうまく調査するには、高い正確性を持つ回帰モデルを構築することが重要で、それには一般的に回帰モデルを構築する際の学習データの量に依存します。しかしながら、学習データの量は時間とコストに比例するため、できるだけ少ない学習データで高い正確性を持つモデルを構築することが課題となっています。

モデルの正確性を調べるには、予測精度を向上させる特徴量を探す特徴選択がありますが、本研究ではデータポイントを学習データに加えて予測精度を向上させる能動学習、特に実測データがない候補から選択する不確実性サンプリングに着目しました。不確実性サンプリングは能動学習において有用で、最も不確実なデータポイントが選択されることで予測精度を向上させることができます。しかしながら、マテリアルサイエンスにおいては不確実性サンプリングは常に可能ではなく、実験前に予測可能な特徴量(分子量や分子構造の情報)が限られていると、予測不可能な特徴量(XRDパターンやDSC)が不確実性サンプリングにおいて選択されてしまいます。予測不可能な特徴量は実際に実験してみてわかるものであり、予測のための情報も予測したい情報も実験が必要となるのでは予測モデルとしては成り立ちません。しかし、予測不可能な特徴量の種類は種々の測定で増え、調べたい物性値とより関連性が高くなることが多くの事例において見られます。つまり、予測不可能な特徴量が予測モデルの正確性を向上させることができるのならば、測定が難しい物性値を測定が簡単な物性値から予測することになり、例えばXRD やDSC 等のデータを用いてなるべく少ない実験回数で、正確に材料物性が予測できるように、合成すべき材料として設定できる記述子を適切に選定する方法の開発を行いました。

本研究で目指した予測モデル(出典:住友化学プレスリリース

開発した手法の有効性を検証するために、15 種類のポリプロピレンについて、各々5つの異なるプロセス加工により得られた合計75 点を対象材料としました。対象とする物性評価は、シャルピー衝撃試験引張弾性率の機械物性で実験までに設定できる記述子としては、分子量、立体規則性、および射出成型冷却温度としました。また、測定によって得られる記述子としては、DSCとXRD、NMR、偏光顕微鏡観察による表面形状、比重を対象としました。

では実験結果に移ります。本研究では、予め機械特性と相関がある予測不可能な記述子をピアソンの相関係数が高い順に10個選択しておき、1-5番目と6-10番目に加えて予測可能な記述子に対して75点すべてを学習データとして使って回帰モデルを作り、一個抜き交差検証で予測と実測値を比較しました。結果、予め選んだ関連性が高い予測不可能な記述子の中では、1-5番目の方が6-10番目よりもどちらの物性値においても高い正確性を持つことが分かりました。シャルピー衝撃試験においては、予測可能な記述子を使ったほうが正確性は高くなりましたが、引張弾性率は1-5番目の予測不可能な記述子の方が正確性は高くなりました。

(a)シャルピー衝撃試験と(b)引張弾性率の実測と予測値の違いを表すプロット図、モデルによるLOOE(leave-one-out error)と決定係数R2の違い(出典:原著論文

次に本題のサンプル作製回数ごとにモデルを改良し正確性を上げていく検討ですが、まず開発方法について見ていきます。最初に予測可能な記述子でのみデータセットを準備しました。次にモデルに使用する記述子が選択されたら予測不可能な記述子とターゲットの物性値を実際に測定しました。さらに予測不可能な記述子からターゲットの物性値を予測するように学習を行います。そしてこの機械学習の予測精度が高くなると期待される試料の作製条件が提示され、そのサンプルの物性値を測定し予測値との比較を行います。試料の作製条件の提示について、従来の不確実性サンプリングは使えず、ベイズ最適化に基づく手法(BOED)と、不確実性サンプリングに基づく手法(USED)を使用しました。論文中では、記号と数式を用いて詳細を解説していますが、紹介するに足りる知識を持ち合わせておらず、本記事では割愛させていただきます。

結果、シャルピー衝撃試験では1-5番目か6-10番目の記述子に関係なく、ランダムに試験を行うよりもBOEDやUSEDの方が少ない試験回数で高い正確性を持つモデルが構築されました。一方で引張弾性率の場合は、1-5番目の記述子のみランダムでの試験選択よりもない試験回数で高い正確性を持つモデルが構築され、6-10番目の記述子を使用するとランダムよりも悪い結果になりました。BOEDとUSEDを比較するとどちらの物性評価でもUSEDの方が効果的であることが観測されていて、この理由について予測可能な記述子と予測不可能な記述子の中でいくつかの関係性があるためだと本文中ではコメントされています。

(a)シャルピー衝撃試験と(b)引張弾性率の実験回数ごとの予測誤差。左の図で1-5番目の記述子を使用し、右の図では6-10番目の記述子を使用(出典:原著論文

まとめとしてサンプルの作製・評価とその結果からモデルを構築し、回を重ねるごとにモデルの正確性を向上させる検討において、予測不可能な記述子を活用しランダムに条件を設定するより有効に実験条件が選択され少ない実験回数で正確性が高いモデルが構築されることを確認しました。もしも予測不可能な記述子が知りたい物性よりも簡単に測定できる場合、両者が予測不可能でありながら、簡単な測定から難しい測定を予測することができ、材料設計の高速化と材料開発のコスト削減が実現できます。これは別の見方をすれば、知りたい物性が簡単に測定できる物性と関係していることを意味しており物質の深い理解につながるとコメントしています。さらに、本手法は必要な実験回数を削減できるため、近年注目されている実験自動化技術と組み合わせることで、材料開発の高速化に貢献できると考えているそうです。

今回は、予め関連性が高い予測不可能な記述子を調査して選んでいますが、実際には予測不可能な記述子と調べる目的の物性値の関係は不明の状態で条件を変えて実験を行うことになり、方法の改良が必要だとしています。

この取り組みは、2017年に発表されたマテリアルオープンプラットフォーム(MOP)において作成されたデータベースが利用されました。MOPでは、NIMSと個々の会社が連携するのではなく、NIMSと各社が水平連携して物性や計算科学の研究を進めているようで、この研究では各社がそれぞれのポリプロピレンと加工プロセスを持ち込んで機械学習を行ったと予想されます。個々のデータで個々に手法を開発するよりも、データを集めて予測手法を開発したほうが効率的かつ良い研究成果が出ると考えたためこのような共同研究を進める運びになったかもしれません。今後、水平連携のなかで手法の開発は続ける一方、商品開発としては各社が注力する分野、材料でこの手法をチューニングし、各社の開発に活かされていくと個人的には予想しています。

研究内容の表層しかを紹介できませんでしたが、実際の現場でも実験結果を見た時に予測不可能な物性値が関連し合っているけど、試料の合成条件とは相関が無く、目的の物性値を持つ試料の合成にたどり着けないことは起こりうると思います。そんなときに他の測定を行って、目的の物性への関係性を明らかにすることができるのであれば大変有用な技術になると思います。素材の物性測定方法は、数多くありますので関係性を示せそうな測定方法をAIが自動的に提案してくれるようになれば、予測の応用が広がるのではないでしょうか。企業での素材開発では、カスタマーからのリクエストや規格の適合のために要求される物性値がいくつもあり、長い年月とコストをかけて数々の試験をクリアし商品化される製品もたくさんあります。そんな場合において手ごろに測れる物性から大掛かりな試験の結果を精度よく予測できるようになれば、研究開発を加速させるだけでなく、今まではリスクを考えて挑戦できなかった新しいアイディアを採用した素材の開発も可能になるかもしれません。今後も化学メーカーからのマテリアルズ・インフォマティクス技術の発表に目が離せません。

関連書籍

[amazonjs asin=”B08R9CXC5M” locale=”JP” title=”マテリアルズ・インフォマティクス 材料開発のための機械学習超入門”] [amazonjs asin=”4764960230″ locale=”JP” title=”詳解 マテリアルズインフォマティクス 有機・無機化学のための深層学習 (近代科学社Digital)”]

関連リンク

Avatar photo

Zeolinite

投稿者の記事一覧

ただの会社員です。某企業で化学製品の商品開発に携わっています。社内でのデータサイエンスの普及とDX促進が個人的な野望です。

関連記事

  1. 医薬品の黄金世代到来?
  2. 住友化学の9月中間営業益は+20.5%、精密・医薬など好調で
  3. 世界初の「窒化タンタル光触媒」、可視光で水分解
  4. 積水化学、高容量電池の火炎防ぐ樹脂繊維複合材を開発
  5. 日本触媒で爆発事故
  6. 製薬各社 2010年度 第2四半期決算を発表
  7. スイス・ロシュの1―6月期、純利益4%増
  8. 塩基の代わりに酸を使うクロスカップリング反応:X線吸収分光が解き…

注目情報

ピックアップ記事

  1. 有機合成化学協会誌2022年11月号:英文特別号
  2. 有機・無機材料の相転移ダイナミクス:数理から未来のマテリアル開発まで
  3. 『Ph.D.』の起源をちょっと調べてみました② 化学(科学)編
  4. 熱すると縮む物質を発見 京大化学研
  5. 発想の逆転で糖鎖合成
  6. アウグスト・ホルストマン  熱力学と化学熱力学の架け橋
  7. 米ファイザー、感染予防薬のバイキュロンを買収
  8. 長谷川 美貴 Miki Hasegawa
  9. イオンの出入りを制御するキャップ付き分子容器の開発
  10. ナノってなんナノ?~日本発の極小材料を集めてみました~

関連商品

ケムステYoutube

ケムステSlack

月別アーカイブ

2021年11月
1234567
891011121314
15161718192021
22232425262728
2930  

注目情報

最新記事

有機合成化学協会誌2024年12月号:パラジウム-ヒドロキシ基含有ホスフィン触媒・元素多様化・縮環型天然物・求電子的シアノ化・オリゴペプチド合成

有機合成化学協会が発行する有機合成化学協会誌、2024年12月号がオンライン公開されています。…

「MI×データ科学」コース ~データ科学・AI・量子技術を利用した材料研究の新潮流~

 開講期間 2025年1月8日(水)、9日(木)、15日(水)、16日(木) 計4日間申込みはこ…

余裕でドラフトに収まるビュッヒ史上最小 ロータリーエバポレーターR-80シリーズ

高性能のロータリーエバポレーターで、効率良く研究を進めたい。けれど設置スペースに限りがあり購入を諦め…

有機ホウ素化合物の「安定性」と「反応性」を両立した新しい鈴木–宮浦クロスカップリング反応の開発

第 635 回のスポットライトリサーチは、広島大学大学院・先進理工系科学研究科 博士…

植物繊維を叩いてアンモニアをつくろう ~メカノケミカル窒素固定新合成法~

Tshozoです。今回また興味深い、農業や資源問題の解決の突破口になり得る窒素固定方法がNatu…

自己実現を模索した50代のキャリア選択。「やりたいこと」が年収を上回った瞬間

50歳前後は、会社員にとってキャリアの大きな節目となります。定年までの道筋を見据えて、現職に留まるべ…

イグノーベル賞2024振り返り

ノーベル賞も発表されており、イグノーベル賞の紹介は今更かもしれませんが紹介記事を作成しました。 …

亜鉛–ヒドリド種を持つ金属–有機構造体による高温での二酸化炭素回収

亜鉛–ヒドリド部位を持つ金属–有機構造体 (metal–organic frameworks; MO…

求人は増えているのになぜ?「転職先が決まらない人」に共通する行動パターンとは?

転職市場が活発に動いている中でも、なかなか転職先が決まらない人がいるのはなぜでしょう…

三脚型トリプチセン超分子足場を用いて一重項分裂を促進する配置へとペンタセンクロモフォアを集合化させることに成功

第634回のスポットライトリサーチは、 東京科学大学 物質理工学院(福島研究室)博士課程後期3年の福…

実験器具・用品を試してみたシリーズ

スポットライトリサーチムービー

PAGE TOP