先端素材高速開発技術研究組合(ADMAT)、日本ゼオンは産業技術総合研究所(AIST)と共同で、NEDOの「超先端材料超高速開発基盤技術プロジェクト」において、人工知能(AI)によって材料の構造画像を生成し、高速・高精度で物性の予測を可能とする技術を開発しました。今回開発した技術は、単純な化学構造を持つ低分子化合物に限定されない材料にディープラーニング(深層学習)を適用する新しいAI技術です。カーボンナノチューブ(CNT)のような複雑な構造を持つ材料に対して構造画像の学習および生成を行い、実際の実験と比べて98.8%もの時間を短縮し、材料物性の高精度な予測を実現しました。これにより従来はAI技術を適用できなかったさまざまな材料系についても材料選定から加工・評価まで一連の実験作業を高速・高精度にコンピュータ―上で再現(仮想実験)することが可能になり、材料開発のさらなる加速が期待できます。 (引用:NEDOプレスリリース8月30日)
NEDOよりAIを活用してカーボンナノチューブの物性を予測する技術が発表されたので紹介します。
まず研究の背景ですが、マテリアルサイエンスにおいてはAIを使った研究が近年盛んに行われております。例えば、物質の構造ごとに物性を調べた結果でニューラルネットワークを学習させれば、物質の構造から物性を予測することができ、このアプローチは、新しい化合物や無機固体、周期的な構造を持つ物質の発見に役立てられています。ニューラルネットワークの学習には構造が正確に定義されていて、広範囲をカバーしているデータセットが必要ですが、プラスチックや合金、ゴムは複雑で構造を正確に定義することが難しいためデータベースは存在せず、ディープラーニングを活用することは難しい材料分野となっています。そんな中2014年に、人工的に人間の顔や猫、犬といった物体の画像を作り出すことで有名になった敵対的生成ネットワーク(GAN)と呼ばれるアルゴリズムが開発されました。化学の分野においてもGANを活用した研究例は報告されており、例えば分子吸着に適したゼオライトの細孔構造のデザインや、薄膜の成膜条件と微細構造の理解に活用された例が報告されています。これらの研究には重要な進歩がありますが、現状を超えるにはマテリアルの形成から構造評価、物性計測までをコンピューター上で行うバーチャル実験を実施することが求められています。
そこで本研究では、ディープラーニングの基礎とした計算フレームワークについて調べました。中心的な内容は条件付きGANによって倍率の異なるSEM画像を生成させることであり、さらにその画像を使ってニューラルネットワークで物性の予測を行いました。物性予測の題材に選んだのは、カーボンナノチューブ(CNT)で、CNT粉末を溶液に分散させ、減圧濾過でCNTの薄膜を作成後、SEMの様々な倍率で表面を観察し、またその物性値として電気伝導性と表面積を測定しました。この材料を選んだ理由ですが、薄膜の中でCNTが階層構造を有しており、それがSEMの拡大倍率で見られるからです。具体的には、低倍率では、高速道路のように大きなCNTの束が見え、中倍率では、中程度の大きさの束が内部構造とともに確認でき、高倍率では、細かいCNTの束のランダムなネットワークが観察されます。そしてこの階層構造が電気伝導性を支配しています。カーボンナノチューブといってもその構造は様々で、長さや直径、結晶性、層の数に違いがあります。そのためこの様々な構造のCNTがあることが、薄膜において異なる構造や特性を示すきっかけになり、CNTを素晴らしい実験材料にしていると本文中では主張しています。実際、本研究では構造が異なる7つのCNT (eDips, SG, Tuball, JEIO, Knano, Nanocyl, Cnano)を使用しました。
まず、条件付きGANによるSEM画像生成ですが、種々のCNTの配合や、分散、ろ過条件で作った薄膜のSEM画像を学習データとしました。SEMの倍率ごとにGANがあり、それぞれのGANは画像を生成する発生器と生成画像と本物の測定画像とに違いをを付ける識別器から成っています。実際に作ったCNT薄膜は、それぞれのCNT100%の7サンプルとCNTを混合した10サンプルの合計17サンプルで、角度や倍率を変えながら測定し12000近い学習用データを取得しました。GANでは、一つの写真に対して五万回の繰り返し処理が行われていますが、処理を繰り返すことにランダムなノイズの画像から学習用の画像に近づいていくところがSupplementary Informationの図からわかります。具体的には×2kと ×20k, ×50k, ×100kのSEM画像に対して処理を行い、下記のような画像が生成されました。
CNTの種類によって構造は大きく異なりますが、本物の測定結果に並外れて似た画像が得られ条件付きGANによって幅広い構造を再現できることが示されました。画像の類似性を定量的に評価するために、CNTの束の構造の長さと空洞の直径を2値化した画像から調べました。ヒストグラムで実際と生成画像の結果を比較するとほぼ同じ結果になり、CNTの束の構造の長さと空洞の直径の平均値を比較しても相関係数は 0.78 と 0.84という値になりました、
次に画像から物性値を予測するモデルですが、ここで使用する画像は、学習データも含めて条件付きGANが生成した画像を使用し、4つの倍率の画像を結合させて一枚の画像として処理を行いました。画像生成と同様に17の薄膜サンプルから合計12000データセットを作り、9割を学習用に10%を検証用に使用され、画像ごとに予測された電気伝導性と表面積は、サンプル別に平均値が算出されました。
結果、検証用データと実測定結果における電気伝導性と表面積の信頼性(決定係数:R2)は共に0.99で、テストデータを用いた場合は0.85と0.42になり、ディープラーニングの基礎とした計算フレームワークがバーチャル実験を実行可能であることを示しました。先行研究によってCNTの長さや結晶性、層の数と電気伝導性/表面積の関係性は明らかにされましたが、SEMではこれらの構造に関する情報は最大の解像度にしても得られません。そのため、観測できないこれらの構造的特性がCNT薄膜のネットワークと階層構造の違いに間接的に影響を与えていると本文中ではコメントしています。異なる拡大率のSEM画像をタイル状にした画像を使用したことについて個々の倍率の画像を使用した場合と比較して電気伝導性/表面積共に信頼性(決定係数:R2)が高いことが確認されました。
次に上記で作り上げたモデルを使用して1716ものCNT薄膜の電気伝導性と表面積を予測しました。実際に実験すれば1年間かかりますが、計算では1時間で終わりこの速さがディープラーニングの長所だとコメントしています。
この結果について考察を行いました。まず電気伝導性と表面積をCNTの配合ごとにプロットすると、三角の相関を示すことが読み取れます。そして電気伝導性と表面積は逆相関を示し、どちらも高い値を示す単層のCNTは存在しないことが確認されました。層の数でプロットを括ると、層が増えるほど両特性が低下し、単層CNTが電気伝導性も表面積も高い値を示すことが分かりました。異なるCNTのタイプで見ると結晶性が高く直径が短いほど高い電気伝導性を示しますが、密に詰まった束になるため、表面積は少なくなります。一方、低い結晶性で直径が長いと電気伝導性は低くなりますが、ゆるく詰まった束になり表面積は大きくなり、これが電気伝導性と表面積が逆相関を示す理由だとしています。
また、このデータを科学的な理解だけでなく、実用的な応用に活用しました。開発においては、目標の物性を満足するかつコスト効果が高い組み合わせや混合比率を探すことが行われます。CNTでは機能性の単層CNTの方が多層CNTよりも100倍高く、本研究ではこのCNTの経済性(材料コスト)を数値化し電気伝導性と表面積にプロットしました。すると、特性が向上するほど経済性は低下することが分かりました。そして各特性値で最大の経済性を示すCNTの配合を調べると、いくつかのCNTが特性値の高低で特質して多く含まれていることが分かり、開発において価値のある予測がこの方法で得られることが分かりました。
上記で得られたCNTの特性予測を活用して電気二重層コンデンサの開発に適用しました。具体的には上記のグラフから異なる特性を示すことが予想されるCNTの配合をピックアップし、そのCNT薄膜を電極にして硫酸を電解質としたコンデンサを試作しました。エネルギー密度と緩和時間定数を測定したところ、それぞれ表面積と電気伝導性に相関することが分かりました。先の検討でCNTの配合別にコスト効果も確認されており、エネルギー密度と緩和時間定数の目標値を満たしつつ、コスト効果が高いCNTの配合をこのアプローチで決定することができます。
まとめとして、条件付きGANを使用して、限定されず周期的でない階層構造を持つCNT薄膜のSEM画像を生成し、特性を予測することを行いました。このアプローチはCNTだけに限定されず、実験的に構造と物性の情報が得られ、お互いが相関を持つ複雑な材料についても活用でき、マテリアルサイエンスにおけるAI活用を広げる一歩だとコメントしています。
素人コメントになってしまいますが、画像生成技術は被写体が何であれ実測そっくりの画像が生成されるため、そのクオリティに驚きます。またSEM画像の見た目にはCNTの違いが顕著に表れていないにもかかわらず、電気伝導性と表面積の予測では、実測に近い値が算出されていることにもニューラルネットワークの実力を感じました。一方で、論文後半では得られた結果に対して解釈が加えられており、解析がブラックボックス化されず科学的な理解がなされていることもマテリアルサイエンスの論文として評価できるのではないでしょうか。コスト効果を計算して特性とのバランスを見る試みは企業にける開発現場においては大変有用だと思いますが、コスト以外にも原料の入手性や安全性、二酸化炭素排出量、企業間との関係性など、製品の製造にはいろいろな因子が関わっています。そのため、これだけで製品の配合を決めることは難しいと思いますが、複雑な関係を分かりやすくできると思います。製品の製造においては様々な部署が異なる視点で見ており、問題が起きた時に共通認識を持つことは簡単ではありません。製品開発サイドでは原料や製法の変更のたびに評価を行って性能を確保しようとしますが、評価によってはコストや時間がかかって常に適切なタイミングで性能評価ができない場合もあります。そんなときにこの論文のようなアプローチをとれば、原料や製法の変化/製品のパフォーマンス/それ以外の因子を予測し最適な製法の決定を容易にするかもしれません。もちろんモデルを作るにはそれに適した学習データが必要であり、この例で言えばバーチャル実験は1時間で完了するものの、学習データを作成するのにたくさんのSEM画像を取得しており、同様のモデルを作るには綿密な実験計画か自動実験装置などが必要です。
画像を取得して物質の状態を調べる分析方法はSEMだけでなく、TEMや光学・蛍光顕微鏡、AFMなど数多くあります。冒頭で触れたように複雑な素材に対しては予測モデルを作ることが難しい現状があり画像生成を活用した物性予測はCNTやSEMに限らず幅広い分野と画像取得方法で活躍すると考えられます。このような予測に関する研究が進むことで、AIが処理する仕事と人が頭で考えて遂行する仕事の棲み分けが進み、研究開発が今よりも加速することを期待します。
関連書籍
[amazonjs asin=”B07SPLVCBM” locale=”JP” title=”Pythonで機械学習入門 深層学習から敵対的生成ネットワークまで”] [amazonjs asin=”4526076236″ locale=”JP” title=”NEDOレポート カーボンナノチューブのすべて”]関連リンク
- AIが生成した材料の構造画像を用い、物性を予測する技術を開発―材料の選定から加工・評価までを高速・高精度に再現、材料開発を加速―:NEDOプレスリリース
- AIが生成した材料の構造画像を用い、物性を予測する技術を開発―材料の選定から加工・評価までを高速・高精度に再現、材料開発を加速―: 先端素材高速開発技術研究組合プレスリリース
- AIが生成した材料の構造画像を用い、物性を予測する技術を開発―材料の選定から加工・評価までを高速・高精度に再現、材料開発を加速―: 日本ゼオンプレスリリース
- Virtual experimentations by deep learning on tangible materials:原著論文