材料研究分野でデータを“ゆりかごから墓場まで”フル活用するシステムの構築が進んでいる。人工知能(AI)技術やデータ科学を有効に使うには計測機器や学術論文など、研究開発環境を再構築する必要があった。材料業界では学術界と産業界が連携しながらデータ活用を模索する。 (引用:日刊工業新聞1月7日)
材料分野の研究では、新しい材料を合成後何かしらの物性を測定し、その結果に基づいて傾向を導き出すことが多いですが、論文に載せるデータは本質にかかわる一部分で、他のデータが公開されることはありません。またその本質のデータも他の研究グループがそのデータ自身を活用されることはほとんどありません。しかし、近年AIやデータ科学を導入するマテリアルズ・インフォマティクス(MI)が急拡大していて多くの測定データを活用しようという動きがあり、その具体例を三つ紹介します。
一つ目は、東北大学の富安啓輔助教と山形大学の富安亮子准教授らの研究で、中性子線回折散乱データから、物質の磁気構造や原子占有率を求める数理手法を開発したそうです。従来は、X線・中性子線回折実験でデータを測定し予測された結晶や磁気構造の候補をもとに対して最小二乗法などで最適な候補を選んでいましたが、それでは、実験データに最も合致する構造であるという保証はありませんでした。そこで、半正定値計画緩和法という解析方法を適用することで、イリジウム酸化物磁性材料の磁気構造を実験的に決定することに初めて成功したそうです。これにより構造の候補を実験結果と照らし合わせて選ぶのではなく、計算により最適な構造を導き出すことになるため、これまでのデータを計算し直せば、研究者ごとに違った学説に答えを出せるとしています。
二つ目は、物質・材料研究機構(NIMS)の取り組みで、計測機からデータを直接収集するシステムと、論文からデータを再取得する技術を開発しています。NIMSの取り組みの一つは、計測機器からデータを収集するシステムの構築で、2社から書式情報をもらい、内部データをAIなどが読めるように直す自動翻訳ツールを整備しています。計測機器メーカーとしては自社の分析ソフトを使ってほしいですが、ユーザーとしては共通のプラットフォームでデータの解析、比較ができれば、研究の効率が格段に向上することは確実です。また、自然言語処理技術で過去の膨大な論文から物性値を集める取り組みも行っています。AIが高分子材料に関わる6万報の文献から100種の物性値を収集することができました。それはNIMSの専門家が論文を読み集めてきたデータの12年分を、AIは1―2週間で精度は9割以上で収集できたことになり驚くべき能力です。NIMSはこうしたデータ収集や処理、解析、蓄積、管理、公開の機能をまとめた統合データプラットフォームを構築中で、2020年に機構内部で運用開始し2021年には機構外で利用開始を目指すとしています。
三つ目は、電機各社の取り組みでNECはデータを秘匿したまま複数のデータを処理する秘密計算を提案しています。お互いにデータの内容はわからないが、解析の処理に使われる技術を開発しています。また日立製作所は受託解析サービスを展開していて顧客から実験データを預かり、データサイエンティストが解析するサービスを行っているそうです。相関のある因子の組み合わせや特異例などを特定し報告され材料開発期間が5分の1になった事例もあるそうです。
研究分野にもよりますが、実験を多く行ってデータを数多く生成し事象を捉えゴールにたどり着く手法よりもデータサイエンスを活用し実験数を最小限で効率よくゴールにたどり着く手法がメインになりつつあると感じています。そのため、化学者も実験だけでなくデータ処理にも精通する必要が出てきているのかもしれません。
関連書籍
[amazonjs asin=”4865435476″ locale=”JP” title=”マテリアルズインフォマティクス – 機械学習を活用した材料工学への誘い (MyISBN – デザインエッグ社)”] [amazonjs asin=”4534056265″ locale=”JP” title=”AIをビジネスに実装する方法”]関連リンク
- 東北大学プレスリリース: 数理科学が証明する磁気構造と原子占有率の初の決定法 〜磁石材料、水素・電池材料の高性能化へ期待〜
- NECの秘密計算技術のご紹介:NECの秘密計算に関する資料
- データサイエンティストとは:SASによるデータサイエンティストの紹介