第365回のスポットライトリサーチは、理化学研究所 環境資源科学研究センター (先進機能触媒研究グループ)客員研究員の山口滋 先生にお願いしました。
機械学習のモデルを構築するにはデータが必要ですが、解析用の実験データ自体の収集が難しい反応系も考えられます。モデル構築に必要な実験データの代わりに、計算で得られたデータに注目したのが今回ご紹介する成果で、遷移状態計算により計算機上で集めたわずか30個のサンプルからエナンチオ選択性が向上する不斉触媒設計に成功したという報告をされました。Bulletin of the Chemical Society of Japan誌 原著論文・プレスリリースに公開されています。
“Molecular Field Analysis Using Computational-Screening Data in Asymmetric N-Heterocyclic Carbene-Copper Catalysis toward Data-Driven in Silico Catalyst Optimization”
Mukai, M.; Nagao, K.; Yamaguchi, S.; Ohmiya, H., Bulletin of the Chemical Society of Japan, 2022, 95, 271–277. doi:10.1246/bcsj.20210349
それでは今回もインタビューをお楽しみください!
Q1. 今回プレスリリースとなったのはどんな研究ですか?簡単にご説明ください。
データ駆動型のインシリコ不斉触媒設計法の構築に成功しました。鍵となるのは分子場解析と呼ばれる手法です。不斉触媒反応における分子場解析とは、生成物のエナンチオ選択性と分子の3次元構造から計算した分子場との間の回帰分析です。分子場とは今回の場合、分子の3次元画像データ(ボクセルデータ)です。作成した回帰モデルの回帰係数から分子のどこに置換基を導入すればエナンチオ選択性が上がるあるいは下がるのかを可視化できます。しかし可視化した構造情報から選択性が向上する分子設計に成功した例はありませんでした。一方、触媒と基質からなるエナンチオ選択性決定段階の中間体を用いて分子場解析を行い、可視化した構造情報(下図水色の点)に重なるように置換基を導入することで、選択性が向上する分子設計が可能であることを2019年に見出しています[1](下図A)。
今回は、上記の中間体を用いた分子場解析の発展型として、30サンプルほどの遷移状態計算により算出したエナンチオ選択性の値と、対応する遷移状態構造とを用いて分子場解析を行いました(上図B)。抽出・可視化した情報をもとにエナンチオ選択性が向上する不斉配位子のインシリコでの設計に成功しました(実験値で最大73% eeを示す訓練データの解析をもとに96% eeを示す不斉配位子を設計)。金沢大学大宮研究室との共同研究で、解析対象はNHCカルベン銅錯体触媒によるシリルボロン酸エステルのアルデヒドへの不斉付加反応です[2]。形式上、データ解析に実験データを必要としない、データ駆動型インシリコ不斉触媒設計法となります。
Q2. 本研究テーマについて、自分なりに工夫したところ、思い入れがあるところを教えてください。
実は今回は、工夫はほとんどしていません。設計した触媒を合成してくれた向くんが一番大変だったのではないでしょうか。工夫が必要だったのは前回の中間体を使った分子場解析でした。私は有機合成・構造有機化学が専門ですが、2013年にバイオインフォマティクスの研究室で2回目の博士課程学生になり、有機合成と機械学習の融合研究をはじめました。この分野に入りたての人が陥りがちな以下2点の「思い込み」から脱却するのが大変でした。
- 機械学習を用いた有機合成・分子触媒解析はまっさらな新しい分野である。
- 機械学習により魔法のように簡単に活性があがる触媒が発見できる。
前者に関しては、論文を投稿しReviewerにボコボコにされていくうちに、今回ハイライトしていただいたような有機反応の回帰分析は結局Hammett則の拡張であり、しっかりとした歴史のある分野であるということ[3]と、なんとか向き合えるようになりました。
後者に関しては、そもそも回帰分析による活性(今回の場合はエナンチオ選択性)があがる触媒の予測は外挿にあたることが多く、本質的に難しい問題です。この分野に入って最初に不斉触媒反応の回帰分析にLASSOという機械学習手法を導入する研究[4]を行いましたが、その際にエナンチオ選択性があがる触媒の予測はいくらやってもできそうになく、その時点でようやく「機械学習では外挿は難しい」という当たり前の事実に向き合えるようになりました。
前後して2015年に理研にポスドクとして移り、自分で実験してデータを集めながら、データ解析・分子設計を行うようになりました。その際に、外挿が無理なら、合成が比較的簡単な基質側中心にスクリーニングを行いとにかく選択性をあげ、触媒と基質からなる中間体を用いた分子場解析を行うことを考えました。そうすれば触媒まわりに基質由来の選択性支配因子に関する情報を抽出・可視化でき、その情報をもとに高いエナンチオ選択性を示す触媒を設計できるのではないかというアイデアです。内挿の範囲内で分子設計につながる研究テーマです。
このアイデアに沿って研究を進めているうちに、触媒と基質からなるエナンチオ選択性決定段階の中間体を使って分子場解析を行えば、選択性支配因子に関する情報を解釈性の高い形で抽出・可視化でき、研究者の直感と組み合わせることで、外挿、つまり選択性が向上する分子設計が可能となることを見出しました[1](図A)(それまでの分子場解析のほとんどは触媒のみの構造を解析に使っていた)。データ解析には「予測」と「解釈」の2通りの目的があると考えています[3,5]が、本分子場解析の枠組みは反応の「解釈」のためのデータ解析に分類されます。上記成果を投稿中に、分子場解析を用いた高性能触媒の「予測」に関する論文がDenmarkらにより報告されました[6]。「予測」と「解釈」という点でアプローチが違ったためなんとかなりましたが生きた心地がしませんでした。その後もAngewangteでDOIつきのminor revisionになったもののそこから奇跡的にRejectされ最終的にBCSJに採択いただいた話など長くなるのではしょりますが思い入れだらけです。
今回の研究は、形式上インシリコで触媒設計ができるためいろいろな展開が考えられ重要であるものの、Q1で述べたように上記研究の発展型(選択性の実験値+中間体の解析を、計算値+遷移状態構造の解析に置き換えたもの)なので、やればできるだろうとは思っていました。ACSのJournalの査読で、この手法が将来的に不斉触媒設計のスタンダードになる、との高い評価を受けつつも他のReviewerに酷評されRejectされるなど苦労もありましたが、粘り強くご一緒いただいた向くん、長尾助教、大宮教授にはこの場を借りて厚く御礼申し上げます。
今回の成果ではなく選択性の実験値+中間体を用いた分子場解析ですが、有機合成の難題である複雑な触媒反応(立体分岐型不斉合成)を制御できることを東京大学金井先生との共同研究で見出していますのでこちらも宣伝させていただきます[7]。触媒設計の概要を動画としてSIにアップしてありますので、ぜひご覧ください[7c]。金井研究室、陳さん、三ツ沼助教の怒涛の基質スコープも圧巻です。Chemにもハイライトいただいています[8]。
Q3. 研究テーマの難しかったところはどこですか?またそれをどのように乗り越えましたか?
合成可能な触媒を提案するところでしょうか。選択性があがりそうな触媒はある程度提案できるものの、めぼしいものは大宮研究室ですでに検討済みであり、現実的なタイムスケールで合成できる新規触媒を提案するのは簡単ではありませんでした(なんとか解析対象の反応系での新しい不斉配位子を設計でき選択性が上がりましたが)。有機合成化学者の経験知に基づく触媒反応開発はやはりそんなに簡単に置き換わるものではないのではという感想を抱くような結果でした。一方で本手法も使いようで、プレスリリースに書いたように、たとえば触媒が高価であったり合成が難しかったりで、従来型のスクリーニングや機械学習用の実験データの収集が難しい系には有用なのではないかと考えています。本手法をうまく使えば人と機械学習の協働を促し、これまで難しかった反応系が開発可能になるなど、有機化学という分野の探索可能範囲が大幅にひろがる、つまり研究のワクワクが大幅に増えるのではと期待しています。
Q4. 将来は化学とどう関わっていきたいですか?
化学を媒体に自分もまわりの人も幸せになるような仕事をしたいと考えています。この分子場解析の研究も、2012年時点で、これからプログラミング等インフォマティクスも勉強しながら有機合成研究を進めたい学生さんが増えていくだろうから、その受け皿となる研究をつくりたい、そういう学生さんとともにガッツリ研究がしたい、という思いではじめました。おかげさまで大宮先生との本共同研究含め、とても楽しい共同研究をさせていただける機会が多く大変ありがたく思っています。一方で、データサイエンスが流行っているためか共同研究のつもりが、いつのまにか技術供与になってしまうことが絶えませんでした。逆に言えば、それだけ皆が真似したいと思える、インフォマティクスをしたい有機合成化学者の受け皿となる研究を作り出せた、つまり目標を達成できたのであろうと前向きに考え、現在、手法の背景知識やノウハウをweb上に公開しはじめています[9]。昨年末までの理研の任期制非PI職では、自身の飯のタネである手法を公開してしまうと研究者としてご飯が食べられなくなる可能性が低くないので、職をさがした結果、ありがたいことに三井化学に採用していただき、これまでの経験をもとに研究を展開しています。さらに副業としてアカデミアで研究を行うこともOKいただいており、これまでも大変お世話になっている理研CSRS侯先生のグループ所属の客員研究員として恵まれた環境で新たなチャレンジができています。まだまだやりたいこと、やるべきと思うことは多々あります。環境や周りの方々が許す限り、化学のワクワクを増やせるような仕事にチャレンジしていきたいと思っています。
Q5. 最後に、読者の皆さんにメッセージをお願いします。
DXの時代です。がんがんチャレンジできるような環境・雰囲気を作っていきたいですね。
関連リンク
- (a) S. Yamaguchi, M. Sodeoka, Molecular Field Analysis Using Intermediates in Enantio-Determining Steps Can Extract Information for Data-Driven Molecular Design in Asymmetric Catalysis. Bull. Chem. Soc. Jpn. 2019, 92, 1701. DOI: 10.1246/bcsj.20190132 (b) 理化学研究所プレスリリース「触媒反応におけるデータ駆動型分子設計に成功」https://www.riken.jp/press/2019/20190913_4/index.html
- (a) K. Yabushita, A. Yuasa, K. Nagao, H. Ohmiya, Asymmetric Catalysis Using Aromatic Aldehydes as Chiral α-Alkoxyalkyl Anions. J. Am. Chem. Soc. 2019, 141, 113. DOI: 10.1021/jacs.8b11495 (b) 金沢大学プレスリリース「キラルな医薬品の合成に向けた新しい戦略」https://www.kanazawa-u.ac.jp/rd/63183
- 有機反応の回帰分析 https://mfa-catalysis.com/regression-organic-reaction/
- S. Yamaguchi, T. Nishimura, Y. Hibe, M. Nagai, H. Sato, I. Johnston, Regularized Regression Analysis of Digitized Molecular Structures in Organic Reactions for Quantification of Steric Effects. J. Comp. Chem. 2017, 38, 1825. DOI: 10.1002/jcc.24791
- T. Fujita, D. A. Winkler, Understanding the Roles of the “Two QSARs”. J. Chem. Inf. Model. 2016, 56, 269. DOI: 10.1021/acs.jcim.5b00229
- (a) A. F. Zahrt, J. J. Henle, B. T. Rose, Y. Wang, W. T. Darrow, S. E. Denmark, Prediction of Higher-selectivity Catalysts by Computer-driven Workflow and Machine Learning. Science 2019, 363, eaau5631. DOI: 1126/science.aau5631 (b) 高選択的な不斉触媒系を機械学習で予測するhttps://www.chem-station.com/blog/2019/09/machinelearning.html
- (a) H. Chen, S. Yamaguchi, Y. Morita, H. Nakao, X. Zhai, Y. Shimizu, H. Mitsunuma, M. Kanai, Data-driven catalyst optimization for stereodivergent asymmetric synthesis by iridium/boron hybrid catalysis. Cell Reports Physical Science 2021, 2, 100679. DOI: 10.1016/j.xcrp.2021.100679 (b) 東京大学プレスリリース「有機合成の難題である複雑な反応の機械学習・データ駆動型触媒設計による制御」https://www.u-tokyo.ac.jp/focus/ja/press/z0111_00045.html (c) https://www.sciencedirect.com/science/article/pii/S2666386421004045?via%3Dihub#mmc7
- T. Rodrigues, Deriving intuition in catalyst design with machine learning. Chem 2022, 8, 15. DOI: 10.1016/j.chempr.2021.12.006
- 分子場解析入門 https://mfa-catalysis.com
研究者の略歴
名前:山口滋(やまぐちしげる)
所属:三井化学株式会社 生産技術研究所(理化学研究所環境資源科学研究センター兼務)
研究テーマ:分子場解析に基づくデータ駆動型触媒設計法の構築と応用
略歴:https://researchmap.jp/s-yamaguchi