2019年にこちらの記事でイリノイ大学・Scott E. Denmark教授らの三次元分子構造を用いた機械学習による不斉触媒反応における選択性予測を可能とするワークフロー[1]が紹介されています。その後、2022年に同教授がこれを用いた高不斉収率を示す触媒の開発に成功していましたので紹介します。今回はこのワークフローをそのまま使っただけでなく、「投票」を利用する、という工夫しています。
“High-Level Data Fusion Enables the Chemoinformatically Guided Discovery of Chiral Disulfonimide Catalysts for Atropselective Iodination of 2-Amino-6-arylpyridines.”
Rose, B. T.; Timmerman, J. C.; Bawel, S. A.; Chin, S.; Zhang, H.; Denmark, S. E.
J. Am. Chem. Soc. 2022, 144 (50), 22950-22964. DOI: 10.1021/jacs.2c08820
概要
機械学習を用いた触媒改良法の詳細[1]については、2019年記事をご覧ください。今回は、下に示すフェニルピリジン 1 のヨウ素化によって生じるアトロープ異性体 2 を不斉合成する新反応開発を試みているところに、この機械学習ワークフローを使って、最適な触媒 3d を見出すに至っています(図1上)。この反応の開発に取り組んだ理由は、創薬的な需要があるものの、現実的に有効な手段が無かったから、とのことです。
関連するエナンチオ選択的な臭素化反応は Miller, 秋山らによって開発されていました(図1下)。Denmark らの以前の検討[1]でも秋山らのキラルなリン酸触媒が良好な結果を与えていたため、最初はこれらの方法を参考にリン酸を試したものの、今回の系ではリン酸よりもスルホンイミド 3a を使った方がエナンチオ選択性 (enantiomeric ratio, er) が高いことがわかりました(図2)。しかし、条件検討ではエナンチオ選択性もこれ以上改善しなかった上に、基質によっては満足のいくエナンチオ選択性が得られなかったため、より選択性と汎用性の高い触媒を同定するために先述の機械学習を利用したワークフローを適用するに至ったようです。
方法
以下のフローで実施しています。詳細は2019年記事に詳しく書かれていますので割愛します。
- 触媒構造の Core を生成(MMとDFT計算を利用):ビナフチル 3 と水素化ビナフチル 4 を選択
- 739個の置換基から 1478個のバーチャル触媒ライブラリーを創出(ccheminfolibとpythonを利用)
- 最適化(Maestro)、配座の発生(OPLS3e)、調節(Maestroで計算をするのにNHをBHにしていたのをNHに戻す)
- 前報[1]で利用していた記述子:平均立体占有率(ASO, 1Å格子)を計算(+電子状態の配慮)
- K-平均クラスタリングによって 21個の触媒候補(ユニバーサルトレーニングセット)を選出、そのうち合成可能な18種の合成に成功(図3)
結果
実際に合成した触媒18種 x 基質13種類の 234 実験を実施し、図4に示す結果を得ています。さすがに人力ではなく、反応はハイスループット装置で、解析は二次元LCで実施しています。
この実験結果をもとにした機械学習によって4s, 4u, 4t の3つの触媒がよいと求められました。いくつかの基質に対しては高いエナンチオ選択性が予想できるものだったものの、期待に反して、いずれの触媒も一般性が低い結果となりました(図5)。
また、さまざまな回帰方法をためしてもこの点は改善しなかったことから、基質の種類に応じた特定の相互作用が加味されていないと筆者らは考え、「投票制」によって最適な触媒を選ぶこととしました。すなわち、基質ひとつひとつが「投票者」となって、UTSを用いた実験結果を利用して、一つの基質に関して最も優れた結果を与える触媒を1478個のバーチャル触媒の中から選出し、その投票数の順に触媒を選んでいく、という方法です。13人の基質が投票した結果、得票数を最も多く集めた触媒として 3d, 4w, 4x が選出されました(図6)。
この三つの中でも最も合成しやすい 3d を用いて触媒反応を実施したところ、投票人のみならず、それ以外の基質に対しても良好な結果を与えることがわかりました(図7)。図2に示した 2a や 2b の合成における選択性も改善されています(2a 91:9→96:4)(2b 82:18→96:4)。
私見
- 前報をうまく使って触媒の改良をしようとして、うまくいった結果のみならず、初期の使い方の失敗やその解決のプロセス(投票の考案など)は、機械学習を利用した化学研究における考え方として示唆に富んでいる。
- ある程度、適用しやすい反応の種類を選んで検証している。この方法の前提としてある程度の実験量が必要なことからハイスループットな反応実施と解析法が揃っていることが必要。
- 研究の進展に伴って計算方法や反応条件の微調整がなされている。詳細は不明だが、時間や手間の問題もあるのでこのあたりの事情は理解できなくもない。
関連記事
- 高選択的な不斉触媒系を機械学習で予測する(Denmark 研の前報[1])
- 実験と機械学習の融合!ホウ素触媒反応の新展開と新理解(根本研@千葉大)
- 機械学習による不⻫有機触媒の予測⼿法の開発(List研 辻G@北大)
参考文献
- (a) Zahrt, A. F.; Henle, J. J.; Rose, B. T.; Wang, Y.; Darrow, W. T.; Denmark, S. E. Science 2019, 363, eaau5631. DOI: 10.1126/science.aau5631 (2) Reivew: Rinehart, N. I.; Zahrt, A. F.; Henle, J. J.; Denmark, S. E. Acc. Chem. Res. 2021, 54 , 2041-2054. DOI: 10.1021/acs.accounts.0c00826