第612回のスポットライトリサーチは、横浜国立大学 大学院理工学府(五東研究室)博士課程後期1年の坂口大門 さんにお願いしました。
今回ご紹介するのは、反応の立体選択性を予測する機械学習モデル開発に関する成果です。本手法を用いて323反応の解析を行ったところ高い精度の定量的な予測を達成し、また構築されたモデルの定量性から反応条件による選択性の違いを解明されています。
本成果はJ. Chem. Inf. Model.誌 原著論文プレスリリースに公開されています。
“Using Three-Dimensional Information to Predict and Interpret the Facial Selectivities of Nucleophilic Additions to Cyclic Ketones”
Sakaguchi, D.; Gotoh, H. J. Chem. Inf. Model. 2024, 64, 3213–3221. DOI: 10.1021/acs.jcim.4c00101
研究室を主宰されている五東弘昭 准教授から、坂口さんについて以下のコメントを頂いています。それでは今回もインタビューをお楽しみください!
坂口くんが2021年4月に卒業研究生として配属されてから博士課程前期課程までに行った研究が、成果としてまとまったものです。機械学習などにより色々な化学的なことが予想されるようになっておりますが、この研究では、あまり報告例が無い身近なジアステレオ選択的な求核付加反応をテーマにしたものです。
このテーマは、最初は坂口くんの希望もあって研究目的だけを与え、具体的な研究計画や手法は坂口君の考案に委ねていましたが研究の初期段階では苦労が絶えませんでした。ケトンのNaBH4やPhLiなどによるジアステレオ選択的な還元や付加は、多くの有機化学系の研究室で行われる一般的なことだと思いますが、機械学習で予測するには非常に難しいものでした。それでも、辛抱強く検討を重ねて初期の予測を凌駕する驚くような研究成果に繋げてくれました。
また、坂口くんは、最近ではQSSR(定量的構造選択性相関研究)チームのリーダーとして後輩の指導を適切な距離感で親身に行なってくれており、グループにおいて欠かすことのできない人物になっています。今回の研究は、坂口君のファーストオーサーのデビュー作ですが、QSSRに関する研究を他にも色々と検討しております。博士後期課程に進学しても持ち前の能力を発揮して、飛躍した研究を引き続き行ってくれることを期待しております。
Q1. 今回プレスリリースとなったのはどんな研究ですか?簡単にご説明ください。
「機械学習を用いた反応選択性の定量解明」を行いました。反応選択性の制御は原料化合物を無駄なく反応させる上で重要であり、精密な制御が求められています。一方でフラスコの内で起きている反応はまだまだブラックボックスな部分が多く、理論計算 (ex. 遷移状態計算) による選択性の定量解明 (活性化エネルギー差ΔΔG ≈ 数kcal/mol) はあまり進んでいません。そこで着目したのが、機械学習を用いたデータ駆動的な手法を用いた選択性の解明です。私は、反応の本質情報である立体電子状態と、反応選択性ΔΔGの定量的な関係を機械学習により経験的に解明することで、香料や医薬品の合成等に用いられる環状ケトンの求核反応の面選択性の予測に成功しました。本研究により、環状ケトンの求核反応の面選択性は求核剤の大きさとハード性によって決まるということが分かりました (図1)。
Q2. 本研究テーマについて、自分なりに工夫したところ、思い入れがあるところを教えてください。
まず、図の作成にはかなりこだわりました。本研究では3次元の電子状態を解析しているので、2次元の紙面上に分かりやすく表示するのはかなり難しかったです。透かしや網目を駆使することで伝わりやすくなったと思います(論文のFigure 4, Figure. 7は是非見ていただきたいです)。
あとは、反応選択性の予測だけで完結とならないよう、実験化学者の方にも理解してもらえるような見せ方を工夫しました。具体的には、本手法を基にしたウェブアプリケーションを作成・公開しており、学会等では好評を得ています (図2)。まだまだ勉強中ですが、実験化学で求められていることを理解し、私の解析モデルを通じて世界中の実験化学者の方と繋がりたいと思っています。
Q3. 研究テーマの難しかったところはどこですか?またそれをどのように乗り越えましたか?
「機械学習はデータ収集が8割」といわれる通り、データ収集です。当初、化学データベース (Scifinder) からデータ収集の自動化を試みましたが、表記ゆれや情報の欠落が多く実用が難しかったため、構造情報や選択性といったデータは手入力で集めることにしました。いくつかの総説はデータ収集に役立ちましたが、誤植や重要情報の欠落も見られ、オリジナルの論文を自分の目で確かめることの重要性を強く感じました。結果的には論文を読み込んだおかげで、数値では現れない定性的な文書情報が問題解決の糸口に繋がった所もあった点は良かったかと思います。
Q4. 将来は化学とどう関わっていきたいですか?
データサイエンスと計算化学を用いて、化学の本質を解明していく化学者を目指しています。学術分野・産業分野ともに、化学のデジタル化が進んできていると感じます。これから20年、30年後の化学では、機械学習やAI技術がさらに発展していることでしょう。今後、必要になるであろう実験化学と計算化学を両方分かっている化学者になりたいと考えています。
Q5. 最後に、読者の皆さんにメッセージをお願いします。
私の所属する五東研究室の研究テーマは計算 (自然言語処理や分子生成モデル) から実験 (抗酸化能測定やフェノールのカップリング) まで多岐にわたり、それぞれの専門分野を持った学生から刺激を受けています。私の学部時代の印象に残っている講義で、研究は特定のテーマを究めること以上に、視野を広くすることも重要だと学びました。自分の専門分野を究める以上に、視野を広げていくことが重要だと思います。まだまだ研究者としては未熟ですが、研究室選びで悩んでいる学生の方に研究の捉え方の一意見としてとらえてもらえれば幸いです。
最後に、研究の遂行から論文執筆までをあらゆる面からご指導いただいた五東先生、研究紹介を行う機会を設けていただいた Chem-Station スタッフの皆様に深く感謝いたします。
研究者の略歴
名前:坂口 大門(さかぐち だいもん)
所属:横浜国立大学理工学府 博士課程後期 1年
略歴:
2024年 3月 横浜国立大学 理工学府 化学・生命系理工学専攻 博士課程前期卒業
2024年 4月 横浜国立大学 理工学府 化学・生命系理工学専攻 博士課程後期入学
2024年 4月 横浜国立大学 理工学府 非常勤講師 (データサイエンス実践基礎)
関連リンク
- Sakaguchi, D.; Gotoh, H. Using Three-Dimensional Information to Predict and Interpret the Facial Selectivities of Nucleophilic Additions to Cyclic Ketones. J. Chem. Inf. Model. 2024, 64, 3213–3221. DOI: 10.1021/acs.jcim.4c00101
- Matsumoto, Y.; Gotoh, H. Compound Classification and Consideration of Correlation with Chemical Descriptors from Articles on Antioxidant Capacity Using Natural Language Processing. J. Chem. Inf. Model. 2024, 64, 119–127. DOI: 10.1021/acs.jcim.3c01826
- 研究室ホームページ