2021年にタンパク質の立体構造予測ツールであるAlphaFold2 (AF2) が登場し、様々な分野において非常に大きな影響力をもたらしました1。現時点でもAF2を用いた研究論文は多く、AF2報告論文の引用数は20000件を超えます。今回はNature誌に、AF2の改良版であり、かつ複合体の予測を行えるAF3が報告されたので、こちらについて紹介したいと思います。
“Accurate structure prediction of biomolecular interactions with AlphaFold 3”
Josh Abramson, Jonas Adler, Jack Dunger, Richard Evans, Tim Green, Alexander Pritzel, Olaf Ronneberger, Lindsay Willmore, Victor Bapst, Pushmeet Kohli, Max Jaderberg, Demis Hassabis, John M. Jumper et al., Nature 2024, under revised
DOI : 10.1038/s41586-024-07487-w
AlphaFold (AF) とは?
AFはGoogleのDeepMind社により開発された、人工知能 (AI) プログラムを用いた、アミノ酸配列からタンパク質の立体構造を予測するツールです。2020年にAF2の開発が発表され、2021年にNature誌より論文が報告されました。このAF2は精度が非常に高いこと、ソースコードが公開されていたことにより、様々な論文でタンパク質の立体構造予測に用いられています。現時点でもNature姉妹雑誌などに、結晶構造解析をせずに論文を出すことができております。さらにAF2を利用して、AutoDock Vinaなどのリガンドとタンパク質のドッキングシミュレーションツールとの併用としても用いることができるようになりました。また現在、AlphaFold Protein Databaseには、Uniprotに登録されているタンパク質のうち、AF2で構築された2億個の立体構造が登録されています。
AF2からAF3への変更点
大きな違いとしてはタンパク質とDNA、tRNAなど含むRNA、金属イオンなどの原子、小分子などとの複合体を予測できるという点、正確性の向上、予想構造を出力するまでのスピードの向上などが挙げられます。今までは上述したようにAF2で構築した後に、別のツールを用いてドッキングする必用がありました。一方AF3では1つのツールで複合体を予測できる、という点が今回のAF3の大きな強みではないかと考えられます。
AF3の予測構造
実際に論文に挙がっている予測構造をお示しします。図にはタンパク質とDNAの複合体の予測構造を示しております。DNAが明後日の方向にいる様子は見られませんね。
続いては2つのタンパク質、RNA (tRNA) 、金属イオン (亜鉛2分子) の複合体です。こちらも非常に良く複合体が形成されている様子が見られると思います。
AF3の使い方
AF3を実際に使ってみました。使い方はDeepMind社がYouTubeに挙げておられます。
まずこちらのAF3のサーバーにアクセスします。すると以下のような画面になります。このとき上のserverはまだ薄いグレーとなっております。Googleアカウントでログインするとここが黒くなり、使用することが可能となります。
使えるようになると以下の画面になります。
+Add entryを押すことで、入力するタンパク質や金属イオン、DNAなどを増やすことができます。まず論文でも採用されており、上記にも示しました2つのタンパク質、RNA (tRNA) 、金属イオン (亜鉛2分子) の複合体をエントリーした様子を示します。すると以下のような画面になります。タンパク質や核酸はそれぞれアミノ酸配列や塩基配列を入力し、金属イオンの場合はすでに登録されているイオンから選ぶ形式となっておりました。同じようにリガンドも選ぶことができましたが、今のところATPなどの生体分子しか選べないようです。
こちらで動かすと、先に示したような複合体が予想構造として出力されました。上のDownloadを押すと、PyMOLでも動かせるCIFファイルなどがダウンロードできます。
実際に使ってみた
本記事では、ケムステでも取り上げられたことのあるP450 BM3の予測構造を作ってみたいと思います。P450はヘム鉄をリガンドとして常に持つため、このヘム鉄が正常な位置に固定されているか確認してみたいと思います。
始めにserver画面のproteinにP450 BM3のアミノ酸配列を、リガンドとしてHeminを選択してみました。
実際に走らせてみたとこと、たった2分半で予測が終了してしまいました!!!X (旧Twitter) でも速いと話題になってはいましたが、この速度は驚きですね!予測構造では、それらしい位置にヘム鉄が結合しておりました。
そこでヘム鉄とP450 BM3の共結晶構造と比較してみました!するとリガンドであるヘム鉄は正常な位置に結合していることがわかりました!!タンパク質全体もRMSD値が0.628と非常に小さな値をとっており、素晴らしい予測結果を出力してくれました!
今後の展望・期待
今はまだβ版であり、また論文も完全にパブリッシュされている訳ではありませんが、現時点ですでに非常に正確な予測結果、出力までのスピード、そして1番の強みである複合体の予測までできるというのは、創薬に始まり様々な分野で用いられることとなるでしょう。ただ研究者の中でも話題にも挙がっていますが、留意すべき点として、あくまでも予測構造であるため、出力した結果が実際の構造と違うじゃないか!という意見は的外れな気もすると同時に、予測構造すべてを信じてしまうのも良くないと思いました。またAF2が非常に利用された部分については、ソースコードの開示が非常に貢献しておりました。実際にX (旧Twitter) では、今回の論文のReviewerが名乗り出て、AF2のソースコードの開示がどれだけ貢献したかを伝えたものの、開示には至らなかったと述べております。
まだまだこのAF3は話題の渦中ですが、ケムステでも引き続き追っていきたいと思います!!
関連記事・文献・サイト
2024年ノーベル化学賞は、「タンパク質の計算による設計・構造予測」へ : ケムステ記事(2024/10/9)
https://ja.wikipedia.org/wiki/AlphaFold : Wikipedia
Moriwaki, Y. JSBi Bioinformatics Review, 2022, 3, 47-60. https://doi.org/10.11234/jsbibr.2022.3 : AF2の仕組みについての総説 (和文)
話題のAlphaFold2を使ってみた : ケムステ記事(2021/7/21)
https://blog.google/technology/ai/google-deepmind-isomorphic-alphafold-3-ai-model/ : Google DeepMind社によるAF3の説明
https://zenn.dev/tonets/articles/dd8c3855eadb2b : AF3の論文の日本語解説
参考文献
- Jumper, J.; Evans, R.; Pritzel, A.; Green, T.; Figurnov, M.; Ronneberger, O.; Tunyasuvunakool, K.; Bates, R.; Žídek, A.; Potapenko, A.; Bridgland, A.; Meyer, C.; Kohl, S. A. A.; Ballard, A. J.; Cowie, A.; Romera-Paredes, B.; Nikolov, S.; Jain, R.; Adler, J.; Back, T.; Petersen, S.; Reiman, D.; Clancy, E.; Zielinski, M.; Steinegger, M.; Pacholska, M.; Berghammer, T.; Bodenstein, S.; Silver, D.; Vinyals, O.; Senior, A. W.; Kavukcuoglu, K.; Kohli, P.; Hassabis, D. Highly Accurate Protein Structure Prediction with AlphaFold. Nature 2021, 596 (7873), 583–589. https://doi.org/10.1038/s41586-021-03819-2.
関連書籍
実験医学 2023年10月 Vol.41 No.16 AlphaFoldの可能性と挑戦〜すぐ始められる構造・機能予測から、複合体予...
The Journey of Demis Hassabis: From Chess Prodigy to Deepmind Visionary