[スポンサーリンク]

一般的な話題

話題のAlphaFold2を使ってみた

[スポンサーリンク]

 

ここ数日、構造生物学界隈で「AlphaFold2」と呼ばれているタンパク質の構造計算ツールが話題です。
2021年7月16日にGitHubで無償公開されたこの人工知能プログラムは、有志によってGoogle Colab上で動かせる簡易版も作られており、構造生物学者や生物物理学者だけでなく、生物学、薬学、化学、計算科学などに関わる幅広い領域の研究者から注目を集めています。

タンパク質はその構造と機能に密接な関係があり、通常、特定の構造をとることではじめて機能を持つことが出来ます。そのため、タンパク質の機能のメカニズムを調べたり、人工的な機能の改変や制御をしたり、あるいはアミノ酸配列のみがわかっているタンパク質の機能を推定したりするためには、タンパク質の構造情報は欠かせないものです。しかし、実験的にタンパク質の構造を確かめる手法である結晶構造解析・NMR構造解析・クライオ電子顕微鏡を用いた解析などは、年単位での時間や多額の経費がかかったり、実験に必要なタンパク質量が多かったり、高い精製度が必要であったりすることから、誰でもが気軽に行えるものではありません。

「ゲノムシーケンスデータから塩基配列だけがわかっているタンパク質について、アミノ酸の一次配列からタンパク質の構造と機能を推定したい」
「タンパク質の結晶構造を決めるために結晶を作って回折像を得たものの、位相が決定できずに途中で解析がお蔵入りしてしまっている。計算した予測構造を活用して構造解析をやり遂げたい」
「タンパク質同士がどんな複合体を形成するかのシミュレーションをやりたい」
こういった要望を持つ研究者が、今、続々とAlphaFold2を試しています。

Alphafold2の論文: https://www.nature.com/articles/s41586-021-03819-2

Alphafold2の論文(その2):  https://www.nature.com/articles/s41586-021-03828-1

 

 

Twitterでの熱狂

AlphaFold2の公開直後から、構造生物学に関係する研究者の有志によって、実際にAlphaFold2(簡易版を含む)を用いて解析した構造がTwitterに投稿され出しました。複数の研究者が様々な報告をアップしその精度の高さが示されていくにつれ、情報は拡散され、興味を持つ人が爆増。Twitter上では音声チャット機能である「スペース」を用いた座談会(という名の、もはや事実上の研究会)がこれらの有志研究者によって開催され、最終的に700人以上が参加・聴講するという(おそらくは)歴史に残る状況となりました。

座談会のTogetter: https://togetter.com/li/1748214

 

 

AlphaFold2を使ってみた

こんなにホットなのならば、是非AlphaFold2を体験してみたい。

計算科学どころかそもそもパソコンが苦手な筆者ですが、簡易版のほうならばブラウザにアミノ酸配列を入力するだけで使えるとのことで、早速やってみることにしました!

 

1. タンパク質のアミノ酸配列をゲットする
とりあえずまずアミノ酸配列を準備する必要があります。
初めての練習Runということで、Protein Data Bank(以下PDB)のWebサイトからGreen Fluorescent Protein(以下GFP)のアミノ酸配列をとってきて使うことにしました。
今回使用したのはPDB ID: 1EMAの情報です。

 

(1) PDBのWebサイト(https://www.rcsb.org/)に行き、右上にPDB IDを入力する。 (PDB IDが不明の場合はタンパク質の名称を英語で入力し、表示された一覧の中から1つを選択する)

(2) タンパク質データの個別ページにて、Display Filesをクリックし、さらにFASTA Sequenceをクリックする

(3) 表示されたアミノ酸配列データをコピー

 

 

2. AlphaFold2簡易版で構造計算してみる

いよいよgoogle colab上で動かせるAlphaFold2簡易版にタンパク質配列を入力し、構造計算を試してみます。

 

(1) AlphaFold2簡易版のページを開く

(2) query_sequenceの欄にタンパク質のアミノ酸配列をペーストする。その下のjobname欄も入力する

(3) 上のほうにある「ランタイム」タブをクリックする

(4) 「ランタイムのタイプを変更」をクリックし、GPUを選んで保存

(5) 「すべてのセルを実行」をクリック

これで計算が走ります!

 

ちなみに筆者が使っているメモリ4GBのレトロなノートパソコンでは、GFP1分子を計算するのに約15分ほどかかりました。

メモリ8GBやメモリ16GBのノートパソコンならば、このくらいの大きさのタンパク質を10分未満〜数分で計算できそうです。

AlphaFold2簡易版での計算はGoogleの計算環境で行われるため、個人が使用するPCのスペックは計算速度とは関係ないそうです。

 

計算終了して吐き出された構造はこちら。

 

おおお、GFPっぽいのが出てきた!

 

計算構造はブラウザに表示されるだけでなくpdbファイルとしても自動で出力されるので、得られた結果をPyMOLなどの表示プログラムでも扱うことができます。

結晶構造(水色)とAlphaFold2計算構造(桃色)をPyMOLで重ね合わせ表示したらこんな感じでした。

AIということでデータベース上に既にある立体構造に引っ張られるのはあると思われますが、とても似た構造!

 

 

ただし、AlphaFold2計算構造では、天然では自発的化学反応によって形成される発色団の構造はできておらず、通常のアミノ酸の形のままでした。

この事象はTwitterで報告している方がいらっしゃり、複数のGFP様タンパク質で見られるそうです。

いつか、立体構造をとる過程やとった後の化学反応まで含めて構造予測可能なAIが出てきたりするのだろうか。

 

 

複合体の構造予測もできちゃう

先述したAlphaFold2座談会の開催者でもあるYoshitaka Moriwaki氏は、7月19日にTwitterで「2つのタンパク質のアミノ酸配列を(ポリGなどの)長いリンカーでつないでAlphaFold2にかけると、複合体の構造予測ができる」との旨を提案。反響が大きかったためか、単分子計算する「Alphafold2簡易版」に加え、2つのアミノ酸配列を入力できる「Alphafold2 複合体版」ともいうべきページがどうやら7月21日(?)にアップされました。複合体版の使い方は簡易版と同様です。

 

試しに先程のGFPの配列を途中で切断し、2つに分けて複合体版のAlphaFold2に入れ、計算をかけてみました。

 

吐き出された構造はこちら。

 

2本のアミノ酸として表示されているし、それらしい形が出てきました。

これは、色々なタンパク質の配列データを使って、色んな組み合わせで、どんな複合体ができるか…研究の汎用ツールになっていくのではないでしょうか。

 

なお、Moriwaki氏はAlphafold2簡易版の使い方および通常版のインストールも含めた使用方法をWebにアップされておりますので、より詳しく知りたい方はこちらのページを参照されると良いと思います。

通常版AlphaFold2は3TB程度の大容量PCが必要とのことですのでご注意ください。

 

データベース誕生!?

Alphafold2で計算したヒトやモデル生物のタンパク質構造のデータベースが登場したようです。生物学の革命と言って過言ではないでしょう。

関連記事

2024年ノーベル化学賞は、「タンパク質の計算による設計・構造予測」へ
AlphaFold3の登場!!再びブレイクスルーとなりうるのか~実際にβ版を使用してみた~

関連書籍

 

=====================================================

※AlphaFold2簡易版での計算速度に関する記載に誤りがあり、2021年7月24日に加筆修正を実施しました。また同時に記事中の一部表記について微修正を行いました。

 

Avatar photo

Shirataki

投稿者の記事一覧

目には見えない生き物の仕組みに惹かれ、生体分子の魅力を探っていこうとしています。ポスドクや科学館スタッフ、大学発ベンチャー研究員などを経て放浪中。

関連記事

  1. なんとオープンアクセス!Modern Natural Produ…
  2. 材料開発の未来を語る、マテリアルズ・インフォマティクスに特化した…
  3. アニリン類のC–N結合に不斉炭素を挿入する
  4. リアルタイムで分子の自己組織化を観察・操作することに成功
  5. 世界最小電圧の乾電池1本で光る青色有機EL
  6. 金属原子のみでできたサンドイッチ
  7. KISTECおもちゃレスキュー こども救急隊・こども鑑識隊
  8. ”がんのメカニズムに迫る” 細胞増殖因子とシグナル学術セミナー …

注目情報

ピックアップ記事

  1. 『鬼滅の刃』の感想文~「無題」への回答~
  2. リビングラジカル重合による高分子材料合成技術【終了】
  3. メチルトリメトキシシラン (methyltrimethoxysilane)
  4. ガラス器具を見積もりできるシステム導入:旭製作所
  5. シュガーとアルカロイドの全合成研究
  6. “Wakati Project” 低コストで農作物を保存する技術とは
  7. グラフェンの量産化技術と次世代デバイスへの応用【終了】
  8. SHIPS uniform worksとのコラボ!話題の白衣「WHITECOAT」を試してみた
  9. 2010年ノーベル化学賞予想―トムソン・ロイター版
  10. SNS予想で盛り上がれ!2022年ノーベル化学賞は誰の手に?

関連商品

ケムステYoutube

ケムステSlack

月別アーカイブ

2021年7月
 1234
567891011
12131415161718
19202122232425
262728293031  

注目情報

最新記事

イグノーベル賞2024振り返り

ノーベル賞も発表されており、イグノーベル賞の紹介は今更かもしれませんが紹介記事を作成しました。 …

亜鉛–ヒドリド種を持つ金属–有機構造体による高温での二酸化炭素回収

亜鉛–ヒドリド部位を持つ金属–有機構造体 (metal–organic frameworks; MO…

求人は増えているのになぜ?「転職先が決まらない人」に共通する行動パターンとは?

転職市場が活発に動いている中でも、なかなか転職先が決まらない人がいるのはなぜでしょう…

三脚型トリプチセン超分子足場を用いて一重項分裂を促進する配置へとペンタセンクロモフォアを集合化させることに成功

第634回のスポットライトリサーチは、 東京科学大学 物質理工学院(福島研究室)博士課程後期3年の福…

2024年の化学企業グローバル・トップ50

グローバル・トップ50をケムステニュースで取り上げるのは定番になっておりましたが、今年は忙しくて発表…

早稲田大学各務記念材料技術研究所「材研オープンセミナー」

早稲田大学各務記念材料技術研究所(以下材研)では、12月13日(金)に材研オープンセミナーを実施しま…

カーボンナノベルトを結晶溶媒で一直線に整列! – 超分子2層カーボンナノチューブの新しいボトムアップ合成へ –

第633回のスポットライトリサーチは、名古屋大学理学研究科有機化学グループで行われた成果で、井本 大…

第67回「1分子レベルの酵素活性を網羅的に解析し,疾患と関わる異常を見つける」小松徹 准教授

第67回目の研究者インタビューです! 今回は第49回ケムステVシンポ「触媒との掛け算で拡張・多様化す…

四置換アルケンのエナンチオ選択的ヒドロホウ素化反応

四置換アルケンの位置選択的かつ立体選択的な触媒的ヒドロホウ素化が報告された。電子豊富なロジウム錯体と…

【12月開催】 【第二期 マツモトファインケミカル技術セミナー開催】 題目:有機金属化合物 オルガチックスのエステル化、エステル交換触媒としての利用

■セミナー概要当社ではチタン、ジルコニウム、アルミニウム、ケイ素等の有機金属化合物を“オルガチッ…

実験器具・用品を試してみたシリーズ

スポットライトリサーチムービー

PAGE TOP