AIの機械学習による創薬が化学業界で注目を集めています。2019年3月に米国サンフランシスコで開催されたMIT Technology Review主催のEmTech Digitalのパネルディスカッションに登壇したInsitro社Daphne Koller氏によると同社はAIの「生成機械学習」アプローチを科学に応用し、創薬の全自動実験装置を完成させたといいます。
化合物自動生成実験装置 Kebotix Platform
生成機械学習とは別名「敵対的生成ネットワーク」(Generative Adversarial Network,以下GAN)と呼ばれています。GANの生成モデルでは「教師無し」でデータから特徴を抽出し学習することで実在しないデータを作ったり、ふたつのデータを組み合わせて中間的な特徴を持つ新しいデータを生成することが可能です。
Insitro社が用いるのは具体的に、ニューラルネットワークの伝統的なオートエンコーダーという手法です。以下の図では右側の女性、左型の女性の写真のエンコードとデコードを繰り返すことで、両方の特徴を合わせ持つ実在しない「新しい」女性の写真を生成することができるのです。
これを応用すると、創薬における新しい化合物生成に活用することができます。同社の化合物自動生成実験装置はKebotix Platformと名付けられ、新薬に活用できる新しい化合物の生成に大きく貢献しています。
「言語学習」の手法を用いて化学式を読み込み反応を予測
AIと一言で言ってもそのアプローチは様々です。AIによる新薬開発の別の例をご紹介しましょう。
2019年9月の発表によればイギリスのケンブリッジ大学はAIの「言語学習」の手法を用いて化学式を読み込み、新薬生成の際の化合物の反応、効能を予測するアルゴリズムを確立したといいます。その手法を用いると90%以上の正確性で複雑な化学反応の予測ができるようになるとのこと。(原文記事はこちらから”AI learns chemistry language to predict how to make medicines”)
このアルゴリズムによって、これまで研究結果を実験室のノートにとってきたものをあらゆる化学反応を予測した「マップ」として管理ができるようになりました。現在もケンブリッジ大学の研究者によってパターン学習の強化が続けられています。
このアルゴリズムによる結果を見ることで、新薬開発に最適な化合物の組み合わせのヒントの発見を圧倒的に短い時間で実現することが可能になると期待されています。
「2020年からはバイオ・テクノロジー・エンジニアリングの時代になる」というInsitro社Koller氏の説明のとおりAIがマーケティングや事務効率化、顧客サービスへの活用のみに留まらず、化学分野で当たり前のように使われる時代はもうすぐそこまで来ているのです。
最先端のAIが学習に要する時間
このような科学分野におけるテクノロジーを支えているのはAIアルゴリズムだけではありません。膨大なデータの蓄積、クレンジング、ガバナンスの効いた管理、そして高い計算能力を持ったコンピューティング開発がその成功を下支えしているのです。
Google社やIBM社が産学協同で開発に力を入れている量子コンピュータ(Quantum Computer)のような大掛かりな演算処理システムの開発から、話題の自動運転を支えるメモリSRAM*といったハードウェアプロセッサの高性能化まで、データ処理と演算を効率的に実装できるシステム開発があってこそ化学分野のAI活用が実現するのです。
Open AIによるとこれまでの傾向として、最先端のAIが学習に要する時間は3. 5カ月ごとに倍増しているといいます。結果、過去5年間でその処理能力は約30万倍にも増加しています。
今後、新薬開発におけるでより多くのデータ量、演算が求められても機械学習能力はその必要に追いつくべくさらなる進化を続けることでしょう。化学分野におけるAIの貢献からはますます目が離せません。
*SRAMに関する詳細の情報はRSコンポーネンツ社サイトから