こんにちは、アセトアミノフェンといいます。今回初投稿です。これからどうぞよろしくお願いいたします。
さて、今回は Open Babel について書いてみることにしました。
Open Babel ってなに?
Open Babel とは、主に化学構造を保持しているさまざまなファイルフォーマットを変換するシステムです。Sourceforge からフリーで配布されています。分子のモデリングというよりは“分子の情報学”(ケモインフォマティクスなどともいわれます)の目的で使われるシステムで、化学構造のライブラリ、構造が類似しているかどうかの判定などにも役立つアルゴリズムです。
入出力ファイル形式は相当数あり、おそらく化学構造を表すために用いられるほとんどのフォーマットをカバーしています。主なものでは
- .mol (MDL MOL format):化学構造を記述する標準的なフォーマットで、結合表 (Connection Table) という考えに基づく行列表記法の1つ
- .cml (Chemical Markup Language):化学情報をXMLと同じように扱おうという言語
- .cdx (ChemDraw binary format):化学系で最もメジャーな構造式描画ソフトの標準出力形式
- .smi (SMILES files):Simplified Molecular Input Line Entry Specificationの略で、線形表記法の1つ
といったところでしょうか。フォーマットの詳しい日本語リソースとしては、例えば
などがあります。
そんな Open Babel はこんな時に役立ちます。
- ChemDraw 形式のファイル(拡張子.cdx)をもらったが、手元に ChemDraw がなくて開けない!
- いちいちGUI(グラフィカルユーザインタフェース)で開くのではなく、一発でコマンド処理したい!
もちろん、化学構造式を描くためのフリーソフトとして ChemSketch (Windows), Accelrys Draw (Windows), Marvin Sketch (Windows/Mac/Linux) などがあります。これらは独自フォーマットのほかに、一般的な .mol や .cdx にも対応しています。しかし、いずれも商用ソフトの無料部分を活用することになるので、いくぶん制約がかかってしまいます。
それに対し、Open Babel はオープンソースで、世界中の有志が開発に参加し、常に不具合を修正したり機能を追加したりすることによって維持されています。つまり、内部の処理が公開されているということで、興味があればソフトが内部でどういうことをやっているのか直接見ることができます。また、OS によらずどこでも利用でき、そのうえコマンドライン(Windows のコマンドプロンプトや Mac のターミナル)から操作する機能もあるので、たくさんあるファイルをいちいち直感的に操作するのではなく、まとめて素早く処理したい場合にも役立ちます。
ダウンロードとインストール
まずは、Open Babel をインストールしましょう。Open Babel の Wiki ページに行って、自分のOSにあったインストーラをダウンロードしましょう。ここでは私はWindows 用のインストーラの場合で説明します。
最新のインストーラは「OpenBabel2.3.2a_Windows_Installer.exe」でした。これをダウンロードして起動すると、こんな画面が出てきます。
Next をクリックするとライセンス使用条件が現れるので、読んだら I Agree をクリック。あとは数回 Next をクリックするだけで、簡単にインストールが終了します。
完了したらスタートメニューに追加されるはずなので、起動してみましょう。左側がインプット、右側がアウトプットで、中央で変換処理の調節になっています。たくさんの入力フォーマットがあるのが分かると思います。
使ってみよう
では、いよいよ Open Babel を使ってみましょう。
最初は特に中央をいじらずに、入力と出力だけ指定してみましょう。私のペンネームであるアセトアミノフェンを例に説明します。今回は自力で構造式を描かずに、ChemSpider からとってきたものを使ってみます。みなさんも検索窓から acetaminophen と入力して検索してみてください。別名の Paracetamol がヒットしますので、Save をクリックして MOL 形式でダウンロードしましょう。ここでは分かりやすく acetaminophen.mol と名前を変更しておきます。
はじめに一般的な PNG という画像形式に変換してみます。Open Babelの画面左側でINPUT FORMATの下向き矢印から「mol — MDL MOL format」を指定し、そのすぐ下にある細い入力エリアの右についている「…」をクリックして今ダウンロードしたacetaminophen.molを探します。右側でOUTPUT FORMATを「png — PNG 2D depiction」を指定し、保存先を指定します。
Convert をクリックすると、ちゃんとPNG画像が出力されます。
もう一つ試してみましょう。今度は SMILES 表記法から MOL 形式への変換をやってみます。先ほどの ChemSpider のページには「SMILES and InChIs」という項目がありました。ここのSMILES表記を見ると、アセトアミノフェンは
CC(=O)Nc1ccc(cc1)O
と書かれています。これをコピーし、今度は Open Babel の画面左の大きな入力エリアに貼り付けましょう。Input below にチェックを入れると入力や貼り付けが可能になります。先ほどの方法をまねて、右側で出力を「mol — MDL MOL format」に指定し、保存先を決めたら Convert をクリックします。
出てきたMOLファイルをChemSketchで開いてみます。あれ、なんか変ですね。コンパクトになってしまいました。
こんなときは、Clean Structureをクリックします(図の矢印)。ちゃんとアセトアミノフェンの構造式になっていました。
終わりに
いかがだったでしょうか? 今回はファイル変換しか行いませんでしたが、Open Babel はもっと高機能です。興味のある方は関連記事を見てください。
初めての投稿で、慣れない部分もありましたが、今後ともよろしくお願いいたします。
関連情報:今回の著者・アセトアミノフェンは「はてなブログ」で個人ブログを運営しております。今回はケムステの化学者のつぶやきと連動して Open Babel 特集を組みました。こちらでは、Open Babel を GUI ではなくコマンドで使用する例を紹介しておりますので、併せてよろしくお願いいたします。
関連記事
- SDFって何?~化合物の表記法~:化学者のつぶやき
- ACD/ChemSketch Freeware 12.0:化学者のつぶやき
- OpenBabel — Cheminformist
- ケムインフォマティクスに虚空投げ
関連書籍
- [amazonjs asin=”4621075527″ locale=”JP” title=”ケモインフォマティックス―予測と設計のための化学情報学”]
- [amazonjs asin=”4062744074″ locale=”JP” title=”ChemSketchで書く簡単化学レポート―最新化学レポート作成ソフトの使い方入門 (ブルーバックスCD-ROM)”]