Descriptors Generation Using the CDK Toolkit and Web Services
Tutorials in Chemoinformatics(Alexandre Varnek)の9章の読書メモ
Molecular Descriptor(分子記述子)の話と分子記述子を生成するソフトウェアだったり、Webサービスだったりの話
What's 記述子
- Molecular Descriptorは、分子情報に由来する、分子の属性や表現である
例えば: 分子の重さ、原子の個数〜複雑なものまで様々 - 分子構造のある側面を捉えるために設計されている
e.g. 定量的構造物性相関(QSPR)とか定量的構造活性相関(QSAR)とかに用いられる - 実験結果の値もMolecular Descriptorとして使われるよ
e.g. 分配係数*1とか、分光学的特性とか(他のアクセスしにくいエンドポイント[???]を予測するのに関連性があるらしい) - 本質的な記述子は、分子全体の特性を含む
i.e. 分子の重みや原子の数、結合の数、回転可能な結合の数、分子量などを含む
記述子の分類
- Fragment Descriptor: 官能基や前もって決められた部分構造の出現頻度をカウントするもの
- Topological Descriptor: 分子構造を数学的なグラフとして考え、グラフ理論を用いグラフ不変量を求めそれを用いる
- Geometrical Descriptor: 分子の三次元構造をエンコードしたもの(特に3D Descriptorと呼ばれる)異なる立体配座*2のもの(conformations)、ジアステレオ異性体*3(diastereoisomers)を区別することができる
分子記述子の例
- Wiener Index [Topological Descriptor]
分子内の水素以外の原子に対しペアを考えた際の距離の総和
距離は2つの原子間に存在する結合の数で定義される
= 距離行列の全ての要素を加算し2で割ると得られる
分岐の兆候を示し、ファンデルワールス面に対する簡単なアプローチである(?) - 2D autocorrelation vectors [Topological Descriptor]
原子同士のトポロジカル距離と、それぞれの原子の特性(部分電荷、分極率とか)の値の積により表現される。 - Radial Distribution Function code(RDF descriptors)[3D Descriptor]
さっきの2D autocorrelation Descriptorの距離の部分を3次元距離にしたもの
あとはソフトウェアの解説なので飛ばす。解説してたのは
- CDK Descriptor Calculator
- E-DRAGON Web Service
- OCHEM Web Service
の3つ。
ジアステレオ異性体とかの話↓
1-2 3) エナンチオマーとジアステレオマー - YAKU-TIK ~薬学まとめました~
こんな風に生物学的活性が異なるようなペアが存在するらしい(すごい)
ってことはQSARとか考えるときは3D Descriptorがよくない?(しらん)