mits58のメモ

メモ 参考にしないでください

Descriptors Generation Using the CDK Toolkit and Web Services

Tutorials in Chemoinformatics(Alexandre Varnek)の9章の読書メモ

Molecular Descriptor(分子記述子)の話と分子記述子を生成するソフトウェアだったり、Webサービスだったりの話

 

What's 記述子

  • Molecular Descriptorは、分子情報に由来する、分子の属性や表現である
    例えば: 分子の重さ、原子の個数〜複雑なものまで様々
  • 分子構造のある側面を捉えるために設計されている
    e.g. 定量的構造物性相関(QSPR)とか定量的構造活性相関(QSAR)とかに用いられる
  • 実験結果の値もMolecular Descriptorとして使われるよ
    e.g. 分配係数*1とか、分光学的特性とか(他のアクセスしにくいエンドポイント[???]を予測するのに関連性があるらしい)
  •  本質的な記述子は、分子全体の特性を含む
    i.e. 分子の重みや原子の数、結合の数、回転可能な結合の数、分子量などを含む

記述子の分類

  • Fragment Descriptor: 官能基や前もって決められた部分構造の出現頻度をカウントするもの
  • Topological Descriptor: 分子構造を数学的なグラフとして考え、グラフ理論を用いグラフ不変量を求めそれを用いる
  • Geometrical Descriptor: 分子の三次元構造をエンコードしたもの(特に3D Descriptorと呼ばれる)異なる立体配座*2のもの(conformations)、ジアステレオ異性体*3(diastereoisomers)を区別することができる

分子記述子の例

  • Wiener Index [Topological Descriptor]
    分子内の水素以外の原子に対しペアを考えた際の距離の総和
    距離は2つの原子間に存在する結合の数で定義される
    = 距離行列の全ての要素を加算し2で割ると得られる
    分岐の兆候を示し、ファンデルワールス面に対する簡単なアプローチである(?)
  • 2D autocorrelation vectors [Topological Descriptor]
    原子同士のトポロジカル距離と、それぞれの原子の特性(部分電荷、分極率とか)の値の積により表現される。
  • Radial Distribution Function codeRDF descriptors)[3D Descriptor]
    さっきの2D autocorrelation Descriptorの距離の部分を3次元距離にしたもの

 

あとはソフトウェアの解説なので飛ばす。解説してたのは

  • CDK Descriptor Calculator
  • E-DRAGON Web Service
  • OCHEM Web Service

の3つ。

 

 

 

ジアステレオ異性体とかの話↓

1-2 3) エナンチオマーとジアステレオマー - YAKU-TIK ~薬学まとめました~

こんな風に生物学的活性が異なるようなペアが存在するらしい(すごい)

ってことはQSARとか考えるときは3D Descriptorがよくない?(しらん)

 

*1:水と油のような、2つの混ざり合わない液体を同じ容器に入れ、どちらの液体にも溶ける第三の物質を加えてよく振ると、両方の液体中の第三の物質の濃度の比がある値に一定になる、そのときの値。疎水性を表したりする、あと固体と液体でも定義可能

*2:ぐるぐる動かせる単結合などの結合に関して、その位置が異なる関係の化合物

*3:キラル中心が存在する物質に関して、鏡像関係にあるもの、乳酸とか