新規薬物設計で行なわれるHigh Throughput Screening(HTS)では、いかに多様な(Diversityの高い)化合物群をスクリーニングに用いるか が重要です。また、一旦Hit(Lead)が見つかった後には、その化合物と『類似性が高い』と見られる化合物群を用いてのスクリーニングを行なうことになります。Selectorは、このような相反する目的に対応した、『化合物群の Diversity(多様性)と Similarity(類似性)を評価する』ためのモジュールです。
(Jarvis-Patrick clustering, Hierarchical clustering, Reciprocal Nearest Neighbor clustering)
SYBYLの Molecular Spreadsheetを基に記述子を計算し、それについてクラスター解析を行います。各クラスターから化合物を取り出すことにより、Diversityの高いサブセットを得ることができます。記述子としては任意のものを使用できますが、特に 2D fingerprint、CoMFAは Selector独自のもので、記述子としての有用性が論文で証明されています。
2D fingerprintを用いてTanimoto distance を計算する事により、データベースからDiversityの高いSubsetを抽出します。3つのアルゴリズムが用意されています。
「Database Dissimilarity Selection」を応用した機能で、2つのデータベースを Tanimoto distanceに基づいて比較します。比較の結果、片方のデータベースから Diversityの高い化合物だけを取り出すことができます。
「複数の化合物を含んだ Molecular Spreadsheetを用意すると、それらの化合物と Similarityの高い化合物をデータベースから一度に取り出すことができます。HTSの結果リード候補が幾つか得られた場合、それらと構造的に似た化合物を集める際に有用な機能です。
データベースに含まれる化合物から、指定した条件を満たすものだけを取り出します。例えば、「分子量が 500以下、ClogPが 5以下、H-bond donorの数が 5以下、H-bond acceptorの数が 10以下」の化合物だけを直ちに抽出する事ができます。

