タンパク質とは、生体内で特定の機能を発揮する巨大分子です。ヒトをはじめとする様々な生物種のゲノム情報が解読されている現在、創薬のターゲットとなるタンパク質をコードする配列を取得して、疾患の標的タンパク質のアミノ酸配列を得ることが可能となっています。しかしながら、ゲノム情報から取り出されるアミノ酸配列はそれ以外にも莫大な数存在し、その多くが機能の分からないタンパク質といっても過言ではありません。また、”アミノ酸配列”だけからタンパク質の立体構造を予測することは、構造の可変領域の構築などが壁となって、現在でも研究が続けられている分野となっています。
一方、タンパク質自体の分子構造に関する研究も加速的に進んでいて、タンパク質立体構造の Protein Data Bankへの登録数が急激に飛躍しています。タンパク質の立体構造の解析には結晶構造解析やNMRを用いるのですが、結晶構造解析では「結晶化の困難なタンパク質については実験が困難」、NMRでは「(固体での観測手法もあるものの)溶液中での構造解析を主とすること」「NMRデータから得られる距離情報から構造を推定する計算ステップが必要であり、動的な構造が観測可能な反面、分子の大きさが制限される」といった点が問題になります。/p>
ところで、これまでの様々な生物種のタンパク質に関する研究から「違う生物種に由来するものであっても、類似したアミノ酸配列をもつタンパク質は、類似した立体構造を保持する」ことがわかっています。このことから、立体構造既知の分子群の特徴を利用して、立体構造未知のタンパク質の構造を推定する手法が考案されました。これらは、一般にHomology Modelingと呼ばれており、これまでに多数の方法が提案されています。
SYBYLのAdvanced Protein Modelingは、タンパク質の構造を研究する方向けのモジュールで、Homology Modelingの機能を提供するものです。この中では、英国ケンブリッジ大学のTom Blundell教授らのグループによって開発されたFUGUETMとORCHESTRARTMという2つの技術が使われており、これらの技術を用いた次のような手順で「アミノ酸配列しかわかっていないタンパク質の立体構造を予測」します。
Homology Modelingで『アミノ酸配列』だけしかわかっていないタンパク質の立体構造を推定する場合、最初に「立体構造既知のタンパク質」から類似した分子を探します。Homology Modelingでは、そのようなタンパク質のアミノ酸配列(Query配列)とデータベース中のタンパク質のアミノ酸配列を比較して類似性を計算し、その得点の高いものを採用します。評価項目としては
が用いられます。これらの箇所を特定して、あらかじめ決めた加点・減点のルール(置換基テーブル)で評価して類似性を計算します。
Advanced Protein ModelingのHomolog検索では、この考え方を拡張した『Structure Aided Sequence Comparison』と呼ばれる手法を用います。この手法の一番の特徴は、アミノ酸が置換された部分が『高次構造の一部に属しているか否か』『分子表面にあるか否か』などの「アミノ酸残基の存在する環境」によって置換基テーブルを変える点にあります。
この『置換された部位の環境を考慮して置換基テーブルを変える』という考え方は、ESST(Environment Specific Substitution Table)として実装されています。また、挿入・欠落に対するペナルティも、『その残基が高次構造を構成するものか否か』で評価を変えるESGP(Environment Specific Gap Penalties)として実装されています。
これらESST、ESGPを使うことで、「より信頼度の高いタンパク質分子どうしの類似性評価」が可能となりました。
Advanced Protein ModelingのHomolog検索機能は、前述のような新しいアプローチを導入しているにもかかわらず、非常に簡単に利用できます。Query配列を与えて計算開始を指示すれば処理はほぼ自動で進行します。面倒な詳細設定や計算途中でのユーザからの指示はほとんど必要としません。
計算終了後、類縁タンパク質分子の候補一覧をSYBYL利用者に提供します。この際、Webブラウザでの結果表示とSYBYLのGUI上での結果表示機能を併用できますので、結果取得後 即座にモデリング作業に移ることが可能です
Query配列として与えられる『構造未知のタンパク質』が「類似性の認められるタンパク質」と同様の機能・機構で働く分子であれば、その一次構造(配列)中に共通点が見出せるだけでなく、立体構造既知のタンパク質に見られる高次構造も保存されていると期待できます。そのような部位は構造保存領域(Structure Conserved Region;SCR )と呼ばれ、Query配列として与えられるタンパク質の立体構造を構築する基本部品として利用することが可能です。
Advanced Protein Modelingモジュールでは、SCR構築には『Fragment Assembly Approach』と呼ばれる方法が搭載され、「SCR領域の構築」以降の分子構造構築のステップではSYBYLで結果を確認しながらの分子構築が可能となっています。
類縁タンパク質分子が如何に類似性の高いものであっても、SCRに含まれない「共通性の見出せない領域」は見つかります。そのような領域については、ORCHESTRARの技術で強化された「Loop Search」を使って構造を推定します。このLoop Searchの際には、「データベースから探す※1」「既知の構造の一部を利用する※2」「計算によって求める※3」といったアプローチが利用可能です。
「SCR領域の構築」「Loop Search」の2つの処理で主鎖を構築した後、側鎖を付与する、ぶつかりのある部分の調整を行う、といった処理を行って、タンパク質全体の構造を推定します。
注:※1〜3は、ソフトウェア中では次のような名称で呼ばれております:※1;Database、※2;Homologs、※3:ab Initio Database(PETRA)
【事例紹介〜FactorXa〜】
環器疾患において『凝固因子』が重要な役割を果たしていることが知られています。血液凝固系に作用するFactorXa関連タンパク質分子のモデリングを行った結果が発表されております。[1]
[1] Scharer, K. et al. (2005) Quantification of Cation-Pi Interactions in Protein-Ligand Complexes: Crystal-Structure Analysis of Factor Xa Bound to a Quaternary Ammonium Ion Ligand. Angew.Chem., Int.Ed.Engl. 44:4400.
オレンジ(半透明):PDBより取得したFactorXaの例(2BOK)、水色:Advanced Protein Modelingでのモデリング結果

