
Bio knowledge は、遺伝子やタンパク質からのメカニズム探索を実施するためのシステムです。 化合物、タンパク質、遺伝子、ゲノム疾患、組織、などのアノテーションをまとめて搭載したデータベースを利用して、 辞書としての利用、個々のアノテーションの参照、マイクロアレイなどで求めた遺伝子グループを対象としたGO分析、 疾患分析、化合物分析などに利用可能となっています。
特に、遺伝子グループを対象とした解析では、遺伝子グループが持つ機能や、 疾患や化合物との関係の傾向が客観的に判断できます。ほとんどの化合物は構造情報を持ち、 Chem Knowledge機能を利用した構造からの解析にも対応しています。 各種辞書の機能を利用して文献検索した結果データに対し、遺伝子や疾患、 化合物との文献共記情報を利用した解析も探索に友好的手段となっています。
Bio Knowledge機能の特徴 Bio Knowledgeでは、目的に応じた遺伝子とタンパク質、疾患、化合物のアノテーション展開が可能です。
遺伝子の情報展開
疾患の情報展開
化合物の情報展開
マイクロアレイの解析
独自アノテーションの登録
キーワード検索の主な機能
基本であるキーワード検索は、遺伝子、タンパク質、化合物、疾患、または組織のシノニムやパターン一致手法、
オプションフィルタなどを利用可能とし、できるだけ多くの選択肢で確実に検索結果を取得できる仕組みを採用しています。
遺伝子を例の場合、遺伝子シンボルや遺伝子名、それらの完全一致か曖昧検索を行うかどうか、生物種の指定、
BioAssayや立体構造へのリンクの有無など、様々なフィルターが準備されています。
これらのフィルター条件をうまく利用することで一般的なキーワード検索よりも効率良く、そして、
正確に行うことが可能となります。
Advance Searchでは、AccessionやIDからの直接検索、Input Assist機能で目的の機能を検索しやすくしたGO Term検索や、
マイクロアレイプローブの検索などができるほか、複数の遺伝子リストやプローブIDリスト、
文献のPMIDリストなど一度に処理し検索できるバッチ処理機能があります。
この機能は、遺伝子リストからのGO分析やオルソログ遺伝子の検索、文献のIDリストからその中に記載のある遺伝子、
疾患、化合物、組織の関連情報のランキング分析などに威力を発揮します。
Expression Analysisでは発現データの数値フィルター、統計計算、遺伝子アノテーションやオルソログ変換などを
一度に行うことが可能です。
Gene Group Analysisでは遺伝子IDリストをキーに、GOの分析、文献分析結果をもとにした遺伝子、疾患、化合物、
組織との関連の重みづけ分析を実施でき、選択した遺伝子群の大まかな機能を求めることが可能です。
化合物検索としては、化合物IDリストをキーに、文献分析結果をもとにした遺伝子、疾患、化合物、
組織との関連の重みづけ分析を実施でき、選択した遺伝子群の機能推定に非常に有意な機能となっています。
● Clip Board機能 Clip Board機能は、LSKBの各種検索結果の遺伝子、疾患、化合物、組織用語を登録でき、 用語のグループ化やAND/ORでの文献の取得、文献IDをパスウエイ解析ソフトウエアやその他のアプリケーションに 送り込むことができます。また、PubMedへのクエリー式を自動的に作成する機能があります。
● Job History機能 Job Historyはバッチ処理などの結果を自動的に保存し、後日参照できる機能です。Job Historyにコメントを記述や、 他ユーザーへのBroadcast機能を搭載しています。
● 遺伝子辞書機能
LSKBの遺伝子辞書には通常のシンボル名や遺伝子名といったキーワードの他、数多くのシノニム用語が搭載されています。
これらのシノニム遺伝子名を利用しすることで、より広範囲かつ、見落としのない検索が可能となります。
“peroxisome proliferators”をキーワードとした例:
より広範囲に検索するために、[Multiple Random]を選択します。[Multiple Random]は検索するクエリーの全ての単語が
順不同に辞書内のひとつのキーワードレコードに出現すればヒットとみなされます。種を[Human]に設定し、
BioAssayやPDBなどのオプションフィルタは利用せず検索します。
検索結果には現在の登録にない遺伝子には”Replaced”, “Discontinued”のコメントと共に表示れます、
その対象文献も参照可能です。創薬探索に重要なPDBやBioAssayの情報も表示されます。
検索結果を開くと、それぞれの検索用語での文献数や、その遺伝子から次の情報取得のためのリストボックスが表示され、
タンパク、ドメイン、PDB、BioAssay、オルソログ、Gene Ontology、マイクロアレイプローブ、疾患、
化合物などの情報が取り出せるようになっています。
● 遺伝子にリンクされているタンパク質情報 タンパク質のサマリーのほか、GO、ドメインとそのドメインをもつ遺伝子リスト、 PDBとその複合体リガンド情報などがふくまれています。 このPDF複合体リガンド情報から、 さらに掘り下げた化合物情報の取得や文献の情報の取得が可能となります。
● BioAssayサマリーや化合物情報の検索
遺伝子検索後、BioAssay SummeryやBioAssay Compoundリストで化合物情報を取得できます。
BioAssay Summeryを選択すると、アッセイの要約のほか、テストされた化合物、
活性のある化合物などのアノテーション情報や構造式を取得できます。
● GO検索ウイザード機能
GO検索ウイザード機能を利用して、求めたい機能をもつ遺伝子やタンパクの情報を取得することが可能です。
“membrane”と“transport”をキーワードとして検索し例:
断片的なキーワードで検索した後、該当する機能グループに該当する遺伝子がヒト、マウス、ラット、
ゼブラフィッシュそれぞれに分類され表示されます。
遺伝子リストからの分析
● オルソログ遺伝子アノテーションの作成
豊富なヒトの遺伝子アノテーション情報を利用すると、モデル動物としてよく利用するマウスやラットなどの情報より、
より多くの機能を得ることが期待できます。各生物種のわかっている遺伝子をヒトやマウスに変換することで機能解明を
より効率的に行えます。
オルソログは、GeneIDリストをクエリーとして、Human, Mouse, Rat, Zebrafish間での相互変換と、
それ以外に17の生物種の遺伝子IDをHuman, Mouse, Rat, Zebrafishに変換する機能を持もっています。
また、独自のオルソログ遺伝子を登録することも可能です。
● グループ化した遺伝子のGO機能解析
?マイクロアレイデータやその他で求めた遺伝子にどの様な特異的な機能があるか、
?どの遺伝子に着目するのが調査しやすいか、?定量的な遺伝子の優先付けはどうするか、
などといった決定を大きく左右し、ヒントとなるのが、遺伝子機能がどれだけ解明されているか、です。
機能の研究が進んでいるほど論文は多いのが現状ですが、全く報告のない遺伝子をターゲットとして解析したい場合など、
GOをキーとして遺伝子の優位付けを可能にしたのがこのGO解析機能です。
Gene Group AnalysisにGeneIDリストを入力し、Targetを[GO Term]にし、機能を[Biological Process]に設定し検索実行します。
一般のGO解析と手法は同じですが、結果表示には 「横軸にそれぞれの遺伝子」、「縦軸に機能を表示」することで、
遺伝子と機能の関係が明快に分析できます。
統計値のみに頼っていた従来の判定方法にくらべ、その遺伝子が特異的な機能なのか、
多くの機能に所属しているかが一目瞭然です。また類似機能に集合があるかも従来のリスト形式より見やすいことが
特徴となっています。
解析結果はMicrosoft Excelにもダウンロード可能です。
● グループ化した遺伝子の疾患分析 同様に、Gene Group AnalysisにGeneIDリストを入力し、Targetを[Disease]に設定し検索を実行します。 疾患vs.遺伝子データベースからの検索結果に各遺伝子がどのような疾患に偏りがあるかを明快に知ることができます。 GO検索も同様ですが、マイクロアレイ実験などで絞り込んだ遺伝子セットを利用しての実行などに大変有効な機能です。
● マイクロアレイデータ解析をする
LSKBのアノテーションを利用したマイクロアレイデータの分析が可能です。
基本機能は、2群比較、統計処理です。しかしながら、遺伝子アノテーション情報取得、
オルソログ変換までを自動で実行可能なため、絞り込んだ遺伝子群を利用してGO機能や疾患の傾向などの調査を同時に行え、
研究を効率よく進めることが可能です。
マイクロアレイアノテーションは標準で、Affymetrix, AgilentのHuman, Mouse, Rat, Zebrafishをサポートします。
その他チップもアノテーションインポート機能を利用して登録可能です。
おもな基本解析機能は以下の4項目となります。
| マイクロアレイデータ | → |
発現変動比
P値 遺伝子アノテーション オルソログ |
→ |
GO解析
疾患解析 |
| マイクロアレイデータをアップロードし、発現変動比のフィルター条件や統計解析手法を選択すると、 遺伝子アノテーションやオルソログ遺伝子アノテーションを加えた表が出力される。 | ||||
● GEOデータの分析
データファイルとしてはテキストデータまたは、NCBIのGEOデータセットが利用できます。
データがどちらのタイプであるかを選択した後、アップロードし、サンプル群指定、プローブIDやEntrez Gene ID場所指定、
計算条件、発現変動比のフィルターやオルソログ変換などの各種設定を行った後解析を実行します。
統計計算からオルソログ遺伝子までのアノテーションを自動作成います。
それらの結果は、Job Historyでいつでも参照することが可能です。

