![]() |
GO功能分類和GO功能富集.
|
|||||||||||||||||
[發表評論] [本類其他服務] [本類其他服務商] |
服務商: 上海生咨生物科技有限公司 | 查看該公司所有服務 >> |
基因本體論(Gene Ontology, GO)[1]是一個被廣泛使用的生物學數據庫,它由兩個方面組成:其一為本體自身,即由生物學家定義好的詞條以及它們之間的結構化關系;其二為基因產物和詞條之間的關系,即基因本體注釋。本體是某一專門領域的有嚴格約束的功能詞匯或稱作功能類,它們通過有向無環圖(Directed Acyclic Graph, DAG)的形式將嚴格定義的不同功能類之間的關系組織起來。GO是跨越原核生物與真核生物各物種的基因功能分類體系,分為三個獨立的ontology, 分別是生物過程(biological process, BP),分子功能(molecular function, MF),和細胞組分(cellular component, CC)。GO分析是對這三個ontology分別進行分析。更多的內容可以參考gene ontology官網http://www.geneontology.org。這方面進一步的學習可以參加由上海生咨生物(www.biorefer.com)組織的研習班, 示例視頻http://www.biorefer.com/biorefer/flv/playflv.php?id=14。
我們對GO分析對于有功能注釋的物種和對功能注釋缺少的物種采用二種不同的方法進行分析。有功能注釋的物種,如人類、大鼠、小鼠通常我們采用DAVID(The Database for Annotation,Visualization and Integrated Discovery)[2]進行分析。DAVID是一個生物信息數據庫,整合了生物學數據和分析工具,為大規模的基因或蛋白列表(成百上千個基因ID或者蛋白ID列表)提供系統綜合的生物功能注釋信息。DAVID的使用非常廣,有超過2.6篇的引用。提交分析列表獲得結果之后,采用內部的用Perl和R開發的DAVIDPipeline軟件進行繪圖。對于沒有功能注釋的物種,如果有蛋白質序列優先選用蛋白質序列,采用BLAST+軟件(version: 2.2.30+)與GO序列數據庫(****年**月**日更新)進行比對,選擇E-value<1e-8且相似度大于30%的序列的匹配最好的序列的注釋做為GO注釋,同時采用Interproscan軟件(version: 5.25-64.0 )進行GO功能注釋預測。將兩種方法得到的GO注釋合并后,采用[****年**月**日]更新的GO數據庫對GO功能進行分類分析。對于選取差異表達基因或者差異表達蛋白,以[****]為背景參照,然后采用Fisher’s exact test方法,檢驗該功能模塊中是否非隨機地富集了差異基因。
GO分析結果主要包括GO功能分類結果和GO功能富集結果。
GO功能分類分析
GO功能分類是在某一功能層次上統計蛋白或者基因的數目或組成,往往是在GO的第二層次。此外也有研究都挑選一些Term,而后統計直接對應到該Term的基因或蛋白數。目的是展示數據集大概的GO功能情況,我們提供幾種不同風格的圖形以供選擇。
GO功能富集分析
GO功能富集目的是為了獲得相對于本底參照顯著富集的功能類別,通過該項分析可以找出在統計上顯著富集的.該功能或者定位有可能與研究的目前有關。我們也提供了幾種不同的風格的圖形以供選擇。
其它結果
篩選出的細胞定位