中文字幕日韩精品一区二区免费_精品一区二区三区国产精品无卡在_国精品无码专区一区二区三区_国产αv三级中文在线

go富集R語言程序代碼 r語言做go和kegg富集分析圖

[R語言] GO富集分析可視化 GOplot::GOCircle

查看GOplot內(nèi)示例數(shù)據(jù)的格式,對自己的數(shù)據(jù)做處理

創(chuàng)新互聯(lián)是一家從事企業(yè)網(wǎng)站建設(shè)、成都網(wǎng)站制作、成都做網(wǎng)站、外貿(mào)營銷網(wǎng)站建設(shè)、行業(yè)門戶網(wǎng)站建設(shè)、網(wǎng)頁設(shè)計(jì)制作的專業(yè)的建站公司,擁有經(jīng)驗(yàn)豐富的網(wǎng)站建設(shè)工程師和網(wǎng)頁設(shè)計(jì)人員,具備各種規(guī)模與類型網(wǎng)站建設(shè)的實(shí)力,在網(wǎng)站建設(shè)領(lǐng)域樹立了自己獨(dú)特的設(shè)計(jì)風(fēng)格。自公司成立以來曾獨(dú)立設(shè)計(jì)制作的站點(diǎn)上1000家。

觀察結(jié)論:

觀察自己的兩個數(shù)據(jù)表:

table.legend 設(shè)置為T時(shí)會顯示表格

本圖中表格和圖例是出圖后剪切拼合而成,沒有用R中的拼圖包

GO、KEGG富集分析(一)有參情況

對基因的描述一般從三個層面進(jìn)行:

這三個層面具體是指:

得到GO注釋

做GO分析的思路:

比如,在疾病研究的時(shí)候,進(jìn)行藥物治療之后某些基因的表達(dá)量明顯的發(fā)生了變化,拿這些基因去做GO分析發(fā)現(xiàn)在Biological process過程當(dāng)中集中在RNA修飾上,然后在此基礎(chǔ)上繼續(xù)進(jìn)行挖掘。這個例子就是想啟示大家拿到差異表達(dá)基因DEG只是一個開始,接下來就應(yīng)該去做GO注釋,之后需要進(jìn)行一個分析看這些注釋主要集中在哪個地方。假如我們有100個差異表達(dá)基因其中有99個都集中在細(xì)胞核里,那我們通過GO分析就得到了一個顯著的分布。

GO富集分析原理:

有一個term注釋了100個差異表達(dá)基因參與了哪個過程,注釋完之后(模式生物都有現(xiàn)成的注釋包,不用我們自己注釋),計(jì)算相對于背景它是否顯著集中在某條通路、某一個細(xì)胞學(xué)定位、某一種生物學(xué)功能。

clusterProfiler是一個功能強(qiáng)大的R包,同時(shí)支持GO和KEGG的富集分析,而且可視化功能非常的優(yōu)秀,本章主要介紹利用這個R包來進(jìn)行Gene Ontology的富集分析。

進(jìn)行GO分析時(shí),需要考慮的一個基礎(chǔ)因素就是基因的GO注釋信息從何處獲取。Bioconductor上提供了以下19個物種的Org類型的包,包含了這些物種的GO注釋信息

對于以上19個物種,只需要安裝對應(yīng)的org包,clusterProfile就會自動從中獲取GO注釋信息,我們只需要差異基因的列表就可以了,使用起來非常方便。

1.1 準(zhǔn)備輸入數(shù)據(jù)

待分析的數(shù)據(jù)就是一串基因名稱了,可以是ensembl id、entrze id或者symbol id等類型都可以。把基因名稱以一列的形式排開,放在一個文本文件中(例如命名“gene.txt”)。Excel中查看,就是如下示例這種樣式。

1.3 GO富集分析

加載了注釋庫之后,讀取基因列表文件,并使用clusterProfiler的內(nèi)部函數(shù)enrichGO()即可完成GO富集分析。

讀取基因列表文件,并使用clusterProfiler的內(nèi)部函數(shù)enrichKEGG()即可完成KEGG富集分析。

此外,clusterProfiler中也額外提供了一系列的可視化方案用于展示本次富集分析結(jié)果,具有極大的便利。

參考:

;utm_medium=timeline

【R語言】解決GO富集分析繪圖,標(biāo)簽重疊問題

前面我給大家詳細(xì)介紹過

?GO簡介及GO富集結(jié)果解讀

?四種GO富集柱形圖、氣泡圖解讀

?GO富集分析四種風(fēng)格展示結(jié)果—柱形圖,氣泡圖

?KEGG富集分析—柱形圖,氣泡圖,通路圖

? DAVID GO和KEGG富集分析及結(jié)果可視化

也用視頻給大家介紹過

? GO和KEGG富集分析視頻講解

最近有粉絲反映說,利用clusterProfiler這個包繪制GO富集分析氣泡圖和柱形圖的時(shí)候,發(fā)現(xiàn)GO條目的名字都重疊在一起了。

氣泡圖

柱形圖

這個圖別說美觀了,簡直不忍直視。經(jīng)過我的認(rèn)真研究,發(fā)現(xiàn)跟R版本有關(guān)。前面我給大家展示的基本都是R 3.6.3做出來的圖。很多粉絲可能用的都是最新版本的R 4.1.2。

我們知道R的版本在不停的更新,相應(yīng)的R包也在不停的更新。我把繪制氣泡圖和柱形圖相關(guān)的函數(shù)拿出來認(rèn)真的研究了一下,終于發(fā)現(xiàn)的癥結(jié)所在。

dotplot這個函數(shù),多了個 label_format 參數(shù)

我們來看看這個參數(shù)究竟是干什么用的,看看參數(shù)說明

label_format :

a numeric value sets wrap length, alternatively a custom function to format axis labels. by default wraps names longer that 30 characters

原來這個參數(shù)默認(rèn)值是30,當(dāng)標(biāo)簽的長度大于30個字符就會被折疊,用多行來展示。既然問題找到了,我們就來調(diào)節(jié)一下這個參數(shù),把他設(shè)置成100,讓我們的標(biāo)簽可以一行展示。

是不是還是原來的配方,還是熟悉的味道

同樣的柱形圖,我們也能讓他恢復(fù)原來的容貌。

關(guān)于如何使用R做GO和KEGG富集分析,可參考下文

GO和KEGG富集分析視頻講解

R語言:clusterProfiler進(jìn)行GO富集分析和Gene_ID轉(zhuǎn)換

ID轉(zhuǎn)換用到的是 bitr() 函數(shù),bitr()的使用方法:

org.Hs.eg.db包含有多種gene_name的類型

keytypes() :keytypes(x),查看注釋包中可以使用的類型

columns() :類似于keytypes(),針對org.Hs.eg.db兩個函數(shù)返回值一致

select() :select(x, keys, columns, keytype, ...) eg.

函數(shù)enrichGO()進(jìn)行GO富集分析,enrichGO()的使用方法:

舉例:

本文標(biāo)題:go富集R語言程序代碼 r語言做go和kegg富集分析圖
網(wǎng)站URL:http://m.rwnh.cn/article14/dosgdde.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供云服務(wù)器、外貿(mào)網(wǎng)站建設(shè)品牌網(wǎng)站建設(shè)、網(wǎng)站內(nèi)鏈全網(wǎng)營銷推廣、品牌網(wǎng)站制作

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)

營銷型網(wǎng)站建設(shè)
弥勒县| 连城县| 合作市| 万源市| 塔河县| 高安市| 新河县| 天气| 都匀市| 富锦市| 皋兰县| 酒泉市| 同江市| 错那县| 日照市| 浦城县| 大田县| 南华县| 阿拉善左旗| 铜川市| 寿阳县| 甘洛县| 延长县| 库车县| 远安县| 铜山县| 邹城市| 公主岭市| 浠水县| 永城市| 仙桃市| 淮阳县| 叶城县| 青冈县| 罗甸县| 饶阳县| 巴楚县| 延边| 大余县| 乌拉特中旗| 全南县|