R语言做基因go分析 r语言进行go分析
【R语言】解决GO富集分析绘图,标签重叠问题
前面我给大家详细介绍过
成都创新互联专注于安州网站建设服务及定制,我们拥有丰富的企业做网站经验。 热诚为您提供安州营销型网站建设,安州网站制作、安州网页设计、安州网站官网定制、重庆小程序开发公司服务,打造安州网络公司原创品牌,更为您提供安州网站排名全网营销落地服务。
☞GO简介及GO富集结果解读
☞四种GO富集柱形图、气泡图解读
☞GO富集分析四种风格展示结果—柱形图,气泡图
☞KEGG富集分析—柱形图,气泡图,通路图
☞ DAVID GO和KEGG富集分析及结果可视化
也用视频给大家介绍过
☞ GO和KEGG富集分析视频讲解
最近有粉丝反映说,利用clusterProfiler这个包绘制GO富集分析气泡图和柱形图的时候,发现GO条目的名字都重叠在一起了。
气泡图
柱形图
这个图别说美观了,简直不忍直视。经过我的认真研究,发现跟R版本有关。前面我给大家展示的基本都是R 3.6.3做出来的图。很多粉丝可能用的都是最新版本的R 4.1.2。
我们知道R的版本在不停的更新,相应的R包也在不停的更新。我把绘制气泡图和柱形图相关的函数拿出来认真的研究了一下,终于发现的症结所在。
dotplot这个函数,多了个 label_format 参数
我们来看看这个参数究竟是干什么用的,看看参数说明
label_format :
a numeric value sets wrap length, alternatively a custom function to format axis labels. by default wraps names longer that 30 characters
原来这个参数默认值是30,当标签的长度大于30个字符就会被折叠,用多行来展示。既然问题找到了,我们就来调节一下这个参数,把他设置成100,让我们的标签可以一行展示。
是不是还是原来的配方,还是熟悉的味道
同样的柱形图,我们也能让他恢复原来的容貌。
关于如何使用R做GO和KEGG富集分析,可参考下文
GO和KEGG富集分析视频讲解
R语言:clusterProfiler进行GO富集分析和Gene_ID转换
ID转换用到的是 bitr() 函数,bitr()的使用方法:
org.Hs.eg.db包含有多种gene_name的类型
keytypes() :keytypes(x),查看注释包中可以使用的类型
columns() :类似于keytypes(),针对org.Hs.eg.db两个函数返回值一致
select() :select(x, keys, columns, keytype, ...) eg.
函数enrichGO()进行GO富集分析,enrichGO()的使用方法:
举例:
R语言GEO数据挖掘:步骤三:进行基因差异分析
用limma包,这里注意,limma包是对基因芯片表达矩阵的分析,不能对逆转录RNAseq表达矩阵进行分析(因为数据特征不同),RNAseq需要用另一种方法
解读此表
但是上面的用法做不到随心所欲的指定任意两组进行比较,所有还有下一种方法
处理好了分组信息,再自定义比较元素
自定义函数进行比较
热土和火山图都是傻瓜式的,只要的前面得出的deg数据(也就是基因差异表达数据)是正确的
如何从众多go生物学分析中选取出需要的生物过程
1 如果肯下功夫,可以通过R语言获得基因本体论以及通路富集数据并将其可视化,所用的R包可以是GOSim(GO分析),或者clusterprofiler(GOKEGG)
2 cytoscape 的插件cluego可以傻瓜式实现通路的图片展示,可以用来直接发文章(低分的至少可以)
3 关于GO和KEGG数据的获得,上DAVID就好
本文标题:R语言做基因go分析 r语言进行go分析
分享链接:http://azwzsj.com/article/doshccj.html