
首先你应该在官网找到相应的R安装包,我们选择的是Windows的,下载页面如下:
2
下载成功之后双击选择安装,对于我们来说我们选择的是简体中文,如下图
3
点击确定之后进入下一个页面(此处你可以看到自己安装的版本号),如下图:
4
上面点击下一步之后进入下一个页面,如下图(如果你能看懂,你可以看一下,了解嘛,总有好处)
5
继续点击下一步,进入如下图界面,此处我们可以选择安装的地址
6
上面安装地址选择好之后,继续下一步,进入以下页面,在此页面我们可以选择32位版本和64位版本,如果电脑是32位的,最好把64位的去掉,如果64位的电脑,我们可以全部选择。
7
点击下一步,我们可以在以下页面选择默认选项
8
点击下一步之后我们可以选择R程序保存的位置,并且选择是否创建开始菜单文件夹,如下图
9
选择成功之后点击下一步
10
选择你喜欢的、习惯的快捷方式,点击下一步,它就自动安装了,如下图
11
安装完成之后如下图,点击结束,即可使用R
12
最后我们就可以看到桌面快捷方式启动
13
启动成功之后则可以使用R,如下图
环境设置函数为options(),用options()命令可以设置一些环境变量,使用help(options)可以查看详细的参数信息。查看默认参数的默认设置 getOption()
查看所有默认参数的设置
默认参数的更改
拼图之前,先要根据自己的张数,设置好画布大小,这很重要。一般一张方形的图会设置为width和height都等于5,如果两张横着拼在一起,就会设画布为105;如果拼6张图,一行三张,则设为1510,以此类推。当然画图的时候也可以自己尝试,根据实际情况调整。
reprplotheight 和 reprplotwidth 设置了整张图的大小
参考: >你好,看你的报错信息,很明显是无法连接到mirrosustceducn的镜像地址;第一种情况:你的网络环境不太好;推荐在网速良好的情况下再试一下;第二种来说:这个中国科技大的镜像抽风了,那就把R包镜像地址给换一下;再试一下,应该就可以解决了。一准备安装所需要的软件:
1VMware虚拟机的下载和安装在我的博客中已经提到,这里就不再详细阐述。
2下载一个redhat,因为redhat已经商业化了,推荐大家使用centos,如果自己有合适的linux安装版本,可以不使用这个。
二在VMware虚拟机为RedHat Linux创建新的虚拟机 :
1打开虚拟机,选择新建虚拟机:
2选择自定义(这里选择典型可能会在安装过程中出现一个硬件找不到的错误,所以推荐选择自定义),然后点下一步:
3 作系统选择linux,版本不用修改:
4命名,并选择虚拟 *** 作系统的存放位置(位置所在硬盘空间最好大于5G):
5给虚拟机分配内存(这个自己看情况,我的电脑内存是512,给虚拟机分配了256)
6选择虚拟机网络类型(推荐使用桥接网络)
7选择磁盘类型,这里选择IDE(这也是第三步选择自定义的原因,因为选择典型的话,系统会自动选择SCSI硬盘,而有的linux,主要是早的linux版本,不能使用SCSI硬盘,所以才会出现没有发现硬盘的错误)
8指定磁盘容量(推荐大小为8g,基本够用了)
二、安装linux系统就很简单了,网上也有很多的教程。虚拟机和真实服务器基本么有什么差别。
三、linux下安装程序
1yum 安装 直接敲yum install 后面跟软件名称,linux系统会自动到yum源上寻找你所要安装的软件,以及它所需要的依赖关系的软件等
2rpm安装 也是直接敲rpm install后面跟软件名称,系统会到rpm源上寻找软件,但是可能会提示在安装它之前还需要安装其他的软件,yum会直接帮你安装,但是rpm不会,你需要自己安装
3源码包安装 相对于yum和rpm安装。源码包安装比较麻烦,但是它相当于软件的定制版,你可以设定安装目录及安装参数等等,比较自由。
我们输入的数据包含 gene ID 和 vector(单样本)部分,这里的 gene ID 是一个通用概念,可以是基因、转录本、酶或蛋白质。这里的 vector 可以是样本的表达量、倍数变化, p-value, 组蛋白修饰数据等可测量的属性。下面我们以一个 RNA-seq 差异分析后的数据为例,来学习 pathview 的用法。
在 KEGG PATHWAY Database 查询,例如查询小鼠的"Cell Cycle"这条通路:
得到通路 ID 为"04110",物种为"mmu"
我们通过指定 genedata 和 pathwayid 来观察我们数据里的基因在信号通路“Pathways in cancer”上的表达变化:
相比于原始的 KEGG 图,我们可以使用 graphviz 产生一个新的布局,并且输出 PDF 格式的文件:
以下是输出结果图
如果我们想要运行的更快一点,并且不介意输出的大小,我们可以分图层,用 samelayer = F 将节点颜色和标签添加到另一个图层中,并且原来的 KEGG 基因标签会变成官方的 gene symbols :
在此基础上,修改 keggnative = FALSE ,我们就可以得到一个主图与图例分成两个页面的 PDF 文件
在原始的 KEGG 视图中,一个基因节点可能代表具有相似或者冗余功能的基因/蛋白质,我们可以将这种包含多个基因的节点拆分成独立的节点,这样可以更好的从基因层面而不是节点层面来查看数据。同时也可以通过汇总基因数据来可视化节点数据:
为了画面有更好的清晰度和可读性,默认不分裂节点,也不单独标记每个成员基因。
代谢途径中,除了基因节点还有化合物节点,我们可以尝试利用代谢途径( Propanoate metabolism)整合基因数据和化合物数据。这里的化合物数据包括代谢物、药物,对它们的测量和它们的属性。在这里我们仍然使用之前 RNA-seq 差异分析的数据作为 gene data,然后,我们生成模拟化合物或代谢组数据,并加载适当的化合物 ID 类型以进行演示:
结果如下
pathview 可以集成并将多个样本或状态绘制成一个图,我们可以使用多个重复样本模拟化合物数据:
结果如下,可以看到基因节点和化合物节点被分成多份,对应不同的样本:
我们可以根据将化合物数据分为绝对值大于 5 和小于 5 两类,构成一组离散型数据:
结果如下:
Pathview 包中的主函数是 pathview() ,有着各种参数,是我们用到最多的函数。在这篇文章中,我们介绍了 pathview()的比较常见的用法,包括包安装,数据准备,以及其他有用的特性。我们也可以使用 pathxiew 的网页版,地址是 > 欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)