
下载Windows的Server端
安装Memcache Server(也可以不安装直接启动)
1. 下载memcached的windows稳定版,解压放某个盘下面,比如在c:\memcached
2. 在CMD下输入 "c:\memcached\memcached.exe -d install" 安装.
3. 再输入:"c:\memcached\memcached.exe -d start" 启动。NOTE: 以后memcached将作为windows的一个服务每次开机时自动启动。这样服务器端已经安装完毕了。
如果下载的是二进制的版本,直接运行就可以了,可以加上参数来加以设置。
常用设置:
-p <num> 监听的端口
-l <ip_addr> 连接的IP地址, 默认是本机
-d start 启动memcached服务
-d restart重起memcached服务
-d stop|shutdown 关闭正在运行的memcached服务
-d install安装memcached服务
-d uninstall 卸载memcached服务
-u <username>以<username>的身份运行 (仅在以root运行的时候有效)
-m <num> 最大内存使用,单位MB。默认64MB
-M内存耗尽时返回错误,而不是删除项
-c <num> 最大同时连接数,默认是1024
-f <factor> 块大小增长因子,默认是1.25
-n <bytes> 最小分配空间,key+value+flags默认是48
-h显示帮助
——Biomart下载基因和motif位置信息
科研过程中我们经常会使用Ensembl(http://asia.ensembl.org/index.html) 网站来获取物种的参考基因组,其中BioMart工具可以获取物种的基因注释信息,以及跨数据库的ID匹配和注释等。
在参考基因组和基因注释文件一文中有详细介绍如何在Ensembel数据库中获取参考基因组和基因注释文件。(点击蓝字即可阅读)
生信分析中,想要找到感兴趣基因的转录因子结合位点,该怎么做呢?
首先需要准备以下3个文件,后面两个文件可以在ensembl网站中下载:
bed格式文件提供了一种灵活的方式来定义数据行,以此描述基因注释的信息。BED行有3个必须的列和9个可选的列。 每行的数据格式要求一致。
关于bed文件格式的介绍,在https://genome.ucsc.edu/FAQ/FAQformat.html#format1中有详细说明。
我们需要下载的 基因位置信息列表 是一个6列的bed文件,每列信息如下:
注:起始位置和终止位置以0为起点,前闭后开。
转录因子结合位点列表 是一个5列的bed文件,每列信息如下:
具体内容见后面示例,更方便理解。
1. 进入Ensembl主页后点击 BioMart
2. 使用下拉框- CHOOSE DATASET - 选择数据库,我们选则 Ensembl Genes 93 ;这时出现新的下拉框- CHOOSE DATASET - ,选择目的物种,以 Human gene GRCh38.p12 为例。如果自己实际 *** 作,需要选择自己的数据常用的基因组版本。如果没有 历史 包袱,建议选择 GRCh38 最新版。
3. 选择数据库后,点击Filters对数据进行筛选,如果是对全基因组进行分析可不用筛选, 略过不填 。
4. 点击 Attributes ,在GENE处依次选择1-6列的内容,勾选顺序便是结果矩阵中每列的顺序。
5. 如上图中所示,点击 results 后跳转下载页面,中间展示了部分所选的数据矩阵,确定格式无误后点击 GO 即可下载。
6. 转录因子结合位点矩阵的下载 类似上面,不过在下拉框-CHOOSE DATASET- 选择数据库时,我们选则 Ensembl Regulation 93 ,再选择 Human Binding Motif (GRCh38.p12)
7. 在Attributes处选择需要的信息列,点击 Results 和 GO 进行数据下载
将上述下载的两个文件分别命名为 GRCh38.gene.bed 和 GRCh38.TFmotif_binding.bed ,在Shell中查看一下:
基因组中每个基因所在的染色体、位置和链的信息,以及对应的ENSG编号和Gene symbol。
第五列为人中的转录因子,每一行表示每个转录因子在基因组范围的结合位点分布,即其可能在哪些区域有结合motif。这些区域是与TF的结合motif矩阵相似性比较高的区域,被视为潜在结合位点。有程序 MEME-FIMO 或 Homer-Findmotifs.pl 可以完成对应的工作。
模因(meme)是一种文化素材或者行为模式,可以在人类文化之间传播,类似于基因在生物种群之间的传播。模因以各种形式保存在人类的文化中,如文字、图片、语言、音乐等。完全直接复制(完美复制)的模因,指的是复制的过程中不经历任何变化,使得第二份拷贝和原始版本完全相同的模因。下面列举一些完全直接复制的模因例子:
1. “KEEP CALM AND CARRY ON”(保持冷静和继续前进):这个英文短语最早出现于1940年代,是英国政府在第二次世界大战期间为民众所设计的宣传海报。近年来,这个短语在社交媒体上流传甚广,并被改编成各种形象和风格的图片。
2. “I Can Has Cheezburger?”: 这个短语最初来自于2007年的一个网络迷因,指的是将一只猫的图片贴在一个带有错别字的文本上,形式类似于人类语言,这样看起来就像是一只猫在说人话。这个短语及相关的猫咪图片被广泛传播,并被用于各种各样的广告和商品设计。
3. Harlem Shake: Harlem Shake是一种舞蹈风格和音乐的名字。2013年时,这个舞蹈和音乐视频突然在网络上迅速传播,一个视频中的人开始跳舞,但是其他人似乎并不知情,然后在转场的瞬间,所有人都突然开始露出奇怪的舞蹈动作。这个舞蹈短片的搞笑性和强烈的覆盖性,使得这个模因在网络上迅速传播开来。
需要注意的是,虽然这些模因在出现后会被广泛复制、模仿、重编等,但它们初始的出现和演变需要满足很多的条件,例如社会背景、文化的传承和相关个人或团体的创意或推广等。模因的有效性和持续的传播能力也需要在后续的复制中进行评估和改变。
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)