和NCBI的refseq对应的数据库在EMBL中叫做什么如何查询

和NCBI的refseq对应的数据库在EMBL中叫做什么如何查询,第1张

选择开始菜单中→程序→Management SQL Server 2008→SQL Server Management Studio命令,打开SQL Server Management Studio窗口,并使用Windows或 SQL Server身份验证建立连接。

在对象资源管理器窗口中展开服务器,然后选择数据库节点

右键单击数据库节点,从d出来的快捷菜单中选择新建数据库命令。

执行上述 *** 作后,会d出新建数据库对话框。在对话框、左侧有3个选项,分别是常规、选项和文件组。完成这三个选项中的设置会后,就完成了数据库的创建工作,

在数据库名称文本框中输入要新建数据库的名称。例如,这里以“新建的数据库”。

在所有者文本框中输入新建数据库的所有者,如sa。根据数据库的使用情况,选择启用或者禁用使用全文索引复选框。

在数据库文件列表中包括两行,一行是数据库文件,而另一行是日记文件。通过单击下面的添加、删除按钮添加或删除数据库文件。

切换到选项页、在这里可以设置数据库的排序规则、恢复模式、兼容级别和其他属性。

切换到文件组页,在这里可以添加或删除文件组。

完成以上 *** 作后,单击确定按钮关闭新建数据库对话框。至此“新建的数据”数据库创建成功。新建的数据库可以再对象资源管理器窗口看到。

1 PIR和PSD

PIR国际蛋白质序列数据库(PSD)是由蛋白质信息资源(PIR)、慕尼黑蛋白质序列信息中心(MIPS)和日本国际蛋白质序列数据库(JIPID)共同维护的国际上最大的公共蛋白质序列数据库,可在这里下载。这是一个全面的、经过注释的、非冗余的蛋白质序列数据库,其中包括来自几十个完整基因组的蛋白质序列。所有序列数据都经过整理,超过99%的序列已按蛋白质家族分类,一半以上还按蛋白质超家族进行了分类。PSD的注释中还包括对许多序列、结构、基因组和文献数据库的交叉索引,以及数据库内部条目之间的索引,这些内部索引帮助用户在包括复合物、酶-底物相互作用、活化和调控级联和具有共同特征的条目之间方便的检索。每季度都发行一次完整的数据库,每周可以得到更新部分。

PSD数据库有几个辅助数据库,如基于超家族的非冗余库等。PIR提供三类序列搜索服务:基于文本的交互式检索;标准的序列相似性搜索,包括BLAST、FASTA等;结合序列相似性、注释信息和蛋白质家族信息的高级搜索,包括按注释分类的相似性搜索、结构域搜索GeneFIND等。

2 SWISS-PROT

SWISS-PROT是经过注释的蛋白质序列数据库,由欧洲生物信息学研究所(EBI)维护。数据库由蛋白质序列条目构成,每个条目包含蛋白质序列、引用文献信息、分类学信息、注释等,注释中包括蛋白质的功能、转录后修饰、特殊位点和区域、二级结构、四级结构、与其它序列的相似性、序列残缺与疾病的关系、序列变异体和冲突等信息。SWISS-PROT中尽可能减少了冗余序列,并与其它30多个数据建立了交叉引用,其中包括核酸序列库、蛋白质序列库和蛋白质结构库等。

利用序列提取系统(SRS)可以方便地检索SWISS-PROT和其它EBI的数据库。SWISS-PROT只接受直接测序获得的蛋白质序列,序列提交可以在其Web页面上完成。

3 PROSITE

PROSITE数据库收集了生物学有显著意义的蛋白质位点和序列模式,并能根据这些位点和模式快速和可靠地鉴别一个未知功能的蛋白质序列应该属于哪一个蛋白质家族。有的情况下,某个蛋白质与已知功能蛋白质的整体序列相似性很低,但由于功能的需要保留了与功能密切相关的序列模式,这样就可能通过PROSITE的搜索找到隐含的功能motif,因此是序列分析的有效工具。PROSITE中涉及的序列模式包括酶的催化位点、配体结合位点、与金属离子结合的残基、二硫键的半胱氨酸、与小分子或其它蛋白质结合的区域等;除了序列模式之外,PROSITE还包括由多序列比对构建的profile,能更敏感地发现序列与profile的相似性。PROSITE的主页上提供各种相关检索服务。

4 PDB

蛋白质数据仓库(PDB)是国际上唯一的生物大分子结构数据档案库,由美国Brookhaven国家实验室建立。PDB收集的数据来源于X光晶体衍射和核磁共振(NMR)的数据,经过整理和确认后存档而成。目前PDB数据库的维护由结构生物信息学研究合作组织(RCSB)负责。RCSB的主服务器和世界各地的镜像服务器提供数据库的检索和下载服务,以及关于PDB数据文件格式和其它文档的说明,PDB数据还可以从发行的光盘获得。使用Rasmol等软件可以在计算机上按PDB文件显示生物大分子的三维结构。

5 SCOP

蛋白质结构分类(SCOP)数据库详细描述了已知的蛋白质结构之间的关系。分类基于若干层次:家族,描述相近的进化关系;超家族,描述远源的进化关系;折叠子(fold),描述空间几何结构的关系;折叠类,所有折叠子被归于全α、全β、α/β、α+β和多结构域等几个大类。SCOP还提供一个非冗余的ASTRAIL序列库,这个库通常被用来评估各种序列比对算法。此外,SCOP还提供一个PDB-ISL中介序列库,通过与这个库中序列的两两比对,可以找到与未知结构序列远缘的已知结构序列。

6 COG

蛋白质直系同源簇(COGs)数据库是对细菌、藻类和真核生物的21个完整基因组的编码蛋白,根据系统进化关系分类构建而成。COG库对于预测单个蛋白质的功能和整个新基因组中蛋白质的功能都很有用。利用COGNITOR程序,可以把某个蛋白质与所有COGs中的蛋白质进行比对,并把它归入适当的COG簇。COG库提供了对COG分类数据的检索和查询,基于Web的COGNITOR服务,系统进化模式的查询服务等。

目前,数据库管理系统关系型数据库为主导产品的商品化,技术相对成熟。虽然面向对象的数据库管理系统的先进技术,数据库易于开发,维护,但尚未成熟的产品。国际和国内领先的关系数据库管理系统,甲骨文,Sybase,Informix和INGRES。这些产品支持多种平台,如UNIX,VMS,Windows上,而不是同一级别的支持。和成熟的IBM的DB2关系数据库。但是,DB2是内嵌于IBM的AS/400系列机,只支持OS/400 *** 作系统。

?1MySQL

?MySQL是最受欢迎的开源SQL数据库管理系统,由MySQL AB公司,发布和支持。 MySQL AB是基于MySQL开发一个商业公司,它是利用与开源值相结合的一个成功的商业模式?和方法论的第二代开源公司。 MySQL是MySQL AB的注册商标。

?MySQL是一个快速,多线程,多用户和健壮的SQL数据库服务器。 MySQL服务器支持关键任务,重负载生产系统的使用,它可以嵌入到一个大配置(大规模部署)软件。

?的MySQL与其他数据库管理系统相比,具有以下优点:

?(1)MySQL是一个关系数据库管理系统。

?(2)MySQL是开源。

?(3)MySQL服务器是一个快速,可靠和易于使用的数据库服务器。

?(4)在MySQL服务器的客户机/服务器或嵌入式系统。

?(5)可以使用MySQL软件。

2SQL Server的吗?

?SQL Server是由微软开发的数据库管理系统,是目前最流行的数据库,用于存储在网络上的数据,它已被广泛用于电子商务,银行,保险,电力和其他数据库相关的产业。

?SQL Server 2005的最新版本,它只能在Windows作业系统的稳定运行是非常重要的数据库。并行实施和共存模型并不成熟,这是很难对付越来越多的用户和数据量是有限的,可扩展性。

?SQL Server提供了网络和电子商务功能,如丰富的XML和Internet标准的支持,轻松且安全地通过Web访问的数据的范围很广,有一个强大,灵活和网络,基于安全和应用管理。此外,由于它的易用性和友好的用户界面,通过广大用户的好评,。

?3Oracle

?提出的数据库,该公司首先想到的,通常是甲骨文(Oracle)。该公司成立于1977年,原是一个专门开发的数据库公司。甲骨文一直在数据库领域的领导者。 1984年,第一个关系数据库转移到一台台式电脑。然后,Oracle5率先推出的分布式数据库,客户机/服务器体系结构的新概念。甲骨文公司的第一行锁定模式和对称多处理计算机的支持最新的Oracle对象技术,成为关系 - 对象数据库系统。目前,甲骨文的产品涵盖了几十个型号的大,中,小型机,Oracle数据库已成为世界上使用最广泛的关系数据。

Oracle数据库产品具有以下优良特性。

?(一)兼容性

?Oracle产品使用标准的SQL,和美国国家标准技术局(NIST)测试后。兼容IBM的SQL / DS,DB2中,安格尔的IDMS / R。

?(2)可移植性

??甲骨文的产品,可以广泛的硬件和 *** 作系统平台上运行。可以安装在超过70种大不同,VMS系统的DOS,UNIX上,Windows和其他 *** 作系统,小型机;

?(3)协会

甲骨文与各种通信网络连接,支持各种协议(TCP / IP协议说,DECnet,LU62工作等)。?

?(4)高生产率

?Oracle提供了多种开发工具,可以极大地方便进一步的发展。

?(5)开放

?Oracle的兼容性,可移植性,连接性和高生产力的Oracle RDBMS具有良好的开放性。

?4Sybase

?马克B Hiffman和罗伯特·爱泼斯坦,1984年,创建了Sybase公司,并于1987年推出了Sybase数据库产品。 SYBASE主要有三种版本:一是UNIX *** 作系统版本下运行的Novell Netware环境下运行的版本; Windows NT环境下运行的版本。 UNIX *** 作系统,目前应用最广泛使用的SCO UNIX SYBASE 10 SYABSE- 11。

??的Sybase数据库的特点:

?(1)它是基于客户机/服务器体系结构的数据库。

?(2)它是真正开放的数据库。

?(3)它是一种高性能的数据库。

?5DB2

?DB2是内嵌在IBM的AS/400系统的数据库管理系统,直接从硬件支持。它支持标准的SQL语言,异构数据库连接的网关。因此,它具有速度快,可靠性好等优点。但是,只有硬件平台选择了IBM的AS/400,可以选择使用DB2数据库管理系统。

?DB2可以运行在所有主要平台(包括Windows),最适于海量数据。

?DB2是使用最广泛的企业级,而国内约5%,在1997年,在世界最大的500家企业,近85%的DB2数据库服务器。

?此外,微软的Access数据库,FoxPro数据库。现在有这么多的数据库系统,在游戏中进行编程,应该选择什么样的数据库?首要的原则,根据实际需要,另一方面,考虑游戏开发预算。现在常用的数据库:SQL Server中,我的SQL,甲骨文,FoxPro的。 MySQL是一个免费的数据库系统,其功能与一个标准的数据库功能,因此,建议使用独立制片人。甲骨文虽然功能强大,但它是用于商业用途,是目前在比赛中很少使用。

欧洲生物信息研究所简称:EMBL-EBI

一、详细介绍

欧洲生物信息研究所(EMBL-EBI)全称EMBL - European Bioinformatics Institute,是一个非盈利性的学术机构,致力于以信息学手段解答生命科学问题。

该所建立于1994年,位于英国剑桥南部的维康信托基因园,是欧洲分子生物学实验室(EMBL,全称EuropeanMolecular Biology Laboratory)的一部分。

欧洲生物信息研究所为科学界提供免费生物信息资源、促进基础研究、提供培训和传播行业尖端技术。

欧洲生物信息研究所管理和维护着多个大型生物信息公共数据库, 跨基因组学,蛋白质组学,化学信息学,转录组学,系统生物学等,同时创建了多种工具供让研究人员分析和分享信息。

欧洲生物信息研究所提供最优质的研究环境、无数跨学科的合作机会以及遍及世界各地的培训课程。欧洲生物信息研究所拥有超过20年生物信息学研究和服务经验,是全球收集和传播生物数据、提供免费生物信息服务的欧洲节点。

该所管理维护着世界最全面的分子生物数据库,其中很多是生物学家熟悉的数据库,例如ENA(核酸序列数据库),Ensembl(基 因组),ArrayExpress(基因表达数据),UniProtKB蛋白质序列。

ENA由原EMBL-Bank核酸序列数据库基础上发展起来,是欧洲最重要的核酸序列资源,与美国NCBI的GenBank和日本的DDBJ组成国际核酸序列数据库合作联盟(INSDC)。

这三大数据库各自收录了世界上所报道的所有序列数据的一部分,并且每天实时更新交换各自的序列信息。

一般来说所用的分析工具有在线跟下载的 下面简要列举一些常用在线软件的使用 1、使用VecScreen工具,分析下列未知序列,输出序列长度、载体序列的区域、可能使用的克隆载体都有哪些。一、步骤:

打开google 首页,搜索VecScreen,进入VecScreen首页,复制序列,运行,View report。

二、结果:

输出序列长度918bp,

载体序列的区域456bp——854bp

克隆载体:M13mp18 phage,pGEM-13Zf(+),pBR322,pRKW2。

2、使用相应工具,分析下列未知序列的重复序列情况,输出重复序列的区域、包含的所有重复序列的类型、重复序列的总长度及Masked Sequence。

一、步骤:

进入google首页,进入ICBI主页,对序列进行BLAST。得出序列是human的。

进入google首页,搜索RepeatMasker,进入RepeatMasker主页,进入RepeatMasking,复制序列,DNA source选择human,运行!点击超链接,在结果中选择

Annotation File :RM2sequpload_1287631711outhtml

3、使用CpGPlot/CpGReport/Isochore工具,分析下列未知序列,输出CpG岛的长度、区域、GC数量、所占的百分比及Obs/Exp值。一、步骤:

进入google首页,搜索CpGPlot,进入CpGPlot主页,program中选择cpgreport复制序列,运行!

二、结果:

CpG岛的长度:385bp

区域:48——432;

GC数量:Sum C+G=297,百分数=7714

Obs/Exp:101

4、预测下面序列的启动子,输出可能的启动子序列及相应的位置。一、步骤:

进入google首页,进入ICBI主页,对序列进行BLAST。得出序列是human的

进入google首页,搜索Neural Network Promoter Prediction,进入主页,复制序列,选择eukaryote,运行!

二、结果:

位置:711—761 ,1388—1438,1755—1805;

5、运用Splice Site Prediction工具分析下面序列,分别输出内含子-外显子剪接位点给体和受体的区域及剪接处位置的碱基。一、步骤:

进入google首页,进入ICBI主页,对序列进行BLAST。得出序列是human的

进入google首页,搜索Splice Site Prediction,进入主页,复制序列。Organism选择Human or other。其他默认,运行!

二、结果:

供体:

受体:

6、对下面序列进行六框翻译,利用GENESCAN综合分析(首先确定给定序列的物种来源)哪个ORF是正确的,输出六框翻译(抓图)和GENESCAN结果(包括predicted genes/exons 和 predicted peptide sequence(s) 两个部分)。一、步骤:

进入google首页,进入ICBI主页,对序列进行BLAST。得出序列是Zea的

进入google首页;搜索NCBI,进入主页,选择all resources(A~Z),选择O,选择ORF finder。复制序列,默认,运行!

二、结果:ORF图

三、步骤:进入google首页,搜索GENESCAN,进入主页,Organism:Maize, ,其他默认,运行!

四、结果:

G7、进入REBASE限制性内切酶数据库,输出AluI、MboI、EcoI三种内酶的Recognition Sequence和Type。

一、步骤:进入google首页,google in English,搜索REBASE,进入主页, 分别输入AluI、MboI、EcoI,运行!

在MboI中选择第一个,EcoI选择第二个。

二、结果:

ENSCAN图

8、使用引物设计工具,针对下列未知序列设计一对引物,要求引物长度为20-25bp,扩增产物长度300-500bp,退火温度为50-60℃。请写出选择的一对引物(Forward Primer and Reverse Primer)、及相应的GC含量、引物的位点、Tm值和产物长度。一、步骤:进入google首页,搜索genefisher,进入主页,复制fasta格式,chechk input, sunmit, ; ;设置一下引物长度为20-25bp,扩增产物长度300-500bp,退火温度为50-60℃; 。

二、结果:

GC含量:

引物的位点:

Tm值:

产物长度:。

9、将下面的序列用NEBcutter 20工具分析,用产生平末端及有四个酶切位点的酶进行酶切,并用抓图提交胶图(view gel),要求14% agarose和Marker为100bp DNA Ladder。

一、步骤:

进入google首页,进入ICBI主页,对序列进行BLAST,得知是linear。

进入google首页,搜索NEBcutter 20,进入主页,选择linear,运行!选择custom digest, ,把“1”改为“4”,选择平末端,后digest。View gel。选择14% agarose和Marker为100bp。

二、结果:

然后就是蛋白质的了一般都在expasy里swiss-prot 适用于检索的 compute pi/mw 求理论分子量 分子量 protparam物理化学性质 protscale亲水性疏水性 peptidemass分析蛋白酶和化学试剂处理后的内切产物

NCBI((>

以上就是关于和NCBI的refseq对应的数据库在EMBL中叫做什么如何查询全部的内容,包括:和NCBI的refseq对应的数据库在EMBL中叫做什么如何查询、常用的查询蛋白质结构以及序列的数据库主要有哪些、什么是常用的三个数据库等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/sjk/9484586.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-04-28
下一篇2023-04-28

发表评论

登录后才能评论

评论列表(0条)

    保存