string数据库蛋白质信息点不开_工具

解决方法如下：

1，首先，打开string数据库的页面，选择“Multipleproteins”。

2，在第一个框中，粘贴蛋白英文名，呈现出每行一个蛋白的格式，或者点击“Browse”选择包含蛋白名称的excel表格进行上传。

3，粘贴或者上传完毕后，选择“Organism”即输入蛋白的所属物种，可以是人类，大鼠，小鼠等，如果包含多种蛋白，也可以选择“auto-detect”，点击“search”即可。

4，页面会跳转出你输入的蛋白名称以及相匹配的多个蛋白条目，勾选匹配正确的蛋白质，匹配错误的，舍弃即可，继续点击“continue”即可。

5，最终的呈现图案，可以通过下面多个条目进行更改，若要下载，选择“exports”，并选择400bpi高分辨率的条目即可。

一级。

一级蛋白质数据库：存储的是通过各种科学手段得到的最直接的基础数据。如X射线衍射法获得的蛋白质三级结构等。MMDB就属于其中。

英语缩略词“MMDB”经常作为“MassMemoryDataBase”的缩写来使用，中文表示：“大容量存储器数据库”。

Genbank库包含了所有已知的核酸序列和蛋白质序列，以及与它们相关的文献著作和生物学注释。它是由美国国立生物技术信息中心(NCBI)建立和维护的。它的数据直接来源于测序工作者提交的序列；由测序中心提交的大量EST序列和其它测序数据；以及与其它数据机构协作交换数据而来。Genbank每天都会与欧洲分子生物学实验室(EMBL)的数据库，和日本的DNA数据库(DDBJ)交换数据，使这三个数据库的数据同步。到1999年8月，Genbank中收集的序列数量达到460万条，34亿个碱基，而且数据增长的速度还在不断加快。Genbank的数据可以从NCBI的FTP服务器上免费下载完整的库，或下载积累的新数据。

NCBI还提供广泛的数据查询、序列相似性搜索以及其它分析服务，用户可以从NCBI的主页上找到这些服务。

大型数据库分成若干子库，有许多好处。首先，可以把数据库查询限定在某一特定部分，以便加快查询速度。其次，基因组计划快速测序得到的大量序列尚未加以注释，将它们单独分类，有利于数据库查询和搜索时“有的放矢”。GenBank将这些数据按高通量基因组序列(High Throughput Genomic Sequences，HTG)、表达序列标记(Expressed Sequence Tags，EST)、序列标记位点(Sequence Tagged Sites，STS)和基因组概览序列(Genome Survey Sequences，GSS)单独分类。尽管这些数据尚未加以注释，它们依然是GenBank的重要组成部分。

可通过Entrez数据库查询系统对GenBank进行查询。这个系统将核酸、蛋白质序列和基因图谱、蛋白质结构数据库整合在一起。此外，通过该系统的文献摘要数据库MEDLINE，可获取有关序列的进一步信息。在万维网上，进入NCBI的主页，可以用BLAST程序对GenBank数据库进行未知序列的同源性搜索(详见第六章)。

完整的GenBank数据库包括序列文件，索引文件以及其它有关文件。索引文件是根据数据库中作者、参考文献等子段建立的，用于数据库查询。GenPept是由GenBank中的核酸序列翻译而得到的蛋白质序列数据库，其数据格式为FastA。GenBank曾以CD-ROM光盘的形式分发，价格比较便宜。随着数据库容量的增长，一套最新版的GenBank需要12张光盘存放，不仅生产成本很高，也不便于使用。现在，光盘分发的方式已经停止，可以通过网络下载GenBank数据库。

GenBank中最常用的是序列文件。序列文件的基本单位是序列条目，包括核甘酸碱基排列顺序和注释两部分。目前，许多生物信息资源中心通过计算机网络提供该数据库文件。下面，我们介绍序列文件的结构。

序列文件由单个的序列条目组成。序列条目由字段组成，每个字段由关键字起始，后面为该字段的具体说明。有些字段又分若干次子字段，以次关键字或特性表说明符开始。每个序列条目以双斜杠“//”作结束标记。序列条目的格式非常重要，关键字从第一列开始，次关键字从第三列开始，特性表说明符从第五列开始。每个字段可以占一行，也可以占若干行。若一行中写不下时，继续行以空格开始。

序列条目的关键字包括代码(LOCUS)，说明(DEFINITION)，编号(ACCESSION)，核酸标识符(NID)，关键词(KEYWORDS)，数据来源(SOURCE)，文献(REFERENCE)，特性表(FEATURES)，碱基组成(BASE COUNT)及碱基排列顺序(ORIGIN)。

代码LOCUS是该序列条目的标记，或者说标识符，蕴涵这个序列的功能。例如，图41中所示的HUMCYCLOX表示人的环氧化酶cyclooxygenase。该字段还包括其它相关内容，如序列长度、类型、种属来源以及录入日期等。说明字段是有关这一序列的简单描述，如本例为人环氧化酶-2的mRNA全序列。

序列代码具有唯一性和永久性，如本例中代码M90100用来表示上述人环氧化酶-2的mRNA序列，在文献中引用这个序列时，应该以此代码为准。核酸标识符NID对序列信息的当前版本提供？

关键词字段由该序列的提交者提供，包括该序列的基因产物以及其它相关信息，如本例中还氧化酶-2 (cyclooxygenase-2)，前列腺素合成酶(prostaglandin synthase)。数据来源字段说明该序列是从什么生物体、什么组织得到的，如本例中人脐带血管(umbilical vein)。次关键字种属(ORGANISM)指出该生物体的分类学地位，如本例人、真核生物等等。文献字段说明该序列中的相关文献，包括作者(AUTHORS)，题目(TITLE)及杂志名(JOURNAL)等，以次关键词列出。该字段中还列出医学文献摘要数据库MEDLINE的代码。该代码实际上是个网络链接指针，点击它可以直接调用上述文献摘要。一个序列可以有多篇文献，以不同序号表示，并给出该序列中的哪一部分与文献有关。

FEATURES是具有自己的一套结构，用来详细描述序列特性的一个表格。在这个表格内，带有‘/db-xref/’标志的字符可以连接到其它数据库内(本例，您看到的是一个分类数据库(taxon 9606)，以及一个蛋白质数据库(PID：g181254))；序列中各部分的位置都加以标明，5’非编码区(1-97)，编码区(98-1912)，3非编码区(1913-3387)，多聚腺苷酸序列(3367-3374)，等等；蛋白质翻译的信号肽及最终的多肽也都有所说明。这个例子不能说很全面，但已经足以说明特性表给出信息的详细程度。

接下来是BASE COUNT记录，计算出不同碱基在整个序列中出现的次数(1010A，712个C，633个G，1032个T)。ORIGIN那一行，指出了序列第一个碱基在基因组中可能的位置。最后，核酸的序列全部列出，并以//作为结尾。

以上就是关于string数据库蛋白质信息点不开全部的内容，包括:string数据库蛋白质信息点不开、MMDB数据库是几级蛋白质数据库、怎么从genbank下载物种信息并打开等相关内容解答，如果想了解更多相关内容，可以关注我们，你们的支持是我们更新的动力！

欢迎分享，转载请注明来源：内存溢出

原文地址:https://54852.com/sjk/9465381.html

string数据库蛋白质信息点不开

发表评论

评论列表（0条）