footprintDB是一个转录因子综合数据库,收录了8754个去冗余的转录因子,整合了JASPAR在内的9个数据库的9350个转录因子、13682个DNA motifs和35058个DNA结合位点数据,存储了transcription factors, DNA motifs, DNA binding sites3种信息。通过这个数据库,我们能够预测结合特定DNA位点或基序的转录因子,以及可能被特定DNA结合蛋白识别的DNA基序或位点。
footprintDB
http://floresta.eead.csic.es/footprintdb/index.php
接下来看看怎么利用footprintDB的Menu-Search模块找到特定DNA位点或基序的转录因,或者可能被特定DNA结合蛋白识别的DNA基序或位点吧。
Search模块分为两种形式,一种是Keywords,另一种是sequences 。
01 Search Keywords
Keywords模块提供关键词类型有转录因子、DNA结合基序、DNA结合位点,其中DNA binding motifs/sites碱基序列官方建议使用Sequence检索方式。除此外,提供物种、数据库、Pfam区域的选择。
本次以骨髓细胞瘤myeloblastosis oncogene等条件选择如下为例:
返回结果如下:
检索到关于myeloblastosis oncogene的2个Transcription factors条目,4个DNA binding motifs条目和0个DNA binding sites条目。
点击Transcription Factors查看,详细信息如下:、展现的是Accessions、Names、Organisms、Description and notes、Binding MotifsBinding Sites(结合基序结合位点)。
点击Transcription factors结果下Show results,以上这些表格都是可以下载的。DNABinding sites代表该转录因子实际的结合区域,DNA binding sites代表该转录因子实际的结合区域。转录因子的本质是与DNA特异性结合的一系列蛋白质。它一般有不同的功能区域,如DNA结合结构域与效应结构域。
Accessions这一栏蓝色字体跳转对应的是转录因子的概况DNA Binding Motif,包含了motif的编号,转录因子名称、对应的物种,一致性序列,sequence logo, PSSM矩阵,binding sites 、功能描述、家族和序列等基本信息。
如果点击Binding Sites,会跳转进入DNA binding Sites,里面有关于转录因子的实际结合区域,提供物种、数据库、参考文献、碱基序列和转录因子等详细信息。
02 Search by Sequence
sequences 模块主要用于接收两种类型的查询:①DNA共有基序,PWM或位点。这部分通常返回的结果主要是:预计结合相似的DNA基序的TF列表-INPUT。②假定的TF蛋白的蛋白序列。返回的结果是可能识别的DNA基序列表。
数据库检索结果以邮件的形式发送,可以先命名检索结果,记得填入有效邮件地址就行。
示例使用我们选择检索框Demo,下拉菜单展示输入的内容可以是DNA binding motifs碱基序列FASTA格式和TANSFAC文件格式,以及蛋白序列FASTA格式。实际中别忘了选择物种、数据库以及DNA结合区域。点击Search等待结果:
返回结果提供与输入碱基序列相似的序列对应的转录因子信息,提供差异性指标和相似性评分。
footprinDB这种整合型的数据库,可以减少我们在多个数据库之间交叉检索的操作,更加简单,值得收藏。
Research:
Sebastian A, Contreras-Moreira B. footprintDB: a database of transcription factors with annotated cis elements and binding interfaces. Bioinformatics 30, 258–65 (2014).
展开阅读全文
欢迎分享,转载请注明来源:优选云