基因的编码区(英语:Coding region),亦称为“编码序列”(Coding sequence)或“CDS”(Coding DNA Sequence),是指DNA或RNA中由外显子组成,编码蛋白质的部分。
该区域的边界范围从靠近5′末端的起始密码子开始,到靠近3′末端的终止密码子为止。mRNA的编码区范围位于5′非翻译区和部分同样为外显子的3′非翻译区之间。
某个生物体的编码区是指该生物由基因编码区组成的基因组的总和。
编码区是细胞DNA的一部分,基因分为:编码区,非编码区。编码区是指能够转录信使RNA的部分,它能够合成相应的蛋白质,而非编码区是不能够转录信使RNA的DNA结构。但是它能够调控遗传信息的表达。
真核生物的DNA中的基因是由编码区和非编码区组成的,其中编码区是由外显子和内含子组成的,但是其中内含子又是非编码序列,所以说真核细胞基因结构中,非编码区和内含子是非编码序列 。
外显子属于编码区。含有外显子的基因能转录出前体RNA,再由内含子转录出来的部分进行自我切割,才得到成熟的mRNA,没有内含子也就没有自我切割。
原核细胞只有编码区和非编码区,没有内含子和外显子之分。真核生物才有内含子和外显子。
扩展资料:
编码序列注释
虽然识别DNA序列内的开放阅读框简单明了,但识别编码序列却并非如此,因为细胞只会把所有开放阅读框的一部分翻译为蛋白质目前CDS预测通过对细胞mRNA取样测序完成,但要判断给定mRNA究竟哪一部分实际翻译为了蛋白质,目前仍是问题。
CDS预测属于基因预测的一部分,后者不仅包括对编码蛋白质的DNA序列预测,也包括对其它功能元件,如RNA基因和调节序列的预测。
参考资料:百度百科-编码区
CDS是编码序列(Coding sequence)的缩写。DNA转录成mRNA,mRNA经剪接等加工后翻译出蛋白质,所谓CDS就是与蛋白质序列一 一对应的DNA序列,且该序列中间不含其它非该蛋白质对应的序列,不考虑mRNA加工等过程中的序列变化,总之,就是与蛋白质的密码子完全对应。CDS是编码一段蛋白产物的序列,是结构基因组学术语。开放阅读框ORF是基因序列的一部分,包含一段可以编码蛋白的碱基序列,不能被终止密码子打断。当一个新基因被识别,其DNA序列被解读,人们仍旧无法搞清相应的蛋白序列是什么。欢迎分享,转载请注明来源:优选云