人体基因组的大小约为30亿个碱基对,即3000Mbp。
基因组大小通常以核苷酸碱基对的数量表示,单位为百万计,写成Mb或Mbp。
人类基因组由23对染色体(共46个)所构成,每一个染色体皆含有数百个基因。
1号到22号染色体编号顺序,大致符合他们由大到小的尺寸排列,23号为决定性别的性染色体。最大的染色体约含有2亿5千万个碱基对,最小的则约有3800万个碱基对。总共约30亿个碱基对,即3000Mbp。
扩展资料:
人体基因组碱基对数据计算历史:
1964年,来自德国海德堡大学的Friedrich Vogel,孤身一人进行了历史上对于人类基因组数目的第一次计算。
Vogel计算的第一个基石源于此前对于人类染色体重量的测量。Mirsky and Ris通过实验得出人类单倍体的染色体大小为2.72 × 10−12 g。综合其他实验结果,为简明,Vogel选择了3 x 10-12g作为人类单倍体基因组的重量。
已知一对核苷酸的质量为1.026 x 10-21g(GC对和AT对相差甚微),据此Vogel估算人类基因组的大小为30亿个碱基对——这一估算与今天的测序结果惊人接近。
参考资料来源:百度百科-基因组大小
参考资料来源:百度百科-人类基因组
1、分析得知:全部人类基因组约有2.91Gbp,约有39000多个基因;平均的基因大小有27kbp;其中G+C含量偏低,仅占38%,而2号染色体中G+C的含量最多;到目前仍有9%的碱基对序列未被确定,19号染色体是含基因最丰富的染色体,而13号染色体含基因量最少等等(具体信息可参见cmbi 特别报道:生命科学的重大进展)。2、目前已经发现和定位了26000多个功能基因,其中尚有42%的基因尚不知道功能,在已知基因中酶占10.28%,核酸酶占7.5%,信号传导占12.2%,转录因子占6.0%,信号分子占1.2%,受体分子占5.3%,选择性调节分子占3.2%,等。发现并了解这些功能基因的作用对于基因功能和新药的筛选都具有重要的意义。
3、基因数量少得惊人:一些研究人员曾经预测人类约有14万个基因,但Celera公司将人类基因总数定在2.6383万到3.9114万个之间,不超过40,000,只是线虫或果蝇基因数量的两倍,人有而鼠没有的基因只有300个。如此少的基因数目,而能产生如此复杂的功能,说明基因组的大小和基因的数量在生命进化上可能不具有特别重大的意义,也说明人类的基因较其他生物体更'有效',人类某些基因的功能和控制蛋白质产生的能力与其他生物的不同。这将对我们目前的许多观念产生重大的挑战,它为后基因组时代中生物医学的发展提供新的非凡的机遇。但由于基因剪切,EST数据库的重复以及一些技术和方法上的误差,将来亦可能人类的基因数会多于4万。
4、人类单核苷酸多态性的比例约为1/1250bp,不同人群仅有140万个核苷酸差异,人与人之间99.99%的基因密码是相同的。并且发现,来自不同人种的人比来自同一人种的人在基因上更为相似。在整个基因组序列中,人与人之间的变异仅为万分之一,从而说明人类不同“种属”之间并没有本质上的区别。
5、人类基因组中存在"热点"和大片"荒漠"。 在染色体上有基因成簇密集分布的区域,也有大片的区域只有“无用DNA” ——不包含或含有极少基因的成分。基因组上大约有1/4的区域没有基因的片段。在所有的DNA中,只有1%-1.5%DNA能编码蛋白,在人类基因组中98%以上序列都是所谓的“无用DNA”,分布着300多万个长片断重复序列。这些重复的“无用”序列,决不是无用的,它一定蕴含着人类基因的新功能和奥秘,包含着人类演化和差异的信息。经典分子生物学认为一个基因只能表达一种蛋白质,而人体中存在着非常复杂繁多的蛋白质,提示一个基因可以编码多种蛋白质,蛋白质比基因具有更为重要的意义
6、男性的基因突变率是女性的两倍,而且大部分人类遗传疾病是在Y染色体上进行的。所以,可能男性在人类的遗传中起着更重要的作用。
7、人类基因组中大约有200多个基因是来自于插入人类祖先基因组的细菌基因。这种插入基因在无脊椎动物是很罕见的,说明是在人类进化晚期才插入我们基因组的。可能是在我们人类的免疫防御系统建立起来前,寄生于机体中的细菌在共生过程中发生了与人类基因组的基因交换。
8、发现了大约一百四十万个单核苷酸多态性,并进行了精确的定位,初步确定了30多种致病基因。随着进一步分析,我们不仅可以确定遗传病、肿瘤、心血管病、糖尿病等危害人类生命健康最严重疾病的致病基因,寻找出个体化的防治药物和方法,同时对进一步了解人类的进化产生重大的作用。
9、人类基因组编码的全套蛋白质(蛋白质组)比无脊椎动物编码的蛋白质组更复杂。人类和其他脊椎动物重排了已有蛋白质的结构域,形成了新的结构。也就是说人类的进化和特征不仅靠产生全新的蛋白质,更重要的是要靠重排和扩展已有的蛋白质,以实现蛋白质种类和功能的多样性。有人推测一个基因平均可以编码2-10种蛋白质,以适应人类复杂的功能。
3G个序列,每个序列需要两位二进制数表示,所以总共6Gb,由位与字的换算相差8,总共算下来大约750MB。也就是只需要一张光盘,就可以记录一个人的生命所有遗传信息。还有,男人比女人要长一点,准确数值是男人734MB,女人720MB。
欢迎分享,转载请注明来源:优选云