一代测序是上世纪70年代由Sanger和Coulson开创的DNA双脱氧链终止法测序,也称为Sanger测序。在1977年完成第一个基因组序列(噬菌体X174),全长共计5375个碱基。2001年完成的首个人类基因组图谱就是以改进了的Sanger法为其测序基础。
Sanger测序原理: 在4个DNA合成反应体系(含dNTP)中分别加入一定比例带有标记的ddNTP(分为:ddATP、ddCTP、ddGTP和ddTTP),通过凝胶电泳和放射自显影后可以根据电泳带的位置确定待测分子的DNA序列。由于ddNTP的2’和3’都不含羟基,其在DNA的合成过程中不能形成磷酸二酯键,因此可以用来中断DNA合成反应。
一代测序虽然准确度十分高,且该技术在当下依然被广泛应用(比如构建载体做克隆,基因敲除等实验都可以用到),但是通量太低,所以对于大片段或者全外显子等非常耗时,且很多情况下成本较高。
二代测序技术,又称为Next Generation Sequencing(NGS)技术,是为了改进一代测序通量过低的问题而出现的,能够同时对上百万甚至数十亿个DNA分子进行测序,实现了大规模、高通量测序的目标。刚面世时主要包括Roche公司的454技术、ABI公司的Solid技术和Illumina公司的Solexa技术。这三种技术都极大的提高了测序的通量,大大降低了测序成本和周期。
其中Illumina公司凭借超低的测序成本和可以接受的读长,成为了目前最主流的二代测序公司,其测序成本近五年来从几千元1G(1G即10亿碱基)降到了到今天的40多块钱1G数据量,这个过程中基因组 De novo 测序、转录组测序、小RNA测序、LncRNA测序、circRNA测序、DNA甲基化测序、高密度遗传图谱、大规模GWAS关联分析等等实验手段得到了广泛的推广应用。近年来,NGS技术发展迅速,其应用已进展至临床检测,如无创产前、遗传性疾病,肿瘤(实体/血液)等。
Illumina 原理: 桥式PCR+4色荧光可逆终止+激光扫描成像。
主要步骤:
1、DNA文库制备——超声打断加接头;
2、Flowcell——吸附流动DNA片段;
3、桥式PCR扩增与变性——放大信号;
4、测序——测序碱基转化为光学信号。
二代测序技术虽然通量很高,成本低廉,但是读长实在太短,主流的Illumina测序仪,常规模式只能测PE150的长度,靠着软件算法上的进步才得以可用。由此三代测序走上了历史舞台。
三代测序主要有两种技术:PacBio公司的SMRT和Oxford Nanopore Technologies的纳米孔单分子测序技术,这两种技术的测序读长都可以达到几十kb的级别,远远高于二代测序技术。与前两代相比,他们最大的特点就是单分子测序,测序过程无需进行PCR扩增。实现了对每一条DNA分子的单独测序。单分子测序可以更准确地检测串联重复扩增等。这对于无参物种的分子生物学研究大有帮助,长读长对于基因组拼接、全长基因序列的获取提供了巨大的便利。
Pacific Biosciences公司研发的单分子实时测序系统(Single Molecule Real Time,SMRT)应用了边合成边测序的原理,并以SMRT芯片为测序载体。基本原理如下:
1、聚合酶捕获文库DNA序列,锚定在零模波导孔底部;
2、4种不同荧光标记的dNTP随机进入零模波导孔底部;
3、荧光dNTP被激光照射,发出荧光,检测荧光;
4、荧光dNTP与DNA模板的碱基匹配,在酶的作用下合成一个碱基;
5、统计荧光信号存在时间长短,区分匹配碱基与游离碱基,获得DNA序列;
6、酶反应过程中,一方面使链延伸,另一方面使dNTP上的荧光基团脱落;
7、聚合反应持续进行,测序同时持续进行。
但是三代仍然不是完美的技术,其测序错误率相对于一代和二代还是高了很多,另外通量还是远低于二代测序,导致成本也是数倍于二代测序。
胡润 | 文案
DNA(脱氧核糖核酸)是核酸的一类,因分子中含有脱氧核糖而得名。DNA分子极为庞大(分子量一般至少在百万以上),主要组成成分是腺嘌呤脱氧核苷酸、鸟嘌呤脱氧核苷酸、胞嘧啶脱氧核苷酸和胸腺嘧啶脱氧核苷酸。DNA存在于细胞核、线粒体、叶绿体中,也可以以游离状态存在于某些细胞的细胞质中。大多数已知噬菌体、部分动物病毒和少数植物病毒中也含有DNA。
除了RNA(核糖核酸)和噬菌体外,DNA是所有生物的遗传物质基础。生物体亲子之间的相似性和继承性即所谓遗传信息,都贮存在DNA分子中。1953年,詹姆斯·沃森和弗朗西斯·克里克描述了DNA的结构:由一对多核苷酸链相互盘绕组成双螺旋。他们因此与伦敦国家工学院的物理学家弗雷德里克·威尔金斯共享了1962年的诺贝尔生理学或医学奖。
这是生物长期进化的结果。所有已知的DNA聚合酶只能使新合成的DNA子链从5′→3′方向延伸,这种方向性是其在生物进化中保留的、深刻的、选择与适应性特征,有着深刻的化学及生物学功能的根源。首先,DNA复制过程中,DNA双链解螺旋后,每一条链上所暴露出来的碱基各自与一个游离于核中的三磷酸脱氧核糖核苷酸(dTTP、dGTP、dATP、dGTP)按碱基配对原则配对。之所以参与反应的是三磷酸脱氧核苷酸(dNTP),是因为DNA的聚合反应需要能量,在DNA聚合酶的催化下,dNTP分解2个磷酸基团,放出能量用于核苷酸顺序连接而成为新链。其次,DNA聚合酶只能将游离的核苷酸加到新链的3′端(即-OH)。再次,我们可以利用反证法来说明“为什么DNA聚合酶的延伸方向都是5′→3′,而不是3′→5′”。假设链的延伸方向为3′→5′,基于能量的需要,其多核苷酸链的5′端必须带有三磷酸基团(p~p~p),才能与游离的dNTP起反应,而dNTP也有p~p~p,由于磷酸基团之间强的电负性,使dNTP难以聚合到DNA的5′端,这就需要切除DNA5′端的2个磷酸基因以消除这种影响。而这样又难于为进一步的聚合提供所需的能量,为使聚合反应得以继续,5′端必须重新活化,需要额外的能量供应以及别的酶参与反应,才能与下一个dNTP的3′-OH生成磷酸二酯键。这样既费时又耗能,从生物进化与适应角度来讲是不利的。通过进化,DNA复制总是在5′→3′方向添加新核苷酸解决该问题。DNA复制过程中,滞后链的半不连续复制过程虽然复杂,但它节省能量,且有利于错配核苷酸的校正。因此,DNA复制方向只能是由5′到3′端的方向欢迎分享,转载请注明来源:优选云