AMD龙系列CPU的今生前世

AMD龙系列CPU的今生前世,第1张

公元2017年3月2日,AMD 锐龙 CPU 解禁,它的诞生似乎注定了无法平凡,仿佛于宁静的湖水中投下一枚炸d,它无疑重新激起了 DIY 玩家们多年无处发泄的热情,期待的声音在小小的蓝色星球掀起涛涛巨浪。

纵然身处其中,我们似乎并不能确定它将对今后半导体格局的影响如何,又会有着怎样的历史意义。无论如何,我们都将见证历史,当 AMD 用 Ryzen 撬开 Intel 那紧紧捂住的口袋时,似乎这一市场再次重归了活力。

在感谢 AMD 把锐龙带到我们世界的同时,且不如随我们跟着历史的车轮回到过去。一起回顾这条乱世魔”龙“的前世今生。

时间回到上个世纪60年代末,被现在人们赞誉为硅谷摇篮的仙童半导体因母公司的管理不善,导致了大量的人才流失,而由此催生了三家对后来半导体发展举足轻重的公司:国家半导体、英特尔、与超微半导体(AMD)。此时 AMD 的八位联合创始人也许还不知道,他们即将面对的,是足足半个世纪的博弈与成长,而我们的主角-”龙“系列芯片,也将在经历了足足30年的技术资本积累后,于1999年,第一次问世。

现在,让我们以热烈的掌声,欢迎第一代速龙登上历史舞台!

作为第一款使用 Slot A 接口的 CPU,速龙的诞生具有着无比重要的意义, 此前的 K5、K6、K6-2 系列处理器都是使用与英特相同的 Socket 7 接口,而从这一代开始,K7 系列将正式与英特尔”分家“,落户在 AMD-750 芯片组的主板上。这一举措,无疑使得两家半导体公司竞争白热化,而消费者也被迫作出抉择。

在当时,K7 的性能尤其是浮点运算能力方面独树一帜,因而受到了不少 DIY 玩家的追捧,因其相对较宽松的倍频锁定限制,更是受到了不少超频爱好者的欢迎,没经历过那个时代的玩家,请回顾一下安卓手机 CPU 最初的发展史,是否也有那么一丝共鸣呢?无论在哪个时代,发烧友们对计算性能的极致追求都催促着半导体行业的快速发展。

让我们再回顾一下当时的K7,核心代号”Argon“,250 nm 制程,单核心,主频 500~700 Mhz,激进的频率调节策略使得它具备了在当时优秀的超频性能,同时制程的限制也使得超频时机器变成一个温度极高的”火炉“,甚至有烧毁 CPU 的风险,也导致了部分消费者对其稳定性产生了忧虑。

无疑 AMD 也注意到了这点,得益于硅谷最强预言家摩尔的“摩尔定律”的帮助(这大概是局座之前最早被人们所熟知的大规模杀伤性因果律武器),在 Argon 发布五个月后,速龙家族的第二代成员,Pluto 问世,Pluto 的制程由 250nm 升级至了 180nm,制程的升级,使得发热与功耗降低,默频得以提升至 550~850Mhz。

时隔4个月,Pluto 的兄弟核心代号 Orion 也呱呱坠地,采用了与哥哥相同的制程。青出于蓝而胜于蓝,Orion 的基础频率再次提升至 900~1 GHz,成为了当时速度最快的处理器,同时也 Orion 在2000年的节点,正式宣布处理器进入 GHz 纪元。

在同年,AMD 还发布了核心代号雷鸟(Thunderbird)的新成员,此后基于雷鸟,又发展出了一系列子核心。值得一提的是,为了与英特尔抢占低端市场,AMD 用亚当(雷鸟)的肋骨制造出了夏娃(钻龙),关于名称,玩家们更愿意使用Duron的音译称其为”毒龙“,这大概是”龙“系列家族中最小的一位成员。二级缓存也爆缩至64KB。而即由此完成完整的市场布局,令老对手英特尔不敢轻易懈怠。

此后,AMD本着速龙一贯的家训,陆续推出了支持多核运算的 Athlon MP、针对移动端的 Althlon4、基于雷鸟核心改造而来的 Athlon XP,至此,速龙家族日益强盛。直到公元2004年,”龙“系家族的”毒龙“退位让贤,”闪龙“作为”毒龙“系列的代替者,接下了低端市场这口锅。继续将”龙“家族带入更多的家庭。

尽管从2000年开始是 AMD 在民用领域快速发展的时期,“龙”系列芯片在这段时期快速发展了相当多的衍生型号,并且速龙一度成为当时速度最快的处理器,但事实上,因特尔在2001年8月推出的2.0GHz版 Pentium 4 再次击败速龙雷鸟,夺得当时最快 X86 处理器的宝座,而此前,因特尔已经连续16年在 X86 性能上保持了领先,回顾 AMD 的历史,似乎其总是笼罩在因特尔的阴影之下,于逆境之中成长。

但是,好戏才刚刚开始。

公元2003年4月22日,面向服务器市场的全新“龙”族——皓龙(Opteron)问世,其采用全新K8微处理器架构,加入 AMD64 指令集,是 AMD 第一款支持64位应用的处理器,支持多路主板。

同年9月23日,基于与皓龙同架构的 Althlon 64 系列处理正式加入速龙家族,对于我们而言,这是真正意义上的“世界第一款64位处理器”,Althlon 64的问世,宣布了64位处理器第一次来到个人家中。其中 Althlon 64 FX 为追求极限的发烧友们特意作了不锁倍频的预设,玩家可自由改变倍频来把 CPU 超频或降频。FX 这两个字母,在今天看来,无疑是极致与发烧的证明。

实际上,Althlon 64 的诞生意义远不止让我们可以用得上64位处理器这么简单。随着这款64位处理器的横空出世,越来越多的相关厂商加入64位改革的行列,其中包括现在最受欢迎的科技公司苹果与微软,苹果增加了 Mac OS X 对64位的支持,微软也宣布为 AMD 芯片建立全新的 Windows *** 作系统。而因特尔依旧坚持只在 Itanium 芯片中支持64位应用。

伟大的企业带领世界发展,发展的潮流不可逆转,时间流转到2004年,市场证明了 AMD 的成功,巨大的压力使得英特尔不得不转变态度,承认了 AMD 的成功并开始着手研发 AMD 64 延伸的替代品。英特尔与 AMD 这对亦师亦友,亦顽固亦开放的老对手正以各自的方式改变着世界。

在此后的多年里,遵循着“摩尔定律”,AMD 与英特尔继续着制程与架构的改进与升级,其中 AMD 的对速龙,闪龙,皓龙系列都进行了稳步的升级。包括2005年在笔记本平台推出的炫龙(Turion)。有趣的是,AMD 的 CEO 桑德斯(Jerry Sanders)在2004正式卸任主席后不久,05年推出的炫龙便在市场策略上出现了问题,与自家的 Athlon X2 产品线出现了冲突,这是仙童市场部出身的桑德斯在位时基本不可能出现的滑稽情况,这是后话。

时间来到了2007年,AMD K8 微处理架构升级到了 K10,伴随 K10 而来的,是新一代“龙成员”——羿龙(Phenom),也就是 DIY 玩家俗称的“肥龙”。羿龙诞生之初,尽管用上了最新的 K10 架构,但苦于制程落后,还出现了不可预知的 BUG(程序员的说辞),使得功耗较高,性能也较低,唯有B3 修订版能对位 65nm 版的英特尔 Core 2 处理器。巨大的困难使得 AMD 出货受到严重阻碍。而英特尔因为缺乏对手“无奈”地涨了价,可依旧填补不了市场巨大的需求。

2008年3月27日,在解决了所有的问题后,AMD 正式发布了业界首创的三核心处理器“Phenom X3 8000” 系列,诡异的核心数使得玩家对这颗芯片产生了浓厚的兴趣,而后的事实也证明了玩家的敏感是正确的,AMD 在生产四核 CPU 的过程中,生产出来的核心不是每一个都达到预期指标,于是厂家将不达标的核心屏蔽成为了最合理的做法,注意到这点的玩家开始用尽各种办法将 CPU 屏蔽的核心恢复,美其名曰“开核”,一时间,“开核”成为了发烧友们口口相传的新玩法。时至今日,也依旧有不少粉丝对其津津乐道。

2010年4月,最后一款羿龙(Phenom II X6)发布,此后”龙“系列进入静默状态,经过精简后的产品线只剩下给曾经的AMD带来无数荣耀的速龙,与其 APU,FX 系列一同布局中低端处理器市场,世界归于宁静。

时至今日,我们已经知道,这宁静的背后,是技术的积累,是全新思路的结晶。她回来了,带着最荣耀的“龙”字勋章,禅意之中藏下一丝锐气,超凡脱俗地进入人们的视野,以超前的思维重新设计的智能架构告诉着我们此次回归的决心,在2017年的人工智能元年,锐龙能否为世界带来更多的改变?

尽管我们还并不知道锐龙的回归意味着什么,或许只是一纸 PPT,或许它已经开始了改变世界之旅。当然,我们更愿意抱着善意的心态去看待世界,毕竟,数风流人物,还看今朝。

作者 | 海怪

来源 | 脑极体(ID:unity007)

意法半导体、英飞凌、恩智浦三家半导体企业先后从其母公司独立或重组之后,直到今天,一直是撑起欧洲半导体产业面子的“三巨头”。

之所以被称为“三巨头”,是因为自1987年以来,三家几乎从未跌出全球半导体企业20强,虽然排名有调换,但都没掉队。当然也再没有新兴的欧洲半导体企业进入这个头部榜单。

如今,在全球半导体市场中,这三巨头主要选择了工业和 汽车 等B端芯片市场,而避开了竞争激烈的移动终端及电脑等消费级芯片市场。

这就让芯片产业之外的人很少有机会听到三巨头的名声,也自然很少了解这三巨头在全球芯片市场所扮演的角色,以及三家当下的竞争格局和未来可能的发展前景。

那么,三巨头之间有哪些纠葛和关联?各自有哪些优势?顺着这些问题我们接着讨论下去。

三巨头的并购“排位赛”

由于三巨头将市场都定位在B端芯片市场,三家各自的技术和产品自然有重叠,因此不可避免会出现激烈的竞争。而在近几年三巨头的发展过程中,大规模并购其他半导体企业和技术公司,成为能够快速赶超对手的“常规”手段。

在2018年,曾传出“英飞凌试图收购意法半导体”的消息,最后可能因为法国政府的阻挠而告吹。甚至早在2007年,还有“意法半导体要收购英飞凌”的传闻。可见三巨头相互之间觊觎对方已久。

而三巨头的关系中,英飞凌和恩智浦的竞争最为激烈,双方都在 汽车 半导体领域深耕多年,且排名接近。2015年,恩智浦以118亿美元的价格,收购了美国的飞思卡尔半导体(Freescale Semiconductor),成为当年的天价收购案。完成此次收购后,恩智浦成功进入全球半导体厂商前十的行列,成为全球最大的车用半导体制造商,并且成为车用半导体解决方案与通用微型控制器(MCU)的市场龙头。

经此一战,英飞凌虽然在 汽车 半导体市场略占下风,但也没有停止并购扩张的脚步。为巩固其在功率半导体的领先地位,英飞凌在2015年率先以30亿美元现金并购美国国际整流器公司;又在去年4月,宣布以100亿美元的价格完成对美国赛普拉斯半导体公司的收购。

赛普拉斯半导体的产品,包括微控制器、连接组件、软件系统以及高性能存储器等,与英飞凌当先的功率半导体、 汽车 微控制器、传感器以及安全解决方案,形成了高度的优势互补,双方将在ADAS/AD、物联网和5G移动基础设施等高增长应用领域,提供更先进的解决方案。

简单来说,英飞凌的目的仍然是要加强 汽车 半导体产品的实力,试图超越恩智浦的 汽车 半导体业务。此外,英飞凌在MCU、电源管理和传感器芯片方面超过或接近意法半导体。

去年几乎同时,恩智浦又以17.6亿美元收购美国美满电子(Marvell)的无线连接业务,主要产品线是Marvell的Wi-Fi和蓝牙等连接产品。通过这一收购,恩智浦可以更好补强其在工业和 汽车 领域的无线通信实力。

相比之下,过去几年意法半导体在并购市场的动作较少,但也并非没有。2016年8月,意法半导体宣布收购奥地利微电子公司(AMS)的NFC和RFID reader的所有资产,获得相关的所有专利、技术、产品以及业务,以强化其在安全微控制器解决方案的实力,在移动设备、穿戴式、金融、身份认证、工业化、自动化以及物联网等领域的发展提供技术支持。

在2019年的TOP15半导体市场排名中,来自欧洲的三家企业只能排在12-14位。恩智浦收购飞思卡尔的红利已经消失。而英飞凌收购赛普拉斯之后,两家营收加起来,会使得英飞凌大幅提升排名进到前十名当中。

从半导体产品形态来看,英飞凌、意法半导体和恩智浦,都是模拟芯片或模数混合芯片企业。从近几年的产业趋势来看,模拟芯片产业的集中度不断提高,而且模拟芯片企业的并购重组主要发生在美国和欧洲之间。从恩智浦和英飞凌收购的案例中,我们可以看到其对模拟和模数混合芯片厂商的并购,而且标的几乎全部来自美国。

一方面说明美国模拟芯片整体的数量和实力都很强,一方面也能看出全球模拟芯片企业发展进入一个相对稳定发展的阶段,如果想要打破平衡,取得快速发展,并购重组和强强联合就成为一个直接有效的手段。

不过值得注意的是,美国和欧洲直接模拟芯片企业的这种“内部消化”,正在进一步拉大欧美和亚洲之间在模拟芯片产业上的优势差距。

三巨头的守旧与拓新

为什么三巨头想要突破增长瓶颈,就必须依靠巨额收购来实现呢?

这实际上要跟模拟芯片产业的特点有关。与数字芯片要求快速更新迭代(摩尔定律)不同,模拟芯片产品使用周期较长,价格相对较低,其使用时间通常在10年以上,产品价格也较低。寻求高可靠性与低失真低功耗,核心在于电路设计,模拟芯片设计工艺特别依赖人工经验积累、研发周期长。

一旦某家企业在某类模拟芯片上建立其研发优势,那么其他竞争对手就很难在短时间内模仿或者超过,同时也因为下游客户对模拟芯片超高稳定性要求,一旦某些厂商建立其产品优势,其他竞争者也难以撼动其供应市场。所以,模拟芯片的产品与行业特点导致模拟芯片厂商存在寡头竞争特点。

德州仪器、亚德诺、意法半导体、英飞凌、恩智浦都是长期稳居全球TOP10的模拟芯片巨头,并且近几年,集中度还在进一步上升。近日,亚德诺高价完成美信的收购,甚至于有机会挑战第一名德州仪器的位置,而英飞凌对赛普拉斯的收购,也能让其排名大幅上升。

从产品线来看,三巨头都是老牌的IDM制造商,都拥有非常齐全的产品线,并且更加注重产品线工艺的稳步改进。

当然,恩智浦也想过拓展其他业务。2007年,恩智浦曾收购SiliconLabs蜂窝通信业务,发力移动业务市场,以及数字电视、机顶盒等家庭应用半导体市场,但短暂的出圈尝试不够成功。

因此,2007年起恩智浦很快将无线电话SoC业务、无线业务和家庭业务部门予以出售或剥离,并重新集中到飞利浦时代就确立的优势领域—— 汽车 电子和安全识别业务。2009年,恩智浦开始主要发力HPMS(高性能混合信号)产品,到2019年,包括 汽车 电子、安全识别相关业务的HPMS部门的营收占比超过了95%,产品线大幅度集中。

另外,恩智浦一直在大力推广以UWB、NFC等为代表的射频芯片业务。去年收购Marvell的无线连接业务正是致力于这一方向的表现。

英飞凌更重视其王牌业务板块——功率半导体产品。2016年,英飞凌尝试收购从美国Cree手中收购其Wolfspeed Power &RF部门(不过被美国CFIUS否决),其目的也是为了集中资源,加强其功率半导体业务。英飞凌拥有 汽车 电子、工业功率控制、电源管理及多元化市场、智能卡与安全等四大事业部。

(意法半导体2017Q2~2018Q2三大业务线营收及营业利润率)

相对于英飞凌和恩智浦,意法半导体在传感器业务上更加突出,特别是其MEMS技术,竞争力很强,也正是依托该优势技术,使得该公司在消费类电子、 汽车 ,以及工业传感器应用方面都有较强的竞争力。另外,意外半导体在 汽车 和分立器件、模拟器件以及微控制器和数字IC产品都有相当比例的市场表现。

早在十年以前,欧洲半导体产业就做出了自己的选择,那就是不在移动终端及PC市场寻求突破,而是专注于车用半导体和工业半导体两个细分市场。这一选择既有延续传统优势的考虑,又有对电动 汽车 及物联网这些新兴市场趋势的判断。

欧洲国家本身有良好的 汽车 工业和制造业基础,而欧洲半导体三巨头又在车用和工业半导体领域深耕多年,具备完整的设计、制造和封测的IDM体系,使得竞争对手短期内难以超越,这也是三巨头能够“守旧”的底气。

随着PC市场和移动终端市场红利期的结束,紧随5G网络普及而来的正是万物互联的物联网时代,智能电动 汽车 、无人驾驶、车联网、物联网等全新红利市场的到来,让欧洲半导体产业迎来新一轮增长周期。这是三巨头能够“拓新”的机遇。

从“守旧”中“拓新”,正是欧洲半导体产业能够继续赢得未来市场的不二法门。

三巨头的“中国红利”

由于欧洲半导体产业一直以来,无论是排名还是营收,其相对于美国和亚洲厂商来说,波动都非常小,但是未来又有一个稳定的增长预期。因此即便是三巨头如此大的体量,也成为美国半导体巨头试图并购的目标。

(虚线为2016年高通收购恩智浦流产后去除的390亿美元)

2016年,美国高通尝试以380亿美元收购恩智浦,成为当年金额最高的收购计划。当时恩智浦表示出浓厚的兴趣,但大幅提高了报价至440亿美元。高通同意了这一价格,并且收购案先后获得了美国、欧盟、韩国、日本、俄罗斯等全球八个主要监管部门同意。但在中国监管部门的反垄断审核期内,高通在其收购期内宣布放弃这些收购计划,并为此向恩智浦支付了20亿美元的“分手费”。

高通大力收购恩智浦的原因不难理解,那就是在5G发展可能受阻的情况下,获得恩智浦在 汽车 、物联网、网络融合、安全系统等领域的半导体技术优势,从而实现业务的互补和企业规模的飞跃。

不过,这场收购案中,有一个关键环节就是中国的反垄断审查。而事实上,无论恩智浦还是高通,中国都是最大的销售市场。假如两家强行完成并购,在未来仍有可能面临着我国的反垄断调查、限制甚至是处罚。

同样,对于恩智浦、英飞凌和意法半导体来说,中国既是三家最主要的销售市场,同时也是三巨头耕耘多年的新红利市场。

比如,恩智浦的众多业务早已在中国扎根。2019年汇顶 科技 以1.65亿美元收购NXP的音频应用解决方案业务(VAS),VAS可广泛应用智能手机、智能穿戴、IoT等领域。更早之前的2015年,建广资产与恩智浦宣布成立合资公司瑞能半导体,随后建广资产又以18亿美元巨资收购恩智浦的RF Power部门,成为中国资本首次对具有全球领先地位的国际资产、团队、技术专利和研发能力进行的并购。

2017年,由中资收购恩智浦标准产品业务而组建的安世半导体,已经在半导体细分市场上,取得二极管和晶体管排名第一, ESD保护器件排名第二,小信号MOSFET排名第二,逻辑器件仅次于德州仪器, 汽车 功率MOSFET仅次于英飞凌的名次。

意法半导体也早已在中国耕耘多年,特别是其STM32系列MCU,在中国有巨大的市场影响力。而英飞凌在与1998年已入华的赛普拉斯的整合之后,将获得更大的中国市场,并且英飞凌本身的功率器件在中国的销售也有巨大的增长空间。

在当下华为遭受美国在半导体方面的阻击之时,华为与英飞凌、意法半导体的合作,对于双方来说,都显得非常重要。

在我们完整地回顾完欧洲半导体产业的前世今生之后,如果用一个字来形容,那就是“稳”。

从欧洲半导体产业初兴之时,在各国政府主导下,几乎所有半导体产业都聚集在各国原本的工业巨头之下,享受产业政策的呵护。即使在世纪之交,半导体产业从体量臃肿的母公司独立出来,也仍然只诞生出三家身世优渥的半导体巨头。

而三巨头在发展过程中,其实又一次经历了从臃肿到精简,不断剥离非核心业务的过程。而此后的并购也主要集中在三家重点发展的产业方向,或者优势互补的产业方向上面。

这一切既源于欧洲大陆的传统工业基础优势的延续,又源于欧美亚洲在半导体产业格局上面的复杂博弈。欧洲半导体产业在利用自身传统产业优势的同时,也其实限制了突破传统桎梏的机会。不会像日韩、台湾地区和中国这样,利用人口红利和后发优势,最早从零开始,建立其各自的半导体特色优势。

这也是《圣经》里说的“当上帝关了这扇门,一定会为你打开另一扇门“的现实意义吧。下一篇,我们继续欧洲半导体的回顾,探寻从荷兰飞利浦诞生的一个制造业的奇迹——荷兰光刻机公司ASML。

基因组代表了遗传研究的起点。自从发现DNA结构以来,科学家们一直致力于以精确的方式确定碱基的排列顺序。从1965年开始第一个酵母的片段测序到现在,测序的读长依然不足以覆盖大多数物种整个基因组的大小,因此基因组组装技术也一直是不断研发改进的关键技术。本文系统的回顾了整个基因组测序相关的重要技术、主要里程碑以及当前三代测序技术的优势和挑战。

下图展示了基因组组装的各个重要的里程碑。不同的颜色背景分别展示了从最早基于核苷酸的早期测序到基于Sanger的鸟q法测序,到大规模的二代NGS测序,再到现在的三代TGS测序的主要组装成就。历时13年(1990-2003)耗资30亿美元的人类基因组计划(HGP)毫无疑问加速了基因组组装的进程,NGS衍生了一系列新颖的应用,包括全外显子组测序、RNA-seq、ChIp-seq、WGBS-seq等等,极大的促进了基因组测序的应用。2010年之后,全新的技术开启了第三代测序TGS—长读长测序的时代,长读长测序极大的增加了基因组组装的优势,基因组组装的连续性大大提高。

TGS的定义可能会有所不同,通常是指无需扩增直接对单个DNA分子进行测序的技术。这些技术产生比NGS更长的reads,每个reads可以跨越几到几百kbps的长度。10X Genomics linked reads 以及Hi-C等NGS的技术可以使得基因组组装连续度有一定的提升,但是TGS的出现,使得组装连续度的提升变得更加容易。

目前应用比较多的三代测序技术,一种是Pacific Biosciences(PaciBio)公司完善和商业化的单分子实时测序技术(SMRT),另一种是Oxford Nanopore Technologies(ONT)公司商业化的纳米孔测序技术(Nanopore)。SMRT测序技术应用了边合成边测序的原理,以SMRT芯片为测序载体,载体上分布上百万个纳米级的零模波导孔(ZMW),每个ZMW中聚合酶捕获文库DNA序列,通过荧光激发dNTP,从而根据捕获荧光信号的长短,进行边合成边测序。目前SMRT测序有两种模式,一种是Continuous Long Read(CLR)模式,一种是Circular Consensus Sequences(CCS)模式。CLR的读长更长,但是碱基测序的错误率较高(准确率90%远低于NGS的99.9%),但是测序错误是完全随机的,CCS模式即利用这种特性,通过自我校正的方法将测序的错误率降低到了NGS的水平,与此同时相比CLR牺牲了测序读长。

纳米孔测序使用插入人工脂质双层的转基因细菌纳米孔,放置在几十微米宽的单个微孔中并排列在传感器芯片上, 当每条单链 DNA 穿过一个通道时,它会扰乱流过孔的电流,并由半导体传感器测量变化。不同的碱基以略微不同的方式破坏电场,记录的电流变化可以转化为 DNA 序列。ONT可以读取的长度更长,取决于制备的DNA文库的大小,但是其碱基的准确率难以校正,测序的错误率也较高。

三代测序技术,由于其超长的读长,可以有效的跨越基因组中复杂的区域,从而显著提高基因组组装的质量。此外,在二倍体(多倍体)基因组中,TGS可以更容易的生成单倍型的长定相块,区分来源于父母本的遗传信息,避免嵌合的基因组,有助于准确的进行包括高度重复区域的长变异、大型的插入缺失、重复、倒位和易位等结构变异(SV)检测。同时三代测序还可以通过PacBio的酶动力学反应或Nanopore中的离子电流信号来实现表观遗传的测序。

FALCON是PacBio直接开发并于2013年发布的基于三代数据的De novo组装软件,它继承于分级基因组装配(HGAP)流程,首先进行序列自身的比对,以校正三代测序的reads准确度,然后使用de Brujin图(DBG)构建重叠群,如下图所示。FALCON可以识别二倍体序列,可以输出包含位点变异信息的等位基因序列(alternative contigs / a-contigs)和主要的基因组序列(primary contig / p-contig)。FALCON-Unzip是FALCON的升级版,可以利用初始组装中鉴定的杂合SNP来获得高度定相的单倍型,再利用Hi-C数据映射到组装中,利用haplotigs和共有序列,将两个单倍体完全组装出来。

Canu是起源于Celera Assember的三代组装软件,可以用于PacBio和Nanopore两家公司得到的测序结果,其采用Overlap-Layout-Consensus(OLC)的方式进行组装,即利用长序列与序列之间的交叠进行组装,主要分为纠错、修剪和组装三大步。对于FALCON来说,虽然经过组装之前的纠错,相比短读长有比较大的改进,但其组装出来的单倍型仍然是嵌合的,重复序列经常被折叠到一个序列中,为了解决这个问题,2018年发布的新版本的软件TrioCanu可以利用亲本信息来完全定相单倍型,其利用父母本的二代illumina数据在组装之前根据不同的SNP对组装样本的序列进行分类,然后进行独立组装出两套来源于亲本的单倍型,因此TrioCanu尤其适合于高杂合的基因组组装。

Canu的计算是比较慢的,HiFiasm是近两年开发的一个用于PacBio HiFi reads的快速单倍型解析从头组装软件,它可以在单个机器上多线程运行,在较少的资源消耗下快速完成基因组的组装,同时也可以在给定亲本数据的情况下,实现子代来自不同亲本的单倍体组装。但是其单倍型分型的准确性略差于TrioCanu。

组装结果的准确性,计算工作的优化都是组装需要考虑的方面,目前已开发出多种从头组装的软件,除以上介绍的软件外,还有Wtdbg2、Flye、Peregrine、Shasta等等,这几个软件的速度都比较快,但是其组装质量可能没那么准确。所有的基因组组装方法和软件都有优点和缺点,实际应用中可以考虑实际组装物种的情况,以及测序策略、组装目标,综合考量选取准确优秀的组装软件。

对于大基因组来说,即便长读长的reads也不能跨越整条染色体序列,需要其它连锁信息来定位和排序组装的重叠群,以将基因组组装提升到支架(Scanfold)水平。Bionano光学图谱是一种单分子DNA技术,该方法基于DNA标记,生成遗传光学图谱,然后结合初始组装的重叠群,可以进一步对重叠群进行定相和排序,产生更长的支架。除此之外,Bionano光学图谱还可以用于SV和甲基化的分析。

另外一种定向和排序重叠群的技术是基于染色体构象捕获(3C)的技术(Hi-C)。Hi-C技术首先使用甲醛将染色体空间构象固定之后,再利用限制性内切酶处理DNA,并重新连接空间上临近的DNA分子,该技术利用基因组的空间信息,组合重叠群以及支架将其分配到染色体水平。Hi-C目前是在大基因组中实现染色体水平支架的唯一方法,但往往不如Bionano支架那么保守,染色质不可预测的折叠导致染色体远处区域的相互作用,可能导致组装错误,例如人工倒位、同一染色体内的支架错位或不同染色体的支架错配。综合利用不同的技术可以更好地纠正这些错误,甚至可以获得整个染色体的端粒到端粒组装 。

基因组组装的方式一直在不断创新、优化。通过不断改进现有技术并引入全新的 DNA 测序方法和生物信息学工具,组装的质量一直在提升。NGS 引入的高通量能力和 TGS 提供的更高质量序列,最终使复杂的基因组也可用于全基因组研究。人类遗传学研究,包括人口基因组学、遗传疾病定位和诊断、个性化医疗计划、癌症研究和产前检测,已经受益于过去十年基因组测序和组装的进步。同样,这些方法越来越多地用于非模式生物以了解生态和进化过程。对参考基因组测序和组装的承诺现已从单一物种项目扩大到多物种协调工作,旨在使用 NGS 和 TGS 方法组合为大多数生物体产生高质量基因组的项目目前正在进行中。

Giani AM, Gallo GR, Gianfranceschi L, Formenti G. Long walk to genomics: History and current approaches to genome sequencing and assembly. Comput Struct Biotechnol J. 2019 Nov 1718:9-19. doi: 10.1016/j.csbj.2019.11.002. PMID: 31890139PMCID: PMC6926122.


欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/dianzi/7544726.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-04-06
下一篇2023-04-06

发表评论

登录后才能评论

评论列表(0条)

    保存