
鲲鹏920是2019年发布的7纳米工艺ARM架构处理器,也是你所说的鲲鹏服务器的主力核心芯片。没看错,鲲鹏也是7纳米工艺台积电代工,所以现在鲲鹏的情况大家也就明白了吧。鲲鹏服务器和麒麟手机一样,都是在数着仓库里芯片的数量过日子。所以,就不用讨论鲲鹏芯片的性能到底是强是弱了,因为它也处于用一片少一片的窘境下。所以,你觉得鲲鹏是在扩大市场还是坚守市场,或者让出市场?
不过,也算是有一个让中国人依旧无法高兴地“好”消息吧。那就是鲲鹏920的直接对手,飞腾FT2000处理器也被美国人的限制令波及了。飞腾和华为是中国大陆获得了ARM公司ARMv8架构完全开发权的唯二的两家公司,理论上两家公司都拥有在ARMv8架构上进行任意开发的权力,而且两家公司也确实都开发出来了性能几乎相当的处理器。但很可惜,美国人的限制令把两家公司都扫到了,现在鲲鹏920黄掉了,但它的直接对手飞腾FT2000也一样黄掉了。
至此,华为的鲲鹏服务器有变成一个梦的趋势,而其直接对手,飞腾FT2000连梦都没来得及做,也成了昨日黄花。所以,现在非X86服务器市场上,中国最有希望的两个平台就都因为同一个原因出局了。
但又有一个算是可以让人高兴点的消息,就是ARM架构服务器并没有想象中那么好的市场前景,虽然高通、AMD、华为、飞腾等等中外主打ARM架构的公司在一个劲儿地扇呼,但市场并不是太买帐,AMD和高通折腾了几年,已经都认输了,砍掉了ARM服务器的研发部门。现在,华为和飞腾再被美国人废掉武功,ARM架构在服务器领域内对X86的进攻差不掉就偃旗息鼓了。
所以现在的这个鲲鹏服务器,市场前景大概就是上面说的这些了。估计,华为或许还不甘心于无法切入服务器市场,但在美国的限制令下,国内的ARM平台服务器大概也是进入了低潮,一时半会儿是缓不过劲儿来了。
就算所有人都不买鲲鹏服务器,华为依然可以靠鲲鹏服务器赚钱。时代变了,现在的服务方式已经完全不同了。
华为是国内除了阿里最大的云服务商,华为云,对外提供IaaS,PaaS,SaaS服务。华为云做的,就是微软,亚马逊现在在国外做的,是微软现在最赚钱的一块业务,叫企业服务业务。
华为租给你虚拟机,租给你容器运行环境,甚至直接租给你软件,给你提供maven和yum等各种软件源,你只知道你在一个平台上运行你的应用,你根本不需要知道你的容器或 *** 作系统是运行在鲲鹏上还是在英特尔上。
现在IBM,微软都在考虑卖服务赚钱了,华为已经靠卖服务在云服务商里名列前茅了,你还在担心鲲鹏服务器卖不出去?
国内最大的服务器消费商,就是华为阿里这种云服务商了。
只要你自己的东西自己可以用出去,别人不买有什么关系?
华为现在最大的问题难道不是自己想用的很多东西有点不够用吗?哪里愁卖不出去了?
不会吧, 华为不是在推出鲲鹏生态吗,广西都有鲲鹏创新中心推广鲲鹏产业,不过如果华为没有了芯片,靠库存能撑多久呢,去库存完了就像手机一样消失了。如果这样广西鲲鹏产业也只是一个梦。惨。计划赶不上变化。
和华为在鲲鹏服务器领域合作的厂家有:长沙的湘江鲲鹏服务器,许昌的黄河鲲鹏服务器,它们的 *** 作系统和数据库都采用华为的欧拉 *** 作系统和高斯数据库。
华为的泰山服务器,逐步退出服务器市场,让自己的几个合作伙伴承担鲲鹏服务器的市场推广工作。
服务器不比普通消费品,例如手机性能不行,水军忽悠一下就行,但服务器都是懂行的用,华为的就不好卖了
不是华为退出鲲鹏服务器市场,而是改变了策略,把鲲鹏处理器和主板授权给更多的整机厂商,让国内更多的服务器硬件制造商加入到鲲鹏生态中,华为自己逐渐成为处理器,主板和关键技术提供方,就像Intel和AMD在x86服务器市场的角色。
当前,为推进IT支撑系统集约化建设和运营,进一步发挥集中化能力优势,IT云成为运营商IT支撑系统建设的基础架构。但在IT云资源池部署过程中,服务器技术面临多个新挑战,主要体现在以下3个方面。
在性能方面,人工智能(AI)应用快速扩张,要求IT云采用高性能GPU服务器。AI已在电信业网络覆盖优化、批量投诉定界、异常检测/诊断、业务识别、用户定位等场景规模化应用。AI应用需求的大量出现,要求数据中心部署的服务器具有更好的计算效能、吞吐能力和延迟性能,以传统通用x86服务器为核心的计算平台显得力不从心,GPU服务器因此登上运营商IT建设的历史舞台。
在效率成本方面,IT云部署通用服务器存在弊端,催生定制化整机柜服务器应用需求。在IT云建设过程中,由于业务需求增长快速,IT云资源池扩容压力较大,云资源池中的服务器数量快速递增,上线效率亟需提高。同时,传统通用服务器部署模式周期长、部署密度低的劣势,给数据中心空间、电力、建设成本和高效维护管理都带来了较大的挑战。整机柜服务器成为IT云建设的另一可选方案。
在节能方面,AI等高密度应用场景的快速发展,驱动液冷服务器成为热点。随着AI高密度业务应用的发展,未来数据中心服务器功率将从3kW~5kW向20kW甚至100kW以上规模发展,传统的风冷式服务器制冷系统解决方案已经无法满足制冷需求,液冷服务器成为AI应用场景下的有效解决方案。
GPU服务器技术发展态势及在电信业的应用
GPU服务器技术发展态势
GPU服务器是单指令、多数据处理架构,通过与CPU协同进行工作。从CPU和GPU之间的互联架构进行划分,GPU服务器又可分为基于传统PCIe架构的GPU服务器和基于NVLink架构的GPU服务器两类。GPU服务器具有通用性强、生态系统完善的显著优势,因此牢牢占据了AI基础架构市场的主导地位,国内外主流厂商均推出不同规格的GPU服务器。
GPU服务器在运营商IT云建设中的应用
当前,电信业开始推动GPU服务器在IT云资源池中的应用,省公司现网中已经部署了部分GPU服务器。同时,考虑到GPU成本较高,集团公司层面通过建设统一AI平台,集中化部署一批GPU服务器,形成AI资源优化配置。从技术选型来看,目前运营商IT云资源池采用英伟达、英特尔等厂商相关产品居多。
GPU服务器在IT云应用中取得了良好的效果。在现网部署的GPU服务器中,与训练和推理相关的深度学习应用占主要部分,占比超过70%,支撑的业务包括网络覆盖智能优化、用户智能定位、智能营销、智能稽核等,这些智能应用减少了人工投入成本,提升了工作效率。以智能稽核为例,以往无纸化业务单据的人工稽核平均耗时约48秒/单,而AI稽核平均耗时仅约5秒/单,稽核效率提升达 90%。同时,无纸化业务单据人工稽核成本约15元/单,采用GPU进行AI稽核成本约0048元/单,稽核成本降低达968%。
整机柜服务器发展态势及在电信业的应用
整机柜服务器技术发展态势
整机柜服务器是按照模块化设计思路打造的服务器解决方案,系统架构由机柜、网络、供电、服务器节点、集中散热、集中管理6个子系统组成,是对数据中心服务器设计技术的一次根本性变革。整机柜服务器将供电单元、散热单元池化,通过节约空间来提高部署密度,其部署密度通常可以翻倍。集中供电和散热的设计,使整机柜服务器仅需配置传统机柜式服务器10%的电源数量就可满足供电需要,电源效率可以提升10%以上,且单台服务器的能耗可降低5%。
整机柜服务器在运营商IT云建设中的应用
国内运营商在IT云建设中已经推进了整机柜服务器部署,经过实际应用检验,在如下方面优势明显。
一是工厂预制,交付工时大幅缩短。传统服务器交付效率低,采用整机柜服务器将原来在数据中心现场进行的服务器拆包、上架、布线等工作转移到工厂完成,部署的颗粒度从1台上升到几十台,交付效率大大提升。以一次性交付1500台服务器为例,交付工作量可减少170~210人天,按每天配10人计算,现场交付时间可节省约17~21天。
二是资源池化带来部件数量降低,故障率大幅下降。整机柜服务器通过将供电、制冷等部件资源池化,大幅减少了部件数量,带来故障率的大幅降低。图1比较了32节点整机柜服务器与传统1U、2U服务器机型各自的电源部件数量及在一年内的月度故障率情况。由于32节点整机柜服务器含10个电源部件,而32台1U通用服务器的电源部件为64个,相较而言,整机柜电源部件数减少844%。由于电源部件数量的降低,32节点整机柜服务器相对于32台1U通用服务器的月度故障率也大幅缩减。
三是运维效率提升60%以上。整机柜服务器在工厂预制机柜布线,网络线缆在工厂经过预处理,线缆长度精确匹配,理线简洁,接线方式统一规范,配合运维标签,在运维中可以更方便简洁地对节点实施维护 *** 作,有效降低运维误 *** 作,提升运维效率60%以上,并大幅减少发生故障后的故障恢复时间。
液冷服务器技术发展态势及在电信业的应用
液冷服务器技术发展态势
液冷服务器技术也称为服务器芯片液体冷却技术,采用特种或经特殊处理的液体,直接或近距离间接换热冷却芯片或者IT整体设备,具体包括冷板式冷却、浸没式冷却和喷淋式冷却3种形态。液冷服务器可以针对CPU热岛精确定点冷却,精确控制制冷分配,能真正将高密度部署带到前所未有的更高层级(例如20kW~100kW高密度数据中心),是数据中心节能技术的发展方向之一,3种液冷技术对比如表1所示。
液冷服务器在运营商IT建设中的应用
液冷服务器技术目前在我国仍处于应用初期,产业链尚不完备、设备采购成本偏高、采购渠道少、电子元器件的兼容性低、液冷服务器专用冷却液成本高等问题是液冷服务器尚未大规模推广的重要原因。从液冷服务器在运营商数据中心领域的具体应用案例来看,运营商在IT云资源池规划和建设过程中,通常会对液冷服务器的发展现状、技术成熟度等进行分析论证。
考虑到目前液冷服务器规模化应用尚处于起步阶段,需要3~5年的引入期,因此暂时未在IT云资源池建设中进行大规模落地部署,但在部分地区有小规模应用,如中国移动南方基地数据中心已经开展液冷服务器试点应用,中国联通研究院也在开展边缘数据中心服务器喷淋式液冷系统的开发。未来,随着IT云建设规模、建设密度的继续攀升,以及液冷产业生态体系的逐步成熟,液冷服务器在IT云建设中将有更大的应用空间。
总体来看,运营商IT云资源池建设对服务器计算性能、延迟、吞吐、制冷、定制化、分布式部署等方面都提出了更高要求。未来,GPU服务器、定制化整机柜服务器、液冷服务器等新兴服务器技术将快速迭代,为运营商数据中心服务器技术的发展和演进带来新的思路和路径。
撰文 | 机器之能
“ 吉姆 · 凯勒(Jim Keller)是一个摇滚明星,英特尔失去了一位伟大的建筑师,” Moor Insights and Strategy的总裁和首席分析师帕特里克·穆尔黑德向媒体说道。
机器之心6月12日消息,英特尔宣布负责硅工程部门(Silicon Engineering Group)的高级副总裁吉姆 · 凯勒因为个人原因辞职,辞呈立即生效。不过,吉姆 · 凯勒将继续出任公司顾问六个月时间,以协助工作交接。
吉姆 · 凯勒是英特尔新架构的策划者之一,在宣布辞职之前,他已在英特尔工作了两年,提出了 3D 堆叠芯片等创新方法。英特尔表示,此后他还将留任顾问六个月以进行工作交接。随着凯勒的离开,英特尔也进行了一系列组织架构调整:
尽管吉姆 · 凯勒在计算机行业之外鲜为人知,但他无疑是芯片领域的超级明星。
他的设计帮助AMD从一个失败者变成了一个受人尊敬的竞争者;特斯拉 汽车 能识别红灯和停车标志,那也归功于他的设计。从iPhone到谷歌云服务器,再到Xbox 游戏 机,所有芯片里都潜藏着他的核心工作。
一 所到之处皆留下「大作」
作为半导体业界的传奇人物,在吉姆 · 凯勒近40年的职业生涯里,从业经历颇为丰富,虽然跳槽频繁,但所到之处均留下了痕迹——在英特尔、特斯拉、AMD、苹果和Alpha等公司就职期间留下了不少经典之作,是的,你所知道的「翻身」故事有不少都是出自他之手。
第一款以500 MHz运行的芯片,其内存缓存达到1 GHz,这是当时闻所未闻的速度。Alpha还率先推出乱序运行软件指令,以提高性能。
吉姆 · 凯勒与AMD的渊源最为深厚,在两次为 AMD 效力的经历中,他曾先后主导了 AMD Opteron(K7和K8 X86-64架构)和 Zen 架构,无论是主流的Ryzen还是发烧的Ryzen ThreadRipper都让人惊喜万分。
而在服务器、数据中心领域,AMD曾经凭借Opteron在服务器领域拿到过27%的市场份额,风光一时无两。
Opteron是最早的64位处理器之一,可安装在服务器中,并开创了一种称为HyperTransport的数据通信标准,该标准至今仍在云计算中广泛使用
凯勒致力于提高图形能力。为最初的iPad和iPhone 4供电的芯片启用了Apple的第一个高分辨率“视网膜”显示器。
特斯拉表示其首个内部人工智能 该芯片旨在实现自动驾驶,其性能是其替换的Nvidia芯片的20倍。
低功耗芯片是Intel 最早受到凯勒影响的设计之一,旨在运行小型便携式设备,但可以扩展到PC。
二 加入英特尔:「被他深深的挣扎所吸引」
三 每一次转身,都卡在节点
在加入英特尔之前,吉姆 · 凯勒已经活成了一个传奇。AMD二十多年来几次挑战英特尔,还有苹果A系列的一炮而红,都与其有密切的关系。
吉姆 · 凯勒在上世纪九十年代就曾在DEC工作, 并涉足了Alpha处理器项目的设计。这段经历让他对Alpha处理器获得了深入了了解,并为后面的经历埋下了伏笔。
在DEC被收购之后,公司大批人才出走,当时求贤若渴的AMD CEO Jerry Sanders 立即招募了大量 Alpha 项目的资深工程师,其中包括吉姆 · 凯勒。进入AMD后,凯勒参与了K7处理器的设计,并成为后来K8的主架构师,由于这开启了AMD对Intel的大反击,因此这对吉姆 · 凯勒的职业生涯是一个重要加成。
K7综合性能超越同频的奔腾III(代号Katamai),让所有的用户为之震惊。吉姆 · 凯勒 还主导了将战火推向最高潮的K8架构核心研发,但在第二年,他离开AMD。在不少人看来,凯勒的突然离开似乎有些“虎头蛇尾”,但是,AMD首席技术官Fred Weber有不同看法。
“我不认为,他没有完成任务(就走了),他肯定完成了。”“他更像是一个项目的前沿人物。好消息是,他的前线做了这么多工作,设定了这么好的方向。”
对于一名这位工程师中的工程师来说,解决清楚有趣的问题永远排在第一,“工程师喜欢工作,不想再胡扯了。”他说。在他旅程的下一站,很重要的一个节点换做了苹果。
苹果A系列处理器之所有能够获得今天的市场地位和表现,一个很重要的原因在于2008年收购了PA-Semi。这家公司是由Daniel W Dobberpuhl在2003年创立,专注于高端个人电脑和服务器的芯片,而且他们都曾效力于DEC。
Daniel W Dobberpuhl在半导体领域的地位是吉姆·凯勒目前难以企及的。不过,在加入PA-Semi工作的几年里,吉姆·凯勒在老板的领导下,继续积累了低功耗RISC处理器的设计经验。直到2008年,苹果将PA-Semi收归囊中。
对于凯勒来说,苹果的吸引力主要有两方面。一个是向世界上最坚韧、最成功的CEO史蒂夫·乔布斯学习;二是新兴智能手机带来的挑战和乐趣。
在此之前,iPhone的前三个版本都使用了三星芯片,凯勒加入后,成立了苹果自己的芯片团队。从iPhone 4开始,苹果采用了凯勒设计的芯片。他对苹果A6和A7影响最大(这两款芯片用在了iPhone 5和5s上)。设计速度不仅比竞争对手快,还对芯片进行了优化,图形处理更加流畅,让竞争对手相形见绌。另外,芯片还加速了iPhone的语音处理,为Siri提供了支持。
凯勒还吸收了乔布斯的一句格言,这句话也在其后续辉煌中,产生共振:“一旦你知道什么是正确的事情,这就是你应该做的所有事情。”
随后,看到新问题和机会的凯勒再度回到正处水深火热的AMD。凯勒给AMD带来的市场优势此时已经黯然褪去,英特尔又再度居上。他知道原因在哪里:
AMD芯片设计错综复杂,难以改进,而优秀的工程师又会花很长时间优化旧芯片的设计。这个时候需要的不是优化,而是借助新技术,从零开始。
芯片本质上就像在搭乐高:用更小,单独制造的硅块组装成更大,更复杂的芯片。凯勒意识到,他可以通过将几个小芯片组合在一起,为高计算强度的活动制造出新的芯片,比如深度学习。这样的设计比单个集成芯片更便宜,但仍然很强大,而且,模块化设置能够实现在不产生太多热量的情况下,增加计算能力。这些小芯片还可以在更大配置中工作,满足云计算数据中心的需求。
“他有那种疯狂的专注力。” 这是同事对他的评价。他设计的首批芯片被称为Ryzen系列,直到2017年才上市。价格低于英特尔,但在某些情况下,性能却超过英特尔,引发市场轰动。到2019年,仍然采用凯勒设计的第三代Ryzen芯片几乎在所有方面都击败了曾经的对手。
写到这里,典型的故事结尾又发生了:在Ryzen上市之前,大神早已转身离开。
四 遇上马斯克,迷上制造
“他是我们行业的阿甘,”AMD前首席技术官Fred Weber曾评价道,“他总是置身于有趣的事物之中,并做出改变。”
回到老东家创造奇迹后,大神又转会到特斯拉。还记得马斯克在2016年股东大会上大谈工厂自动化吗?当时,他也谈到了片上系统(Soc),主要原因就是2016年1月,凯勒加入了特斯拉。
马斯克想要制造自动驾驶 汽车 ,但是,英特尔和英伟达的产品都不足以让这位天才工程师满意。而在加入特斯拉之前,凯勒已经真正将 汽车 视为计算机领域的挑战。在工作面试过程中,凯勒说服马斯克,自己可以设计一种专利芯片,运行速度比对手快10倍。
一旦了解特斯拉软件的运行方式,凯勒发现,可以忽略或者最小化英伟达芯片中那些与特斯拉软件不太相关的组件。2019年,凯勒设计的芯片开始被纳入Model 3系列和其他车型,公司业绩也增长了20倍。
不过,让人印象最深刻的是凯勒还在芯片设计上增加了一项功能:Model 3在遇到红灯和停车标志时,会自动停车。
凯勒被特斯拉的制造业务迷住了。通过观看 汽车 组装过程,他发现,虽然许多部件需要使用5年或10年,但是,芯片需要频繁更新,每两三年更新一次。于是,他说服特斯拉重新设计计算机组件与 汽车 其余部分连接方式,方便公司更容易更换芯片板。
五 转身之后
就在凯勒从英特尔离职的前一天,英特尔发布了新的 Lakefield 混合处理器,其中包括他参与设计的低功耗Tremont处理器,对于凯勒来说,他已经完成了现阶段在英特尔的任务。
或许,和过去每次转身一样,等不及看着自己的工作结出市场硕果,在完成最为开创性新的工作之后,又去寻求下一个激动人心的问题和解决之道。
鉴于吉姆 · 凯勒和前雇主 AMD 的「深情厚谊」以及后者近几年突飞猛进的发展,很多人猜测他「可能重回 AMD」,可谓「Once an AMD forever an AMD」。
也有人猜测,他可能重回苹果。因为前段时间彭博社报道称,苹果可能会在今年 WWDC 2020 上宣布自家 Mac 产品将会从英特尔处理器转向 ARM 处理器。真是一个巧合的时间点。
对于当下风云变化莫测的芯片市场来说,这位重量级人物的“恢复单身”势必会引发新的人才争夺,不知道这一次是否会出现中国大厂的身影?
Arm二手服务器芯片可以在任何时候购买,不过由于Arm技术新颖,应用场景较少,所以市面上的库存比较紧张。国内竞价网站有一些二手服务器芯片,但是其供应量不多。建议网上搜一下Arm二手服务器芯片的信息,可以及时看到市场的情况、库存量、价格等信息。根据Intel之前的说法,2020年他们将首次推出两代服务器处理器,升级换代的间隔大幅缩短到4-5个月时间,其中一个是14nm工艺的Cooper Lake,另外一个是10nm工艺的Ice Lake-SP。
在目前的两代至强可扩展处理器中,14nm工艺的Skylake、Cascade Lake系列都是最多28核,这是14nm工艺下原生多核的极限,但是10nm工艺呢?之前传闻Ice Lake服务器版的核心数也不会增多,这样的话对阵AMD的64核处理器时候就更没什么机会了。
韩国网站日前在介绍华硕服务器产品线时意外泄露了Intel处理器平台的路线图,其中有些资料跟之前泄露的就不一样了,尤其是Ice Lake系列的具体规格。
Skylake、Cascade Lake这两代的处理器已经发布,不一一介绍了,14nm节点还有Cooper Lake,预计2020年Q2季度问世,Socket P+eack,最大功耗300W,这个指标比前面两代14nm工艺处理器大幅提升, 因为它实现了没插槽最多48核处理器,大幅超过了最多28个原生核心的限制 。
Cooper Lake的这个48核倒是容易解释,Intel在Cascade Lake-AP处理器就实现这个水平了,通过MCM多芯片封装,将2个Cascade Lake处理器封装为一个处理器就能让核心数大幅增长, 之前Intel做过2个24核的、2个28核的,实现了56核112线程的巨大提升 。
但是10nm Ice Lake处理器的核心数就不好解释了, 上面标注的是38核,TDP功耗也是270W,比普通28核的14nm处理器的205W大幅增加 ,增幅基本上跟核心数增加呈线性比例。
这个38核怎么来的呢?假如跟前面的48核Cooper Lake一样也是胶水MCM封装,技术上没问题,但实在没必要,更何况14nm都做到48核了,10nm没理由再搞个38核的,越做越少是没道理的。
排除这一点,那就意味着10nm Ice Lake处理器可以 做到原生38核或者更高了,也代表着Intel终于可以超越28核,在高性能服务器芯片市场上通过提升核心数的方式来跟AMD的EPYC霄龙处理器竞争了,虽然总核心数还是落后很多。
考虑到10nm工艺的晶体管密度达到了1亿/mm2,是14nm工艺的27倍,Intel技术上显然是可以做到更多核心的。
除此之外,10n Ice Lake处理器其他规格也先进不少,8通道DDR4-3200内存虽然没提升, 但支持二代非易失性傲腾内存,而且也加入了PCIe 40支持了 。
英伟达在英国剑桥的超算中心部署了由若干块A100 80GB组成的DGX系统实际上,除了改变芯片产品的架构,把成百上千块芯片用最高效的形式“连”起来,当然也能解决科学家们每秒/百亿亿次的超大计算需求,而收购的Mellanox的用意便在于此。
如果你见过位于无锡的中国超级计算机“太湖之光”,就会发现“这台计算机”其实是一个由成百上千台黑色机柜组成的计算机集群,可以填满一间约1000平米的屋子。
它既可以被称为“高性能计算机群”,也可以被看做是一个不小规模的数据中心。
当然,这些黑色机柜的性能,要比普通服务器强大太多,由4万多块不同种类的国产芯片组成,仅集成它们就是一项极为艰巨的任务,用时两年,总投入超过了18亿人民币。
位于无锡超算中心的太湖之光
而NVIDIA Mellanox 400G InfiniBand的作用,便是将超级计算机中上万块CPU、GPU以及其他种类芯片“连接”在一起。在发挥性能最大化的同时,每块芯片的数据传输效率也不能有太多损耗。
“之前CPU与GPU之间的互联,都是通过英伟达的NVlinks(一种总线及其通信协议),但这个东西互联的效率没有特别好,不能简单扩展到上千块芯片互联的超算场景。”参与研发过TPU,芯英科技联合创始人杨龚轶凡告诉虎嗅,Mellanox擅长的便是此前英伟达最大的短板之一,
“一台超级计算机,各品牌芯片之间的高效配合,极为重要。之前英伟达的NVlinks只能和IBM的CPU互联。而收购Mellanox后,英伟达增强了用芯片构建超算系统的可扩展性,可以让GPU与其他品牌和种类的芯片进行连接。”
换句话说,英伟达找到了“让自己产品轻松插进包括英特尔在内,所有服务器芯片接口”的方法。
超算市场,不可忽视的芯片掘金地
英伟达的这次全系列产品,无一例外面向的都是“烧钱魔窟”——超级计算机市场。
举个例子,在2020年6月颁布的全球超级计算机Top500榜单上,排名第二的美国橡树岭国家实验室超级计算机Summit,在每个节点配备了2个IBM的 Power9 CPU和 6个英伟达的Tesla V100。这样的节点有4356个,总耗资2亿美元。
而在2019年3月,美国能源部阿贡实验室公开宣布,将耗资5亿美元搭建新一代超级计算机 Aurora 。这台将在2021年实现交付的超级计算机,并非追求一味追求计算速度,而是需要针对人工智能等新技术应用采用新的设计思路。
那么这笔巨额政府合同的主要受益者是谁?外界猜测是美国最大的CPU生产商英特尔与著名超算系统集成商Cray。
但不可忽视的是,随着超算系统被用在人工智能研究领域的次数越来越多,额外装载的加速芯片GPU,逐渐成为搭建超级计算机的必选品。
因此,英伟达也在全球许多超算项目中获得了颇为丰厚的收益,包括美国技术最强大的国家实验室——橡树岭实验室、阿贡实验室,都是英伟达最好性能产品的首批尝鲜者。在大数据的驱动下AI技术有了实现商用的可能性,同时,随着智能化场景的不断扩大,用作于数据处理和存储的数据中心建设也在全球范围内兴起。根据Arizton的报告显示,从投资额进行计算,预计全球超大规模数据中心市场规模将在2026年达到12764亿美元,在2020至2026年内该市场将以超过402%复合年增长率保持增长。
显然,通过收购的方式,是加快数据中心芯片布局的方式之一,而在这背后,也预示着,这四大芯片巨头决战数据中心的步伐也加快了。
根据IDC的预测显示,2015年到2025年,数据将以每年25%的速度增长。这些数据的增长带动了云端计算和边缘计算等市场的兴起,他们的增长也拉动了数据中心市场的成长。由此,芯片巨头们也在数据中心市场展开了布局。
英特尔是全球最大PC和数据中心服务器CPU制造商,2017年初他们更是将其以“PC为中心”的战略转移到“以数据为中心”的业务中,从2017年初他们确立了这个战略后,到了2019年,数据中心业务便表现出了较好的成绩。到2020年,其全年财报体现出以数据为中心的转型取得了显著进展,数据中心业务呈迅猛发展态势——2020年相较2019年增长11%。
也因此,英特尔已经将以数据为中心业务的总体潜在市场规模由2021年的1600亿美元调整为2022年的2000亿美元。这将是公司 历史 上最为重大的机遇所在。CPU是英特尔在数据中心市场发展的基石,在此基础之上,英特尔新任CEO帕特·基辛格也在今年提出英特尔2023 CPU产品路线图——面向数据中心的Granite Rapids,我们将采用英特尔7纳米制程工艺生产计算芯片。
AMD是英特尔在CPU领域的竞争对手之一,凭借着 EPYC系列产品,AMD再次迎来其高光时刻,同时该系列产品也为AMD进军数据中心市场带来了希望——根据Mercury Research的数据显示,经过长达六年的重返数据中心的争夺战,到2021年第一季度,AMD的X86处理器在数据中心的销售份额达到了115%。
数据中心市场的增长也为AMD的营收带来了提升,从其2021年第一季度显示,AMD营业额同比增长93%,净收入增长超300%,数据中心营业额增长超一倍。此外,根据AMD总裁兼首席执行官苏姿丰博士Computex 2021时的演讲显示,今年还将会有100多款各大厂商的搭载EPYC处理器的服务器平台问世,以及400多个基于EPYC处理器的实例。
这也是Arm服务器芯片在数据中心市场获得契机的原因之一。其于去年推出的ThunderX3 也是针对云计算和HPC高性能运算市场中的特定工作负载而设计,公司希望通过 Marvell 的差异化优势为最终客户带来更高的性能成本比和性能功耗比优势。
与上述三家芯片巨头不同的是,英伟达则是以GPU上的优势进入到数据中心市场。从英伟达的财报中看,数据中心市场的发展已经成为了他们营收当中重要的一部分。近几年,英伟达的数据中心业务的表现就开始逐渐露出锋芒——2021财年第一季度其数据中心业务首次达到了10亿美元,2021财年第二季度当中,其数据中心业务收入达到175亿美元,该项业务的收入占总营收的比重达到45%,首超 游戏 业务,创 历史 新高。
但随着数据中心市场的成长,仅凭单一的CPU或者是GPU都难以支撑这个市场的发展。因此,这四大芯片巨头开始向更多的领域做拓展——原来在CPU领域有着优势的企业开始向GPU、FPGA等领域进军,而GPU企业在在试图向多元化的方向发展,于是,我们看到了,这四大芯片厂商在数据中心市场的催化下,开始出现了交集。
英特尔曾在2018年提出XPU异构愿景,既由标量(对应CPU)、矢量(对应GPU)、矩阵(对应ASIC)、空间(对应FPGA)组成的架构,可以进行多种架构组合。英特尔认为,必须在CPU的基础上加入并完善GPU、FPGA、AI芯片、视觉处理芯片等不同类型的计算架构,组成一个有机的整体。
而这也是他们能够在数据中心市场持续发展的动力之一,因此,他们也针对这个愿景进行了布局,在自研方面,英特尔于去年11月正式发布其全新服务器GPU,即首款数据中心的独显产品。
在收购方面,英特尔于2015年完成了对全球第二大FPGA 厂商Altera的收购,2018年收购无晶圆厂eASIC开始向Chiplet发展,2019年四月收购为FPGA提供IP和定制解决方案的供应商Omnitek,6月,又收购了网络交换芯片厂商Barefoot(该收购旨在解决数据爆发式增长的问题,这些海量数据激发了对分析这些数据的计算能力的需求,也刺激了对在数据中心内交换这些数据的联网系统的需求),2019年还对以色列数据中心AI芯片制造商Habana Labs进行了收购(虽然Habana独立运营,但该笔收购也加强了英特尔在数据中心人工智能产品上的实力)。
在英特尔重返独立显卡之前,AMD是业内唯一一家既能做高性能x86 CPU,也能做高性能GPU的公司。而随着新的竞争的到来,AMD也对其GPU领域的发展做出了新的规划——AMD在其2020年财报会议上宣布,公司将在通用化GPU的基础上,将其产品定位成专注于 游戏 优化的RDNA和专注于运算导向的CDNA。
在对数据中心的布局上,最值得一提的是,AMD将对FPGA领域的龙头赛灵思的收购,这也是他们布局数据中心市场的重要一步——在拥有CPU 和 GPU 产品后,赛灵思可以为他们布局数据中心市场提供加速能力。
从英伟达方面来看,这是一个市值曾一度超过英特尔的巨头芯片公司,而市场对于他的看好,也来源于他们在数据中心这一市场的布局。而他们也开始突破GPU领域市场,开始向CPU市场进行发力——在今年4月,英伟达推出其基于Arm的数据中心CPU,据英伟达介绍,该芯片是专为大规模神经网络工作负载设计的,预计将于2023年在英伟达的产品中使用。
而针对数据中心方面的布局,英伟达也同样逃不过用收购的方式来进行发展。这其中包括,他们以69亿美元收购Mellanox获得的网络技术,与计划用400亿美元的价格收购Arm。
由于英特尔、AMD、英伟达针对数据中心的布局,使得他们的产品形成了一定的竞争关系,也被行业成为是数据中心市场的三大巨头。但在他们的发展中,尤其是英伟达以Arm架构为基础推出了CPU之后,我们也看到了Arm架构对于数据中心市场的冲击力,而这就不得不再提一下Marvell,这个在决战数据中心市场中一个不可忽视的力量。
除了他们所推出的Arm服务器芯片以外,在数据中心市场方面,Marvell 凭借着广泛的存储、计算、 安全与网络产品组合带来了同类最佳的构建模块与架构,以优异的总拥有成本满足了基础设施需求,在数据中心市场而占有一席之地。
这针对这些领域的布局,marvell也进行了多笔的收购,包括在2017年以约60亿美元收购Cavium,2019年收购以太网网络连接产品领域的Aquantia、格罗方德旗下Avera半导体子公司。2020年,他们还收购了光芯片厂商Inphi。近期,Marvell还宣布将收购供应云服务器以及边缘数据中心的网络交换芯片等产品的 Innovium。这些收购都将直接或间接地加强其在数据中心市场的发展。
如果说,向更多的领域做拓展,是这四大芯片厂商为数据中心市场的发展而打下基础。近期,这四大芯片厂商又不约而同地将目光投向了DPU市场。
在英伟达看来,数据中心路线图包括CPU、GPU和DPU这三类芯片。英伟达也在今年早些时候的博客中表示:“DPU(即数据处理单元)已经成为以数据为中心的加速计算模型的第三个成员,英伟达首席执行官黄仁勋在一次演讲中说:“这将代表未来计算的三大支柱之一。”这三者之间,CPU用于通用计算,GPU用于加速计算,而DPU在数据中心周围移动数据,进行数据处理。
因此,除了上文我们提到的,他们在CPU、GPU领域的成就外,他们也针对DPU这一市场进行了布局——去年英伟达发布了第一款DPU产品BlueField-2,今年的GTC上又发布了BlueField-3,BlueField-3会在明年上半年推向市场。
英特尔则在今年推出了名为IPU产品,按照英特尔的说法,英特尔官方的说法,IPU是一种可编程网络设备,旨在使云和通信服务提供商减少在中央处理器(CPU)方面的开销,并充分释放性能价值。在这种介绍下,也有人认为,这与当下主流的DPU作用类似。
而英特尔之所以能够在DPU领域取得成绩,这也离不开当时收购Altera。从DPU的本质上看,根据THENEXTPLATFORM的分析报告显示,在2020年,SmartNIC正在演变成DPU。SmartNIC可以通过从服务器的CPU上卸载网络处理工作负载和任务,提高云端和私有数据中心中的服务器性能。而针对多种SmartNIC的方案来说,由于FPGA是可重编程的,因此利用FPGA实现的数据平面功能可以任意并且实时地去除和重新配置,采用这种设计可以将网络功能提速几个数量级,因而,也被视为是数据中心市场发展的动力之一。
而赛灵思也是SmartNIC领域中的杰出玩家,据了解,该公司于2019年秋季收购了Solarflare Communications,并且Solarflare自2012年以来一直在构建基于ASIC和FPGA的NIC进行电子交易。由此来看,如果AMD收购了赛灵思,那么对于他们发展DPU来说也大有裨益。
除此之外,近期,Marvell也发布了一款DPU产品,根据半导体行业观察此前的报道显示,Marvell将推出OCTEON 10系列DPU,这是一个全新的SoC系列,建立在TSMC的5nm工艺节点之上,在这个处理器上,将首次展示Arm的新型基础设施处理器——Neoverse N2。根据公开消息显示,这将是Marvell第一个基于TSMC N5P工艺的芯片设计,实际上也是同类中第一个采用该工艺的DPU。
但对于未来数据中心市场的发展而言,这个市场可能会由这些芯片巨头厂商所主导,但并不意味着其他厂商没有机会,一些细分领域的巨头和初创公司也将会是这个市场中另外一股不可忽视的势力。目前根据媒体报道,国产服务器芯片已经完成32核心的3D5000芯片的研发,标志着中国自主芯片架构即将迎来收获期,服务器芯片更多的还是依赖大量的核心数量来完成算力任务,所以32核心国产服务器芯片完成研发,对于信创国产化事业来说无疑是一个巨大的好消息。
同时就像华为一样,备用芯片其实早就准备好,也就是大家熟悉的申威芯片,通过采用自研的申威芯片,我们的超级计算机将会彻底突破国外技术壁垒,真正走向自主可控的时代。
另一方面,政策方面的支持也是一大优势,近期,国内某银行举行6亿元的服务器招标,全数由国内的服务器芯片企业供应芯片,分别是深圳某科技企业的鲲鹏服务器芯片取得六成份额,海光服务器芯片取得26%的份额,飞腾服务器芯片取得12%的份额。随着更多国产芯片在服务器市场取得主导地位,国产芯片将在芯片市场的四大领域--服务器芯片、PC处理器、移动芯片、物联网芯片市场取得两个市场的主导地位,为未来最终形成国产芯片的生态提供支持。
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)