
首先得同时代的比较,同时代的服务器CPU和家用CPU,首先差距最大的是核心数,服务器的要执行各种并发任务,核心数通常比较多,这是服务器CPU的优点。
缺点就是CPU主频偏低,而玩 游戏 ,尤其是多人网游,或者是模拟经营性的 游戏 ,对CPU主频要求高,所以服务器CPU就不适合打 游戏 。
一般家用机配服务器CPU有两种情况:
1买新的。前几年的e3神教,那时候和家用机主板通用,性能也不低。
2淘汰的服务器CPU,主要是 游戏 挂机多开,工作室用的多,个人不建议碰,网上卖的各种i7级i9级都是这种。
一个是服务器CPU(目前很多大型 科技 公司都在建立自己的服务器基地:最出名的华为七星湖)
另一个含义:电脑上的cpu(普通)
先规定一下讨论的范畴,那就是这里只说X86架构的CPU,一般来说服务器CPU和普通CPU相比,往往有以下特点, 主频低,核心多,IO性能更强,更注重稳定性等方面 。
先看看主频部分,目前桌面处理器已经突破了5GHz,而服务器CPU的频率往往也就4GHz左右,核心数量越多,频率往往也越低,我们可以看看最新的AMD EPYC系列产品规格表,可以看到频率最高72F3是8核16线程的产品,主频才41GHz,而AMD桌面的8核16线程CPU早就是47GHz的水平了。
不过服务器的核心数量优势还是很明显的,最高达到了64核,不过最大单核主频只有3675GHz,而且服务器上面是 支持多CPU互联的 ,而桌面(含HEDT平台)就不支持这种技术了,而且目前桌面最高端产品R9-5950X最高也才16核心,不过单核最高频率达到了49GHz。
说完了频率和核心的差异,再来说说IO性能的差异,服务器的IO性能是可以秒掉桌面平台的,在内存支持方面桌面处理器还是双通道内存,而服务器CPU已经支持8通道了,在PCI-E通道数量上,服务器CPU也远超普通桌面CPU,可以看到AMD EPYC服务器CPU支持高达128条PCI-E通道,而桌面CPU往往也就支持20条左右。
稳定性这个就不用多说了,服务器往往都是7X24小时全年运行,其对稳定性的要求自然特别高,所以除了CPU,配套的主板内存这些往往也会注重稳定性,这样子的结果就是服务器开机自检相比PC电脑特别慢,搭配的内存规格往往也不高,很多服务器主板看上去也没有那么多的接口,看上去给人一种简陋的感觉。此外候服务器CPU会先采用新指令集,譬如Intel的AVX 512就是率先在服务器上采用。
看完服务器CPU和普通CPU的区别,相信很多人对服务器CPU的兴趣会减低很多,原因也很简单,那就是目前桌面CPU的核心线程数量已经足够大部分用户使用了,而且桌面处理器的频率比服务器高得多,所以在 游戏 性能上面,桌面CPU具有更好的体验。
总的来说,在今天服务器CPU对于个人用户而言,早就没有选择的必要了,现在已经不是当年了,当年桌面处理器上面最高也就4核心8线程,服务器CPU的核心优势很明显,现在桌面上8核心16线程不算什么了,16核心32线程也有了,服务器CPU早就不香了,如果不是玩家,真的没有必要去碰服务器CPU了。
服务器处理器擅长处理多个简单任务,比如同时处理数十万用户访问网页。PC处理器擅长单个或少数几个复杂任务。
服务器cpu拿来跑 游戏 会很痛苦的。适合多线程作业
缓存和指令集,最重要的是价格,普通玩家没必要要至强类的cpu
普通的CPU性能侧重于多媒体方面的应用,是需要和 *** 作系统配合,才能发挥其相关的能力的。常见的个人window7、windows10等系统都是这一类。
服务器CPU性能侧重于数据处理方面的应用!它的 *** 作系统有unix lnix windows2000 server等等!尤其是对各种数据库的优化!
所以架构和设计方面就有很大的不同。服务器CPU在在硬件的支持下,可以支持25651210242048个,或者更多数量的同时工作。也支持热拔插,就是带电作业!
服务器的CPU更加稳定,可以常年累月的不关机,并处于工作状态!而且有了其它硬件的配合,不死机,不蓝屏!目前很多淘汰的洋垃圾,就有至强和安腾处理器。无良商家就用这种服务器CPU忽悠小白们!淘宝、拼多多的所谓低价高配,相当于酷睿九代十代的电脑就是这么来的!
最后再说一下,因为使用的目的、场合不同,两者在设计制造的时候,就有很多的不同!比如电子电路的布局,一、二、三级缓存的设计!各种指令集,固件,都是不一样的!
最主要的区别就是服务器CPU性能稳定,能 *** 持724小时工作平衡状态
普通CPU性能根据工作状态需要即时调整,一般用于 游戏 方面,不能长时间工作
只是打打字,看看文章,两者倒是可以通用。
服务器CPU相比普通CPU,核心和线程数更多,但主频相对较低,不适合玩 游戏 ,稳定性和安全性更强,而且价格也相对较高。但英特尔的E3系列服务器处理器是个例外,e3处理器硬件规格和同代的i7非常接近,而价格比i7更低,玩 游戏 也没有太大问题,像e3-1230v3及前代处理器可以使用同代酷睿主板,由于性价比非常高,所以深受电脑玩家的喜爱,这些处理器也被称为e3大法。由于intel担心e3处理器影响i7的销量,所以对e3处理器进行封杀,像后续的e3-1230v5已经无法使用普通主板,必须搭配专用主板才能使用,另外价格也没有任何优势了,所以E3大法也就基本淡出市场了。
对于老百姓来说,价格是最明显的区别,从性能上来说,那就是服务器的更加稳定一些,容错性更高一点。其他的没啥差别,服务器cpu就是比家用更贵,更好,更稳定。同样级别的服务器要比家用贵很多,还必须用配套设备,不然光一个cpu体现不了专业的价值。
为什么有人说服务器CPU垃圾?
我觉得说服务器CPU垃圾的原因有两点
第一:主频低, 游戏 体验差点被当成垃圾什么是服务器CPU,就是用来给服务器使用的,服务器正常24小运行,对待CPU稳定性有很高的要求。另外要同时处理多个请求,但是每个请求并不是那么的复杂,为了满足条件服务器CPU就有了以下几个特点。
正是因为稳定,主频低才合适做服务器CPU,但是当我们把这类CPU拿来家用时,尤其是拿来运行大型的单机 游戏 ,这类对单核频率有要求的 游戏 来说,可能服务器CPU的表现就不那么的出色,自然很多使用过这类CPU的 游戏 发烧级玩家会觉得此类CPU很垃圾。
准确的说,可能没有没有认识到此类CPU的针对领域吧,杀牛用羊刀,自然不是那么顺手。
第二:配对主板少,山寨居多,易出问题被当做垃圾
服务器CPU绝大部分都是国外一些服务器拆机然后送到国内的,俗称“大船靠岸”,很多“自称垃圾佬的图吧大佬”喜欢研究的东西。
因为此类CPU的主板很难买到新的,因为生产这些的都去卖服务器了。市场上流通的都是一些拆机主板,大家熟知的华南,科脑、美可可等品牌,也是佩服他们。能魔改成适配的,当然质量上就大打折扣了。很多不懂的小白上车,可能用不了多久主板坏了。城门失火殃及池鱼,怪主板差的同时,CPU也被顺带看做垃圾了。
并且适配的主板如果是一线厂家生产的话价格很高,已经超出了同级别的家用电脑,主板贵,没人买,COU自然便宜,便宜了自然有人认为是垃圾。
我觉得服务器CPU并不是垃圾
看每个人怎么使用了,我个人还在使用者E3处理器,很好用,也不存在什么大的问题。关键看怎么选配,怎么去使用,合适自己的才是最重要的,而不是一味的认为服务器的CPU就是垃圾。
以上是我对这个问题的解答和观点,纯手打,实属不易,也仅表达个人观点,希望能给读者很好的参考,若是觉得写的还可以就给个赞吧。
服务器CPU好比大拖头,桌面CPU好比小轿车。你要拿大拖头来飙车显然飙不过小轿车。但你拿来拉重活试试。高清视频剪辑,3D建模渲染,多任务工作,那服务器CPU哪怕是上代的性能也是杠杠的,而且不用担心工作一半突然给你定住要你重启,倒是你拿来 游戏 ,那么显然不怎么样了。一个是赚钱的工具一个是拿来玩乐。怎么比?
我是很懒的,我才不自己买主板一堆东西自己配。直接买个淘汰下来的品牌工作站主机,除开机自检时间比较久,启动系统后就非常爽了。
很多人的印象中都觉得服务器CPU不值得购买,然而市面上很多服务器CPU都卖的很火,比如英特尔志强E5系列,动辄8核心、10核心的至强CPU只卖不到一千元,然而英特尔和AMD最新款的消费级10核心以上的CPU至少都在3000元以上,从核心数量来看,很多人就是冲着E5这类服务器CPU便宜量又足来的。
当然,对于主流应用和 游戏 来说,市面上大部分的服务器CPU都不太合适,一方面是因为这些CPU都是老旧服务器淘汰下来的,虽说核心数量多,但是架构较老,频率也不高,真要比玩 游戏 的话,这些动辄10核心以上的服务器CPU可能还不如酷睿I3效果好。另外,大部分的日常应用对多核心CPU的支持不佳,服务器CPU核心数量虽多,但是反倒派不上用场。
不过即使如此,像至强E5 2000系列的CPU仍然非常热销,工作室买来可以加速视频渲染和3D渲染,提高内容创作效率,还有的 游戏 工作室专门买这类CPU 游戏 多开,毕竟核心越多,越能承受多个 游戏 同时运行的压力,这是那些普通消费级CPU难以相比的。
有的人可能担心这类CPU的保修问题,确实这类服务器CPU基本都属于二手货,没法考虑保修问题,但是CPU正常使用中就很难损坏,唯一值得担心的反倒是主板,这从一定程度上就要看运气了,不过好歹这类平台的价格都不贵,如果是用个两三年坏了也算是用值了。
说服务器cpu垃圾的都是一些不思进取整天呆在家里打 游戏 的人
不是服务器CPU垃圾,而是人的认知没有到位,觉得对自己用处不大的东西就垃圾,实际上去看看服务器CPU的价格和家用CPU的价格,就知道服务器的CPU到底垃圾不垃圾,当然这里的价格是指一手的价格,不要拿那些洋垃圾的价格来说事情。服务器CPU和家用CPU相比,往往有以下特点,主频低,核心多3,IO性能更强,更注重稳定性。
所以对于普通用户而言,服务器CPU并不是很适合,其中影响最大的还是主频,在桌面处理器已经突破5GHz的情况下,服务器CPU的频率往往还在4GHz徘徊,而且核心数量越多的型号,其频率更低,譬如最新的AMD EPYC系列产品里面,我们可以看到频率最高的是8核16线程的产品,其主频也才41GHz,而桌面的8核16线程早就是47GHz的水平了,而最高端的EPYC产品,核心数量达到了64核,但是主频最高只有3675GHz。
而频率对于单线程的性能影响是很关键的,在 游戏 等项目上面,高主频的CPU往往具有更好的性能表现,这也导致了在 游戏 等方面的表现中,服务器CPU往往不如桌面CPU,而这个也是服务器CPU垃圾的主要原因,此外我们以AMD EPYC产品的价格为例,我们可以看到服务器的CPU价格远超桌面的产品,所以更加让人觉得服务CPU垃圾。
不过这些钱并不能说是白花了,服务器CPU在IO部分的表现是可以秒杀桌面处理器的,目前的桌面处理器往往也就是支持双通道内存,而服务器CPU直接支持8通道内存了,此外在PCI-E通道数量上面,服务器CPU的数量也远超普通桌面CPU,可以看到EPYC服务器CPU支持高达128个PCI-E通道,而桌面的往往也就是20条左右。
此外在主板的选择上面,服务器CPU往往也不会有很多选择,而且其考虑的也不是家用环境,所以对于普通玩家而言,其周边的配置往往也不合意,而且价格也往往很贵,这进一步让服务器CPU没有那么香了。
当然如果是洋垃圾的话,成本会便宜很多,整体成本可以做得比家用更低,但是主频低的问题依旧无解,主板的话,这个里面的水就比较深了,二手服务器主板,山寨板,HEDT平台的新主板都有,这也导致了搭配出来的平台良莠不一,出点问题就满天飞,给大家带来不好的印象。
总的来说,服务器CPU在今天对于个人用户早就没有必要了,桌面上面的8核16线程也算是很常见的配置了,16核32线程的产品也有了,已经不是当年最高4核8核心的时代了,服务器CPU早就没有那么香了,如果不是玩家的话,就不要去玩服务器CPU了。
服务器CPU垃圾——洋垃圾。
其实这应该分两方面说
在锐龙出现之前,一直是英特尔霸占着CPU市场,无论是双核、四核普通桌面级,还是六核、八核旗舰级,甚至连十核、十二核的服务器CPU也进入了不少家庭。
而多核心低主频的服务器CPU是从哪里来的,这成了他们洋垃圾称号的起源——新型号的太贵用不起,走进家庭的服务器CPU都是些便宜货,是从淘汰的服务器上扒拉下来的。
这样的CPU不好吗?没有什么不好,主频低、发热高而已,并没有太多缺点,性能来说,多核心给多任务、多线程软件提供了很多便利。
但是,这样的CPU需要搭配相应特殊的主板才可以使用,这才是真正有风险、被说成垃圾的地方。
像X58、X79这种主板,市面上很少买的到大厂产品,毕竟是卖服务器的。想要好主板只能买到拆机板。而这时候,科脑、华南、美可可等品牌的X58X79主板就应运而生了。而其做工、质量,都不可能跟技嘉华硕微星比较,但是售价也不低,四五百一张,而且豪华版的卖八百多。没办法,想用多核撑场面,就得靠这种主板,毕竟是新的,有售后。
随着锐龙一代上市,六核、八核的桌面级CPU才有机会走进千家万户,二代锐龙上市,进一步拉低了六核十二线程、八核十六线程CPU的售价,三代锐龙上市,一代二代锐龙价格更低,八核十六线程才一千多点,而且可以搭配质量过硬的大厂主板,还可以使用最新的技术——RGB、M2、XFR等。这时E5、E7才算是真正到了尴尬的时候——可玩性不高,就像是一头忠实的老牛,只能低头干活,没有任何趣味,而且主板随时翻车。
这就使原本自嘲的洋垃圾真正变成垃圾了——多核多线程的优势在锐龙面前不堪一击,主频没锐龙高,主板质量差。
虽然如此,这并不能说CPU如何如何,毕竟在英特尔挤牙膏的那些年,E5E7填补了多核多线程的空白,而且错不在CPU在主板。要用发展眼光看待它们,它们只是跟不上这两年的 科技 步伐了。如果手里还用着E5的用户,请善待它们,它们很老了,但是依然勤勤恳恳。如果新用户装机,买新不买旧就是说给你们听的,感受 科技 的魅力吧。
服务器CPU一点儿也不垃圾。
华南X79主板烈焰战神,CPU是 E5-2680V2,32G服务器内存,性能杠杠的!
要是追求单核频率高些,2643V2很划算,主频35G,六核心十二线程。2667v2,2673v2都很好。
玩 游戏 也不差,配个好点儿的显卡就行了。
x99先进些,2678v3很流行,实际体验没多大差异。
主板要用大板,两个或三个显卡插槽。要有m2接口,快很多。四个内存插槽,方便组成双通道。
不 服务区cpu并不垃圾 反而性价比还很高 我做视频剪辑 用的就是工包主板x79加至强E5的服务区CPU还用了ECC服务区内存 价格低 性能好 其实适用才是王道 如果你玩大型 游戏 的话 主频高的普通版本的cpu很适合 但是如果你好做视频 图形图像处理的话 服务器的cpu 你可以考虑一下啊 不会让你失望的
因为这些人基本就是没玩过这类CPU,另一方面主要是支持这类CPU的主板太少,而大部分支持这类CPU的主板都是小厂,其实服务器U类别很多,其中不乏有一些最贴近普通PC的单路U,比方说当年的E3 1230,这些CPU都是核心数不高但是主频还是非常不错的,一般都是用来做高性能工作站使用的,这种一般就是I7类型的服务器版。
还有现在的多路服务器CPU的中高端产品,核心数量都是可以动态调整的,比如说AMD的宵龙,动态调整核心,其玩 游戏 也是非常厉害的。
其实我们很多时候概念还是停留在过去的思想里面里面,其实现在我们的 游戏 已经对多核做过很好地优化了,虽然服务器版的主频很低,但是你会发现 游戏 帧速率并没有拉到多地,这说明服务器版的CPU在 游戏 方面还是可以完全胜任的。
另外很多人喜欢搞服务器CPU主要是因为服务器CPU便宜,U便宜,内存也非常便宜,随便上个64GB的内存也花不了多少钱,最重要的是现在很多经典的服务器CPU也有高主频的,即使在玩 游戏 方面也十分充足。
另外造成一个最大的误解,就是很多人说服务器CPU垃圾,其实真正的原因是你不会选择,有些CPU天生下来就是为了稳定性,比如一些文件服务器用的2450/2650,其核心主频是非常低的,但是核心数多,其主要目的就是为了保证稳定性,你说你要是用这种服务器CPU玩 游戏 那就太难为他们了,因为时钟频率太低了。因为低功耗问题这类服务器CPU阉割了大量的ALU单元,其逻辑运算单元完全无法保证复杂的大量逻辑运算,玩 游戏 当然卡不说帧数还上不去。
你可以淘那些从提供服务器虚拟化那种的CPU,其主频高ALU单元多,虽然在寿命方有损耗但是不影响你玩 游戏 。总之服务器CPU要看你会不会选择,并且有更好的主板支持的话,我觉得在很多方面吊打消费级CPU是没有任何问题的,尤其是性价比方面。
专业专用
有一说一,一个东西设计成什么样的,大家最好就按照什么样的用法来用。
相信很多朋友没买过云服务器,所以我先讲讲怎么玩云服务器。首先你要挑一个看着顺眼的厂商,然后花钱买(其实应该叫租)一定时长的服务器资源,然后厂商就会给你分配一个虚拟机,这个虚拟机就等于是你自己的了,可以随便怎么玩,比如打个小网站、挂个下载器当网盘之类的都可以。而这些厂商会为大量用户提供这种服务,那么大家应该也可以想到,这些厂商使用的服务器CPU应该具有一下特征: 主频低,核心多,可以同时支持大量并发。
但是这些特性,和我们家用用户基本完全没什么关系。一般的 游戏 和应用对多核的优化不是那么完善,多核特性用处不是很大。主频低会导致很多需要单核性能的应用和 游戏 卡顿。综合起来,你说使用体验能好吗?
英特尔挤牙膏很多人用服务器CPU的很大一个原因,其实是因为当年英特尔没啥对手,家用CPU性价比不高。当年我混迹显卡吧的时候,看到很多人装机用的都是服务器的那款E3V2, 当时的家用酷睿系列的处理器价格高,但是单核性能对比服务器CPU来说拉不开差距,结果就是性价比被完爆。
不过这种情况现在应该是不存在了,AMD自从出了锐龙系列处理器,英特尔有了竞争对手,再也不敢挤牙膏了。所以现在这个时段,家用装机,正常挑选一款家用CPU就可以了,没必要在迷信当年的经验去用服务器CPU。如果你还要头硬去用的话,很可能会因为主频低,运行 游戏 卡,而发出类似本问题的抱怨: “为什么服务器CPU这么垃圾”
x86、arm都有。
1、在x86架构方面,浪潮推出了诸如NC8000、NF5486M5、RH5885HV3等多款服务器产品,搭载英特尔Xeon处理器或AMDEPYC处理器,通常用于企业级应用、云计算、大数据分析等领域。
2、在ARM架构方面,浪潮推出了基于华为鲲鹏处理器开发的TaiShan200(Model2280)服务器、TaiShan200(Model5300)服务器等产品,主要应用于边缘计算、人工智能、物联网等新兴领域,具有低功耗、高性能等优点。
根据Intel之前的说法,2020年他们将首次推出两代服务器处理器,升级换代的间隔大幅缩短到4-5个月时间,其中一个是14nm工艺的Cooper Lake,另外一个是10nm工艺的Ice Lake-SP。
在目前的两代至强可扩展处理器中,14nm工艺的Skylake、Cascade Lake系列都是最多28核,这是14nm工艺下原生多核的极限,但是10nm工艺呢?之前传闻Ice Lake服务器版的核心数也不会增多,这样的话对阵AMD的64核处理器时候就更没什么机会了。
韩国网站日前在介绍华硕服务器产品线时意外泄露了Intel处理器平台的路线图,其中有些资料跟之前泄露的就不一样了,尤其是Ice Lake系列的具体规格。
Skylake、Cascade Lake这两代的处理器已经发布,不一一介绍了,14nm节点还有Cooper Lake,预计2020年Q2季度问世,Socket P+eack,最大功耗300W,这个指标比前面两代14nm工艺处理器大幅提升, 因为它实现了没插槽最多48核处理器,大幅超过了最多28个原生核心的限制 。
Cooper Lake的这个48核倒是容易解释,Intel在Cascade Lake-AP处理器就实现这个水平了,通过MCM多芯片封装,将2个Cascade Lake处理器封装为一个处理器就能让核心数大幅增长, 之前Intel做过2个24核的、2个28核的,实现了56核112线程的巨大提升 。
但是10nm Ice Lake处理器的核心数就不好解释了, 上面标注的是38核,TDP功耗也是270W,比普通28核的14nm处理器的205W大幅增加 ,增幅基本上跟核心数增加呈线性比例。
这个38核怎么来的呢?假如跟前面的48核Cooper Lake一样也是胶水MCM封装,技术上没问题,但实在没必要,更何况14nm都做到48核了,10nm没理由再搞个38核的,越做越少是没道理的。
排除这一点,那就意味着10nm Ice Lake处理器可以 做到原生38核或者更高了,也代表着Intel终于可以超越28核,在高性能服务器芯片市场上通过提升核心数的方式来跟AMD的EPYC霄龙处理器竞争了,虽然总核心数还是落后很多。
考虑到10nm工艺的晶体管密度达到了1亿/mm2,是14nm工艺的27倍,Intel技术上显然是可以做到更多核心的。
除此之外,10n Ice Lake处理器其他规格也先进不少,8通道DDR4-3200内存虽然没提升, 但支持二代非易失性傲腾内存,而且也加入了PCIe 40支持了 。
近年来,在服务器和数据中心等企业级市场,AMD凭借持续更新的“Zen”架构,其EPYC(霄龙)系列处理器的市场占有率上升势头非常迅猛。2022年11月,AMD推出全新第四代EPYC处理器。新处理器将单插槽处理器核心数量提升到最多96核,并且采用了最新的“Zen 4”架构,带来大量全新特性。接下来,本文就对第四代EPYC处理器进行详细解读。第四代EPYC处理器:EPYC 9004系列登场
在解析AMD第四代EPYC处理器的架构之前,我们先来梳理一下它的型号定义,因为在这方面它与上代产品存在显著差异。
此前,AMD采用EPYC 7000系列作为原始命名。最后一位数代表不同代次,比如EPYC 7001、EPYC 7002和EPYC 7003就分别代表三代不同的产品,其中又包含大量细分型号。在第四代EPYC处理器上,AMD改用了EPYC 9004作为产品基础代号,这可能是考虑到本代产品具备极为显著的性能提升。同时,在大多数人的概念中,“9”相比“7”显得定位更高、性能更强。第二位数字代表处理器核心数量,其基本对应关系如下表:

第三位数字代表性能情况,数字越大则性能越强,目前由2~7的不同数字组成。如果AMD愿意,未来还可能进一步扩展到9。最后一位数字则固定为“4”,代表第四代EPYC处理器。
打开APP查看高清大图
▲AMD详细解读了EPYC 9004产品命名情况
打开APP查看高清大图
▲AMD将EPYC 9004产品分为了三类:追求核心密度的产品、追求平衡和优化的性能的产品以及追求核心性能的产品。
AMD本次发布了18款EPYC 9004系列处理器,分为3个大类,分别是追求核心密度的产品、追求平衡和优化的性能的产品以及追求核心性能的产品,具体规格见下表。
打开APP查看高清大图
打开APP查看高清大图
▲EPYC 9004、EPYC 7003、英特尔第12代酷睿、锐龙7000以及英特尔第11代酷睿处理器(从左到右)的外观对比,可以看到EPYC 9004大了不少。
计算和扩展的领先地位:EPYC 9004技术架构一览
毫不夸张地说,EPYC 9004是目前市面上最先进的企业级产品之一。它在CPU架构、Chiplet应用以及互联方式上,几乎都是当前技术条件下所能达到的极致。这一次,AMD在超大规模的企业级产品研发上进入了一个新的层次,短时间内,能超越它的只有AMD自己的下一代产品。
设计目标:拥有扩展和计算性能的优势地位

▲AMD EPYC 9004的设计理念
按照惯例,我们先来看看EPYC 9004的设计理念和实现情况。AMD EPYC 9004的设计理念就是继续保持计算性能和扩展能力的优势地位。AMD分四个方面进行了阐述:首先是拥有最先进的单核心性能和单插槽性能,这依靠最新的Zen 4架构和5nm工艺实现;其次是配备超大的内存带宽和容量,这依靠12通道的DDR5内存来实现;第三是采用全新的下一代IO接口,这包括最大160通道的PCIe 50控制器以及可以利用CXL协议扩展的内存寻址功能等;第四则是加密计算方面的新进展,主要通过CXL以及2倍的SEV-SNP功能来实现。

▲EPYC 9004和上代产品的性能比较情况
根据AMD官方数据显示,和EPYC 7003系列的顶级型号EPYC 7763相比,EPYC 9004系列中的顶级型号EPYC 9654能够在云端、HPC和企业级性能方面分别领先107%、123%以及94%。AMD宣称第四代EPYC处理器是全世界最好的数据中心处理器,拥有最快的数据中心性能、领先的能源效率、优秀的TCO表现、安全的加密计算能力以及丰富的生态系统。

▲AMD EPYC 9004的宏观布局
为了达到这些设计要求,EPYC 9004在结构上依旧采用了Chiplet设计,布局在中间的是全新设计的IO芯片,周围的CCD单元数量增加到12个。每个CCD中依旧包含了8个CPU核心和相应的缓存,以及32MB L3缓存。EPYC 9004核心数量大增的原因是CCD数量从上代产品的最多8个增加到了最多12个,这使得它最多能提供96核心192线程。
Zen 4架构:IPC提升14%
AMD在企业级产品和消费级产品上采用了同样的核心微架构:EPYC 9004和桌面锐龙7000系列都是最新的Zen 4架构。有关Zen 4架构,本刊在之前锐龙7000首发文章中曾有过介绍,本文再简单回顾一下。

▲Zen 4微架构及改进一览
AMD Zen 4架构是基于Zen 3架构改进而来,在架构设计上,AMD希望实现更高的性能、更低的延迟和更好的能效比。其中性能的提升来自频率和IPC的提升;更低的延迟主要是提升了缓存的性能并且降低了整个架构的平均延迟;能效比方面则通过新设计、新工艺以及将移动端的一些技术移植在桌面端,降低了整个CPU的动态功耗。

▲Zen 4架构相比Zen 3架构的重要提升
具体来看,Zen 4架构在分支预测、Op缓存、指令排序相关窗口、整数或浮点寄存器、每核心更深的缓冲区、后端读取和加载等方面进行了优化。特别的变化是另外加入对AVX-512指令集的支持,以及重新调整的每核心1MB、8-way L2缓存。
前端方面,分支预测部分有大幅加强。AMD使用了一个更强有力的分支预测单元,每周期可以执行2次分支预测。此外,L1分支目标缓冲区的容量提升了50%,达到15K条目,L2分支目标缓冲区则达到7K。Zen 4还拥有更大的Op缓存、更大的指令回写队列,它们在很大程度上提升了处理器的前端性能。
执行单元部分,Zen 4没有提升执行单元的数量,而是持续增大重排缓冲区。它增加了浮点/整数寄存器的体积,整数从192增加至224,浮点从160增加至192,核心缓冲区达到320条目。执行单元方面依旧是每周期10个INT和6个FP。
后端的读取和加载部分,Zen 4拥有更大的读取排序单元,更少的缓存端口冲突以及增大50%的L2 DTLB。另外依旧拥有每周期3个内存 *** 作,最多每周期3个读取和2个写入。
缓存方面,最明显的改变是每个核心的L2缓存翻倍到1MB,这样可以降低CPU核心的未命中率并提升命中率,同时也降低了从L3和内存读取数据的几率。但是由于L2缓存增大,延迟也相应提升,L2和L3的延迟分别增加到最多14个周期和最多50个周期。

▲AMD在Zen 4上设计了全新的AVX-512引擎,和英特尔的路线有巨大差异。
在指令集方面,Zen 4实现了对AVX-512指令集的支持。Zen 4采用了2个AVX 256来合并执行1个AVX-512,而英特尔采用了独立的AVX512 SIMD核心。AMD的设计可以节省晶体管资源,并且不需要降低频率来运行AVX-512。但是当同时执行AVX2和AVX-512的时候,则必须完成一个后再执行另一个。AVX-512比之前Zen架构多核心执行FP32的工作效能提升了30%。此外,Zen 4也实现了对BF16数据格式的支持,这是AI计算中新兴的一种重要数据格式。

▲在启用AVX-512后,相关性能得到了巨大提升。
根据AMD官方数据显示,在支持AVX-512后,使用2路EPYC 9654(192核心)对比2路EPYC 7763(128核心),在NLP、图像识别以及物体检测的吞吐量测试中,前者的领先幅度分别达到42倍、3倍和35倍。
AMD还给出了Zen 4相比Zen 3的性能改进情况。总的来看,Zen 4有大约14%的IPC提升。其中贡献最大的是前端的改进,其次是存储和加载部分,再次是分支预测部分,执行部分和L2部分的改进带来的性能增幅则相对较小。在发布锐龙7000系列的时候,AMD给出的IPC提升数据是13%,所以这里提到的14%应该是根据服务器所面向的不同负载重新测试而来。

▲AMD Zen 4架构在服务器端取得了14%的IPC提升
最后再来看看安全方面的内容。Zen 4架构目前支持安全加密的虚拟化,包括SEV-ES、SEV-SNP,内存加密支持AES-256-XTS,支持最多1006个加密的客户机以及多主机秘钥SMKE。此外,它还支持虚拟化X2APIC、免SMT攻击和额外的SPEC_CTL功能等。
12通道DDR5内存
每核心带宽至少比上代产品提升50%
所有EPYC 9004系列处理器都支持12通道DDR5内存,相比上代支持的8通道DDR4内存有巨大进步。从内存带宽来看,DDR5的使用在很大程度上缓解了超多核心处理器内存带宽不足的情况。

▲AMD在EPYC 9004上全面启用DDR5内存
举例来说,上代EPYC 7763拥有64个核心128线程,支持8通道DDR4内存,内存总带宽为2048GB/s,平均每核心32GB/s。新一代的EPYC 9654拥有96核心192线程,支持12通道DDR5内存,内存总带宽为4608GB/s,平均每核心48GB/s。EPYC 9654在处理器核心数量更多的情况下,每核心内存带宽提升了50%。如果是48核心或者32核心产品,每核心内存带宽的提升会更大,这为内存带宽敏感型应用带来了极为不错的性能提升空间。

▲EPYC 9004的内存架构和特性一览
从AMD官方给出的实际测试数据来看,EPYC 7003系列的实际内存带宽大约为154GB/s,EPYC 9004则高达356GB/s,是前代产品的大约23倍。延迟方面,由于EPYC 9004支持的DDR5内存容量更大、通道数量更多,因此延迟有所上升。EPYC 9004的SoC延迟大约在73ns左右,设备延迟大约是45ns左右,因此总延迟在118ns左右,而EPYC 7003的对应数据分别是70ns、35ns和105ns。从整体上来看,EPYC 9004的延迟略高,但是考虑到它拥有更大的带宽,这一点是完全可以接受的。

▲EPYC 9004的内存性能情况
在内存容量方面,所有EPYC 9004系列处理器都支持高达6TB容量。不过目前AMD只给出了1DPC(DIMM Per Channel),也就是12个内存通道、12条内存插槽下的配置情况,内存最高支持12通道的DDR5 4800。至于2DPC配置,AMD宣称会在2023年第一季度再公布详细信息。不过考虑到EPYC 9004不小的面积,12通道DDR5内存插槽所占的体积以及接近400W的CPU供电所需要的PCB面积,未来出现24通道、48插槽的2DPC主板的可能性较低,并且6TB内存对大多数应用场景来说已经足够了。

▲EPYC 9004设计有内存分区管理
最后再来看看内存分区。由于EPYC 9004系列处理器的规模很大,因此AMD也提供了NUMA域的管理和设置,使得用户可以在某些情况下对内存和核心进行调配。它包括了NPS1、NPS2和NPS4三种分区方式:NPS1就是整个处理器;NPS2是将处理器分为2个部分,每个部分有6个内存通道和6个GMI3接口;NPS4则是将处理器分为4个部分。
IO芯片和总线连接系统:采用最新的GMI3连接
AMD在EPYC 9004上继续采用大获成功的Chiplet方案。整个处理器除了CCD之外,还有一个IO芯片。EPYC 9004的CCD由台积电5nm工艺制造,这也是首个使用5nm工艺的企业级CPU产品。IO芯片也采用了台积电6nm工艺制造。

▲EPYC 9004架构简图和特性一览
因为EPYC系列一直采用Chiplet方案,因此在CCD和IO芯片之间需要通信协议予以连接。上一代EPYC处理器采用的是GMI2总线,其IO芯片内部有8个GMI2总线端口,因此总共能支持8个CCD单元连接,每个CCD拥有2个GMI总线接口,可以根据需要进行配置。

▲EPYC 9004的Chiplet连接图一览
EPYC 9004升级为GMI3总线。其中Zen 4架构的8个CCD和12个CCD采用的是每个CCD与1个GMI3总线互联,4个CCD架构中每个CCD通过2个GMI3总线进行互联,从而实现
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)