X86和ARM架构的处理器能效差异

X86和ARM架构的处理器能效差异,第1张

姓名:韩政

学号:16010188021

嵌牛导读:在大一下学期嵌入式微处理器原理这门课程中,我们学习了arm cortexM3的架构。其中老师说到了X86与ARM架构处理器能效有很大差异从而引发探索。

嵌牛鼻子:架构  指令集

嵌牛提问:X86和ARM架构的处理器能效差异为什么会这么大?

嵌牛正文

ARM处理器本身定位于嵌入式平台,应付轻量级、目的单一明确的程序,现在应用在移动设备上正是得心应手。x86定位于桌面和服务器,这些平台上很多应用是计算密集型的,比如多媒体编辑、科研计算、模拟等等。因此将x86和ARM在移动环境下做对比得出“差不多”是不好的。

由于定位的不同,ARM处理器基于精简指令集(RISC)架构。指令集数量少就可以简化硬件逻辑的设计,减少晶体管数量,也就意味着低功耗。而且由于移动平台应用通常简单,程序的控制流不复杂,执行效率没有必要很高,所以流水线、分支预测等硬件逻辑都比较简单。这些都降低了晶体管总量。同时因为移动设备有电池的能源限制,ARM的电源管理是作为重要部分特别设计了的。比如移动设备的处理器在待机时通常只以极低的主频在运行,甚至可以暂时关闭闲置的核心、协处理器来降低功耗。

x86就截然不同。x86是复杂指令集(CISC)架构,存在很多机器指令,只为了高效地完成一项专门任务(比如MMX, SSE中的指令)。这就使得硬件的逻辑很复杂,晶体管数量庞大。为了高效地进行运算,x86架构有较长的流水线以达到指令级并行(ILP)。长流水线带来的一个弊端,就是当遇到分支时,如果预载入分支指令不是未来真实的分支,那么要清空整个流水,代价较高。所以x86为此还必须有复杂的分支预测机构,确保流水线的效率。再加上多级cache,支持超线程、虚拟化等等,x86的复杂度其实相当高。

硬件层面,这两种处理器的设计初衷可说是背道而驰的,目前看来,x86架构在移动计算站稳脚跟很困难,而ARM之类的RISC架构也无法在较复杂的应用中表现很出色,例如高性能计算等领域。

至于发热量和功耗,一则因为x86处理器要包含很多指令集,这用去了不少晶体管,二则因为内部逻辑比较复杂,也用去了不少晶体管。所以它从架构上讲,做到低功耗其实很困难,intel号称可以讲功耗做到数百毫瓦,但那是在CPU闲置进入C5或者C6 state的时候的功耗,相当于某些低频ARM处理器正常工作的功耗。

总结来看:

1、精简指令集就意味着更小的芯片,更少的晶体管工作。CISC相比于RISC有更多实现单一功能的晶体管结构(言外之意它们被使用的频率并不高),而这部分晶体管在不工作的时候会提供不小的静态功耗。

2、ARM在无指令处理的时候可以休眠,而X86在无指令处理时只是降低工作频率而已

3、ARM一般都有协处理器共同工作,比如GPU

在英文里这两者都叫server(服务器),小型机是国内的习惯称呼。pc服务器则主要指基于intel处理器的架构,是一个通用开放的系统。而不同品牌的小型机架构大不相同,使用risc、mips处理器,像美国sun、日本fujitsu等公司的小型机是基于sparc处理器架构,而美国hp公司的则是基于pa-risc架构,compaq公司是alpha架构,ibm和sgi等的也都各不相同;i/o总线也不相同,fujitsu是pci,sun是sbus,等等,这就意味着各公司小型机机器上的插卡,如网卡、显示卡、scsi卡等可能也是专用的; *** 作系统一般是基于unix的,像sun、fujitsu是用sun solaris,hp是用hp-unix,ibm是aix,等等,所以小型机是封闭专用的计算机系统。使用小型机的用户一般是看中unix *** 作系统的安全性、可靠性和专用服务器的高速运算能力,虽然小型机的价格是pc服务器的好几倍。
pc服务器一般用的 *** 作系统是安全性、可靠性稍差的windows 2000/windows nt4。目前造成windows nt口碑不佳的原因其实多少也在于大家对microsoft的偏见,其实windows nt安全性、可靠性和运算速度并不差,尤其是其windows2000发布以后,而windows2000针对服务器市场又分为多个版本:windows2000 server、windows2000 advance server、windows2000 datacenter server。目前在湖南长沙服务器 *** 作系统市场上的ms windows 2000/nt市场占有率在50%以上,而且windows nt在 *** 作界面的易用性、通用性、易开发性、大量的应用软件支持上有绝对的优势;另外,pc服务器还可以支持现在流行的linux、sco unix、solaris for x86等unix *** 作系统,对于文件和打印服务器novell netware *** 作系统也是一个不错的选择。相对而言,pc服务器具有较高的性能价格比,通用性是其最大的一个优点,会使用pc机就可以很容易地使用pc服务器,它的硬件结构与pc机差不多,用户心里有底;它的 *** 作系统一般是windows nt/2000,又对用惯windows 95/98的用户来说容易掌握,而且应用软件也更丰富。另外,价格便宜也是pc服务器的优势,价位处于pc机与昂贵的小型机之间,具有最佳的性能价格比。

眼下,中国共计装有近2亿个视频监控摄像头,而具备AI能力的摄像头仅占其中的1%。

在高清监控摄像头数量与AI渗透率不断递增的情况下,由摄像头采集的图像、视频流数据,需要更强大的分析引擎对其进行分析、处理和训练。

以北京地铁站为例,北京1000多个地铁站中平均每站都有上百个摄像头,平均每个地铁站每天流通8到10万人较为常见。保守预估每个相机每天看见1万个人,再假设对比库中有1万个目标(对于公安数据库来说并不大),这个相机每天要回答的问题就是一亿零一万个!

显然,在当前各类安防项目中,依靠纯嵌入式智能DVR和NVR均无法满足严苛的计算要求。

面对万亿级AI安防市场,在技术落地成花的十字路口,所有的安防企业高管们都会面对一个终极命题:AI安防究竟需要一款怎样强大的服务器?
谈到安防服务器,X86无处不在,一直以来,它都是包括安防在内等多个行业的“宠儿”。

“眼下安防市场很多的管理平台,譬如流媒体服务器、转发服务器、主控服务器基本基于X86架构建设,它的最大优势是比较容易开发、上手比较快,大多工程师更擅长在X86架构上做研发。”

华泰科捷CEO傅剑辉告诉雷锋网,考虑到它表现不俗的性价比,X86服务器一直都是我们采购的首选。

由此,过去多年来,X86服务器也获得了全球顶尖服务器供货商的青睐。

遗憾的是,各科成绩均“达标”的 X86服务器,在如今大热的AI浪潮面前,却遇到了一些“偏科”难题。

傅剑辉透露,从安防用户实际使用角度考量,目前X86服务器应用在安防行业主要存在三大问题:

一、CPU负责逻辑运算的单元并不多,在多任务处理时效率低下。面对海量视频信息,传统X86服务器单纯以CPU为核心的数据中心部署已经不能很好地满足并行灵活计算、多变环境的计算需求,很难在安防企业级服务器市场有惊艳的表现。

“以前的视频数据只需存在后台,做少量分析即可,也就是说存储足够大就行;今天,很多客户都希望我们能够实时处理这些海量视频信息并反馈结果,而这就意味着系统需要同时做解码、做视频结构化、做识别、搜索等等,X86明显就不够用了。”

换句话说,X86可以类比手机里的功能机,它能够满足单一的通信处理需求,而AI融入的安防市场,更需要一台强大的智能手机,配备更强大的性能以适配 游戏 、处理等个性需求。

二、在行业出现算力不够的大背景下,很多厂商打出X86服务器加上若干GPU卡的组合拳,而这种为了单纯解决算力而“拼凑”出的方案大大增加了服务器的功耗和用户成本。

从行业采用情况看,如果涉及人脸识别等AI项目时,大部分厂商会采用GPU作为人像数据结构化的处理单元,特别是在X86服务器集群中,GPU更是成为唯一选择。

在某种程度上,GPU的确解决了部分算力不足的问题,却也存在两个致命硬伤。

一是功耗大,需依托X86架构服务器运行,不适用于更为广泛的AI方案开发; 二是成本高昂,比如采用GPU方案,折算单路人脸识别成本在万元以上,相较其他千元级,甚至是百元级的方案,毫无成本优势可言,这两个致命短板,也让很多企业不得不寻求新的方案。

三、由于X86更多采用的是较为开放的LinuX系统,而非封闭的AIX系统,在稳定性和可维护性上略显不足。

“未来的市场必定是数据规模和计算能力的角逐。”

浪潮商用机器有限公司产品部张琪告诉雷锋网,随着越来越多新应用的出现,传统的X86计算架构会遇到很多瓶颈,包括数据瓶颈(处理器的计算单元以多快的速度获取和交换数据)、计算瓶颈(单位空间内能集成多少计算能力)、延迟瓶颈、通信瓶颈。

就像设计时速30码的道路难以承载均速100码的车辆通行一样,很短时间内就可造成道路拥堵甚至瘫痪。

今天来看,面对大计算、智能化场景,谁能够最先解决算力问题,又能够更好降低功耗与成本,谁就能在AI浪潮下引领鳌头。

在张琪看来,基于POWER9的高性能服务器能够很好满足AI安防时代下的高智能需求。
从AI安防实际场景所需出发,浪潮商用机器有限公司近期推出了基于POWER9服务器,搭载UltraVision视频智能分析系统的AI视觉分析智能分析解决方案(UltraVision on Power)。

AI视觉分析解决方案可以看作一个超级高效的AI大脑,它软硬结合,能够实时、准确、智能、节能地完成包括安防在内各个行业所需的复杂性数据处理工作。

“硬”,体现在POWER9架构上,它能够提供强大的图像视频的计算处理能力。相比其他处理器,POWER9支持了PCIe40、NVlink20等新一代I/O协议,能够在AI等应用中展示出更好的应用表现。

具体来看,相比X86,其单节点视频处理路数提升近3倍,达38倍提升深度学习框架AI模型训练效率,18倍更好的加速数据库性能,IO能力提升了近5倍。

另外,执行视频和图像编解码,查询搜索任务时,整机可提供单精度56TFlops和双精度28TFlops超强算力,和比X86服务器相比,单块GPU即可提供比纯CPU服务器高30倍的推理能力。

值得一提的是,该方案独有的CAPI技术,可以将延迟降低至1/36,全面加速图像处理,同时功耗降低高达30%。

18倍、38倍、3倍、5倍、30倍,看起来不大的几个数字对于安防行业来说,都是庞大数量级的提升。

这几个数字的变化,能够将各类犯罪和严重的暴力事件的防控手段从事后介入提前到事前或事中,大大减少安全事件的发生,实现公共安全从被动防御到主动防御的业务转变。

除了POWER9提供的超强算力硬核外,在软件层面,该方案还有高重UltraVision视频智能分析技术加持,如目标检测(PD)、行人重识别(RE-ID)等多项计算机视觉技术,提升目标识别准确率高达94%。

毋庸置疑,软硬结合的AI视觉分析解决方案在实际落地过程中,能够实实在在地为用户解决AI时代下的高算力与低功耗问题。

除此之外,相比其他热门方案,该方案还有两大优势不得不提。

其一、独有的利旧能力降低客户成本。

通常来说,一般的AI视频系统想要实现某些功能必须接入具备AI技术的感知摄像头,该方案在部署过程中不需要更换原有摄像头,只需要旁路接入视频采集端,即可实现AI系统;

另外,该方案还可以兼容不同品牌、不同制式的任何摄像头;可以不改变客户原服务器等硬件架构的情况下直接部署,有效降低客户部署成本。

其二、就浪潮商用机器公司本身来说,依托其在服务器领域的引领地位,拥有强大的定制化落地能力,缩短交付周期从月到天。
该方案无论是面对大数据处理、机器学习这样的AI应用,还是软件定义存储、内存数据库这一类的开源应用都会有比较好的性能表现。

毫无疑问,专为AI、云计算、大数据等新兴应用而生的AI视觉分析解决方案在客户面对严苛业务挑战时,提供了更多元化的选择。

依托这款高性能产品,用户可以更快地部署各类智能应用,缩短安防AI应用的技术迭代周期。

与此同时,性能卓越的浪潮商用机器服务器的应用不仅限于安防行业,在互联网、金融等对安全性要求高的领域,其也可以施展拳脚。

安防之外,整个 社会 正在向规模化、自动化、智能化转型升级。其中,智能化的应用方向涵盖四大方向:前端化、云端化、平台化和行业化。

在这个升级过程中,新的平台需要有新的能力做新的认知,新的认知催生新的需求和应用。

对于包括浪潮在内的 科技 公司来说,这是一次巨大的机会,同时也是一个不小的挑战,路漫漫其修远兮,必须上下而求索。雷锋网雷锋网雷锋网


欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/zz/12585914.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2025-08-26
下一篇2025-08-26

发表评论

登录后才能评论

评论列表(0条)

    保存