
1、芯片:低功耗、高可靠性的半导体芯片应用广泛,MCU/SoC逐渐渗透物联网领域。MCU芯片复杂度较低,适用于智能设备的短距离信息运输,主要应用于智能家居、消费电子、医疗保健和工业电子等领域;SoC芯片系统复杂度较高,集成功能更丰富,支持运行多任务复杂系统,可应用于功能较复杂的嵌入式电子设备,应用于无人机、自动驾驶和工业互联网等领域
2、无线模组:为物联网提供网联能力的基础硬件,将芯片、存储器和功放器件等集成在一块线路板上,并提供标准接口,在物联网产业中处于承上启下的中间环节,向上连接芯片行业,向下连接各类终端设备,终端设备借助无线模组实现通信或定位的功能。
3、传感器:作为物体的“五官”,传感器承担采集数据、感知世界的重任,不断向智能化、高精度、微型化的方向发展,市场空间广阔。传感器与MEMS结合是当下技术的新趋势,MEMS传感器集成通信、CPU、电池等组件及多种传感器,具有体积小、功耗低、成本低、集成度高、智能化特点,广泛应用于消费电子、医疗和车联网等领域。
涉及企业:
芯片
翱捷科技:具备全球稀缺的全制式蜂窝基带芯片研发能力的平台型芯片设计企业。2015年成立以来一直专注于无线通信芯片的研发和技术创新。公司各类芯片产品可应用于手机、智能穿戴设备为代表的消费电子市场和以智慧安防、智能家居、自动驾驶为代表的智能物联市场。
先科电子:领先的高质量模拟和混合信号半导体产品供应商。成立于1960年,主要为客户提供电源管理、保护、高级通信。人机界面、测试与测量以及无线和感应产品方的专有解决方案。
广芯微电子:成立于2017年,一家为客户提供创新解决方案的集成电路设计企业,公司开发包括面向工业物联网(IIoT)并支持边缘计算的专用处理器芯片、面向LPWA的IoT连接专用芯片、IoT基带处理器芯片、以及应用于传感器信号调理的专用芯片。
华为海思:全球领先的Fabless半导体与器件设计公司,前身为华为集成电路设计中心,2004年注册成立实体公司,提供海思芯片的对外销售及服务。
联发科:全球第四大无晶圆半导体公司,联发科技的核心业务包括移动通信、智能家居与车用电子,着重研发适用于跨平台的芯片组核心技术,联发科的芯片经过优化,能在极低散热量且极度节能的模式下运行,以延长电池续航力,时时刻刻达到高效能、高电源效率与连网能力的完美平衡。
紫光展锐:我国集成电路设计产业的龙头企业。公司于2013年成立,致力于移动通信和物联网领域核心芯片的研发及设计,产品包括移动通信中央处理器、基带芯片、AI芯片、射频前端芯片、射频芯片等各类通信、计算及控制芯片,其物联网解决方案支持众多智能电子产品,包括智能手机、平板电脑、Wi-Fi调制解调器、家用设备、可穿戴设备、互联汽车产品等。
移芯通信:为中国自主研发的超低功耗NB-IoT和Cat-M物联网芯片供应商。公司于2017 年成立,2020年12月完成B轮融资。主要业务为蜂窝物联网芯片的研发和销售,致力于设计全球极致性价比的蜂窝物联网基带芯片。
高通:是全球领先的无线科技创新者,也是5G研发、商用与实现规模化的推动力量。成立于1985年,1991年在纳斯达克上市。Qualcomm主要研发无线芯片平台和其它产品解决方案,凭借行业领先的技术解决方案以及在标准组织中的积极贡献,Qualcomm成为赋能无线生态系统不可或缺的一部分。
诺领科技成立于2018年9月,是探索满足IoT需求的全集成、低功耗无线SoC解决方案的先行者。诺领科技作为一家广域无线物联网芯片设计公司,拥有射频模拟、基带通信系统、GNSS、SoC系统和软件方面的顶尖人才,致力于发布最佳SoC解决方案。公司目前推出的产品包括物联网系统级芯片NB-IoT和Cat-M SoCs,服务于广泛的市场,其中包括智慧城市、可穿戴设备、资产追踪等等。
芯翼信息是5G物联网端侧SoC创新领导者。成立于2017年3月,公司专注于物联网通讯芯片(NB-IoT)的研发和销售。其产品XY1100是全球首颗single die集成CMOS PA的量产NB-IoT SoC,具有超低功耗、超小体积模块设计和开发灵活等优势,可应用于智慧气表、智慧水表、烟感、电动车、物流跟踪、智慧穿戴等应用场景。
智联安科技是一家专业从事芯片设计的国家高新技术企业。成立于2013年9月,公司总部位于中国北京,在硅谷、武汉、合肥等多地设有子公司和技术研发中心。公司致力于无线通信芯片的技术研发,目前已于2019年8月成功完成NB-IoT终端通信芯片MK8010量产流片,并在多个行业中实现落地应用。
中兴微电子为中国领先的通信IC设计公司。成立于2003年,中兴微电子专注于通信网络、智能家庭和行业应用等通信芯片开发,自主研发并成功商用的芯片达到100多种,覆盖通信网络“承载、接入、终端”领域,服务全球160多个国家和地区,连续多年被评为“中国十大集成电路设计企业”。
Nordic Semiconductor北欧半导体是专注研究物联网无线技术无晶圆厂半导体公司。公司专注于低功耗无线技术产品,包括短距离蓝牙,2020年从Imagination Technologies收购的Wi-Fi技术和LTE-M / NB-IoT蜂窝物联网解决方案。
Marvell美满是高性能数据基础架构产品的全球半导体解决方案提供商。成立于1995年,Marvell专注模拟,混合信号,计算,数字信号处理,网络,安全性和存储领域,提供产品和解决方案来满足汽车,运营商,数据中心和企业数据基础架构市场日益增长的计算,网络,安全性和存储需求。公司当前的产品主要包括两大类:网络和存储。
Broadcom博通是全球领先的有线和无线通信半导体公司。拥有50年来的创新,协作和卓越工程经验,公司设计提供高性能并提供关键任务功能的产品和软件,包括半导体解决方案和基础设施软件解决方案,半导体解决方案主要包括明星级的有线基础设施业务(以太网交换芯片/数据包处理器/ASCI等)和无线芯片业务(Wi-Fi 芯片/蓝牙/GPS 芯片等)。基础设施软件部门主要包括主机、企业软件解决方案和光纤通道存储区域网络业务。
NXP恩智浦半导体公司是嵌入式应用安全连接解决方案的全球领导者。公司于2006年在荷兰成立,前身为荷兰飞利浦公司于1953年成立的半导体事业部,致力于为客户提供广泛的半导体产品组合,包括微控制器,应用处理器,通信处理器,连接芯片组,模拟和接口设备,RF功率放大器,安全控制器和传感器等
乐鑫科技是一家专业的物联网整体解决方案供应商。公司在2008年4月成立于上海,是一家主要从事智能物联网Wi-Fi MCU通信芯片与模组研发设计与销售的公司。公司采用Fabless的经营模式,将晶圆制造、封装和测试环节委托于专业代工厂商。近年来,公司牢牢把握智能物联网行业的机遇,主要产品Wi-Fi MCU通信芯片目前主要运用于智能家居、智能照明、智能支付终端、智能可穿戴设备、传感设备及工业控制等物联网领域
晶晨股份是全球布局、国内领先的集成电路设计商。成立于2003年,公司专注于为多媒体智能终端SoC芯片的研发、设计与销售,芯片产品主要应用于智能机顶盒、智能电视和AI音视频系统终端等科技前沿领域。公司属于典型的Fabless模式IC设计公司,将晶圆制造、芯片封装和芯片测试环节分别委托给专业的晶圆制造企业和封装测试企业代工完成,自身则长期专注于多媒体智能终端SoC芯片的研发、设计与销售,已成为智能机顶盒芯片的领导者、智能电视芯片的引领者和AI音视频系统终端芯片的开拓者。
蜂窝模组企业
移远通信:全球领先的物联网模组龙头。公司成立于2010年,从事物联网领域无线通信模组及其解决方案的设计、生产、研发与销售服务,可提供包括无线通信模组、物联网应用解决方案及云平台管理在内的一站式服务。
广和通:作为首家上市的无线通讯模组企业,近十年为公司业务的快速发展期。成立于1999年,并于2017年在深圳证券交易所创业板上市,成为中国无线通讯模组产业中第一家上市企业。公司主要从事无线通信模块及其应用行业的通信解决方案的设计、研发与销售服务。
美格智能:全球领先的无线通信模组及解决方案提供商。成立于2007年,美格智能专注于为全球客户提供以MeiGLink品牌为核心的标准M2M/智能安卓无线通信模组、物联网解决方案、技术开发服务及云平台系统化解决方案。
日海智能:通信行业连接设备龙头,成立于2003年,2017年相继收购了龙尚科技与芯讯通,入股美国艾拉,在国内率先实现了“云+端”的物联网战略布局,卡位物联网发展关键环节;在2018年重新确立了AIoT人工智能物联网发展战略,
高新兴:全球领先的智慧城市物联网产品与服务提供商。成立于1997年,公司长期致力于研发基于物联网架构的感知、连接、平台层相关产品和技术,从下游物联网行业应用出发,以通用无线通信技术和超高频RFID技术为基础,融合大数据和人工智能等技术,实现物联网“终端+应用”纵向一体化战略布局,构筑物联网大数据应用产业集群,并成为物联网大数据应用多个细分行业领先者,服务于全球逾千家客户。目前公司正处于战略和资源进一步聚焦阶段,重点聚焦车联网和执法规范化两大垂直应用领域。
有方科技:物联网接入通信产品和服务提供商。成立于2006年,公司致力于为物联网行业提供稳定可靠的接入通信产品和服务。公司的主营业务为物联网无线通信模块、物联网无线通信终端和物联网无线通信解决方案的研发、生产(外协加工方式实现)及销售。
合宙通信:一家专业提供物联网无线通信解决方案技术产品和服务的高科技企业。成立于2014年,公司致力于提供基于通信模块的智能硬件、软件平台、云平台等综合解决方案
鼎桥通信:行业无线解决方案的领导者。成立于2005年,公司专注于无线通信技术与产品的创新,布局三大业务板块:行业无线、物联网&5G、行业定制终端。
锐明技术:全球商用车载监控龙头。成立于2002年,公司聚焦商用车视频监控和车联网18年,细分行业龙头公司,产品覆盖商用车全系车型。公司外销“商用车通用监控产品”,内销“商用车行业信息化产品”,全球累计超过120万辆商用车安装有公司的产品
传感器
奥比中光:一家全球领先的AI 3D 感知技术方案提供商。公司成立于2013年,在2020年12月进行上市辅导备案。公司拥有从芯片、算法,到系统、框架、上层应用支持的全栈技术能力,主要产品包括3D视觉传感器、消费级应用设备和工业级应用设备技术产品,其AI 3D 感知技术广泛应用于移动终端、智慧零售、智能服务、智能制造、智能安防、数字家庭等领域。
歌尔股份:一家电子元器件制造商,成立于2001年,属于消费电子行业,主营业务可分为精密零组件业务、智能声学整机业务和智能硬件业务。
汉威科技:气体传感器龙头企业,成立于1998年,并于2009年10月作为创业板首批上市公司在深交所创业板上市。公司致力于气体传感器和仪表的制造、并提供物联网解决方案
联创电子:成立于1998年,公司主营业务为研发、生产和销售触控显示类产品和光学元件产品。公司现已形成光学镜头和触控显示两大业务板块,主要产品包括高清广角镜头、平面保护镜片、手机触摸屏、中大尺寸触摸屏、显示模组、触控显示一体化模组等
瑞声科技:全球领先的智能设备解决方案提供商,在声学、光学、电磁传动、精密结构件、射频天线等领域提供专有技术解决方案。公司成立于1993年,公司是电磁器件、射频天线、精密结构件等多个细分领域的行业冠军,也是5G天线产品的重要供应商
睿创微纳公司是一家专业从事专用集成电路、红外热像芯片及MEMS传感器设计与制造,成立于2009年。公司具有完全自主的知识产权,为全球客户提供性能卓越的红外成像MEMS芯片、红外探测器、ASIC 处理器芯片、红外热成像与测温机芯、红外热像仪、激光产品光电系统。
远望谷:我国物联网产业的代表企业,成立于1999年,公司主营业务集中在物联网感知层和应用层,为多个行业提供基于RFID技术的系统解决方案、产品和服务。
金溢科技:一家智慧交通与物联网核心设备及解决方案提供商。公司创立于2004年,公司产品主要包括高速公路ETC产品、停车场ETC产品、多车道自由流ETC产品和基于射频技术的路径识别产品。
杭州士兰微电子:一家专业从事集成电路芯片设计以及半导体微电子相关产品生产的企业。公司成立于1997年,并于2003年3月在上交所主板上市。公司主要产品是集成电路以及相关的应用系统和方案,主要产品包括集成电路、半导体分立器件、LED(发光二极管)产品等三大类。
水晶光电:专业从事光学光电子行业的设计、研发与制造,专注于为行业领先客户提供全方位光学光电子相关产品及服务的公司。公司创建于2002年8月
敏芯股份:成立于2007年,是一家专业从事微电子机械系统传感器研发设计和销售的的高新技术企业,也是国内唯一掌握多品类MEMS芯片设计和制造工艺能力的半导体芯片上市公司,主营产品包括MEMS麦克风、MEMS压力传感器和MEMS惯性传感器
必创科技:成立于2005年,无线传感器网络系统解决方案及MEMS传感器芯片提供商
固锝电子:成立于1990年,2006年在深交所主板上市,是国内半导体分立器件二极管行业完善、齐全的设计、制造、封装、销售的厂商。
感知交互企业
出门问问:以语音交互和软硬结合为核心的AI公司。公司成立于2012年,作为入选“新基建产业独角兽TOP100”的人工智能企业,出门问问拥有完整的“端到端”语音交互相关技术栈,包括声音信号处理、热词唤醒、语音识别、自然语言识别、自然语言理解、语音合成等尖端技术。
汉王科技:国内人工智能产业的先行者,成立于1998年,在人工智能领域深耕二十多年,是一家模式识别领域的软件开发商与供应商,主营业务包括“人脸及生物特征识别”、“大数据与服务”、“智能终端”、“笔触控与轨迹”等
科大讯飞:亚太地区知名的智能语音和人工智能上市企业,公司成立于1999年,公司主营业务包括语音及语言、自然语言理解、机器学习推理及自主学习等人工智能核心技术研究、人工智能产品研发和行业应用落地。科大讯飞作为中国人工智能产业的先行者,在人工智能领域深耕二十年,公司致力让机器“能听会说,能理解会思考”,用人工智能建设美好世界,在发展过程中形成了显著的竞争优势。
声智科技:融合声学和人工智能技术的平台服务商,也是全球人工智能 *** 作系统领域的开拓者。公司成立于2016年4月,拥有声学与振动、语音与语义、图像与视频等远场声光融合算法,以及开源开放的壹元人工智能交互系统(SoundAI Azero),具有声光融合感知、人机智能交互、内容服务聚合、数据智能分析、IoT控制和即时通讯等能力。
云知声:致力于AI产业的高新技术企业,成立于2012年6月,总部位于北京。公司以AI语音技术起家,经过多年经验和技术的积累,逐渐构筑起一个涵盖机器学习平台、AI芯片、语音语言、图像及知识图谱等技术的技术城池,成为了具有世界顶尖智能语音技术的独角兽
生物识别企业
商汤科技:全球领先的人工智能平台公司,也是中国科技部指定的首个“智能视觉”国家新一代人工智能开放创新平台。公司自主研发并建立了全球顶级的深度学习平台和超算中心,推出了一系列领先的人工智能技术,包括:人脸识别、图像识别、文本识别、医疗影像识别、视频分析、无人驾驶和遥感等。商汤科技已成为亚洲领先的AI算法提供商。
神州泰岳:致力于将人工智能/大数据技术、物联网通讯技术、ICT技术进行融合,大力提升行业/企业组织信息化、智能化的质量与效率的高新技术企业。公司成立于2001年
端侧BIoT
比特大陆:是一家全球领先的科技公司,成立于2013年。公司立足中国,以全球视野整合前沿研发资源,专注于高速、低功耗定制芯片设计研发,其产品包括算力芯片、算力服务器、算力云,主要应用于区块链和人工智能领域。
智东西(公众号:zhidxcom)
作者 | 杨畅
编辑 | 李水青
智东西2月25日消息,近日,“东数西算”国家项目正式启动,为数据中心产业带来了重要利好信号。(《 历史 时刻!“东数西算”国家工程全面启动》)
作为数据中心中领域的一颗“明珠”,智算中心也引起行业关注。
一般认为,智算中心全称是人工智能计算中心,主要是为人工智能(AI)应用提供所需算力服务、数据服务和算法服务,由AI芯片和算力机组等设备组成,与云计算中心、超算中心有一定区别。企业和研究机构可以依托智算中心提供的强大算力,驱动AI模型进行数据深度加工,实现AI应用创新。
“东数西算”国家项目强调在京津冀、长三角、成渝等八大枢纽间建设算力网络,支持全国各地日益增长的算力需求。而沿着这张算力网络“地图”,我们发现智算中心已经“遍地开花”。
细数过来,从2021年到2022年开年,全国有不下20座城市建成或正在建智算中心,智算中心数量达到27个,而其中位于八大枢纽的就有12个,接近50%。
“东数西算”工程国家算力枢纽节点范围内的智算中心
那么具体有哪些城市在建设或者规划建设智算中心?“东数西算”工程会对智算中心带来什么样的影响?各地智算中心项目建设进度如何?可能会对当地AI产业有何影响?
智东西通过调查2021年以来各地规划、建设和建成的智算中心,并与业内人士交流,来与大家一起探讨这些问题。
据智东西统计,从2021年1月1日到2022年2月15日,全国共有至少26个城市在推动或刚刚完成当地智算中心的建设,这些城市中既有省会城市,例如南京、西安,也有非省会城市,像许昌、青岛。
其中,不少城市已经在本地建设了像大数据中心、云计算中心、国家超算中心等信息基础设施。不过这些中心并不能替代智算中心,它们之间的功能存在差异——像云计算中心,主要是提供云服务,超算中心主要为科学研究提供超算服务,智算中心则主要是为企业和科研院所提供普惠AI算力服务。
此外,中信所《人工智能计算中心发展白皮书(2021)》中指出,智算中心借鉴了超级计算(高性能计算)中心和云计算数据中心大规模并行计算和数据处理的技术架构,但它是以AI专用芯片为计算算力底座的。上述三类中心的软件和业务架构不一样,不过云数据中心和超算中心也可以通过延展建设,来对外提供智能算力。
据我们统计,2021年,全国建成并投入运营或试运营的智算中心有8个,分别是武汉人工智能计算中心、合肥先进计算中心、南京智能计算中心、中国电信京津冀大数据智能算力中心、浙江(长三角)新一代全功能智能超算中心、西安未来人工智能计算中心、中原人工智能计算中心、哈尔滨人工智能先进计算中心,投运时间分别是5月、6月、7月、8月、9月、9月、10月和12月。这些智算中心中大部分都有二期建设规划。
截至目前,2021年和2022年各地投入运营的智算中心情况
一些智算中心并没有直接用“智算中心”或“人工智能计算中心”命名,而是采用“先进计算中心”或“智能超算中心”的命名方式,但它们也提供智能算力,所以也可以算作智算中心,例如合肥先进计算中心和浙江(长三角)新一代全功能智能超算中心。
不同智算中心的测算算力时采用的算力测试基准有所差别,使用算力单位略有不同,但是无论是“1 P OpS”、“1 PFLOPS FP16”、“1 Petaflops”还是“1 P”,都相当于每秒可进行一千万亿次运算。
2022年开年以来,国内已经有一个新投运的智算中心,是位于上海的商汤 科技 人工智能计算中心。
很多城市是正在建设智算中心,从2021年1月1日到2022年2月15日,全国共有至少18个城市签约、开工、招标、计划建设智算中心项目,其中已经宣布开工建设的至少有6个城市,分别是合肥、庆阳、大连、沈阳、深圳、长沙。
截至目前,2021年和2022年各地规划或已经开始建设的智算中心情况
对比2021年之前的各地智算中心建设情况来看,2020年之前的智算中心项目更少一些。不过,部分2021年开工建成的智算中心其实在2020年就已经立项招标和预研规划,比如武汉人工智能计算中心项目。
智算中心并不是2021年才有的新类型数据中心,我国较早建成的智算中心还有深圳鹏城云脑、旷视芜湖AI超算中心等。2018年,鹏城云脑I初步建成并上线运行,算力达到100 PFLOPS(1 PFLOPS相当于每秒运算能力为一千万亿次)。
从全国智算中心的地理位置分布来看,目前,东部、中部和西部都有省市在部署智算中心。作为数据中心的一种,各地的智算中心建设规划难免会受到“东数西算”政策的影响。
特别是国家发改委等部门在《全国一体化大数据中心协同创新体系算力枢纽实施方案》等文件中指出:“原则上,对于在国家枢纽节点之外新建的数据中心,地方政府不得给予土地、财税等方面的优惠政策。”智算中心作为各地政府主导的项目,极有可能受到影响,但是并不一定会大批向西部地区迁移。因为智算中心主要面向AI相关产业,这些业务对于网络通信的要求也比较高,在这方面,东部地区略有优势。
中科曙光高级副总裁任京暘告诉智东西,“东数西算”工程会促进智算中心的发展,预计在全国一体化算力网络国家枢纽节点建设中,规划的数据中心项目会配置一定规模的智能算力,有些项目还可能是直接以智算中心的形态出现。
另外,从这些智算中心公布的算力规模情况来看, 100P算力是很多智算中心的起步目标 。
一般认为,100P大约相当于5万台高性能电脑的算力。拿科研场景为例,天文学家在20万颗天体的星空图中要定位某种特征星体,如果算力不够,耗时可能要超100天,如果拥有100P算力,定位星体所需时间仅为100秒。
任京暘说,一般智算中心提到的100P是指FP16或INT16,即半精度算力,就现阶段而言,以100P起步,能实现比较大的规模效益。
从需求角度看,智算中心作为城市级公共算力平台,要满足区域内政府、企业、高校等各类用户的算力需求,起步规模不宜过小,否则无法支撑类似大模型训练等大算力需求,也不足以发挥集约共享的规模效益。
任京暘补充道,从投资角度看,智算中心发展尚处于初期阶段,建设、运营、应用与生态建设等投入较大,需要结合地方财政承受能力做出合理评估,根据实际需求进行适度的超前部署。
大部分智算中心都是分期建设的,建成一期,就可以投入运营一期,后期再根据运行情况和产业发展需求进行二期、三期建设。
例如武汉人工智能计算中心,该智算中心在2021年5月完成了一期项目建设工作,并开始为企业提供AI算力,但很快饱和了。于是,武汉人工智能计算中心又进行了二期项目扩容工作,将算力规模从100P扩容到200P。武汉人工智能计算中心相关负责人在接受媒体采访时说,现在二期算力也接近饱和,随着准备进行进一步的算力扩容工作。
武汉人工智能计算中心
根据各智算中心的数据,至少数百家企业已经签约智算中心,例如武汉人工智能计算中心已经为多家高校和科研院所、100多家企业提供算力,南京智能计算中心已经吸引超40家产学研机构入驻。
一个智算中心可以同时支撑的产业场景很多,例如自动驾驶、智慧医疗、智慧城市、智慧交通、智慧矿山、智能制造等等,主要看当地的需求,一般都是为了支撑当地的优势产业更好发展。比如,青岛靠近海域,其人工智能计算中心招标文件就有提到青岛人工智能计算中心要支撑青岛优势产业集群,比如智能家居、智能制造等产业智能化持续领先,并着重强调支撑当地智慧海洋经济的发展。
上述智算中心都并不局限于支撑单一产业。不过,也有一些城市选择建设针对性更强的智算中心,像山西晋城建设了专门面向煤炭行业的智算中心(智能矿山创新实验室创新成果&计算中心)。该智算中心由华为、晋能控股等企业参与建设,主要是为推动山西煤矿智能化建设。
智能矿山创新实验室创新成果&计算中心
在智算中心建设过程中,市政和建筑设计企业背后的AI和ICT企业是重要角色,例如曙光、华为、浪潮、腾讯、商汤 科技 等企业。
在 探索 智算中心过程中,作为计算领域的头部玩家曙光提出了“5A级”智算中心建设方案,从开放、融合、绿色、普惠、服务五个方面,进行智算中心相关的实践和 探索 。目前,曙光5A级智算中心已在广东珠海、安徽合肥、浙江桐乡等地陆续落成,其江苏昆山等地的智算中心也进入建设阶段。
合肥先进计算中心
曙光智算中心会采用兼容多种芯片、算法、模型等的多元协作方式以实现多元算力提供。例如曙光参建的合肥先进计算中心不仅能提供智能算力,还能提供高性能计算所需算力。在降低智算中心、数据中心能耗方面,曙光研发有浸没式相变液冷技术,可使智算中心的PUE值降至104到105。
华为应该是比较早尝试智算中心的企业,而且也是参与各地智算中心建设最多的企业之一。华为升腾计算业务总裁许映童曾在2021世界人工智能大会期间透露,华为希望在2021年内启动超20个智算中心建设。
包括“鹏城云脑II”、“武汉人工智能计算中心”在内的几个华为承建的智算中心项目几乎都是使用华为的Atlas 900 AI集群架构,来实现AI算力供给的。Atlas 900 AI集群架构是由数千颗升腾910 AI处理器构成,其总算力达到256P 1024 PFLOPS FP16。
鹏城云脑
浪潮在智算中心方面也有多年的研究,无论是智算中心运行过程中算力生产、算力聚合、算力调度还是算力释放环节,浪潮都分别有相应的技术和软硬件支撑。南京智能计算中心就是采用了浪潮AI服务器算力机组和寒武纪思元270和思元290智能芯片及加速卡。
南京智能计算中心
作为数据中心行业的重要玩家,腾讯将其在数据中心方面的 探索 应用在了智算中心建设中,像腾讯智慧产业长三角(合肥)智算中心建设中就用到了腾讯第四代T-Block等高端模块化技术,支持项目快速交付。腾讯第四代T-Block等高端模块化技术就是将IT、空调等数据中心的各个功能模块化,以实现按需灵活配置。
商汤 科技 是从2018年开始进行人工智能计算中心预研工作的,2020年7月开始商汤 科技 人工智能计算中心建设工作。2022年1月24日,商汤 科技 人工智能计算中心启动运营。商汤 科技 人工智能计算中心的峰值算力高达3740 Petaflops,这背后包含了商汤 科技 的多种技术突破,包括高性能计算、分布式调度、硬件/软件协同设计等。
商汤 科技 人工智能计算中心
我们通过调查2021年以来建设和建成的智算中心,发现越来越多的城市已经开始了智算中心建设。这体现了各地对于AI产业的重视。从一些现有的智算中心建设工期来看,一般一期建设大概时间在半年到一年不等,今年可能会有更多在建的智算中心建成并投运。另外,“东数西算”工程也会对新的智算中心的规划、建设产生多重影响。
目前参与智算中心建设的企业相对有限,随着各地对智算中心建设需求的增加以及一些新玩家加入,智算中心领域玩家可能会面临更激烈的竞争。
算力是指计算设备通过处理数据,实现特定结果输出的计算能力。
算力广泛存在于手机、PC、超级计算机等各种硬件设备中,没有算力,这些软、硬件就不能正常使用。而玩虚拟货币的投资者,都听过算力这个词,在区块链中,算力通常是指挖矿机挖出比特币的能力,算力占全网算力的比例越高,算力产出的比特币就越多。
算力可分为三类:第一类,就是高性能计算,即“超算”。第二类算力,为人工智能计算机,主要用于处理人工智能应用问题;第三类就是数据中心,它更多是通过云计算的方式给大家提供算力的公共服务。这三种计算中心,合起来就反映出一个国家的算力。
2023年算力龙头上市公司:
1、拓维信息:公司依托兆瀚服务器和兆瀚AI推理服务器提供的通用和A算力支持,在云边端的技术框架内,重点发展鸿蒙行业专属 *** 作系统、鸿蒙行业专属终端、拓维元 *** 作系统、行业边缘一体机,“软+硬”深度融合,实现云边端协同,以边端促云。
2、科大讯飞:讯飞的算力完全满足AI算法模型训练,可面向开放平台数百万开发者和其他行业伙伴提供相关AI服务的需求,公司持续打造人工智能核心技术的领先引擎,通过无监督训练、小数据学习算法的突破,用更少的标记数据实现更好的效果,从而降低人工智能在各个领域推广落地的成本。
3、首都在线:公司的CDS首云异构算力平台,主要面向以GPU算力为主的业务场景,既包括了以深度学习、AI计算、超算为主的算力业务,也覆盖了以影视渲染、实时渲染、云游戏、XR等视觉计算需求。
一, 语音合成技术原理语音合成(test to speech),简称TTS。将文字转化为语音的一种技术,类似于人类的嘴巴,通过不同的音色说出想表达的内容。
在语音合成技术中,主要分为 语言分析部分 和 声学系统部分 ,也称为 前端部分 和 后端部分, 语言分析部分主要是根据输入的文字信息进行分析,生成对应的语言学规格书,想好该怎么读;声学系统部分主要是根据语音分析部分提供的语音学规格书,生成对应的音频,实现发声的功能。
1 语言分析部分
语言分析部分的流程图具体如下,可以简单的描述出语言分析部分主要的工作。
文本结构与语种判断: 当需要合成的文本输入后,先要判断是什么语种,例如中文,英文,藏语,维语等,再根据对应语种的语法规则,把整段文字切分为单个的句子,并将切分好的句子传到后面的处理模块。
文本标准化: 在输入需要合成的文本中,有阿拉伯数字或字母,需要转化为文字。根据设置好的规则,使合成文本标准化。例如, “请问您是尾号为8967的机主吗?“8967”为阿拉伯数字,需要转化为汉字“八九六七”,这样便于进行文字标音等后续的工作;再如,对于数字的读法,刚才的“8967“为什么没有转化为”八千九百六十七“呢?因为在文本标准化的规则中,设定了”尾号为+数字“的格式规则,这种情况下数字按照这种方式播报。这就是文本标准化中设置的规则。
文本转音素: 在汉语的语音合成中,基本上是以拼音对文字标注的,所以我们需要把文字转化为相对应的拼音,但是有些字是多音字,怎么区分当前是哪个读音,就需要通过分词,词性句法分析,判断当前是哪个读音,并且是几声的音调。
例如,“南京市长 江大桥”为“nan2jing1shi4zhang3jiang1da4qiao2”或者“南京市 长江大桥”“nan2jing1shi4chang2jiang1da4qiao3”。
句读韵律预测: 人类在语言表达的时候总是附带着语气与感情,TTS合成的音频是为了模仿真实的人声,所以需要对文本进行韵律预测,什么地方需要停顿,停顿多久,哪个字或者词语需要重读,哪个词需要轻读等,实现声音的高低曲折,抑扬顿挫。
2 .声学系统部分
声学系统部分目前主要有三种技术实现方式,分别为:波形拼接,参数合成以及端到端的语音合成技术。
1) 波形拼接语音合成
通过前期录制大量的音频,尽可能全的覆盖所有的音节音素,基于统计规则的大语料库拼接成对应的文本音频,所以波形拼接技术通过已有库中的音节进行拼接,实现语音合成的功能。一般此技术需要大量的录音,录音量越大,效果越好,一般做的好的音库,录音量在50小时以上。
优点:音质好,情感真实。
缺点:需要的录音量大,覆盖要求高,字间协同过渡生硬,不平滑,不是很自然。
2) 参数语音合成技术
参数合成技术主要是通过数学方法对已有录音进行频谱特性参数建模,构建文本序列映射到语音特征的映射关系,生成参数合成器。所以当输入一个文本时,先将文本序列映射出对应的音频特征,再通过声学模型(声码器)将音频特征转化为我们听得懂的声音。
优点:录音量小,可多个音色共同训练,字间协同过渡平滑,自然等。
缺点:音质没有波形拼接的好,机械感强,有杂音等。
3) 端到端语音合成技术
端到端语音合成技术是目前比较火的技术,通过神经网络学习的方法,实现直接输入文本或者注音字符
,中间为黑盒部分,然后输出合成音频,对复杂的语言分析部分得到了极大的简化。所以端到端的语音合成技术,大大降低了对语言学知识的要求,且可以实现多种语言的语音合成,不再受语言学知识的限制。通过端到端合成的音频,效果得到的进一步的优化,声音更加贴近真人。
优点:对语言学知识要求降低,合成的音频拟人化程度更高,效果好,录音量小。
缺点:性能大大降低,合成的音频不能人为调优。
以上主要是对语音合成技术原理的简单介绍,也是目前语音合成主流应用的技术。当前的技术也再迭代更新,像端到端技术目前比较火的wavenet,Tacotron,Tacotron2以及deepvoice3等技术,感兴趣的朋友可以自己了解学习。
二, 技术边界
目前语音合成技术落地是比较成熟的,比如前面说到的各种播报场景,读小说,读新闻以及现在比较火的人机交互。但是目前的TTS还是存在着一些解决不掉的问题。
1 拟人化
其实当前的TTS拟人化程度已经很高了,但是行业内的人一般都能听出来是否是合成的音频,因为合成音的整体韵律还是比真人要差很多,真人的声音是带有气息感和情感的,TTS合成的音频声音很逼近真人,但是在整体的韵律方面会显得很平稳,不会随着文本内容有大的起伏变化,单个字词可能还会有机械感。
2 情绪化
真人在说话的时候,可以察觉到当前情绪状态,在语言表达时,通过声音就可以知道这个人是否开心,或者沮丧,也会结合表达的内容传达具体的情绪状态。单个TTS音库是做不到,例如在读小说的时候,小说中会有很多的场景,不同的情绪,但是用TTS合成的音频,整体感情和情绪是比较平稳的,没有很大的起伏。目前优化的方式有两种,一是加上背景音乐,不同的场景用不同的背景音乐,淡化合成音的感情情绪,让背景音烘托氛围。二是制作多种情绪下的合成音库,可以在不同的场景调用不同的音库来合成音频。
3 定制化
当前我们听到语音合成厂商合成的音频时,整体效果还是不错的,很多客户会有定制化的需求,例如用自己企业职员的声音制作一个音库,想要达到和语音合成厂商一样的效果,这个是比较难的,目前语音合成厂商的录音员基本上都是专业的播音员,不是任何一个人就可以满足制作音库的标准,如果技术可以达到每一个人的声音都可以到达85%以上的还原,这将应用于更多的场景中。
三, 效果指标和技术指标
随着语音合成技术的发展,语音合成(TTS)已经应用于生活中的各个场景,实现了语音合成技术的应用落地。例如,在高铁,机场的语音播报工作,医院的叫号业务,以及现在比较火热的语音交互产品。语音合成的各种应用说明它不仅仅是一项技术,更是一款产品,作为产品,可以用哪些指标来衡量这款产品呢?
下面将介绍两种衡量TTS产品的指标,效果指标和性能指标。
1 效果指标
1) MOS 值
目前关于TTS合成效果的评判标准,行业内一致认可的是mos值测试 ,找一些业内专家,对合成的音频效果进行打分,分值在1-5分之间,通过平均得到最后的分数,这就是mos值测试。 很显然这是一个主观的评分,没有具体的评分标准,这和个人对音色的喜好,对合成音频内容场景的掌握情况,以及对语音合成的了解程度是强相关的,所以算是仁者见仁,智者见智的测试方式。
由于TTS合成效果的评判主观性,导致在一些项目的验收中,不能明确出具体的验收标准,例如在定制音库的项目中,客户想做一个独有的定制音库,最后验收肯定是客户对合成音频效果满意,则成功验收,这是一个很主观的标准,怎么样才算满意呢?对于TTS厂商而言,这是不公平的。所以需要找一些可以量化的标准使得项目可以更好的验收,双方也不会因为合成效果出分歧。这里推荐一条验收标准,可以将语音合成效果量化, 分别对原始录音和合成音频进行盲测打分(mos值测试) , 合成音频的mos值能达到原始录音的85% (数值可以根据项目情况来定) 以上 , 就可验收 ,这样就可以把验收标准确定下来,且进行了量化。当然打分团队可以是客户和TTS厂商的人,也可以请第三方的人来打分,确保公平。
虽然mos值是一个比较主观的测试方式,但也有一些可评判的标准。例如在合成的音频中,多音字的读法,当前场景下数字的播报方式,英语的播报方式,以及在韵律方面,词语是否连在一起播报,应该重读的地方是否有重读,停顿的地方是否合理,音色是否符合应用于当前的这个场景,都可以在打分的时候做为得分失分的依据。
分享一个简单的评分标准,可作为参考依据。
2) ABX 测评
合成效果对比性测试,选择相同的文本以及相同场景下的音色,用不同的TTS系统合成来对比哪个的合成效果较好,也是人为的主观判断,但是具有一定的对比性,哪一个TTS更适合当前的场景,以及合成的效果更好。
2 性能指标
1) 实时率
在语音合成中,合成方式分为 非流式合成 和 流失合成 , 非流失合成指的是一次性传入文本,一次性返回合成的文本音频;流式合成指的是文本传输给TTS时,TTS会分段传回合成的音频, 这样可以减少语音合成的等待时间,在播报的同时也在合成,不用等到整段音频合成完再进行播报,所以对于语音合成时间的一个指标就是实时率。实时率等于文字合成所需时长除以文字合成的音频总时长,下面是实时率的计算公式:
为什么讲实时率会说到非流失合成和流式合成,因为在流式合成场景中,开始合成的时候也就已经开始播报了,音频合成完成也就播报完成了,不会产生等待的过程,这种过程主要用于语音交互的场景,智能机器人收到语音信号之后,马上就可以给予答复,不会让用户等太久。所以为了确保用户的最佳体验, 要求“文字合成所需时长”≤“文字合成出的音频时长”,也就是实时率要小于等于1 。
2) 首包响应时间
在流式合成中,分段合成的音频会传输给客户端或者播放系统,在合成首段音频时,也会耗费时间,这个耗时称为“首包响应时间”。为什么会统计这个时间呢,因为在语音交互中,根据项目经验以及人的容忍程度,当用户说完话时,在1200ms之内,机器人就要开始播报回复,这样就不会感觉有空白时间或者停顿点,如果时间超过1200ms,明显感觉会有一个等待的时间,用户体验不佳,性子急的用户可能就终止了聊天。1200ms的时间不只是TTS语音合成的首包时间,还有ASR(语音识别)和NLU(自然语言理解)所消耗的时间,所以TTS首包响应时间要控制在500ms以内,确保给ASR,NLU留有更多的时间。
3) 并发数
人工智能的发展主要有三个方面,分别为算法,算力,数据,其实讲的性能指标相当于是算力的部分,目前承载算力的服务器有CPU服务器和GPU服务器。前面说到实时率的指标是要小于等于1,那如果实时率远小于1,是不是会对服务器造成浪费呢,因为只要实时率小于等于1,就可以满足用户的需求,让用户体验良好。 所以上面说的实时率是针对CPU服务器单核单线程时,或者GPU单卡单线程时, 那实时率的公式可以为:
为了资源的最大利用化,我们只需确保实时率接近1,或者等于1就行,没必要远小于1,所以当在单核单线程实时率远小于1时,则可以实现一核二线,一核三线的线程数,使得实时率为1,这个一核“二线”,“三线”,这个“几线”说的就是几 并发数 ,准确说是 单核并发数。 那这个并发数怎计算呢,举个例子,如果单核单线程的并发数是01,则一核10线程的并发就是1,也是满足需求的,就可以按照这个并发数给客户提供。所以并发数的计算公式如下:
所以当用户需要200线程的语音合成并发数使,按01的实时率,一核十线,只需要20核的cpu服务器,则可以跟客户要求24核的cpu服务器即可满足客户的需求,也为客户节省了成本。
再说一下这个线程和并发的概念,线程,并发算是同一个概念,例如200线并发,指的是需要同时支持200线的语音合成,200线是同时合成音频的,合成内容可以相同也可以不同。
4) 合成100个字需要多少时间(1s能合成多少个字)
有些客户对于实时率,响应时间这些概念是比较模糊的,他会问你们的 TTS合成100个字需要多少时间 或者 1s能合成多少个字 ,所以这个时候为了方便和客户沟通,我们需要知道合成100个字TTS消耗的时间。这个数据是可以大概算出来的,当然也可以直接让测试测出一百字消耗的时间。这里主要讲一下计算的方法。
按照正常的播报速度,1秒可以播报4个字左右,我们就按照四个字计算,100个字的音频,音频时长大概就是25s(100除以4),假如实时率为01,再根据当前的实时率计算公式,算出合成时间为25s,也可以计算出1s合成的字数(100/25)为40个字。
简单介绍了语音合成产品会涉及到的一些参数指标,还有一些测试时需要了解的指标数据,例如cpu占用,内存占用,DPS(单位时间合成的音频总时长),TPS(单位时间合成的音频任务数)以及TP99,感兴趣的朋友可以查询研究一下,这些数据也主要用于项目poc的测试中,或者TTS产品整体的测试中,可以算是对于TTS产品的一个整体的了解。
四, 语音合成厂商
有很多厂商拥有语音合成技术,有互联网大厂,也有一些只专注于人工智能的企业。
科大讯飞 科大讯飞的语音合成技术在全球范围内也是数一数二的,合成的音频效果自然度高,讯飞官网挂接的音库是最多的,且涉及很多的场景,以及很多的外语音库。
阿里巴巴 在阿里云官网的音库,有几个音库的合成效果非常棒,例如艾夏,合成的音频播报时感觉带有气息感,拟人化程度相当高。
百度 百度的语音合成技术还是很强的,但是官网给的合成音库较少,具体不太好评判。
灵伴科技 这家公司在语音合成领域是不在忽略的。灵伴的音库合成音效果也是非常的棒,有一个东北大叔的音库,主要是偏东北话,整体的韵律,停顿,重读等掌握的很好,很到位。
标贝科技 标贝科技和灵伴科技一样,是语音合成领域不可小觑的两个企业,是因为他们TTS合成的音频效果拟人化程度很高,每个场景的风格也很逼真。
捷通华声 捷通华声是一家老牌的人工智能企业,合成的音频效果整体还是不错的,且支持多种语种的音库。
还有些企业没有一一列出来,是因为上面这些企业是在平时项目中,或者TTS技术落地应用上比较多的企业。
五, 小结
目前的语音合成已经应用于各种场景,是较成熟可落地的产品,对于合成音的要求,当前的技术已经可以做很好了,满足了市场上绝大部分需求,语音合成技术主要是合成类似于人声的音频,其实当前的技术已完全满足。目前的问题在于不同场景的具体需求的实现,例如不同的数字读法,如何智能的判断当前场景应该是哪种播报方式,以及什么样的语气和情绪更适合当下的场景,多音字如何更好地区分,确保合成的音频尽可能的不出错。当然错误有时候是不可避免的,但是如何在容错范围之内,或者读错之后是否有很好的自学机制,下次播报时就可以读对,具有自我纠错的能力,这些可能是当前产品化时遇到的更多更实际的问题,在产品整体设计的时候,这些是需要考虑的主要问题。
后续会讲述在实际场景中主要遇到的问题以及解决的方案。据IDC数据显示,过去一年,中国边缘计算服务器市场爆发式增长了2663%,这意味着当前中国企业的IT架构正在迈向一个云网融合、混合多云、边缘计算等多架构并存的全新阶段。为帮助企业更好的应对数字化转型下的架构变革,7月18日联想正式发布全新边缘服务器ThinkServer SE550 V2,这款双路2U边缘服务器具备强大的计算性能和丰富的扩展能力,能够为企业边缘端应用和场景提供专业计算平台支持。
联想ISG中国战略及运营高级总监、智能边缘中国事业部总经理杨春表示:“边缘计算将在企业未来的数字化转型中发挥关键作用。联想正在将边缘计算业务上升到公司战略高度,致力于成为行业领先的边缘计算方案提供商。联想ThinkServer SE550 V2边缘服务器凭借强大的性能、丰富的扩展能力和稳定的可靠性,能够释放边缘端的强大算力,点燃边缘人工智能、边缘网络、边缘云、边缘加速等典型应用的智慧场景。”
近年来随着人工智能、5G、物联网等信息技术的不断发展,海量的数据被逐渐释放,仅依靠传统集中式的云计算架构难以解决企业低延时、本地化、高频次的计算需求。而边缘计算技术由于融合了边缘侧计算、存储、网络能力,能够在数据产生端就近提供边缘智能服务,从而满足用户和行业数字化所面临的敏捷链接、实时业务、智能应用、数据安全等关键需求,因此受到了众多企业的青睐。据Gartner预测,到2025年,约75%的企业数据将不通过数据中心,而是直接在边缘进行计算。
目前,我国智能制造、智慧零售、智慧园区、智慧城市等行业的智能化转型正在加速,这些复杂的场景对边缘计算设备的性能要求极高。比如在智能制造领域,利用边缘服务器作为载体,将机器视觉运用到产品质检过程中,智能实时处理海量数据,能够实现生产线的管理优化。作为计算平台的核心硬件之一,能够应对复杂多样的业务需求,面向特定场景的边缘服务器应运而生。
联想ThinkServer SE550 V2边缘服务器不仅满足运营商OTII边缘服务器的众多标准,配合联想“端-边-云-网-智”的全要素能力,还能为用户提供从软件到硬件的整套解决方案。联想ThinkServer SE550 V2支持最多两颗Intel Xeon 第三代可扩展处理器,每个处理器数量最多32核,并且支持NVIDIA专业GPU,为边缘人工智能的场景应用提供强大算力支持。此外,联想ThinkServer SE550 V2也可像普通2U机架式服务器一样,为用户的虚拟化、数据库、云计算和AI等应用场景提供强大的算力支撑。
联想ThinkServer SE550 V2实现了便携性与扩展性的平衡。联想ThinkServer SE550 V2采用短机箱设计,相比传统机架式服务器能够节省部署空间。同时,联想ThinkServer SE550 V2支持16个DDR4内存插槽,内存频率最高可支持到3200 MHz,整机内存最大可扩展到1TB。在硬盘容量方面,联想ThinkServer SE550 V2最多支持八个25英寸热插拔硬盘,最多两个内置M2高速固态硬盘,配合Lenovo Anybay技术,可在同一驱动器托架内灵活混搭SAS/SATA/NVMe硬盘,实现灵活扩展。
相比云端服务器,边缘服务器需要深入各类行业使用场景,应对不同的温度、工业环境等需求对产品进行设计和优化。基于联想在服务器领域多年的技术积累和品质追求,联想ThinkServer SE550 V2对可能存在的极限场景进行了针对性提升——通常产品工作温度范围为常温,而联想ThinkServer SE550 V2支持宽温使用,能够在45 高温中保持长期高效运行。同时,联想ThinkServer SE550 V2还通过了地震烈度测试,能够保证在极端情况下的数据安全和使用稳定。
边缘计算是联想重点聚焦和投入的核心技术领域之一,不久前联想正式成立智能边缘事业部,基于对产业趋势的洞察和用户需求的研究,联想正式发布智能边缘计算品牌“慧天”。同时,联想将充分整合其在边缘计算领域的硬件、软件、方案及服务,致力于成为业界领先的全栈式智能化边缘计算方案提供商。目前,联想已为智能制造、智慧城市、智慧园区、智慧教育、智慧医疗、智慧金融等领域的众多企业提供智能边缘计算服务。
在“ 科技 赋能中国智能化转型”的愿景下,联想中国区基础设施业务群将继续围绕“1248”战略全景,在边缘计算领域持续攻坚,打磨成熟的边缘计算解决方案,为千行百业客户提供绿色、敏捷、高效的“新IT”智能架构,助力中国企业迈向数字化转型新阶段。
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)