
各种半导体封装形式的特点和优点:
DIP双列直插式封装
DIP(DualIn-line Package)是指采用双列直插形式封装的集成电路芯片,绝大多数中小规模集成电路(IC)均采用这种封装形式,其引脚数一般不超过100个。采用DIP封装的CPU芯片有两排引脚,需要插入到具有DIP结构的芯片插座上。当然,也可以直接插在有相同焊孔数和几何排列的电路板上进行焊接。DIP封装的芯片在从芯片插座上插拔时应特别小心,以免损坏引脚。
DIP封装具有以下特点:
1.适合在PCB(印刷电路板)上穿孔焊接, *** 作方便。
2.芯片面积与封装面积之间的比值较大,故体积也较大。
Intel系列CPU中8088就采用这种封装形式,缓存(Cache)和早期的内存芯片也是这种封装形式。
BGA球栅阵列封装
随着集成电路技术的发展,对集成电路的封装要求更加严格。这是因为封装技术关系到产品的功能性,当IC的频率超过100MHz时,传统封装方式可能会产生所谓的“CrossTalk”现象,而且当IC的管脚数大于208 Pin时,传统的封装方式有其困难度。因此,除使用QFP封装方式外,现今大多数的高脚数芯片(如图形芯片与芯片组等)皆转而使用BGA(Ball Grid Array Package)封装技术。BGA一出现便成为CPU、主板上南/北桥芯片等高密度、高性能、多引脚封装的最佳选择。
BGA封装技术又可详分为五大类:1.PBGA(Plasric BGA)基板:一般为2-4层有机材料构成的多层板。Intel系列CPU中,Pentium II、III、IV处理器均采用这种封装形式。
2.CBGA(CeramicBGA)基板:即陶瓷基板,芯片与基板间的电气连接通常采用倒装芯片(FlipChip,简称FC)的安装方式。Intel系列CPU中,Pentium I、II、Pentium Pro处理器均采用过这种封装形式。
3.FCBGA(FilpChipBGA)基板:硬质多层基板。
4.TBGA(TapeBGA)基板:基板为带状软质的1-2层PCB电路板。
5.CDPBGA(Carity Down PBGA)基板:指封装中央有方型低陷的芯片区(又称空腔区)。
BGA封装具有以下特点:
1.I/O引脚数虽然增多,但引脚之间的距离远大于QFP封装方式,提高了成品率。
2.虽然BGA的功耗增加,但由于采用的是可控塌陷芯片法焊接,从而可以改善电热性能。
3.信号传输延迟小,适应频率大大提高。
4.组装可用共面焊接,可靠性大大提高。
BGA封装方式经过十多年的发展已经进入实用化阶段。1987年,日本西铁城(Citizen)公司开始着手研制塑封球栅面阵列封装的芯片(即BGA)。而后,摩托罗拉、康柏等公司也随即加入到开发BGA的行列。1993年,摩托罗拉率先将BGA应用于移动电话。同年,康柏公司也在工作站、PC电脑上加以应用。直到五六年前,Intel公司在电脑CPU中(即奔腾II、奔腾III、奔腾IV等),以及芯片组(如i850)中开始使用BGA,这对BGA应用领域扩展发挥了推波助澜的作用。BGA已成为极其热门的IC封装技术,其全球市场规模在2000年为12亿块,预计2005年市场需求将比2000年有70%以上幅度的增长。
QFP塑料方型扁平式封装和PFP塑料扁平组件式封装
QFP(Plastic Quad Flat Package)封装的芯片引脚之间距离很小,管脚很细,一般大规模或超大型集成电路都采用这种封装形式,其引脚数一般在100个以上。用这种形式封装的芯片必须采用SMD(表面安装设备技术)将芯片与主板焊接起来。采用SMD安装的芯片不必在主板上打孔,一般在主板表面上有设计好的相应管脚的焊点。将芯片各脚对准相应的焊点,即可实现与主板的焊接。用这种方法焊上去的芯片,如果不用专用工具是很难拆卸下来的。
PFP(Plastic Flat Package)方式封装的芯片与QFP方式基本相同。唯一的区别是QFP一般为正方形,而PFP既可以是正方形,也可以是长方形。
QFP/PFP封装具有以下特点:
1.适用于SMD表面安装技术在PCB电路板上安装布线。
2.适合高频使用。
3. *** 作方便,可靠性高。
4.芯片面积与封装面积之间的比值较小。
Intel系列CPU中80286、80386和某些486主板采用这种封装形式。
PGA插针网格阵列封装
PGA(Pin Grid Array Package)芯片封装形式在芯片的内外有多个方阵形的插针,每个方阵形插针沿芯片的四周间隔一定距离排列。根据引脚数目的多少,可以围成2-5圈。安装时,将芯片插入专门的PGA插座。为使CPU能够更方便地安装和拆卸,从486芯片开始,出现一种名为ZIF的CPU插座,专门用来满足PGA封装的CPU在安装和拆卸上的要求。
ZIF(Zero Insertion Force Socket)是指零插拔力的插座。把这种插座上的扳手轻轻抬起,CPU就可很容易、轻松地插入插座中。然后将扳手压回原处,利用插座本身的特殊结构生成的挤压力,将CPU的引脚与插座牢牢地接触,绝对不存在接触不良的问题。而拆卸CPU芯片只需将插座的扳手轻轻抬起,则压力解除,CPU芯片即可轻松取出。
PGA封装具有以下特点:1.插拔 *** 作更方便,可靠性高。
2.可适应更高的频率。
Intel系列CPU中,80486和Pentium、Pentium Pro均采用这种封装形式。
MCM多芯片模块
为解决单一芯片集成度低和功能不够完善的问题,把多个高集成度、高性能、高可靠性的芯片,在高密度多层互联基板上用SMD技术组成多种多样的电子模块系统,从而出现MCM(Multi Chip Model)多芯片模块系统。
MCM具有以下特点:
1.封装延迟时间缩小,易于实现模块高速化。
2.缩小整机/模块的封装尺寸和重量。
3.系统可靠性大大提高。
总之,由于CPU和其他超大型集成电路在不断发展,集成电路的封装形式也不断作出相应的调整变化,而封装形式的进步又将反过来促进芯片技术向前发展。
CSP芯片尺寸封装
随着全球电子产品个性化、轻巧化的需求蔚为风潮,封装技术已进步到CSP(Chip Size Package)。它减小了芯片封装外形的尺寸,做到裸芯片尺寸有多大,封装尺寸就有多大。即封装后的IC尺寸边长不大于芯片的1.2倍,IC面积只比晶粒(Die)大不超过1.4倍。
CSP封装又可分为四类:
1.Lead Frame Type(传统导线架形式),代表厂商有富士通、曰立、Rohm、高士达(Goldstar)等等。
2.Rigid Interposer Type(硬质内插板型),代表厂商有摩托罗拉、索尼、东芝、松下等等。
3.Flexible Interposer Type(软质内插板型),其中最有名的是Tessera公司的microBGA,CTS的sim-BGA也采用相同的原理。其他代表厂商包括通用电气(GE)和NEC。
4.Wafer Level Package(晶圆尺寸封装):有别于传统的单一芯片封装方式,WLCSP是将整片晶圆切割为一颗颗的单一芯片,它号称是封装技术的未来主流,已投入研发的厂商包括FCT、Aptos、卡西欧、EPIC、富士通、三菱电子等。
CSP封装具有以下特点:
1.满足了芯片I/O引脚不断增加的需要。
2.芯片面积与封装面积之间的比值很小。
3.极大地缩短延迟时间。
CSP封装适用于脚数少的IC,如内存条和便携电子产品。未来则将大量应用在信息家电(IA)、数字电视(DTV)、电子书(E-Book)、无线网络WLAN/GigabitEthemet、ADSL/手机芯片、蓝芽(Bluetooth)等新兴产品中。
CPU是中央处理单元(Central Process Unit)的缩写,它可以被简称做微处理器。(Microprocessor),不过经常被人们直接称为处理器(processor)。不要因为这些简称而忽视它的作用,CPU是计算机的核心,其重要性好比心脏对于人一样。实际上,处理器的作用和大脑更相似,因为它负责处理、运算计算机内部的所有数据,而主板芯片组则更像是心脏,它控制着数据的交换。CPU的种类决定了你使用的 *** 作系统和相应的软件。CPU主要由运算器、控制器、寄存器组和内部总线等构成,是PC的核心,再配上储存器、输入/输出接口和系统总线组成为完整的PC。CPU的基本结构、功能及参数CPU主要由运算器、控制器、寄存器组和内部总线等构成。寄存器组用于在指令执行过后存放 *** 作数和中间数据,由运算器完成指令所规定的运算及 *** 作。
CPU主要的性能指标有:
1.主频
主频也叫时钟频率,单位是MHz,用来表示CPU的运算速度。CPU的主频=外频×倍频系数。很多人认为主频就决定着CPU的运行速度,这不仅是个片面的,而且对于服务器来讲,这个认识也出现了偏差。至今,没有一条确定的公式能够实现主频和实际的运算速度两者之间的数值关系,即使是两大处理器厂家Intel和AMD,在这点上也存在着很大的争议,我们从Intel的产品的发展趋势,可以看出Intel很注重加强自身主频的发展。像其他的处理器厂家,有人曾经拿过一块1G的全美达来做比较,它的运行效率相当于2G的Intel处理器。
所以,CPU的主频与CPU实际的运算能力是没有直接关系的,主频表示在CPU内数字脉冲信号震荡的速度。在Intel的处理器产品中,我们也可以看到这样的例子:1 GHz Itanium芯片能够表现得差不多跟2.66 GHz Xeon/Opteron一样快,或是1.5 GHz Itanium 2大约跟4 GHz Xeon/Opteron一样快。CPU的运算速度还要看CPU的流水线的各方面的性能指标。
当然,主频和实际的运算速度是有关的,只能说主频仅仅是CPU性能表现的一个方面,而不代表CPU的整体性能。
2.外频 外频是CPU的基准频率,单位也是MHz。CPU的外频决定着整块主板的运行速度。说白了,在台式机中,我们所说的超频,都是超CPU的外频(当然一般情况下,CPU的外频都是被锁住的)相信这点是很好理解的。但对于服务器CPU来讲,超频是绝对不允许的。前面说到CPU决定着主板的运行速度,两者是同步运行的,如果把服务器CPU超频了,改变了外频,会产生异步运行,(台式机很多主板都支持异步运行)这样会造成整个服务器系统的不稳定。
目前的绝大部分电脑系统中外频也是内存与主板之间的同步运行的速度,在这种方式下,可以理解为CPU的外频直接与内存相连通,实现两者间的同步运行状态。外频与前端总线(FSB)频率很容易被混为一谈,下面的前端总线介绍我们谈谈两者的区别。
3.前端总线(FSB)频率 前端总线(FSB)频率(即总线频率)是直接影响CPU与内存直接数据交换速度。有一条公式可以计算,即数据带宽=(总线频率×数据位宽)/8,数据传输最大带宽取决于所有同时传输的数据的宽度和传输频率。比方,现在的支持64位的至强Nocona,前端总线是800MHz,按照公式,它的数据传输最大带宽是6.4GB/秒。
外频与前端总线(FSB)频率的区别:前端总线的速度指的是数据传输的速度,外频是CPU与主板之间同步运行的速度。也就是说,100MHz外频特指数字脉冲信号在每秒钟震荡一千万次;而100MHz前端总线指的是每秒钟CPU可接受的数据传输量是100MHz×64bit÷8bit/Byte=800MB/s。
其实现在“HyperTransport”构架的出现,让这种实际意义上的前端总线(FSB)频率发生了变化。之前我们知道IA-32架构必须有三大重要的构件:内存控制器Hub (MCH) ,I/O控制器Hub和PCI Hub,像Intel很典型的芯片组 Intel 7501、Intel7505芯片组,为双至强处理器量身定做的,它们所包含的MCH为CPU提供了频率为533MHz的前端总线,配合DDR内存,前端总线带宽可达到4.3GB/秒。但随着处理器性能不断提高同时给系统架构带来了很多问题。而“HyperTransport”构架不但解决了问题,而且更有效地提高了总线带宽,比方AMD Opteron处理器,灵活的HyperTransport I/O总线体系结构让它整合了内存控制器,使处理器不通过系统总线传给芯片组而直接和内存交换数据。这样的话,前端总线(FSB)频率在AMD Opteron处理器就不知道从何谈起了。
4、CPU的位和字长
位:在数字电路和电脑技术中采用二进制,代码只有“0”和“1”,其中无论是 “0”或是“1”在CPU中都是 一“位”。
字长:电脑技术中对CPU在单位时间内(同一时间)能一次处理的二进制数的位数叫字长。所以能处理字长为8位数据的CPU通常就叫8位的CPU。同理32位的CPU就能在单位时间内处理字长为32位的二进制数据。字节和字长的区别:由于常用的英文字符用8位二进制就可以表示,所以通常就将8位称为一个字节。字长的长度是不固定的,对于不同的CPU、字长的长度也不一样。8位的CPU一次只能处理一个字节,而32位的CPU一次就能处理4个字节,同理字长为64位的CPU一次可以处理8个字节。
5.倍频系数
倍频系数是指CPU主频与外频之间的相对比例关系。在相同的外频下,倍频越高CPU的频率也越高。但实际上,在相同外频的前提下,高倍频的CPU本身意义并不大。这是因为CPU与系统之间数据传输速度是有限的,一味追求高倍频而得到高主频的CPU就会出现明显的“瓶颈”效应—CPU从系统中得到数据的极限速度不能够满足CPU运算的速度。一般除了工程样版的Intel的CPU都是锁了倍频的,而AMD之前都没有锁。
6.缓存
缓存大小也是CPU的重要指标之一,而且缓存的结构和大小对CPU速度的影响非常大,CPU内缓存的运行频率极高,一般是和处理器同频运作,工作效率远远大于系统内存和硬盘。实际工作时,CPU往往需要重复读取同样的数据块,而缓存容量的增大,可以大幅度提升CPU内部读取数据的命中率,而不用再到内存或者硬盘上寻找,以此提高系统性能。但是由于CPU芯片面积和成本的因素来考虑,缓存都很小。
L1 Cache(一级缓存)是CPU第一层高速缓存,分为数据缓存和指令缓存。内置的L1高速缓存的容量和结构对CPU的性能影响较大,不过高速缓冲存储器均由静态RAM组成,结构较复杂,在CPU管芯面积不能太大的情况下,L1级高速缓存的容量不可能做得太大。一般服务器CPU的L1缓存的容量通常在32—256KB。
L2 Cache(二级缓存)是CPU的第二层高速缓存,分内部和外部两种芯片。内部的芯片二级缓存运行速度与主频相同,而外部的二级缓存则只有主频的一半。L2高速缓存容量也会影响CPU的性能,原则是越大越好,以前家庭用CPU容量最大的是512KB,现在笔记本电脑中也可以达到2M,而服务器和工作站上用CPU的L2高速缓存更高,可以达到8M以上。
L3 Cache(三级缓存),分为两种,早期的是外置,现在的都是内置的。而它的实际作用即是,L3缓存的应用可以进一步降低内存延迟,同时提升大数据量计算时处理器的性能。降低内存延迟和提升大数据量计算能力对游戏都很有帮助。而在服务器领域增加L3缓存在性能方面仍然有显著的提升。比方具有较大L3缓存的配置利用物理内存会更有效,故它比较慢的磁盘I/O子系统可以处理更多的数据请求。具有较大L3缓存的处理器提供更有效的文件系统缓存行为及较短消息和处理器队列长度。
其实最早的L3缓存被应用在AMD发布的K6-III处理器上,当时的L3缓存受限于制造工艺,并没有被集成进芯片内部,而是集成在主板上。在只能够和系统总线频率同步的L3缓存同主内存其实差不了多少。后来使用L3缓存的是英特尔为服务器市场所推出的Itanium处理器。接着就是P4EE和至强MP。Intel还打算推出一款9MB L3缓存的Itanium2处理器,和以后24MB L3缓存的双核心Itanium2处理器。
但基本上L3缓存对处理器的性能提高显得不是很重要,比方配备1MB L3缓存的Xeon MP处理器却仍然不是Opteron的对手,由此可见前端总线的增加,要比缓存增加带来更有效的性能提升。
7.CPU扩展指令集
CPU依靠指令来计算和控制系统,每款CPU在设计时就规定了一系列与其硬件电路相配合的指令系统。指令的强弱也是CPU的重要指标,指令集是提高微处理器效率的最有效工具之一。从现阶段的主流体系结构讲,指令集可分为复杂指令集和精简指令集两部分,而从具体运用看,如Intel的MMX(Multi Media Extended)、SSE、 SSE2(Streaming-Single instruction multiple data-Extensions 2)、SEE3和AMD的3DNow!等都是CPU的扩展指令集,分别增强了CPU的多媒体、图形图象和Internet等的处理能力。我们通常会把CPU的扩展指令集称为”CPU的指令集”。SSE3指令集也是目前规模最小的指令集,此前MMX包含有57条命令,SSE包含有50条命令,SSE2包含有144条命令,SSE3包含有13条命令。目前SSE3也是最先进的指令集,英特尔Prescott处理器已经支持SSE3指令集,AMD会在未来双核心处理器当中加入对SSE3指令集的支持,全美达的处理器也将支持这一指令集。
8.CPU内核和I/O工作电压
从586CPU开始,CPU的工作电压分为内核电压和I/O电压两种,通常CPU的核心电压小于等于I/O电压。其中内核电压的大小是根据CPU的生产工艺而定,一般制作工艺越小,内核工作电压越低;I/O电压一般都在1.6~5V。低电压能解决耗电过大和发热过高的问题。
9.制造工艺
制造工艺的微米是指IC内电路与电路之间的距离。制造工艺的趋势是向密集度愈高的方向发展。密度愈高的IC电路设计,意味着在同样大小面积的IC中,可以拥有密度更高、功能更复杂的电路设计。现在主要的180nm、130nm、90nm、65nm、45nm。最近官方已经表示有32nm的制造工艺了。
10.指令集
(1)CISC指令集
CISC指令集,也称为复杂指令集,英文名是CISC,(Complex Instruction Set Computer的缩写)。在CISC微处理器中,程序的各条指令是按顺序串行执行的,每条指令中的各个 *** 作也是按顺序串行执行的。顺序执行的优点是控制简单,但计算机各部分的利用率不高,执行速度慢。其实它是英特尔生产的x86系列(也就是IA-32架构)CPU及其兼容CPU,如AMD、VIA的。即使是现在新起的X86-64(也被成AMD64)都是属于CISC的范畴。
要知道什么是指令集还要从当今的X86架构的CPU说起。X86指令集是Intel为其第一块16位CPU(i8086)专门开发的,IBM1981年推出的世界第一台PC机中的CPU—i8088(i8086简化版)使用的也是X86指令,同时电脑中为提高浮点数据处理能力而增加了X87芯片,以后就将X86指令集和X87指令集统称为X86指令集。
虽然随着CPU技术的不断发展,Intel陆续研制出更新型的i80386、i80486直到过去的PII至强、PIII至强、Pentium 3,最后到今天的Pentium 4系列、至强(不包括至强Nocona),但为了保证电脑能继续运行以往开发的各类应用程序以保护和继承丰富的软件资源,所以Intel公司所生产的所有CPU仍然继续使用X86指令集,所以它的CPU仍属于X86系列。由于Intel X86系列及其兼容CPU(如AMD Athlon MP、)都使用X86指令集,所以就形成了今天庞大的X86系列及兼容CPU阵容。x86CPU目前主要有intel的服务器CPU和AMD的服务器CPU两类。
(2)RISC指令集
RISC是英文“Reduced Instruction Set Computing ” 的缩写,中文意思是“精简指令集”。它是在CISC指令系统基础上发展起来的,有人对CISC机进行测试表明,各种指令的使用频度相当悬殊,最常使用的是一些比较简单的指令,它们仅占指令总数的20%,但在程序中出现的频度却占80%。复杂的指令系统必然增加微处理器的复杂性,使处理器的研制时间长,成本高。并且复杂指令需要复杂的 *** 作,必然会降低计算机的速度。基于上述原因,20世纪80年代RISC型CPU诞生了,相对于CISC型CPU ,RISC型CPU不仅精简了指令系统,还采用了一种叫做“超标量和超流水线结构”,大大增加了并行处理能力。RISC指令集是高性能CPU的发展方向。它与传统的CISC(复杂指令集)相对。相比而言,RISC的指令格式统一,种类比较少,寻址方式也比复杂指令集少。当然处理速度就提高很多了。目前在中高档服务器中普遍采用这一指令系统的CPU,特别是高档服务器全都采用RISC指令系统的CPU。RISC指令系统更加适合高档服务器的 *** 作系统UNIX,现在Linux也属于类似UNIX的 *** 作系统。RISC型CPU与Intel和AMD的CPU在软件和硬件上都不兼容。
目前,在中高档服务器中采用RISC指令的CPU主要有以下几类:PowerPC处理器、SPARC处理器、PA-RISC处理器、MIPS处理器、Alpha处理器。
(3)IA-64
EPIC(Explicitly Parallel Instruction Computers,精确并行指令计算机)是否是RISC和CISC体系的继承者的争论已经有很多,单以EPIC体系来说,它更像Intel的处理器迈向RISC体系的重要步骤。从理论上说,EPIC体系设计的CPU,在相同的主机配置下,处理Windows的应用软件比基于Unix下的应用软件要好得多。
Intel采用EPIC技术的服务器CPU是安腾Itanium(开发代号即Merced)。它是64位处理器,也是IA-64系列中的第一款。微软也已开发了代号为Win64的 *** 作系统,在软件上加以支持。在Intel采用了X86指令集之后,它又转而寻求更先进的64-bit微处理器,Intel这样做的原因是,它们想摆脱容量巨大的x86架构,从而引入精力充沛而又功能强大的指令集,于是采用EPIC指令集的IA-64架构便诞生了。IA-64 在很多方面来说,都比x86有了长足的进步。突破了传统IA32架构的许多限制,在数据的处理能力,系统的稳定性、安全性、可用性、可观理性等方面获得了突破性的提高。
IA-64微处理器最大的缺陷是它们缺乏与x86的兼容,而Intel为了IA-64处理器能够更好地运行两个朝代的软件,它在IA-64处理器上(Itanium、Itanium2 ……)引入了x86-to-IA-64的解码器,这样就能够把x86指令翻译为IA-64指令。这个解码器并不是最有效率的解码器,也不是运行x86代码的最好途径(最好的途径是直接在x86处理器上运行x86代码),因此Itanium 和Itanium2在运行x86应用程序时候的性能非常糟糕。这也成为X86-64产生的根本原因。
(4)X86-64 (AMD64 / EM64T)
AMD公司设计,可以在同一时间内处理64位的整数运算,并兼容于X86-32架构。其中支持64位逻辑定址,同时提供转换为32位定址选项;但数据 *** 作指令默认为32位和8位,提供转换成64位和16位的选项;支持常规用途寄存器,如果是32位运算 *** 作,就要将结果扩展成完整的64位。这样,指令中有“直接执行”和“转换执行”的区别,其指令字段是8位或32位,可以避免字段过长。
x86-64(也叫AMD64)的产生也并非空穴来风,x86处理器的32bit寻址空间限制在4GB内存,而IA-64的处理器又不能兼容x86。AMD充分考虑顾客的需求,加强x86指令集的功能,使这套指令集可同时支持64位的运算模式,因此AMD把它们的结构称之为x86-64。在技术上AMD在x86-64架构中为了进行64位运算,AMD为其引入了新增了R8-R15通用寄存器作为原有X86处理器寄存器的扩充,但在而在32位环境下并不完全使用到这些寄存器。原来的寄存器诸如EAX、EBX也由32位扩张至64位。在SSE单元中新加入了8个新寄存器以提供对SSE2的支持。寄存器数量的增加将带来性能的提升。与此同时,为了同时支持32和64位代码及寄存器,x86-64架构允许处理器工作在以下两种模式:Long Mode(长模式)和Legacy Mode(遗传模式),Long模式又分为两种子模式(64bit模式和Compatibility mode兼容模式)。该标准已经被引进在AMD服务器处理器中的Opteron处理器.
而今年也推出了支持64位的EM64T技术,再还没被正式命为EM64T之前是IA32E,这是英特尔64位扩展技术的名字,用来区别X86指令集。Intel的EM64T支持64位sub-mode,和AMD的X86-64技术类似,采用64位的线性平面寻址,加入8个新的通用寄存器(GPRs),还增加8个寄存器支持SSE指令。与AMD相类似,Intel的64位技术将兼容IA32和IA32E,只有在运行64位 *** 作系统下的时候,才将会采用IA32E。IA32E将由2个sub-mode组成:64位sub-mode和32位sub-mode,同AMD64一样是向下兼容的。Intel的EM64T将完全兼容AMD的X86-64技术。现在Nocona处理器已经加入了一些64位技术,Intel的Pentium 4E处理器也支持64位技术。
应该说,这两者都是兼容x86指令集的64位微处理器架构,但EM64T与AMD64还是有一些不一样的地方,AMD64处理器中的NX位在Intel的处理器中将没有提供。
11.超流水线与超标量
在解释超流水线与超标量前,先了解流水线(pipeline)。流水线是Intel首次在486芯片中开始使用的。流水线的工作方式就象工业生产上的装配流水线。在CPU中由5—6个不同功能的电路单元组成一条指令处理流水线,然后将一条X86指令分成5—6步后再由这些电路单元分别执行,这样就能实现在一个CPU时钟周期完成一条指令,因此提高CPU的运算速度。经典奔腾每条整数流水线都分为四级流水,即指令预取、译码、执行、写回结果,浮点流水又分为八级流水。
超标量是通过内置多条流水线来同时执行多个处理器,其实质是以空间换取时间。而超流水线是通过细化流水、提高主频,使得在一个机器周期内完成一个甚至多个 *** 作,其实质是以时间换取空间。例如Pentium 4的流水线就长达20级。将流水线设计的步(级)越长,其完成一条指令的速度越快,因此才能适应工作主频更高的CPU。但是流水线过长也带来了一定副作用,很可能会出现主频较高的CPU实际运算速度较低的现象,Intel的奔腾4就出现了这种情况,虽然它的主频可以高达1.4G以上,但其运算性能却远远比不上AMD 1.2G的速龙甚至奔腾III。
12.封装形式
CPU封装是采用特定的材料将CPU芯片或CPU模块固化在其中以防损坏的保护措施,一般必须在封装后CPU才能交付用户使用。CPU的封装方式取决于CPU安装形式和器件集成设计,从大的分类来看通常采用Socket插座进行安装的CPU使用PGA(栅格阵列)方式封装,而采用Slot x槽安装的CPU则全部采用SEC(单边接插盒)的形式封装。现在还有PLGA(Plastic Land Grid Array)、OLGA(Organic Land Grid Array)等封装技术。由于市场竞争日益激烈,目前CPU封装技术的发展方向以节约成本为主。
13、多线程
同时多线程Simultaneous multithreading,简称SMT。SMT可通过复制处理器上的结构状态,让同一个处理器上的多个线程同步执行并共享处理器的执行资源,可最大限度地实现宽发射、乱序的超标量处理,提高处理器运算部件的利用率,缓和由于数据相关或Cache未命中带来的访问内存延时。当没有多个线程可用时,SMT处理器几乎和传统的宽发射超标量处理器一样。SMT最具吸引力的是只需小规模改变处理器核心的设计,几乎不用增加额外的成本就可以显著地提升效能。多线程技术则可以为高速的运算核心准备更多的待处理数据,减少运算核心的闲置时间。这对于桌面低端系统来说无疑十分具有吸引力。Intel从3.06GHz Pentium 4开始,所有处理器都将支持SMT技术。
14、多核心
多核心,也指单芯片多处理器(Chip multiprocessors,简称CMP)。CMP是由美国斯坦福大学提出的,其思想是将大规模并行处理器中的SMP(对称多处理器)集成到同一芯片内,各个处理器并行执行不同的进程。与CMP比较, SMT处理器结构的灵活性比较突出。但是,当半导体工艺进入0.18微米以后,线延时已经超过了门延迟,要求微处理器的设计通过划分许多规模更小、局部性更好的基本单元结构来进行。相比之下,由于CMP结构已经被划分成多个处理器核来设计,每个核都比较简单,有利于优化设计,因此更有发展前途。目前,IBM 的Power 4芯片和Sun的 MAJC5200芯片都采用了CMP结构。多核处理器可以在处理器内部共享缓存,提高缓存利用率,同时简化多处理器系统设计的复杂度。
2005年下半年,Intel和AMD的新型处理器也将融入CMP结构。新安腾处理器开发代码为Montecito,采用双核心设计,拥有最少18MB片内缓存,采取90nm工艺制造,它的设计绝对称得上是对当今芯片业的挑战。它的每个单独的核心都拥有独立的L1,L2和L3 cache,包含大约10亿支晶体管。
15、SMP SMP(Symmetric Multi-Processing),对称多处理结构的简称,是指在一个计算机上汇集了一组处理器(多CPU),各CPU之间共享内存子系统以及总线结构。在这种技术的支持下,一个服务器系统可以同时运行多个处理器,并共享内存和其他的主机资源。像双至强,也就是我们所说的二路,这是在对称处理器系统中最常见的一种(至强MP可以支持到四路,AMD Opteron可以支持1-8路)。也有少数是16路的。但是一般来讲,SMP结构的机器可扩展性较差,很难做到100个以上多处理器,常规的一般是8个到16个,不过这对于多数的用户来说已经够用了。在高性能服务器和工作站级主板架构中最为常见,像UNIX服务器可支持最多256个CPU的系统。
构建一套SMP系统的必要条件是:支持SMP的硬件包括主板和CPU;支持SMP的系统平台,再就是支持SMP的应用软件。
为了能够使得SMP系统发挥高效的性能, *** 作系统必须支持SMP系统,如WINNT、LINUX、以及UNIX等等32位 *** 作系统。即能够进行多任务和多线程处理。多任务是指 *** 作系统能够在同一时间让不同的CPU完成不同的任务;多线程是指 *** 作系统能够使得不同的CPU并行的完成同一个任务
要组建SMP系统,对所选的CPU有很高的要求,首先、CPU内部必须内置APIC(Advanced Programmable Interrupt Controllers)单元。Intel 多处理规范的核心就是高级可编程中断控制器(Advanced Programmable Interrupt Controllers–APICs)的使用;再次,相同的产品型号,同样类型的CPU核心,完全相同的运行频率;最后,尽可能保持相同的产品序列编号,因为两个生产批次的CPU作为双处理器运行的时候,有可能会发生一颗CPU负担过高,而另一颗负担很少的情况,无法发挥最大性能,更糟糕的是可能导致死机。
16、NUMA技术
NUMA即非一致访问分布共享存储技术,它是由若干通过高速专用网络连接起来的独立节点构成的系统,各个节点可以是单个的CPU或是SMP系统。在NUMA中,Cache 的一致性有多种解决方案,需要 *** 作系统和特殊软件的支持。图2中是Sequent公司NUMA系统的例子。这里有3个SMP模块用高速专用网络联起来,组成一个节点,每个节点可以有12个CPU。像Sequent的系统最多可以达到64个CPU甚至256个CPU。显然,这是在SMP的基础上,再用NUMA的技术加以扩展,是这两种技术的结合。
17、乱序执行技术
乱序执行(out-of-orderexecution),是指CPU允许将多条指令不按程序规定的顺序分开发送给各相应电路单元处理的技术。这样将根据个电路单元的状态和各指令能否提前执行的具体情况分析后,将能提前执行的指令立即发送给相应电路单元执行,在这期间不按规定顺序执行指令,然后由重新排列单元将各执行单元结果按指令顺序重新排列。采用乱序执行技术的目的是为了使CPU内部电路满负荷运转并相应提高了CPU的运行程序的速度。分枝技术:(branch)指令进行运算时需要等待结果,一般无条件分枝只需要按指令顺序执行,而条件分枝必须根据处理后的结果,再决定是否按原先顺序进行。
18、CPU内部的内存控制器
许多应用程序拥有更为复杂的读取模式(几乎是随机地,特别是当cache hit不可预测的时候),并且没有有效地利用带宽。典型的这类应用程序就是业务处理软件,即使拥有如乱序执行(out of order execution)这样的CPU特性,也会受内存延迟的限制。这样CPU必须得等到运算所需数据被除数装载完成才能执行指令(无论这些数据来自CPU cache还是主内存系统)。当前低段系统的内存延迟大约是120-150ns,而CPU速度则达到了3GHz以上,一次单独的内存请求可能会浪费200-300次CPU循环。即使在缓存命中率(cache hit rate)达到99%的情况下,CPU也可能会花50%的时间来等待内存请求的结束- 比如因为内存延迟的缘故。
你可以看到Opteron整合的内存控制器,它的延迟,与芯片组支持双通道DDR内存控制器的延迟相比来说,是要低很多的。英特尔也按照计划的那样在处理器内部整合内存控制器,这样导致北桥芯片将变得不那么重要。但改变了处理器访问主存的方式,有助于提高带宽、降低内存延时和提升处理器性
制造工艺:现在CPU的制造工艺是0.35微米,最新的PII可以达到0.28微米,在将来的CPU制造工艺可以达到0.18微米。
文章为百度百科
Analog Device Inc. ,即“亚德诺半导体技术公司”,另一译名是 “美国模拟器件公司”亚德诺半导体技术公司(Analog Devices, Inc. 纽约证券交易所代码:ADI)自从1965年创建以来到2005年经历了悠久历史变迁,取得了辉煌业绩,树立起成立40周年的里程碑。回顾ADI公司的成功历程——从位于美国马萨诸塞州剑桥市一座公寓大楼地下室的简陋实验室开始起步——经过40多年的努力,发展成全世界特许半导体行业中最卓越的供应商之一。
ADI将创新、业绩和卓越作为企业的文化支柱,并基此成长为该技术领域最持久高速增长的企业之一。ADI公司是业界广泛认可的数据转换和信号处理技术全球领先的供应商,拥有遍布世界各地的60,000客户,涵盖了全部类型的电子设备制造商。作为领先业界40多年的高性能模拟集成电路(IC)制造商,ADI的产品广泛用于模拟信号和数字信号处理领域。公司总部设在美国马萨诸塞州诺伍德市,设计和制造基地遍布全球。ADI公司的股票在纽约证券交易所上市,并被纳入标准普尔500指数(S&P 500 Index )。
ADI生产的数字信号处理芯片(DSP:Digital Singal Processor),代表系列有 ADSP Sharc 211xx (低端领域),ADSP TigerSharc 101,201,....(高端领域),ADSP Blackfin 系列(消费电子领域).
ADSP与另外一个著名的德州仪器(TI: Texas Instrument)生产的芯片特点相比较,具有浮点运算强,SIMD(单指令多数据)编程的优势, 比较新的Blackfin系列比同一级别TI产品功耗低.缺点是ADSP不如TI的C语言编译优化好.TI已经普及了C语言的编程,而AD芯片的性能发挥比较依赖程序员的编程水平.ADSP的Linkport数据传输能力强是一大特色,但是使用起来不够稳定,调试难度大.
ADI提供的Visual DSP ++2.0, 3.0, 4.0, 4.5 ,5.0编程环境,可以支持软件人员开发调试.
http://baike.baidu.com/view/471819.htm
美国国家仪器公司(NI)帮助测试、控制、设计领域的工程师与科学家解决了从设计、原型到发布过程中所遇到的种种挑战。通过现成可用的软件,如LabVIEW, 以及高性价比的模块化硬件,NI帮助各领域的工程师不断创新,在缩短产品问世时间的同时有效降低开发成本。如今,NI为遍布全球各地的30,000家不同的客户提供多种应用选择。NI总部设于美国德克萨斯州的奥斯汀市,在40个国家中设有分支机构,共拥有5,200多名员工。在过去连续十二年里,《财富》杂志评选NI为全美最适合工作的100家公司之一。作为最大的海外分支机构之一,NI中国拥有完善的产品销售、技术支持、售后服务和强大的研发团队。
20世纪70年代初期,詹姆斯·楚查德博士、比尔·诺林和杰夫·科多斯基三个年轻人在得克萨斯州大学奥斯汀分校的应用研究实验室中工作。因为从事对美国海军项目的研究,这些人使用了早期的计算机技术来收集和分析数据。当时数据收集方法的低效使他们十分沮丧,于是他们决定创造一种新产品,来使他们的任务变得轻松。 1976年,在詹姆斯·楚查德家的车库里,三个小伙子建立了一家公司。
最初公司命名时曾有过“长角牛仪器”、“得克萨斯数据”等创意,但提交申请时均遭到拒绝,于是最终采用了如今的名称:“国家仪器”。
公司成立后,从Interfirst银行贷款一万美元并购置了一台PDP-11小型计算机。设置和建造GPIB接口是公司接手的第一个项目,第一个成功的订单则是向位于圣安东尼奥的凯利空军基地推销而得的。由于三人受聘于学校,所以在1977年他们雇佣了第一位全职人员来负责订单、账单与客户服务。随着公司交易额的扩大,1978年,他们搬到了一个56平方米的办公室内。
1980年,三人从学校辞去工作全职投入公司的发展,公司也搬到了一个拥有500平方米的办公室内。为了帮助创收,公司接手了许多特别项目,包括油泵xyk系统和美国海军声纳测试所需的波形发生器。到1981年,该公司已达成100万美元的销售大关,因此他们1982年迁移到拥有1000平方米的一间更大的办公室。
1986年,LabVIEW这一基于苹果机环境下的著名图形开发系统推出。这款软件使工程师和科学家们可以生动的采用“电线”等图形进行编程,而非像之前一样基于代码来输入文字。通过人们更直观的使用和框架结构的减少,生产力得以大大提高,这使得LabVIEW一经发布便大受欢迎。次年,基于DOS环境的LabVIEW新版本LabWindows发布。伴随着这如今已成为旗舰产品的面市,NI提出了“软件就是仪器”的口号,开辟了虚拟仪器这一全新的概念。
此时的美国国家仪器公司已经拥有了100名员工,为了提高员工的工作积极性,员工的每一份成就都会得到赞誉。在1987年,公司决定直接销售产品而非继续通过代理,于是在日本东京开设了第一家国际分公司。
1990年公司挪到了奥斯汀湖畔的一栋建筑里,并于1991年将其购置。因紧邻当地一座桥,又称为“硅丘桥点”("Silicon Hills = Bridge Point.")。1991年,公司通过LabVIEW获得了第一份专利。其后,他们相继发明了SCXI,LabWindows/CVI等,并开设了NI园区。
2002年,公司在匈牙利第二大城市德布勒森开设第一家海外工厂。
http://baike.baidu.com/view/5314752.htm
英特尔公司(Intel Corporation)(NASDAQ:INTC,港交所:4335),总部位于美国加州,工程技术部和销售部以及6个芯片制造工厂位于美国俄勒冈州波特兰。英特尔的创始人Robert Noyce和Gordon Moore原本希望他们新公司的名称为两人名字的组合——Moore Noyce,但当他们去工商局登记时,却发现这个名字已经被一家连锁酒店抢先注册。不得已,他们采取了“Integrated Electronics(集成电子)”两个单词的缩写为公司名称。现任经营高层是董事长克雷格·贝瑞特和总裁兼执行长保罗·欧德宁。
英特尔公司在随着个人电脑普及,英特尔公司成为世界上最大设计和生产半导体的科技巨擘。为全球日益发展的计算机工业提供建筑模块,包括微处理器、芯片组、板卡、系统及软件等。这些产品为标准计算机架构的组成部分。业界利用这些产品为最终用户设计制造出先进的计算机。英特尔公司致力于在客户机、服务器、网络通讯、互联网解决方案和互联网服务方面为日益兴起的全球互联网经济提供建筑模块。
具体研究领域包括音频/视频信号处理和基于PC的相关应用,以及可以推动未来微结构和下一代处理器设计的高级编译技术和运行时刻系统研究。另外还有英特尔中国软件实验室、英特尔架构开发实验室、英特尔互联网交换架构实验室、英特尔无线技术开发中心。除此之外,英特尔还与国内著名大学和研究机构,如中国科学院计算所针对IA-64位编译器进行了共同研究开发,并取得了可喜的成绩。
编辑本段
创办起源
1955年,“晶体管之父”威廉·肖克利,离开贝尔实验室创建肖克利半导体实验室并吸引了许多才华横溢的年轻科学家加入,但很快,肖克利的管理方法和怪异行为引起员工的不满。其中被肖克利称为八叛逆的罗伯特·诺伊斯、戈登·摩尔、朱利亚斯·布兰克、尤金·克莱尔、金·赫尔尼、杰·拉斯特、谢尔顿·罗伯茨和维克多·格里尼克,联合辞职并于1957年10月共同创办了仙童半导体公司。安迪·葛洛夫于1963年在戈登·摩尔的邀请下加入了仙童半导体公司。
由于仙童半导体快速发展,导致内部组织管理与产品问题日亦失衡。1968年7月仙童半导体其中两位共同创办人罗伯特·诺宜斯、戈登·摩尔请辞,并于7月16日,以集成电路之名(integrated electronics)共同创办Intel公司。而安迪·葛洛夫也自愿跟随戈登·摩尔的脚步,成为英特尔公司第3位员工。
在安迪·葛洛夫的口述自传中表示,如果以他是公司第3位员工的角度来看,他是“英特尔创办人之一”。但若以所有权来说,因未受邀1美元价格购股,而是以首位自愿加入员工。
微处理器发展史
1971年:4004微处理器
4004处理器是英特尔的第一款微处理器。这一突破性的重大发明不仅成为Busicom计算器强劲的动力之源,更打开了让机器设备象个人电脑一样可嵌入智能的未来之路。
1972年:8008微处理器
8008处理器拥有相当于4004处理器两倍的处理能力。《无线电电子学》杂志1974年的一篇文章曾提及一种采用了8008处理器的设备 Mark-8,它是首批为家用目的而制造的电脑之一——不过按照今天的标准,Mark-8既难于制造组装,又不容易维护 *** 作。
1974年:8080微处理器
世界上第一台个人电脑 Altair 采用了8080处理器作为大脑——据称“Altair” 出自电视剧《星际迷航 Star Trek》,是片中企业号飞船的目标地之一。电脑爱好者们花395美元就能购买一台Altair。仅短短几个月时间,这种电脑就销售出了好几万台,创下历史上首次个人电脑延期交货的纪录
1978年:8086-8088微处理器
英特尔与IBM 新个人电脑部门所进行的一次关键交易使8088处理器成为了IBM 新型主打产品IBM PC的大脑。8088的大获成功使英特尔步入全球企业500强的行列,并被《财富》 杂志评为“70 年代最成功企业”之一。
1982年:286微处理器
英特尔286最初的名称为80286,是英特尔第一款能够运行所有为其前代产品编写的软件的处理器。这种强大的软件兼容性亦成为英特尔微处理器家族的重要特点之一。在该产品发布后的6年里,全世界共生产了大约1500万台采用286处理器的个人电脑。
1985年:英特386?6?4 微处理器
英特尔386?6?4 微处理器拥有275,000个晶体管,是早期4004处理器的100多倍。该处理器是一款32位芯片,具有多任务处理能力,也就是说它可以同时运行多种程序。
1989年:英特尔486?6?4 DX CPU 微处理器
英特尔486?6?4 处理器从真正意义上表明用户从依靠输入命令运行电脑的年代进入了只需点击即可 *** 作的全新时代。史密森尼博物院国立美国历史博物馆的技术史学家David K. Allison回忆说,“我第一次拥有这样一台彩色显示电脑,并如此之快地在桌面进行我的排版工作。”英特尔486?6?4 处理器首次增加了一个内置的数学协处理器,将复杂的数学功能从中央处理器中分离出来,从而大幅度提高了计算速度。
1993年:英特尔奔腾(Pentium)处理器
英特尔奔腾处理器能够让电脑更加轻松地整合“真实世界” 中的数据(如讲话、声音、笔迹和图片)。通过漫画和电视脱口秀节目宣传的英特尔奔腾处理器,一经推出即迅速成为一个家喻户晓的知名品牌。
1995年:英特尔高能奔腾(Italium Pentium)处理器
于1995 年秋季发布的英特尔高能奔腾处理器设计用于支持32位服务器和工作站应用,以及高速的电脑辅助设计、机械工程和科学计算等。每一枚英特尔高能奔腾处理器在封装时都加入了一枚可以再次提升速度的二级高速缓存存储芯片。强大的英特尔高能奔腾处理器拥有多达550万个晶体管。不适应市场需要,过早夭折。
1997年:英特尔奔腾II(Pentium II)处理器
英特尔奔腾II 处理器拥有750万个晶体管,并采用了英特尔MMX?6?4 技术,专门设计用于高效处理视频、音频和图形数据。该产品采用了创新的单边接触卡盒(S.E.C)封装,并整合了一枚高速缓存存储芯片。有了这一芯片,个人电脑用户就可以通过互联网捕捉、编辑并与朋友和家人共享数字图片;还可以对家庭电影进行编辑和添加文本、音乐或情景过渡;甚至可以使用视频电话通过标准的电话线向互联网发送视频。
1998年:英特尔奔腾II至强(Xeon)处理器
英特尔奔腾II至强处理器设计用于满足中高端服务器和工作站的性能要求。遵照英特尔为特定市场提供专属处理器产品的战略,英特尔奔腾II至强处理器所拥有的技术创新专门设计用于工作站和服务器执行所需的商业应用,如互联网服务、企业数据存储、数字内容创作以及电子和机械设计自动化等。基于该处理器的计算机系统可配置四或八枚处理器甚至更多。
1999年:英特尔赛扬(Celeron)处理器
作为英特尔面向具体市场开发产品这一战略的继续,英特尔赛扬处理器设计用于经济型的个人电脑市场。该处理器为消费者提供了格外出色的性价比,并为游戏和教育软件等应用提供了出色的性能。
1999年:英特尔奔腾III(Pentium III)处理器
英特尔奔腾III处理器的70条创新指令——因特网数据流单指令序列扩展(Internet Streaming SIMD extensions)——明显增强了处理高级图像、3D、音频流、视频和语音识别等应用所需的性能。该产品设计用于大幅提升互联网体验,让用户得以浏览逼真的网上博物馆和商店,并下载高品质的视频等。该处理器集成了950万个晶体管,并采用了0.25微米技术。
1999年:英特尔奔腾III至强(Pentium III Xeon)处理器
英特尔奔腾III至强处理器在英特尔面向工作站和服务器市场的产品基础上进行了扩展,提供额外的性能以支持电子商务应用及高端商业计算。该处理器整合了英特尔奔腾III 处理器所拥有的70条SIMD 指令,使得多媒体和视频流应用的性能显著增强。并且英特尔奔腾III至强处理器所拥有的先进的高速缓存技术加速了信息从系统总线到处理器的传输,使性能获得了大幅提升。该处理器设计用于多处理器配置的系统。
2000年:英特尔奔腾4(Pentium 4)处理器
基于英特尔奔腾4处理器的个人电脑用户可以创作专业品质的电影;通过互联网发送像电视一样的视频;使用实时视频语音工具进行交流;实时渲染3D图形;为MP3 播放器快速编码音乐;在与互联网进行连接的状态下同时运行多个多媒体应用。该处理器最初推出时就拥有4200万个晶体管和仅为0.18微米的电路线。英特尔首款微处理器4004的运行速率为108KHz,而现今的英特尔奔腾4处理器的初速率已经达到了1.5GHz,如果汽车的速度也能有同等提升的话,那么从旧金山开车到纽约只需要13秒。
2001年:英特尔至强(Xeon)处理器
英特尔至强处理器的应用目标是那些即将出现的高性能和中端双路工作站、以及双路和多路配置的服务器。该平台为客户提供了一种兼具高性能和低价格优势的全新 *** 作系统和应用选择。与基于英特尔奔腾III至强处理器的系统相比,采用英特尔至强处理器的工作站根据应用和配置的不同,其性能预计可提升30%到90%左右。该处理器基于英特尔NetBurst?6?4 架构,设计用于为视频和音频应用、高级互联网技术及复杂3D图形提供所需要的计算动力。
2001年:英特尔安腾(Itanium)处理器
英特尔安腾处理器是英特尔推出的64位处理器家族中的首款产品。该处理器是在基于英特尔简明并行指令计算(EPIC)设计技术的全新架构之基础上开发制造的,设计用于高端、企业级服务器和工作站。该处理器能够为要求最苛刻的企业和高性能计算应用(包括电子商务安全交易、大型数据库、计算机辅助的机械工程以及精密的科学和工程计算)提供全球最出色的性能。
2002年:英特尔安腾2处理器(Itanium2) Intel Pentium 4 /Hyper Threading处理器
英特尔安腾2处理器是安腾处理器家族的第二位成员,同样是一款企业用处理器。该处理器家族为数据密集程度最高、业务最关键和技术要求最高的计算应用提供英特尔架构的出色性能及规模经济等优势。该处理器能为数据库、计算机辅助工程、网上交易安全等提供领先的性能。
英特尔推出新款Intel Pentium 4处理器内含创新的Hyper-Threading(HT)超执行绪技术。超执行绪技术打造出新等级的高效能桌上型计算机,能同时快速执行多项运算应用,或针对支持多重执行绪的软件带来更高的效能。超执行绪技术让计算机效能增加25%。除了为桌上型计算机使用者提供超执行绪技术外,英特尔亦达成另一项计算 机里程碑,就是推出运作时脉达3.06GHz的Pentium 4处理器,是首款每秒执行30亿个运算周期的商业微处理器,如此优异的性能要归功于当时业界最先进的0.13微米制程技术,翌年,内建超执行绪技术的Intel Pentium4处理器时脉达到3.2GHz。
2003年:英特尔奔腾 M(Pentium M)/赛扬 M (Celeron M)处理器
英特尔奔腾M处理器,英特尔855芯片组家族以及英特尔PRO/无线2100网卡是英特尔迅驰?6?4 移动计算技术的三大组成部分。英特尔迅驰移动计算技术专门设计用于便携式计算,具有内建的无线局域网能力和突破性的创新移动性能。该处理器支持更耐久的电池使用时间,以及更轻更薄的笔记本电脑造形。
2005年:Intel Pentium D 处理器
首颗内含2个处理核心的Intel Pentium D处理器登场,正式揭开x86处理器多核心时代。(绰号胶水双核,被别人这样叫是有原因的,PD由于高频低能噪音大,所以才有这个称号)
2005年:Intel Core处理器
这是英特尔向酷睿架构迈进的第一步。但是,酷睿处理器并没有采用酷睿架构,而是介于NetBurst和Core之间(第一个基于Core架构的处理器是酷睿2)。最初酷睿处理器是面向移动平台的,它是英特尔迅驰3的一个模块,但是后来苹果转向英特尔平台后推出的台式机就是采用的酷睿处理器。
酷睿使双核技术在移动平台上第一次得到实现。与后来的酷睿2类似,酷睿仍然有数个版本:Duo双核版,Solo单核版。其中还有数个低电压版型号以满足对节电要求苛刻的用户的要求。
2006年:Intel Core2 (酷睿2,俗称“扣肉”)/ 赛扬Duo 处理器
Core微架构桌面/移动处理器:桌面处理器核心代号Conroe。将命名为Core 2 Duo/Extreme家族,其E6700 2.6GHz型号比先前推出之最强的Intel Pentium D 960(3.6GHz)处理器,在效能方面提升了40%,省电效率亦增加40%,Core 2 Duo处理器内含2.91亿个晶体管。移动处理器核心代号Merom。是迅驰3.5和迅驰4的处理器模块。当然这两种酷睿2有区别,最主要的就是将FSB由667MHz/533MHz提升到了800MHz。
2007年:Intel 四核心服务器用处理器
英特尔已经推出了若干四核台式机芯片,作为其双核Quad和Extreme家族的组成部分。在服务器领域,英特尔将在其低电压3500和7300系列中交付使用不少于具有9个四核处理器的Xeons。
2007年:Intel QX9770四核至强45nm处理器
先进制程带来的节能冷静,HI-K的引进使CPU更加稳定。先进的SSE4.1指令集、快速除法器,卓越的执行效率,INTEL在处理器方面不断领先
2008年:Intel Atom凌动处理器
低至0.6W的超低功耗处理器,带给大家的是难以想象的节能与冷静
未来:Intel Larrabee计划
Larrabee核心是由1990年的P54C演变而来的,即第二款Pentium处理器,当然生产工艺已经进化到45nm,同时也加入了大量新技术,使其得以重新焕发青春。
Larrabee发布的时候将有32个IA核心(现在的样品是16/24个),支持64位技术,并很可能会支持MMX指令集。事实上,Larrabee的指令集被称为AVX(高级矢量指令集),整数512位,浮点1024位。Stiller估计Larrabee每Hz的理论单精度浮点性能为32Flops,也就是在2GHz下能超过2TFlops。
Intel TerraFlops 80核处理器
这里的“80核”只是一种概念,并不是说处理器正好拥有80个物理核心,而是指处理器拥有大量规模化并行处理能力的核心。TerraFlops处理器将拥有至少28个核心,不同的核心有不同的处理领域,整个处理器运算速度将达到每秒万亿次,相当于现在对普通用户还遥不可及的超级计算机的速度。目前,TerraFlops计划只接纳商业和政府用户,但是根据英特尔的计划,个人用户也会在将来使用上万亿次计算能力的多核处理器。
英特尔处理器核的特点在于具有称之为“宽动态执行”的功能。更为重要的是,其工作功耗比为奔腾4提供处理能力的Netburst架构要低。“我们期望到今年底自顶向下百分之百地采用核微架构,”Otellini说,“今年全年,我们正以非常快的速度取代所有的产品,甚至以核微架构的变种渗透到奔腾处理器和赛扬处理器的领域。这就赋予我们在每一个领域的性能领先地位,并赋予我们高度的成本优势。”
3月26日,英特尔公司总裁兼首席执行官保罗·欧德宁在北京宣布:英特尔将投资25亿美元在大连兴建一座先进的300毫米晶圆制造厂。
2008年11月17日:英特尔发布core i7处理器
基于全新Nehalem架构的下一代桌面处理器将沿用“Core”(酷睿)名称,命名为“Intel Core i7”系列,至尊版的名称是“Intel Core i7 Extreme”系列。而同架构服务器处理器将继续延用“Xeon”名称。
Intel Core i7是一款45nm原生四核处理器,处理器拥有8MB三级缓存,支持三通道DDR3内存。处理器采用LGA 1366针脚设计,支持第二代超线程技术,也就是处理器能以八线程运行。根据网上流传的测试,同频Core i7比Core 2 Quad性能要高出很多。
综合之前的资料来看,英特尔首先会发布三款Intel Core i7处理器,频率分别为3.2GHz、2.93GHz和2.66GHz,主频为3.2GHz的属于Intel Core i7 Extreme,处理器售价为999美元,当然这款顶级处理器面向的是发烧级用户。而频率较低的2.66GHz的定价为284美元,约合1940元人民币,面向的是普通消费者。全新一代Core i7处理器将于2008第四季度推出。Intel于2008年11月18日发布了三款Core i7处理器,分别为Core i7 920、Core i7 940和Core i7 965。
core i7的能力在core2 extreme qx9770(3.2GHz)的三倍左右。IDF上,intel工作人员使用一颗core i7 3.2GHz处理器演示了CineBench R10多线程渲染,渲染开始后,四颗核心的八个线程同时开始工作,仅仅19秒钟后完整的画面就呈现在了屏幕上,得分超过45800。相比之下,core2 extreme qx9770 3.2GHz只能得到12000分左右,超频到4.0GHz才勉强超过15000分,不到core i7的3分之一。
1. 基于Nehalem微架构
2. 2-8颗核心。
3. 内置三通道DDR3内存控制器。
4. 每颗核心独享256KB二级缓存。
5. 8 MB共享三级缓存。
6. SSE 4.2指令集(七条新指令)。
7. 超线程技术。
8. Turbo mode(自动超频)。
9. 微架构优化(支持64-bit模式的宏融合,提高环形数据流监测器性能,六个数据发射端口等等)
10. 提升预判单元性能,增加第二组分支照准缓存。
11. 第二组512路的TLB。
12. 对于非整的SSE指令提升性能。
13. 提升虚拟机性能(根据Intel官方数据显示,Nehalem相对65nm Core 2在双程虚拟潜伏上有60%的提升,而相对45nm Core 2产品提升了20%)
14. 新的QPI总线。
15. 新的能源管理单元。
16. 45nm制程,32nm制程产品随后上线,代号Westmere。
17. 新的1366针脚接口。
Nehalem相当于65nm产品有着如下几个最重要的新增功能。
1. SSE4.1指令集(47个新SSE指令)。
2. 深层休眠技术(C6级休眠,只在移动芯片上使用)。
3. 加强型Intel动态加速技术(只在移动芯片上使用)。
4. 快速Radix-16分频器和Super Shuffle engine,加强FPU性能
5. 加强型虚拟技术,虚拟机之间交互性能提升25%-75%。
Nehalem的核心部分比Core微架构改进了以下部分:
Cache设计:采用三级全内含式Cache设计,L1的设计与Core微架构一样;L2采用超低延迟的设计,每个核心各拥有256KB的L2 Cache;L3则是采用共享式设计,被片上所有核心共享使用。
集成了内存控制器(IMC):内存控制器从北桥芯片组上转移到CPU片上,支持三通道DDR3内存,内存读取延迟大幅减少,内存带宽则大幅提升,最多可达三倍。
快速通道互联(QPI):取代前端总线(FSB)的一种点到点连接技术,20位宽的QPI连接其带宽可达惊人的每秒25.6GB,远超过原来的FSB。QPI最初能够发放异彩的是支持多个处理器的服务器平台,QPI可以用于多处理器之间的互联。
Nehalem的核心部分比Core微架构新增加的功能主要有以下几方面:
New SSE4.2Instructions (新增加SSE4.2指令)
Turbo Mode (内核加速模式)
Improved Lock Support (改进的锁定支持)
Additional Caching Hierarchy (新的缓存层次体系)
Deeper Buffers (更深的缓冲)
Improved Loop Streaming (改进的循环流)
Simultaneous Multi-Threading (同步多线程)
Faster Virtualization (更快的虚拟化)
Better Branch Prediction (更好的分支预测)
2009年第四季度
Clarkdale将于今年第四季度推出,LGA1156接口,双核心四线程。它不但将是Intel(以及整个业界)的第一款32nm工艺芯片,也会是首次集成图形核心的处理器。与之对应的移动版本Arrandale采用类似的架构,只不过要到明年才会发布。
不过值得注意的是,Clarkdale上只有处理器部分才是32nm工艺,同一基片上的独立图形核心(以及双通道DDR3内存控制器)仍是45nm。
2010年八核处理器的诞生
2010年3月30日,Intel公司宣布推出Intel至强处理器7500系列,该系列处理器可用于构建从双路到最高256路的服务器系统。
芯片
http://baike.baidu.com/view/2396.htm
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)