微处理器的发展历程

CPU从最初的发展到现在,已经有20多年了。在此期间,CPU可分为4位微处理器、8位微处理器、16位微处理器、32位微处理器和最新的64位微处理器。可以说,个人电脑的发展是随着CPU的发展而前进的。微型计算机是指以大规模和超大规模集成电路为主要部件,集成了计算机的主要部件——控制器和运算器的微处理器MP(Micro Processor)。经过30多年的发展,微处理器的发展大致可以分为以下几个阶段:

(1971—1973)一般来说,字长是4位或8位微处理器,典型的是美国的Intel 4004和Intel 8008微处理器。Intel 4004是一款4位微处理器,可以进行4位二进制并行运算。它有45条指令,速度为0.05 MIPS(每秒百万条指令)。Intel 4004功能有限,主要用于计算器、电动打字机、相机、台秤、电视机等家电。,以使这些电气设备智能化,从而提高它们的性能。英特尔8008是世界上第一个8位微处理器。存储器采用PMOS工艺。在这个阶段,计算机工作缓慢,微处理器的指令系统不完整,内存容量很小,只有几百字节,没有操作系统,只有汇编语言。主要用于工业仪表和过程控制。(1974—1977)典型的微处理器有Intel 8080/8085、Zilog公司的Z80和摩托罗拉公司的M6800。与第一代微处理器相比,集成度提高了1 ~ 4倍,运算速度提高了10 ~ 15倍,指令系统比较完善,具有典型的计算机体系结构、中断、直接内存访问等功能。

由于微处理器可以用来完成许多过去用大型设备才能完成的计算任务,而且价格便宜,半导体公司开始竞相生产微处理器芯片。Zilog公司生产了8080增强型Z80,摩托罗拉公司生产了6800,Intel公司生产了1976中的8085,但这些芯片基本没有改变8080的基本特性,都属于第二代微处理器。均采用NMOS技术,集成约9000个晶体管,平均指令执行时间为1μs ~ 2μs,采用汇编语言、BASIC和Fortran编程,使用单用户操作系统。第三级(1978—1984)是16位微处理器。1978年,Intel率先推出16位微处理器8086。同时,为了方便原有的8位电脑用户,Intel还提出了准16位微处理器8088。

8086微处理器的最大时钟速度为8MHz,数据通道为16位,内存寻址能力为1MB。同时,英特尔还生产了配套的数学协处理器i8087。这两种芯片使用相互兼容的指令集,但在i8087指令集中增加了一些专门用于对数、指数和三角函数等数学计算的指令。这些指令集统称为x86指令集。虽然英特尔生产了第二代、第三代等更先进、更快的新CPU,但仍然兼容原有的x86指令,英特尔在命名后续CPU时也沿用了原有的x86顺序,直到后来由于商标注册问题,放弃了用阿拉伯数字命名。

1979年,英特尔开发了8088。8086和8088都在芯片内部使用16位数据传输,所以都被称为16位微处理器,但8086每周期可以发送或接收16位数据,而8088每周期只用8位。因为原来的器件和芯片大多是8位的,所以8088的外部8位数据收发可以兼容这些器件。8088采用40针DIP封装,工作频率为6.66MHz、7.16MHz或8MHz。微处理器集成了大约29,000个晶体管。

在Intel推出8086和8088 CPU之后,各公司也相继推出了类似的产品,如Zilog Z8000和摩托罗拉M68000。16位微处理器比8位微处理器具有更大的寻址空间、更强的计算能力、更快的处理速度和更完善的指令系统。因此,16位微处理器已经能够替代部分小型机的功能,特别是在单任务单用户系统中,8086等16位微处理器得到了广泛的应用。

1981年,美国IBM公司在其IBM-PC中使用了8088芯片,从而开创了一个全新的微型计算机时代。也是从8088年开始,个人电脑(PC)的概念开始在全世界发展。自从8088被应用于IBM PC后,个人电脑真正进入了人们的工作和生活,这也标志着一个新时代的开始。

1982年,Intel公司在8086的基础上,开发了80286微处理器。该微处理器最高频率为20MHz,内外数据传输为16位,采用24位内存,内存寻址容量为16MB。80286可以有两种工作方式,一种叫实模式,一种叫保护模式。

在实模式下,微处理器可以访问的内存总量限制为1兆字节;在保护模式下,80286可以直接访问16兆内存。此外,80286工作在保护模式下,可以保护操作系统在遇到异常应用时不停止系统,不像实模式或8086等无保护的微处理器。

IBM公司在先进技术微型计算机,即at计算机中使用了80286微处理器,引起了很大轰动。80286在以下四个方面比其前辈有显著改进:支持更大的内存;能够模拟内存空间;可以同时运行多个任务;并且提高了处理速度。

最早的PC速度是4MHz,基于80286的第一台AT机速度是6MHz到8MHz。有的厂商还自己提高了速度,让80286达到了20MHz,也就是说性能有了很大的进步。

80286的封装是方形封装,叫PGA。PGA是一种源自PLCC的廉价封装,具有内部和外部实心引脚。在这种封装中,80286集成了大约130000个晶体管。

IBM PC/AT微机的总线保持了XT的三层总线结构,增加了高低字节总线驱动程序和高字节总线的转换逻辑。和XT机一样,CPU是焊在主板上的。第四级(1985—1992)是一个32位微处理器。1985 65438+10月17日,英特尔划时代产品80386DX正式发布。它包含了275000个晶体管,时钟频率是12.5MHz,然后逐渐提高到20MHz,25MHz,33MHz,最后还有少数40MHz的产品。

80386DX具有32位内外数据总线和32位地址总线,可寻址4GB内存,管理64TB虚拟存储空间。其运行模式除了实模式和保护模式外,还增加了一种“虚86”工作模式,可以通过同时模拟多个8086微处理器来提供多任务能力。

80386DX的指令比80286多。12.5MHz频率的80386每秒可执行600万条指令,比16MHz频率的80286快2.2倍。80386最经典的产品就是80386 DX-33 MHz,也就是我们通常所说的。

由于32位微处理器强大的计算能力,PC机的应用已经扩展到许多领域,如商务办公和计算、工程设计和计算、数据中心和个人娱乐等。80386使32位CPU成为PC行业的标准。

1989年,Intel推出准32位微处理器芯片80386SX。这是英特尔为了扩大市场份额而推出的一款廉价且受欢迎的CPU。其内部数据总线为32位,外部数据总线为16位。可以接受为80286开发的16位输入/输出接口芯片,降低整机成本。80386SX推出后,受到了市场的广泛欢迎,因为80386SX的性能比80286好很多,而价格只有80386的三分之一。

1989,我们都很熟悉的80486芯片是Intel推出的。这款历时四年研发、投资3亿美元的芯片的伟大之处在于,它实际上首次打破了654.38+0万个晶体管的边界,集成了654.38+0.2万个晶体管,并采用了654.38+0微米的制造工艺。80486的时钟频率从25MHz逐渐提高到33MHz、40MHz、50MHz。

80486在一个芯片上集成了80386、数学协处理器80387和8KB缓存。80486中集成的80487的数字运算速度是之前80387的两倍,内部缓存缩短了微处理器和慢速DRAM的等待时间。而且80x86系列首次采用RISC(精简指令集)技术,一个时钟周期可以执行一条指令。它还采用了突发总线模式,大大提高了与存储器的数据交换速度。由于这些改进,80486的性能比带有80387数学协处理器的80386 DX高4倍。第五阶段(1993-2005)是奔腾系列微处理器时代,通常称为第五代。典型的产品有英特尔奔腾系列芯片和与其兼容的AMD K6系列微处理器芯片。内部采用超标量指令流水线结构,有独立的指令和数据缓存。随着MMX(MultiMediaeXtended)微处理器的出现,微型计算机在网络化、多媒体化和智能化方面的发展达到了更高的水平。

早期奔腾75 MHz ~ 120MHz采用0.5微米制造工艺,后来120MHz以上的奔腾采用0.35微米制造工艺。经典奔腾性能相当一般,整数运算和浮点运算都不错。为了提高计算机在多媒体和3D图形方面的应用能力,许多新的指令集应运而生,其中最著名的三个是英特尔的MMX、SSE和AMD的3D NOW!。MMX(MultiMedia Extensions)是Intel在1996年发明的一种多媒体指令增强技术,包括57条多媒体指令,可以一次处理多个数据。在软件的配合下,MMX技术可以获得更好的性能。

奔腾MMX的正式名称是“采用MMX技术的奔腾”,发布于1996年底。英特尔从奔腾开始就锁定了自己CPU的倍频,但是MMX的CPU有特别强的超外频能力,还可以通过提高核心电压来超倍频,所以超频在当时是一个非常时尚的动作。超频这个词也是在那个时候流行起来的。

多功能奔腾是英特尔继奔腾之后的又一成功产品,生命力也相当顽强。多功能奔腾在原有奔腾的基础上做了很大的改进,增加了片内16KB数据缓存和16KB指令缓存、4路写缓存、分支预测单元和返回堆栈技术。特别是新加入的57条MMX多媒体指令,使得多功能奔腾即使在运行非MMX优化的程序时,也比同频率的奔腾CPU快得多。

1997推出的奔腾II处理器结合了英特尔MMX技术,可以高效处理电影、音效和绘图数据。首次采用内置高速缓存的单边接触(S.E.C)盒式封装。这种芯片允许计算机用户通过互联网捕捉、编辑和与朋友和亲戚分享数字照片,编辑和添加文本、音乐或制作家庭电影的过渡效果,使用视频电话并通过标准电话线和互联网传输电影。英特尔奔腾II处理器中的晶体管数量为750万。

奔腾III处理器增加了70条新指令,并增加了一个名为MMX的互联网流媒体SIMD扩展集,可以大大提高高级图像、3D、流媒体音乐、电影、语音识别等应用的性能。它可以大大增强使用互联网的体验,允许用户浏览逼真的在线博物馆和商店,并下载高质量的电影。英特尔首次推出0.25微米工艺,英特尔奔腾III晶体管数量约为950万。

同年,英特尔还发布了奔腾III至强处理器。作为PentiumII Xeon的继任者,它不仅在内核架构上采用了全新的设计,还继承了Pentium III处理器增加的70个指令集,能够更好地执行多媒体和流媒体应用。除了面向企业市场,奔腾III至强还加强了电子商务应用和高级商业计算的能力。在缓存速度和系统总线结构方面也有许多改进,这大大提高了性能,并为更好的多处理器合作而设计。

2000年,奔腾4处理器由4200万个晶体管组成,采用0.18微米电路。奔腾4最初发布时的速度高达1.5GHz,晶体管数量约为4200万。次年8月,奔腾4处理器达到了2 GHz的里程碑。2002年,英特尔推出了采用创新超线程(HT)技术的全新英特尔奔腾4处理器。超线程技术创造了高性能桌面计算机的新水平,它可以同时快速执行多个计算应用程序,或者为支持多线程的软件带来更高的性能。超线程技术将计算机性能提高了25%。除了为台式电脑用户提供超线程技术之外,英特尔还实现了另一个计算机里程碑,即它推出了工作频率为3.06 GHz的奔腾4处理器,这是第一个每秒执行30亿次运算周期的商用微处理器。如此优异的性能归功于当时业界最先进的0.13微米工艺技术。第二年,内置超线程技术的英特尔奔腾4处理器的频率达到了3.2 GHz。

PentiumM:以色列团队特别设计的新型移动CPU。Pentium M是Intel公司的x86架构微处理器,用于笔记本个人电脑。它也在2003年3月作为迅驰的一部分推出。公布了以下主频:标准1.6GHz,1.5GHz,1.4GHz,1.3GHz,低压1.1GHz,超低电压900MHz。为了在低频下获得高性能,Banias做了优化,使每个时钟可以执行的指令数量更多,并通过高级分支预测降低了误预测率。另外,最突出的改进是L2缓存增加到1MB(P3-M和P4-M只有512KB),估计这里面用到的大部分是Banias数高达7700万的晶体管。

此外,还有一系列与降低功耗相关的设计:增强型Speedstep技术必不可少,多种电源电压和计算频率,让性能更好地满足应用需求。

智能功率分配可以将系统功率分配到处理器需要的地方,关闭闲置的应用;移动电压定位(MVPIV)技术可以根据处理器活动动态降低电压,从而支持更低的散热设计功耗和更小的外形设计;具有优化功率的400MHz系统总线;微操作(Micro-opsfusion)微操作指令融合技术将可同时执行的多条指令合并为一条指令,以提高性能和功效。专用堆栈管理器,使用专用硬件记录内部操作,处理器可以不间断地执行程序。

Banias对应的芯片组是855系列,855芯片组由北桥芯片855和南桥芯片ICH4-M组成,北桥芯片分为无内置显卡的855PM(代码Odem)和内置显卡的855GM(代码Montara-GM),最高支持2GB的DDR266/200内存,AGP4X,USB2.0和两套ATA-65438+。其中855GM针对3D显示引擎优化了InternalClockGating,可以只在需要的时候给3D显示引擎供电,从而降低芯片组的功耗。

2005年,英特尔推出奔腾D和奔腾至尊版,同时推出945/955/965/975芯片组,支持全新双核处理器。这两款采用90nm工艺生产的新型双核处理器,使用了无引脚的LGA 775接口,但处理器底部的片电容数量增加,排列也有所不同。

桌面平台的处理器,代号为史密斯菲尔德,官方命名为奔腾D处理器。除了去掉阿拉伯数字,用英文字母代表双核处理器的世代交替,字母D也更能让人联想到双核的含义。

英特尔的双核架构更像是双CPU平台,奔腾D处理器继续使用Prescott架构和90nm生产工艺。实际上奔腾D内核是由两个独立的Prescott内核组成的,每个内核都有一个独立的L2缓存和1mb的执行单元,两个内核加起来是2MB。但由于处理器中的两个内核有独立的缓存,所以需要保证每个二级缓存中的信息完全一致,否则会出现操作错误。

为了解决这个问题,Intel把两个内核之间的协调交给了外部的MCH(北桥)芯片。虽然缓存之间的数据传输和存储并不庞大,但由于需要通过外部的MCH芯片来协调处理,无疑会给整个处理速度带来一定的延迟,从而影响处理器的整体性能。

由于普雷斯科特内核,奔腾D还支持EM64T技术和XD位安全技术。值得一提的是,奔腾D处理器将不支持超线程技术。原因很明显:在多个物理处理器和多个逻辑处理器之间正确分配数据流和平衡计算任务并不容易。比如一个应用需要两个计算线程,显然每个线程对应一个物理内核,但是如果有三个计算线程呢?因此,为了降低双核奔腾D架构的复杂性,英特尔决定在面向主流市场的奔腾D中取消对超线程技术的支持。

两者都来自英特尔,奔腾D和奔腾至尊版名称的不同说明这两种处理器的规格也是不同的。两者最大的区别是对超线程技术的支持。奔腾D不支持超线程技术,而奔腾至尊版没有这个限制。开启超线程技术后,双核奔腾至尊版处理器可以模拟另外两个逻辑处理器,可以被系统识别为四核系统。

奔腾EE系列以奔腾EE8xx或9xx的形式标有三位数,如奔腾EE840等。数字越大,规格越高或支持的功能越多。

奔腾EE8x0:表示这款产品是Smithfield core,每核1MB L2缓存,800MHzFSB。它和PentiumD8x0系列唯一的区别就是只增加了对超线程技术的支持,其他技术特性和参数都是一样的。

Pentium EE9x5:表示这款产品是一款Presler核心,每核2MB L2缓存,1066MHzFSB。它与PentiumD9x0系列的区别在于,它只增加了对超线程技术的支持,并将前端总线改进为1066MHzFSB,其他技术特性和参数完全相同。

奔腾4、奔腾4 EE、赛扬D等单核CPU和奔腾D、奔腾EE等双核CPU均采用LGA775封装。与之前的插座478接口CPU不同的是,LGA 775接口CPU的底部没有传统引脚,而是775触点,即不是引脚式而是接触式,通过与相应LGA 775插槽中的775接触引脚接触来传输信号。LGA 775接口不仅可以有效提高处理器的信号强度和频率,还可以提高处理器的良率,降低生产成本。第六阶段(2005年至今)是酷睿系列微处理器时代,通常称为第6代。“芯”是领先的节能新型微建筑。设计的出发点是提供出色的性能和能效,提高每瓦性能,也就是所谓的能效比。早期的酷睿是基于笔记本处理器的。Core 2:英文名为Core 2 Duo,是英特尔于2006年推出的基于Core微架构的新一代产品系统。发表于2006年7月27日。Core 2是跨平台架构,包括服务器版、桌面版和移动版。其中,服务器版的开发代码为Woodcrest,桌面版的开发代码为Conroe,移动版的开发代码为Merom。

酷睿2处理器的酷睿微架构是英特尔以色列设计团队在Yonah微架构的基础上改进的新一代英特尔架构。最显著的变化在于各个关键部位的强化。为了提高两核内部数据交换的效率,采用了* * *共享二级缓存设计,两核* * *享受高达4MB的二级缓存。

继LGA775接口之后,英特尔首次推出LGA1366平台,定位高端旗舰系列。首款采用LGA 1366接口的处理器代号为Bloomfield,采用了改进的Nehalem内核,基于45nm工艺和原生四核设计,内置8-12MB三级缓存。LGA1366平台再次引入英特尔超线程技术,QPI总线技术取代了从奔腾4时代就开始使用的前端总线设计。最重要的是LGA1366平台支持三通道内存设计,大大提升了实际性能,这也是LGA1366旗舰平台与其他平台在定位上的一大区别。

作为高端旗舰的代表,LGA1366接口的处理器主要有45nm Bloomfield Core i7四核处理器。随着2010英特尔采购32nm工艺,高端旗舰的代表换成了酷睿i7-980X处理器。全新的32nm工艺解决了六核技术,拥有最强大的性能。对于准备搭建高端平台的用户来说,LGA1366依然占据高端市场,酷睿i7-980X和酷睿i7-950依然是不错的选择。

英特尔酷睿i7是一款45纳米原生四核处理器,配有8MB三级高速缓存和三通道DDR3内存。处理器采用LGA 1366引脚设计,支持第二代超线程技术,即处理器可以运行八个线程。根据网上流传的测试,同频酷睿i7的性能远高于酷睿2四核。

基于之前的数据,英特尔将首先发布三款英特尔酷睿i7处理器,频率分别为3.2GHz、2.93GHz和2.66GHz。3.2GHz处理器属于英特尔酷睿i7至尊版,处理器价格为999美元。当然,这款顶级处理器是针对发烧用户的。较低频率2.66GHz售价284美元,约合1.940人民币,面向普通消费者。新一代酷睿i7处理器将于2013第四季度上市。

根据英特尔在英特尔技术峰会2008(IDF2008)上的演示,酷睿i7的能力大约是酷睿2至尊qx9770(3.2GHz)的三倍。在IDF上,英特尔工作人员使用酷睿i7 3.2GHz处理器演示了CineBench R10多线程渲染,结果令人惊叹。渲染开始后,四个核心的八个线程同时开始工作。仅仅过了19秒,完整的画面就呈现在屏幕上,评分超过45800。相比之下,core2 extreme qx 9770 3.2GHz只能拿到12000分左右,超频到4.0GHz勉强超过15000分,不到core i7的三分之一。酷睿i7的超强实力由此可见一斑。

Core i5是基于Nehalem架构的四核处理器,采用集成内存控制器和三级缓存模式,L3达到8MB,支持Turbo Boost等技术的新处理器电脑配置。它和Core i7(Bloomfield)的主要区别是总线没有使用QPI,而是使用成熟的DMI(直接媒体接口),并且只支持双通道DDR3内存。结构上采用LGA1156接口,酷睿i7采用LGA1366。I5有睿频技术,在一定条件下可以超频。

Core i3可以看作是Core i5的进一步简化版(或者阉割版),还会有32nm工艺版本(开发代号为Clarkdale,基于Westmere架构)。Core i3最大的特点就是集成了GPU(图形处理器),也就是说Core i3会被CPU和GPU两个核心封装起来。由于集成GPU的性能有限,如果用户想要获得更好的3D性能,可以添加显卡。值得注意的是,即使在克拉克代尔,显示器核心的制造工艺仍将是45纳米。i3 i5最大的区别就是i3没有turbo技术。

2010年6月,英特尔再次发布革命性的处理器——第二代酷睿i3/i5/i7。第二代酷睿i3/i5/i7属于第二代智能酷睿家族,均基于全新的Sandy Bridge微架构。相比第一代产品,主要带来五大重要创新:1,采用全新32nm Sandy Bridge微架构,功耗更低,性能更强。2、内置高性能GPU(核心显卡),视频编码,图形性能更强。3、睿频加速技术2.0,更智能更高效。4.引入新的环形架构,带来更高的带宽和更低的延迟。5.全新的AVX和AES指令集,加强了浮点运算和加密解密运算。

SNB(Sandy Bridge)是英特尔在2011年初发布的新一代处理器微架构。这种架构最大的意义在于重新定义了“集成平台”的概念,与处理器无缝集成的“核心显卡”终结了“集成显卡”的时代。这项开创性的工作得益于全新的32纳米制造工艺。由于Sandy Bridge框架下的处理器采用了比之前45nm工艺更先进的32nm制造工艺,理论上进一步降低了CPU的功耗,电路尺寸和性能显著优化,为集成图形核心(核心显卡)和CPU封装在同一基板上创造了有利条件。此外,第二代酷睿还加入了全新的高清视频处理单元。视频转换和解码的速度与处理器直接相关。由于增加了高清视频处理单元,新一代酷睿处理器的视频处理时间比旧款处理器至少长30%。新一代Sandy Bridge处理器采用全新LGA1155接口设计,不兼容LGA1156接口。Sandy Bridge是一种新的微架构,将取代Nehalem,但仍将采用32纳米工艺。更吸引人的是,这一次,英特尔不再是用“胶水”把CPU核心和GPU核心粘在一起,而是真正做到了合二为一。

2012北京天文馆4月24日下午,英特尔正式发布了常春藤桥(IVB)处理器。22nm Ivy Bridge将执行单元数量翻倍至最多24个,自然会带来性能的进一步飞跃。Ivy Bridge将增加一个支持DX11的集成显卡。此外,新加入的XHCI USB3.0控制器* * *享有四个通道,因此最多提供四个USB3.0,从而支持原生USB 3.0。采用3D晶体管技术的cpu功耗会降低一半。