中央处理器(CPU)製造商

中央处理器（Central Process Unit，CPU），是计算机的核心配件之一，其功能主要是解释计算机指令以及处理计算机软体中的数据，所谓的计算机的可程式性主要是指对CPU的编程，CPU是计算机中的核心配件，只有火柴盒那幺大，几十张纸那幺厚，但它却是一台计算机的运算核心和控制核心，计算机中所有操作都由CPU负责读取指令，对指令翻译编码并执行指令的核心部件，CPU、内部存储器和输入/输出设备是电子计算机的三大核心部件，现在着名的中央处理器(CPU)製造商主要为Intel和AMD。

基本介绍

中文名：中央处理器
外文名：Central Process Unit，CPU
简称：CPU
主要功能：解释计算机指令及处理软体的数据

着名厂商

1·Intel公司

Intel是生产CPU的老大哥，它占有大约80%的市场份额，Intel生产的CPU就成了事实上的x86CPU技术规範和标準。最新的酷睿2成为CPU的首选。

2·AMD公司

除了Intel公司外，最有力的挑战的就是AMD公司。AMD公司专门为计算机、通信和消费电子行业设计和製造各种创新的微处理器（CPU、GPU、APU、主机板晶片组、电视卡晶片等)、快闪记忆体和低功率处理器解决方案，AMD 致力为技术用户——从企业、政府机构到个人消费者——提供基于标準的、以客户为中心的解决方案，AMD是目前业内唯一一个可以提供高性能CPU、高性能独立显示卡GPU、主机板晶片组三大组件的半导体公司，为了明确其优势，AMD提出3A平台的新标誌，在笔记本领域有“AMD VISION”标誌的就表示该电脑採用3A构建方案，AMD 有超过70% 的收入都来自于国际市场，是一家真正意义上的跨国公司。

3·Cyrix

曾经风靡一时的世界第三大CPU生产厂家，现在被VIA与AMD分别收购生产线与技术。

·全美达·NexGen·IDT公司

曾经的辉煌，因AMD与Intel大厂之间的竞争而渐渐退出市场。

4·IBM公司

国际商业机器公司IBM，拥有了自己的晶片生产线，主要生产伺服器用POWER处理器。

国产品牌：

5·国产龙芯

GodSon 小名狗剩，是国有自主智慧财产权的通用处理器，目前已经有2代产品。

最新的龙芯2F已经赶上intel中端P4的水平。

6·VIA中国威盛

VIA威盛是台湾一家主机板晶片组厂商，收购了前述的 Cyrix和IDT的cpu部门，推出了自己的CPU，性能可以与Intel的经济型CPU相比，功耗只有1W，在Intel与AMD的双重压迫下艰难生存。

工作原理

基本结构

CPU包括运算逻辑部件、暂存器部件和控制部件。CPU从存储器或高速缓冲存储器中取出指令，放入指令暂存器，并对指令翻译编码。它把指令分解成一系列的微操作，然后发出各种控制命令，执行微操作系列，从而完成一条指令的执行。

指令是计算机规定执行操作的类型和运算元的基本命令。指令是由一个位元组或者多个位元组组成，其中包括操作码栏位、一个或多个有关运算元地址的栏位以及一些表征机器状态的状态字和特徵码。有的指令中也直接包含运算元本身。

运算逻辑部件：运算逻辑部件，可以执行定点或浮点的算术运算操作、移位操作以及逻辑操作，也可执行地址的运算和转换。

暂存器部件：暂存器部件，包括通用暂存器、专用暂存器和控制暂存器。

32位CPU的暂存器：通用暂存器又可分定点数和浮点数两类，它们用来保存指令中的暂存器运算元和操作结果。

通用暂存器是中央处理器的重要组成部分，大多数指令都要访问到通用暂存器。通用暂存器的宽度决定计算机内部的数据通路宽度，其连线埠数目往往可影响内部操作的并行性。

专用暂存器是为了执行一些特殊操作所需用的暂存器。

控制暂存器通常用来指示机器执行的状态，或者保持某些指针，有处理状态暂存器、地址转换目录的基地址暂存器、特权状态暂存器、条件码暂存器、处理异常事故暂存器以及检错暂存器等。

有的时候，中央处理器中还有一些快取，用来暂时存放一些数据指令，快取越大，说明CPU的运算速度越快，目前市场上的中高端中央处理器都有2M左右的二级快取。

控制部件：主要负责对指令解码，并且发出为完成每条指令所要执行的各个操作的控制信号。

其结构有两种：一种是以微存储为核心的微程式控制方式；一种是以逻辑硬布线结构为主的控制方式。

微存储中保持微码，每一个微码对应于一个最基本的微操作，又称微指令；各条指令是由不同序列的微码组成，这种微码序列构成微程式。中央处理器在对指令解码以后，即发出一定时序的控制信号，按给定序列的顺序以微周期为节拍执行由这些微码确定的若干个微操作，即可完成某条指令的执行。

简单指令是由（3～5）个微操作组成，複杂指令则要由几十个微操作甚至几百个微操作组成。

逻辑硬布线控制器则完全是由随机逻辑组成。指令解码后，控制器通过不同的逻辑门的组合，发出不同序列的控制时序信号，直接去执行一条指令中的各个操作。

其他：套用大型、小型和微型计算机的中央处理器的规模和实现方式很不相同，工作速度也变化较大。中央处理器可以由几块电路块甚至由整个机架组成。如果中央处理器的电路集成在一片或少数几片大规模积体电路晶片上，则称为微处理器（见微型机）。

基本原理

CPU的主要运作原理，不论其外观，都是执行储存于被称为程式里的一系列指令。在此讨论的是遵循普遍的架构设计的装置。程式以一系列数字储存在电脑记忆体中。差不多所有的CPU的运作原理可分为四个阶段：提取（Fetch）、解码（Decode）、执行（Execute）和写回（Writeback）。

第一阶段，提取，从程式记忆体中检索指令（为数值或一系列数值）。由程式计数器（Program Counter）指定程式记忆体的位置，程式计数器保存供识别目前程式位置的数值。换言之，程式计数器记录了CPU在目前程式里的蹤迹。

提取指令之后，程式计数器根据指令式长度增加记忆体单元。指令的提取常常必须从相对较慢的记忆体寻找，导致CPU等候指令的送入。这个问题主要被论及在现代处理器的快取和管线化架构（见下）。

CPU根据从记忆体提取到的指令来决定其执行行为。在解码阶段，指令被拆解为有意义的片断。根据CPU的指令集架构（ISA）定义将数值解译为指令。

一部分的指令数值为运算码（Opcode），其指示要进行哪些运算。其它的数值通常供给指令必要的资讯。诸如一个加法（Addition）运算的运算目标。这样的运算目标也许提供一个常数值（即立即值），或是一个空间的定址值：暂存器或记忆体位址，以定址模式决定。

在旧的设计中，CPU里的指令解码部分是无法改变的硬体装置。不过在众多抽象且複杂的CPU和指令集架构中，一个微程式时常用来帮助转换指令为各种形态的讯号。这些微程式在已成品的CPU中往往可以重写，方便变更解码指令。

在提取和解码阶段之后，接着进入执行阶段。该阶段中，连线到各种能够进行所需运算的CPU部件。

例如，要求一个加法运算，算数逻辑单元（ALU，Arithmetic Logic Unit）将会连线到一组输入和一组输出。输入提供了要相加的数值，而且在输出将含有总和结果。ALU内含电路系统，以于输出端完成简单的普通运算和逻辑运算（比如加法和位元运算）。如果加法运算产生一个对该CPU处理而言过大的结果，在标誌暂存器里，运算溢出（Arithmetic Overflow）标誌可能会被设定（参见以下的数值精度探讨）。

最终阶段，写回，以一定格式将执行阶段的结果简单的写回。运算结果极常被写进CPU内部的暂存器，以供随后指令快速存取。在其它案例中，运算结果可能写进速度较慢，但容量较大且较便宜的主记忆体。某些类型的指令会操作程式计数器，而不直接产生结果资料。这些一般称作“跳转”（Jumps）并在程式中带来循环行为、条件性执行（透过条件跳转）和函式。

许多指令也会改变标誌暂存器的状态位元。这些标誌可用来影响程式行为，缘由于它们时常显出各种运算结果。

例如，以一个“比较”指令判断两个值的大小，根据比较结果在标誌暂存器上设定一个数值。这个标誌可藉由随后的跳转指令来决定程式动向。

在执行指令并写回结果资料之后，程式计数器的值会递增，反覆整个过程，下一个指令周期正常的提取下一个顺序指令。如果完成的是跳转指令，程式计数器将会修改成跳转到的指令位址，且程式继续正常执行。许多複杂的CPU可以一次提取多个指令、解码，并且同时执行。这个部分一般涉及“经典RISC管线”，那些实际上是在众多使用简单CPU的电子装置中快速普及（常称为微控制（Microcontrollers））。

发展过程

诞生

CPU这个名称，早期是对一系列可以执行複杂的电脑程式或电脑程式的逻辑机器的描述。这个空泛的定义很容易在“CPU”这个名称被普遍使用之前将计算机本身也包括在内。

但从20世纪70年代开始，由于积体电路的大规模使用，把本来需要由数个独立单元构成的CPU集成为一块微小但功能空前强大的微处理器时。这个名称及其缩写才真正在电子计算机产业中得到广泛套用。儘管与早期相比，CPU在物理形态、设计製造和具体任务的执行上都有了戏剧性的发展，但是其基本的操作原理一直没有改变。

1971年，当时还处在发展阶段的Intel公司推出了世界上第一台真正的微处理器－－4004。这不但是第一个用于计算器的4位微处理器，也是第一款个人有能力买得起的电脑处理器！

4004含有2300个电晶体，功能相当有限，而且速度还很慢，被当时的蓝色巨人IBM以及大部分商业用户不屑一顾，但是它毕竟是划时代的产品，从此以后，Intel公司便与微处理器结下了不解之缘。可以这幺说，CPU的历史发展历程其实也就是Intel公司X86系列CPU的发展历程，就通过它来展开的“CPU历史之旅”。

起步的角逐

1978年，Intel公司再次领导潮流，首次生产出16位的微处理器，并命名为i8086，同时还生产出与之相配合的数学协处理器i8087，这两种晶片使用相互兼容的指令集，但在i8087指令集中增加了一些专门用于对数、指数和三角函式等数学计算的指令。由于这些指令集套用于i8086和i8087，所以人们也把这些指令集中统一称之为X86指令集。

虽然以后Intel公司又陆续生产出第二代、第三代等更先进和更快的新型CPU，但都仍然兼容原来的X86指令，而且Intel公司在后续CPU的命名上沿用了原先的X86序列，直到后来因商标注册问题，才放弃了继续用阿拉伯数字命名。至于在后来发展壮大的其他公司，例如AMD和Cyrix等，在486以前（包括486）的CPU都是按Intel的命名方式为自己的X86系列CPU命名，但到了586时代，市场竞争越来越厉害了，由于商标注册问题，它们已经无法继续使用与Intel的X86系列相同或相似的命名，只好另外为自己的586、686兼容CPU命名了。

1979年，Intel公司推出了8088晶片，它仍旧是属于16位微处理器，内含29000个电晶体，时钟频率为4.77MHz，地址汇流排为20位，可使用1MB记忆体。8088内部数据汇流排都是16位，外部数据汇流排是8位，而它的兄弟8086是16位。

微机时代的来临

1981年，8088晶片首次用于IBM的PC（个人电脑Personal Computer）机中，开创了全新的微机时代。也正是从8088开始，PC的概念开始在全世界範围内发展起来。

早期的CPU通常是为大型及特定套用的计算机而订製。但是，这种昂贵为特定套用定製CPU的方法很大程度上已经让位于开发便宜、标準化、适用于一个或多个目的的处理器类。

这个标準化趋势始于由单个电晶体组成的大型机和微机年代，随着积体电路的出现而加速。积体电路使得更为複杂的CPU可以在很小的空间中设计和製造出来（在微米的量级）。

1982年，许多年轻的读者尚在襁褓之中的时候，Intel公司已经推出了划时代的最新产品枣80286晶片，该晶片比8086和8088都有了飞跃的发展，虽然它仍旧是16位结构，但是在CPU的内部含有13.4万个电晶体，时钟频率由最初的6MHz逐步提高到20MHz。其内部和外部数据汇流排皆为16位，地址汇流排24位，可定址16MB记忆体。从80286开始，CPU的工作方式也演变出两种来：实模式和保护模式。

1985年，Intel公司推出了80386晶片，它是80X86系列中的第一种32位微处理器，而且製造工艺也有了很大的进步，与80286相比，80386内部内含27.5万个电晶体，时钟频率为12.5MHz，后提高到20MHz、25MHz、33MHz。80386的内部和外部数据汇流排都是32位，地址汇流排也是32位，可定址高达4GB记忆体。它除具有实模式和保护模式外，还增加了一种叫虚拟86的工作方式，可以通过同时模拟多个8086处理器来提供多任务能力。

除了标準的80386晶片，也就是经常说的80386DX外，出于不同的市场和套用考虑，Intel又陆续推出了一些其它类型的80386晶片：80386SX、80386SL、80386DL等。

1988年，Intel推出的80386SX是市场定位在80286和80386DX之间的一种晶片，其与80386DX的不同在于外部数据汇流排和地址汇流排皆与80286相同，分别是16位和24位（即定址能力为16MB）。

高速CPU时代的腾飞

1990年，Intel公司推出的80386 SL和80386 DL都是低功耗、节能型晶片，主要用于便携机和节能型台式机。80386 SL与80386 DL的不同在于前者是基于80386SX的，后者是基于80386DX的，但两者皆增加了一种新的工作方式：系统管理方式。当进入系统管理方式后，CPU 就自动降低运行速度、控制显示屏和硬碟等其它部件暂停工作，甚至停止运行，进入“休眠”状态，以达到节能目的。

1989年，大家耳熟能详的80486 晶片由Intel公司推出，这种晶片的伟大之处就在于它实破了100万个电晶体的界限，集成了120万个电晶体。80486的时钟频率从25MHz逐步提高到了33MHz、50MHz。80486是将80386和数学协处理器80387以及一个8KB的高速快取集成在一个晶片内，并且在80X86系列中首次採用了RISC（精简指令集）技术，可以在一个时钟周期内执行一条指令。它还採用了突发汇流排方式，大大提高了与记忆体的数据交换速度。

由于这些改进，80486 的性能比带有80387数学协处理器的80386DX提高了4倍。80486和80386一样，也陆续出现了几种类型。上面介绍的最初类型是80486DX。

1990年，Intel公司推出了80486 SX，它是486类型中的一种低价格机型，其与80486DX的区别在于它没有数学协处理器。80486 DX2由于用了时钟倍频技术，也就是说晶片内部的运行速度是外部汇流排运行速度的两倍，即晶片内部以2倍于系统时钟的速度运行，但仍以原有时钟速度与外界通讯。80486 DX2的内部时钟频率主要有40MHz、50MHz、66MHz等。80486 DX4也是採用了时钟倍频技术的晶片，它允许其内部单元以2倍或3倍于外部汇流排的速度运行。为了支持这种提高了的内部工作频率，它的片内高速快取扩大到 16KB。80486 DX4的时钟频率为100MHz，其运行速度比66MHz的80486 DX2快40%。80486也有SL增强类型，其具有系统管理方式，用于便携机或节能型台式机。

CPU的标準化和小型化都使得这一类数字设备（香港译为“电子零件”）在现代生活中的出现频率远远超过有限套用专用的计算机。现代微处理器出现在包括从汽车到手机到儿童玩具在内的各种物品中。

奔腾时代

Pentium（奔腾）微处理器于1993年三月推出，它集成了310万个电晶体。它使用多项技术来提高cpu性能，主要包括採用超标量结构，内置套用超级流水线技术的浮点运算器，增大片上的cache容量，採用内部奇偶效验一边检验内部处理错误等。

性能指标

主频

主频也叫时钟频率，单位是兆赫（MHz）或千兆赫（GHz），用来表示CPU的运算、处理数据的速度。

CPU的主频=外频×倍频係数。很多人认为主频就决定着CPU的运行速度，这不仅是片面的，而且对于伺服器来讲，这个认识也出现了偏差。至今，没有一条确定的公式能够实现主频和实际的运算速度两者之间的数值关係，即使是两大处理器厂家Intel（英特尔）和AMD，在这点上也存在着很大的争议，从Intel的产品的发展趋势，可以看出Intel很注重加强自身主频的发展。像其他的处理器厂家，有人曾经拿过一块1GHz的全美达处理器来做比较，它的运行效率相当于2GHz的Intel处理器。

主频和实际的运算速度存在一定的关係，但并不是一个简单的线性关係.　所以，CPU的主频与CPU实际的运算能力是没有直接关係的，主频表示在CPU内数字脉冲信号震荡的速度。在Intel的处理器产品中，也可以看到这样的例子：1 GHz Itanium晶片能够表现得差不多跟2.66 GHz至强（Xeon）/Opteron一样快，或是1.5 GHz Itanium 2大约跟4 GHz Xeon/Opteron一样快。CPU的运算速度还要看CPU的流水线、汇流排等等各方面的性能指标。

主频和实际的运算速度是有关的，只能说主频仅仅是CPU性能表现的一个方面，而不代表CPU的整体性能。

外频

外频是CPU的基準频率，单位是MHz。CPU的外频决定着整块主机板的运行速度。通俗地说，在台式机中，所说的超频，都是超CPU的外频（当然一般情况下，CPU的倍频都是被锁住的）相信这点是很好理解的。但对于伺服器CPU来讲，超频是绝对不允许的。前面说到CPU决定着主机板的运行速度，两者是同步运行的，如果把伺服器CPU超频了，改变了外频，会产生异步运行，（台式机很多主机板都支持异步运行）这样会造成整个伺服器系统的不稳定。

目前的绝大部分电脑系统中外频与主机板前端汇流排不是同步速度的，而外频与前端汇流排(FSB)频率又很容易被混为一谈，下面的前端汇流排介绍谈谈两者的区别。

前端汇流排(FSB)频率

前端汇流排(FSB)频率(即汇流排频率)是直接影响CPU与记忆体直接数据交换速度。有一条公式可以计算，即数据频宽=(汇流排频率×数据位宽)/8，数据传输最大频宽取决于所有同时传输的数据的宽度和传输频率。比方，现在的支持64位的至强Nocona，前端汇流排是800MHz，按照公式，它的数据传输最大频宽是6.4GB/秒。

外频与前端汇流排(FSB)频率的区别：前端汇流排的速度指的是数据传输的速度，外频是CPU与主机板之间同步运行的速度。也就是说，100MHz外频特指数字脉冲信号在每秒钟震荡一亿次；而100MHz前端汇流排指的是每秒钟CPU可接受的数据传输量是100MHz×64bit÷8bit/Byte=800MB/s。

其实现在“HyperTransport”构架的出现，让这种实际意义上的前端汇流排(FSB)频率发生了变化。IA-32架构必须有三大重要的构件：记忆体控制器Hub (MCH) ,I/O控制器Hub和PCI Hub，像Intel很典型的晶片组 Intel 7501、Intel7505晶片组，为双至强处理器量身定做的，它们所包含的MCH为CPU提供了频率为533MHz的前端汇流排，配合DDR记忆体，前端汇流排频宽可达到4.3GB/秒。但随着处理器性能不断提高同时给系统架构带来了很多问题。而“HyperTransport”构架不但解决了问题，而且更有效地提高了汇流排频宽，比方AMD Opteron处理器，灵活的HyperTransport I/O汇流排体系结构让它整合了记忆体控制器，使处理器不通过系统汇流排传给晶片组而直接和记忆体交换数据。这样的话，前端汇流排(FSB)频率在AMD Opteron处理器就不知道从何谈起了。

CPU的位和字长

位：在数字电路和电脑技术中採用二进制，代码只有“0”和“1”，其中无论是 “0”或是“1”在CPU中都是一“位”。

字长：电脑技术中对CPU在单位时间内(同一时间)能一次处理的二进制数的位数叫字长。所以能处理字长为8位数据的CPU通常就叫8位的CPU。同理32位的CPU就能在单位时间内处理字长为32位的二进制数据。位元组和字长的区别：由于常用的英文字元用8位二进制就可以表示，所以通常就将8位称为一个位元组。字长的长度是不固定的，对于不同的CPU、字长的长度也不一样。8位的CPU一次只能处理一个位元组，而32位的CPU一次就能处理4个位元组，同理字长为64位的CPU一次可以处理8个位元组。

倍频係数

倍频係数是指CPU主频与外频之间的相对比例关係。在相同的外频下，倍频越高CPU的频率也越高。但实际上，在相同外频的前提下，高倍频的CPU本身意义并不大。这是因为CPU与系统之间数据传输速度是有限的，一味追求高主频而得到高倍频的CPU就会出现明显的“瓶颈”效应－CPU从系统中得到数据的极限速度不能够满足CPU运算的速度。一般除了工程样版的Intel的CPU都是锁了倍频的，少量的如Inter 酷睿2 核心的奔腾双核E6500K和一些至尊版的CPU不锁倍频，而AMD之前都没有锁，现在AMD推出了黑盒版CPU（即不锁倍频版本，用户可以自由调节倍频，调节倍频的超频方式比调节外频稳定得多）。

快取

快取大小也是CPU的重要指标之一，而且快取的结构和大小对CPU速度的影响非常大，CPU内快取的运行频率极高，一般是和处理器同频运作，工作效率远远大于系统记忆体和硬碟。实际工作时，CPU往往需要重複读取同样的数据块，而快取容量的增大，可以大幅度提升CPU内部读取数据的命中率，而不用再到记忆体或者硬碟上寻找，以此提高系统性能。但是由于CPU晶片面积和成本的因素来考虑，快取都很小。

L1　Cache(一级快取)是CPU第一层高速快取，分为数据快取和指令快取。内置的L1高速快取的容量和结构对CPU的性能影响较大，不过高速缓冲存储器均由静态RAM组成，结构较複杂，在CPU管芯面积不能太大的情况下，L1级高速快取的容量不可能做得太大。一般伺服器CPU的L1快取的容量通常在32－256KB。

L2　Cache(二级快取)是CPU的第二层高速快取，分内部和外部两种晶片。内部的晶片二级快取运行速度与主频相同，而外部的二级快取则只有主频的一半。L2高速快取容量也会影响CPU的性能，原则是越大越好，以前家庭用CPU容量最大的是512KB，现在笔记本电脑中也可以达到2M，而伺服器和工作站上用CPU的L2高速快取更高，可以达到8M以上。

L3　Cache(三级快取)，分为两种，早期的是外置，现在的都是内置的。而它的实际作用即是，L3快取的套用可以进一步降低记忆体延迟，同时提升大数据量计算时处理器的性能。降低记忆体延迟和提升大数据量计算能力对游戏都很有帮助。而在伺服器领域增加L3快取在性能方面仍然有显着的提升。比方具有较大L3快取的配置利用物理记忆体会更有效，故它比较慢的磁碟I/O子系统可以处理更多的数据请求。具有较大L3快取的处理器提供更有效的档案系统快取行为及较短讯息和处理器伫列长度。

其实最早的L3快取被套用在AMD发布的K6-III处理器上，当时的L3快取受限于製造工艺，并没有被集成进晶片内部，而是集成在主机板上。在只能够和系统汇流排频率同步的L3快取同主记忆体其实差不了多少。后来使用L3快取的是英特尔为伺服器市场所推出的Itanium处理器。接着就是P4EE和至强MP。Intel还打算推出一款9MB L3快取的Itanium2处理器，和以后24MB L3快取的双核心Itanium2处理器。

但基本上L3快取对处理器的性能提高显得不是很重要，比方配备1MB L3快取的Xeon MP处理器却仍然不是Opteron的对手，由此可见前端汇流排的增加，要比快取增加带来更有效的性能提升。

CPU扩展指令集

CPU依靠指令来自计算和控制系统，每款CPU在设计时就规定了一系列与其硬体电路相配合的指令系统。指令的强弱也是CPU的重要指标，指令集是提高微处理器效率的最有效工具之一。从现阶段的主流体系结构讲，指令集可分为複杂指令集和精简指令集两部分（指令集共有四个种类），而从具体运用看，如Intel的MMX（Multi Media Extended，此为AMD猜测的全称，Intel并没有说明词源）、SSE、 SSE2（Streaming-Single instruction multiple data-Extensions 2）、SSE3、SSE4系列和AMD的3DNow!等都是CPU的扩展指令集，分别增强了CPU的多媒体、图形图象和Internet等的处理能力。通常会把CPU的扩展指令集称为”CPU的指令集”。SSE3指令集也是目前规模最小的指令集，此前MMX包含有57条命令，SSE包含有50条命令，SSE2包含有144条命令，SSE3包含有13条命令。目前SSE4也是最先进的指令集，英特尔酷睿系列处理器已经支持SSE4指令集，AMD会在未来双核心处理器当中加入对SSE4指令集的支持，全美达的处理器也将支持这一指令集。

CPU核心和I/O工作电压

从586CPU开始，CPU的工作电压分为核心电压和I/O电压两种，通常CPU的核心电压小于等于I/O电压。其中核心电压的大小是根据CPU的生产工艺而定，一般製作工艺越小，核心工作电压越低；I/O电压一般都在1.6~5V。低电压能解决耗电过大和发热过高的问题。

製造工艺

製造工艺的微米是指IC内电路与电路之间的距离。製造工艺的趋势是向密集度愈高的方向发展。密度愈高的IC电路设计，意味着在同样大小面积的IC中，可以拥有密度更高、功能更複杂的电路设计。现在主要的180nm、130nm、90nm、65nm、45纳米。最近inter已经有32纳米的製造工艺的酷睿i3/i5系列了。

而AMD则表示、自己的产品将会直接跳过32nm工艺（2010年第三季度生产少许32nm产品、如Orochi、Llano）于2011年中期初发布28nm的产品（名称未定）

指令集

（1）CISC指令集

CISC指令集，也称为複杂指令集，英文名是CISC，（Complex Instruction Set Computer的缩写）。在CISC微处理器中，程式的各条指令是按顺序串列执行的，每条指令中的各个操作也是按顺序串列执行的。顺序执行的优点是控制简单，但计算机各部分的利用率不高，执行速度慢。其实它是英特尔生产的x86系列（也就是IA-32架构）CPU及其兼容CPU，如AMD、VIA的。即使是现在新起的X86-64（也被成AMD64）都是属于CISC的範畴。

要知道什幺是指令集还要从当今的X86架构的CPU说起。X86指令集是Intel为其第一块16位CPU(i8086)专门开发的，IBM1981年推出的世界第一台PC机中的CPU－i8088(i8086简化版)使用的也是X86指令，同时电脑中为提高浮点数据处理能力而增加了X87晶片，以后就将X86指令集和X87指令集统称为X86指令集。

虽然随着CPU技术的不断发展，Intel陆续研製出更新型的i80386、i80486直到过去的PII至强、PIII至强、Pentium 3，Pentium 4系列，最后到今天的酷睿2系列、至强（不包括至强Nocona），但为了保证电脑能继续运行以往开发的各类应用程式以保护和继承丰富的软体资源，所以Intel公司所生产的所有CPU仍然继续使用X86指令集，所以它的CPU仍属于X86系列。由于Intel X86系列及其兼容CPU（如AMD Athlon MP、）都使用X86指令集，所以就形成了今天庞大的X86系列及兼容CPU阵容。x86CPU目前主要有intel的伺服器CPU和AMD的伺服器CPU两类。

（2）RISC指令集

RISC是英文“Reduced Instruction Set Computing ” 的缩写，中文意思是“精简指令集”。它是在CISC指令系统基础上发展起来的，有人对CISC机进行测试表明，各种指令的使用频度相当悬殊，最常使用的是一些比较简单的指令，它们仅占指令总数的20%，但在程式中出现的频度却占80%。複杂的指令系统必然增加微处理器的複杂性，使处理器的研製时间长，成本高。并且複杂指令需要複杂的操作，必然会降低计算机的速度。基于上述原因，20世纪80年代RISC型CPU诞生了，相对于CISC型CPU ,RISC型CPU不仅精简了指令系统，还採用了一种叫做“超标量和超流水线结构”，大大增加了并行处理能力。RISC指令集是高性能CPU的发展方向。它与传统的CISC(複杂指令集)相对。相比而言，RISC的指令格式统一，种类比较少，定址方式也比複杂指令集少。当然处理速度就提高很多了。目前在中高档伺服器中普遍採用这一指令系统的CPU，特别是高档伺服器全都採用RISC指令系统的CPU。RISC指令系统更加适合高档伺服器的作业系统UNIX，现在Linux也属于类似UNIX的作业系统。RISC型CPU与Intel和AMD的CPU在软体和硬体上都不兼容。

目前，在中高档伺服器中採用RISC指令的CPU主要有以下几类：PowerPC处理器、SPARC处理器、PA-RISC处理器、MIPS处理器、Alpha处理器。

（3）IA-64

EPIC（Explicitly Parallel Instruction Computers，精确并行指令计算机）是否是RISC和CISC体系的继承者的争论已经有很多，单以EPIC体系来说，它更像Intel的处理器迈向RISC体系的重要步骤。从理论上说，EPIC体系设计的CPU，在相同的主机配置下，处理Windows的套用软体比基于Unix下的套用软体要好得多。

Intel採用EPIC技术的伺服器CPU是安腾Itanium（开发代号即Merced）。它是64位处理器，也是IA－64系列中的第一款。微软也已开发了代号为Win64的作业系统，在软体上加以支持。在Intel採用了X86指令集之后，它又转而寻求更先进的64-bit微处理器，Intel这样做的原因是，它们想摆脱容量巨大的x86架构,从而引入精力充沛而又功能强大的指令集，于是採用EPIC指令集的IA-64架构便诞生了。IA-64 在很多方面来说，都比x86有了长足的进步。突破了传统IA32架构的许多限制，在数据的处理能力，系统的稳定性、安全性、可用性、可观理性等方面获得了突破性的提高。

IA-64微处理器最大的缺陷是它们缺乏与x86的兼容，而Intel为了IA-64处理器能够更好地运行两个朝代的软体，它在IA-64处理器上（Itanium、Itanium2 ……)引入了x86-to-IA-64的解码器，这样就能够把x86指令翻译为IA-64指令。这个解码器并不是最有效率的解码器，也不是运行x86代码的最好途径（最好的途径是直接在x86处理器上运行x86代码），因此Itanium 和Itanium2在运行x86应用程式时候的性能非常糟糕。这也成为X86-64产生的根本原因。

（4）X86-64 （AMD64 / EM64T）

AMD公司设计，可以在同一时间内处理64位的整数运算，併兼容于X86-32架构。其中支持64位逻辑定址，同时提供转换为32位定址选项；但数据操作指令默认为32位和8位，提供转换成64位和16位的选项；支持常规用途暂存器，如果是32位运算操作，就要将结果扩展成完整的64位。这样，指令中有“直接执行”和“转换执行”的区别，其指令栏位是8位或32位，可以避免栏位过长。

x86-64（也叫AMD64）的产生也并非空穴来风，x86处理器的32bit定址空间限制在4GB记忆体，而IA-64的处理器又不能兼容x86。AMD充分考虑顾客的需求，加强x86指令集的功能，使这套指令集可同时支持64位的运算模式，因此AMD把它们的结构称之为x86-64。在技术上AMD在x86-64架构中为了进行64位运算，AMD为其引入了新增了R8-R15通用暂存器作为原有X86处理器暂存器的扩充，但在而在32位环境下并不完全使用到这些暂存器。原来的暂存器诸如EAX、EBX也由32位扩张至64位。在SSE单元中新加入了8个新暂存器以提供对SSE2的支持。暂存器数量的增加将带来性能的提升。与此同时，为了同时支持32和64位代码及暂存器，x86-64架构允许处理器工作在以下两种模式：Long Mode(长模式)和Legacy Mode(遗传模式)，Long模式又分为两种子模式(64bit模式和Compatibility mode兼容模式)。该标準已经被引进在AMD伺服器处理器中的Opteron处理器.

而今年也推出了支持64位的EM64T技术，再还没被正式命为EM64T之前是IA32E，这是英特尔64位扩展技术的名字,用来区别X86指令集。Intel的EM64T支持64位sub-mode，和AMD的X86-64技术类似，採用64位的线性平面定址，加入8个新的通用暂存器（GPRs），还增加8个暂存器支持SSE指令。与AMD相类似，Intel的64位技术将兼容IA32和IA32E，只有在运行64位作业系统下的时候，才将会採用IA32E。IA32E将由2个sub-mode组成：64位sub-mode和32位sub-mode，同AMD64一样是向下兼容的。Intel的EM64T将完全兼容AMD的X86-64技术。现在Nocona处理器已经加入了一些64位技术，Intel的Pentium 4E处理器也支持64位技术。

应该说，这两者都是兼容x86指令集的64位微处理器架构，但EM64T与AMD64还是有一些不一样的地方，AMD64处理器中的NX位在Intel的处理器中将没有提供。

超流水线与超标量

在解释超流水线与超标量前，先了解流水线(Pipeline)。流水线是Intel首次在486晶片中开始使用的。流水线的工作方式就象工业生产上的装配流水线。在CPU中由5－6个不同功能的电路单元组成一条指令处理流水线，然后将一条X86指令分成5－6步后再由这些电路单元分别执行，这样就能实现在一个CPU时钟周期完成一条指令，因此提高CPU的运算速度。经典奔腾每条整数流水线都分为四级流水，即指令预取、解码、执行、写回结果，浮点流水又分为八级流水。

超标量是通过内置多条流水线来同时执行多个处理器，其实质是以空间换取时间。而超流水线是通过细化流水、提高主频，使得在一个机器周期内完成一个甚至多个操作，其实质是以时间换取空间。例如Pentium 4的流水线就长达20级。将流水线设计的步(级)越长，其完成一条指令的速度越快，因此才能适应工作主频更高的CPU。但是流水线过长也带来了一定副作用，很可能会出现主频较高的CPU实际运算速度较低的现象，Intel的奔腾4就出现了这种情况，虽然它的主频可以高达1.4G以上，但其运算性能却远远比不上AMD 1.2G的速龙甚至奔腾III。

封装形式

CPU封装是採用特定的材料将CPU晶片或CPU模组固化在其中以防损坏的保护措施，一般必须在封装后CPU才能交付用户使用。CPU的封装方式取决于CPU安装形式和器件集成设计，从大的分类来看通常採用Socket插座进行安装的CPU使用PGA(栅格阵列)方式封装，而採用Slot x槽安装的CPU则全部採用SEC(单边接插盒)的形式封装。现在还有PLGA(Plastic Land Grid Array)、OLGA(Organic Land Grid Array)等封装技术。由于市场竞争日益激烈，目前CPU封装技术的发展方向以节约成本为主。

多执行绪

同时多执行绪Simultaneous Multithreading，简称SMT。SMT可通过複製处理器上的结构状态，让同一个处理器上的多个执行绪同步执行并共享处理器的执行资源，可最大限度地实现宽发射、乱序的超标量处理，提高处理器运算部件的利用率，缓和由于数据相关或Cache未命中带来的访问记忆体延时。当没有多个执行绪可用时，SMT处理器几乎和传统的宽发射超标量处理器一样。SMT最具吸引力的是只需小规模改变处理器核心的设计，几乎不用增加额外的成本就可以显着地提升效能。多执行绪技术则可以为高速的运算核心準备更多的待处理数据，减少运算核心的闲置时间。这对于桌面低端系统来说无疑十分具有吸引力。Intel从3.06GHz Pentium 4开始，所有处理器都将支持SMT技术。

多核心

多核心，也指单晶片多处理器（Chip Multiprocessors，简称CMP）。CMP是由美国史丹福大学提出的，其思想是将大规模并行处理器中的SMP（对称多处理器）集成到同一晶片内，各个处理器并行执行不同的进程。与CMP比较， SMT处理器结构的灵活性比较突出。但是，当半导体工艺进入0.18微米以后，线延时已经超过了门延迟，要求微处理器的设计通过划分许多规模更小、局部性更好的基本单元结构来进行。相比之下，由于CMP结构已经被划分成多个处理器核来设计，每个核都比较简单，有利于最佳化设计，因此更有发展前途。目前，IBM 的Power 4晶片和Sun的 MAJC5200晶片都採用了CMP结构。多核处理器可以在处理器内部共享快取，提高快取利用率，同时简化多处理器系统设计的複杂度。

2005年下半年，Intel和AMD的新型处理器也将融入CMP结构。新安腾处理器开发代码为Montecito，採用双核心设计，拥有最少18MB片内快取，採取90nm工艺製造，它的设计绝对称得上是对当今晶片业的挑战。它的每个单独的核心都拥有独立的L1，L2和L3 cache，包含大约10亿支电晶体。

SMP

SMP（Symmetric Multi-Processing），对称多处理结构的简称，是指在一个计算机上汇集了一组处理器(多CPU),各CPU之间共享记忆体子系统以及汇流排结构。在这种技术的支持下，一个伺服器系统可以同时运行多个处理器，并共享记忆体和其他的主机资源。像双至强，也就是所说的二路，这是在对称处理器系统中最常见的一种（至强MP可以支持到四路，AMD Opteron可以支持1-8路）。也有少数是16路的。但是一般来讲，SMP结构的机器可扩展性较差，很难做到100个以上多处理器，常规的一般是8个到16个，不过这对于多数的用户来说已经够用了。在高性能伺服器和工作站级主机板架构中最为常见，像UNIX伺服器可支持最多256个CPU的系统。

构建一套SMP系统的必要条件是：支持SMP的硬体包括主机板和CPU；支持SMP的系统平台，再就是支持SMP的套用软体。为了能够使得SMP系统发挥高效的性能，作业系统必须支持SMP系统，如WINNT、LINUX、以及UNIX等等32位作业系统。即能够进行多任务和多执行绪处理。多任务是指作业系统能够在同一时间让不同的CPU完成不同的任务；多执行绪是指作业系统能够使得不同的CPU并行的完成同一个任务。

要组建SMP系统，对所选的CPU有很高的要求，首先、CPU内部必须内置APIC（Advanced Programmable Interrupt Controllers）单元。Intel 多处理规範的核心就是高级可程式中断控制器（Advanced Programmable Interrupt Controllers–APICs）的使用；再次，相同的产品型号，同样类型的CPU核心，完全相同的运行频率；最后，儘可能保持相同的产品序列编号，因为两个生产批次的CPU作为双处理器运行的时候，有可能会发生一颗CPU负担过高，而另一颗负担很少的情况，无法发挥最大性能，更糟糕的是可能导致当机。

NUMA技术

NUMA即非一致访问分布共享存储技术，它是由若干通过高速专用网路连线起来的独立节点构成的系统，各个节点可以是单个的CPU或是SMP系统。在NUMA中，Cache 的一致性有多种解决方案，需要作业系统和特殊软体的支持。图2中是Sequent公司NUMA系统的例子。这里有3个SMP模组用高速专用网路联起来，组成一个节点，每个节点可以有12个CPU。像Sequent的系统最多可以达到64个CPU甚至256个CPU。显然，这是在SMP的基础上，再用NUMA的技术加以扩展，是这两种技术的结合。

乱序执行技术

乱序执行（out-of-orderexecution），是指CPU允许将多条指令不按程式规定的顺序分开发送给各相应电路单元处理的技术。这样将根据个电路单元的状态和各指令能否提前执行的具体情况分析后，将能提前执行的指令立即传送给相应电路单元执行，在这期间不按规定顺序执行指令，然后由重新排列单元将各执行单元结果按指令顺序重新排列。採用乱序执行技术的目的是为了使CPU内部电路满负荷运转并相应提高了CPU的运行程式的速度。分枝技术：（branch）指令进行运算时需要等待结果，一般无条件分枝只需要按指令顺序执行，而条件分枝必须根据处理后的结果，再决定是否按原先顺序进行。

CPU内部的记忆体控制器

许多应用程式拥有更为複杂的读取模式（几乎是随机地，特别是当cache hit不可预测的时候），并且没有有效地利用频宽。典型的这类应用程式就是业务处理软体，即使拥有如乱序执行（out of order execution）这样的CPU特性，也会受记忆体延迟的限制。这样CPU必须得等到运算所需数据被除数装载完成才能执行指令（无论这些数据来自CPU cache还是主记忆体系统）。当前低段系统的记忆体延迟大约是120－150ns，而CPU速度则达到了3GHz以上，一次单独的记忆体请求可能会浪费200－300次CPU循环。即使在快取命中率（cache hit rate）达到99%的情况下，CPU也可能会花50%的时间来等待记忆体请求的结束－比如因为记忆体延迟的缘故。

你可以看到Opteron整合的记忆体控制器，它的延迟，与晶片组支持双通道DDR记忆体控制器的延迟相比来说，是要低很多的。英特尔也按照计画的那样在处理器内部整合记忆体控制器，这样导致北桥晶片将变得不那幺重要。但改变了处理器访问主存的方式，有助于提高频宽、降低记忆体延时和提升处理器性

製造工艺：现在CPU的製造工艺是45纳米，今年1月10号上市最新的I5I可以达到32纳米，在将来的CPU製造工艺可以达到24纳米。

各种包装

散装CPU只有一颗CPU，无包装。通常店保一年。一般是厂家提供给装机商，装机商用不掉而流入市场的。有些经销商将散装CPU配搭上风扇，包装成原装的样子，就成了翻包货。还有另外的主要来源是就是走私的散包。CPU是电脑最重要的部位

原包CPU ，也称盒装CPU。原包CPU，是厂家为零售市场推出的CPU产品，带原装风扇和厂家三年质保。其实散装和盒装CPU本身是没有质量区别的，主要区别在于渠道不同，从而质保不同，盒装基本都保3年，而散装基本只保1年，盒装CPU所配的风扇是原厂封装的风扇，而散装不配搭风扇，或者由经销商自己配搭风扇。

黑盒CPU是指由厂家推出的顶级不锁频CPU，比如AMD的黑盒5000+，这类CPU不带风扇，是厂家专门为超频用户而推出的零售产品。

深包CPU，也称翻包CPU。经销商将散装CPU自行包装，加风扇。没有厂家质保，只能店保，通常是店保三年。或把CPU从国外走私到境内，进行二次包装，加风扇。这类是未税的，价格比散装略便宜。

工程样品CPU，是指处理器厂商在处理器推出前提供给各大板卡厂商以及OEM厂商用来测试的处理器样品。生产的製成是属于早期产品，但品质并不都低于最终零售CPU，其最大的特点例如：不锁倍频，某些功能特殊，是精通DIY的首选。市面上偶尔也能看见此类CPU销售，这些工程样品会给厂商打上“ES”标誌（ES=Engine Sample的缩写）