您所在位置：网站首页 > 高等教育 > 大学课件 > 计算机组成原理第一章概论共50页

计算机组成原理第一章概论共50页.ppt

50页

卖家[上传人]：平***

文档编号：26284497

上传时间：2017-12-24

文档格式：PPT

文档大小：755.98KB

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10金贝

下载

/ 50 举报版权申诉马上下载

文本预览

下载提示

常见问题

参考教材,《计算机系统结构》陆鑫达高教出版社 96年《计算机系统结构》孙强南科学出版社 92年《计算机系统结构》苏东庄西安电子科技大学 92年《RISC单发射与多发射体系结构》李三立清华出版社 93年《计算机系统结构》郑纬民等清华出版社 97年《Advanced Computer Architecture 》 Kai Hwang 清华出版社 95年,第一章概论,计算机的“年龄”： Clolossus:1944.1.19(英国)----二战期间 ENIAC：1946.2.14（美国） Baby：1948.6.21（英国） EDSAC：1949年英国剑桥大学，第一台存储式计算机,本章要点,体系结构概念弗林分类法计算机层次结构CPU 性能及计算,作业 P23 1.12 1.14,1.1 现代计算机系统,发展经历了五次更新换代,,电子管、继电器存储,晶体管,集成电路,,从结构的发展而言 :,单个CPU组成的单机系统,,流水线机,,大规模的并行处理机,大规模和超大规模集成电路,,多处理机,,磁介质存储,,从器件发展而言：,变址技术,,中断技术,,微程序技术,,缓冲技术共享,,重用技术,,虚拟技术,从语言及应用方面而言 :,由汇编到高级语言从单用户到多用户，到并行处理的语言、编译，操作系统，直到如今计算机网络、异构系统处理等等,从技术的发展上而言 :,五代：,第一代：1945~1954年，电子管和继电器；第二代：1955~1964年，晶体管和磁芯存储器；第三代：1965~1974年，中小规模集成电路；第四代：1975~1990年，LSI/VLSI和半导体存储器；第五代：1990年至今，巨大规模集成电路。

1.1.1 现代计算机的构成,现代计算机系统结构组成的基本模式,1.1.2 计算机系统的层次结构,层次结构,翻译(汇编程序),虚拟机,硬件,固件,0级,1级,2级,3级,4级,5级,6级,翻译(应用程序包),图中0级～2级为物理机,3～6级为虚拟机,5级是高级语言的运行程序,4级是汇编语言的运行程序,3级是操作系统中对各种资源的管理与控制程序,6级是应用语言级,1.2 计算机系统结构,1.2.1 计算机系统结构的基本概念,1964年，IBM公司的系统设计师阿姆达尔(G.M.Amdahl)在介绍IBM 360机型时提出了系统结构的概念系统结构：从程序设计者的角度所看到的系统的属性，即概念性结构和功能特性计算机系统结构：指机器语言程序的设计者或是编译程序设计者所看到的计算机系统的概念性结构与功能特性应用级的程序设计者与传统机的程序设计者所看到的计算机性能的区别：,前者：用应用语言编程，所以他所看到的机器的功能是能够识别和执行应用语言后者：看到的是硬件设备所体现的具体功能透明性,一种本来存在的有差异的事物和属性，从某种角度上看又好像不存在的现象，被称为是“透明性” 例如，高级程序员看不到各种不同类型机器的差异性就是一个明显的例证。

1.2.2 计算机系统结构、组成与实现,三者区别：,1.计算机系统结构 -机器语言级的程序员所了解的计算机的属性即外特性,2.计算机组成 -计算机系统结构的逻辑实现,3.计算机的实现 -指其计算机组成的物理实现,数据表示寄存器定义指令系统中断系统存储系统输入输出结构机器工作状态信息保护,计算机系统结构,计算机组成,数据通路的宽度专用部件的设置各功能部件控制机构的组成方式缓冲技术可靠性技术的采用和方式的选择预估、预判、优化处理,计算机系统的结构，组成，实现是三个完全不同的概念，相互间有着十分密切的依赖关系和相互的影响例1、指令系统例2、主存系统,1.2.3 系统结构的分类,计算机按系统的结构分类通常有三种方法：,(一) 弗林(FLYNN)分类法 (1966年Michael J.Flynn) 按指令流和数据流的多倍性状况对计算机系统分类指令流(Instruction Stream)：机器执行的指令序列数据流(Data Stream)：由指令流调用的数据序列多倍性(Multiplicity)：在系统性能瓶颈部件上处于同一执行阶段的指令或数据的最大可能个数。

此分类法反映出大多数计算机的并行工作方式和结构特点，使用较广分类对象：Von Neumann 型机器单指令流、单数据流(SISD-Single Instruction Single Data)结构,如PDP-11、IBM-360/370、PC 8086、Z-80等微处理机,单指令流、多数据流(SIMD-Single Instruction Multiple Data)结构,如ILLAC Ⅳ(64个单元) 阵列机,多指令流、单数据流(MISD)结构,如RISC机、向量机,多指令流、多数据流(MIMD)结构,IBM 3081/3084、Univac 1100/80，Cray-2等均属这一类型,Flynn计算机分类举例,缺点：,对于广泛流行的标量及向量流水计算机应属于哪一类系统，不明确因为它不包含多个处理机，所以应属SISD类型，但从一条指令的操作全过程来理解，应将每一个向量元素看作一个分离的数据流，则就存在多个数据流，可归为SIMD计算机按用途：专用机与通用机按规模：巨型机、大型机、中型机、小型机、工作站、微型机、单板机、单片机等等,其他分类：,(二)冯氏分类法（1972年，美籍华人冯泽云教授提出）,最大并行度是指计算机单位时间内能够处理的最大的二进制位数。

1) 字串位串， WSBS n=1,m=1 (2) 字并位串， WPBS n>1,m=1(3) 字串位并， WSBP n=1,m>1(4) 字并位并， WPBP n>1,m>1,n: 一个字中同时处理二进制的位数；m: 一个位片或功能部件中能同时处理的字数三) Wolfgang Handler(汉德勒)法（1977年德国）,从硬件设备结构的并行级和流水线的程度分类,程序控制部件的个数,算术逻辑运算部件或处理部件的个数,基本逻辑线路的套数,PDP-11=(1,1,64),Cray-1=(1,12×8，64),1.3 计算机系统设计,1.3.1 计算机系统的设计原则,(一) 加速那些使用频率高的部件,(二) Amdahl定律,Amdahl定律：系统中某一部件由于采用某种改进的执行方式后，整个系统的性能提高了，其衡量指标为加速比加速比,,加速比=,,采用改进措施后的性能,没有采用改进措施的性能,加速比=,,没有采用改进措施前执行某任务所用时间,采用改进措施前执行某任务所用时间,Amdahl定律可表示为：,Sp：加速比；Te：采用改进措施前执行某任务系统所用的时间；T0：采用改进措施后所需的时间；fe：被改进部分的执行时间占的百分比大小；re: 性能提高的倍数。

分析上式可以看出 :,当fe很小甚至→0时，则Sp→1,当re很大甚至→∞时，则,则,例1：计算机执行某测试程序，其中含有大量浮点数据的处理操作，为提高性能可以采用两种方案，一是采用硬件实现求浮点数平方根(FPSQR)的操作，可以使该操作的速度提高10倍；另一种方案是提高所有浮点数据操作(FP)的速度，使其加快2倍同时已知FPSQR操作时间占整个测试程序执行时间的20%，而FP操作占整个执行时间的50%，现比较两种方案按两种情况求出其加速比,例2，若考虑将系统中某一功能的处理速度加快10倍，但该功能的处理使用时间仅为整个系统运行时间的40%，则采用此增强功能方法后，能使整个系统的性能提高多少？,由题可知：fe=0.4，re=10，则可得：Sp=1.56,若以Sp作纵坐标， fe作横坐标，可画出Sp=f(fe)的函数0.0 0.5 1.0 fe,,加速比Sp与可增强性能部分fe的关系,由图中曲线可知，为使系统能获得较高性能加速比，则功能性能可增强部分必须占有较大的比例；否则，增强该功能就没有多大意义。

三）程序访问局部性原理,程序访问局部性原理:,时间局部性：近期被访问的代码，很可能不久又将再次被访问空间局部性：是指地址上相邻近的代码可能会被连续的访问程序往往重复使用它刚刚使用过的数据和指令原因：程序的顺序指令和程序的循环等1.3.2 计算机系统结构设计,计算机系统的功能要求、性能要求、成本要求,硬件功能分配的基本原则：,系统结构设计的方法：,基于计算机系统结构层次结构，有以下三种设计方法：,自下而上的方法自上而下的方法由中间开始的方法,最好,系统结构设计的步骤,设计步骤可以分为：,需求分析需求说明概念性设计具体设计优化和评价,最终目的：获得尽可能高的性能价格比1.4 计算机的性能评价,计算机的性能以及对系统评价的目标都指系统速度的性能计算机的速度性能通常是用响应时间来衡量,响应时间是指用户的一个任务从送入计算机处理到得到结果所需的时间,1.4.1 CPU性能,CPU性能：CPU执行程序所用的时间Tcpu=INCPI Tc,,CPU执行某一程序中所包含的指令总数,时钟周期,,,执行每条指令所需的平均时钟周期数,,,执行整个程序所需的CPU时钟周期数,,例1：某台计算机只有Load/Store指令能对存储器进行读/写操作其它指令只对寄存器进行操作，根据程序跟踪实验结果，已知每种指令所占的比例及CPI数如下:求：上述情况的平均CPI。

CPI=1×0.43+2×0.21+2×0.12+2×0.24 =0.43+0.42+0.24+0.48=1.57,例2：如果FP操作比例为25%，FP的平均CPI FP=4，其他指令的平均CPI(它) 为1.33，FPSQR操作比例为2%，而FPSQR的CPISQR=20，改进的方案有二：一是提高FP操作的速度，使其增加一倍即CPIFP改=2，一是提高FPSQR的速度10倍，即CPISQR改=10，试比较两个方案，求解：其中设定IN与TC都是不变的，在此基础上求出改进前后所具有的CPI值，进行比较: CPI（原）= =（40.25）+(1.330.75)=2 采取以下两种方案进行改进:,（CPIi× ）,,方案1：改进所有浮点操作指令使FP的平均CPI值提高一倍，即: CPIFP(改)=2 整个程序在改进后的值为： CPI (改)=(2×0.25)+(1.33×0.75)=1.5,方案2：只改进FPSQR指令，使其CPI值提高10倍，即CPISQR(改)=2 整个程序改进后的值应为：CPI(改)=CPI(原)-0.02×(CPIFPSQR(原)-CPIFPSQR(改)) =2-0.02×(20-2)=1.64,两者比较还是方案1更好些,=CPI(原)-0.25×(CPIFP(原)-CPIFP(改)) =2.0-0.25×(4-2)=1.5,。

点击阅读更多内容