好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

计算机体系结构的基本概念1ppt课件.ppt

115页
  • 卖家[上传人]:壹****1
  • 文档编号:577164252
  • 上传时间:2024-08-21
  • 文档格式:PPT
  • 文档大小:512KB
  • / 115 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 第一章第一章计算机体系构造的根本概念计算机体系构造的根本概念 Computer Architecture1.第一台通用第一台通用电子子计算机算机诞生于生于1946年年 2.   18000个个电子真空管子真空管 33万万亿个晶体管个晶体管      (18亿倍倍)3.    800字字节存存储容量容量 4万万亿字字节                   (50亿倍倍)4.   运算速度运算速度5000次次/秒秒 12.5万万亿次次/秒秒           (25亿倍倍)5.2.  阅历了了4个开展个开展过程程  1.1 1.1 引论引论 Computer Architecture1.1 1.1 引论引论时时  间间原原  因因每年的性能每年的性能增长增长1946年起的年起的25年年 制造技术和体系结构的发制造技术和体系结构的发展展 25% 20世纪世纪70年代年代末-末-80年代初年代初 大规模集成电路和微处理大规模集成电路和微处理器出现器出现,以集成电路为代表以集成电路为代表的制造技术的发展的制造技术的发展 约约35% 20世纪世纪80年代年代中开始中开始 RISC结构的出现,系统结结构的出现,系统结构不断更新和变革,制造构不断更新和变革,制造技术不断发展技术不断发展50%以上以上维持了约维持了约16年年 2002年以来年以来 更大规模集成电路技术的更大规模集成电路技术的发展为体系结构的发展尤发展为体系结构的发展尤其是并行化技术的发展提其是并行化技术的发展提供了空间供了空间约约20% Computer Architecture推进性能提高的主要要素:推进性能提高的主要要素:1〕更高的主频〕更高的主频      器件工艺的提高器件工艺的提高(Natural frequency growth )      更深的流水线更深的流水线2〕开发各个层次的并行性〕开发各个层次的并行性      指令级并行性指令级并行性      线程线程/进程级并行性进程级并行性      数据级并行性数据级并行性3〕减少内存延迟〕减少内存延迟      大容量、高性能的片上多级大容量、高性能的片上多级Cache       及更成熟的先行控制、指令预取等技术及更成熟的先行控制、指令预取等技术指令的深度流水线指令的深度流水线乱序执行乱序执行超标量处置机超标量处置机分支预测及前瞻执行分支预测及前瞻执行1.1 1.1 引论引论 Computer Architecture         计算机技算机技术的的飞速开展得益于速开展得益于: 计算机制造技算机制造技术的开展的开展 计算机系算机系统构造的构造的创新新1.1 1.1 引论引论 Computer Architecture进一步开展面一步开展面临的的问题 主主频指令指令级并行性并行性 内存内存访问速度的速度的功耗功耗问题1.1 1.1 引论引论 Computer Architecture微处置机的开展轨迹服从摩尔定理:微处置机的开展轨迹服从摩尔定理:Moore's law : The number of transistors that can be placed inexpensively on an integrated circuit doubles approximately every two years.       This trend has continued for more than half a century and is expected to continue until at least 2021 or 20201.1 1.1 引论引论 Computer Architecture晶体管尺寸的减小晶体管尺寸的减小速度的提高速度的提高连线尺寸的减少连线尺寸的减少传输间隔传输间隔减少减少更少的电更少的电荷能驱动荷能驱动从性能的角度来看:从性能的角度来看:…….1.1 1.1 引论引论 Computer Architecture摩尔定律有三种解释摩尔定律有三种解释:一种是集成电路芯片上所集成的电路的数目,每一种是集成电路芯片上所集成的电路的数目,每隔隔18个月就翻一番;个月就翻一番;第二种是微处置器的性能每隔第二种是微处置器的性能每隔18个月提高一倍,个月提高一倍,而价钱下降一半;而价钱下降一半;第三种解释是用一个美圆所能买到的电脑性能,第三种解释是用一个美圆所能买到的电脑性能,每隔每隔18个月翻两番。

      个月翻两番1.1 1.1 引论引论 Computer Architecture1) 功耗问题功耗问题:晶体管尺寸的减小晶体管尺寸的减小速度的提高速度的提高数量的添加数量的添加电压的降低电压的降低线间距的减少线间距的减少功耗添加功耗添加功耗降低功耗降低连线尺寸的减少连线尺寸的减少电阻的添加电阻的添加功耗添加功耗添加漏电流的添加漏电流的添加可靠性下降可靠性下降功耗添加功耗添加功耗添加,功耗添加,Pentium 4 到达到达100w,  平均平均0.5w/mm2功耗添加功耗添加1.1 1.1 引论引论 Computer ArchitectureMax Power (Watts) i386 i386 i386 i486 i486 i486 Pentium® Pentium® Pentium® Pentium® Pentium® Pentium® w/MMX tech. w/MMX tech. w/MMX tech. 1101001.5m1.5m1m1m0.8m0.8m0.6m0.6m0.35m0.35m0.25m0.25m0.18m0.18m0.13m0.13m Pentium® Pro Pentium® Pro Pentium® Pro Pentium® II Pentium® II Pentium® II Pentium® 4Pentium® 4Pentium® 4 Pentium® III Pentium® III Pentium® III 1.1 1.1 引论引论 Computer Architecture运用中可利用的运用中可利用的ILP在在4 ~ 10 之间之间,目目前可到达的前可到达的ILP在在4 ~ 8 之间之间   进一步开展的空间并不是很大进一步开展的空间并不是很大1)2)实现过于复杂能够反而呵斥性能下降实现过于复杂能够反而呵斥性能下降2)  ILP(指令级并行指令级并行)问题问题:1.1 1.1 引论引论 Computer Architecture1.1 1.1 引论引论包含上亿个晶体管包含上亿个晶体管芯片复杂性芯片复杂性的不断提高的不断提高正确性验证非常困难正确性验证非常困难+ 体系构造的不断复杂化体系构造的不断复杂化研发、消费的本钱不断提高研发、消费的本钱不断提高3)  复杂性问题复杂性问题: Computer Architecture§  主频:不能够无限提高主频:不能够无限提高§  散散热热::主主频频每每添添加加1G,,功功耗耗将将上上升升25瓦瓦,,而而在在芯芯片片功功耗耗超超越越150瓦瓦后后,,现现有有的的风风冷冷散散热热系系统统将将无无法法满满足足散热的需求散热的需求§  复复杂杂度度::英英特特尔尔的的奔奔腾腾(Pentium)四四至至尊尊版版840处处置置器,晶体管数量曾经添加至器,晶体管数量曾经添加至2.5亿个亿个§  有效性:不到有效性:不到6%的晶体管用于计算的晶体管用于计算总结总结 Computer Architecture                                 1.2.1 计计算机系算机系统统中的中的层层次概念次概念1. 计计算机系算机系统统是=是=软软件+硬件件+硬件/固件固件2. 计计算机言算机言语语由低由低级级向高向高级级开展。

      开展      高一  高一级级言言语语的的语语句相句相对对于低于低级级言言语语功功能更能更强强,更便于运用,但又都以低,更便于运用,但又都以低级级言言语语为为根底 3. 从从计计算机言算机言语语的角度,把的角度,把计计算机系算机系统统按功按功能划分成多能划分成多级层级层次构造1.2 1.2 计算机体系构造的概念计算机体系构造的概念 Computer Architecture1.2 1.2 计算机体系构造的概念计算机体系构造的概念 Computer Architecture(1) 虚虚拟拟机:由机:由软软件件实现实现的机器2) 言言语实现语实现的两种根本技的两种根本技术术     ◆◆  翻翻译译:先把:先把N+1级级程序全部程序全部变换变换成成N级级程序后,程序后,       再去再去执执行新行新产产生的生的N级级程序,在程序,在执执行行过过程中程中N+1       级级程序不再被程序不再被访问访问     ◆◆  解解释释:每当一条:每当一条N+1级级指令被指令被译码译码后,就直接后,就直接       去去执执行一串等效的行一串等效的N级级指令,然后再去取下一指令,然后再去取下一       条条N+1级级的指令,依此反复的指令,依此反复进进展。

      展 解释执行比翻译花的时间多,但存储空间占用较少解释执行比翻译花的时间多,但存储空间占用较少1.2 1.2 计算机体系构造的概念计算机体系构造的概念 Computer Architecture1.2.2  计算机体系构造的定义计算机体系构造的定义1. 计算机体系构造:程序员所看到的计算机的属性,计算机体系构造:程序员所看到的计算机的属性,     即概念性构造与功能特性即概念性构造与功能特性2. 按照计算机系统的多级层次构造,不同级程序按照计算机系统的多级层次构造,不同级程序   员所看到的计算机具有不同的属性员所看到的计算机具有不同的属性   如低级言语程序员所看到的许多计算属性对高级语如低级言语程序员所看到的许多计算属性对高级语     言程序员透明言程序员透明透明性:透明性: 在计算机技术中,对这种本来是存在的事物在计算机技术中,对这种本来是存在的事物或属性,但从某种角度看又好象不存在或属性,但从某种角度看又好象不存在1.2 1.2 计算机体系构造的概念计算机体系构造的概念 Computer Architecture3. Amdahl 提出的体系构造:传统机器级的体系构造提出的体系构造:传统机器级的体系构造   即普通所说的机器言语程序员所看到的传统机器级即普通所说的机器言语程序员所看到的传统机器级所具有的属性。

      所具有的属性 5. 对于通用存放器型机器,这些属性主要是指:对于通用存放器型机器,这些属性主要是指:Ø指令系统指令系统 Ø包括机器指令的操作类型和格式、指令间的包括机器指令的操作类型和格式、指令间的Ø排序和控制机构等排序和控制机构等Ø数据表示数据表示 Ø硬件能直接识别和处置的数据类型硬件能直接识别和处置的数据类型Ø寻址规那么寻址规那么 Ø包括最小寻址单元、寻址方式及其表示包括最小寻址单元、寻址方式及其表示 1.2 1.2 计算机体系构造的概念计算机体系构造的概念 Computer Architecture   Ø存放器定义存放器定义 Ø〔包括各种存放器的定义、数量和运用方式〕〔包括各种存放器的定义、数量和运用方式〕 Ø中断系统中断系统Ø〔中断的类型和中断呼应硬件的功能等〕〔中断的类型和中断呼应硬件的功能等〕  Ø机器任务形状的定义和切换机器任务形状的定义和切换Ø〔如管态和目态等〕〔如管态和目态等〕  Ø存储系统存储系统 Ø〔主存容量、程序员可用的最大存储容量等〕〔主存容量、程序员可用的最大存储容量等〕 Ø信息维护信息维护Ø〔包括信息维护方式和硬件对信息维护的支持〔包括信息维护方式和硬件对信息维护的支持〕〕  1.2 1.2 计算机体系构造的概念计算机体系构造的概念 Computer ArchitectureØ   I/O构造构造Ø包括包括I/O连结方式、处置机连结方式、处置机/存储器与存储器与I/O设备之间设备之间数据传送的方式和格式以及数据传送的方式和格式以及I/O操作的形状等操作的形状等经典计算机体系构造概念的本质:经典计算机体系构造概念的本质:        计算机系统中软硬件界面确实定,其界面之上的计算机系统中软硬件界面确实定,其界面之上的是软件的功能,界面之下的是硬件和固件的功能。

      是软件的功能,界面之下的是硬件和固件的功能1.2 1.2 计算机体系构造的概念计算机体系构造的概念 Computer Architecture1.2.3 计算机组成和计算机实现技术计算机组成和计算机实现技术1. 计算机组成:计算机体系构造的逻辑实现计算机组成:计算机体系构造的逻辑实现2. 计算机实现:计算机组成的物理实现计算机实现:计算机组成的物理实现 计算机组成包括的内容可以有:计算机组成包括的内容可以有:处处置置机机、、主主存存等等部部件件的的逻逻辑辑构构造造,,机机器器级级内内数数据据流流和和控制流的组成、各部件的功能以及之间的联络等控制流的组成、各部件的功能以及之间的联络等计算机实现包括的内容可以有:计算机实现包括的内容可以有:处处置置机机、、主主存存等等部部件件的的物物理理构构造造,,包包括括器器件件的的集集成成度度和和速速度度确确实实定定,,器器件件、、模模块块、、插插件件、、底底板板的的划划分分与与衔衔接,组装装配技术及信号衔接、电源、冷却方法等接,组装装配技术及信号衔接、电源、冷却方法等1.2 1.2 计算机体系构造的概念计算机体系构造的概念 Computer Architecture体系构造与组成、实现之间的关系为:体系构造与组成、实现之间的关系为:体系构造是组成的笼统,组成是实现的笼统体系构造是组成的笼统,组成是实现的笼统一种体系构造可以有多种组成。

      一种体系构造可以有多种组成一种组成可以有多种物理实现一种组成可以有多种物理实现 广广义义的的计计算算机机体体系系构构造造概概念念包包括括体体系系构构造造的的外外部部特特性性和内部特性:和内部特性:1)计计算算机机体体系系构构造造外外部部特特性性---计计算算机机体体系系构构造造的的经经典定义典定义2)计计算算机机体体系系构构造造内内部部特特性性---计计算算机机组组成成与与实实现现中中一些比较笼统的内容〔微体系构造〕一些比较笼统的内容〔微体系构造〕 1.2 1.2 计算机体系构造的概念计算机体系构造的概念 Computer Architecture系列机系列机在一个厂家内消费的具有一样的体系构造在一个厂家内消费的具有一样的体系构造(经典定义经典定义),但具有不同组成和实现的一系列不同型号的机器但具有不同组成和实现的一系列不同型号的机器 如如 IBM 370系列有系列有370/115、、125、、、、145、、158、、168等一系列从低速到高速的各种型号等一系列从低速到高速的各种型号一样点:程序员所看到的概念性构造和功能属性一样点:程序员所看到的概念性构造和功能属性  指令系一致致指令系一致致不同点:组成和实现技术不同点:组成和实现技术 速度特性不一样速度特性不一样 1.2 1.2 计算机体系构造的概念计算机体系构造的概念 Computer Architecture1.2 1.2 计算机体系构造的概念计算机体系构造的概念1.2.4 计算机系统构造的分类计算机系统构造的分类常常见的的计算机系算机系统构造分构造分类法有两种:法有两种:      Flynn分分类法、法、冯氏分氏分类法法 Computer Architecture1.2 1.2 计算机体系构造的概念计算机体系构造的概念Ø冯氏分氏分类法法Ø用系用系统的最大并行度的最大并行度对计算机算机进展分展分类。

      Ø最大并行度:最大并行度:计算机系算机系统在在单位位时间内可以内可以处置的最置的最大的二大的二进制位数 Ø     用平面直角坐用平面直角坐标系中的一个点代表一个系中的一个点代表一个计算机系算机系统,其横坐,其横坐标表示字表示字宽〔〔n位〕,位〕,纵坐坐标表示一次能表示一次能同同时处置的字数〔置的字数〔m字〕m×n就表示了其最大并行就表示了其最大并行度 ØFlynn分分类法法 Ø按照指令流和数据流的多倍性按照指令流和数据流的多倍性进展分展分类Ø指令流:指令流:计算机算机执行的指令序列行的指令序列 Computer Architecture1.2 1.2 计算机体系构造的概念计算机体系构造的概念–数据流:由指令流数据流:由指令流调用的数据序列用的数据序列–多倍性:在系多倍性:在系统受限的部件上,同受限的部件上,同时处于于同一同一执行行阶段的指令或数据的最大数目段的指令或数据的最大数目–Flynn分分类法把法把计算机系算机系统的构造分的构造分为4类::–  单指令流指令流单数据流数据流(SISD)–  单指令流多数据流指令流多数据流(SIMD)–  多指令流多指令流单数据流数据流(MISD)–  多指令流多数据流多指令流多数据流(MIMD)–4类计算机的根本构造算机的根本构造–IS:指令流,:指令流,DS:数据流,:数据流,CS:控制流,:控制流,–CU:控制部件,:控制部件,PU::处置部件,置部件,MM和和SM:存:存储器。

      器 Computer Architecture1.3 1.3 定量分析技术定量分析技术4个定量原理:个定量原理:以以经经常性事件常性事件为为重点重点对经对经常常发发生的情况采用生的情况采用优优化方法的原那么化方法的原那么进进展展选选择择,以得到更多的,以得到更多的总总体上的改良体上的改良优优化是指分配更多的化是指分配更多的资资源、到达更高的性能或者源、到达更高的性能或者分配更多的分配更多的电电能等 1.3.1  计算机系统设计的定量原理计算机系统设计的定量原理 Computer Architecture1.3 1.3 定量分析技术定量分析技术ØAmdahl定律定律Ø      加快某部件加快某部件执执行速度所能行速度所能获获得的系得的系统统性能性能加速比,受限于加速比,受限于该该部件的部件的执执行行时间时间占系占系统统中中总总执执行行时间时间的百分比的百分比Ø系系统统性能加速比:性能加速比:加速比=加速比=系统性能改良后系统性能改良后系统性能改良前系统性能改良前总执行时间改良前总执行时间改良前总执行时间改良后总执行时间改良后 == Computer Architecture1.3 1.3 定量分析技术定量分析技术–加速比依加速比依赖于两个要素于两个要素–可改良比例:在改良前的系可改良比例:在改良前的系统中,可改良部分中,可改良部分的的执行行时间在在总的的执行行时间中所占的比例。

      它中所占的比例它总是小于等于是小于等于1–例如:一个需运例如:一个需运转60秒的程序中有秒的程序中有20秒的运算秒的运算可以加速,那么可以加速,那么这个比例就是个比例就是20/60–部件加速比:可改良部分改良以后性能提高的部件加速比:可改良部分改良以后性能提高的倍数它是改良前所需的倍数它是改良前所需的执行行时间与改良后与改良后执行行时间的比普通情况下部件加速比是大于的比普通情况下部件加速比是大于 1 的–例如:假例如:假设系系统改良后,可改良部分的改良后,可改良部分的执行行时间是是2秒,而改良前其秒,而改良前其执行行时间为5秒,那么部秒,那么部件加速比件加速比为5/2 Computer Architecture1.3 1.3 定量分析技术定量分析技术–改良后程序的改良后程序的总执行行时间总执行行时间改良后改良后  == 不可改良部分的不可改良部分的执行行时间 ++                                   可改良部分改良后的可改良部分改良后的执行行时间总执行行时间改良后改良后 == (1-可改良比例-可改良比例)×总执行行时间改良前改良前                                                      +== [ (1 -可改良比例-可改良比例) +                           ] ×总执行行时间改良改良前前 可改良比例可改良比例部件加速比部件加速比可改良比例可改良比例×总执行行时间改良前改良前部件加速比部件加速比 Computer Architecture1.3 1.3 定量分析技术定量分析技术系系统加速比加速比为改良前与改良后改良前与改良后总执行行时间之比之比加速比加速比 ==总执行时间改良总执行时间改良前前总执行时间改良总执行时间改良后后 ==〔〔1-可改良比例〕-可改良比例〕+可改良比例可改良比例部件加速比部件加速比1 Computer Architecture1.3 1.3 定量分析技术定量分析技术           例例1.1 将将计计算机系算机系统统中某一功能的中某一功能的处处置速置速度提高到原来的度提高到原来的20倍,但倍,但该该功能的功能的处处置置时间时间仅仅占整个系占整个系统统运运转时间转时间的的40%,那么采用此,那么采用此提高性能的方法后,能使整个系提高性能的方法后,能使整个系统统的性能提的性能提高多少?高多少?     Computer Architecture1.3 1.3 定量分析技术定量分析技术解解             可改良比例可改良比例 = 40% = 0.4,,                       部件加速比部件加速比 = 20              根据根据Amdahl定律可知:定律可知:             采用此提高性能的方法后,能使整个系采用此提高性能的方法后,能使整个系统的的性能提高到原来的性能提高到原来的1.613倍。

      倍总加速比总加速比 = 10.6 +0.420= 1.613 Computer Architecture1.3 1.3 定量分析技术定量分析技术      例例1.2   某某计计算机系算机系统统采用浮点运算部件后,使浮采用浮点运算部件后,使浮点运算速度提高到原来的点运算速度提高到原来的20倍,而系倍,而系统统运运转转某一某一程序的整体性能提高到原来的程序的整体性能提高到原来的5倍,倍,试计试计算算该该程序程序中浮点操作所占的比例中浮点操作所占的比例     Computer Architecture1.3 1.3 定量分析技术定量分析技术解解  部件加速比部件加速比 = 20,系,系统加速比加速比 = 5    根据根据Amdahl定律可知定律可知           由此可得:可改良比例由此可得:可改良比例 = 84.2%      即程序中浮点操作所占的比例即程序中浮点操作所占的比例为84.2% Computer Architecture1.3 1.3 定量分析技术定量分析技术–Amdahl定律:一种性能改良的定律:一种性能改良的递递减减规规那么那么–假假设仅仅对计设仅仅对计算算义务义务中的一部分做性能改良,中的一部分做性能改良,那么改良得越多,所得到的那么改良得越多,所得到的总总体性能的提升就体性能的提升就越有限。

      越有限–重要推重要推论论:假:假设设只只针对针对整个整个义务义务的一部分的一部分进进展展改良和改良和优优化,那么所化,那么所获获得的加速比不超越得的加速比不超越–                      1/〔 〔1-可改良比例-可改良比例〕 〕  Computer Architecture1.3 1.3 定量分析技术定量分析技术两种情况两种情况: :(1)(1)可改良比例为0,这时系统加速比等于1,即可改良比例为0,这时系统加速比等于1,即系统性能无法提高系统性能无法提高2)(2)部件加速比趋于无穷,这时分母中可改良比例部件加速比趋于无穷,这时分母中可改良比例与部件加速比之比趋于0,由此系统加速比趋于1与部件加速比之比趋于0,由此系统加速比趋于1除以1减可改良比例,这是加速这个部件所获得的除以1减可改良比例,这是加速这个部件所获得的系统性能改善的极限系统性能改善的极限 Computer Architecture1.3 1.3 定量分析技术定量分析技术 Computer Architecture1.3 1.3 定量分析技术定量分析技术3.CPU性能公式性能公式4.执执行一个程序所需的行一个程序所需的CPU时间时间5.      CPU时间时间 = 执执行程序所需的行程序所需的时钟时钟周期数周期数×时钟时钟周周期期时间时间6.执执行程序所需的行程序所需的时钟时钟周期数可周期数可进进一步分解一步分解为为::7.   CPI :每条指令:每条指令执执行的平均行的平均时钟时钟周期数周期数8.    IC::  所所执执行的指令条数行的指令条数9.程序程序执执行的行的CPU时间时间可以写成可以写成10.        CPU时间时间 = IC ×CPI ×时钟时钟周期周期时间时间  Computer Architecture1.3 1.3 定量分析技术定量分析技术计算机任务的时钟频率计算机任务的时钟频率       计算机系统中与实现技术和工艺有关的要素。

      计算机系统中与实现技术和工艺有关的要素       单位是单位是MHz或或GHz  时钟周期时间时钟周期时间= 1 / 时钟频率时钟频率 CPU时间时间 = CPI   IC / 时钟频率时钟频率  Computer Architecture1.3 1.3 定量分析技术定量分析技术时钟频率:时钟频率:受计算机实现技术和计算机组成影响受计算机实现技术和计算机组成影响CPI:: 受计算机指令集构造和计算机组成影响受计算机指令集构造和计算机组成影响IC::受计算机指令集构造和编译技术影响受计算机指令集构造和编译技术影响对对许许多多CPU来来说说,,不不同同的的指指令令运运转转时时所所用用的的周周期期数数是是不不同同的的,,假假设设我我们们假假设设::计计算算机机系系统统有有 n 种种指指令令,,其其中中  CPIi :: 第第 i 种指令所用的时钟周期数;种指令所用的时钟周期数;     ICi :: 在在程程序序运运转转过过程程中中中中第第 i 种种指指令令被被运转的次数;运转的次数; Computer Architecture1.3 1.3 定量分析技术定量分析技术CPU时间时间 =    (CPIi   ICi) / 时钟频率时钟频率CPI =   (CPIi   ICi) / IC =   (CPIi   ICi / IC)其中:其中:(ICi / IC) 反映了第反映了第 i 种指令在程序中所占的种指令在程序中所占的             比例。

      比例  Computer Architecture例例1.3  假设我们思索条件分支指令的两种不同设计方法假设我们思索条件分支指令的两种不同设计方法如下:如下: (1) CPUA:经过比较指令设置条件码,然后测试条:经过比较指令设置条件码,然后测试条               件码进展分支件码进展分支 (2) CPUB:在分支指令中包括比较过程:在分支指令中包括比较过程    在两种在两种CPU中,条件分支指令都占用中,条件分支指令都占用2个时钟周期而个时钟周期而一切其它指令占用一切其它指令占用1个时钟周期,对于个时钟周期,对于CPUA,执行的,执行的指令中分支指令占指令中分支指令占20%;由于每个分支指令之前都需求;由于每个分支指令之前都需求有比较指令,因此比较指令也占有比较指令,因此比较指令也占20%由于CPUA1.31.3 定量分析技术根底定量分析技术根底 Computer Architecture在分支时不需求比较,因此假设它的时钟周期时间比在分支时不需求比较,因此假设它的时钟周期时间比CPUB快快1.25倍哪一个倍哪一个CPU更快?假设更快?假设CPUA的时的时钟周期时间仅仅比钟周期时间仅仅比CPUB快快1.1倍,哪一个倍,哪一个CPU更快呢更快呢?? 解:我们不思索一切系统问题,所以可用解:我们不思索一切系统问题,所以可用CPU性能公性能公式。

      占用式占用2个时钟周期的分支指令占总指令的个时钟周期的分支指令占总指令的20%,剩,剩下的指令占用下的指令占用1个时钟周期所以个时钟周期所以      CPIA = 0.2   2 + 0.80   1 = 1.2那么那么CPU性能为:性能为:      总总CPU时间时间A = ICA   1.2   时钟周期时钟周期A1.31.3 定量分析技术根底定量分析技术根底 Computer Architecture对对 CPUB 根据假设,有:根据假设,有:    时钟周期时钟周期B = 1.25   时钟周期时钟周期A在在CPUB中没有独立的比较指令,所以中没有独立的比较指令,所以CPUB的程序量的程序量为为CPUA的的80%,分支指令的比例为:,分支指令的比例为:    20%/80% = 25%这些分支指令占用这些分支指令占用2个时钟周期,而剩下的个时钟周期,而剩下的75%的指令的指令占用占用1个时钟周期,因此:个时钟周期,因此:    CPIB = 0.25   2 + 0.75   1 = 1.251.31.3 定量分析技术根底定量分析技术根底 Computer Architecture由于由于CPUB不执行比较,故:不执行比较,故:    ICB = 0.8   ICA因此因此CPUB性能为:性能为:  总总CPU时间时间B = ICB   CPIB   时钟周期时钟周期B   = 0.8   ICA   1.25   (1.25   时钟周期时钟周期A)  = 1.25   ICA   时钟周期时钟周期A在这些假设之下,虽然在这些假设之下,虽然CPUB执行指令条数较少,执行指令条数较少,CPUA由于有着更短的时钟周期,所以比由于有着更短的时钟周期,所以比CPUB快。

      快1.31.3 定量分析技术根底定量分析技术根底 Computer Architecture假设假设CPUA的时钟周期时间仅仅比的时钟周期时间仅仅比CPUB快快1.1倍,那倍,那么么  时钟周期时钟周期B = 1.10   时钟周期时钟周期ACPUB的性能为:的性能为:  总总CPU时间时间B = ICB   CPIB   时钟周期时钟周期B   = 0.8   ICA   1.25   (1.10   时钟周期时钟周期A)  = 1.10   ICA   时钟周期时钟周期A因此因此CPUB由于执行更少指令条数,比由于执行更少指令条数,比CPUA运转更运转更快1.31.3 定量分析技术根底定量分析技术根底 Computer Architecture1.3 1.3 定量分析技术定量分析技术4. 程序的部分性原理程序的部分性原理        程序在程序在执执行行时时所所访问访问地址的分布不是随机的,而地址的分布不是随机的,而是相是相对对地簇聚;地簇聚;这这种簇聚同种簇聚同时时存在于指令存在于指令访问访问和数据和数据访问访问中   ◆◆ 程序的程序的时间时间部分性:程序即将用到的信息很能部分性:程序即将用到的信息很能够够就是目前正在运用的信息。

      就是目前正在运用的信息   ◆◆ 程序的空程序的空间间部分性:程序即将用到的信息很能部分性:程序即将用到的信息很能够够与目前正在运用的信息在空与目前正在运用的信息在空间间上相上相邻邻或者或者临临近  Computer Architecture1.3 1.3 定量分析技术定量分析技术用用Amdahl定律分析并行加速定律分析并行加速      现实世界的计算过程从来不会按照简单的串并行现实世界的计算过程从来不会按照简单的串并行来区分,实践上,也几乎没有计算过程能纯粹地来区分,实践上,也几乎没有计算过程能纯粹地划归为串行或者并行实现的划归为串行或者并行实现的           绝大多数软件会包含绝大多数软件会包含 可并行可并行 和和 不可并行〔串行不可并行〔串行〕的操作〕的操作 Computer Architecture1.3 1.3 定量分析技术定量分析技术§ p:: 处置器数;处置器数;§ W:问题规模〔计算负载、任务负载〕:问题规模〔计算负载、任务负载〕§ WS:: 运用程序中的串行分量运用程序中的串行分量§ WP:运用程序中可并行分量:运用程序中可并行分量§ W = WS +WP§串行分量比例〔串行分量比例〔 f = WS/W〕〕§并行分量比例〔并行分量比例〔1-f = WP/W〕〕§S:加速比:加速比 Computer Architecture1.3 1.3 定量分析技术定量分析技术加速比加速比 Computer Architecture1.3 1.3 定量分析技术定量分析技术例例 假假 设设 想想 用用 100个个 处处 置置 器器 到到 达达 80的的 加加 速速 比比 ,,求原计算程序中串行部分所占比例。

      求原计算程序中串行部分所占比例解解   Amdahl定律为定律为    得出:得出:f==0.0025    可可以以看看出出要要用用100个个处处置置器器到到达达80的的加加速速比比,,串串行行计计算算的的部部分分只能占只能占0.25%  Computer Architecture1.3 1.3 定量分析技术定量分析技术例例 假假设设一一个个程程序序中中80%的的部部分分能能完完全全并并行行化化,,剩剩下下20%串串行行执执行行 ,, 问问 用用 100个个 处处 置置 器器 能能 到到 达达 多多 少少 加加 速速 比比 ??忽略一切因并行产生的额外开销忽略一切因并行产生的额外开销解解   Amdahl定律为定律为    这时用这时用 100 个处置器只能到达个处置器只能到达 4.8 倍的加速比倍的加速比 Computer Architecture1.3 1.3 定量分析技术定量分析技术例例 当处置器数目当处置器数目p =1024,加速比公式如下:,加速比公式如下: Computer Architecture1.3 1.3 定量分析技术定量分析技术Gustafson定律定律 除非特定研讨,在实践运用中没有必要固定任务负除非特定研讨,在实践运用中没有必要固定任务负载而让计算程序运转在不同数目的处置器上,增多载而让计算程序运转在不同数目的处置器上,增多处置器必需相应地增大问题规模才有实践意义处置器必需相应地增大问题规模才有实践意义 对大多数问题,问题规模的改动只会改动计算中并对大多数问题,问题规模的改动只会改动计算中并行计算量,而不会改动串行计算量行计算量,而不会改动串行计算量 Computer Architecture1.3 1.3 定量分析技术定量分析技术§ 并行计算是为理处理大规模计算问题,可并行部并行计算是为理处理大规模计算问题,可并行部分的比例是可扩展的分的比例是可扩展的          加速比与处置器数成斜率为〔加速比与处置器数成斜率为〔1-f〕的线性关系〕的线性关系            串行比例串行比例  f  不再是并行扩展的瓶颈不再是并行扩展的瓶颈  Computer Architecture1.3 1.3 定量分析技术定量分析技术评测的性能目的:的性能目的:执行行时间和吞吐率和吞吐率采用什么性能目的,与采用什么性能目的,与测试者看者看问题的角度有关。

      的角度有关普通用普通用户::                       单个程序的个程序的执行行时间〔〔执行行                                       单个个 程序所花的程序所花的时间〕〕数据数据处置中心的管理置中心的管理员:吞吐率〔在:吞吐率〔在单位位时间里可以里可以                                       完成的完成的义务 〕〕1.3.2 计算机系统的性能评测计算机系统的性能评测 Computer Architecture1.3 1.3 定量分析技术定量分析技术       执行行时间可以有多种定可以有多种定义::计算机完成某一算机完成某一义务所破所破费的全部的全部时间: 包括磁包括磁盘访问、存、存储器器访问、、输入入/输出、操作系出、操作系统开开销等CPU时间::CPU执行所行所给定的程序所破定的程序所破费的的时间,,不包含不包含I/O等待等待时间以及运以及运转其他程序的其他程序的时间用用户CPU时间:用:用户程序所耗程序所耗费的的CPU时间系系统CPU时间:用:用户程序运程序运转期期间操作系操作系统耗耗费的的CPU时间。

      Computer Architecture1.3 1.3 定量分析技术定量分析技术假假设两台两台计算机算机为X和和Y,,X比比Y快的意思是:快的意思是:对于于给定定义务,,X的的执行行时间比比Y的的执行行时间少X的性能是的性能是Y的的n倍,即倍,即而而执行行时间与性能成反比,即与性能成反比,即 执行时间执行时间Y执行时间执行时间X=nn= = =执行时间执行时间Y执行时间执行时间X性能性能Y1性能性能X1性能性能X性能性能Y Computer Architecture1.3 1.3 定量分析技术定量分析技术通用评测方法通用评测方法:    (1) 采用基于测试的方法,如以测试程序的执行时采用基于测试的方法,如以测试程序的执行时间为度量间为度量;(2) 采用基于分析的方法,如经过对主频、采用基于分析的方法,如经过对主频、CPI 、、各类指令的计数等的分析来获得各类指令的计数等的分析来获得  Computer Architecture1.3 1.3 定量分析技术定量分析技术2 .基准测试程序基准测试程序 1.目前常用的测试程序可以分为四类:目前常用的测试程序可以分为四类:〔按测试可靠性由高至低的顺序列出〕〔按测试可靠性由高至低的顺序列出〕    (1) 真实程序真实程序     (2) 中心程序中心程序     (3) 小测试程序小测试程序     (4) 合成测试程序合成测试程序  Computer Architecture1.51.5 定量分析技术根底定量分析技术根底2. 测试程序组件测试程序组件       选择一组各个方面有代表性的测试程序,选择一组各个方面有代表性的测试程序, 组成组成一个通用测试程序集合。

      一个通用测试程序集合 最大优点:最大优点:       防止了独立测试程序存在的片面性,尽能够全防止了独立测试程序存在的片面性,尽能够全面地测试了一个计算机系统的性能面地测试了一个计算机系统的性能根本测试程序根本测试程序 SPEC科学与工程计算性能科学与工程计算性能 LINPACK Computer Architecture1.51.5 定量分析技术根底定量分析技术根底台式台式计算机的基准算机的基准测试程序套件可以分程序套件可以分为两大两大类::处置器性能置器性能测试程序程序图形性能形性能测试程序程序SPEC89:用于:用于测试处置器性能置器性能10个程序〔个程序〔4个整数个整数程序,程序,6个浮点程序〕个浮点程序〕   演化出了演化出了4个版本个版本        SPEC92::               20个程序个程序        SPEC95::               18个程序个程序        SPEC2000::           26个程序个程序        SPEC CPU2006:: 29个程序个程序 Computer Architecture1.51.5定量分析技术根底定量分析技术根底     SPEC CPU2006     整数程序整数程序12个〔个〔CINT2006〕〕         9个是用个是用C写的,写的,3个是用个是用C++写的写的     浮点程序浮点程序17个〔个〔CFP2006〕〕        6个是用个是用FORTRAN写的,写的,4个是用个是用C++写的,写的,3个是用个是用C写的,写的,4个是用个是用C和和FORTRAN混合混合编写的。

      写的为真正的程序经过精简并最小化为真正的程序经过精简并最小化I/O活动而构成活动而构成, Computer Architecture1.51.5 定量分析技术根底定量分析技术根底针对桌面计算机图形系统支持针对桌面计算机图形系统支持OpenGL库的性能库的性能:                               SPECviewperf针对桌面计算机图形密集型运用的性能:针对桌面计算机图形密集型运用的性能:                  SPECapc针对文件效力器性能:针对文件效力器性能:                               SPECSFS针对网络文件效力器性能:针对网络文件效力器性能:                               SPECWeb针对事务处置领域:针对事务处置领域:               TPC测试程序组件〔主要测试事务处置的测试程序组件〔主要测试事务处置的吞吐才干〕吞吐才干〕 Computer Architecture1.51.5 定量分析技术根底定量分析技术根底基于基于Windows的的PC机方面:机方面:l PCMark04l      包括中央处置器测试组、内存测试组、图包括中央处置器测试组、内存测试组、图l  形芯片测试组、硬盘测试组等形芯片测试组、硬盘测试组等;l Business Winstone 2004l      主要用于测试计算机系统商业运用的综合主要用于测试计算机系统商业运用的综合l  性能性能;l Multimedia Content Creation Winstone  2004l      主主要要用用于于测测试试计计算算机机系系统统多多媒媒体体运运用用的的综综合合性性能能; Computer Architecture1.51.5 定量分析技术根底定量分析技术根底对高性能计算机:对高性能计算机:机器的实际峰值速度机器的实际峰值速度用户能得到的实践速度用户能得到的实践速度加速比、效率加速比、效率可扩展性:可扩展性:       随着计算负载的添加和机器规模的扩展,计算随着计算负载的添加和机器规模的扩展,计算系统的性能能否随着处置器的数目的添加而按比例系统的性能能否随着处置器的数目的添加而按比例的添加的添加 Computer Architecture1.51.5 定量分析技术根底定量分析技术根底     系统评价:系统评价:     单位时间内能完成的任务量单位时间内能完成的任务量     任务量:任务量:       执行的指令数执行的指令数          :计算单位为百万条:计算单位为百万条      每秒执行多少百万条指令每秒执行多少百万条指令 〔〔MIPS〕〕       完成的浮点运算数完成的浮点运算数  :计算单位为百万次:计算单位为百万次      每秒执行多少百万次浮点运算每秒执行多少百万次浮点运算 〔〔MFLOPS〕〕         GFLOPS(10亿亿),  TFLOPS(万亿万亿),   PFLOPS(千万亿千万亿)  Computer Architecture1.3 1.3 定量分析技术定量分析技术性能比性能比较A机机 B机机 C机机 W((1))  W((2))  W((3)) 程序程序1 1.00 10.00 20.00 0.50 0.909 0.999 程序程序2 1000.00 10.00 20.000.50 0.091 0.001 加权算术加权算术平均值平均值Am((1)) 500.50 10.00 20.00加权算术加权算术平均值平均值Am((2)) 91.91 10.00 20.00加权算术加权算术平均值平均值Am((3)) 2.00 10.00 20.00两个程序在两个程序在A、、B、、C三台计算机上的执行时间三台计算机上的执行时间 Computer Architecture1.3 1.3 定量分析技术定量分析技术–平均平均执行行时间:各:各测试程序程序执行行时间的算的算术平均平均值–其中,其中,Ti:第:第i个个测试程序的程序的执行行时间–            n::测试程序程序组中程序的个数中程序的个数  Computer Architecture1.3 1.3 定量分析技术定量分析技术–加加权执行行时间:各:各测试程序程序执行行时间的加的加权平平均均值–其中,其中,Wi:第:第i个个测试程序在程序在测试程序程序组中所中所占的比重占的比重–           – –Ti::该程序的程序的执行行时间 Computer Architecture1.41.4 计算机体系构造的开展计算机体系构造的开展 1.4.1 冯冯·诺诺依曼构造依曼构造  Computer Architecture1.41.4 计算机体系构造的开展计算机体系构造的开展 存存储储程序原理的根本点:指令程序原理的根本点:指令驱动驱动 程序程序预预先存放在先存放在计计算机存算机存储储器中,器中,计计算机一算机一旦启旦启动动,就能按照程序指定的,就能按照程序指定的逻辑顺逻辑顺序序执执行行这这些程序,自些程序,自动动完成由程序所描画的完成由程序所描画的处处置任置任务务。

      Computer Architecture1.41.4 计算机体系构造的开展计算机体系构造的开展     1. 冯冯·诺诺依曼构造的主要特点依曼构造的主要特点以运算器以运算器为为中心在存在存储储器中,指令和数据同等器中,指令和数据同等对对待     指令和数据一指令和数据一样样可以可以进进展运算,即由指令展运算,即由指令组组成成的程序是可以修正的的程序是可以修正的存存储储器是按地址器是按地址访问访问、按、按顺顺序序线线性性编编址的一址的一维维构构造,每个造,每个单单元的位数是固定的元的位数是固定的 Computer Architecture1.41.4 计算机体系构造的开展计算机体系构造的开展 –指令的指令的执行是行是顺序的–普通是按照指令在存普通是按照指令在存储器中存放的器中存放的顺序序执行行;–程序的分支由程序的分支由转移指令移指令实现;–由指令由指令计数器数器 PC 指明当前正在指明当前正在执行的指令在行的指令在存存储器中的地址器中的地址;–指令由操作指令由操作码和地址和地址码组成–指令和数据均以二指令和数据均以二进制制编码表示,采用二表示,采用二进制制运算 Computer Architecture2. 对体系构造进展的改良对体系构造进展的改良 (1) 对输入输出方式的改良对输入输出方式的改良              以运算器为中心带来了慢速输入/输以运算器为中心带来了慢速输入/输      出操作占用快速运算器的问题。

      出操作占用快速运算器的问题1.41.4 计算机体系构造的开展计算机体系构造的开展 Computer Architecture1.41.4 计算机体系构造的开展计算机体系构造的开展 Computer Architecture1.41.4 计算机体系构造的开展计算机体系构造的开展 (2) 采用并行采用并行处处置技置技术术 如何如何发发掘掘传统传统机器中的并行性?机器中的并行性?在不同的在不同的级别级别采用并行技采用并行技术术    例如,微操作例如,微操作级级、指令、指令级级、、线线程程级级、、进进程程级级、、义务级义务级等 Computer Architecture1.41.4 计算机体系构造的开展计算机体系构造的开展 (3) 存存储储器器组织组织构造的开展构造的开展通用存放器:提高运通用存放器:提高运转转速度速度高速高速缓缓冲存冲存储储器和多器和多级级存存储储器器组织组织构造:提构造:提高运高运转转速度并降低本速度并降低本钱钱堆堆栈栈的引入:支持高的引入:支持高级级言言语过语过程程调调用、用、递归递归机制以及表达式机制以及表达式计计算算虚虚拟拟存存储储器:方便高器:方便高级级言言语编语编程程相相联联存存储储器:支持内容器:支持内容查查找找 Computer Architecture• 复杂指令集计算机复杂指令集计算机(CISC) • 精简指令集计算机精简指令集计算机(RISC) (4) 指令集的开展指令集的开展        指令集的功能指令集的功能 ::(5) 指令的寻址方式指令的寻址方式        多种灵敏的寻址方式。

      多种灵敏的寻址方式 1.41.4 计算机体系构造的开展计算机体系构造的开展 Computer Architecture1.41.4 计算机体系构造的开展计算机体系构造的开展 –软件的可移植性:一个件的可移植性:一个软件可以不件可以不经修正修正或者只需少量修正就可以由一台或者只需少量修正就可以由一台计算机移算机移植到另一台植到另一台计算机上正确地运算机上正确地运转差别只只是是执行行时间的不同–            我我们称称这两台两台计算机是算机是软件兼容的件兼容的–实现可移植性的常用方法可移植性的常用方法–  采用系列机,模采用系列机,模拟与仿真,一致高与仿真,一致高级语 言言 1.4.2 软件对系统构造的影响软件对系统构造的影响  Computer Architecture1.41.4 计算机体系构造的开展计算机体系构造的开展 1. 系列机系列机         由同一厂家消费的具有一样的系统构造,由同一厂家消费的具有一样的系统构造,但具有不同组成和实现的一系列不同型号的机但具有不同组成和实现的一系列不同型号的机器        较好地处理软件开发要求系统构造相对稳较好地处理软件开发要求系统构造相对稳定与器件、硬件技术迅速开展的矛盾。

      定与器件、硬件技术迅速开展的矛盾 Computer Architecture1.41.4 计算机体系构造的开展计算机体系构造的开展 系列机的系列机的软件兼容件兼容          向上〔下〕兼容:按某档机器向上〔下〕兼容:按某档机器编制的程序,不制的程序,不加修正就能运加修正就能运转于比它高〔低〕档的机器于比它高〔低〕档的机器          向前〔后〕兼容:按某个向前〔后〕兼容:按某个时期投入市期投入市场的某种的某种型号机器型号机器编制的程序,不加修正地就能运制的程序,不加修正地就能运转于于在它之前〔后〕投入市在它之前〔后〕投入市场的机器      向后兼容是系列机的根本特征向后兼容是系列机的根本特征兼容机:由不同公司厂家消兼容机:由不同公司厂家消费的具有一的具有一样系系统构造构造                      的的计算机算机  Computer Architecture1.41.4 计算机体系构造的开展计算机体系构造的开展 2. 模模拟拟和仿真和仿真使使软软件能在具有不同系件能在具有不同系统统构造的机器之构造的机器之间间相互移植相互移植在一种系在一种系统统构造上构造上实现实现另一种系另一种系统统构造构造;从指令集的角度来看,就是要在一种机器上从指令集的角度来看,就是要在一种机器上实现实现另一另一种机器的指令集。

      种机器的指令集模模拟拟:用:用软软件的方法在一台件的方法在一台现现有的机器有的机器〔 〔称称为为宿主机宿主机〕 〕上上实现实现另一台机器另一台机器〔 〔称称为为虚虚拟拟机机〕 〕的指令集的指令集通常用解通常用解释释的方法来的方法来实现实现运运转转速度速度较较慢,性能慢,性能较较差 Computer Architecture1.41.4 计算机体系构造的开展计算机体系构造的开展 –仿真:用一台仿真:用一台现有机器〔宿主机〕上的微程有机器〔宿主机〕上的微程序去解序去解释实现另一台机器〔目的机〕的指令另一台机器〔目的机〕的指令集–运运转速度比模速度比模拟方法的快方法的快–仿真只能在系仿真只能在系统构造差距不大的机器之构造差距不大的机器之间运运用用–3. 一致高一致高级言言语 –实现软件移植的一种理想的方法件移植的一种理想的方法–较难实现 Computer Architecture1.41.4 计算机体系构造的开展计算机体系构造的开展 • 逻辑电逻辑电路路 •单单芯片上的晶体管数量每年芯片上的晶体管数量每年60% 80%•速度的不断提高速度的不断提高〔 〔主主频频的提高,的提高, GHz 以上以上〕 〕•64位位- 128位机器成位机器成为为能能够够•门级门级 — 存放器存放器级级— 部件部件级级— 系系统级统级均在一个均在一个VLSI芯片中芯片中实现实现•使物理使物理实现实现、、逻辑组逻辑组成和体系构造之成和体系构造之间间的差的差别别模糊模糊化化,•使使软软件、硬件之件、硬件之间间的差的差别别模糊化模糊化〔 〔如如FPGA器件器件〕 〕 。

      1.4.3 器件开展对系统构造的影响器件开展对系统构造的影响  Computer Architecture1.41.4 计算机体系构造的开展计算机体系构造的开展 Ø摩摩尔定律定律Ø     集成集成电路芯片上所集成的晶体管数目每隔路芯片上所集成的晶体管数目每隔18个月就翻一番个月就翻一番Ø计算机的分代主要以器件作算机的分代主要以器件作为划分划分规范Ø它它们在器件、系在器件、系统构造和构造和软件技件技术等方面都有等方面都有各自的特征各自的特征 分代分代 器件特征器件特征 结构特征结构特征 软件特征软件特征 典型实例典型实例 第一代第一代((1945—1954年)年) 电子管和继电电子管和继电器器 存储程序计算存储程序计算机机程序控制程序控制I/O 机器语言机器语言汇编语言汇编语言 普林斯顿普林斯顿ISA,,ENIAC,,IBM 701 第二代第二代((1955—1964年)年) 晶体管、磁芯晶体管、磁芯印刷电路印刷电路 浮点数据表示浮点数据表示寻址技术寻址技术中断、中断、I/O处理处理机机 高级语言和编高级语言和编译译批处理监控系批处理监控系统统 Univac LAPC,,CDC 1604,,IBM 7030 第三代第三代((1965—1974年)年) SSI和和MSI多层印刷电路多层印刷电路微程序微程序 流水线、流水线、Cache先行处理先行处理系列机系列机 多道程序多道程序分时操作系统分时操作系统 IBM 360/370,,CDC 6600/7600,,DEC PDP-8 第四代第四代((1975—1990年)年) LSI和和VLSI半导体存储器半导体存储器 向量处理向量处理分布式存储器分布式存储器 并行与分布处并行与分布处理理 Cray-1,,IBM 3090,,DEC VAX 9000,,Convax-1第五代第五代((1991年年—)) 高性能微处理高性能微处理器高密度电路器高密度电路超标量、超流超标量、超流水水SMP、、MP、、MPP机群机群 大规模、可扩大规模、可扩展展并行与分布处并行与分布处理理 SGI Cray T3E,,IBM SP2,,DECAlphaServer 8400  Computer Architecture1.41.4 计算机体系构造的开展计算机体系构造的开展 1.4.4 运用对系统构造的影响运用对系统构造的影响  不同的运用对计算机系统构造的设计提出了不同不同的运用对计算机系统构造的设计提出了不同的要求,的要求,通用:性能价钱比通用:性能价钱比公用:需求对某一方面性能特别支持的系统构造公用:需求对某一方面性能特别支持的系统构造 高构造化的数值计算高构造化的数值计算气候模型、流体动力学、有限元分析气候模型、流体动力学、有限元分析非构造化的数值计算非构造化的数值计算蒙特卡洛模拟、稀疏矩阵蒙特卡洛模拟、稀疏矩阵实时多要素问题实时多要素问题语音识别、图像处置、计算机视觉语音识别、图像处置、计算机视觉 Computer Architecture1.41.4 计算机体系构造的开展计算机体系构造的开展 –大存大存储容量和容量和输入入输出密集的出密集的问题数据数据库系系统、事、事务处置系置系统–图形学和形学和设计问题–计算机算机辅助助设计–人工智能人工智能–面向知面向知识的系的系统、推理系、推理系统等等 Computer Architecture目前的主流分类:目前的主流分类:                       效力器效力器                      桌面系统桌面系统                       嵌入式计算嵌入式计算1.41.4 计算机体系构造的开展计算机体系构造的开展 Computer Architecture1.41.4 计算机体系构造的开展计算机体系构造的开展 运用需求的分化运用需求的分化桌面计算:桌面计算:    性能价钱比,对图形的支持;性能价钱比,对图形的支持;效力器:效力器:    可用性,可扩展性,高性能可用性,可扩展性,高性能嵌入式计算:本钱,功耗,实时性嵌入式计算:本钱,功耗,实时性根本开展规律:计算机性能随时间下移根本开展规律:计算机性能随时间下移 Computer Architecture1.41.4 计算机体系构造的开展计算机体系构造的开展 诞生、开展、成熟、消亡:生、开展、成熟、消亡:从硬件成熟到系从硬件成熟到系统软件成熟大件成熟大约需求需求5~~7年的年的时间;;从系从系统软件成熟到运用件成熟到运用软件成熟,大件成熟,大约也需求也需求5~~7年年时间;;再再过5~~7年的年的时间,,这种系种系统构培育不会作构培育不会作为主流主流系系统构造存在了。

      构造存在了1.4.5 系统构造的生命周期系统构造的生命周期  Computer Architecture1.41.4 计算机体系构造的开展计算机体系构造的开展 Intel的的x86系列微处置器中系列微处置器中32位系统构造的开展位系统构造的开展 Computer Architecture1.51.5 计算机体系构造中并行性的开展计算机体系构造中并行性的开展 并行性:并行性:计算机系算机系统在同一在同一时辰或者同一辰或者同一时间间隔隔 内内进展多种运算或操作展多种运算或操作 只需在只需在时间上相互重叠,就存在并行性上相互重叠,就存在并行性同同时性:两个或两个以上的事件在同一性:两个或两个以上的事件在同一时辰辰发生并并发性:两个或两个以上的事件在同一性:两个或两个以上的事件在同一时间间隔内隔内发生 1.5.1 并行性的概念并行性的概念  Computer Architecture1.51.5 计算机体系构造中并行性的开展计算机体系构造中并行性的开展 数据并行数据并行 〔如:多个数据同〔如:多个数据同时被被处置〕置〕 控制并行控制并行 〔如:多条指令同〔如:多条指令同时被被执行〕行〕 计算机中并行性分两类:计算机中并行性分两类:  Computer Architecture1.51.5 计算机体系构造中并行性的开展计算机体系构造中并行性的开展 数据并行,并行性等数据并行,并行性等级级从低到高可分从低到高可分为为:: 字串位串字串位串 字串位并字串位并 字并位串字并位串 全并行全并行 Computer Architecture1.51.5 计算机体系构造中并行性的开展计算机体系构造中并行性的开展字串位串:每次只对一个字的一位进展处置。

      字串位串:每次只对一个字的一位进展处置                    最根本的串行处置方式最根本的串行处置方式                    不存在并行性不存在并行性字串位并:同时对一个字的全部位进展处置,不字串位并:同时对一个字的全部位进展处置,不                     同字之间是串行的同字之间是串行的                     开场出现并行性开场出现并行性字并位串:字并位串: 同时对许多字的同一位〔称为位片〕同时对许多字的同一位〔称为位片〕                     进展处置进展处置                     具有较高的并行性具有较高的并行性全并行:全并行:     同时对许多字的全部位或部分位进展处同时对许多字的全部位或部分位进展处                     理                     最高一级的并行最高一级的并行 Computer Architecture1.51.5 计算机体系构造中并行性的开展计算机体系构造中并行性的开展控制并行,并行性等控制并行,并行性等级从低到高可分从低到高可分为:: 指令内部并行指令内部并行 指令指令级并行并行 线程程级并行并行 义务级或或过程程级并行并行 作作业或程序或程序级并行并行 Computer Architecture1.51.5 计算机体系构造中并行性的开展计算机体系构造中并行性的开展指令内部并行:单条指令中各微操作之间的并行。

      指令内部并行:单条指令中各微操作之间的并行指令级并行:指令级并行:    并行执行两条或两条以上的指令并行执行两条或两条以上的指令线程级并行:线程级并行:    并行执行两个或两个以上的线程并行执行两个或两个以上的线程                             通常是以一个进程内派生的多个通常是以一个进程内派生的多个                             线程为调度单位线程为调度单位义务级或过程级并行:义务级或过程级并行:                            并行执行两个或两个以上的过程并行执行两个或两个以上的过程                            或义务〔程序段〕,以子程序或或义务〔程序段〕,以子程序或                            进程为调度单元进程为调度单元作业或程序级并行:作业或程序级并行:                            并行执行两个或两个以上的作业并行执行两个或两个以上的作业                            或程序 Computer Architecture1.5.2 提高并行性的技术途径提高并行性的技术途径1. 三种途径三种途径    (1) 时间时间重叠重叠           多个多个处处置置过过程在程在时间时间上相互上相互错错开,开,轮轮番重迭地运番重迭地运用同一套硬件用同一套硬件设备设备的各个部分,以加快硬件周的各个部分,以加快硬件周转转而博而博得速度。

      得速度      (2) 资资源反复源反复           根据根据“以数量取以数量取胜胜〞的原那么,〞的原那么,经过经过反复地反复地设设置置资资源,尤其是硬件源,尤其是硬件资资源,以大幅度提高源,以大幅度提高计计算机系算机系统统的的性能1.51.5 计算机体系构造中并行性的开展计算机体系构造中并行性的开展 Computer Architecture(3) 资源共享资源共享        这是一种软件方法,它使多个义务按一定时间顺这是一种软件方法,它使多个义务按一定时间顺序轮番运用同一套硬件设备序轮番运用同一套硬件设备目的:普通为提高资源利用率而非性能目的:普通为提高资源利用率而非性能1.51.5 计算机体系构造中并行性的开展计算机体系构造中并行性的开展 Computer Architecture2. 单机系统中并行性的开展单机系统中并行性的开展  1) 时间重叠:在开展高性能单处置机过程中起着主导时间重叠:在开展高性能单处置机过程中起着主导作用作用,其实现根底为部件功能公用化其实现根底为部件功能公用化 把一件任务按功能分割为假设干相互联络的部分;把一件任务按功能分割为假设干相互联络的部分; 把每一部分指定给专门的部件完成;把每一部分指定给专门的部件完成; 然后按时间重叠原那么把各部分执行过程在时间然后按时间重叠原那么把各部分执行过程在时间  上重叠起来,使一切部件依次分工完成一组同样上重叠起来,使一切部件依次分工完成一组同样  的任务。

      的任务1.51.5 计算机体系构造中并行性的开展计算机体系构造中并行性的开展 例如例如 对于解释指令的五个过程,就分别需求五个公用的部件,对于解释指令的五个过程,就分别需求五个公用的部件,即取指令部件即取指令部件(IF)(IF)、指令译码部件、指令译码部件(ID)(ID)、指令执行部件、指令执行部件(EX)(EX)、、访问存储器部件访问存储器部件(M)(M)和写结果部件和写结果部件(WB)(WB) Computer Architecture1.51.5 计算机体系构造中并行性的开展计算机体系构造中并行性的开展2) 资资源反复:在源反复:在单处单处置机中运用也曾置机中运用也曾经经非常普遍非常普遍多体存多体存储储器器多操作部件多操作部件通用部件被分解成假通用部件被分解成假设设干个公用部件,如加法部干个公用部件,如加法部件、乘法部件、除法部件、件、乘法部件、除法部件、逻辑逻辑运算部件等,运算部件等,而且同一种部件也可以反复而且同一种部件也可以反复设设置多个置多个;只需指令所需的操作部件空只需指令所需的操作部件空闲闲,就可以开,就可以开场执场执行行这这条指令条指令〔 〔假假设设操作数已操作数已预备预备好的好的话话〕 〕。

      实现实现了指令了指令级级并行  Computer Architecture1.51.5 计算机体系构造中并行性的开展计算机体系构造中并行性的开展阵阵列列处处置机置机〔 〔并行并行处处置机置机〕 〕 设设置置许许多一多一样样的的处处置置单单元,元,让让它它们们在在同一个控制器的指同一个控制器的指挥挥下,按照同一条下,按照同一条指令的要求,指令的要求,对对向量或数向量或数组组的各元素的各元素同同时进时进行同一操作,就构成了行同一操作,就构成了阵阵列列处处置机 Computer Architecture 3)资资源源共共享享::分分时时系系统统    在在单单处处置置机机上上模模拟拟多多个个        独独立立系系统统的的功功能能,,构构成成所所谓谓虚虚拟拟机机的的概概             念 1.51.5 计算机体系构造中并行性的开展计算机体系构造中并行性的开展 Computer Architecture1.51.5 计算机体系构造中并行性的开展计算机体系构造中并行性的开展 多机系多机系统统遵照遵照时间时间重叠、重叠、资资源反复、源反复、资资源共享源共享原理,开展原理,开展为为3种不同的多种不同的多处处置机:置机: 同构型多同构型多处处置机置机 异构型多异构型多处处置机置机 分布式系分布式系统统1.5.4 多机系统中并行性的开展多机系统中并行性的开展  Computer Architecture1.51.5 计算机体系构造中并行性的开展计算机体系构造中并行性的开展耦合度耦合度:  反映多机系反映多机系统中各机器之中各机器之间物理物理衔接接的的严密程度和交互作用才干的密程度和交互作用才干的强弱。

      弱严密耦合系密耦合系统〔直接耦合系〔直接耦合系统〕:在〕:在这种系种系统中,中,计算机之算机之间的物理的物理衔接的接的频带较高,普通高,普通是是经过总线或高速开关互或高速开关互连,可以共享主存可以共享主存表表现方式:方式:         高可靠系高可靠系统        高性能系高性能系统 Computer Architecture1.61.6 计算机体系构造中并行性的开展计算机体系构造中并行性的开展   松散耦合系统〔间接耦合系统〕:普通是经过通道松散耦合系统〔间接耦合系统〕:普通是经过通道或通讯线路实现计算机之间的互连,可以共享外存或通讯线路实现计算机之间的互连,可以共享外存设备〔磁盘、磁带等〕机器之间的相互作用是在设备〔磁盘、磁带等〕机器之间的相互作用是在文件或数据集一级上进展的文件或数据集一级上进展的表现方式:表现方式:         多台计算机和共享的外存设备衔接,不同机器多台计算机和共享的外存设备衔接,不同机器之间实现功能上的分工〔功能公用化〕,机器处置之间实现功能上的分工〔功能公用化〕,机器处置的结果以文件或数据集的方式送到共享外存设备,的结果以文件或数据集的方式送到共享外存设备,供其他机器继续处置。

      供其他机器继续处置        计算机网络,经过通讯线路衔接,实现更大范计算机网络,经过通讯线路衔接,实现更大范围的资源共享围的资源共享  Computer Architecture三种途径三种途径 (1) 时间重叠时间重叠公用外围处置机〔松散耦合系统公用外围处置机〔松散耦合系统 〕〕高级言语编译处置机、数据库处置机高级言语编译处置机、数据库处置机异构型多处置机系统异构型多处置机系统 (2) 资源反复资源反复容错多处置机容错多处置机 ( 严密耦合系统严密耦合系统 )同构型多处置机系统同构型多处置机系统1.61.6 计算机体系构造中并行性的开展计算机体系构造中并行性的开展 Computer Architecture(3) 资源共享资源共享部分计算机网〔松散耦合系统〕部分计算机网〔松散耦合系统〕分布处置系统分布处置系统1.61.6 计算机体系构造中并行性的开展计算机体系构造中并行性的开展 把假设干个具有独立功能的处置机〔或把假设干个具有独立功能的处置机〔或计算机〕相互衔接起来,在操作系统全盘控计算机〕相互衔接起来,在操作系统全盘控制下,一致协调地任务,而最少依赖集中的制下,一致协调地任务,而最少依赖集中的程序、数据或硬件。

      程序、数据或硬件 同构型多处置机同构型多处置机工程工程异构型多处置机异构型多处置机分布处置系统分布处置系统提高系统性能提高系统性能(可靠性、速度可靠性、速度)目的目的提高系统运用效提高系统运用效率率兼兼顾效率与性能效率与性能 资源反复资源反复技术技术途径途径时间重迭时间重迭(功能公用化功能公用化)资源共享资源共享(网络化网络化)同类型同类型(同等功能同等功能)组成组成不同类型不同类型(不同功能不同功能)不限制不限制义务分布义务分布分工方式分工方式功能分布功能分布硬件、软件、数据硬件、软件、数据等各种资源分布等各种资源分布一个作业由多机一个作业由多机协同并行地完成协同并行地完成任务方式任务方式一个作业由多机一个作业由多机协同串行地完成协同串行地完成一个作业由一台处置机一个作业由一台处置机完成,必要时才恳求它完成,必要时才恳求它机协作机协作常采用浮动控制方式常采用浮动控制方式控制方式控制方式采用公用控制方采用公用控制方式式分布控制方式分布控制方式严密耦合严密耦合耦合度耦合度严密、松散耦合严密、松散耦合松散、严密耦合松散、严密耦合快速性、灵敏性、可重构快速性、灵敏性、可重构性性对互连网络的要对互连网络的要求求公用性公用性快速、灵敏、简单、通快速、灵敏、简单、通用用三种类型多处置机比较三种类型多处置机比较 。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.