电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本
换一换
首页 金锄头文库 > 资源分类 > PPT文档下载
分享到微信 分享到微博 分享到QQ空间

计算机体系结构1讲义

  • 资源ID:108280860       资源大小:1,005.50KB        全文页数:29页
  • 资源格式: PPT        下载积分:30金贝
快捷下载 游客一键下载
账号登录下载
微信登录下载
三方登录下载: 微信开放平台登录   支付宝登录   QQ登录  
二维码
微信扫一扫登录
下载资源需要30金贝
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
如填写123,账号就是123,密码也是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

 
账号:
密码:
验证码:   换一换
  忘记密码?
    
1、金锄头文库是“C2C”交易模式,即卖家上传的文档直接由买家下载,本站只是中间服务平台,本站所有文档下载所得的收益全部归上传人(卖家)所有,作为网络服务商,若您的权利被侵害请及时联系右侧客服;
2、如你看到网页展示的文档有jinchutou.com水印,是因预览和防盗链等技术需要对部份页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有jinchutou.com水印标识,下载后原文更清晰;
3、所有的PPT和DOC文档都被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;下载前须认真查看,确认无误后再购买;
4、文档大部份都是可以预览的,金锄头文库作为内容存储提供商,无法对各卖家所售文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;
5、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据;
6、如果您还有什么不清楚的或需要我们协助,可以点击右侧栏的客服。
下载须知 | 常见问题汇总

计算机体系结构1讲义

计算机体系结构,第 1 周 第 1 节课 授课教师: 陈天洲,计算机系统结构 -定量设计方法,陈天洲 Tzchen A,教材,计算机体系结构 石教英 浙江大学出版社 Computer Architecture -A Quantitative Approach 参考书 计算机系统结构 郑纬民 汤志忠 清华大学出版社,主要特点,强调性能价格比 定量的设计分析方法 主要介绍RISC设计思想和技术 强调编译技术对系统结构的影响,第一章 计算机设计基础 第二章 指令系统设计 第三章 CPU设计 第四章 流水线技术 第五章存储器层次结构 第六章 输入输出系统 第七章 网络并行计算机系统 第八章 多处理机系统,主要内容,第一章 计算机设 计基础,1.1 计算机系统结构设计的重要性 1.2 计算机设计的任务 1.3 实现技术及计算机应用的发展趋势 1.4 计算机定量设计原则 1.5 性能测量与分析报告 1.6 计算机的价格构成及发展趋势,1.1 计算机系统结构设计的重要性 一. 计算机的发展历史,二. 计算机飞速发展的原因,前25年: 制造计算机的技术(器件技术) 计算机设计技术(系统结构) 70年代 小型机和大型机占优势 70年代末 微处理器发展迅速(快速利用IC成果) 软件变化 汇编程序设计几乎不用了 标准OS出现 80年代中期 新的RISC结构出现 性能每年提高50% 系统结构对计算机发展的作用日益增大,快速增长的结果: * 对用户来说,计算机的功能增强 1993年POWER-2高端工作站 1988年的CRA Y-MP * 基于微处理器的计算机占优势,覆盖了计算机设计的所有范围 PC、工作站成主要产品 小型机(门阵列)微处理器的服务器 大型机 微处理器组成的多处理器机 超级计算机 微处理器(MPP),三. 计算机设计的两大发展趋势,强调系统结构的革新 充分有效地利用技术进步(器件),1.2 计算机设计的任务,确定用户的目标(需求功能, 价格, 性能) 确定计算机的属性(计算机系统结构) 指令集设计(程序员可见的指令集, 软硬件界面) 组成设计(存储系统,总线结构,CPU内部设计) 硬件设计(详细逻辑设计, IC设计,封装 ,电源 ,冷却),设计优化 在一定价格限度下追求性能最优(性能/价格比) 可靠性, 容错性(事务处理) 编译和OS优化 实现技术及机器应用的发展趋势(性能价格),计算机功能需求,应用领域 特殊目的 科学计算 通用目的 商业应用 软件兼容级别 高层语言兼容 目标码或二进制兼容 操作系统需求 地址空间大小 存储系统管理 标准,1.3 实现技术和计算机应用的发展趋势,一. 计算机应用的发展趋势,* 程序及数据所需的存储容量日益增加,1.52倍/年 地址位数: 0.51bit/年,* 高级语言取代汇编语言,编译器成为用户和机器的界面,作用日趋重要,完成新的功能 提高程序运行效率,IC逻辑技术 晶体管密度 50% /年 约 4倍/3年 半导体DRAM 密度 60% /年 约 4倍/3年 访问周期 1/3 每 10年 磁盘技术 密度 50% /年 约 4倍/3年 访问周期 1/3 每 10年 成本下降速度 = 密度提高速度,二 . 实现技术的三大发展趋势,离散性,设计时应采用机器投放市场时的技术,这样的产品才会有价格性能优势,1.4 计算机的定量设计原则,一.高频事件高速处理(Make The Common Case Fast),* 提高高频事件的执行速度,有助于提高整体性能,* 高频事件往往是简单事件,更易于提高速度,例1. 常用指令用硬件实现 , 复杂杂指令用软件实现,例2. 优先考虑不溢出的情况,高频事件尽量高速 低频事件保证正确,?,二.Amdahl定律,(1),例 春游,交通工具 步行 自行车 跑车 出租车 赛车,速度 (km/h) 4 10 20 50 200,相对 加速比 1 2.5 5 12.5 50,后段 用时(h) 5 2 1 0.4 0.1,全程 用时(h) 6 3 2 1.4 1.1,全程加速比(h) 1 2 3 4.3 5.45,= 6,若已知以下两个条件:,(1) F -任务在可改进部件上的执行时间 在总执行时间 中的百分比,(2) S -改进后部件性能提高的倍数 (部件性能加速比),改进前,2. 指明了设计原则: 按各部分所占的时间比例来分配资源,3. 指出了两种改进设计提高性能的方法:,* 优先考虑高频事件, 使之尽量快速实现 * 减小(1-F), 进一步提高高频事件的使用频度,4. 给出了定量比较不同设计方案的方法,Amdahl 定律的作用,课后习题1.2,例1 软硬件实现的选择,已知某商用计算机拟增加字符串操作功能 . 若用软件实现, 与无字符 串操作相比,速度提高4倍, CPU成本提高1/5倍;若用硬件实现, 则速度 是原来的100倍,CPU成本是原来的5倍. 由实验测得, 字符串操作占总 运行时间的50%. CPU成本约占整机成本的1/3.你选用哪种设计方案?,软件方法,=1.66,C=2/3 + 1/3* (1+1/5) =1.07,C/S = 1.07/1.66 = 0.64,硬件方法,=1.98,C=2/3 + 1/3* 5 =2.33,C/S = 1.07/1.66 = 1.18,例2.FP SQRT的实现方法比较,已知某一基准测试程序中FPSQRT操作占20%的运行时间. 一种实 现方法是引入FPSQRT硬件, 它能使运算速度提高9倍; 另一种方法 是把所有浮点操作的速度提高到原来的2倍. 已知运行时间的50% 是在执行浮点操作, 问哪种方法更好.,?,三. CPU性能计算公式,CPUtime = 程序执行所用的CPU时钟周期数* 时钟周期(CC),= 程序执行所用的CPU时钟周期数 / 时钟频率(CR) (1),若已知程序动态执行的指令条数(IC), 则可得:,程序执行所用的CPU时钟周期数 平均指令执行时钟周期数(CPI) = 程序动态执行的指令总条数,由此可得公式的另一种表示方式:,CPUtime = IC * CPI * CC (2),= IC * CPI / CR,CPUtime 计算公式的意义:,1. CPU性能依赖于三个参量: IC, CPI, CC; 2. 说明改进CPU性能的三种途径. 尽管同时缩小三个参数是不可能的,而且改变其 中的一个都可能因此影响其他两个参量,但改变这三 个参数的技术途径是独立的: CC -硬件和组成技术 CPI-组成和指令集系统结构 IC -指令集系统结构和编译技术,若已知每种指令执行所需的时钟周期数(CPI i),和每种 指令的动态执行次数(IC i),则可得CPUtime的第三种表示 形式:,优点,在Amdahl定律中, F的计算是很困难的, 而统计IC 或测量CPI 却相对容易得多.,例1 计算CPUtime,已知某计算机的指令使用频度和各类指令的CPI如下:,例2 FP SQRT的实现方法比较,已知测量数据如下: FP操作指令的使用频度= 25%, FP指令的平均 CPI = 4.0, 其他指令的平均CPI = 1.33, FPSQRT的使用频度=2%, FPSQRT的CPI=20.一种方法是设法把FPSQRT的CPI减少到 2; 另一种方法是使所有FP指令的平均CPI减少到 2. 问哪种方案更好?,例3 比较两台机器的条件转移的实现方法,机器A: 一条比较指令+一条转移 条件转移指令频度=20%,机器B: 一条比较且转移指令 CCb = 1.25 *CCa,已知: 条件转移指令平均 CPI=2, 其他指令平均 CPI=1 问: 以CPUtime来衡量, 哪台机器的性能更好?,CPI a = ( 20% * 2 )+ (80% * 1) =1.2,CPUtime a = ICa*1.2*CCa = 1.2* ICa*CCa,因无比较指令, ICb = 0.8*ICa; 条件转移频度=20% / 80%=25%,CPI b = ( 25% * 2 )+ (75% * 1) =1.25,CPUtime b = ICb*1.25*CCb =0.8* ICa *1.25* 1.25 *CCa = 1.25 * ICa*CCa,1.1,1.1,1.1,四.局部性原理,90/10局部性规则 90%的运行时间是花费在执行10%的指令上 时间局部性 若某一数据被引用,则不久以后它可能被再次引用 空间局部性 若某一数据被引用,则它附近的数据不久也将被引用,代码的局部性特征更明显,

注意事项

本文(计算机体系结构1讲义)为本站会员(今***)主动上传,金锄头文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即阅读金锄头文库的“版权提示”【网址:https://www.jinchutou.com/h-59.html】,按提示上传提交保证函及证明材料,经审查核实后我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.