电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本
换一换
首页 金锄头文库 > 资源分类 > DOC文档下载
分享到微信 分享到微博 分享到QQ空间

计算机体系结构总结

  • 资源ID:34051968       资源大小:207.90KB        全文页数:9页
  • 资源格式: DOC        下载积分:10金贝
快捷下载 游客一键下载
账号登录下载
微信登录下载
三方登录下载: 微信开放平台登录   支付宝登录   QQ登录  
二维码
微信扫一扫登录
下载资源需要10金贝
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
如填写123,账号就是123,密码也是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

 
账号:
密码:
验证码:   换一换
  忘记密码?
    
1、金锄头文库是“C2C”交易模式,即卖家上传的文档直接由买家下载,本站只是中间服务平台,本站所有文档下载所得的收益全部归上传人(卖家)所有,作为网络服务商,若您的权利被侵害请及时联系右侧客服;
2、如你看到网页展示的文档有jinchutou.com水印,是因预览和防盗链等技术需要对部份页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有jinchutou.com水印标识,下载后原文更清晰;
3、所有的PPT和DOC文档都被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;下载前须认真查看,确认无误后再购买;
4、文档大部份都是可以预览的,金锄头文库作为内容存储提供商,无法对各卖家所售文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;
5、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据;
6、如果您还有什么不清楚的或需要我们协助,可以点击右侧栏的客服。
下载须知 | 常见问题汇总

计算机体系结构总结

计算机体系结构重点1、并行线索:时间,空间的并行并行性:计算机系统在同一时刻或者同一时间间隔内进行多种运算或操作2、资源重复,时间重叠,资源共享资源重复:通过重复设置硬件资源,大幅度提高计算机系统的性能。 (多处理机系统)时间重叠:多个处理过程在时间上相互错开,轮流、重叠地使用同一套硬件设备的各个部分。 (流水线)资源共享:软件方法,使多个任务按一定时间顺序轮流使用同一套硬件设备。 (多道程序、分时系统)3、数据并行:字、位(1)流水线的指令并行(2)超流水线:细分时间(3)超标量流水线:重复设置流水线(4)向量机:流水线,数据并行(5)提高 cache 命中率(6)多机系统,线程级并行(CMP)4、局部性(1)存储系统原理(2)提高 cache 命中率(victim cache ,伪相联 cache)(3)cache 有好程序(空间、时间局部性)有些去年的题都没有被老师的提纲点出来,崩溃了。 。 。 。蓝色的没查到,晕了。 。 。 。红色的太庞大,懒了。 。 。 。-卖萌了 by 备(分章解读)一、概论1、计算机体系结构与组成原理,实现的关系,基本概念(兼容、模拟、仿真)层次:微程序语言、机器语言、 (操作系统虚拟机) 、汇编语言、高级语言、应用语言硬件逻辑优点:速度快虚拟机:由软件实现的机器,以区别于由硬件/固件实现的物理机器计算机系统结构:程序员所看到的计算机属性,即概念性结构与功能特性计算机组成:计算机系统结构的逻辑实现,包含物理机器中的数据通道和控制信号的组成以及逻辑设计等。计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。计算机系统机构的研究对象:计算物理系统的抽象和定义;具体包括:数据表示;寻址方式;寄存器定义;指令系统;存储结构;中断系统;机器工作状态定义和切换;I/O 系统;总线结构;系统安全与保密;结构、组成和实现三者关系:结构是计算机系统的软、硬件界面;组成是计算机系统结构的逻辑实现;实现是九三级组成的物理实现;软件兼容:同一个软件可以不加修改地运行于系统结构相同的各个机器上,而且所得结果一致;向上(下)兼容:低(高)档机器的目标程序不加修改就可以运行于高(低)档机器。一般向上兼容。前后兼容:指按系列机投放市场先后,实现软件兼容。一般向后兼容。模拟:用机器语言解释实现程序移植的方法;(用机器语言,程序在主存储器)仿真:直接用微程序去解释另一种机器的指令系统;(用微程序,程序在微程序存储器)2、Amdahl(定律加速比公式)S= SiFi1Fi:可改进比例Si:部件加速比应用见大题;3、计算机体系结构设计的主要方法(三个方面。软硬件平衡)(1)确定用户对计算机系统的功能、价格和性能要求(2)软、硬件平衡:性价比与实现的难易程度(3)系统结构设计应符合今后发展方向4、计算机体系结构的评价标准( ,CPI ,平均 CPI,MIPS)时 钟 频 率时 间CPI*PUCPI: (IC:指令数;CPI:每条指令周期)niiiICCPI1)*(5、冯诺依曼计算机(顺序执行(串行执行) ,程序存储,集中控制,以 ALU 为核心)控制流计算机(1)以 ALU 为中心(2)在存储器中,指令和数据同等对待(3)存储器是按地址访问、按顺序线性编址的一维结构,每个存储单元的位数是固定的(4)指令是顺序执行的(5)指令由操作码和地址码组成(6)指令和数据均以二进制编码表示,采用二进制运算6、体系结构分类方法(Flynn 分类法:指令流,数据流,多倍性)Flynn:按指令流和数据流的多倍性进行分类。指令流:机器执行的指令序列数据流:由指令流调用的数据序列多倍性:在系统受限的部件上,同时处于同一执行阶段的指令或数据的最大数目SISD(单指令流单数据流(缩写) ):传统的顺序处理计算机、标量流水线处理机SIMD:阵列处理机、向量流水线处理机、相联处理机MISD:无MIMD:大多数多处理机和多计算机系统;(处理机之间相互作用程度高,紧密耦合)7、非冯诺依曼计算机(数据流驱动、需求驱动)二、流水线(并行概念)1、流水线基本概念(如何实现并行、多个取指、分析、执行部件)(1)流水线:加快指令的解释过程,提高指令的并行性(2)如何实现:(重叠技术)取指分析子过程在指令分析器里完成,执行子过程在执行部件实现。这两个部件是独立的。如果分析子过程所需时间=执行子过程所需时间(分析周期=执行周期) ,那么执行部件里处理第 n 条指令的执行子过程时,分析器里处理的是第 n+1 条指令的分析子过程。2、先行控制技术(预处理、缓冲) ,锁存技术(1)先行控制技术:缓冲+预处理技术结合;通过对指令流和数据流的先行控制,尽量使指令分析部件和执行部件处于忙碌状态。(2)缓冲技术:在工作速度不固定的两个功能部件之间设置缓冲器,用以平滑他们的工作(3)预处理技术:预取指令、对指令进行加工以及预取操作数等。3、指令并行的空间并行和时间并行性:时空图*主要见大题时钟周期指令1 2 3 4 5 6 7 8 9指令 k IF ID EX MEM WB指令 k+1 IF ID EX MEM WB指令 k+2 IF ID EX MEM WB指令 k+3 IF ID EX MEM WB指令 k+4 IF ID EX MEM WBIF-MEM 可能冲突ID-WB 可能冲突4、线性流水线(动静态)的性能分析(加速比、吞吐率、效率、瓶颈)(1)静态流水线:在同一时间段内,多功能流水线中的各段只能按同一种功能的连接方式工作(2)动态流水线:-可以按照不同的方式连接,同时执行多种功能(3)线性流水线:流水线的各段串行连接,没有反馈回路(4)非线性流水线:-,还有反馈回路(5)吞吐率(TP):单位时间内流水线所完成的任务数量或输出结果的数量 个 任 务 所 用 时 间 )( 完 成 任 务 数n)(kTP),max(12kttL)()1(1为 最 慢 的 一 段 时 间实 际 吞 吐 率 : jmi ji tntTP(6)加速比(S):完成同样一批任务,不用流水线所用时间与使用之比 ksT(流水线各段时间相等)1nS(流水线各段时间相等)klimax )()1(S1为 最 慢 的 一 段 时 间实 际 加 速 比 : jjmiiiitnt(7)效率(E):流水线中的设备实际使用时间与整个运行时间的比指令周期 取处 存处 修改IF(取指令周期) 存储器 指令寄存器 IR PC+=4ID(指令译码 /读寄存器周期) IR 寄存器编号、通用寄存器组 读出操作数EX(执行/有效地址计算周期) - - -MEM(存储器访问/分支完成周期) 存储器(load 指令) (store 指令)存储单元 PC(分支指令)WB(写回周期) 通用寄存器组(流水线各段时间相等)121 nkTtekL(流水线各段时间相等)21tEk(流水线各段时间相等)1limaxnk(各段时间不等)),ax()1(211 kkiikiitttEL(8)细分瓶颈段:把大的瓶颈分为若干等时间的小的段(9)重复设置瓶颈段:把连续几次大的瓶颈并行5、非线性流水线的调度问题(性能分析)*主要见大题,以下是会做的方便记的自我总结的方法(1)禁止表 F:每行 X(或)相隔距离组合(2)冲突向量:从右向左书写禁止表(有的地方写 1,没的写 0)(3)状态有向图:不断右移冲突向量,出 1 继续移,出 0 按位或,得新状态再继续(4)最优调度策略:所有策略列表,算平均时间间隔,如策略(x,y,z)时间为(x+y+z)t/3(5)实际吞吐率、加速比、效率:按照定义来算;吞吐率: 个 任 务 所 用 时 间 )( 完 成 任 务 数n)(kTP加速比: ksS效率:流水线中的设备实际使用时间与整个运行时间的比6、(1)流水线相关性分析(数据,名,控制相关)i,j,k 指令两两数据相关:,:,:,i,j 指令名相关(反相关、输出相关):,:,S1 与 p1 控制相关:if p1 S1;(2)相应引起的冒险(冲突) (数据,结构,控制冒险)结构冲突:因硬件资源满足不了指令重叠执行的要求而发生的冲突(硬件资源冲突)数据冲突:当指令在流水线中重叠执行时,因需要用到前面指令的执行结果而发生的冲突(数据相关&名相关)控制冲突:流水线遇到分支指令和其他会改变 PC 值得指令所引起的冲突(控制相关)(3)处理方式*(见大题)数据相关,结构冒险(写读、读写、写写)推后执行(加入 stall)设置相关专用通路(定向技术)静态调度技术(编译技术、乱序)动态调度技术(Tomasulo 算法->要求不高,理解;寄存器换名,动态监测,保留栈)控制相关延迟转移提前形成条件码编译技术(分支失败、分支成功、延迟槽(ReOrderBuffer) )动态转移预测技术(分支历史表 BHT)7、精确断点与不精确断点(1)不精确断点:流水线可以不断流;需要的硬件比较少,控制逻辑比较简单;中断响应时间加长;(2)精确断点:流水线一定中断;要设置一定数量的后援寄存器(3)定义:对于输入输出设备的中断服务,使中断指令现场和其后已进入流水线的指令得到保护,并保证流水线可以恢复中断。8、超标量与超流水线处理机(概念指令并行度(ILP) ,区别,指令相关性分析,超标量发射性能分析)(1)超流水线处理机:一个时钟周期内能够分时流出多条指令的处理机(指令流水线级数为 8+)(2)超标量处理机:使用了多指令流水线,每个时钟周期发射多条指令并产生多个结果(3)不同:处理机不同超流水线处理机 超标量处理机并行性 时间并行性 空间并行性指令发射度 2-5ILP m>ILP>1(m 条指令 )9、循环展开和指令调度(1)循环展开:是一种牺牲程序的尺寸来加快程序的执行速度的优化方法。要求不高,概念,方式1、向量机的基本概念和原理:流水线,多处理机(向量指令、内部寄存器) ,链接技术,半性能向量长度(1)向量处理机:设置了向量数据表示和相应的向量指令的流水线处理机(2)半性能向量长度 n1/2:向量处理机的运行性能达到其峰值性能 R的一半时所必须满足的向量长度。越小越好(3)流水线:讲一个重复的时序过程分解为若干子过程,而每个子过程都可以有效地在其专用功能上与其他子过程同时执行。(4)多处理机:包含两个或两个以上功能大致相同的处理器;所有处理器共享一个公共内存;所有处理器共享 I/O 通道、控制器和外围设备;整个系统由统一的操作系统控制,在处理器和程序之间实现作业、任务、程序段、数组和数组元素等各级的全面并行。2、满足运算器带宽要求的存储系统(存储器-存储器结构,寄存器- 寄存器结构)(1)存储器-存储器结构:主存由多个模块构成,流水处理部件与主存系统之间有三条独立的数据通路(两条输入,一条输出) ,个数据通路可以同时工作,但一个存储模块在某一个时刻只能为一个通路服务。工作特点:源向量都取自主存,且结果向量也存放到主存中(2)寄存器-寄存器结构:主存系统和向量功能部件之间插入了一个小容量的高速向量寄存器组,可以得到较大的带宽。大部分操作在向量寄存器之间进行,减少访存次数,降低对主存带宽要求。工作特点:源向量都取自向量寄存器,且结果也存放到向量寄存器中3、向量处理方式(横向,纵向,纵横向):D=A*(B+C)(1)横向处理方式:for(i=1,i把长向量分成长度固定的段,然后循环分段处理,每一次循环只处理一个向量段。(3)向量递归:对一维数组

注意事项

本文(计算机体系结构总结)为本站会员(第***)主动上传,金锄头文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即阅读金锄头文库的“版权提示”【网址:https://www.jinchutou.com/h-59.html】,按提示上传提交保证函及证明材料,经审查核实后我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.