
计算机组成原理第四版课后答案白中英.pdf
40页计算机组成原理(第四版)课后习题参考答案 计算机组成原理(第四版)课后习题参考答案 白中英 戴志涛 李贞 等 第一章 ..............................................................................................................................................2 第二章 ..............................................................................................................................................4 第三章 ............................................................................................................................................15 第四章 ............................................................................................................................................20 第五章 ............................................................................................................................................22 第六章 ............................................................................................................................................28 第七章 ............................................................................................................................................32 第八章 ............................................................................................................................................35 第九章 ............................................................................................................................................37 第十章 ............................................................................................................................................39 1计算机组成原理(第四版)课后习题参考答案 第一章第一章 1. 模拟计算机的特点是数值由连续量来表示,运算过程也是连续的。
数字计算机的主要特点是按位运算,并且不连续地跳动计算模拟计算机用电压表示数据,采用电压组合和测量值的计算方式,盘上连线的控制方式,而数字计算机用数字 0 和 1 表示数据,采用数字计数的计算方式,程序控制的控制方式数字计算机与模拟计算机相比,精度高,数据存储量大,逻辑判断能力强 2. 数字计算机可分为专用计算机和通用计算机,是根据计算机的效率、速度、价格、运行的经济性和适应性来划分的 3. 科学计算、自动控制、测量和测试、信息处理、教育和卫生、家用电器、人工智能 4. 主要设计思想是:采用存储程序的方式,编制好的程序和数据存放在同一存储器中,计算机可以在无人干预的情况下自动完成逐条取出指令和执行指令的任务;在机器内部,指令和数据均以二进制码表示,指令在存储器中按执行顺序存放主要组成部分有::运算器、逻辑器、存储器、输入设备和输出设备 5. 存储器所有存储单元的总数称为存储器的存储容量每个存储单元都有编号,称为单元地址如果某字代表要处理的数据,称为数据字如果某字为一条指令,称为指令字 6. 计算机硬件可直接执行的每一个基本的算术运算或逻辑运算操作称为一条指令,而解算某一问题的一串指令序列,称为程序。
7. 取指周期中从内存读出的信息流是指令流,而在执行器周期中从内存读出的信息流是数据流 8. 半导体存储器称为内存,存储容量更大的磁盘存储器和光盘存储器称为外存,内存和外存共同用来保存二进制数据运算器和控制器合在一起称为中央处理器,简称 CPU,它用来控制计算机及进行算术逻辑运算适配器是外围设备与主机联系的桥梁,它的作用相当于一个转换器,使主机和外围设备并行协调地工作 9. 计算机的系统软件包括系统程序和应用程序系统程序用来简化程序设计,简化使用方法,提高计算机的使用效率,发挥和扩大计算机的功能用用途;应用程序是用户利用计算机来解决某些问题而编制的程序 10. 在早期的计算机中, 人们是直接用机器语言来编写程序的, 这种程序称为手编程序或目的程序; 后来, 为了编写程序方便和提高使用效率, 人们使用汇编语言来编写程序,称为汇编程序;为了进一步实现程序自动化和便于程序交流,使不熟悉具体计算机的人也能很方便地使用计算机, 人们又创造了算法语言, 用算法语言编写的程序称为源程序,源程序通过编译系统产生编译程序,也可通过解释系统进行解释执行;随着计算机技术的日益发展,人们又创造出操作系统;随着计算机在信息处理、情报检索及各种管理系统中应用的发展,要求大量处理某些数据,建立和检索大量的表格,于是产生了数据库管理系统。
11. 第一级是微程序设计级,这是一个实在的硬件级,它由机器硬件直接执行微指令;第二级是一般机器级,也称为机器语言级,它由程序解释机器指令系统;第三级是操作系统级,它由操作系统实现;第四级是汇编语言级,它给程序人员提供一种符号形式语言,以减少程序编写的复杂性;第五级是高级语言级,它是面向用户的,为方便用户编写应用程序而设置的用一系列的级来组成计算机的接口对于掌握计算机是如何组成的提供了一种好的结构和体制,而且用这种分级的观点来设计计算机对保证产生一个良好的系统结构也是很有帮助的 2计算机组成原理(第四版)课后习题参考答案 12. 因为任何操作可以由软件来实现, 也可以由硬件来实现; 任何指令的执行可以由硬件完成,也可以由软件来完成实现这种转化的媒介是软件与硬件的逻辑等价性 13. 计算机应用和应用计算机在概念上是不等价的 计算机应用是计算机学科与其他学科相结合的交叉学科, 是计算机学科的组成部分, 分为数值计算和非数值应用两大领域 应用计算机是借助计算机为实现特定的信息系统功能的手段 在计算机系统的层次结构中, 应用计算机是多级计算机系统层次结构的最终目标, 是高级语言级之上的服务层次。
3计算机组成原理(第四版)课后习题参考答案 第二章第二章 1. (1) 352(-100011)[ 35]10100011原 [ 35]11011100补 [ 35]11011101反 (2) [127]原=01111111 [127]反=01111111 [127]补=01111111 (3) 1272(-1111111)[ 127]11111111原 [ 127]10000001补 [ 127]10000000反 (4) 2.[x]补 = a0. a1a2…a6 解法一、 (1) 若a0 = 0, 则x > 0, 也满足x > -0.5 此时a1→a6可任意 (2) 若a0 = 1, 则x <= 0, 要满足x > -0.5, 需a1 = 1 即a0 = 1, a1 = 1, a2→a6有一个不为 0 解法二、 -0.5 = -0.1(2) = -0.100000 = 1, 100000 (1) 若x >= 0, 则a0 = 0, a1→a6任意即可 10000000 2(-1) [ 1]10000001原 [ 1]11111111补 [ 1]11111110反 4计算机组成原理(第四版)课后习题参考答案 [x]补 = x = a0. a1a2…a6 (2) 若 x < 0, 则 x > -0.5 只需-x < 0.5, -x > 0 [x]补 = -x, [0.5]补 = 01000000 即[-x]补 < 01000000 010000001**6210aaaa 00111111**6210aaaa 110000006210aaaa 即a0a1 = 11, a2→a6不全为 0 或至少有一个为 1(但不是“其余取 0” ) 3.字长 32 位浮点数,阶码 8 位,用移码表示,尾数 23 位,用补码表示,基为 2 (1) 最大的数的二进制表示 E = 11111111 Ms = 0, M = 11…1(全 1) Ms Es E1→E8 M21 M0 1 11111111 01111111111111111111111 (2) 最小的二进制数 E = 11111111 Ms = 1, M = 00…0(全 0) 1 11111111 1000000000000000000000 (3) 规格化范围 正最大 E = 11…1, M = 11…1, Ms = 0 8个 22个 即: 72212(1 2)2 正最小 E = 00…0, M = 100…0, Ms = 0 8个 21个 即:71222 负最大 E = 00…0, M = 011…1, Ms = 1 8个 21个 (最接近 0 的负数)即: 71222(22)2负最小 E = 11…1, M = 00…0, Ms =1 8个 22个 即:712( 1)2 规格化所表示的范围用集合表示为: [ , ][7122272212(1 2)2712( 1)2 ,] 71222(22)2 5计算机组成原理(第四版)课后习题参考答案 4.在 IEEE754 标准中,一个规格化的 32 位浮点数 x 的真值表示为: X = ( 1)s×(1.M)× 1272E(1)27/64=0.011011=1.1011× 22E= -2+127 = 125= 0111 1101 S= 0 M= 1011 0000 0000 0000 0000 000 最后表示为:0 01111101 10110000000000000000000 (2)-27/64=-0.011011=1.1011× 22E= -2+127 = 125= 0111 1101 S= 1 M= 1011 0000 0000 0000 0000 000 最后表示为:1 01111101 10110000000000000000000 5. (1)用变形补码进行计算: [x]补=00 11011 [y]补=00 00011 结果没有溢出,x+y=11110 (2) [x]补=00 11011 [y]补=11 01011 [x]补 = 00 11011 [y]补 = + 00 00011 [x+y]补= 00 11110 [x]补 = 00 11011 [y]补 = + 11 01011 [x+y]补= 00 00110 结果没有溢出,x+y=00110 (3)[x]补=11 01010 [y]补=11 111111 [x]补 = 00 01010 [y]补 = + 00 11111 [x+y]补= 11 01001 结果没有溢出,x+y=-10111 6.[x-y]补=[x]补+[-y]补 (1)[x]补=00 11011 [-y]补=00 11111 [x]补 = 00 11011 [-y]补 = + 00 11111 [x-y]补= 01 11010 结果有正溢出,x-y=11010 (2)[x]补=00 10111 [-y]补=11 00101 [x]补 = 00 10111 [-y]补 = + 11 00101 [x-y]补= 11 11100 结果没有溢出,x-y=-00100 6计算机组成原理(第四版)课后习题参考答案 (3)[x]补=00 11011 [-y]补=00 10011 [x]补 = 00 11011 [-y]补 = + 00 10011 [x-y]补= 01 01110 结果有正溢出,x-y=10010 7. (1) 用原码阵列乘法器: [x]原=0 11011 [y]原=1 11111 因符号位单独考虑,|x|=11011 |y|=11111 1 1 0 1 1 ×) 1 1 1 1 1 —————————————————————————— 1 1 0 1 1 1 1 0 1 1 1 1 0 1 1 1 1 0 1 1 1 1 0 1 1 1 1 0 1 0 0 0 1 0 1 [x×y]原=1 1101000101 用补码阵列乘法器: [x]补=0 11011 [y]补=1 00001 乘积符号位为:1 |x|=11011 |y|=11111 1 1 0 1 1 ×) 1 1 1 1 1 —————————————————————————— 1 1 0 1 1 1 1 0 1 1 1 1 0 1 1 1 1 0 1 1 7计算机组成原理(第四版)课后习题参考答案 1 1 0 1 1 1 1 0 1 0 0 0 1 0 1 [x×y]补=1 0010111011 (2) 用原码阵列乘法器: [x]原=1 11111 [y]原=1 11011 因符号位单独考虑,|x|=11111 |y|=11011 1 1 1 1 1 ×) 1 1 0 1 1 —————————————————————————— 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 0 1 0 0 0 1 0 1 [x×y]原=0 1101000101 用补码阵列乘法器: [x]补=1 00001 [y]补=1 00101 乘积符号位为:1 |x|=11111 |y|=11011 1 1 1 1 1 ×) 1 1 0 1 1 —————————————————————————— 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 1 1 1 1 1 8计算机组成原理(第四版)课后习题参考答案 1 1 1 1 1 1 1 0 1 0 0 0 1 0 1 [x×y]补=0 1101000101 8.(1) [x]原=[x]补=0 11000 [-y]∣ ∣ 补=1 00001 被除数 X 0 11000 +[-|y|]补 1 00001 ---------------------------------------------------- 余数为负 1 11001 →q0=0 左移 1 10010 +[|y|]补 0 11111 ---------------------------------------------------- 余数为正 0 10001 →q1=1 左移 1 00010 +[-|y|]补 1 00001 ---------------------------------------------------- 余数为正 0 00011 →q2=1 左移 0 00110 +[-|y|]补 1 00001 ---------------------------------------------------- 余数为负 1 00111 →q3=0 左移 0 01110 +[|y|]补 0 11111 ---------------------------------------------------- 余数为负 1 01101 →q4=0 左移 0 11010 +[|y|]补 0 11111 ---------------------------------------------------- 余数为负 1 11001 →q5=0 +[|y|]补 0 11111 ---------------------------------------------------- 余数 0 11000 故 [x÷y]原=1.11000 即 x÷y= -0.11000 余数为 0 11000 (2) [∣x]∣ 补=0 01011 [-y]∣ ∣ 补=1 00111 被除数 X 0 01011 +[-|y|]补 1 00111 ---------------------------------------------------- 余数为负 1 10010 →q0=0 9计算机组成原理(第四版)课后习题参考答案 左移 1 00100 +[|y|]补 0 11001 ---------------------------------------------------- 余数为负 1 11101 →q1=0 左移 1 11010 +[|y|]补 0 11001 ---------------------------------------------------- 余数为正 0 10011 →q2=1 左移 1 00110 +[-|y|]补 1 00111 ---------------------------------------------------- 余数为正 0 01101 →q3=1 左移 0 11010 +[-|y|]补 1 00111 ---------------------------------------------------- 余数为正 0 00001 →q4=1 左移 0 00010 +[-|y|]补 1 00111 ---------------------------------------------------- 余数为负 1 01001 →q5=0 +[|y|]补 0 11001 ---------------------------------------------------- 余数 0 00010 x÷y= -0.01110 余数为 0 00010 9.(1) x = 2-011*0.100101, y = 2-010*(-0.011110) [x]浮 = 11101,0.100101 [y]浮 = 11110,-0.011110 Ex-Ey = 11101+00010=11111 [x]浮 = 11110,0.010010(1) x+y 0 0. 0 1 0 0 1 0 (1) + 1 1. 1 0 0 0 1 0 1 1. 1 1 0 1 0 0 (1) 规格化处理: 1.010010 阶码 11100 x+y= 1.010010*2-4 = 2-4*-0.101110 x-y 0 0. 0 1 0 0 1 0 (1) + 0 0. 0 1 1 1 1 0 0 0 1 1 0 0 0 0 (1) 规格化处理: 0.110000 阶码 11110 x-y=2-2*0.110001 (2) x = 2-101*(-0.010110), y = 2-100*0.010110 [x]浮= 11011,-0.010110 [y]浮= 11100,0.010110 10计算机组成原理(第四版)课后习题参考答案 Ex-Ey = 11011+00100 = 11111 [x]浮= 11100,1.110101(0) x+y 1 1. 1 1 0 1 0 1 + 0 0. 0 1 0 1 1 0 0 0. 0 0 1 0 1 1 规格化处理: 0.101100 阶码 11010 x+y= 0.101100*2-6 x-y 1 1.1 1 0 1 0 1 + 1 1.1 0 1 0 1 0 1 1.0 1 1 1 1 1 规格化处理: 1.011111 阶码 11100 x-y=-0.100001*2-4 10.(1) Ex = 0011, Mx = 0.110100 Ey = 0100, My = 0.100100 Ez = Ex+Ey = 0111 Mx*My 0. 1 1 0 1 * 0.1 0 0 1 0 1 1 0 1 0 0 0 0 0 0 0 0 0 0 0 1 1 0 1 0 0 0 0 0 规格化: 26*0.111011 (2) Ex = 1110, Mx = 0.011010 Ey = 0011, My = 0.111100 Ez = Ex-Ey = 1110+1101 = 1011 [Mx]补 = 00.011010 [My]补 = 00.111100, [-My]补 = 11.000100 0 0 1 1 1 0 1 0 1 11计算机组成原理(第四版)课后习题参考答案 0 0 0 1 1 0 1 0 +[-My] 1 1 0 0 0 1 0 0 1 1 0 1 1 1 1 0 0 1 0 1 1 1 1 0 0 +[My] 0 0 1 1 1 1 0 0 1 1 1 1 1 0 0 0 0.0 1 1 1 1 0 0 0 0 +[My] 0 0 1 1 1 1 0 0 0 0 1 0 1 1 0 0 0.01 0 1 0 1 1 0 0 0 +[-My] 1 1 0 0 0 1 0 0 0 0 0 1 1 1 0 0 0.011 0 0 1 1 1 0 0 0 +[-My] 1 1 0 0 0 1 0 0 1 1 1 1 1 1 0 0 0.0110 1 1 1 1 1 0 0 0 +[My] 0 0 1 1 1 1 0 0 0 0 1 1 0 1 0 0 0.01101 0 1 1 0 1 0 0 0 +[-My] 1 1 0 00 1 0 0 0 0 1 0 1 10 0 0.01101 商 = 0.110110*2-6, 余数=0.101100*2-6 11. 4 位加法器如上图, 1111)()(iiiiiiiiiiiiiiiiiCBABACBABACBCABAC (1)串行进位方式 C1 = G1+P1C0 其中:G1 = A1B1 P1 = A1⊕B1(A1+B1也对) 2 3 4 0 C0 C2 = G2+P2C1 G2 = A2B2 P2 = A2⊕BC3 = G3+P3C2 G3 = A3B3 P3 = A3⊕BC4 = G4+P4C3 G4 = A4B4 P4 = A4⊕B(2)并行进位方式 C1 = G1+P1C0 C2 = G2+P2G1+P2P1C0 C3 = G3+P3G2+P3P2G1+P3P2P1C C4 = G4+P4G3+P4P3G2+P4P3P2G1+P4P3P2P1 12计算机组成原理(第四版)课后习题参考答案 12.(1)组成最低四位的 74181 进位输出为: C4 = Cn+4 = G+PCn = G+PC0, C0为向第 0 位进位 以 4 其中,G = y3+y2x3+y1x2x3+y0x1x2x3,P = x0x1x2x3,所 C5 = y4+x4C4 C6 = y5+x5C5 = y5+x5y4+x5x4C(2)设标准门延迟时间为T, “与或非”门延迟时间为 1.5T,则进位信号C0,由最低位传送至C6需经一个反相器、两级“与或非”门,故产生C0的最长延迟时间为 T+2*1.5T = 4T (3)最长求和时间应从施加操作数到ALU算起:第一片 74181 有 3 级“与或非”门(产生控制参数x0, y0, Cn+4) ,第二、三片 74181 共 2 级反相器和 2 级“与或非”门(进位链) ,第四片 74181 求和逻辑(1 级与或非门和 1 级半加器,设其延迟时间为 3T) ,故总的加法时间为: t0 = 3*1.5T+2T+2*1.5T+1.5T+3T = 14T 13.设余三码编码的两个运算数为Xi和Yi,第一次用二进制加法求和运算的和数为Si’,进位为Ci+1’,校正后所得的余三码和数为Si,进位为Ci+1,则有: Xi = Xi3Xi2Xi1Xi0 Yi = Yi3Yi2Yi1Yi0 Si’ = Si3’Si2’Si1’Si0’ FAFAFAFAFAFAFAFAsi3si2si1si0si3'si2'si1'si0'+3VXi3 Yi3Xi2 Yi2Xi1 Yi1Xi0 Yi0十进校正二进加法Ci+1 当Ci+1’ = 1 时,Si = Si’+0011 并产生Ci+1 当Ci+1’ = 0 时,Si = Si’+1101 根据以上分析,可画出余三码编码的十进制加法器单元电路如图所示。
14. 图如下: Si=AiBiCi+ AiBiCi+ AiBiCi+ AiBiCi 13计算机组成原理(第四版)课后习题参考答案 ≥1Si &Bi CiAi 15.设计思想:电路由三部分构成:ALU 完成定点加减法运算和逻辑运算,专用的阵列乘法器完成乘法运算,专用的阵列除法器完成除法操作逻辑图可参考主教材图 2.7 和图 2.9 16.设计思想:因为有八种运算,所以控制信号采用三位,S0,S1,S2加法和减法操作利用4 位补码加减法器完成;加 1 操作可以单独设计电路实现,也可以将被加数强制为+1 利用加减法器实现;传送操作可以利用加减法器实现,第二加数强制为 0;逻辑乘和取反操作可设计单独的逻辑运算电路,用与门和反相器实现;取补电路单独设计,参见主教材图 2.6;乘法操作可单独设计高速乘法器,电路参见主教材图 2.7 17. 设计思想:将 74181 的 S3~S0 及 M 等五个控制信号缩减为 S2~S0 三根信号,主教材表 2.5(功能表中的算术运算和逻辑运算相应进行简化,去除冗余操作和可替代操作: 000: 逻辑 0 001: AB 010: A+B 011: A⊕B 100: A 加 B 101: A 减 B 减 1 110: A 加 A 111: A 其中,000~011 为四种逻辑运算,100~111 为四种算术运算。
根据功能表可以很容易地设计出简化的函数发生器 14计算机组成原理(第四版)课后习题参考答案 第三章第三章 1. (1)字节M4832*220 (2)片84*28*51232*1024KK (3)1 位地址作芯片选择 2. (1) /=4(块) 262242 (2) (/)×(64 位/8 位)=32(片) 242222(3)主存共需 DRAM 芯片为:4×32=128 (片) 每个内存条有 32 片 DRAM 芯片,容量为 16M×64 位,需 24 根地址线(A23~A0)完成内 存条内存储单元寻址一共有 4 块内存条,采用 2 根高位地址线(A25~A24),通过 2:4 译码器译码产生片选信号对各模块板进行选择 3. (1)根据题意,存储总容量为 64KB,故地址总线需 16 位现使用 16K*8 位 DRAM 芯片,共需 16 片 芯片本身地址线占 14 位, 所以采用位并联与地址串联相结合的方法来组成整个存储器,其组成逻辑图如图所示,其中使用一片 2:4 译码器 (2)根据已知条件,CPU 在 1us 内至少访存一次,而整个存储器的平均读/写周期为 0.5us,如果采用集中刷新,有 64us 的死时间,肯定不行 如果采用分散刷新,则每 1us 只能访存一次,也不行所以采用异步式刷新方式。
假定 16K*1 位的 DRAM 芯片用 128*128 矩阵存储元构成,刷新时只对 128 行进行异步方式刷新,则刷新间隔为 2ms/128 = 15.6us,可取刷新信号周期 15us 刷新一遍所用时间=15us×128=1.92ms 2:4 译码器 A14 A15 CS3 CS2 CS0CS1D0~DA13~A0 4. (1)片328*12832*1024KK (2) 15计算机组成原理(第四版)课后习题参考答案 CPU3:8译码器Y1Y2Y3Y4Y5Y6Y7Y8D0-D31A0-A16A17-A19 (3)如果选择一个行地址进行刷新,刷新地址为A0-A8,因此这一行上的 2048 个存储元同时进行刷新,即在 8ms内进行 512 个周期刷新方式可采用:在 8ms中进行 512 次刷新操作的集中刷新方式,或按 8ms/512 = 15.5us刷新一次的异步刷新方式 5. 所设计的存储器单元数为 1M,字长为 32,故地址长度为 20 位(A19~A0) ,所用芯片存储单元数为 256K,字长为 16 位,故占用的地址长度为 18 位(A17~A0) 。
由此可用位并联方式与地址串联方式相结合的方法组成组成整个存储器,共 8 片 RAM 芯片,并使用一片 2:4 译码器其存储器结构如图所示 CPUY0Y1Y2Y3256k*16RW /RW /256k*16A19A1830~ CSCS0CS0CS1CS1CS2CS2CS3CS3CSD31-D16(高16位)D15-D0(低16位)A17-A16RW / 6.(1)系统 16 位数据,所以数据寄存器 16 位 (2)系统地址 128K=217,所以地址寄存器 17 位 (3) 共需要 8 片 (4) 组成框图如下 16计算机组成原理(第四版)课后习题参考答案 CPU地址 寄存器数据 寄存器32K *8 32K *8 32K *8 32K *8 32K *8 32K *8 32K *8 32K *8 CS3CS2CS1CS0 2:4 译码器 CS0 A15 A16CS3 ~ 7.(1)组内地址用A12~A0 (2)小组译码器使用 3:8 译码器 (3)RAM1~RAM5各用两片 8K*8 的芯片位并联连接 RAM5 RAM4 RAM3 RAM2 RAM1 ROM 0000H 6000H 8000H A000H C000H E000H 4000H 17计算机组成原理(第四版)课后习题参考答案 CPUROMRAM8K*8RAM8K*8RAM8K*8RAM8K*8RAM8K*8RAM8K*8RAM8K*8RAM8K*8RAM8K*8RAM8K*83:8译码器A13-A15D0-D15A0-A12 8.顺序存储器和交叉存储器连续读出 m = 8 个字的信息总量都是: q = 64 位*8 = 512 位 顺序存储器和交叉存储器连续读出 8 个字所需的时间分别是: t1 = mT = 8*100ns = 8*10-7s nsnsnsnsmTt7210*5 . 445050*7100) 1( 顺序存储器和交叉存储器的带宽分别是: ]/[1064)10*8(512/7711stqW位 ]/[108 .113)10*5 . 4(512/7722stqW位 9.cache 的命中率 968. 08024202420mccNNNH 640240cmTTr cache/主存系统效率 e 为 %2 .86%100*968. 0*)61 (61%100*)1 (1Hrre 平均访问时间Ta为 nsnsnseTTca4 .46862. 040 10. h*tc+(1-h)*tm = ta %75.932004020050mcmatttth 18计算机组成原理(第四版)课后习题参考答案 11.设取指周期为T,总线传送周期为τ,指令执行时间为t0 (1)t = (T+5τ+6t0)*80 = 80T+400τ+480 t0 (2) t = (T+7τ+8t0)*60 = 60T+420τ+480 t0 故不相等。
12.D 19计算机组成原理(第四版)课后习题参考答案 第四章第四章 1.不合理指令最好半字长或单字长,设 16 位比较合适 2.70 条指令,所以操作码至少为 7 位 双操作数指令格式可以为: 7 12 12 单操作数指令格式可以为: 25 7 无操作数指令格式可以为: - 7 3.(1)RR 型指令 (2)寄存器寻址 (3)单字长二地址指令 (4)操作码字段OP可以指定 26=64 种操作 4.(1)双字长二地址指令,用于访问存储器操作码字段可指定 64 种操作 (2)RS 型指令,一个操作数在通用寄存器(共 16 个) ,另一个操作数在主存中 (3)有效地址可通过变址寻址求得,即有效地址等于变址寄存器(共 16 个)内容加上位移量 5.(1)双操作数指令 (2)23=8 种寻址方式 (3)24=16 种操作 6.(1)直接寻址方式 (2)相对寻址方式 (3)变址寻址方式 (4)基址寻址方式 (5)间接寻址方式 (6)基址间接寻址方式 7.40 条指令至少需要操作码字段 6 位,所以剩下的长度为 26 位。
主存的容量为 64M 字,则设寻址模式(X)2 位,格式如下: 31 26 25 24 23 0 OP X D X= 0 0 直接寻址 有效地址 E=D X= 0 1 立即寻址 D 字段为立即数 X= 1 0 变址寻址 有效地址 E= (RX)+D (可寻址 64M 个存储单元) X= 1 1 相对寻址 有效地址 E=(PC)+D (可寻址 64M 个存储单元) 其中 RX 为变址寄存器(32 位) ,PC 为程序计数器(32 位) 在相对寻址时,位移量 D 20计算机组成原理(第四版)课后习题参考答案 可正可负 8.(1)50 种操作码占 6 位,4 种寻址方式占 2 位以单地址指令为例: X = 00 寄存器寻址方式D 字段实际使用 4 比特选择 16 个通用寄存器 OP(6)X(2)D(24)X = 01 寄存器间接寻址方式 D字段实际使用4比特选择16个通用寄存器 E= (RX) X = 10 立即寻址方式D 字段给出 24 位立即数 X = 11 直接寻址方式D 字段给出 24 位内存地址。
E = D (2) 寻址模式字段变成 3 位,可以支持更多的寻址方式可增加相对寻址方式,其有效地址 E = PC+D;还可使用内存间接寻址,此时有效地址 E = (D) 9. 16 个通用寄存器占 4 位,64 种操作占 6 位,剩下 22 位用于存储器地址, R(4)D(22)OP(6) 采用 R 为基址寄存器寻址,地址=(R)+D 当基址最大,D 也是最大的时候,寻址能力最大 而寄存器是 32 位的, 故最大存储空间是 232+222 = 4GB+4MB 10. 表 4.9 的指令数为 29,则指令的操作码至少为 5 位设这些指令支持立即寻址、寄存器寻址、直接寻址、堆栈寻址、相对寻址、内存间接寻址、寄存器间接寻址、变址寻址、基址寻址等 9 种寻址方式并设计算机字长为 32 位: OP 目标寻址方式 目标操作数 源寻址方式 源操作数 64848 11.C 12.(1)寄存器 (2)寄存器间接 (3)立即 (4)直接 (5)相对、基址、变址 21计算机组成原理(第四版)课后习题参考答案 第五章第五章 1. (1)IR、(2)AR、(3)DR、通用寄存器 2. STO R1,(R2) PC0, G, ARi R/W=R DR0, G, ARi 3. LAD (R3), R0 4. R20, G, ARi R10, G, DRi R/W=W PC->ARM->DRDR->IRR2->AR R1->DR DR->M PC->AR M->DR DR->IR R30, G, ARi R ->AR 3 M->DR R/W=R DR0, G, R0i DR->R0 22计算机组成原理(第四版)课后习题参考答案 SETCLRDC5脉冲时钟源CLRS32+5VRSETCLRDC2SETCLRDC1SETCLRDC4SETCLRDC3T1T2T5T4T3 5.节拍脉冲T1, T2, T3的宽度实际上等于时钟脉冲的周期或是它的倍数。
此处T1 = T2 = 200ns, T3 = 400ns,所以主脉冲源的频率应为MHzTf51 为了消除节拍脉冲上的毛刺, 环形脉冲发生器采用移位寄存器形式 图中画出了题目要求的逻辑电路图与时序信号关系图根据时序信号关系,T1,T2,T3三个节拍脉冲的逻辑表达式如下: 211*CCT 22CT13TT T1用与门实现,T2和T3则用C2的Q和C端1的Q端加非门实现,其目的在于保持信号输出时延时间的一致性并与环形脉冲发生器隔离 SETCLRDC1SETCLRDC2SETCLRDC3SETCLRDC4脉冲时钟源CLRS32+5VT3 T2 T1R 23计算机组成原理(第四版)课后习题参考答案 1 2 3 4 5 6C4C1C2C3T1T2T3 6. 字节964832*) 13*80( 7. M = G S3 = H+D+F S2 = A+B+H+D+E+F+G S1 = A+B+F+G C = H+D+Ey+Fy+Gφ 8. 经分析, (d, i, j)和(e, f, h)可分别组成两个小组或两个字段,然后进行译码,可得六个微命令信号,剩下的 a, b, c, g 四个微命令信号可进行直接控制,其整个控制字段组成如下: a b c g 01d 01e 10 i 10 f 11 j 11 h * * * * * * * * 9. P1 = 1,按 IR6、IR5 转移 P2 = 1,按进位 C 转移 微地址转移逻辑图: T2 μAR8 μAR7μAR6SIR6 IR5IR4 P(1) T4 Q Q C1 D Q Q C2 D Q Q C3 D μAμAμA678 P(2) 24计算机组成原理(第四版)课后习题参考答案 10. (1)将 C,D 两个暂存器直接接到 ALU 的 A,B 两个输入端上。
与此同时,除 C,D 外,其余 7 个寄存器都双向接到单总线上 移位器R3MARMDRR2R1R0DCIRMPCALU+1+1AB (2) M->MDR->IR,PC+1R1->MDRM->MDR->CR2->MDRM->MDR->DC+D->MDRMDR->M,R2->DD+1->R2PC->MAR测试取指取源操作数取目的操作数加存回修改送回继指令地址 11. (1)假设判别测试字段中每一位作为一个判别标志,那么由于有 4 个转移条件,故该字段为 4 位下地址字段为 9 位,因为控存容量为 512 单元微命令字段则是(48-4-9)=35 位 (2)对应上述微指令格式的微程序控制器逻辑框图如图所示其中微地址寄存器对应下地址字,P 字段即为判别测试字段,控制字段即为微命令字段,后两部分组成微指令寄存器地址转移逻辑的输入是指令寄存器的 OP 码、各种状态条件以及判别测试字段所给的判别标志(某一位为 1) ,其输出修改微地址寄存器的适当位数,从而实现微程序的分支转移就是说,此处微指令的后继地址采用断定方式 25计算机组成原理(第四版)课后习题参考答案 OP微地址寄存器地址转移逻辑控制存储器地址译码P字段控制字段指令寄存器IR状态条件微命令信号…… 12. (1)流水线的操作周期应按各步操作的最大时间来考虑,即流水线时钟周期性 nsi100}max{ (2)遇到数据相关时,就停顿第 2 条指令的执行,直到前面指令的结果已经产生,因此至少需要延迟 2 个时钟周期。
(3)如果在硬件设计上加以改进,如采用专用通路技术,就可使流水线不发生停顿 13. (1) 0 t1t2t3t4t5t6t7t8t9t19t201 2 3 4 5 15 16 17 18 19 20…时间T空间SWBMEMEXIDIF1 2 3 4 5 201 2 3 4 5 201 2 3 4 5 201 2 3 4 5 201 2 3 4 5 20 (2)秒条/10*33. 810*100*) 1205(20) 1(69nKnH (3)17. 415205*20) 1(nKKnTpTsS 14. WBEXIDIF空间S时间T 1 2 3 4 5 6 7 8I1I1I1I1I2I2I2I2非流水线时间图 WBEXIDIF空间S时间T 1 2 3 4 5 6 7 8I1I1I1I1I2I2I2I2流水线时间图I3I3I3I3I4I4I4I4I5I5I5I5 如上两图所示,执行相同的指令,在 8 个单位时间内,流水计算机完成 5 条指令,而非 26计算机组成原理(第四版)课后习题参考答案 流水计算机只完成 2 条,显然,流水计算机比非流水计算机有更高的吞吐量。
15. 证:设 n 条指令,K 级流水,每次流水时间τ 则用流水实现 Tp = Kτ+(n-1) τ TpnHp 非流水实现 Ts = Kτn TsnHs 1111)-(nKnKKnKKnKnTpTsTsnTpnHsHp n->∞时, HsHp n=1 时, 1HsHp, 则可见 n>1 时 Ts>Tp,故流水线有更高吞吐量 16.(1)写后读 RAW (2)读后写 WAR (3)写后写 WAW 17.(1) I1I2译码段执行段写回段I2I1I3I4I2I1I5I6I2I4I3I6I5I4I3I2I6I3I5I6I6取/存 加法器 乘法器I3I4 (2) I1I2I3I4I5I6FFDDEWEEWFFDDEEEEEWWFFDDEWEEW 27计算机组成原理(第四版)课后习题参考答案 第六章第六章 1. 单总线结构:它是一组总线连接整个计算机系统的各大功能部件,各大部件之间的所有的信息传送都通过这组总线其结构如图所示单总线的优点是允许 I/O 设备之间或 I/O设备与内存之间直接交换信息, 只需 CPU 分配总线使用权, 不需要 CPU 干预信息的交换。
所以总线资源是由各大功能部件分时共享的 单总线的缺点是由于全部系统部件都连接在一组总线上,所以总线的负载很重,可能使其吞量达到饱和甚至不能胜任的程度故多为小型机和微型机采用 CPU内存设备接口设备接口…系统总线 多总线结构: 多总线系统结构是通过桥,CPU 总线,系统总线和高速总线彼此相连,各大部件的信息传送不是只通过系统总线;体现了高速,中速,低速设备连接到不同的总线上同时进行工作,以提高总线的效率和吞吐量,而且处理器结构的变化不影响高速总线 2. (1)简化了硬件的设计从硬件的角度看,面向总线是由总线接口代替了专门的 I/O 接口,由总线规范给出了传输线和信号的规定, 并对存储器、 I/O 设备和 CPU 如何挂在总线上都作了具体的规定,所以,面向总线的微型计算机设计只要按照这些规定制作 CPU 插件、存储器插件以及 I/O 插件等,将它们连入总线即可工作,而不必考虑总线的详细操作 (2)简化了系统结构整个系统结构清晰,连线少,底板连线可以印刷化 (3)系统扩充性好一是规模扩充,二是功能扩充规模扩充仅仅需要多插一些同类型的插件; 功能扩充仅仅需要按总线标准设计一些新插件。
插件插入机器的位置往往没有严格的限制这就使系统扩充既简单又快速可靠,而且也便于查错 (4)系统更新性能好因为 CPU、存储器、I/O 接口等都是按总线规约挂到总线上的,因而只要总线设计恰当,可以随时随着处理器芯片以及其他有关芯片的进展设计新的插件,新的插件插到底板上对系统进行更新, 而这种更新只需更新需要更新的插件, 其他插件 28计算机组成原理(第四版)课后习题参考答案 和底板连线一般不需更改 3. “A”的 ASCII 码为 41H = 01000001B,1 的个数为偶数,故校验位为 0; “8”的 ASCII码为 38H = 00111000B,1 的个数为奇数,故校验位为 1 停止位起始位数据位数据位数据位数据位数据位数据位数据位数据位校验位停止位起始位数据位数据位数据位数据位数据位数据位数据位数据位校验位停止位0 1 2 3 4 5 6 70 1 2 3 4 5 6 7 4. 逻辑图如下: 总 线总 线 当 Rout 信号无效时,设备与总线在电气上断开 说明:两个设备共用总线,每个设备的总线接口部分如右图所示通过锁存器保存接收数据,并通过三态门向总线发送数据。
每个设备的 Rin 控制端有效时, 锁存器保存接收数据;每个设备的 Rout 信号有效时,锁存器保存的数据被送上总线5. 中央仲裁器设备接口0设备接口1设备接口n…BSBRBGDA DQCPRinRout设 备 一设 备 二6. 中央仲裁器设备接口0设备接口1设备接口n……………BG0BG1BGnBR0BR1BRn 7. 29计算机组成原理(第四版)课后习题参考答案 竞争设备竞争号设备竞争号接其它设备仲裁总线AB7ABiAB0W7WiW0CN7CNiCN0 8.C 9.B、A、C 10.A 11.D 12.A 13. 存储总线周期用于对内存读写,I/O 总线周期对接口中的端口进行读写 14.D、C、A、B 15.B、A、E、D、C 16.A、B、C、D 17. PCI 总线上有 HOST 桥、PCI/LAGACY 总线桥、PCI/PCI 桥桥在 PCI 总线体系结构中起着重要作用,它连接两条总线,使彼此间相互通信桥是一个总线转换部件,可以把一条总线的地址空间映射到另一条总线的地址空间上, 从而使系统中任意一个总线主设备都能看到同样的一份地址表 桥可以实现总线间的猝发式传送, 可使所有的存取都按CPU 的需要出现在总线上。
由上可见,以桥连接实现的 PCI 总线结构具有很好的扩充性和兼容性,允许多条总线并行工作 18. 分布式仲裁不需要中央仲裁器,每个潜在的主方功能模块都有自己的仲裁号和仲裁器当它们有总线请求时, 把它们唯一的仲裁号发送到共享的仲裁总线上, 每个仲裁器将仲裁总线上得到的号与自己的号进行比较 如果仲裁总线上的号大, 则它的总线请求不予响应,并撤消它的仲裁号最后,获胜者的仲裁号保留在仲裁总线上,分布式仲裁是以优先级仲裁策略为基础 30计算机组成原理(第四版)课后习题参考答案 竞争设备竞争号设备竞争号接其它设备仲裁总线AB7ABiAB0W7WiW0CN7CNiCN0 19.总线的一次信息传送过程,大致可分为:请求总线,总线仲裁,寻址,信息传送,状态返回 地址数据总线时钟启动信号读命令地址线数据线认可 20. 设总线带宽用 Dr 表示,总线时钟周期用 T = 1/f 表示,一个总线周期传送的数据量用 D表示, 根据定义可得: Dr = T / D = D ×1/f=8B×70 = 560MHz/s 21. PCI 总线:是一种不依附于某个具体处理器的局部总线,支持 10 种外设,并能在高时钟频率下保持高性能。
总线时钟频率为 33.3MHz/66MHz,最大数据传输速率 133MB/s,采用时钟同步方式,与 CPU 及时钟频率无关,总线宽度 32 位(5V)/64 位(3.3V) ,能自动识别外设 总线具有与处理器和存储器子系统完全并行操作的能力, 具有隐含的中央仲裁系统,采用多路复用方式(地址线和数据线)减少了引脚数,支持 64 位寻址,具有完全的多总线主控能力 InfiniBand 标准:针对处理器和智能 I/O 设备之间数据流而提出的一种新体系结构,用于在服务器中取代 PCI 总线, 采用 InfiniBand 结构将允许服务器提供更高的带宽和可扩展能力,并增强了存储设备扩充的灵活性InfiniBand 允许服务器,远程存储器,其他网络设备接入到一个由开关和链路组成的中央开关网带,可连接多达 64000 个服务器,存储系统和网络设备 31计算机组成原理(第四版)课后习题参考答案 第七章第七章 1.D 2.C、D、C、A 3.MB18*8256*1024*1024 4.格式化容量=扇区容量*每道扇区数*磁道总数 =512*9*100*2=921600B 5.设读写一块信息所需总时间为tB,平均找道时间为ts,平均等待时间为tl,读写一块信息的传输时间为tm,则 tB = ts+tl+tm 假设磁盘以每秒r转速率旋转,每条磁道容量为N个字,则数据传输率 = rN个字/秒。
又假设每块的字数为 n,因而一旦读写头定位在该块始端,就能在秒的时间中传输完毕 )/(rNntm tl是磁盘旋转半周的时间,tl = (1/2r)秒由此可得: ][21秒rNnrttsB 6.道转转/2775/277560/4000/185000BBssB 2*220*2775 = 1.16MB 7.(1)275*12288*4 = 12.89MB (2) 最高位密度 D1 按最小磁道半径 R1 计算(R1 = 115mm) : D1 = 12288 字节 / 2πR1 = 17 字节 / mm 最低位密度 D2 按最大磁道半径 R2 计算: R2 = R1 + (275 ÷ 5) = 115 + 55 = 170mm D2 = 12288 字节 / 2πR2 = 11.5 字节 / mm (3)sKB/60012288*603000 (4)ms101000*300060*21 (5) 台号柱面(磁道)号盘面(磁头)号扇区号16 15 14 6 5 4 3 0 此地址格式表示有 4 台磁盘, 每台有 4 个记录面, 每个记录面最多可容纳 512 个磁道,每道有 16 个扇区。
8. ms5 .721000*240060*2160平均等待时间平均查找时间存取时间 32计算机组成原理(第四版)课后习题参考答案 sKBDr/480602400*96 9.(1)msmvCD/64000/2/128000字节秒字节 (2)传送一个数据块所需时间为 秒秒字节字节1251/1280001024t 一个数据块占用长度为 mssmtvl016. 01251*/2* 每块间隙 L = 0.014m,数据块总数为 块198674600Ll 故磁带存储器有效存储容量为 19867 块*1K 字节 = 19867K 字节 10.(1)磁盘内径为:9 英寸-5 英寸 = 4 英寸 内层磁道周长为 英寸4 .315*14. 3*22R每道信息量 = 1000 位/英寸*31.4 英寸 = 3.14*104位 磁盘有 100 道/英寸*5 英寸 = 500 道 盘片组总容量:20*500*3.14*104 = 3.14*108位 = 314 兆位 (2)每转即每道含有信息量 3.14*104位,即 3.925*103B 分钟转转转/16020/267/10*925. 3/13sBsMB 11.(1)[(30*10-3+10*10-3+3000/500*10-3)*2+4*10-3]*1000 = 96s (2) [(30*10-3+5*10-3+3000/1000*10-3)*2+4*10-3]*1000 =80s 12. (1)存储容量从大到小依次为:活动头磁盘存储器, MO 磁盘,CD-ROM 存储器,主存,高速缓存,寄存器组 存储周期从大到小依次为:CD-ROM 存储器,MO 磁盘,活动头磁盘存储器,主存,高速缓存,寄存器组 (2)可构成如下的多级存储体系: 寄存器组 高速缓存 主存 活动头硬磁盘 1 2 3MO 磁盘和 CD-ROM 存储器 33计算机组成原理(第四版)课后习题参考答案 (3)CPU 和高速缓存以及 CPU 和主存之间有直接的数据通路,而 CPU 与外存之间不存在直接的数据通路,CPU 访问硬盘和光盘时都需要先将信息调入主存。
13. 刷新存储器是用来存储一图像信息以不断提供刷新图像的信号 其存储容量由图像分辨率和灰度级决定 1024*1024*24bit = 3MB 14.(1)1024*768*3 = 2.25MB (2)1024*768*3B*72/s = 162MB/s 34计算机组成原理(第四版)课后习题参考答案 第八章第八章 1.A、B、C 2.B 3.A 4.C 5.组织外围设备和内存进行数据传输;控制外围设备;选择;数组多路;字节多路 6.能响应,因为设备A的优先级比设备B高若要设备B总能立即得到服务,可将设备B从第二级取出来,单独放在第三级上,使第三级的优先级最高,即令IM3 = 0 7.依次处理设备 A,设备 D,设备 G 的时间为: T1 = t1+t2+t3+t4+tA T2 = t1+t2+t3+t4+tD T3 = t1+t2+t3+t4+tG 总时间为T = T1+T2+T3 = 3*( t1+t2+t3+t4)+ tA + tD + tG8.(1) 中断处理程序L0中断处理程序L1中断处理程序L2中断处理程序L3中断处理程序L4中断处理程序中断处理级屏蔽位L0级01111L1级L2级L3级L4级00001000000001111100 (2) 主程序L1L5L4L3L2 9.要将通用寄存器内容保存到主存中去。
只需保存中断处理程序用到的那 2 个寄存器内容 10. 设计思想:二维中断判优结构如主教材图 8.9(b)所示其中,主优先级独立请求方式的判优电路在主教材图 8.10 的基础上进行改进: 将 PSW 中的 5~7 三位经译码器输出 IR4~IR7 共四个请求信号,参与排队器排队 11.(1)IM2IM1IM0 = 011 (2) IM2IM1IM0 = 001 35计算机组成原理(第四版)课后习题参考答案 (3) 若要设备B总能立即得到服务,可将设备B从第二级取出来,单独放在第三级上,使第三级的优先级最高,即令IM3 = 0 12.D 13.中断、蔽中断、中断、异常、异常、执行软件中断指令 14.B、A、C、D、E 15.B、A、 16.(1)通道方式: 可以实现对外设的统一管理和外设与内存之间的数据传送, 大大提高了CPU 的工作效率 (2)DMA 方式:数据传送速度很高,传送速率仅受到内存访问时间的限制需要更多硬件, ,适用于内存和高速外设之间大批数据交换的场合 (3)中断方式:一般适用于随机出现的服务,且一旦提出要求应立即进行,节省了 CPU的时间开销,但硬件结构稍复杂一些。
17. 20us90us180us光盘软盘打印机DMA控制器 18.主端口是 1394 树形配置结构的根节点一个主端口最多可连接 63 台设备每个设备称为一个节点,它们构成亲子关系其中右侧按菊花链式配置,左侧按亲子关系连接 36计算机组成原理(第四版)课后习题参考答案 第九章第九章 1. B 2. D 3. B、D 4. A、C、D 5. D 6.6 7. 虚拟地址为 30 位,物理地址为 22 位 页表长度:KKBGB25641 8. (1)若页表存放在主存中,则要实现一次页面访问需两次访问主存:一次是访问页表,确定所存取页面的物理地址;第二次才根据该地址存取页面数据故访问一次主存的时间为 50×2=100(ns) (2)75%×50+(1-75%)×2×50=62.5(ns) 9. 被访问的字在 cache 中的概率为 0.9 不在 cache 中但在主存中的概率为(1-0.9)×0.6=0.06 不在 cache 中也不在主存中的概率为(1-0.9) ×(1-0.6)=0.04 则一个字的平均访问时间为:15×0.9+(15+60)×0.06+(15+60+10×106) ×0.04=400021 ns 10. 页内地址 11 位。
逻辑地址:4+11=15 位 物理地址空间大小为 8×2K=16KB 11 页内地址 10 位 虚地址(0AC5)16=(00010 1011000101)2处于虚地址第 2 页,调入到主存第 4 页中,故物理地址为(00100 1011000101)2=(12C5)16 虚地址(1AC5)16=(00110 1011000101)2处于虚地址第 6 页,尚未调入到主存中,故无物理地址 12. 虚存管理是由软件(操作系统)和硬件共同完成,由于软件的介入,虚存对实现存储管理的系统程序不透明而段是按照程序的自然分界划分的长度可以动态改变的区域通常,程序员把子程序、 操作数和常数等不同类型的数据划分到不同的段中, 并且每个程序可以有多个相同类型的段 由于分段是由程序员完成的, 故段式虚拟存储器对应用程序员而言是不完全透明的但虚存到实存的地址映射是由系统软件辅助完成的,故对应用程序而言,段式虚存是“半透明”的 13. 在一个进程的执行过程中,有些页面处在主存中,有些处在辅存中 14.由于页式虚拟存储器的页大小固定,且为 2 的整数次幂(设为 2n) ,故页起始地址一定处在页边界上(页起始地址的最低n位必为全 0) ,页内地址可以用物理地址的低n位直接给出。
而段式虚存中,段的大小可变,且段可起始于任意地址,故必须通过段首址与段内偏移量相加才能得到物理地址 15 答:颠簸是由缺页率高而引起的 37计算机组成原理(第四版)课后习题参考答案 防止颠簸的办法:系统规定缺页率的上界和下界当运行进程缺页率高于上界时,表明所分给它的物理页面数过少,应当增加;反之,当运行进行缺页率低于下界时,表明所分给它的物理页面数过多,可以减少这样,根据缺页率反馈可动态调整物理页面的分配,以防止颠簸的发生 38计算机组成原理(第四版)课后习题参考答案 第十章第十章 1. D 2. 214=16384 3. ld8 r1=[r3] add r6=r8, r9;; sub r3=r1, r4;; add r5=r3, r7 4. 5. ld8.s r3=[r5] …… br next1 //转移至标号 next1 执行 chk.s r3, err_recov sub r2=r1, r3 6. 与多核处理机相比,多线程技术仅仅在单核单线程处理机的基础上增加了很少的成本就显著提高了系统性能, 因而是一种提高并行性的比较经济的手段。
而多核处理机是将多个处理机核封装在一个芯片内部,处理机成本显著增加 由于同时运行的多个线程需要共享执行资源, 因而在超线程处理机中实时调度机制非常复杂如果多个线程同时需要某一个共享资源,只有一个线程能够使用该资源,其他线程要暂停并等待资源空闲时才能继续 因此, 同时多线程技术就性能提升而言远不能等同于多个相同时钟频率处理机组合而成的多核处理机,但从性能-价格比的角度看,同时多线程技术 39计算机组成原理(第四版)课后习题参考答案 40是一种对单线程处理机执行资源的有效优化手段 7. Inst 1 Inst 2 cmp.eq P1, P2=a, b (P1) Inst 5 (P1) Inst 6 (P2) Inst 5 (P2) Inst 3 (P1) Inst 4 Inst 7 Inst 8 8. 去掉分支指令后,只需要两个时钟周期完成上述功能,描述如下: clock 1: if (a > b) then P1=TRUE else P2= TRUE clock 2: (P1)x=a; (P2)x=b; (P1)y=6; (P2)y=y+5 9. 超线程技术是在原有单线程处理机的基础上增加少量成本 (复制必要的线程上下文相关的部件),允许处理机在同一个周期从不同的线程取指令发射执行。
不同的线程共享同一个流水线 超线程技术能够有效地提高芯片上的资源利用率, 但资源冲突会限制处理机的并行操作能力 多核处理机技术把多个独立的处理机核集成到同一个芯片之上, 利用片上更高的通信带宽和更短的通信时延,挖掘出线程级的更高并行性由于多个处理机核相互独立,故在运行多个线程时不会引起资源竞争 超标量流水技术是在单个处理机内部设置多条指令流水线,每条流水线有自己独立的ALU、地址生成部件和cache接口等,从而支持单一的指令流中的若干指令的并行执行但当单一的指令流出现cache不命中等现象时,会使流水线断流;而指令之间的相关性也会严重影响执行单元的利用率 虚拟化技术可以同时运行多个操作系统, 而且每一个操作系统中都有多个程序运行, 每一个操作系统都运行在一个虚拟的CPU或者是虚拟主机上 支持虚拟化技术的CPU带有特别优化过的指令系统来控制虚拟过程 多任务机制是指在一个操作系统中多个程序同时并行运行 操作系统软件可以通过任务调度机制切换处理机时间,从而降低处理机因为等待资源可用造成的延迟 10. 从理论上讲,流水线的级数越多,并行工作的功能段数就越多,单位时间内执行的指令数就越多, 系统吞吐量就越高。
但流水线深度过深也带来了一定副作用, 导致初始时延过长,硬件资源消耗过大, 段间缓冲的开销变大, 一旦流水线断流也将会造成非常大的损失 因此,需要根据处理机体现结构合理安排流水线的级数 。












