
二进制课件[共50页].ppt
50页1.2 二进制与0、1编码•电子计算机是一种极为复杂的电子机器,但是它的组电子计算机是一种极为复杂的电子机器,但是它的组成元件却是极为简单的电子开关成元件却是极为简单的电子开关•电子计算机最基本工作是由电子开关实现的这里电电子计算机最基本工作是由电子开关实现的这里电子开关泛指具有子开关泛指具有“开开”和和“关关”,或者具有,或者具有“高高”电电平和平和“低低”电平这样的两种状态的电子器件电平这样的两种状态的电子器件•为了叙述的方便,为了叙述的方便,0、、1编码通常把这两种状态分别用编码通常把这两种状态分别用符号符号“0”和和“1”表示计算机工作中所需要的一切表示计算机工作中所需要的一切信息,都是用开关状态的组合表示的,称为信息,都是用开关状态的组合表示的,称为“0”和和“1”编码 本节主要内容本节主要内容 1.2.1 数值数据的数值数据的0、、1编码编码 1.2.3 字符数据的字符数据的0、、1编码编码 1.2.4 图像的图像的0、、1编码编码 1.2.5 声音的声音的0、、1编码编码 1.2.6 指令的指令的0、、1编码与计算机程序设计语言编码与计算机程序设计语言 1.2.7 数据传输中的差错检验数据传输中的差错检验1.1.1 数据的开关表示数据的开关表示 一只开关只有一只开关只有““开开””和和““关关””两种状态。
通常把这两种状两种状态通常把这两种状态分别用符号态分别用符号““0””和和““1””表示计算机工作中所需要的一表示计算机工作中所需要的一切数据信息,都是用开关状态的组合表示的,或称为用切数据信息,都是用开关状态的组合表示的,或称为用““0””和和““1””编码表示的编码表示的 1. 1. 数值数据的数值数据的0 0、、1 1编码编码 通通常常人人们们使使用用的的是是十十进进制制计计数数法法十十进进制制计计数数法法有有两两个个主主要特点:要特点: · 采用采用0 0,,1 1,,2 2,,3 3,,4 4,,5 5,,6 6,,7 7,,8 8,,9 9十个符号表示数字;十个符号表示数字; · 十进制的位权是十进制的位权是1010的幂,即的幂,即 10i, 10i-1, ……, 103, 102, 101, 100, 10-1, 10-2, 10-3, …… 位位权权即即位位置置本本身身所所具具有有的的数数量量级级别别。
它它使使一一个个表表数数符符号号在在不同的位置上,所代表的数值不同不同的位置上,所代表的数值不同 与与之之对对应应,,用用电电子子开开关关表表示示数数值值,,只只能能使使用用两两个个符符号号::0和和1,,所所采采用用的的进进位位计计数数法法称称为为二二进进制制二二进进制制的的位位权权是是2的的幂,即幂,即 2i, 2i-1, …, 23, 22, 21, 20, 2-1, 2-2, 2-3, … 表表1.1为几个十进制数与二进制数之间的对应关系为几个十进制数与二进制数之间的对应关系 显显然然,,与与十十进进制制的的“逢逢十十进进一一”相相似似,,二二进进制制也也具具有有“逢逢二进一二进一”的特征 下面介绍十进制数与二进制数之间的一般转换关系下面介绍十进制数与二进制数之间的一般转换关系 ((1)二)二—十十 (B→D) 进制转换进制转换 规则:各位对应的十进制值之和;各位对应的十进制值规则:各位对应的十进制值之和;各位对应的十进制值为系数与其位权之积。
为系数与其位权之积 例例1.1.1 101.11101B== ? D 解:位解:位 权:权:22 21 20 2-1 2-2 2-3 2-4 2-5 二进制数:二进制数:1 0 1 . 1 1 1 0 1 计计 算:算:4 +0 +1+0.5+0.25+0.125+0+0.03125=5.90625D 连续连续“除除2取余取余”0 1 3 7 14 29结束结束 1 1 1 0 1十进制余数序列即对应的二进制数十进制余数序列即对应的二进制数所以所以 29D = 11101B 有有时时,,小小数数十十——二二转转换换,,会会出出现现转转换换不不完完的的情情况况这这时时可可按按““舍舍0取取1””(相当于四舍五入)的原则,取到所需的位数。
相当于四舍五入)的原则,取到所需的位数 例例1.1.3 0.375D= ? B解解:小数部分连续小数部分连续“乘乘2取整取整”0.3750.751.501.00结束结束0.011所以所以 0.375D=0.011B 注意:第一个注意:第一个0与小数点要照写与小数点要照写3) 小数十小数十—二进制转换二进制转换 规则:连续规则:连续“(向右)乘(向右)乘2取整,直到取整,直到0” 例例1.1.4 0.24D==?B 解:解: 连乘连乘 0.24 0.48 0.96 1.92 1.84 1.68 1.36 0.72 1 .44 取整取整 0. 0 0 1 1 1 1 0 1 结果结果 0. 0 0 1 1 1 1 1 舍入舍入 (4) 整数小数混合十整数小数混合十—二进制转换二进制转换 规则:从小数点向左、右,分别按整数、小数规则进行。
规则:从小数点向左、右,分别按整数、小数规则进行 例例1.1.5 29.375D==?B 解:解: 连续连续“除2取余除2取余” 连续取小数部分连续取小数部分“乘2取整乘2取整” 0 1 3 7 14 29 . 375 0 .75 1.50 1.00 1 1 1 0 1 . 0 1 1 所以所以 29.375D==11101.011B 2. 二进制运算法则二进制运算法则 ((1)加法规则:)加法规则:“逢逢2进进1” 0 + 0 = 0 1 + 0 = 0 + 1 = 1 1 + 1 = 10 例例1.1.6 101.01+110.11==? 解:解: 1 0 1 . 0 1 + 1 1 0 . 1 1 1 1 0 0 . 0 0 所以所以 101.01+110.11==1100.00 ((2)减法规则:)减法规则:“借借1当当2” 0 – 0 = 0 1 – 0 = 1 1 – 1 = 0 10 – 1 = 1 例例1.1.7 1100.00-110.11==? 解: 解: 1 1 0 0 . 0 0 - 1 1 0 . 1 1 1 0 1 . 0 1 所以所以 1100.00-110.11==101.01 ((3)乘法规则)乘法规则 0 × 0 = 0 1 × 0 = 0 × 1 = 0 1 × 1 = 1 显然,二进制数乘法比十进制数乘法比简单多了。
显然,二进制数乘法比十进制数乘法比简单多了 例例1.1.8 10.101×101==? 解:解: 1 0 . 1 0 1 …………被乘数被乘数 × 1 0 1 …………乘数乘数 1 0 . 1 0 1 0 0 0 . 0 0 ………部分积部分积 ++1 0 1 0 . 1 1 1 0 1 . 0 0 1 …………积积 所以所以 10.101×101==1101.001 在二进数运算过程中,由于乘数的每一位只有两种可能情在二进数运算过程中,由于乘数的每一位只有两种可能情况,要么是况,要么是0,要么是,要么是 1。
因此部分积也只有两种情况,要么因此部分积也只有两种情况,要么是被乘数本身,要么是是被乘数本身,要么是0 根根据据这这一一特特点点,,我我们们可可以以把把二二进进制制数数的的乘乘法法归归结结为为移移位位和和加加法法运运算算即即通通过过测测试试乘乘数数的的每每一一位位是是0还还是是1,,来来决决定定部部分分积积是加被乘数还是加零是加被乘数还是加零 除除法法是是乘乘法法的的逆逆运运算算,,可可以以归归结结为为与与乘乘法法相相反反方方向向的的移移位位和和减减法法运运算算因因此此,,在在计计算算机机中中,,只只要要具具有有移移位位功功能能的的加加法法/减法运算器,便可以完成四则运算/减法运算器,便可以完成四则运算 3. 八进制(八进制(Octal)、)、十六进制(十六进制(Hexadecimal))和二和二-十进制十进制((1)八进制和十六进制)八进制和十六进制 二二进进制制数数书书写写太太长长,,难难认认、、难难记记。
为为了了给给程程序序员员提提供供速速记记形形式式,,使使用用中中常常用用八八进进制制和和十十六六进进制制作作为为二二进进制制的的助助记记符符形式 八进制记数符:八进制记数符:0,,1,,2,,3,,4,,5,,6,,7 十十六六进进制制记记数数符符::0,,1,,2,,3,,4,,5,,6,,7,,8,,9,,A(a),,B(b),,C(c),,D(d),,E(e),,F(f) 将将二二进进制制数数由由小小数数点点起起,,向向两两侧侧分分别别以以每每3位位划划一一组组((最最高高位位与与最最低低位位不不足足3位位以以0补补))每每一一组组便便为为一一个个八八进进制制数数同同理以理以4位为一组,每一组便为一个十六进制数位为一组,每一组便为一个十六进制数 例例1.1.9 10110 1110.1111B== ?H 解:补零解:补零 0001 0110 1110 . 1111 1 6 E F 所以所以 10110 1110.1111B==16E.FH 从根本上来说,计算机内部进行的运算,实际上是二进制从根本上来说,计算机内部进行的运算,实际上是二进制运算。
但是,把十进制数转换为二进制数,并使用二进数计运算但是,把十进制数转换为二进制数,并使用二进数计算的结果,转换为十进制数,在许多小型计算机中所花费的算的结果,转换为十进制数,在许多小型计算机中所花费的时间是很长的在计算的工作量不大时,数制转换所用时间时间是很长的在计算的工作量不大时,数制转换所用时间会远远超过计算所需的时间在这种情况下,常常采用二会远远超过计算所需的时间在这种情况下,常常采用二-十十进制数 ((2)二)二-十进制(十进制(BCD))码码 二二-十进制(十进制(BCD))码也称为二进制编码形式的十进制数,码也称为二进制编码形式的十进制数,即用即用4位二进制数来表示一位十进制数,这种编码形式可以有位二进制数来表示一位十进制数,这种编码形式可以有多种,其中最自然、最简单的一种方式为多种,其中最自然、最简单的一种方式为 8-4-2-1码,也称压码,也称压缩的缩的BCD码即这4位二进制数的权,从左往右分别为位二进制数的权,从左往右分别为8,,4,,2,, 1 例例1.1.10 3579 D==? BCD 解:解: 3 5 7 9 ↓ ↓ ↓ ↓ 0011 0101 0111 1001 所以所以 3579D == 0011 0101 0111 1001 BCD 4. 机器数机器数 在在计计算算机机中中不不仅仅要要用用0,,1编编码码的的形形式式表表示示一一个个数数的的数数值值部部分分,,正正、、负负号号也也要要用用0,,1编编码码来来表表示示。
一一般般用用 数数 的的 最最 高高 位位 (( 最最 左左 边边 一一 位位 )) (( MSB,, Most Significant Bit))表示数的正负,如:表示数的正负,如: MSB==0 表示正数,如表示正数,如+1011表示为表示为01011;; MSB==1 表示负数,如表示负数,如-1011表示为表示为11011 一一个个数数在在机机器器内内的的表表示示形形式式称称为为机机器器数数它它把把一一个个数数连连同同它它的的符符号号在在机机器器中中被被0,,1编编码码化化了了这这个个数数本本身身的的值值称称为为该该机机器器数数的的真真值值上上边边的的““01011””和和““11011””就就是是两两个个机机器器数它们的真值分别为数它们的真值分别为+1011和和-1011 当然,在不需要考虑数的正、负时,是不需要用一位来表当然,在不需要考虑数的正、负时,是不需要用一位来表示符号的。
这种没有符号位的数,称为无符号数由于符号示符号的这种没有符号位的数,称为无符号数由于符号位要占用一位,所以用同样字长,无符号数的最大值比有符位要占用一位,所以用同样字长,无符号数的最大值比有符号数要大一倍如字长为号数要大一倍如字长为4位时,能表示的无符号数的最大值位时,能表示的无符号数的最大值为为1111,即,即15,而表示的无符号数的最大值为,而表示的无符号数的最大值为111,即,即7 直直接接用用一一位位用用0,,1码码表表示示正正、、负负,,而而数数值值部部分分不不变变,,在在运运算时带来一些新的问题:算时带来一些新的问题: ((1)) 两两个个正正数数相相加加时时,,符符号号位位可可以以同同时时相相加加::0 + 0==0,,即和仍然为正数,没有影响运算的正确性即和仍然为正数,没有影响运算的正确性 ((2)) 一一个个正正数数与与一一个个负负数数相相加加,,和和的的符符号号位位不不是是两两符符号号位位直直接接运运算算的的值值::0 + 1==1,,而而由由两两数数的的大大小小决决定定即即和和的的符符号位是由两数中绝对值大的一个数所决定的号位是由两数中绝对值大的一个数所决定的。
((3)) 两两个个负负数数相相加加时时,,由由于于1 + 1==10,,因因此此和和的的符符号号也也不是由两符号位直接运算的结果所决定不是由两符号位直接运算的结果所决定 简简单单地地说说,,用用这这样样一一种种直直接接的的形形式式进进行行加加运运算算时时,,负负数数的的符符号号位位不不能能与与其其数数值值部部分分一一道道参参加加运运算算,,而而必必须须利利用用单单独独的的线路确定和的符号位这样使计算机的结构变得复杂化了线路确定和的符号位这样使计算机的结构变得复杂化了 如何解决机器内负数的符号位参加运算的问题?如何解决机器内负数的符号位参加运算的问题?•例:例:1110-1011 = ? 如果直接用减法可知如果直接用减法可知 ? = 0011 但是,可考虑但是,可考虑1110-1011+10000 = ?+10000,即,即 1110+(10000-1011) = ?+10000,可得,可得 1110+0101 = ?+10000,可得,可得 10011 = ?+10000,可得,可得 0011 = ? (1) 先看先看10000-1011 = 0101 (2) 再看再看1011的每一位求反后得到的每一位求反后得到0100,,1变变0,,0变变1 (3) 最后发现最后发现(1)中的中的0101与与(2)中的中的0100相差相差1•1011的每一位求反得到的每一位求反得到0100((反码,每一位求反反码,每一位求反))•1011 + 0100 = 1111((原码原码+反码反码=所有位为所有位为1))•0100+1 = 0101((补码,在反码的最低位补补码,在反码的最低位补1)) 为为了了解解决决机机器器内内负负数数的的符符号号位位参参加加运运算算的的问问题题,,引引入入了了反码和补码两种机器数形式,而把前边的直接形式称为原码。
反码和补码两种机器数形式,而把前边的直接形式称为原码 ((1)反码)反码 对正数来说,其反码和原码的形式是相同的即对正数来说,其反码和原码的形式是相同的即 [X]原原==[X]反反 对负数来说,反码为其原码的数值部分的各位变反如:对负数来说,反码为其原码的数值部分的各位变反如: X [X]原原 [X]反反 +1101 01101 01101 -1101 → 11101 → 10010 取反取反 反码运算要注意反码运算要注意3个问题:个问题: · 反码运算时,其符号位与数值一起参加运算。
反码运算时,其符号位与数值一起参加运算 · 反反码码的的符符号号位位相相加加后后,,如如果果有有进进位位出出现现,,则则要要把把它它送送回回到最低位去相加这叫做循环进位到最低位去相加这叫做循环进位 · 反码运算有如右性质:反码运算有如右性质:[X]反反 + [Y]反反==[X + Y]反反 例例1.1.11 已知:已知: X==0.1101 Y==-0.0001 求:求: X + Y==? 解:解: [X]反反==0.1101 正数的反码与原码相同正数的反码与原码相同 + [Y]反反==1.1110 10.1011 +循环进位循环进位 1 X + Y==0.1100 所以所以 X + Y==0.1100 例例 1.1.12 已知:已知:X==-0.1101 Y==-0.0001 求:求: X + Y== ? 解:解: [X]反=反=1.0010 + [Y]反=反=1.1110 11.0000 +循环进位循环进位 1 X + Y==1.0001 所以所以 X + Y == -0.1110 ((2))补码补码 对对正正数数来来说说,,其其补补码码和和原原码码的的形形式式是是相相同同的的:[X]原原==[X]补补;;对对负负数数来来说说,,补补码码为为其其反反码码(数数值值部部分分各各位位变变反反)的的末末位位补补加加1。
例如例如 X [X]原原 [X]反反 [X]补补 +1101 → 01101 → 01101 → 01101 -1101 → 11101 → 10010 → 10011 取反取反 补补1 这这种种求求负负数数的的补补码码的的方方法法,,在在逻逻辑辑电电路路中中实实现现起起来来是是很很容容易的 不不论论对对正正数数,,还还是是对对负负数数,,反反码码与与补补码码具具有有下下列列相相似似的的性性质:质: [[X]反反]反反==[X]原原 [[X]补补]补补==[X]原原 例例1.1.13 原码、补码的性质举例:原码、补码的性质举例: 变反变反 [[X]反反]反反 X [X]原原 变反变反 [X]反反 加加1 [X]补补 变反变反 [[[[X]X]补补] ]反反 加加1 [[ [[X]X]补补] ]补补+ 1101 01101 01101 01101 01101 01101+ 1101 01101 01101 01101 01101 01101 -1101 11101 10010 10011 11100 11101 -1101 11101 10010 10011 11100 11101 采用补码运算也要注意采用补码运算也要注意3 3个问题个问题 · 补码运算时,其符号位也要与数值部分一样参加运算。
补码运算时,其符号位也要与数值部分一样参加运算 · 符号运算后如有进位出现,则把这个进位舍去不要符号运算后如有进位出现,则把这个进位舍去不要 · · 反码运算有如右性质:反码运算有如右性质:[ [X]X]补补 + [ + [Y]Y]补=补=[ [X + Y]X + Y]补 例例 1.1.14 (整数整数) 已知:已知:X==1101 Y==-0010 求:求:X + Y== ? 解:解: [X]补补==1101 + [Y]补补==1110 [X +Y]补补==11011 ↓ 舍去不要舍去不要 所以所以 X + Y==1011 例例(小数小数) 已知:已知:X==0.1101 Y==-0.0001 求:求:X + Y== ? 解:解: [X]补补==0.1101 + [Y]补补==1.1111 [X +Y]补补==10.1100 ↓ 舍去不要舍去不要 所以所以 X + Y==0.1100 例例 1.1.15 已已知知::X==-0.1101 Y==-0.0001 求求:: X + Y== ? 解:解: [X]补补==1.0011 + [Y]补补==1.1111 [X+Y]补补==11.0010 ↓ 舍去不要舍去不要 所以所以 X + Y==-0.1110 采采用用反反码码和和补补码码,,就就可可以以基基本本上上解解决决负负数数在在机机器器内内部部数数值值连同符号位一起参加运算的问题。
连同符号位一起参加运算的问题 (3) 移码移码 移码是在补码的最高位加移码是在补码的最高位加1,故又称增码故又称增码 例例1.1.16 几个数的几个数的4位二进制补码和移码位二进制补码和移码 真值真值 补码补码 移码移码 +3 0011 1011 0 0000 1000 -3 1011 0011 显然,补码和移码的数值部分相同,而符号位相反显然,补码和移码的数值部分相同,而符号位相反 例例1.17 几个典型数的原码、反码、补码和移码表示几个典型数的原码、反码、补码和移码表示 由由表表1.2可可见见,,字字长长为为8位位时时,,原原码码、、反反码码的的表表数数范范围围为为+127~~-127,,而而补补码码的的表表数数范范围围为为+127~~-128。
这这是是因因为为负负数数的的补补码码是是在在其其反反码码上上加加1的的缘缘故故对对于于其其他他字字长长的的原原码码、、反反码的表数范围,读者可以举一反三地得到码的表数范围,读者可以举一反三地得到 从表中还看到:从表中还看到: · 反码有反码有+0与与-0之分 · 从从+128到到-128,,数数字字是是从从大大到到小小排排列列的的只只有有移移码码能能直直接接反反映映出出这这一一大大小小关关系系因因而而移移码码能能像像无无符符号号数数一一样样直直接接进进行大小比较行大小比较 5. 机器数的浮点与定点表示法机器数的浮点与定点表示法 ((1)机器数的浮点表示法)机器数的浮点表示法 一个十进制数可以表示为:一个十进制数可以表示为: N1==3.14159==0.314159×101==0.0314159×102 同样,一个二进制数可以表示为:同样,一个二进制数可以表示为: N2==0.011B==0.110B×2-1==0.0011B×21 一般地说,一个任意二进制数一般地说,一个任意二进制数N可以表示为:可以表示为: N==2E×M 式中:式中: · E——数数N的阶码;的阶码; · M——数数N的有效数字,称为尾数。
的有效数字,称为尾数 当当E变变化化时时,,数数N的的尾尾数数M中中的的小小数数点点位位置置也也随随之之向向左左或或向向右右浮浮动动因因此此将将这这种种表表示示法法称称为为数数的的浮浮点点表表示示法法对对于于这这样样一一个个式式子子,,在在计计算算机机中中用用约约定定的的4部部分分表表示示,,如如图图1.29所所示示其中,其中,Ef,,S分别称为阶码分别称为阶码E和尾数和尾数M的符号位的符号位 由由于于不不同同的的机机器器的的字字长长不不同同,,采采用用浮浮点点表表示示法法时时,,要要预预先先对对上上述述4部部分分所所占占的的二二进进制制位位数数加加以以约约定定,,机机器器才才可可以以自自动动识识别别按按照照IEEE 754:1985标标准准,,常常用用的的浮浮点点数数的的格格式式如如图图1.30所示6. 非数值数据的非数值数据的0、、1编码编码 计计算算机机不不仅仅能能够够对对数数值值数数据据进进行行处处理理,,还还能能够够对对文文本本和和其其它它非非数数值值数数据据信信息息进进行行处处理理非非数数值值数数据据是是指指不不能能进进行行算算术术运算的数据,包括文字、图形、图象和声音等。
运算的数据,包括文字、图形、图象和声音等 为为了了处处理理文文本本,,需需要要一一个个完完整整而而足足够够的的字字符符集集,,这这个个字字符符集最少应包括:集最少应包括: · 26个小写字母;个小写字母; · 26个大写字母;个大写字母; · 约约25个特殊字符,如:个特殊字符,如:[,,+,,-,,@,,|,,# 等;等; · 10个数字码:个数字码:0,,1,,2,,3,,4,,5,,6,,7,,8,,9 共共计计87个个字字符符这这87个个字字符符须须用用7位位“0”,,“1”进进行行编编码码常常用用的的编编码码形形式式有有两两种种::美美国国信信息息交交换换标标准准代代码码((ASCII))和和扩扩展展二二—十十进进制制交交换换代代码码((EBCDIC)),,所所有有小小型计算机和微型计算机都采用型计算机和微型计算机都采用ASCII码 表表1.3为为ASCII码码字字符符表表,,它它用用8位位来来表表示示字字符符代代码码其其基基本本代代码码占占7位位,,第第8位位用用作作奇奇偶偶校校验验位位,,通通过过对对奇奇偶偶校校验验位位设设置置“1”或或“0”状状态态,,保保持持8位位字字节节中中的的“1”的的个个数数总总是是奇奇数数((称称奇奇校校验验))或或偶偶数数((称称为为偶偶校校验验)),,用用以以检检测测字字符符在在传传送(写入或读出)过程中是否出错(丢失送(写入或读出)过程中是否出错(丢失1)。
ENQ((查查询询))、、ACK((肯肯定定回回答答))、、NAK((否否定定回回答答))等,是专门用于串行通信的控制字符等,是专门用于串行通信的控制字符 在在码码表表中中查查找找一一个个字字符符所所对对应应的的ASCII码码的的方方法法是是::向向上上找找b6b5b4向向左左找找b3b2b1b0例例如如,,字字母母’J’的的ASCII码码中中的的b6b5b4为为 100B(5H),, b3b2b1b0为为 1010B(AH) 因因 此此 ,,’J’ASCII码的为码的为1001010B(5AH)象形文字象形文字•公元前公元前5000至至4000年左右,有了埃及象形文字年左右,有了埃及象形文字•1799年,法国古文字学家们发掘出一块黑石碑年,法国古文字学家们发掘出一块黑石碑碑文用碑文用3种文字写成,分别是希腊文、古埃及象形种文字写成,分别是希腊文、古埃及象形文字和后期的埃及文字法国古代语学者研究并文字和后期的埃及文字法国古代语学者研究并设法释读了古埃及的象形文字设法释读了古埃及的象形文字象形文字象形文字•汉字虽然还保留象形文字的特征,但由于汉字除汉字虽然还保留象形文字的特征,但由于汉字除了象形以外,还有其他构成文字的方式;而汉字了象形以外,还有其他构成文字的方式;而汉字经过数千年的演变,已跟原来的形象相去甚远,经过数千年的演变,已跟原来的形象相去甚远,所以不属于象形文字,而属于形、音、义相结合所以不属于象形文字,而属于形、音、义相结合的的“表意文字表意文字”。
2. 汉字的汉字的0、、1编码编码智能ABC全 拼五笔字型自 然 码┆外码键盘管理程序码表机内码字库检索程序字库字模显示驱动程序控制信号汉字编码方案汉字编码方案•· GB2312-1980和和GB2312-1990,共收录,共收录6763个简体汉字、个简体汉字、682个符号,其中汉字个符号,其中汉字分为两级:一级字分为两级:一级字3755,以拼音排序,二级字,以拼音排序,二级字3008,以偏旁排序以偏旁排序•· BIG5编码,是目前台湾、香港地区普遍使用的一种繁体汉字的编码标准,包编码,是目前台湾、香港地区普遍使用的一种繁体汉字的编码标准,包括括440个符号,一级汉字个符号,一级汉字5401个、二级汉字个、二级汉字7652个,共计个,共计13053个汉字•· GBK编码编码——《《汉字内码扩展规范汉字内码扩展规范》》(俗称大字符集),兼容(俗称大字符集),兼容GB2312,共收,共收录汉字录汉字21003个、符号个、符号883个,并提供个,并提供1894个造字码位,简、繁体字融于一库个造字码位,简、繁体字融于一库•· Unicode编码编码(Universal Multiple Octet Coded Character Set),国际标准组织,国际标准组织ISO的标准,的标准,V2.0于于1996公布,内容包含符号公布,内容包含符号6811个,汉字个,汉字20902个,韩文拼音个,韩文拼音11172个,造字区个,造字区6400个,保留个,保留20249个,共计个,共计65534个。
个•· GB 18030-2000——2000年年3月国家信息产业部和质量技术监督局在北京联合发月国家信息产业部和质量技术监督局在北京联合发布的布的《《信息技术和信息交换用汉字编码字符集、基本集的扩充信息技术和信息交换用汉字编码字符集、基本集的扩充》》,收录了,收录了27484个汉字,还收录了藏、蒙、维等主要少数民族的文字个汉字,还收录了藏、蒙、维等主要少数民族的文字•该标准于该标准于2000年年12月月31日强制执行日强制执行 GB 18030-2000 作为作为 GBK for Unicode 汉字的输入汉字的输入——汉字外码汉字外码 •按排列顺序形成的汉字编码(流水码):按排列顺序形成的汉字编码(流水码): 如区位码;如区位码;•按读音规则形成的汉字编码(音码),如按读音规则形成的汉字编码(音码),如 全拼、简拼、双拼等;全拼、简拼、双拼等;•按字形形成的汉字编码(形码),如按字形形成的汉字编码(形码),如 五笔字型、郑码等;五笔字型、郑码等;•按音、形结合形成的汉字编码(音形码),如按音、形结合形成的汉字编码(音形码),如 自然码、智能自然码、智能ABC。
汉字的字模汉字的字模 汉字字模的原汉字字模的原理与西文字符理与西文字符的字模基本相的字模基本相同,只是由于同,只是由于汉字笔画复杂,汉字笔画复杂,为了表达清晰,为了表达清晰,要比西文字符要比西文字符须要更多的点须要更多的点阵 图图1.34 一个一个24×24点阵的汉字字模示例点阵的汉字字模示例汉字系统的工作过程汉字系统的工作过程•①① 用一种输入方法从键盘输入汉字用一种输入方法从键盘输入汉字•②② 键盘管理程序按照码表将外码变换成机内码键盘管理程序按照码表将外码变换成机内码•③③ 机内码经字库模检索程序查对应的点阵信息在机内码经字库模检索程序查对应的点阵信息在字模库的地址,从字库取出字模字模库的地址,从字库取出字模 •④④ 字模送显示驱动程序,产生显示控制信号字模送显示驱动程序,产生显示控制信号•⑤⑤ 显示器按照字模点阵将汉字字形在屏幕上显示显示器按照字模点阵将汉字字形在屏幕上显示出来王永民与五笔字型王永民与五笔字型•出生河南南阳农民家庭,家境贫寒,父母扒房供其读书出生河南南阳农民家庭,家境贫寒,父母扒房供其读书•从小立大志:从小立大志:“翻开物理课本、化学课本,为什么都是外翻开物理课本、化学课本,为什么都是外国人的名字和人头像?中国人为什么不能有自己的发明创国人的名字和人头像?中国人为什么不能有自己的发明创造,然后把自己印进课本去?造,然后把自己印进课本去?”,考入中国科技大学,考入中国科技大学•1982年五笔字型汉字输入法和时任河南省副省长、河南省年五笔字型汉字输入法和时任河南省副省长、河南省科委主任的罗干科委主任的罗干•1978至至1983年,发明年,发明“五笔字型五笔字型”,提出,提出“形码设计三原形码设计三原理理”,首创,首创“汉字字根周期表汉字字根周期表”,发明,发明25键键 4码高效汉字码高效汉字输入法和字词兼容技术。
在世界上,首破电脑汉字输入每输入法和字词兼容技术在世界上,首破电脑汉字输入每分钟分钟 100字大关,获中、美、英三国专利字大关,获中、美、英三国专利•王永民现任中国科协委员、中国民营科技实业家协会副理王永民现任中国科协委员、中国民营科技实业家协会副理事长、北京王码电脑总公司总裁事长、北京王码电脑总公司总裁1.2.4 图像的图像的0、、1编码编码((1)图像类型)图像类型•矢量图(矢量图(vector graphice)法:用一些基本的几何元素)法:用一些基本的几何元素(直线、弧线、圆、矩形等)以及填充色块等描述图像,(直线、弧线、圆、矩形等)以及填充色块等描述图像,并用一组指令表述这种图像一般称为图形或合成图像并用一组指令表述这种图像一般称为图形或合成图像•位图(位图(bitmapped graphics)法:用点阵描述图像,并用)法:用点阵描述图像,并用一组一组0、、1码数据描述这种图像也称为位图码数据描述这种图像也称为位图2)图像处理过程)图像处理过程•离散处理离散处理•采样采样•量化量化1. 图像的离散化图像的离散化•离散化后的图像被看成离散化后的图像被看成一个由一个由MⅹN的像素的像素((picture-elements,,piel)点阵组成的图。
每)点阵组成的图每个像点都是一个单色的个像点都是一个单色的小方块,放大了就是马小方块,放大了就是马赛克图像中像素点的赛克图像中像素点的密度称为图像分辨率密度称为图像分辨率((image resolution),),单位为单位为dpi((dots per inch,每英寸像点数)每英寸像点数) 2. 采样与量化采样与量化 采样(采样(sampling)就是在每个小块中取它的颜色参数,将它的颜色进行分)就是在每个小块中取它的颜色参数,将它的颜色进行分解,计算出红、黄、蓝(解,计算出红、黄、蓝(R、、G、、B)三种基色分量的亮度值将每个采)三种基色分量的亮度值将每个采样点的每个分量进行样点的每个分量进行0、、1编码,就称为量化编码,就称为量化 目前,像素深度有如下一些标准类型:目前,像素深度有如下一些标准类型:•黑白图(黑白图(Black & White)颜色深度为)颜色深度为1,只有黑白两色只有黑白两色•灰度图灰度图(Ggay & Scale)颜色深度为颜色深度为8,,256个灰度等级个灰度等级•8色图色图(RGB 8-Color)颜色深度为颜色深度为3,用,用3基色产生基色产生8种颜色。
种颜色•索引索引16色图色图(Indexed 16-Color)颜色深度为颜色深度为4,建立调色板,提供,建立调色板,提供16种颜种颜色•索引索引256色图色图(Indexed 256-Color)颜色深度为颜色深度为16,建立调色板,提供,建立调色板,提供256种颜色•真彩色图真彩色图(RGB True Color)颜色深度为颜色深度为24,提供,提供16 777 216种颜色,大种颜色,大大超出人眼分辨颜色的极限(大超出人眼分辨颜色的极限(16 000种)颜色深度也可以是种)颜色深度也可以是32,更为真,更为真实3. 位图图像的存储位图图像的存储一幅数字图像,常用一个文件存储,存储空间为:一幅数字图像,常用一个文件存储,存储空间为: 文件字节数文件字节数=(位图宽度(位图宽度ⅹ位图高度位图高度ⅹ位图颜色深度)位图颜色深度)/81.2.5 声音的声音的0、、1编码编码1. 声音数据的编码过程声音数据的编码过程· 采样采样就是每隔一定的时间,测取连续波上的一个振幅值· 量化量化就是用一个二进制尺子计量采样得到的每个脉冲000000010010001101000101011001110111100010011010101111001101111011111011 1101 1110 1111 1111 1110 1110 1011 0100 0001 0000 0000 0001 0010 01002. 两个技术参数两个技术参数•采样频率采样频率•采样频率定律采样频率定律 采样频率与信号频率之间有采样频率与信号频率之间有一定的关系,根据奈奎斯特一定的关系,根据奈奎斯特理论,只要采样频率高于信理论,只要采样频率高于信号最高频率的两倍,就能把号最高频率的两倍,就能把数字信号表示的信号还原成数字信号表示的信号还原成为原来的连续信号。
为原来的连续信号•语音信号频率为语音信号频率为3.4kHZ,采样频率为,采样频率为8kHZ即可满即可满足服务质量足服务质量 •测量精度测量精度1.2.6 指令的指令的0、、1编码与计算机程序设计语言编码与计算机程序设计语言 •指令格式指令格式•指令系统指令系统•计算机程序设计语言计算机程序设计语言操作码操数据地址1操作数地址2 结果数据地址1.2.7数据传输中的差错检验数据传输中的差错检验•抗干扰码可分为检错码和纠错码抗干扰码可分为检错码和纠错码•检错码是指能自动发现差错的码检错码是指能自动发现差错的码•纠错码是指不仅能发现差错而且能自动纠正差错纠错码是指不仅能发现差错而且能自动纠正差错的码 1. 奇偶校验码奇偶校验码•每每传传送送一一个个信信息息码码组组,,都都要要传传送送一一位位附附加加的的冗冗余余校校验验位位;;该该校校验验位位可可以以作作为为码码字字的的最最高高位位,,也也可可以以作作为为码码字字的的最最低低位位,,使使得得整整个个字字符符码码组组((共共8位位))中中1或或0的的数数目目为为奇奇数数或或偶偶数数对对于于奇奇校校验验,,1(或或0)的的数数目目为为奇奇数数为为合合法法码码;;为为偶偶数数,,便便是是非非法法码码。
对对于于偶偶校校验验,,1(或或0)的的数数目目为为偶偶数数为为合合法码;为奇数,便是非法码法码;为奇数,便是非法码• 由此,可以设计出校验逻辑:由此,可以设计出校验逻辑:• P’= C7 C6 C5 C4 C3 C2 C1 C0 P (( P为为校验位值)校验位值) P’=0,,无错;无错;P’=1,,有错• 这这种种校校验验方方法法能能检检测测出出传传输输中中任任意意奇奇数数个个错错误误,,但但不不能检测出偶数个错误能检测出偶数个错误。












