
【精品】数据输入和输出46.ppt
72页第4章 数据输入和输出,4.1 用户界面的发展过程 4.2 汉字的输入码 4.3 输入设备 4.4 汉字的输出码 4.5 输出设备,4.1 用户界面的发展过程,用户界面的发展过程可分作三个主要阶段: (1) 0、1符号式用户界面在计算机发明的最初10年中,用户通过开关、板键或穿孔纸带向计算机输入程序、数据或命令,计算机通过指示灯、打印机等输出程序的运行结果这时输入输出使用的开关、板键、穿孔纸带、指示灯、打印机等都采用0、1符号方式,因此称作0、1符号式用户界面用户使用这种方式的用户界面非常困难2) 字符显示式用户界面从20世纪50年代中期到20世纪70年代后期,用户界面以字符显示为主要特征这时用户通过键盘输入字符型的程序、数据或命令,计算机把运行结果以字符方式显示在显示器上或打印在打印机上这种方式用户界面的优点是用户使用灵活、方便,缺点是输出显示不直观,用户仍需记住许多东西(如命令的单词拼写、格式等)图4-1(a)是一个字符方式用户界面的示例图中,字符串copy d:*.c a: 是用户输入的命令,其中,copy是命令符,表示拷贝命令;字符串d:*.c a:是命令参数,表示D盘根目录下所有以.c为后缀的文件是要拷贝的源文件,A盘(即软盘)是要拷贝的目标盘。
该命令表示把D盘根目录下所有以.c为后缀的文件拷贝到A盘中3) 图形显示式用户界面从20世纪80年代初期至今,用户界面的主流是图形方式的用户界面图形方式用户界面的主要特征是计算机显示采用窗口、图符、菜单等图形方式,用户输入设备除键盘外,增加了鼠标这种指点式输入设备这种方式的用户界面显示直观、操作简便、掌握快当然图形方式用户界面对硬件资源和软件资源要求都很高图4-1(b)是一个图形方式用户界面的示例用户可用鼠标选择菜单的某一项(如粘贴)让计算机执行该菜单项对应的操作,用户也可以用鼠标双击某个图标(如打开图标)让计算机执行该图标对应的操作在图形方式下,用户是通过选择菜单项或双击图标来输入命令的虽然图形方式下用户使用命令的方法和字符显示方式不一样,但一条命令在计算机内部的表示格式都相同Microsoft(R) Windows 95 (C)Copyright Microsoft Corp 1981-1996. C:WINDOWScopy d:*.c a:,图4-1 用户界面 (a) 字符显示式用户界面,图4-1 用户界面 (b) 图形显示式用户界面,4.2 汉字的输入码,4.2.1 拼音码 按汉字拼音规则对汉字进行的编码称为拼音码。
因为凡识字且能正确发音的人基本上都懂汉字读音和拼音的对应关系,所以拼音码有相当的用户使用基础,这是拼音码的优点但是,中文不是拼音文字,使用拼音码输入汉字也有许多问题这主要表现在:汉字的读音都是单音节的,汉语拼音中仅有24个声母和34个实用的韵母,仅能组成413个实用的拼音编码音节如果把GB231280中的6763个汉字按413个音节平均分配,那么重码率在5个以上如果把全部6万多个汉字按413个音节平均分配,那么重码问题将严重到无法使用重码率高是拼音码的缺点 全拼码和双拼码是两种最有影响的拼音码编码方法拼音码构造的汉字集都是GB231280中的6763个常用汉字1. 全拼码 我们把给汉字编码的拼音、笔形等基本特征信息元素称为汉字编码的码元把汉语拼音的每个符号都取为码元的汉字编码称为全拼码全拼码的码元共有25个,除码元符号“”外,其他码元符号和键盘符号是一一对应的码元符号“”的键盘符号是“v”例如,“率”字的全拼码为lv 全拼码的击键次数较多例如,“想”字的全拼码为xiang,用户需击键5次另外,当出现重码时还需击键进一步做出选择所以,使用全拼码时用户输入每个汉字时敲击键盘的次数较多。
拼音码的重码率较高例如,“计”字的全拼码码元为ji,“算”字的全拼码码元为suan,“机”字的全拼码码元为ji计”字和“机”字的全拼码码元相同 用户输入全拼码的码元suan后,可看到如下4个重码: suan:1酸;2算;3蒜;4狻 用户输入全拼码的码元ji后,可看到如下13屏共118个重码:,ji:1几;2及;3急;4既;5即;6机;7鸡;8积;9记; 1级;2极;3计;4挤;5己;6季;7寄;8纪;9系; 1基;2激;3吉;4脊;5际;6击;7圾;8畸;9箕; 1肌;2饥;3迹;4讥;5姬;6绩;7棘;8辑;9籍; 1集;2疾;3汲;4嫉;5蓟;6技;7冀;8伎;9剂; 1悸;2济;3寂;4忌;5妓;6继;7丌;8乩;9剞; 1佶;2墼;3芨;4芰;5蒺;6蕺;7掎;8叽;9咭; 1哜;2唧;3岌;4嵴;5洎;6屐;7骥;8畿;9玑; 1楫;2殛;3戟;4戢;5赍;6觊;7犄;8齑;9矶; 1羁;2嵇;3稷;4瘠;5虮;6笈;7笄;8暨;9跻; 1跽;2霁;3鲚;4鲫;5髻;6麂;7革;8给;9稽; 1缉;2祭;3期;4其;5奇;6齐;7偈;8诘;9荠; 1亟,2. 双拼码 分析全拼码可以发现以下三点: (1) 拼音由声母和韵母组成,在组成拼音时,声母在前,韵母在后。
(2) 拼音符号到拼音音节的组合不是任意的,拼音符号只能组合出有限个拼音音节例如,拼音符号a, n, g只能组成韵母音节a, an和ang (3) 音节是拼音的独立使用元素例如,拼音fang是由声母音节f和韵母音节ang组成的双拼码是把声母和韵母中的多个符号用一个键盘符号表示的编码双拼码共有57个码元,使用了27个键位(除26个字母符号外,增加一个符号“;”)双拼码的57个码元分作声母和韵母两大类键位和声母、韵母的对应关系见表4-1表4-1 双拼码键位和声母、韵母对应关系表,4.2.2 笔形码 汉字不是拼音文字,从汉字本身看不出它的读音,所以,拼音码之所以重码多,是因为拼音码从汉字的弱点出发构造编码,自然编码效率不会很高 汉字是由若干笔划组成的方块字,笔形码就是从汉字的笔形出发构造汉字的编码和拼音码相比,笔形码的优点是可编码的汉字集大,一般可在基本无重码的情况下编码出所有的6万多个汉字但和拼音码相比,笔形码的缺点是用户需要记忆的东西较多目前已提出了几百种不同的笔形码仓颉码和五笔字型码是两种编码方法较科学,且应用较多的笔形码仓颉码是朱邦复1976年发明的,是最早的笔形码之一。
但仓颉码在中国台湾、香港等地区使用较多,在大陆使用较少五笔字型码是王永民于1983年发明的五笔字型码在大陆使用较普遍下面我们简单介绍五笔字型码的编码方法 五笔字型码的编码特点是:把汉字分成三个层次、五种笔划、130个字根,以字根为编码码元、以三种字型拆分汉字、每字最多4码下面我们概要介绍五笔字型码中的一些概念和编码方法 1. 汉字的三个层次 汉字由笔划、字根、单字三个层次组成在书写汉字时,不间断地一次连续写成的线条称为笔划由若干笔划复合形成的相对不变的结构叫字根由若干字根组成汉字的单字 2. 五种笔划 经过对汉字所有笔划的归类,五笔字型码确定了五种基本笔划:横、竖、撇、捺、折并按照使用频度的高低,分别用数字1,2,3,4,5代表五种基本笔划见表4-2表4-2 汉字的五种基本笔划,3. 130个字根 汉字的字根有很多个,在五笔字型码中,把那些组字能力很强、使用频度很高的字根选为五笔字型码的字根,这样的字根共有130个 要使用标准键盘输入汉字,就需要把130个字根对应到键盘的26个英文符号键位上为此,五笔字型码把130个字根分成五个区,每区五个位,每位包括若干个字根,对应标准键盘的一个英文符号键。
这样,除英文符号Z键不对应任何字根外,其余25个英文符号键就分别对应划分成五个区25个位表4-3是五笔字型码的字根和键盘对应关系表表中英文字母旁边的数字表示该组字根所属的区和位例如,英文字母Q旁边的数字35表示该组字根属第3区的第5位4. 三种字型 汉字可以由字根构成,但相同字根的不同排列方式将构成不同的汉字字根“口”和“八”上下排列是“只”字,字根“口”和“八”左右排列是“叭”字五笔字型码把汉字分成三种字型:左右型、上下型、杂合型凡不能归入左右型和上下型的汉字,均归入杂合型在组字时,左右型的数字代号为1,上下型的数字代号为2,杂合型的数字代号为35. 编码规则 五笔字型码的编码规则是: (1) 字根是编码的码元在把汉字拆分成若干个字根时,要拆出尽可能大的字根例如,“佃”字就只能拆分成字根“人”和“田”,而不能拆分成字根“人”、“口”、“十” (2) 字根的编码顺序和汉字从左到右、从上到下、从外到内的书写顺序一致如“明”字的书写顺序是先“日”后“月”,字根“日”对应键位J,字根“月”对应键位E,所以“明”字编码的前两个码元是JE3) 最多只取4码,当字根多于4个时,取前3个字根和最后一个字根作为编码码元。
(4) 末笔与字型交叉克服重码例如,在S键位上有“丁、西、木”三个字根,当它们左边加上三点水将分别构成汉字“汀、洒、沐”三点水的键位为I,这样,“汀、洒、沐”三个字的编码都是IS,将出现重码补充末笔与字型交叉识别的编码规则后,“汀”字的末笔笔划对应的数值是2,“洒”字的末笔笔划对应的数值是1,“沐”字的末笔笔划对应的数值是4;又因这三个字的字型都是左右型,对应的数值是1五笔字型码的编码能力分析:因为五笔字型码是把字根作为编码码元,把130个字根按使用频度基本均分在25个键位上,最长为4个码元的编码方法,所以五笔字型码最多可编码254个汉字,即五笔字型码的最大编码能力超过39万考虑到五笔字型码的码元个数通常不足4个的情况,以及字根使用频度不均匀的情况,五笔字型码的编码能力也可达到数万个,这和汉字的总数基本相同编码能力强、无重码是五笔字型码的最大优点4.2.3 使用词组的汉字输入方法 汉语通常是以单词组词使用的,因此,近年来,许多研究快速输入汉字方法的科技人员设计出了各种形式的词库,可帮助用户实现汉字的快速输入目前的实验表明,用户在具有了个性化的汉语词组库的基础上,计算机输入汉语的速度较输入英语的速度高许多。
帮助用户快速输入汉字的词组主要有固定词组和随机词组两种无论是固定词组还是随机词组,都是以前面讨论的拼音码和笔形码为基础来输入的在拼音码和笔形码输入方法的基础上,使用固定词组或随机词组可以大大提高用户输入汉字的速度1. 固定词组 固定词组是设计人员在大量调查分析的基础上,归纳整理出的常用的汉语词组库,并把这种词组库设计成软件提供给用户使用用户使用固定词组的方法是:用户键入需输入词组的前面一个或若干个汉字,软件将自动显示出以用户输入的一个或若干个汉字为前缀的固定词组库中的所有词组,用户输入的词组前缀越长,软件自动显示出的词组个数越少(即重码率越低),用户只需进行若干次键盘选择,就可完成一个词组的输入例如,使用包括固定词组功能的全拼码输入单词“计算中心”时,如果用户只键入“计”字的码元ji,并在输入码元ji下选择了汉字“计”,则软件将分屏自动显示出词组库中所有以“计”字为第一个汉字的词组如下: 1计策;2计分;3计划;4计划成本;5计划分配;6计划供应;7计划经济;8计划经济与市场调节;9计划内;0计划生育 1计划调节;2计划外;3计划委员会;4计划成本;5计划指标;6计划供应;7计经委;8计量;9计量单位;0计量局 1计上心来;2计时;3计时工资;4计算;5计算方法;6计算机;7计算器;8计算中心;9计委,此时用户需选择到第三屏,然后再选择8才能完成词组“计算中心”的输入。
如果用户键入前缀“计算”的码元jisuan,并在输入码元jisuan下选择了词组“计算”,则软件。