好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

录入校对子系统.doc

19页
  • 卖家[上传人]:鲁**
  • 文档编号:557436063
  • 上传时间:2023-11-21
  • 文档格式:DOC
  • 文档大小:103.51KB
  • / 19 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 录入校对子系统1、 现代校对技术概述现代校对技术采用三校一读对片制度三校”即三个校次,这是必须坚持的最低限度的校次一读”即终校改版后的通读检查 现代的“三校一读”,校法和任务各不相同一校、二校以对校为主,操作上采用点校、折校等方式,任务是消灭录排差错;三校以本校为主,任务是发现并质疑原稿错讹;一读是最后通读检查磁盘书稿校对,由于原稿与校样合二为一,一校没有可资比照的原稿,则应采用本校法,通过是非判断发现录排差错和原稿错讹一校改版后打出二校样,一校样就成为二校的比照物,所以二校时应先对红,然后再进行二校三校样打出后,校法同二校如前所述,三个校次是最低限度的校次,特殊的书稿,特殊的情况,还须相应增加校次对片是当代校对制度的创新,它是计算机排版制片新工艺的产物计算机排版制片,有可能发生文字错乱丢失,因此制片完成后,必须将胶片一一与清样对照对照的方法是:将胶片压在清样上面,通过移动胶片,使胶片上的字符图表与清样完全对合,如发现不能完全对合,则要采用对校法,将胶片与清样对校在校对软件方面,除了OCR校对软件外,还有以下两种功能的商业化软件产品:(1).语文校对针对文章和数据中的中文说明部分,利用文章校对软件的汉语语料库和汉语切分技术、汉语语法分析技术、汉语依存关系分析技术,精确校对中文文字、句法、标点、计量单位、异形词和重句等各类错误和不规范。

      此步属校是非,校对员根据校对结果比对校样与原稿的异同,在判定是非的基础上进行修改2).双文对校不同的录入人员同时录入一份文件,或者,一份采用OCR录入,另一份采用人工录入,两者在同一处出现同样的错误的几率几乎为零,利用双文对校软件对比这两个文件,就能迅速地发现录入稿和原稿中存在的各种错误采用双文对校的方式,成本要低于人工折校的校对费用,而准确率又远远高于人工折校,是替代传统的人工折校的理想工具年鉴、档案、技术报告三校稿有没有改错的地方,二校的修改意见都改了没有?单靠人工校对难免会有遗漏和失误,用双文对校软件比对二校稿和三校稿,所有不同之处尽显眼前,轻松完成核红工作,确保出版物的准确无误通过智能比对原文件和修改后的文件的异同,能够准确地显示和统计编辑人员的修改工作所有不同之处都会准确地标记出来智能定位对比功能确保比对结果的完美性提供添加、删除和修改等标记手段,可以突出显示各种标记2、 现代录入技术概述对于有纸数据,采用扫描录入方式形成电子影像,然后,将文字数据用OCR系统软件识别后存档,将图形数据用矢量化软件矢量化后存档,目前,这种录入方式的录入速度是手工录入速度的5倍左右,如果采用先进的软件系统,录入质量不低于人工录入质量。

      在现代数据中,很多数据是自动采集的,有些作者直接用电脑创作,这些数据不需要录入,但仍然需要校对现代录入技术的发展和数据库技术对校对技术提出了新的要求,首先,用于出版业的传统校对技术的一些环节是有纸的,而基于扫描的录入技术已经得到了影像化的原稿,对数据库工作而言,后续的校对工作最终成果都是无纸化的,纸张校对只是作为一种辅助形式,纸张输出不是最终目的只要电子数据规范准确,可以采用任何形式输出,不仅仅用于打印出版其次,简单实用的对片操作显然可以用于校对的每一个环节,而不只是最后一个环节这是现有软件开发技术可以实现的3、 数据质量要求基础水文数据是水文数据中种类最多、质量最高、数据量最大、且代代相传的数据,是对地球水圈的最真实最完整记载,地球水圈也是子子孙孙们的生存环境,基础水文数据是他们改造地球水圈的重要依据,所以基础水文数据质量高低关乎千秋万代必须采用较高的数据质量标准,电算整编数据、分析图和计算参数按差错率小于1/20000控制,其他数据按出版业标准的1/10000误码率控制数据质量高低主要取决于入库之前的数据处理水平和手段,数据处理手段必须建立在数据处理业务的模式化规范化基础之上,由于录入校对要求的文化素质不高,必须有固定且简洁的工艺要求,才能保证做到人人做得好做的快。

      所以必须建立科学合理的录入校对工序要满足控制误码率的要求,必须靠工序和质量体系,并不是把数据输入到电脑就万事大吉了4、 数据校对工序在信息转移过程中,有可能因转移造成信息损失和变化的,如抄写、纸介质手工录入,都必须校异同,不会造成信息损失和变化的,如复印、计算机复制,网络传输等,不必校异同前者是有损转移,后者是无损转移在信息转移过程中,信息表示形式也有可能发生变化,有些信息转移是同形式转移,如纸上文字打字进电脑,结果还是文字,有些信息转移则是异形的,如纸上图形,采样后以数字形式输入电脑有些信息转移自始至终都是无损的,好像没有原稿一样,又好像都是原稿,如信息采集系统和遥测系统采集传输的数据,没有纸质原稿,我们把数据按有纸质原稿和无纸质原稿分为有纸数据和无纸数据两类,办公无纸化是信息化的必然趋势,在水文数据中,无纸数据越来越多,有纸数据越来越少根据信息转移是否异形转移,将纸质原稿分为同形原稿和异形原稿两类,显然,对结构化水文数据而言,矢量化数据的原稿为异形原稿,其他文字数字数据的原稿为同形原稿无纸质原稿的数据转移是无损的,不必校异同,由于当今OCR系统的识别率均未达到100%,所以有纸质原稿的文字数据转移必然是有损的。

      现有矢量化系统仍然存在遗漏和误判,经过矢量化实现的异形转移也是有损的,也必须校异同同一原稿校对的每道工序由不同的人完成,禁止同一个人完成两道或两道以上工序,每道工序的完成者都必须在文件的属性中填写自己的姓名和完成日期为利于校审和校红,每道工序均必须完整保留前一道工序的结果,即,在同一校样文件中既有本道工序的修改,也有上一道工序的全部结果,修改操作只是逻辑上的改动,校稿上被删掉的信息也是可以直接找回的,不因修改而在物理上丢弃校稿上的任何信息,导致校稿上的部分信息无法找回Word系统具备此功能,将Word设为修订模式且不做接受修订或拒绝修订操作,可以保留前一道工序的结果并直观显示修改点5、 有原稿数据的校对工序设计(1)初校(2)初核利用对片功能,逐文件比对初校结果和原稿影像,发现重叠校样上有合体字则修改,没有则说明初校已通过其修改操作与初校完全相同核完后接受修订,形成二校样3)二校因原稿不清晰或印刷不规范等对片软件不适应的原因,原稿不适合机校或初校质量难以达标时,应进行二校,二校为人工校对,二校比对初核的结果(即二校样)与原稿影像,并修改,应校对每一个字和数字矢量化结果必须有二校4)二核核查二校的修改,将二校红样上修改之处与原稿比对,并修改,核完后接受修订,形成三校样。

      5)校勘以上两个校次的校对和核红属于校异同,是处理校样与原稿文字不同之类的低级错误,这两个校次的校对员和核红人员也可以校是非,但这不是本项目的强制性要求,而校勘既是校是非,也要校与是非有关的异同,与是非无关数据的异同校对不是强制性要求校勘在校对之后,对于有原稿的数据而言,校勘也称为三校,是三校稿和原稿的校对,对无纸数据而言,校勘是一校,是对原稿的校对,校勘分为本校和他校两个方面,“本校者,以本书前后互证,则知其中之谬误他校者,以他书校本书对电子水文数据而言,仅仅利用同一数据文件内的数据关系进行合理性检查,就是本校,利用其他数据文件中的数据,按其与本文件数据之间的计算和逻辑关系校对本文件中的数据,就是他校,通常所说的跨表校对就属他校,在本章数据同化部分的生成全信息序列软件就有他校功能,整编软件大多具备他校功能,信息服务软件的图形化输出功能也可用于图形化形式的本校和他校,语文校对软件提供对文章片断的语法校对,属于本校,除了语文校对软件、整编软件、数据同化软件和信息服务软件提供的校勘功能之外,其他的校勘功能都在数据校验软件之中,所以,校勘是综合利用数据校验软件、整编软件、数据同化软件、语文校对软件和信息服务软件系统提供的校勘功能对数据进行合理性检查,然后根据合理性检查结果,参照本文件的原稿影像和相关数据的原稿影像修改数据。

      以逻辑错误校改为主无论数据是否为有纸数据,都必须校勘,矢量化结果也不例外经过校勘后的结果,称为校勘红样6)勘核凡经过校勘的数据,必须同原稿比对,核查校勘时的修改,遇错则改,核完后接受修订,形成核定样7)抽审在核定样中选取5%作为样本,集中勘测局各业务部门的数据处理骨干,逐字比对核定样和原稿,发现错误则修改并统计误码率,公布各校对单位的误码率,作为校对工作的考核依据, 以便各校对单位改善校对措施,提高校对质量抽审采用集中会议形式,各勘测局派出两名校对和业务骨干参加,对校对质量高的勘测局应予以表彰6、 录入校对软件开发(1)对片(2)文章播放校审人员可利用文章播放软件远距离修改文章,文章播放软件将文章或数据文件按大屏显示器单屏可输出的文字量将文件分页,然后按页序逐页以大字显示,并以普通话自动朗读文章,校审员随时可中断播放,转入修改,显示字体、字号、字色、是否自动朗读和多长时间翻页可设置文章中含有音频的,翻页到该音频时会自动播放,文章中含有视频的,翻页到该视频时会自动在大屏显示器上全屏播放文章播放软件不仅可播放XML文件和其他文本文件,还可以把校样和原稿影像对片叠加起来播放,支持校对审核人员远距离快速修改文章。

      3)影像流化图像音频视频除应保存其原始形态外,还应保存其转化为流格式后的形态(即流媒体形态),以利于流式播放单幅的原稿影像还应按年份站点和字组类型组织,并按照SMIL3标准语法流化,生成有时间控制的图片串接,并保存为SMIL文件,使用户可以在独立的主流播放器或嵌入在网页中的播放器以流媒体形式播放4)数据校验检查数据格式错误和逻辑错误,并指出错误位置和错误性质不仅可以查出数据个数不对、非法字符等格式错误,而且可以根据水文数据的生成规律和排布规律对数据进行合理性分析,程序对所有运算关系的数据都应进行了运算校验,应能按电算整编和相关规范对计算结果舍入后再与有关数据进行相等比较在出现合并、空值等各种情况下的计算方法也完全符合整编规范或相关规范数据校验用于分析数据一致性和可靠性,属于校是非,包括运算校验、范围校验、平滑校验等运算校验是根据各序列之间的计算公式进行校验;范围校验则根据数据的取值范围对数据进行越界检查,或根据变幅的取值范围对数据进行变幅越界检查,含字符匹配校验;平滑校验帮助用户找到突变点数据校验分为入库前的数据校验和入库后的数据校验两个部分数据校验软件应具备批量操作功能,程序可一次检查一个目录下所有各级子目录中的文件,支持用户使用文件通配符。

      为避免功能重复,数据校验不实现序列分析软件提供的图形化校验和时序一致性分析功能,也不提供实时整编软件和年鉴还原软件提供的合理性检查功能,但是,数据校验软件应提供这些系统未提供的其他合理性检查功能7、 录入校对大致分工录入校对工作采用各勘测局分散录校和省局集中录校相结合的方式,由于扫描录入的关键设备和软件在省局,扫描和录入工作应在省局集中完成,勘测局设备可录入的零星数据可由各分局完成各勘测局校对本辖区的数据,校对数据量较大,超出勘测局设备处理能力的部分由省局集中校对,矢量化数据由省局集中校对,校红和数据审查在省局完成8、 校对工作量及费用按上文所述,有纸数据的校对采用三校三核一审七道工序,无纸数据采用一校一核一审三道工序,因校勘部分几乎采用了所有的检查手段,当可保证数据质量抛开不需要校对的图形视频数据和电算整编数据不谈,按紧凑格式计算,十二五之前的其他数据大约2G,其中,无纸数据约为1.5G,有纸数据约为0.5G,由于现有无纸数据均未经过跨表校对和图形校对,某些数据虽然经过一些校对,但由于采用的校对方式单一,数据质量达不到1/10000的标准要求,这些数据应严格按本项目的工序和要求进行校对,才能确保数据质量。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.