电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

爱如生数据库与翰堂典藏数据库的对比

6页
  • 卖家[上传人]:m****
  • 文档编号:491139300
  • 上传时间:2023-05-05
  • 文档格式:DOC
  • 文档大小:21.51KB
  • / 6 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、爱如生数据库与翰堂典藏数据库的对比一 简介爱如生数据库:爱如生数据库包括中国方志库,中国谱牒库 ,中国丛书库,中国类书库,中国俗文库,中国经典库,敦煌文献库,申报数据库以及中国基本古籍库。各据善本,采用爱如生独有的数字再造技术制作,还原式页面,左图右文逐页对照,眉批、夹注、图表无障碍显示;毫秒级全文检索,可编辑、下载和打印。其中,中国基本古籍库由四个子库构成: 哲学库、史地库、文艺库、综合库,共20 大类,收录自先秦至民国历代典籍1 万种,17万卷,版本12500 个、20 万卷,全文17 亿字、影像1200万页,数据总量约320G。翰堂典藏:翰堂典藏古籍数据库是由北京时代瀚堂科技有限公司推出的核心产品,其采用基于Unicode 四字节编码和自然语言全文检索的典籍文献数字化构建。瀚堂典藏古籍数据库由14 个子库构成: 小学工具、类书集成、出土文献、中医药文献、经部集成、史部集成、子部集成、集部集成、古典戏曲、古本小说、佛教典籍、道教典籍、敦煌文献、专题文献。瀚堂典藏加工入库的图书自先秦至民国,从甲骨文到近代文献约有10190 种,图片数量约1200 万张,文字总量超过15 亿字,可全文

      2、检索和连续图文对照阅读的记录条目1500 万条以上,并持续定期增加中。二收录内容及标准中国基本古籍库所收历代典籍及所附重要版本,均经严格筛选。1.收书标准: 历代名著,各学科基本文献,有拾遗补阙意义的特殊著作; 2.选本标准: 完本而非残本、现存最早之本或晚出精刻精钞精校本;未经删削窜改之本。瀚堂典藏1.收书标准: 加工小学工具类,包括古代字书、韵书等瀚堂具有加工和管理优势的图书。这类图书是瀚堂典藏全库的基础;由于瀚堂典藏可以依据用户的要求安排加工种类和进度,也可根据用户的科研要求调整入库品种。2.选本标准: 尽量多收集不同版本的图书,力争收录所有公开影印出版的唐五代写本和宋元珍本。三检索方式中国基本古籍库提供4 条检索路径,并提供模糊匹配: 1.分类检索,通过库、类、目的树形结构进行定向检索; 2.条目检索,限定书名、时代、作者、版本、篇目等条件进行目标检索; 3.全文检索,输入任意字、词或字符串进行爬梳检索; 4.高级检索,可以进行多次检索,或组合字词进行逻辑检索,或综合选项进行关联检索,可以保存最近一次检索结果。基本古籍库的二次检索与一般数据库的二次检索稍有不同,并不是将检索结果

      3、进行二次检索,而是将第一次检索的词与多次检索词进行组合检索。瀚堂典藏的检索限定词包括全文、出处、标题、书目,有三种检索模式: 1.绝对精准模式,不对检索条件启动任何转换处理,完全按照输入词条进行检索; 2.精准模式,启动简繁体和常用异体字自动转换; 3.模糊模式,启动人工智能分词检索功能和简繁体、异体字自动转换。在检索过程中,可以在左侧“书目树”中选择库、类、书目录,以缩小检索范围,并且可以二次检索、跨库检索,也可以选择某本书进行内容检索。如果注册个人用户,可以保存10 次的检索式,方便读者使用。相同:虽然两个数据库的检索界面不同,但是检索方式基本相似,都能够对检索词进行智能模糊匹配,检索的准确率及相关率也是很高的四使用比较中国基本古籍库1. 使用时要求必须下载安装客户端,因此可以使用一些个性化的工具,但是安装客户端比较麻烦,查看内容的时候是全屏显示,使用者要做其他操作时会略有不便2. 在使用细节方面,中国基本古籍库可以繁体字与简体字进行转换,这种转换虽然符合现代人的识字习惯,但是繁简要自由转换,暂时没有技术手段保证不出现错误。3. 可以将查看内容与图书原版的图像进行对比,这样就可以减

      4、少错误,同时也可以通过图书的原版图像查看到一些无法识别的字。4. 该库还自带常用字典,可查询所收录典籍中常用字的发音和释义5. 中国基本古籍库还可以改变背景颜色、增加列线、将文字从竖排改变成横排,并且可以对原文增加标点批注以及书签,可自动收藏并分类管理以前查阅的信息,方便归纳研究。瀚堂典藏1. 采用浏览器/服务器模式,对系统及浏览器无特殊要求和限定,使用时不需要安装客户端及特殊浏览器,直接使用IE 浏览器查看,比较方便。2. 可以将内容与原版进行对比查看,正文为了适应当代人的阅读习惯自动排版为横排,每周对数据更新校勘,因此差错率非常低,能控制在1 /10000 以内。3. 在查看全文的时候,自动将原版书图像与内容对照。并且该数据库利用Unicode 四字节编码技术基本解决了生僻汉字在计算机平台上无法录入、显示、编辑的难题,从根本上彻底突破了古籍整理和研究中生冷僻汉字数字化的瓶颈,因此只要使用时安装宋体扩展字符集,就可以查看到所有的生冷僻汉字,极大地方便了使用者。这一点是其他古籍数据库无法办到的。在原文文献下载方面相同:中国基本古籍库和瀚堂典藏都可以检索后找到相应文献,并对其进行选择下载。两个数据库可能是考虑到古籍资源的数据保护,所以分别对复制内容和查看内容都有所限制,对于需要下载较大内容读者来讲可能有些不方便不同:中国基本古籍库每次最多只能复制200字。瀚堂典藏则是开放自检索信息点上下共7 页与原版图片对照连续的文字,可以直接复制。图片则可以查看检索信息点上下13 页的内容。对于常用品种的古籍,开放章节内的全部内容,可以图文对照连续浏览并且复制,这些图书,在目录树中显示为绿色封皮。五不足中国基本古籍库在查看出处方面略显不足,虽然已经在不断改进中,在6.0 版能在检索到的条目页面下显示出处,并在复制文本时提供出处复制,但也只有书名和卷数,使用者还得通过翻检补充朝代、作者、篇名、版本等信息。另外该库在内容方面将原书序跋删去,而这些内容对使用者的研究会有很大帮助,这一不足很让人遗憾。瀚堂典藏可以说是一个不断建构中的数据库资源,该库的整体架构已初步成型,部分库,如小学工具库,也已经成形较大的优势,由于古籍加工与整理具有很高的难度,其中生僻字的数字化普遍认为是难以克服的障碍。

      《爱如生数据库与翰堂典藏数据库的对比》由会员m****分享,可在线阅读,更多相关《爱如生数据库与翰堂典藏数据库的对比》请在金锄头文库上搜索。

      点击阅读更多内容
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.