1、合伙编目网络资源书目控制的必由之路 王绍平(上海交通大学图书馆 3) 文 摘 对网络资源实行书目控制是对其进行开发、运用的有效途径之一。网络资源数量大、增长快、稳定性 小,唯有走合伙编目之路才干达到事半功倍的效果。OCC顺应网络资源发展的趋势推出CORC筹划,把“编目资源共享”的概念引入网络资源的组织与控制,其中颇有值得我们思考与借鉴的地方。核心词 网络资源 书目控制 联机合伙编目ORC筹划网络资源书目控制的必要性与复杂性 90年代以来因特网在国内的迅速发展已经为我们呈现了网络资源的巨大脑力与潜能。但同老式的文献信息资源同样,网络资源的迅猛发展也带来了信息无序,无用信息掺杂其间的污染,给有效运用制造了日益严重的障碍。 对网络资源内容的监管、对不良信息的过滤、用搜索引擎对无序信息的查询,正是为减轻网络上信息污染而采用的重大措施。图书情报机构在组织文献信息和书目控制方面的类似做法是:文献信息的采集、选择、加工、运用。正如文献信息的扩展迫使人们注重文献信息的组织、控制那样,网络资源的激增也使网络资源的组织、控制提上了议事日程。目前对网络资源实行控制的主体(涉及政府的与社会的)中,图书情报机构
2、有其独特的优势。图书情报机构对非网络信息资源的控制已有较为丰富的经验,将其施行于网络资源的控制可得事半功倍的效果。由图书情报机构对网络资源进行编目,即对网络信息进行选择、加工、整顿,可以同耐对网络上的多种信息实行沈选、过滤、描述、标引,以便于查寻的方式把有价值的信息提供应顾客,这是运用网络资源最为有效的途径之一1。 随着因特网的发展,不少图书情报机构将其丰富的馆藏转化为网络资源,在网上开发Wb界面的联机公共目录系统ePAC便是一例。 网络资源与非网络资源有共性,这是图书情报机构进行信息控制(重要是书目控制)的前提。但网络资源也有区别于非网络资源的个性。一方面网络资源增长迅速、数量巨大。据国外最新的一项研究成果表白,因特网上可编索引的网页已超过10亿2,仅此一项,其增长规模已超越了既有的非网络资源。固然这10亿网页并非所有值得编目,但仅对其进行筛选,也非一种图书情报机构可以应付。另一方面,网络资源变化多端,流动性大,稳定性小。目前AC格式(USRC与UNIMC)都没有链接网络资源的856字段,由于网络信息地址时常更改,为了维护56宇段链接的有效性,就需耗费相称的人力、物力。此外,网络资源
3、自身的修改与版本更替也增长了网络资源编目的难度。2 从联机合伙编目到“台作联机资源目录” 联机合伙编目在图书馆事业发达的国家已成为老式文献书目控制的成熟方式。编目资源共享减少了编目成本,提高了编目效率,随之而来的编目工作社会化,促使图书馆的构造向有助于顾客服务的方向调节。在美国,由于履行联机合伙编目,近来几乎所有的公共、大学与专门图书馆都缩小了编目部的规模;有些图书馆甚至取消了馆内编目业务,把所有编目工作委托给C等专门的编目中心。近年来,联机合伙编目在国内日益受到图书情报界的关注,编目业务的原则化与计算机网络建设的发展为推动联机合伙编目奠定了现实的基本,目前中国国家图书馆与中国高等教育文献保障系统(CLS)正在积极履行联机合伙编目,编目资源的真正共建、共享可望在国内逐渐推广。 网络资源编目既然是老式文献编目在网络环境下的延伸,而网络资源又具有数量大、增长快、稳定性小的特点,实行联矾合伙编目更是理所固然的必由之路。美国的CLC在积其数十年合伙编目丰富经验的基本上,顺应网络资源发展的趋势,及时推出“合伙联机资源目录”(CooraiveOnlnRrceCatao,CORC)的设想,把“编目资
4、源共享”的概念引入网络资源的组织与控制,其中颇有值得我们思考与借鉴的地方。3 CC筹划的有益尝试.1 概况 LC很早就致力于电子资源的组织与控制。它积极倡导元数据(metata)格式的研究,参与制定了“都柏林核心”(DublnCo)元数据规范;在用TL(超文本标记语言)、XML(可扩展标记语言)、DF、(资源描述框架)等工具描述电子资源方面也做了大量的工作。它在网上建设的Inter a与NtFirs便是两个具有示范意义的网络资源数据库。早在99年,OCL研究署( ofc f esearch)就信息技术与因特网的发展对将来社会各方面的影响,为联机联合目录的将来取向,开展了一系列研究,觉得OCC应当适时地将网络资源的合伙编目纳入自己的服务范畴。1998年8月研究署正式向 OCL研究顾问委员会(Rsh Advsry ommittee)提交了CORC(Ceratie Online esource Catalog )筹划的设想3,。 OC筹划的目的是在自动化编目工具与图书馆合伙有机结合的基本上,建设共享的网络资源数据库。这是将老式的图书馆实践与原则文献信息的选择、描述、标引、运用运用于网络信息存
5、取的故意义的尝试,也是联矾联合目录向网络信息领域的扩展。 CORC建立的数据库有4个:资源记录数据库、规范数据库、寻路器(pathfndr)数据库、杜威十进分类法数据库。其中资源记录数据库相称于一般的书目数据库,以DubCoe或MARC形式提供网络信息;寻路器(patfinder)则以网页的形式揭示网络资源的书目信息及其与资源的超文本链接。 年1月,以 Iter Ca与 Net Fir中的数据为基本,开通了实验性的CORC数据库。同年6月,已有8多种图书馆申请加入 CC筹划。OCL将在7月正式推出 CRC服务项目。3. 功能与特点C采用的软件平台与多种工具可觉得图书情报人员建立网络资源数据库提供如下的服务5,: 迅速生成资源记录(即书目记录); 自动标引杜威十进分类法类号; 自动抽取核心词; 自动进行规范控制1. 通过合伙与机器协助的措施维护记录的UR(统一资源定位器); 提供生成、编辑寻路器(Pathfindr)的先进工具。 人们可以按联机合伙编目的程序从网上选择符合自己需要的信息资源,经编目后上载给 CORC数据库,OCLC对输入记录进行审核(质量控制与查重);或者直接从O数据库下
6、载所需的网络资源记录,将其纳入本地的数据库。借助 CORC数据库,可以生成、编辑、输入、输出3种数据:资源记录、数字寻路器(iitalpathfidr)、规范记录。资源记录描述网络资源的书目信息,可根据需要选择MAC或ulin Coe格式;数字寻路器能直接由资源记录生成。顾客访问 CO数据库的界面有多种:例如一组可测览的网页、原则的 OCCSiteearch界面、基于杜威分类法的测览器、Z3.50客户机等。 鉴于网络资源数量众多、流动性大的特点,COC筹划一方面充足吸取老式的联机合伙编目的长处,另一方面尽量发挥自动化编目工具的功能以减轻网络资源采集、选择、描述、标引、维护的强度。 根据顾客提供的UBL,搜索、获取(hest)有关域名的网页,为有关网页及其所有链接生成一系列的资源记录。并且可定向获取具有EAD(EcodngArchivaIescripton)与TEI(ext Ecin nitiatie)头标的网页,并自动生成资源记录。COC工具在获取某一网址后,能自动过滤出核心概念与核心词作为索引词。 采用机器辅助方式标引分类号与主题词。安装了丰富的机助编目工具,如杖威十进分类法(DDC
7、)、美国国会图书馆标题表( CSH)、美国国家医学图书馆标题表(eSH)、美国国会图书馆名称规范档,以减轻编目人员的标引工作强度。 由成员机构分担维护UL,当顾客的记录涉及无效的URL时,OC的自动链接维护工具会通过“状态屏幕”及时告知顾客,由顾客进行核查、改正。3.3 软件平台与原则 COR数据库的软件平台是 Mantis,这是一种合用于任何元数据定义与界面的网络资源编目系统工具箱6。目前存在着众多的元数据规范,这些规范虽具有相似性,但彼此难以兼容。为了支持任意的元数据定义与界面,Mantis用XM(可扩展标记语言)存储记录,以F(资源.描述框架)作为底层的元数据格式。系统可根据需要显示AC与ubiCoe格式的数据,输出MARC 或RDXL格式的记录。 RDF是支持多种元数据应用的建模原则,它将网络资源提成“资源”、“性质”、“值”三部分:“资源”是可唯一辨认的对象,如一篇文章;“性质”根据顾客拟定的语义来鉴定,如一篇文章的题名、著者;“值”是“性质”的具体内容,可以是词串,也可以是另一“资源”,如具体的题名、具体的著者。RDF模型或由DF模型拟定的每个元数据记录则用XL来描述。这里
8、是描述D模型的句法。 当顾客从数据库检索到一条无数据记录时,anis就把记录中的数据根据预先设立的指令充填到XM模板中。XML模板中的所有数据再按照显示指令转换成HTM 语言,传送到顾客的浏览器。有修改权限的顾客可对显示的记录进行编辑。由于在显示过程中数据宇段的隐含信息已嵌入TML,顾客可通过测览器直接进行编辑,Mntis在编辑过程中重建被充填的XML模板,纳人通过修改的宇段。顾客把更新的记录提交数据库时,系统将被充填的ML模板同原始的M模板进行比较,抽出填入的数据存进数据库。为使OR数据库具有自动选择、标引等功能,Mai还吸取了OLC开发的其她某些软件,如用于检索的 SitSrch、用于自动标引的rpon、用于因特网资源获取( harvesting)的 Klroy、基于 Ucode的数据库引擎Pears等。4 CORC筹划的启示 CR眼下还是一种实验的筹划,但它已显示出合伙编目在网络环境下的无限生命力。正是自动化、网络化的发展,促成了联机联合目录的问世,从此步履艰难的合伙编目不仅在发达国家成为文献信息资源编目的常规手段,并且在国内也开始逐渐走上发展的正轨。自动化、网络化不仅给合伙编目
9、带来了新的手段,还为合伙编目注人网络信息资源的新内容,展示了网络资源合伙编目的诱人前景。 尽管目前国内的合伙编目与网络资源的组织、控制都处在起步阶段,但因特网的飞速发展已迫使人们注重网络资源的开发运用。因特网的扩展正使网络资源与非网络资源的界线逐渐趋于模糊:网络资源可以有硬拷贝,非网络资源也可以有软拷贝,我们在对非网络资源实行合伙编目时,将不得不常常考虑网络资源的存在。OLC的 C筹划是在数十年文献信息资源合伙编目丰富经验的基本上产生的,这并不意昧着我们必须先走老式的文献信息资源合伙编目的路,再考虑网络信息的编目资源共享。既然网络资源的书目控制已载人议事日程,目前就应当末雨绸缎,对编目所用的格式、遵循的原则预作筹措,而更重要的是在履行联机合伙编目的过程中考虑到网络资源编目的必要性,以免重蹈文献信息资源编目“各行其是”的覆辙。参照文献1 黄纯元.图书馆与网络信息资源.中国图书馆学报, 997():31 新华杜洛杉矶1月日电3H Ky,Thos,ChiIres,Erc,Waton,BrdllyC.The enesis nd developenof COR as on COLC offie o Reearch prject
《合作编目——网络资源书目控制的必由之路-上海交通大学图书馆》由会员博****1分享,可在线阅读,更多相关《合作编目——网络资源书目控制的必由之路-上海交通大学图书馆》请在金锄头文库上搜索。