
基于元数据仓储的资源发现系统调研、分析与思考 - 清华大学.ppt
36页基于元数据仓储的资源发现系统调研、分析与思考清华大学资源发现测试小组 窦天芳问 题 的 提 出n2009 OCLC Online Catalogs:What Users and Librarians Want 1.“方便胜于质量”&“检索体验和得到所需同等重要”2.“最终用户依赖并期望提升包括文摘目次在内的内容品质”3.“高级检索和分面帮助用户应对大量的检索结果集”4.……用户在检索体验,数据质量,检索结果的重新组织方面的期待问 题 的 提 出 n目前图书馆应用的系统1.传统的书目管理系统以书目信息管理为主&分面&FRBR2.统一的电子资源管理系统检索体验&有限结果集的处理主流的发现系统nSUMMON nPRIMOnWorldCat LocalnEBSCO HOST EDSn开源软件 调研的主要产品Summon/ Primo/Google scholarn工作机制 从出版商,大学,公开的网站收集的学术文献信息; 集中索引; “quick easy simple search”--summon“for quick, easy, and effective searching and retrieval”---PrimoSummon/Primo/Google Scholarn服务架构saas saas+本地数据和界面云计算支撑的saas cloud-based service用户界面 LOCAL indexPrimo Central第三方系统Primo集中索引2集中索引1集中索引3Summon/Primo/Google Scholarn服务架构saas saas+本地数据和界面云计算支撑的saas cloud-based serviceCentral index用户界面集中索引1集中索引2集中索引3Summon/Primo/Google ScholarSummon/Primo/Google Scholar--数 据 量nSUMMON(5亿,1.3亿)n 486,325,421n487,364,976 n放放检索索词为空空, Add results beyond your library's collection,exclude newspapern n134,714,335 n n133,674,780 Summon/Primo/Google Scholar—数据量nPrimo Central(2亿)不接受检索词为空n集中索引使用策略Summon/Google Scholar 不加限制Primo 限制,提交申请表来开放检索的授权n特例 以作者为 “Andrew C.C. Yao”OR“Andrew C. Yao”OR“Andrew Chi-Chih Yao”OR“Yao, Andrew C.”OR“Yao, Andrew C.-C.”检索 作者的文章列表数:114产品产品SUMMONGOOGLE SCHOARPrimo返回结果291104(119)47匹配结果24(学位论文) 6940(ACM)Summon/Primo/Google Scholar—数据量Summon/Primo/Google Scholar—数据质量n数据处理 summonPrimo central Journal Article On the Complexity of Maintaining Partial SumsAuthor: Yao, Andrew CPublication TitleSIAM Journal on ComputingDate1985Volume14Issue2Start Page277ISSN0097-5397DOI10.1137/0214022LanguageEnglish题名题名: Simulating an agile, synchronized manufacturing system. 作者作者: Carlson, John G.H ; Yao, Andrew C 主题主题: Retail trade ; Furniture industry & trade ; Textile fabrics ; Production management 馆藏馆藏: International Journal of Production Economics, Apr2008, Vol. 112 Issue 2, p714 同行评审期刊 描述描述: Abstract: Retail customers are demanding more variety, more features and quicker order response times from manufacturers. Furniture production systems have had to... 识别标签识别标签: ISSN: 09255273 ; DOI: 10.1016/j.ijpe.2007.06.008 来源来源: Business Source (EBSCO) 语言语言: 英语 产品产品SUMMONGOOGLE SCHOARPrimo返回结果291104(119)47匹配结果24(学位论文)6940(ACM)数据质量规范格式参差不齐(摘要)规范格式Summon/Primo/Google Scholar—数据质量Summon/Primo/Google Scholar—检索体验考察:考察: 速度速度 专业检索的便利性专业检索的便利性Summon/Primo/Google Scholar—检索体验Summon/Primo/Google Scholar—检索体验API creator:("Yao Andrew C") OR creator:("Andrew C.C. Yao") OR creator:("Andrew C. Yao") OR creator:("Andrew Chi-Chih Yao") OR creator:("Yao Andrew C.-C.") 47Summon/Primo/Google Scholar——检索体验产品产品SUMMONGOOGLE SCHOARPrimo central返回结果291104(119)47匹配结果24(学位论文)6940(ACM)数据质量规范参差不齐规范OR组合检索好有待提高支持2个预期提高检索速度好 <1s好 <1s好 <1sSummon/Primo/Google Scholar—检索体验n“simple easy quick ”产品产品SUMMONGOOGLE SCHOARPrimo简单检索 √√√Summon/Primo/Google Scholar—检索体验Summon/Primo/Google Scholar—检索体验产品产品SUMMONGOOGLE SCHOARPrimo central返回结果291104(119)47匹配结果24(学位论文)6940(ACM)数据质量规范参差不齐规范OR组合检索好有待提高支持2个预期提高检索速度好 <1s好 <1s好 <1s单一检索框√simple easy quick √simple easy quick √simple easy quick 高级检索最灵活最灵活,友好友好,一一点点可视化点点可视化不灵活不灵活单个作者单个作者不灵活不灵活预期改善预期改善n分面 &FRBR&去重&排序&全文传递&数据服务Summon/Primo/Google Scholar—检索结果处理产品产品SUMMONGOOGLE SCHOARPrimo分面灵活,同分面检索Limit to articles from scholarly publications, including peer-review少量灵活/peer review去重策略 correct去重可控制的去重FRBR未发现?较好处理排序时间,相关度相关度(引用次数)时间,相关度,作者,标题,popular全文传递开放链接系统360 link开放获取开放链接系统SFX结果输出Email print 文献管理Email alertEmail print 文献管理数据服务未发现未发现数据节点 API WIKISummon/Primo/Google Scholar—检索结果处理Summon/Primo/Google Scholar—检索结果处理nWhat do you mean?n输入提醒Summon/Primo/Google Scholar—检索结果页面基于元数据仓储的资源发现系统——思考n资源覆盖度是一个过程n检索的灵活性?n结果处理,未来的数据服务?n用户行为在系统中的体现?n与Google scholar的关系?n在检索结果管理和全文获取方面,商用平台和科研环境及图书馆的业务结合更紧密。
n基于元数据仓储的资源发现系统有很大的发展空间,在未来依托数据提供特色服务提供了 广阔的空间n与本地数据整合n学位论文&OPAC&多媒体数据Summon/Primo/Google Scholar—本地数据整合Summon/Primo/Google Scholar—本地数据整合Primo系统中 学位论文数据字段映射 学位论文系统学位论文系统PRIMO/searchPRIMO/displaydc:title TITLE_CNtitletitledc:subject KEYWORD_CNsubjectsubjectdc:key KEYWORD_CNsubjectdc:class SUBJECT_NAMEsubjectdc:creator AUTHORcreatorcontribcreatordc:coverage PAGENUMcoverageCoverage/formatdc:description ABSTRACT_CNdescriptiondescriptiondcterms:abstractABSTRACT_ENdescriptiondescriptiondc:publisher AU_INSTITUTIONcreatorcontribpublisherdc:date LATEST_DATE
