
信息资源及检索基础知识130228剖析.ppt
65页2019/10/23,1,第1章 文献信息检索基础*,1 基本概念 2 信息资源的分类 3 信息检索的类型 4 信息检索语言,2019/10/23,2,1.1 基本概念-信息(Information),信息:客观事物存在方式或运动状态的反映信息来源于人们的生产、生活、科研以及社会活动 信息的特征:普遍性、客观性、共享性、扩散性、传递性、依附性、时效性、存储性、商品性等 信息的分类 按信息的客体性质:自然信息、生物信息、社会信息 按信息的内容:经济信息、文化信息、科技信息、决策信 息、工业信息、军事信息 按信息的时间:预测信息、实时信息、反馈信息,2019/10/23,3,信息的特征*,(1)客观性(本质属性) 地震,海啸,花草树林的发芽、生长和枯萎,广播电视、网络的新闻、广告等等发出的信息,不管你知道不知道,感知不感知,它都是客观存在 只要有物质存在,就有信息的存在——不以人们的意志为转移的它是现实世界中各种事物运动与状态的反映,它可以被人们所感知、处理、存储和使用它的客观性还表现在反映客观世界变化的信息包含在各种物质之中2)传递性——信息的本质,信息广泛存在于自然界、生物界以及人类社会之中,它既不是物质,也不是能量,而是依附于客观事物的存在,只要有物质,就有表征其属性的信息。
诺亚的方舟在洪水中飘荡许久,当放出的飞鸽衔回一束橄榄,就带回了洪水已经退去的信息2019/10/23,5,(3)时效性,朝鲜战争与兰德咨询公司故事 在美国出兵朝鲜之前,美政府曾请美国著名的咨询机构兰德公司做一预测:如果美国出兵,中国会不会出兵?兰德公司请了大批资深专家,从中共历史、军力、国际关系、甚至中共领袖性格等各方面做了精深的分析,最后得出结论是:“中国将出兵朝鲜”其主题词只有7个字,要价150万美元美国国防部认为是敲诈,不予理睬,在自认为中共不敢出兵的假设下,冒险出兵 麦克阿瑟将军得知这个研究之后,感慨道:“我们最大的失策是怀疑咨询公司的价值,舍不得为一条科学的结论付出不到一架战斗机的代价,结果是我们在朝鲜战场上付出了830亿美元和10多万名士兵的生命 由上例可以看出信息的价值性、时效性、预测性 信息的时效性是指信息的效用依赖于时间并有一定的期限,其价值的大小与提供信息的时间密切相关实践证明,信息一经形成,所提供的速度越快,时间越早,其实现价值越大2019/10/23,6,(4)共享性,英国剧作家萧伯纳说:你有一个苹果,我有一个苹果,彼此交换一下,我们仍然是各有一个苹果;你有一种思想,我有一种思想,彼此交换,我们就都有了两种思想,甚至更多。
信息也是一样,我们常说的一句话“信息共享”,2019/10/23,7,1.2 基本概念-知识(Knowledge),知识:是人类在实践中所获得的认识和经验的总和人脑通过对客观事物发出的信息的接受、选择和处理,得到对事物一般性的认识,形成概念又通过对相关概念的判断、推理和综合,加深对事物本质的认识,构成人们头脑中的知识 知识的特征:属于意识范畴,具有规律性、实践性、继承性、渗透性 知识的分类:世界经合组织把人类的所有知识分为: 原理知识(Know···why) (显性) 事实知识(Know···what)(显性) 人力知识(Know···who) (隐性) 技能知识(Know···how) (隐性),2019/10/23,8,1.3 基本概念-情报(Intelligence),原始的定义:战时关于敌情之报告,曰情报 近代的定义:系列化知识是情报;是被人们所利用的信息 情报:是在特定时间、特定状态下、对特定人提供的有用知 识和信息 概括起来:情报是特定对象为特定目的而收集的有使用价值 的知识和信息 不同的情报对应不同的用户:科技部门——科技情报(信息);决策部 门——决策情报(信息);军事情报;经济情报…… ● 在西语中信息和情报都是“information”,不加以区别。
● 原国家科委于1992年决定用“科技信息”取代“科技情报”2019/10/23,9,1.4 基本概念-文献,文献:以文字、图形、符号、声频、视频等方式记录有知识的一切载体 载体:具备记录和传播知识信息的物质材料如甲骨、青铜器、纸介型 、胶片,磁带,磁盘,光盘等 记录:构成文献的重要手段 文献的基本要素: (1)信息内容—文献的核心 (2)信息符号—揭示和表达知识和信息的标记符号 (3)载体材料—承载文献信息符号的物质材料 (4)记录方式—将包含信息内容的信息符号存储到载体材料上去的方法知识,文献,情报,记录,传递应用,知识、文献、情报间的关系,2019/10/23,10,数据—信息—知识—情报四者关系,信息、知识、情报关系图 信息是产生知识的原料,知识是大脑对信息加工后形成的产品; 知识在需要时可以变成情报,情报在不需要时可以还原为知识; 知识和情报在人们不能认识,不能系统化时,又是一种信息;,,,,情报,,知识,信息,,,2019/10/23,11,数据 收集、提取 信息知识分析、研究 情报,国内新闻泄密案件占整个新闻出版泄密案的一半以上,特别是在科技、经济方面,给国家造成了巨大的损失,同时也在政治上产生严重影响。
境外的一些中国问题专家在谈到搜集中国情报的方法时,认为主要手段就是分析研究中国的报刊和出版物境外谍报组织广泛收集我国公开发生的报纸、杂志、刊物、官方报告、人名通讯录、企业号码簿以及车船、飞机时刻表等,经过选择让专家分析研究美国中央情报局把凡是能弄到手的每一份共产党国家的出版物都买下来,每月约有20多万份,他们认为,所需要情报的80%可以从这些公开的材料中得到满足,称之为“白色”情报案例,“两步发酵法生产维生素C”是国家重大科技发明,这是人类需求极大、前景无比广阔的科学成果,世界两大产业国瑞士和美国闻风而至,竞相出价要买下这项技术专利没想到,一星期后,争得脸红脖子粗的两国代表“和气生财”,欢天喜地地回老家去了原来这项专利便宜到只值一本杂志的价钱!某学报将全部研制过程、细节、配方、剂量刊登无遗稍有化学常识者,回去按谱炒菜即可,真是得来全不费工夫!,2019/10/23,12,“杂交水稻泄密事件”水稻之父袁隆平的发明攻克了美、日等国早在50年代就开始研究而没有突破的难关,但这项重大科研成果没有得到应有的保护,一些报刊连篇累牍的发表有关水稻杂交技术的文章,一些科研部门把这项技术带到菲律宾的国际水稻研究所进行扩散,甚至免费为世界几十个国家和地区举办学习班,印发了技术资料,公开了技术秘密。
当我国把这项水稻杂交技术作为我国的一项重大技术展让给谋国一个公司时,该公司拿出了搜集到的有关我水稻杂交技术资料60多份,说他们已经掌握了这项技术,不需要再买专利了这样,可获几十项专利的杂交水稻技术,仅有“杂交水稻和技术”一项获得了专利忽视这项重大科研成果的保密,给我国造成了重大损失2019/10/23,13,最著名的“照片泄密案”:,1960年王进喜被冠之以“铁人”的称号以后,国内的各大报纸对他都有了相关的报道 1966年《中国画报》封面刊出的一张照片大庆油田的“铁人”王进喜头戴大狗皮帽,身穿厚棉袄,顶着鹅毛大雪,握着钻机手柄眺望远方,在他身后散布着星星点点的高大井架2019/10/23,传递性 逻辑推理 转化性,信息F1 ( 图像信息) : 1966 年7 月的一期《中国画报》刊登了一张照片,照片中的人“头戴大狗皮帽子,身穿厚棉袄” 知识K1 ( 地理知识) : 只有在北纬46 度至48 度的区域( 即我国东北的北部寒冷地区) 内,冬季采油工人才必须戴大狗皮帽和穿厚棉袄 信息F2:运原油的列车上灰尘的厚度 知识K2 ( 常识知识) :火车运行时间越长,车厢( 油罐) 上灰土就越多; 不同地方的土质颜色有差别,东北土黑,华北土黄。
测算出了油田与北京的距离,断定大庆油田位于齐齐哈尔与哈尔滨之间 信息F3: 1966年10月份,《人民中国》也刊登出宣传王进喜的文章,在其中透出一个“马家窑”的地理信息 信息F4: 地图上关于安达等地方的区划信息 信息F5:照片中王进喜身后反应塔、所握手柄的架式和井架密度 知识K3:以扶手栏杆和反应塔的直径相比,推断出油井的直径是5 米;井架密度推断出油田的大致储量和产量 知识K4:圆柱体的体积计算公式为: 柱体积= 底面积× 高,情报T1:推出大庆在安达车站附近——大庆油田的地理位置,情报T2: 南北400 公里的范围——大庆油田的规模,情报T3:推出大庆油田的年产量约为100万吨——大庆油田的产量,情报T4:有了如此多的准确情报,日本人迅速设计出适合大庆油田开采用的石油设备我国向世界各国征求开采大庆油田的设计方案时,日本人一举中标,后来几乎政府垄当断了我国石油设备进口市场2019/10/23,15,知识作用于“数据→信息→情报”的整个转化过程,2019/10/23,16,从上例中可以看出,大庆油田的信息是刊载在《人民画报》等这些公开发行的报刊杂志上的,而日本人正是利用这些公开的报纸、杂志分析中我国大庆油田的产量和设备需求,获取了最高的经济利益。
信息的传递性是指任何信息只有从信源出发,经过信息载体传递才能被信宿接受并进行处理和运用也就是说,信息可以在时间上或空间上从一点移动到另一点,可以通过语言、动作、文字、通信、电子计算机等各种渠道和媒介传播结 论,情报沿着“数据→信息→情报”的线性方向转化,2019/10/23,17,从数据到信息的转化过程、从信息到情报的转化过程都需要知识的支撑,知识作用于整个转化过程2019/10/23,19,2 信息资源(文献)的分类*,按加工深度形式分 按载体形式分 按出版形式分,2019/10/23,20,2.1 按文献加工深度*,二次文献(又称检索性文献):是按一定规律和方法编制成的查找图书馆文献收藏的工具,记录内容包括书名、期刊名、著者、以及主题、索书号等,可以从题名、著者名、期刊号、图书号等途径查找 文摘索引数据库等检索工具记录的内容包括文献中的题名、著者、原文的出处(刊登的期刊名称、年、卷期页、摘要、网址等,可以从任何实义词查找如:书目、文摘、索引、题录等2019/10/23,21,2.1 按文献加工深度,2019/10/23,22,2.1 按文献加工深度,三次文献(又称参考性文献):在利用一次文献的基础上,分析综合归纳信息后,组织形成具有资料性、查考性、阅读性的文献(如教科书、综述、工具书、进展、调查报告、标准、数据手册、百科全书等参考工具书) 特点:三次文献源于一次文献,又高于一次文献,属于一种再创性文献.三次文献一般来说系统性好,综合性强,内容比较成熟,常常附有大量的参考文献,有时以作为查阅文献的起点. 总之:零次文献是一次文献的素材;一次文献是文献的基本形式,是检索的主要对象,是二、三次文献的基础;二次文献是检索一次文献的工具;三次文献是对众多文献分析、综合、归纳整理而形成的。
2019/10/23,23,按信息的加工深度划分,2019/10/23,24,2.2 按文献载体形态,印刷型(print form) 也称为纸介型(paper-based)传统的文献形式 缺点:存贮密度低,体积庞大,加上纸张的化学、物 理特性, 难于收藏保存 缩微型(micro form) 以感光材料为载体的文献记录形式,有缩微胶片,缩微 平片等. 优点:体积小、存贮密度高,便于传递、保存可节省书 库面积达90%以上 缺点:不能直接阅读,必须借助阅读机2019/10/23,25,声象型(audio-visual form) 通过特定设备,将信息表现为声音、图像、影视及动 画(sound,image,video & animation) 等形式 优点:直观、形象 电子型(electronic form) 通过计算机对电子信息进行存取处理电子信息存于磁盘、磁带或光盘等媒体中电子出版物,如电子图书期刊,各种联机信。
