
电子文件立卷问题思考-.docx
13页电子文件立卷问题思考* 王大青摘 要:从计算机辅助档案管理开始,就出现了取消立卷的声音然而,从档案整理理论和实践发展情况看,立卷以其独特的优势,依然占据着主流地位在电子文件时代,案卷应被赋予新的生命和意义文章从电子案卷的概念出发,分析了电子文件立卷的需求、立卷的原则、立卷的标准和程序,是对电子文件整理工作理论和实践的再认识,对电子文件的科学管理具有一定借鉴意义关键词:电子文件;立卷;电子案卷Abstract: There has been a point of view of abolishing archival file, from the beginning of managing archives with the computer assistant. However, archival file still takes up dominating status in the practice and theory research because of its advantages. In the era of electronic records, the archival file should be endowed with new senses. This paper sets out from the concept of electronic volume. Then, it analyzes the requirements, principles, standards and processes of composing archival file for electronic records. It is the theoretic and practical cognizance for the electronic records organization under the new circumstance. It will be useful for the scientific management of electronic records.Key Words: Electronic Records; Composing Archival File; Electronic Volume案卷是文件保管的基本单位,立卷是纸质文件管理的重要环节,也是文件成为档案的一个重要标志。
立卷是实践“遵循文件形成规律,保持文件之间的联系,便于保管和利用”这一档案整理原则的组织形式和具体措施[1]伴随着计算机辅助立卷的发展,出现了弱化甚至取消立卷的声音例如,有的单位或行业系统依据文件形成时间直接放盒归档;国家行业标准DA/T22-2000《归档文件整理规则》,也没有明确提及立卷这一工作环节在2015年发布的修订版中,提出了立卷整理与以件为单位整理的并行做法但是,从世界范围来看,在档案管理实践和理论研究主流中,基本沿袭和强调了纸质档案文件的立卷工作,认为“案卷作为档案的典型微观存在形态,具有不容置疑的理论依据和不可或缺的实践意义”[2]所谓取消或弱化立卷,其否定的并非案卷形态本身,而是要简化档案整理工作[3]那么,从保管和利用角度看,电子案卷存在的意义究竟有多大?继续保持还是取消立卷?电子案卷的形态是什么?如何科学地立卷?经过这些年的电子文件管理实践,尤其是机器深度学习、人工智能大力发展的当下,十分有必要对电子文件立卷工作进行理论梳理和总结、创新0 电子案卷“案卷是由互有联系的若干文件组合而成的档案保管单位[4]电子案卷究竟是物理概念还是逻辑概念?对于这一问题,不必拘泥于纸质文件管理模式的机械对照,“在电子文件时代,不仅全宗形态将出现异化,案卷也将继续存在并率先出现异化”[5],即应该在电子文件物理归档和逻辑归档的具体实践中对电子案卷概念作出创新发展,针对电子文件管理需求,将其作为一个管理和利用单元来看待,可以是物理的,也可以是逻辑的形态。
由此,可将电子案卷定义为:在档案全宗类目之内,为便于文件保管和利用而设置的电子文件集合电子案卷是具有密切关联的若干文件的组合体,是“档案的保管单位,通常也是统计档案数[本文来自于wWw.zZ-news.Com]量和进行检索的基本单位之一”[6]显然,在电子文件管理中,从物理视角看,案卷存在形态发生了变化,不再是触手可及的卷、册、盒,而对应的是存储介质(当前主要是光学或磁性存储介质)中的某一区间,这一区间可以是物理上連续的,也可以是间断的、由计算机操作系统或应用系统整合起来的“连续”空间当前,其表现形式主要为文件夹;从逻辑视角看,电子案卷表现为一组标识,即通过分类标引、用一组相同标识将具有共同来源、关联性较强的电子文件集中起来,组成逻辑案卷电子案卷逻辑形态与物理形态可以是一致的,即同一案卷的电子文件存储于同一存储介质的同一文件夹之下;在某些情形下,电子案卷逻辑形态与物理形态是不一致的,电子文件组成“虚拟案卷”,而这些文件实体可暂时分布于不同的存储介质乃至不同系统、不同地域,在云计算平台上的表现尤为突出1 电子文件立卷的需求分析有人认为,“电子文件可取消立卷,因为计算机可以将电子文件任意组合成各种‘案卷”。
实际上,当前的主流档案信息管理系统是按照给定的检索式进行匹配查询的,机器不能准确理解检索词以及数据库中档案信息的语义,在小数据量时检索结果的分类积聚是可以保证准确率的,而在大数据量时,往往会出现同一历史活动中形成的、联系紧密的文件分散排列乃至不能被同一个检索式全部查询到的现象在这种情形下,设定电子案卷,不仅可以确保反映历史面貌的全面性,还可以方便保管利用1.1 保持电子文件之间历史联系的需求不可否认,在电子文件时代,更加依赖背景信息来保障电子文件的真实性、完整性和可用性,而案卷实际上就是提供档案背景信息的一种形态同一活动中所产生的电子文件,相互之间具有自然的历史联系某一事件,某一会议,某一项目,某一案件等,这些主题活动所产生的文件,如若分散保管、不设置统一的逻辑标识符,则会弱化其应有联系,对于不熟悉该活动的人来说,就会从一定程度上影响历史面貌再现的全面性和准确性目前,通过检索式查询所得到的结果展现的是文件之间的人工联系,而非文件形成之时的自然联系,这两种联系并非完全对等[本文来自于wwW.zz-news.CoM],因为人工联系是通过关键词的匹配检索展现的许多文件之间存在的是隐性联系,即文中关键词、主题词等并不能直接反映文件之间的密切相关性,再加上文件标引和著录的主观性、不规范性、计算机对自然语义理解的机械性,容易出现文件之间自然联系反映不全面、不准确的现象,从而导致社会活动、历史面貌呈现障碍。
如何保持这种自然联系呢?“立卷就是使文件之间的历史联系在微观层次上得到保持的有效手段[7]对于不同类型、不同记录方式的电子文件,电子案卷更具生命力例如,关于某一案件或建设项目的文字、照片、声音和视频,克服了物理形态的差异性,可以集合于同一案卷之下,实现信息和实体的统一组合,更为高效、系统而完整地展现其历史联系1.2 科学保管电子文件逻辑与物理形态的需求与纸质文件相比,电子文件分卷管理的成本大大降低,省去了卷盒印制、填写和文件装订装盒等程序,不再轻易受案卷容量约束而强制分开关联性较强的文件;由软件系统进行统一立卷,克服了“因人而异”的分类“任意性”同时,其分卷的优势却有所增加电子案卷是电子文件保管物理和逻辑结构体系的重要构件,是实体分类的基本单位,是信息分类的基础,可以恰如其分地“划分”电子文件物理存放空间和控制信息集聚数量传统文书档案是以“全宗-类别-案卷-文件”的层级结构进行保管的在档案管理实践中,全宗内部一般以年度作为分类的一级类目,如果从年度直接跨度到单份电子文件,文件较多时则会显得杂乱无序,不便于人工干预和异常情形下的电子文件管理,这与大数据环境下电子文件管理实践以及档案管理理念是不相适应的。
在年度类目之下设置电子案卷,则增加了电子文件实体与信息管理的可控性,具有信息量和专指性适度的优势,便于人工识读、信息存取和数据迁移,便于新发现或捕获电子文件的增量管理,从总体上提升电子文件管理效益比如,在一项职能活动中,不仅仅会产生文字图表类文件,还可能会形成数码照片等电子政务平台外文件,此时就需要人工干预以建立对应关系,采取立卷模式后,则可方便地实现相关文件的集聚和关联1.3 高效开发档案资源的利用需求通常,用户不具备档案所反映职能活动的完整知识,尤其是历史久远的活动,在数据量大、没有档案专业人员指导和档案信息共享的情境下,很容易造成文件漏检和误检等现象的发生在检索结果的排序上,没有立卷却联系紧密的电子文件很可能会被其他无关却符合检索式匹配要求的档案文件分隔开,极大地影响检索方便性和查询效率将具有历史联系的文件放置在同一案卷,便于用户检索和发现目标电子文件,全面了解相关职能活动或事件的来龙去脉,衡量一份文件在工作查考、科研、编史修志和文化服务等方面的综合价值同时,在案卷题名、主题词等著录完整的前提下,还增加了检索层次,为族性检索提供方便,有利于用户从案卷中发现相关文件的检索信息,从而充实、丰富特定主题的内容信息。
在大数据环境下,电子文件的立卷,也为数据自动分析和数据挖掘提供了分类和积聚的可靠途径,奠定了数据智能化处理基础此外,在“双套制”保管时代,“要建立电子文件之间的关联和它们与本单位产生的非电子文件之间的联系,就必须对电子文件进行立卷”[8],以此高效地维持电子文件与纸质文件之间的对应关系,还有利于简化纸质文件的整理综上所述,在“人工智能”迅猛发展的时期,计算机在数据感知、语音和图像识别、数据分析以及知识挖掘等方面,都取得了很大进展,但是,这其中的许多成果是建立在统计学基础之上的,而对自然语言语义的综合理解、判断与处置依然是计算机面临的挑战,计算机在实现电子文件任意标准的自动分类组合、语义检索等方面依然存在着差距,而这正是电子文件智能化管理和利用所需要的,即电子文件的管理和利用还脱离不了人工干预,在今后较长一段时间内尚不能达到“随意”组合、完全智能化管理的理想状态也就是说,电子文件立卷依然有其自身与环境的强烈需求2 电子文件立卷的原则2.1 保持电子文件之间历史联系的原则文件之间的历史联系包括背景联系和内容联系背景联系包括文件形成者、职能活动、形成时间和形式联系等;内容联系一般指文件主题、事由之间的联系。
这个原则要求:将形成时具有天然联系的电子文件组成一个案卷考虑到现代社会分工协作日益紧密的现实,不能将这个原则简单地理解为“来源于共同的组织机构、部门或个人的电子文件”,不能囿于立档单位之限而分割联系紧密的电子文件,應将电子文件产生的源泉——社会职能活动作为立卷的核心原则正如特里·库克指出的那样“电子时代,档案来源概念需要重新定义,它不能仅仅局限于文件的形成机关,还应包含形成目标、形成活动和职能范围等”[9],要从电子文件形成者和职能活动两个视角考察电子文件之间的有机联系,选择适宜于计算机智能操作并能够最大限度地维护历史联系的模式立卷保持电子文件之间历史联系,实际上也是电子文件高效保管和利用的重要基础2.2 有利于电子文件保管和利用的原则电子文件立卷的原则,其中很重要的一点就是将电子文件前端控制和全程管理思想贯穿其中当前,在电子文件接收、检查、迁移、维护、鉴定和管理等诸多环节中,需要适度的人工干预因此,电子文件立卷时,不仅要考虑计算机自动管理的效益,还要考虑到人工干预的方便性、效率一个电子案卷之下,文件数量应保持适宜如若文件太多,则会影响数据迁移、再鉴定、检查和维护效率在移交电子文件,尤其是离线存储时,应注意保持电子案卷逻辑与物理形态的一致性,即将同一案卷电。
