【硕士论文】电子文档管理系统的设计与实现.pdf
68页分类号U DC密级Y8 5 3 4 9 3亏位论支电子文档管理系统的设计与实现作者姓名奎堂竖指导教师姓名盘连型堑壅亟盔i &蠢生筮鲑主:兰申请学位级别亟±学科类别童些堂焦学科专业名称盐笠垫垫查论文提交日期学位授予口期2 0 0 5 .7论文答辩[ 1 期答辩委员会- j i 席塞』盐垦评阅人塞』盐垦塞责羞东北大学东北大学硕士学位论丈摘要电子文档管理系统的设计与实现摘要随着计算机技术及网络技术的快速发展,以及企业内部各种业务系统的建立,企业内部的文档数量快速增长,越来越多的企业丌始建立专业的电子文档管理系统对企业内部各利,电子文档进行统一管理本文首先对电子文档管理系统的概念、作用及典型应用进行了介绍,然后详细介绍了电子文档管理系统的系统层次划分及接口设计与实现,并介绍了电子文档处理的一些关键技术,说明了电子文档管理系统是如何对现代企业中数量庞大的电子文档进行有效管理的本文介绍的电子文档管理系统基于J 2 E E 应用平台,以S t r u t s 作为系统的基础框架,系统内部又划分成数据访问层、数据对象层、业务模块层、系统调度程序四个层次,层次分明、结构清晰,整个系统具有非常良好的可扩展能力。
在对电子文档的处理技术方面,本文重点描述了对电子文档的属性信息进行自动维护的技术的设计和实现对电子文档属性维护的方法有4 种方法:图像扫描、图像属性自动提取、文档属性自动提取、自动标引,本文在自动标引部分对如何设计和实现一个表达式引擎进行了完整的介绍另外,本文对电子文档的分类、组织、分发及利用也进行了介绍关键嗣电子文档J 2 E E 设计模式框架图像扫描O C R东北大学硕士学位论文A B S T R A C TT h eD e s i g na n dI m p l e m e n t a t i o no fE l e c t r o n i cD o c u m e n t M a n a g e m e n tS y s t e l nA BS T R A C TW i t ht h ed e v e l o p m e n to ft h ec o m p u t e rt e c l - m o l o g ya n dt h en e t w o r kt e c l m o l o g y ,m a n yc o r p o r a t i o n sd e v e l o p et h e i rb u s i n e s si n f o r m a t i o ns y s t e m .A tt h es a m et i m e ,t h ea m o u n to ft h ed o c u m e n ti n s i d ec o r p o r a t i o n si sr a p i d l yin c r e a s i n g 。
N o wm o r ea n dm o r ec o r p o r a t o n sd e v e l o pt h ed o c u m e n tm a n a g e m e n ts y s t e m ,a n dt r e a t ei ta st h eu n i f i e ds t o r ef o ra llt y p ea r c h i v e dd o c u m e n ta n di n f o r m a t i o n .F i r s t l y ,t h i st h e s i si n t r o d u c et h ee l e c t r o n i cd o c u m e n tm a n a g e m e n ts y s t e m ’sc o n c e p ta n df u n c t i o n .T h e ni n t r o d u c et h et e c h n o l o g yf r a m e w o r ka n di n t e r f a c eo fe l e c t r o n i cd o c u m e n tm a n a g e m e n ts y s t e m ,i n t r o d u c et h ek e yt e c h n o l o g yi nt h i ss y s t e m ,e x p l a i nh o wt om a n a g ea m o u n td o c u m e n ta n di n f o r n a a t i o ni nc o r p o r a t i o n s .’F i l ee l e c t r o n i cd o c u m e n tm a n a g e m e n ts y s t e mi sb a s e d0 1 1J 2 E Ep l a t f o r m ,u s eS t r u t sa st h eb a s i cs y s t e mf f m n e w o r k .T h es y s t e mh a sf o u rl a y e r s :d a t aa c c e s sl a y e r ,d a t ao b j e c tl a y e r ,b u s i n e s sl o g i c a ll a y e r ,a n dr e q u e s td i s p a t c hl a y e r .T h es y t e mi ss c a l a b l em a de x t e n d a b l e .W h i l ei n t r o d u c i n gk e yt e c t m o l o g yi ne l e c t r o n i cd o c u m e n t sm a n a g e m e n t ,t h i st h e s isd e s c r i b es o m em e t h o d st om a i n t a i nd o c u m e n t ’Sp r o p e r t i e sm e t a d a t a .T h em e t h o d sa r ei n a a g es c a n i n g ,o p t ic a lc h a r a c t e rr e c o g n i t i o n ,e x t r a c t i o nf o ro f f i c ed o c u m e n t ,a u t o m a t e di n p u t .T h i st h e s i sa l s od e s c r i b et h ed e s i g na n di m p l e m e n t a t i o no fo n ee x p r e s s i o ne n g i n e ,w h i c hm a k et h ea u t o m a t e di n p u tp o s s i b l e .L a s t l y ,t i f f st h e s i se x p l a i nh o wt oc l a s s i f y ,o r g a n i z e .a n dd i s t r i b u t et h ed o c u m e n ti nm o r ee f f e c t i v ew a y s .K e y w o r d sD o c u m e n t ,J 2 E E ,D e s i g nP a t t e r n ,F r a m e w m ‘k ,T W A I N ,O C R—I I 丁一独创性声明本人声明所呈交的学位论文是在导师的指导下完成的。
论文中 取得的研究成果除加以标注和致谢的地方外,不包含其它人己经发表或撰写过的研究成果,也不包括本人为获得其它学位而使用过的材料与我一同二[ 作的同志对本研究所做的任何贡献均己在论文中作了明确的说明并表示谢意学位论文作者签名:镌彩I J矧扎1 ,一万謦.! 箩学位论文版权使用授权书本学位论文作者和指导教师完全了解东:l 匕大学有关保留、使用 学位论文的规定:即学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅本人同意东北大学可以将学位论文的全部或部分内容编入有关数据库进行检索、交流学位论文作者签名:摩墨礴 日飙1 心冉.k . 另外,如作者和导师不同意网上交流,请在下方签名;否则视为唰意学位论文作者签名:签字目期:导师签名:签字日期:东北大学硕士学位论文第一章概述1 .1 引言第一章概述信息可以分为结构化信息和非结构化信息两种,传统的数据管理系统都是对结构化信息的维护和利用,这方面的技术已经非常成熟但是在现实世界中,非结构化信息所占的比重更大,而且增加的速度也更快I B M 研究部门调查发现,全球8 5 %的信息是非结构化的【2 3 1 ,包括纸上的文件、报告、视频和音频文件、照片、件、信件,由于传统的数据管理系统只能对结构化的信息进行管理,这就造成大量的信息得不到有效利用,如何同时对结构化和非结构化的信息进行统一的管理,最大限度地挖掘有价值的信息已经被越来越多的企业和开发商所关注。
另外在现代社会中,企业与企业之间、企业与雇员之间、企业与客户之间的交往F l 益频繁,传递的信息也越来越多,单纯以人工的方式进行信息传递已经很难保证信息传递的准确、用时,如何有效、及时、准确地进行信息传递也成为企业所关注的一个热点1 .2 电子文档管理系统的概念及作用电子文档是指“电子化“ 了的文档,包括文本、图片、图纸、音频、视频、电子邮件、、甚至计算机软件等各种被电子化的、能够保存在计算机系统中的信息都属于电子文档电子文档管理系统是指能够将各种载体的文档进行电子化,并能够对电子文档进行采集、加工、整理、分类、组织、传递、利用、转换的计算机信息管理系统电子文档管理系统主要作用有:( 1 ) 利用计算机信息技术对大量的、各个时期的、各种形式的电子文档进行自动分析处理,并对电子文档进行统一组织与管理 2 ) 使得人们在浩瀚的文档中检索所需的信息成为可能,提高文档的利用率,充分发挥文档的价值 3 ) 使用企业与企业之间、企业与雇员之问、企业与客户之间信息传递的方式更加简便,传播的速度更快、更有效 4 ) 降低对文档进行手工维护的成本,使得企业能够对数量庞大的文档进行有东北大学硕士学位论文第一章概述效管理。
5 ) 使工作人员可以把精力放在工作上而不需要考虑分发工作任务或寻找文档 6 ) 加强对文档和工作流的控制能力,实现更佳的专业化水平,减少非法风险,做到了遵循法规和实践原则 7 ) 减少或取消了文档所占用的物理空间,减少或取消了存储设备和机柜、缩微胶片和缩微胶卷的占用空间1 .3 课题实施的背景及意义随着计算机技术和网络技术的快速发展,以及企业内部各种业务系统的建立,企业每年所产生的文档成倍甚至更快地增长( 据J u p i t e rR e s e a r c h 的报告显示,企业所产生的文档量每6 .8 个月便以双倍或更快的速率急增J 2 4 】) ,如此大量的文档如果以手工方式进行管理和查询的话,势必消耗大量的人力和物力,而且文档利用率很低,在这种情况下电子文档管理系统应用而生电子文档管玛! 系统能够对各种电子文档和资料( O 蚯c e 文档、图形图像、音频视频、X M L 文档、历史档案、扫描的票据影像、数据库导出记录、其他文档) 进行有效的组织管理和再利用国内现阶段电子文档的典型应用有:纸质文档数字化加工、基于网络的文档共享、【程图纸管驯、电子档案管理等,研究的主要对象集中在对静态电子文档,研究的重点是文档棚关信息的采集、存储、查询。
在采集方而又分多种,如手工录入、电子扫描识别、网络收集、与其它系统交换数据直接做接口进行数据交换等。





