
毕业论文(设计)基于人工神经网络的手写识别系统.doc
45页摘 要信息技术的快速开展,计算机迅速走进人们的生活,手写识别技术和应用领域越来越广泛,比方在移动设备上、文印工作中都离不开它的身影,极大的方便了人们的日程生活、工作、学习,因此手写识别具有很强的应用价值和实用价值本文中利用神经网络算法识别数字图像和手写汉字识别的前提是获得稳定的神经网路,需要通过大量的训练样本进行训练针对数字图像首先对图像进行处理,通过灰度化、二值化、中值滤波、梯度锐化、归一化等算法获得特征矩阵,然后用经过训练的神经网路算法识别需要识别的特侦矩阵,进而获得识别的结果针对汉字识别,首先处理图像获得特征矩阵,通过经过训练的神经网络的识别获得笔画,然后用笔画去识别汉字,最后获得识别的汉字以及联想汉字和词组经过测试和验证,基于人工神经网络的手写识别系统能够有效识别数字手写图像与手写汉字,在本文选用的一些测试文字与数字图像的识别上获得了不错的结果关键词:手写识别;图像处理;神经网络ABSTRACTThe rapid development of information technology makes the computer immediately appear in people's lives. The application of handwriting recognition technology becomes widespread, and there are more and more application areas. For example, we can see it on a mobile deviceand in the printing work. It makes people's daily life, work and learning more convenient. Therefore, the handwriting recognition has very strong applied value and practical value.In this article, the writer uses neural network to identify digital image and handwriting Chinese ideogram. The premise of recognition is to obtain a stable neural network and a great deal of sample training is needed. For digital image, we need to process the images, and get characteristic matrix through a series of algorithms, including graying, linearization, Median filter, gradient sharpening and normalization.For Chinese ideogram recognition,we should gain a characteristic matrix by processing images, and then get painting pen through the training neural network identification.Next, we use painting pen to recognize Chinese ideogram.At last, the Chinese ideogram and associative Chinese characters and phrases will be obtained.After testing and verification, handwriting recognition which is based on artificial neural network system can effectively identify the handwriting image and Chinese ideogram. We obtain satisfying results in the identification test on words and digital image.Key words: Handwriting recognition;image processing;neural network目 录第1章 绪论 1 课题研究的背景 1 课题研究的目的及意义 1 国内外研究现状 2 课题研究内容 2 论文的组织结构 3第2章 神经网络算法的原理 4 神经网络的原理 42.1.1 生物神经元网络 42.1.2 人工神经元网络 4 神经元学习算法 6 前馈神经网络 6 感知机 6 反向传播算法 8 神经网络在模式识别上面的优势 11 本章小结 11第3章 系统设计与实现 12 神经网络算法的实现 12 神经网络的结构 12 算法的结构 12 神经网络识别手写数字 14 手写数字的常规预处理方法 14 图像的灰度化 15 图像的二值化 15 中值滤波 16 去掉离散点 16 图像锐化 17 数字的切分 18 数字的归一化 19 特征提取 19 数字识别过程 19 神经元规模确实定 21 神经网络识别汉字 21 笔画的预处理 22 图像的处理 233.3.3 神经网络规模确实定 243.3.4 字库的管理方式 243.3.5 汉字的查询 273.3.6 联想词组的查询 28 UI界面的实现 29 主窗口的自绘实现 29 自绘控件的实现 30 本章小结 32第4章 系统测试及效果分析 33 系统测试 33 神经网络算法的测试 33 手写数字识别的测试 33 手写汉字识别的测试 36 本章小结 37结论 38参考文献 39致谢 41第1章 绪论 课题研究的背景手写识别的研究具有很大的使用价值,在过去的几十年,由于数字化、信息化的大力开展,手写识别成为模式识别的一个热点。
随着 、平板等电子产品的快速开展,手写识别技术在这些产品上已经广泛应用,既能够提升这些产品的用户体验、也能提高不少的效率与此同时,现实生活中存在大量的手写、打印文件等,有的需要整理成电子文档,如果用人力去将该文件录入到电子设备当中,不仅效率低而且错误率高,这种方法已经不适应当今社会,由于现在电子计算机的广泛应用于各行各业,但是由于各种各样的原因,智能识别系统不能广泛应用于社会,极大影响了人们的生活、工作效率人工智能有一段时间曾经陷入低迷,群众都认为人工智能只是个玩具而没有实际应用价值进入21世纪以来,数学的大力开展大大推动了人工智能的进步,也大大推动了计算机科学的开展机器学习是人工智能的一个重要分支,也是现在的一个热点一个真正的智能,应该具有学习能力,能够根据自身的环境来学习,并改善自身的性能,能够自动获取学习所需要的知识以前的智能系统不具有学习能力,只是根据某些算法去计算,随着时代的开展,这种局限表现的更加突出在这种现象下,机器学习在很大程度上解决了这种局限现在机器学习已经应用到各个领域,比方专家系统、语音识别、搜索、计算机视觉等神经网络是机器学习学科中的一个重要局部,用来分类或者回归。
神经网络的开展,为手写识别提供了一个新的途径 课题研究的目的及意义单个神经元的结构简单,但是当大量的神经元组成了神经网络,就有了本质的改变,它能够模拟现实生活中的行为,而且每个神经元都能处理和存储信息,使得神经网络具有了并行计算和分布式存储的特点研究神经网络的结构有助于更好的从手写字中踢出去关键因素,从而提高识别的准确度和丰富度研究手写识别具有很大的应用价值,将其应用于现代便携电子设备,丰富了人们的生活,提高工作效率将其应用于手写文档的识别,不仅能将人们从繁重重复的劳动中解脱出来,而且能够提高手写文档电子化的效率手写识别有很重要的理论价值,人们书写的文字种类不同,每个人的书写习惯不同,使得识别的样本具有丰富的多样性,识别算法需要从不同的方面进行研究 国内外研究现状 在20世纪20年代,西方学者就研究过字符的识别,最早的是德国人G.Tausher的阅读机,采用的比拟简单的匹配原理,能够粗略的识别简单的字符比方数字到了20世纪60年代初,OCR(广字符阅读机)已经能够识别书写比拟公正的手写体字符了,比方日本的Toshiha公司开发的邮政编码自动分拣机到了近代,人工智能的开展,神经网络走入了人们的视线,它具有众多优点,能够有效利用样本的特点进行学习,然后根据学习的结果识别手写字符[1]。
由于汉字的基数大、写法复杂、字体繁多,识别起来难点很大,所以汉字的识别被认为是字符识别领域的最终目标,很多人投入了大量的精力,也取得了很大的成就[2]汉字的识别最开始始于1966年,IBM公司的Casey和Nagy首次发表了汉字识别的文章国内的汉字识别技术始于20世纪70年代,当时是联机手写识别技术,经过长时间的摸索之后,刘迎健等人于1988年提出了利用笔段作为基元来进行联机的手写汉字识别,识别的汉字能够到达6763-12000字,已经具有了一定的实用价值现在的手写识别技术较上个世纪,已经有了长足的进步,识别范围能够支持GB2312-80规定的6763个简体字,对于书写标准的汉字,识别率能够到达95%以上[3,4] 课题研究内容本课题研究的是一个基于神经网络的手写识别系统系统由C++语言开发完成,负责神经网络前馈网络、反应神经网络、界面的设计、图形的处理、图形的识别、字库管理程序的设计,手写识别系统包括神经网络算法的设计系统研究的是基于神经网络的手写识别,包括数字与汉字的识别数字与汉字的识别方法不一样,数字比拟简单,数量只有10个,汉字较为复杂,数量大,所以针对这两种模型采用了不同的思路。
本文首先从理论上介绍了神经网络算法,然后介绍了数字的识别方法、汉字的手写识别方法数字的识别能够识别两种模式的数字,第1种是直接通过手写工具写在手写板上的数字,通过神经网络的分类,得出书写的结果;第2种是加载含有噪声的数字,首先通过计算机图形学的知识降噪,然后通过神经网络分类得出结果汉字的识别是将汉字拆分成元字根,本系统根据笔尖的走向,判断出书写的笔划,然后通过笔划来判断汉字 论文的组织结构本文共分为4章,按如下方式组织:第1章是全文的绪论局部,介绍了系统开发的背景,系统的研究的目的和意义,国内外的研究现状,课题的研究内容,系统的预期效果和关键指标以及本文的组织结构第2章是神经网络算法的介绍,这局部详细介绍了神经网络算法,然后介绍了神经网络中的BP神经网络算法第3章是手写识别的根本过程,这局部介绍了神经网络的实现、对图形的处理、特征向量的提取、以及汉字和数字的手写识别过程,以及用户界面的实现过程第4章是介绍了系统的测试局部,这局部主要介绍了手写识别系统的三个局部的测试最后是结论局部,对全文进行了全面的总结第2章 神经网络算法的原理人工神经网络(Artificial Neural Network,ANN)由大量的神经元组成,结构与脑神经 组织相似,是对生物神经元的模拟,能够完成与生物神经元网络类似的功能。
神经网络的原理2.1.1 生物神经元网络人脑的神经系统的根本组成单位是神经细胞,人脑组织的神经系统大约由1011个神经元细胞组成,而每个神经细胞大于与104个神经细胞相连接,通过。












