您所在位置：网站首页 > 办公文档 > 工作计划 > 《文字识别算法》

《文字识别算法》.docx

9页

卖家[上传人]：tang****xu4

文档编号：271276184

上传时间：2022-03-28

文档格式：DOCX

文档大小：163.78KB

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10金贝

下载

/ 9 举报版权申诉马上下载

文本预览

下载提示

常见问题

题目图像分割技术学院计算机科学与技术班级计软1401学生兰俊锋学号20141214023文字识别是智能识别技术中的一个重要技术文字具有便于信息保存和传递的优点，使信息在时间和空间上得以迅速扩散在人们的日常生活中，在机关事务处理、工业以及商业交往中，需要识别文字的数量如同天文数字，但利用计算机识别的文字量却很少最近几年，随着计算机技术、数学和图像技术的发展，文字识别的应用领域逐步扩大，目前较为活跃的应用包括数字识别，文字识别等文字识别是指用计算机字典、高速地识别现在介质（如纸张等）上的数字、英文符号或汉字文字识别实际上就是解决文字的分类问题，一般通过特征及特征匹配的方法来进行处理本文将从算法、应用两方面介绍文字识别技术，本文介绍的文字识别应用有英文字母识别、车牌特殊文字识别、书写文字识别、特殊文字识别文字是人类相互交流信息的重要工具社会发展进入信息时代，人们已不再停留在用自己的耳朵和眼睛去直接获得这些信息，而是使用计算机将文字自动的输入计算机，用计算机对他们进行处理，随时以各种方式满足人们的不同需要因此，研究如何用计算机自动识别文字图像，解决文字信息自动输入计算机，并进行高速加工处理的问题已引起大家的广泛关注。

归一化算法一般作为一种图像的预处理技术，其目的是将采集到的原始图像转换成特征提取器所能接受的形式（灰度图像或二值图像），消除一些与类别无关的因素（噪声消除、归一化等）从理论上讲，经过归一化后的骨架应该是宽度为一的中心线，但这是不可能的不同的硬件设备和不同的算法得出的结果可能不是唯一的，其结果与原图案的扭曲程度也是不〜样的，扭曲程度尽量的小应该是归一化算法追求的目的之一既然预处理是为后续的特征提取和分类器设计服务的，那么预处理方法的选择就应该有利于特征的提取，以使分类变得简单1. 汽车牌照识别，在高速公路收费、电子警察和治安卡口等系统中有重要的应用价值作为图像识别的典型问题，汽车牌照识别的研究有很长的历史，但因为实际路况的高度复杂性（如车速、光线、污染及变形等），目前的性能还不能令人满尽、O文字识别过程概述一般来说，文字图像的识别过程主要由以下4个部分组成：①正确地分割文字图像区域；②正确地分离单个文字；③正确识别单个文字；④正确地连接单个文字其中①、④属于文字图像分析技术问题，③属于文字识别技术问题关于②，由于仅从分割处理不能对其进行评价，通常采用文字识别地评价值来判断分离的正确性单纯的文字识别是指经二值化处理后的单个文字识别。

1.1. 文字识别系统的原理及组成文字图像的识别的原理如下图所示图中光电变换检测部分的主要功能，是对纸面上的文字进行光电转换，然后经模数转换成具有一定灰度的数字信号，送往其后的各部分进行处理和识别常用的检测设备是扫描仪，CCD摄像头等文字图像分割的目的就是根据文字图像的特征的视线文字图像区域的定位和分割，将真正的文字图形分割出来，以便后续进行识别，识别与处理部分的功能是将已分割出的文字图形信息加以区分，去除信号中的污点、空白等噪声，增强文字图像的信息并根据一定的准则除掉一些非本质信号，对文字的大小、位置和笔画粗细等进行规范化，以便简化判断部分的复杂性特征提取部分是从整形和规范化的信号中抽取反映字符本身的有用信息，供识别部分进行识别作为特征提取的内容是比较多的，可以是几何特征，如文字线条的端点、折点和交点等识别判断部分则是根据抽取的特征，运用一定的识别原理，对文字进行分类，确定其属性，达到识别的目的，实际上判断部分就是一个分离器1.2. 识别系统学习部分的功能是生成计算机特征字典，学习根据已准备好的多个字样，抽出代表该字的特征，进行修改，按照字典的规定位置存放该特征学习分为两种：一种是在人的参与下进行，称为“有教师”学习；一种由计算机自动进行，称为“无教师学习”o文字识别的方法文字识别是指用计算机字典、高速地识别现在介质（如纸张等）上的数字、英文符号或汉字。

文字识别实际上就是解决文字的分类问题，一般通过特征及特征匹配的方法来进行处理特征判别是通过文字类别（例如英文或汉字）的共同规则（如区域特征、四周边特征等）进行分类判别它不需要利用各种文字的具体知识，根据特征抽取的程度（知识的使用程度）分解到地使用结构分析的办法完成字符的识别匹配的方法则是根据各国文字的知识（称为自动）采取按形式匹配的方法进行按实现的技术途径不同又可分为两种：一种是直接利用输入的二维平面图像与字典中记忆的图像进行全域匹配；另一种是只抽出部分图像与字典进行匹配然后根据各部分形状及相对位置关系，与保存在字典中的知识进行对照，从而识别出每一个具体的文字前一种匹配方法适合于数字、英文符号一类的小字符集；后一种匹配方法适用于汉字一类的大字符集1.3. 边缘检测边缘（Edge）是指图像局部亮度变化量最显著的部分边缘主要存在于目标与木板、目标与背景、区域与区域（包括不同色彩）之间，是图像分割、纹理特征提前和形状特征提取等图像分析的重要基础图像分析和理解的第一步常常是边缘检测由于边缘检测十分重要，因此成为机器视觉研究领域最活跃的课题之一图像中的边缘通常与图像亮度或图像亮度的一阶导数的不连续性有关。

图像亮度的不连续可分为：①阶跃不连续，即图像亮度在不连续处的两边的像素灰度值有着显著的差异；②线条不连续，即图像亮度突然从一个值变化到另一个值，保持一个较小的行程后又返回到原来的值在实际中，阶跃和线条边缘图像是很少见的，由于大多数传感元件具有低频特性，使得阶跃边缘变成斜坡型边缘，线条边缘变成屋顶形边缘，其中的亮度变化不是瞬间的，而是跨越一定的距离对一个边缘来说，有可能同时具有阶跃和线条边缘特性，例如在一个表面上，由一个平面变化到发线方向不同的另一个平面上就会产生阶跃边缘；如果这一表面具有镜面反射特性且两平面形成的棱角比较圆滑，则当棱角圆滑表面的法线经过镜面反射角时，由于镜面反射分量，在棱角圆滑表面上会产生明亮光条，这样的边缘看起来像在阶跃边缘上叠加了一个线条边缘由于边缘可能与场景中物体的重要特征对应，所以它是很重要的图像特征比如，一个物体的轮廓通常产生阶跃边缘，因为物体的图像亮度不同于背景的图像亮度2. 简单贝叶斯分类器简单贝叶斯分类器(SimpleBayesClassifier或Na?veBayesClassifier)⑴假定特征向量的各分量间相对于决策变量是相对独立的对于特征向量为X=[幻,X2,・・・Xd]T的测试样本，它属于第C类的条件概率为：P(Ci|X)=P(XCi)*P(Ci)/P(X)二(P(C0/p(x))(1)对每一个类别(即取不同的值)都计算上面的条件概率，最终的识别结果为条件概率最大的那一类别。

虽然简单贝叶斯分类器是基于独立性假设的，在违背这种假定的条件下简单贝叶斯也表现出相当的健壮性和高效性678,它已经成功地应用到分类、聚类等问题中2.1.简单贝叶斯分类器在切分中的应用在确定文字的最佳候选后边界时，假设有m个候选后边界，分别对应m个候选切分结果,用d种特征来衡量其合理性,记为X=[xi,X2,・・泌「,j(=l,2-m)则,当文字为类(G、C2、G)分别表示汉字、英文和数字、标点类别)，且后边界为第j个候选后边界的概率为：P（X」,C1）=P（X」Cl）*P（Ci）二P（CL）（i=l,2,3j=l,2・・・m）（2）以上公式（2）与公式（1）不同的是，公式（1）只需要确定一个值，即观测值X对应的类别；而公式（2）不仅需要确定一个候选后边界切分出文字的种类，还需要确定m个候选后边界那一个最合适显然，使P（X|CJ取最大值时的j就对应了最佳切分位置，而相应的i即为对文字类别的定义2. 2.特征提取文中的贝叶斯分类器用到的特征可分为两种：一种是文字形状和结构方面的特征，包括6种文字外形特征（文字高度、宽度、字间距离、覆盖率、高宽比［2］、纵向起始位置）和3种后边界特征（后边界穿越笔划数、后边界投影值、后边界上下穿越笔划点距离）；另一种是文字内容特征，包括16维方向线素特征（把文字分成不重叠的2X2块，每块提取出水平、垂直、45°和135°4个方向的方向线素特征）。

第一种特征里，除了覆盖率和高宽比外都需要特征归一化这里用图像中的汉字平均高和宽对它们归一化因此，切分过程的第一步需要估计基本参数：汉字平均高和宽在研究中发现，文字切分中最容易出现的错误是：（1）把汉字的偏旁、部首等部件当成英文、数字或标点单独切开；（2）把英文、数字或标点与汉字切在一起为了有较好的切分效果，就需要抽取出能够区分这些错误的特征一级汉字中容易切开的汉字有以下几种：（1）“八”，“儿”，“川”，“非”，“加”，“旧”，“别”，“训”；（2）“叫”，“礼”，“仆”，“讨”，“引”，“很”；（3）“必”,“小”，“心”；（4）“懊”第1、3种字，单个字左右部分容易切开；第2、4种字，由于有左边的部首，左右部分也容易切开；第1、2种汉字易被当成英文或数字类文字切开；第2、4种汉字左边的点易被当成标点类文字切开为此，把上面4种文字易被切开的部分定义为新的文字类别：部件类，用C4来表示它；该类仅用于提取特征3. 归一化算法的研究汉字图像的归一化包括位置、大小、旋转、倾斜和笔画宽度的归一化在整个汉字识别系统中会进行字符切分、倾斜校正等步骤，本文主要研究汉字的大小和笔画宽度的归一化字体大小归一化由于汉字字形、字体繁多，同一汉字的特征也因此而不同，为了便于统一描述和提取同一汉字的特征，对不同字形、字体汉字均能识别，为汉字识别工作打好基础，在汉字特征提取前还需对汉字图像进行大小归一化的操作。

所谓大小归一化就是对实际提取的字符进行缩放操作，最后得到预定大小的字符图像一般汉字图像预处理的第一步是进行二值化处理，二值化处理的目的是把灰度图像转换为二值图像二值化处理后图像中的像素点不是1(黑点)就是0(白点)记为：g*n二(Pi,j)(1wiwMlwJwN)其中，M和N分别为G的长和宽；P】,j为第i行、第j列的像素点P,j=l时表示一个黑像素点(前景点)，P,l0时表示一个白像素点(背景点)简记为G一般的缩放算法是对一个区域的灰度值进行运算，由四个以上的输入像素决定输出像素的灰度值而对于二值图像，只有黑白像素，此时可以对图G进行划分而得到一组图块g,使得每个g内黑像素点的分布是比较均匀的，记为：gm*n=(Pa,b)(Pa,b€G1WaWg1WbWFl)其中，m和n(mWMnWN)分别称为该图块的长和宽定义了图块之后，二值点阵图像又可表示为：Q*N=(g%n)(1WxW[M/m],lWyWLN/n])其中，(x,y)表示图块g在图像G中的位置在图块g中，值为1的像素点个数与全部像素点个数之比，称为该图块的灰度值记为：P(g)=(艺Pi.j/(mXn))X100%(1WiWm,1WjWm)若g中所有的像素点为1,则称将g置1,若所有的像素点为0,则称将g置0o本文所用的大小归一化算法不是简单地将g压缩为一个像素点，而是按压缩比将g缩小成为另一个图块g'使得g'具有与g相同的特征，即二者的黑像素点分布是相似的。

这样，由g'构成的缩小图G就可基本上保持原图G的特征，从而减小了由缩小所造成的失真设：Gm*n=(g/m*n)(1wiw[M/m],lwJw[N/n])G'=(g')(g'为g缩小后形成的图块)算法描述如下：① 读入原图G根据G的行列数、特征及压缩比，确定图块g的行、列数及g'的行、列数；i二1,j=l；读人gltJ,根据第一次划分得到的图块的灰度值P(gllJ)及图块的特征构造i>Jg';② 若iW[M/m]或jW[N/n],贝M修改i,j的值使之指向下一个像素点，然后转向步骤③继续；否则结束。

点击阅读更多内容