好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

神经网络学习之BP神经网络.doc

20页
  • 卖家[上传人]:hs****ma
  • 文档编号:432981424
  • 上传时间:2023-09-19
  • 文档格式:DOC
  • 文档大小:1.52MB
  • / 20 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • word神经网络学习 之 BP神经网络目录第一章 概 述第二章BP算法的根本思想第三章BP网络特性分析3.1 BP网络的拓扑结构43.2 BP网络的传递函数53.3 BP网络的学习算法6第四章BP网络的训练分解前向传输〔Feed-Forward前向反响〕8逆向反响〔Backpropagation〕94.3 训练终止条件10第五章BP网络运行的具体流程10网络结构10变量定义10误差函数:11第六章 BP网络的设计146.1 网络的层数146.2 隐层神经元的个数156.3 初始权值的选取156.4 学习速率15BP网络的局限性15BP网络的改良16第一章 概 述神经网络是1986年由Rumelhart和McCelland为首的科研小组提出,参见他们发表在Nature上的论文 Learning representations by back-propagating errors BP神经网络是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一BP网络能学习和存贮大量的 输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程它的学习规如此是使用最速下降法,通过反向传播来不断 调整网络的权值和阈值,使网络的误差平方和最小。

      第二章 BP算法的根本思想多层感知器在如何获取隐层的权值的问题上遇到了瓶颈既然我们无法直接得到隐层的权值,能否先通过输出层得到输出结果和期望输出的误差来间接调整隐层的权值呢?BP算法就是采用这样的思想设计出来的算法,它的根本思想是,学习过程由信号的正向传播与误差的反向传播两个过程组成· 正向传播时,输入样本从输入层传入,经各隐层逐层处理后,传向输出层假如输出层的实际输出与期望的输出(教师信号)不符,如此转入误差的反向传播阶段· 反向传播时,将输出以某种形式通过隐层向输入层逐层反传,并将误差分摊给各层的所有单元,从而获得各层单元的误差信号,此误差信号即作为修正各单元权值的依据这两个过程的具体流程会在后文介绍BP算法的信号流向图如如下图所示 第三章 BP网络特性分析我们分析一个ANN时,通常都是从它的三要素入手,即 1)网络拓扑结构; 2)传递函数; 3)学习算法每一个要素的特性加起来就决定了这个ANN的功能特性所以,我们也从这三要素入手对BP网络的研究3.1 BP网络的拓扑结构上一次已经说了,BP网络实际上就是多层感知器,因此它的拓扑结构和多层感知器的拓扑结构一样由于单隐层〔三层〕感知器已经能够解决简单的非线性问题,因此应用最为普遍。

      三层感知器的拓扑结构如如下图所示 一个最简单的三层BP: 3.2 BP网络的传递函数BP网络采用的传递函数是非线性变换函数——Sigmoid函数〔又称S函数〕其特点是函数本身与其导数都是连续的,因而在处理上十分方便为什么要选择这个函数,等下在介绍BP网络的学习算法的时候会进展进一步的介绍 单极性S型函数曲线如如下图所示 双极性S型函数曲线如如下图所示3.3 BP网络的学习算法BP网络的学习算法就是BP算法,又叫 δ 算法〔在ANN的学习过程中我们会发现不少具有多个名称的术语〕, 以三层感知器为例,当网络输出与期望输出不等时,存在输出误差 E ,定义如下:将以上误差定义式展开至隐层,有 进一步展开至输入层,有 由上式可以看出,网络输入误差是各层权值ωjκ、υij的函数,因此调整权值可改变误差 E 显然,调整权值的原如此是使误差不断减小,因此应使权值与误差的梯度下降成正比,即 :对于一般多层感知器,设共有 h 个隐层,按前向顺序各隐层节点数分别记为 m1,m2,…,mh,各隐层输出分别记为 y1,y2,…,yh,各层权值矩阵分别记为 W1,W2,…,Wh,Wh+1,如此各层权值调整公式为输出层第 h 隐层按以上规律逐层类推,如此第一隐层权值调整公式容易看出,BP学习算法中,各层权值调整公式形式上都是一样的,均由3个因素决定,即:1. 学习率 η2. 本层输出的误差信号δ3. 本层输入信号 Y〔或X〕其中输入层误差信号与网络的期望输出与实际输出之差有关,直接反响了输出误差,而各隐层的误差信号与前面各层的误差信号有关,是从输出层开始逐层反传过来的。

      可以看出BP算法属于δ学习规如此类,这类算法常被称为误差的梯度下降算法δ学习规如此可以看成是Widrow-Hoff(LMS)学习规如此的一般化(generalize)情况LMS学习规如此与神经元采用的变换函数无关,因而不需要对变换函数求导,δ学习规如此如此没有这个性质,要求变换函数可导这就是为什么我们前面采用Sigmoid函数的原因综上所述,BP三要素如如下图所示第四章 BP网络的训练分解训练一个BP神经网络,实际上就是调整网络的权重和偏置这两个参数,BP神经网络的训练过程分两局部:· 前向传输,逐层波浪式的传递输出值;· 逆向反响,反向逐层调整权重和偏置; 我们先来看前向传输前向传输〔Feed-Forward前向反响〕在训练网络之前,我们需要随机初始化权重和偏置,对每一个权重取[−1,1]的一个随机实数,每一个偏置取[0,1]的一个随机实数,之后就开始进展前向传输神经网络的训练是由多趟迭代完成的,每一趟迭代都使用训练集的所有记录,而每一次训练网络只使用一条记录,抽象的描述如下:首先设置输入层的输出值,假设属性的个数为100,那我们就设置输入层的神经单元个数为100,输入层的结点Ni为记录第i维上的属性值xi。

      对输入层的操作就这么简单,之后的每层就要复杂一些了,除输入层外,其他各层的输入值是上一层输入值按权重累加的结果值加上偏置,每个结点的输出值等该结点的输入值作变换 前向传输的输出层的计算过程公式如下: 对隐藏层和输出层的每一个结点都按照如上图的方式计算输出值,就完成前向传播的过程,紧接着是进展逆向反响逆向反响〔Backpropagation〕逆向反响从最后一层即输出层开始,我们训练神经网络作分类的目的往往是希望最后一层的输出能够描述数据记录的类别,比如对于一个二分类的问题,我们常常用两个神经单元作为输出层,如果输出层的第一个神经单元的输出值比第二个神经单元大,我们认为这个数据记录属于第一类,否如此属于第二类还记得我们第一次前向反响时,整个网络的权重和偏置都是我们随机取,因此网络的输出肯定还不能描述记录的类别,因此需要调整网络的参数,即权重值和偏置值,而调整的依据就是网络的输出层的输出值与类别之间的差异,通过调整参数来缩小这个差异,这就是神经网络的优化目标对于输出层: 其中Ej表示第j个结点的误差值,Oj表示第j个结点的输出值,Tj记录输出值,比如对于2分类问题,我们用01表示类标1,10表示类别2,如果一个记录属于类别1,那么其T1=0,T2=1。

      中间的隐藏层并不直接与数据记录的类别打交道,而是通过下一层的所有结点误差按权重累加,计算公式如下: 其中Wjk表示当前层的结点j到下一层的结点k的权重值,Ek下一层的结点k的误差率计算完误差率后,就可以利用误差率对权重和偏置进展更新,首先看权重的更新: 其中λ表示表示学习速率,取值为0到1,学习速率设置得大,训练收敛更快,但容易陷入局部最优解,学习速率设置得比拟小的话,收敛速度较慢,但能一步步逼近全局最优解更新完权重后,还有最后一项参数需要更新,即偏置: 至此,我们完成了一次神经网络的训练过程,通过不断的使用所有数据记录进展训练,从而得到一个分类模型不断地迭代,不可能无休止的下去,总归有个终止条件4.3 训练终止条件每一轮训练都使用数据集的所有记录,但什么时候停止,停止条件有下面两种:1. 设置最大迭代次数,比如使用数据集迭代100次后停止训练2. 计算训练集在网络上的预测准确率,达到一定门限值后停止训练第五章BP网络运行的具体流程网络结构输入层有n个神经元,隐含层有p个神经元,输出层有q个神经元变量定义输入变量:x=(x1,x2,…,xn)隐含层输入变量:hi=(hi1,hi2,…,hip)隐含层输出变量:ho=(ho1,ho2,…,hop)输出层输入变量:yi=(yi1,yi2,…,yiq)输出层输出变量:yo=(yo1,yo2,…,yoq)期望输出向量:do=(d1,d2,…,dq)输入层与中间层的连接权值:wih隐含层与输出层的连接权值:who隐含层各神经元的阈值:bh输出层各神经元的阈值:bo样本数据个数:k=1,2,…,m激活函数:f(⋅)误差函数:第一步:网络初始化给各连接权值分别赋一个区间(−1,1)内的随机数,设定误差函数e,给定计算精度值ε和最大学习次数M。

      第二步:随机选取随机选取第k个输入样本以与对应的期望输出 x(k)=(x1(k),x2(k),…,xn(k))do(k)=(d1(k),d2(k),…,dq(k))第三部:隐含层计算计算隐含层各神经元的输入和输出 第四步:求偏导数利用网络期望输出和实际输出,计算误差函数对输出层的各神经元的偏导数δo(k) 第六步:修正权值利用输出层各神经元的δo(k)和隐含层各神经元的输出来修正连接权值who(k) 第七部:修正权值利用隐含层各神经元的δh(k)和输入层各神经元的输入修正连接权值 第八步:计算全局误差第九步:判断模型合理性判断网络误差是否满足要求 当误差达到预设精度或者学习次数大于设计的最大次数,如此完毕算法 否如此,选取下一个学习样本以与对应的输出期望,返回第三部,进入下一轮学习第六章 BP网络的设计在进展BP网络的设计是,一般应从网络的层数、每层中的神经元个数和激活函数、初始值以与学习速率等几个方面来进展考虑,下面是一些选取的原如此6.1 网络的层数理论已经证明,具有偏差和至少一个S型隐层加上一个线性输出层的网络,能够逼近任何有理函数,增加层数可以进一步降低误差,提高精度,但同时也是网络 复杂化。

      另外不能用仅具有非线性激活函数的单层网络来解决问题,因为能用单层网络解决的问题,用自适应线性网络也一定能解决,而且自适应线性网络的 运算速度更快,而对于只能用非线性函数解决的问题,单层精度又不够高,也只有增加层数才能达到期望的结果6.2隐层神经元的个数网络训练精度的提高,可以通过采用一个隐含层,而增加其神经元个数的方法来获得,这在结构实现上要比增加网络层数简单得多一般而言,我们用精度和 训练网络的时间来恒量一个神经网络设计的好坏: 〔1〕神经元数太少时,网络不能很好的学习,训练迭代的次数也比拟多,训练精度也不高 〔2〕神经元数太多时,网络的功能越强大,准确度也更高,训练迭代的次数也大,可能会出现过拟合(over fitting)现象。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.