
基于神经网络的房地产估价研究.doc
6页精品论文基于神经网络的房地产估价研究沈瑞平 辽宁工程技术大学理学院,辽宁阜新(123000) E-mail:srp_555@摘 要:随着我国房地产市场体逐步确立并走向完善,房地产估价在房地产市场中扮演越来 越重要的角色,并且服务范围越来越广目前我国房地产估价理论需要多元化拓展,因而积 极探索更为科学的估价方法具有重要的理论意义和现实意义本文根据房地产估价的特点分 析,在前人研究的基础上充分论证了 BP 神经网络理论在房地产估价应用的理论和方法,利 用神经网络超强的学习能力和处理非线性关系能力,从房地产交易案例中发现房地产价格与 其影响因素之间的客观规律,建立了房地产估价的神经网络模型 关键词:人工神经网络;BP 神经网络;房地产估价1. 引言人工神经网络(Artificial Neural Network,简称 ANN)是生理学上的真实人脑神经网络 的结构和功能,以及若干基本特征的某些原理抽象简化和模拟而构成的一种信息处理系统 是由大量神经元通过极其丰富和完善的联结而构成的自适应非线形、能够进行复杂的逻辑操 作的动态系统[1]人工神经网络有很多模型,但是目前应用最广泛的、基本思想最直观、 最容易理解的前馈神经网络中的误差逆传播学习算法(Error Back Propagation),简称为 BP 神经网络。
它是前馈神经网络中的核心部分,也是最精华的部分房地产估价是以房地产为研究对象,对其客观合理价格的估计预测或判断,它不是估价 人员的定价,实质是模拟市场的价格形成过程将房地产价格显现出来,是科学和艺术的有机 结合另一方面,房地产价格的高低是由众多影响房地产价格的因素综合作用的结果,而各 种影响房地产价格的因素,影响房地产价格变动的方向是不尽相同的,影响程度也是不一样 的[2]房地产价格与影响因素之间不是简单的线性关系,属于非线性并且很难用精确的数学模 型表述人们一直在探索着其中的规律,发现人工神经网络在处理这类问题时具有极大的灵 活性和自适应性将人工神经网络引入房地产估价中,利用神经网络的超强学习能力发现房 地产价格与影响因素的错综复杂的关系,对于拓展房地产估价的理论和方法,将具有一定的积极意义[3]2. BP 神经网络应用于房地产估价应用研究2.1 BP 神经网络的基本原理2.1.1 BP 神经网络的基本思想BP 神经网络是误差反向传播的多层前向网络 ,其信息处理机制由神经元激活特性和网 络拓扑结构决定 ,神经元的激活函数是非线性的 sigmoid 函数 ,网络结构由输入层、隐含 层、输出层组成 ,同层节点间无关联 ,异层节点前向连接。
BP 神经网络对问题的求解方法与 传统方法不同 ,它是经过训练来解答问题的 ,训练一个人工神经网络是一系列的输入和理想 的输出作为训练的样本 ,根据 BP 算法对网络进行足够的训练 ,使得 BP 神经网络能够学 习包含在“解”中的基本原理 ,训练结束后 ,该模型便可以求解相同的问题[4] 1 -2.1.2 BP 神经网络的结构下面以三层 BP 神经网络为例,其结构如图 2 一 1 所示前层是输入层,中间为隐层, 最后为输出层其信息从输入层依次向前,直到输出层输入层神经元的个数为输入信号的 维数,隐层个数以及隐层中神经元个数视具体情况而定,输出层神经元个数为输出信号的维数每一个神经元的激活函数是可微的 Sigmodi 函数或双曲正切函数x1x2 yx3输 隐 输入 层 出 层 层信 息 流图 2 一 1 基于 BP 算法的神经元网络的结构设有任一输入矢量 X∈Rn,有 n 个神经元,X=(X0,X1,…,Xn-1)T;中间隐层矢量 X ' ∈ R n1' ' ' ' T m1有 n1 个神经元, X = ( x1 , x2 ,..., xn −1 ); 最后输出层矢量 Y∈R,有 m 个神经元,Y=(y0,y1,…,ym-1)T。
其中输入层与隐层之间的连接权为 w ,阈值为 θ ,隐层与输出层之间的jk连接权为 w'ij jk,阈值为θ / ,那么各层神经元的输出为:⎧ '⎪x j =⎪⎨n−1xkjf (∑ wij xii =0jkn1 −1− θ j )(2-1)y⎪ =⎩⎪ kf (∑ w' 'j =0− θ ' )其中函数 f(.)满足 f(u)=11 + e −u, i = (1,2,..., n), j = (1,2,..., n1 ), k = (1,2,..., m)2.1.3 BP 神经网络的算法δ 学习规则:也称误差纠正学习规则它利用期望输出与实际输出差的最小平方误差这 个条件推导出来连接权值的调整如下:'Δwij= η (t j − y j ) f(u j ) xi(2-2)式中η f 0 位学习率,t j 为期望输出, y j 为实际输出, xi 为神经元 i 的输入,f(.)、 f' (.)分别为神经元的传递函数及其一阶导数; u j 为第 j 个神经元的输入BP 学习算法属于 δ 学习规则,是一种由教师的学习算法输入学习样本为 p 个,1x p1( p = 1,2,..., p) ,已知与其对应的教师值T p1 ,学习算法是将实际输出允许误差或达到最大训练次数为止。
1)信号正向传播:输入信号从输入层经过隐层单元,传向输出层,在输出端产生输出 信号,这是工作信号的正向传播在信号向前传递的过程中网络的权值是固定不变的,每一 层神经元的状态只影响下一层神经元的状态如果在输出层不能得到期望的输出,则转入误 差信号方向传播k= w为了方便,把阈值写入连接权,令:θ ',θ'n1k j= w, x'nj n1= −1, xn= −1, 则隐层的输入和输出为:nxi =0输出层的输入和输出为:n jn=f'j ∑ wij xii =0∑ wn j(2-3)' ' 'j =0yk = f' 'xjk j1j =0(2-4)单个样本的输出层误差:m−1E = ∑ (t p1 − y p1 ) 2(2-5)2p1 kk =0kp m−1对于 p 个样本的学习,其总误差为:E = 1 ∑∑ (t p1 − y p1 ) 2(2-6)2p1 k k1p =1 k =02)误差信号方向传播:网络的实际输出与期望的输出之间差值即为误差信号,误差信 号由输出端开始逐渐向回传播,这是误差信号的反向传播。
在误差信号反向传播的过程中, 网络的权值由误差反馈进行调节通过权值的不断修正使网络的实际输出更接近期望输出 如果满足给定的允许误差或达到最大训练次数,训练结束,否则转入信号正向传播设 wsq 为网络中的任意两个神经元的连接权,也包括阈值( wsq 代表前面定义的wij ,θ', wkj jk,θ ' ) 根据梯度下降算法,在批处理训练方式下权值的调整为:∂wsqΔw = −η ∂E总sq增量训练方式下的权值调整为:Δwsq∂E= −η p1∂w(2-7)sqjk下面以批处理训练方式为例进行权值调整的推导对于输出层:w' (t + 1) = w'(t ) − η∂E总(2-8)∂wjk jk' (t )jk式中 t 为迭代次数w'(t) 是隐层第 j 个神经元与输出层第 k 个神经元的连接权,从式(2-8)可以看出,它只与输出层的一个神经元有关系兼顾式(2-1)、(2-4)、(2-5)、(2-6), 于是得到:∂E p∂E p∂y p1∂u ' p1总 = ∑ 1 k k ∂wjk' (t )p1 =1∂y p1∂u ' p1' (t )pk= − ∑p1 =1(t p1 −kkp1 ) fk∂wkx' (u ' p1yjk)' p1j(2-9)pk= − ∑p1 =1(t p1 −kykp1 ) y ' p1(1 −' p1kj) x ' p1令 p1( p1p1 )' p1 (1y' p1 )δ jk = t k− yk yk− yk于是有w' (t + 1) = w'p(t ) + η ∑δ p1 x ' p1(2-10)jk jkjk jp1∂E总同理对于隐层:wij (t + 1) = wij (t) + η (2-11)∂wij (t )3)Levenberg-Marquardt 算法当误差函数具有平方和的形式时,Hessian 矩阵近似为 H= J T J ,梯度可以由式 J T e 计 算。
其中,J 是包含网络误差对权值一阶导数的 Jacobian 矩阵,e 是误差向量,Levenberg-Marquardt 算法为:w(t + 1) = w(t ) − [ J T J + μJ ]−1 J T e(2-12)其中 μ 是自适应调整的当 μ → ∞ 时,上式变成梯度下降法, μ → 0 时,就变成了近似Hessian 矩阵的牛顿法在前馈方向传播网络应用中,如果网络具有几百个权值时,采用Levenberg-Marquardt 算法收敛速度最快3. 房地产模型的建立3.1 房地产估价流程设计3.2 BP 神经网络的设计——网络拓扑结构1.输入/输出变量的确定 输入变量的选择应遵循这样两条原则:一是对输出影响很大且能够检测或提取的变量作为输入变量;二要注意输入变量之间互不相关或相关很小由于影响房地产价格的因素因子 很多,应在分析房地产价格影响因素的基础上,进行适当筛选2.网络层数的确定理论证明:具有偏差和至少一个 S 型隐层加上一个线性输出层的神经网络,能够闭紧 任何有理函数为了降低误差同时考虑尽快收敛,本文估价模型采用三层神经网络,即输入 层——隐层——输出层结构3.隐层单元数的确定 网络训练精度的提高,可以采用一个隐层,而增加其神经元数量的方法来实现,这比增加网络隐含层数的方法简单的多。
3.3 网络参数的确定1.初试权值的选取 由于系统是非线性的,初始值对于学。
