
基于主成分分析的杭州市二手房住宅特征价格研究.docx
2页基于主成分分析的杭州市二手房住宅特征价格研究基于主成分分析的杭州市二手房住宅特征价格研究 :未知 【摘要】主成分分析是研究住宅属性与价格关系的有效手段本文将主成分分析模型用于杭州市二手房市场研究,分析2930个杭州市二手房的详细情况,进行多重回归分析,并用SPSS软件模拟特征价格模型关键词】住宅属性 二手房一、引言特征价格法是目前国际上研究影响住宅价格微观决定因素的最主流方法自1974年Rosen提出完整的技术框架后,经历30余年的发展,业己十分成熟,在我国及很多发达国家的政府部门和产业界得到越来越广泛的应用二、研究区概况杭州市房地产市场是我国最为发达的房地产市场之一,自2016年G20之后,杭州市的国际知名度大增,二手房交易流动速度远高于我国房产交易平均水平在二手房交易中,卖方和买方的信息对称和知情权是目前制约二手房市场发展的主要原因之一对卖方而言,由于复杂多变的政策、“一房一价”模式以及个人偏好问题,导致售出过程受阻;而对买方而言,从浩瀚如烟的房产数据里搜寻出心仪的房产,更是难事一桩因此,快速准确地为业主的房产估值或为购房者提供置业建议成为房产经济行业非常有意义的研究问题。
三、样本量的确定本文从实际样本量的可获取量出发,参考各个城区人口数量间的比例关系,其中西湖区编号为1,人口数量80.85万人,样本数量510;上城区编号为2,人口数量35.30万人,样本数量412;下城区编号为3,人口数量53.50万人,样本数量330;江干区编号为4,人口数量71.09万人,样本数量456;拱墅区编号为5,人口数量57.10万人,样本数量640;滨江区编号为6,人口数量33.08万人,样本数量582四、特征价格模型的构建(一)数据来源变量数据的获取主要依靠网络内容包括:装修程度、建筑类型、朝向、附近生活便利情况、附近教育配套、附近医疗情况、附近交通情况、面积、户型、楼层、建造年代等以及区位特征和邻里特征;对于特征不详尽的住房,以实地调查的方式补充资料二)样本变量的选择和量化分等级赋值变量:有些特征变量需要通过主观识别进行评价,为了便于赋值,所以进行了等级的赋值的方法,这类变量主要有:装修程度、建筑类型、朝向三个变量赋值越高,对住宅价格的附加值就越高装修中毛坯、简装、精装分别赋值为3、6、9;楼层低中高分别对应楼层2、7、10;给朝向排序综合指标变量由于过多变量的共线性问题不容忽视,故需对过多变量进行概括与浓缩,形成一个综合指标,包括15min步行范围内公交站数;5公里内医院数;1公里内学校数;15min步行范围内超市数。
还对定量数据进行量化,包括:几室几厅、面积、建造年代、电梯有无三)杭州二手房房产估值模型的建立建立多元线性回归模型,再用逐步回归法对影响房价不大的因素移去,再利用线性最小二乘法对其他主要因素进行拟合1.多元线性回归模型的建立与求解:由y=β0+β1x1+…+βkxk确定模型为:Y=Xβ+εE(ε)=0,COV(ε,ε)=σ2In为k元线性回归模型,k=12,简记为(Y,Xβ,σ2In)Y=-185.5261+3.0877*x3+3.9751*x4+8.7603*x5+17.2894*x6+0.7181*x9+5.1173*x1o+10.6264*x11+1.3616*x12其中β0,βD,…,β12是13个带估计参数y为房价,单位万元;x1为室数,单位室;x2为厅数,单位厅;x3为面积;x4为朝向;x5为装修;x6为电梯有无;x7为建造年代;x8为楼层高低;x9为周边交通;x10为周边医疗;x11为周边教育;x12为周边超市用最小二乘法求β0,…,βk的估计量做离差平方和:选择β0,…,βk使得Q达到最小解得估计值:此为经验回?w平面方程,βi为经验回归系数进行逐步回归分析,从一个自变量开始,视自变量y作用的显著程度,从大到小地依次逐个引入回归方程。
当引入的自变量由于后面变量的引入而变得不显著时,要将其剔除掉对于每一步都要进行y值检验,以确保每次引入新的显著性变量前回归方程中只包含对y作用显著的变量这个过程反复进行,直至既无不显著的变量从回归方程中剔除,又无显著变量可引入回归方程时为止最终得到回归平面方程为:y=-185.5261+3.0877x3*+3.9751*x4+8.7603*x5+17.2894*x6+0.7181*x9+5.1173*x1*+10.6264*x11+1.3616*x122.线性模型和回归系数的检验:利用R检验法,解得R2=0.79802;修正后:,模型具有比较强的解释能力与显著性相关的P值=0。
