
Python工程应用—机器学习方法与实践第12章财政收入影响因素分析及预测.pptx
25页第一章第一章 概论概论西华大学西华大学机器学习第十二章 财政收入影响因素分析及预测XXX学校XXXXXX20222022目录Contents案例引入模型介绍案例操作 3 XXXXXXXXXXXXXXXXX 本章知识图谱本章知识图谱3求是 明德 卓越 案例引入一 5 XXXXXXXXXXXXXXXXX1 1 案例引入案例引入5案例数据:本案例将研究我国某重要地区的财政收入与经济的关系,以得到市财政收入的关键影响因素本案例所用的财政收入分为地方一般预算收入和政府性基金收入由于数据获取的有限性,使用的数据均来自于某市统计年鉴案例目标:梳理影响地方财政收入的关键特征,分析影响地方财政收入的关键特征的选择模型,以及对某市的财政收入进行预测求是 明德 卓越 模型介绍二 72.1 2.1 模型介绍模型介绍7 Adaptive-Lasso是近年来被广泛应用于参数估计和变量选择的方法之一,并且在确定的条件下,可以使用Adaptive-Lasso方法进行变量选择使用Adaptive-Lasso方法来探究地方财政收入与经济的关系,本方案将选择参数估计与变量同时进行的一种正则化方法,其被定义为:82.1 2.1 模型介绍模型介绍8由普通最小二乘法得出的系数为:求解微分方程,得到预测模型如下:92.1 2.1 模型介绍模型介绍9 提示:GM(1,1)模型就是灰色预测中的强力工具之一。
该模型中,G表示Grey,M表示Model,括号中第一个1代表一阶微分方程,第二个1代表微分方程有一个变量同理,灰色预测理论中GM(1,2)表示有两个变量的一阶微分方程灰色模型102.1 2.1 模型介绍模型介绍10 利用模型进行预测之后,对建立的灰色预测模型进行精度检验,本案例使用后验差检验对模型精度进行检验,计算公式如下所示:均值:标准差:112.1 2.1 模型介绍模型介绍11残差的均值:残差的标准差:方差比:122.1 2.1 模型介绍模型介绍12最小残差概率:预测精度等级预测精度等级P PC C好好0.950.800.700.50不合格不合格=0.65预测精度等级对照表求是 明德 卓越 案例操作三 143.1 3.1 案例步骤案例步骤14基于机器学习的财政收入预测模型的主要实现步骤如图 153.1 3.1 案例步骤案例步骤15由此构建该案例的实现步骤如下:Step1:搜集某市财政收入以及各类别收入相关数据Step2:利用Step1形成的已完成数据预处理的建模数据,建立Adaptive-Lasso变量选择模型Step3:在Step2的基础上建立单变量的灰色预测模型和人工神经网络预测模型。
Step4:利用Step3的预测值代入构建好的人工神经网络模型中,从而得到某市财政收入以及各类别收入的预测值163.2 3.2 案例实现案例实现1、数据收集和预处理 考虑一些与能源消耗关系密切并且有线性关系的因素,初步选取以下因素为自变量,分析它们之间的关系:社会从业人数(x1):就业人数的上升伴随着居民消费水平的提高,从而间接增加财政收入在岗职工工资总额(x2):在岗职工工资总额反映的是社会分配情况,主要影响财政收入中的个人所得税、房产税和潜在的消费能力社会消费品零售总额(x3):代表社会整体消费情况,是可支配收入在经济生活中的体现当社会消费品零售总额增长时,表明社会消费意愿强烈173.2 3.2 案例实现案例实现1、数据收集和预处理城镇居民人均可支配收入(x4):居民收入越高,消费能力越强,同时意味着其工作积极性越高,创造出的财富越多,从而能带来财政收入的增长城镇居民人均消费性支出(x5):居民在消费商品的过程中会产生各种税费,税费又是调节生产规模的手段之一在商品经济发达的今天,居民消费得越多,对财政收入的贡献就越大年末总人口(x6):在地方经济发展水平既定的条件下,地方人均财政收入与地方人口数呈反比例变化。
全社会固定资产投资额(x7):建造和购置固定资产的经济活动,即固定资产再生产活动183.2 3.2 案例实现案例实现1、数据收集和预处理地区生产总值(x8):地方经济发展水平第一产业产值(x9):第一产业对财政收入的影响小税收(x10):政府财政收入的最重要的收入形式和来源居民消费价格指数(x11):影响城乡居民的生活支出和国家的财政收入第三产业与第二产业产值比(x12):产业结构居民消费水平(x13):间接影响地方财政收入193.2 3.2 案例实现案例实现1、数据收集和预处理 通过上述的描述分析,可以得到数据集的最小值、最大值、均值和标准差发现财政收入的均值和标准差数值较大,从而可以说明某市各个年份之间的财政收入存在较大的差异通过初步选取自变量,得到相关关系之后,还需要对数据进行描述性统计分析,从而对于所获取的数据有整体上的认识,203.2 3.2 案例实现案例实现1、数据收集和预处理(1)相关性分析 相关系数可以用来描述定量和变量之间的关系,初步判断因变量与解释变量之间是否具有线性相关性,利用原始数据求解相关系数根据分析结果可以知道,居民消费价格指数(x11)与财政收入的线性关系不显著,而且呈现负相关,其余变量都是与财政收入呈现高度的正相关。
213.2 3.2 案例实现案例实现2、变量选择 根据相关性分析可以知道,并不是所有的影响因素对财政收入的贡献度都是相同的,因此本文使用AdaptiveLasso算法对影响因素进行选择识别影响财政收入的关键影响因素是社会从业人数(x1)、在岗职工工资总额(x2)、社会消费品零售总额(x3)、城镇居民人均可支配收入(x4)、城镇居民人均消费性支出(x5)和全社会固定资产投资额(x7)223.2 3.2 案例实现案例实现3、GM(1,1)模型 建立GM(1,1)模型,编写GM(1,1)模型的灰色预测函数通过Adaptive-Lasso方法识别的影响财政收入的因素,建立灰色预测模型,本案例将通过建立灰色预测模型得到社会从业人数(x1)、在岗职工工资总额(x2)、社会消费品零售总额(x3)、城镇居民人均可支配收入(x4)、城镇居民人均消费性支出(x5)、全社会固定资产投资额(x7),预测结果:233.2 3.2 案例实现案例实现4、神经网络预测模型绘出真实值和预测值的折线图如下:由图可知真实值与预测值的趋势大致相同24 思考题思考题24 根据上述分析的案例,读者可以通过下面两个小练习,进一步巩固相关知识要点。
1、使用灰色预测计算该地未来两年的增值税、营业税、企业所得税以及个人所得税2、使用神经网络预测计算该地未来两年的增值税、营业税、企业所得税以及个人所得税实现小贴士Step1:对数据集进行预处理,处理缺失值、异常值等Step2:划分训练数据集以及测试数据集Step3:使用训练数据集对模型进行训练Step4:使用测试数据集对所训练的模型进行测试谢谢!。












