好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

统计方法在税收分析中的应用.docx

92页
  • 卖家[上传人]:ni****g
  • 文档编号:554781815
  • 上传时间:2023-07-21
  • 文档格式:DOCX
  • 文档大小:1.46MB
  • / 92 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 目 录第一节 统计学学概述——知识准备备一、 统计学的的定义二、数据处理(一)统计数据据的类型(二)数据预处处理的基本步步骤三、统计推断的的基本原理介介绍(一)几个基本本概念(二)区间估计计(三)假设检验验四、相关分析与与方差分析(一)相关分析析与偏相关分分析(二)方差分析析第二节 税收收收入运行的统统计学分析一、税收收入运运行的经济性性(一)描述统计计量(二)相关性分分析(三)税收随GGDP增长的的弹性二、税收收入的的内在增长趋趋势(一)税收收入入运行随时间间变动的趋势势(二)税收增长长率分析三、税收收入运运行的季节性性四、其他常用税税收分析方法法(一)税源质量量的效能位差差分析(二)同业税负负分析第三节 多元统统计分析方法法一、聚类分析(一)定义(二)聚类的基基本步骤(三)实例:部部分国家税收收加社保负担担率聚类分析析二、主成分分析析法和因子分分析法(一)主成分分分析法(二)因子分析析法第四节 回归分分析一、基本原理(一)一元回归归模型(二)多元回归归模型二、模型的基本本假设和特殊殊情况处理(一)古典回归归模型的假设设(二)模型的检检验统计量(三)几种特殊殊情况及处理理方法第五节 指数一、加权综合指指数(一)拉氏价格格指数(二)帕氏价格格指数(三)加权平均均指数二、常用价格指指数(一)消费者物物价指数的定定义(二)消费者物物价指数的作作用三、多指标综合合评价指数的的构建第六节 常用统统计分析软件件简介——SPSSS和EVIEEWS应用实实例一、描述统计量量二、相关性分析析三、图表演示四、回归分析五、预测六、时序模型———季节性差差分附: EXCEEL软件数据据分析功能的的应用第一节 数据整整理第二节 图表功功能一、柱形图二、散点图三、折线图第三节 分析功功能一、抽样二、描述统计三、相关系数四、回归五、移动平均参考书目第一节 统计学概述———知识准备一、 统计学的的定义统计学是收集、处处理、分析、解解释数据并从从数据中得出出结论的科学学,在多个科科学领域有着着日益重要的的地位。

      统计计学分为描述述统计、推断断统计、理论论统计和应用用统计 统计学是与与数据打交道道的学科,包包括数据收集集、数据处理理和数据分析析数据收集集也就是取得得统计数据,这这是一切统计计分析的立足足点;数据处处理是将数据据用图表等形形式展示出来来,是数据特特征的直观反反映;数据分分析则是选择择适当的统计计方法研究数数据,并从数数据中提取有有用信息进而而得出结论,这这是对数据的的精细加工,数数据分析的方方法宜适当,应应能说明问题题数据分析所用的的方法可分为为描述统计和和推断统计描描述统计是指指用图形、表表格和数值方方法来汇总数数据的统计学学目的在于于描述数据的的统计特征,找找出数据的基基本规律推推断统计是指指以一定的置置信标准要求求,根据样本本数据来判断断总体数量特特征的归纳推推理方法二、数据处理(一)统计数据据的类型1、定性数据和和定量数据分类数据是指归归于某一类别别的非数字型型数据,它是是对事物进行行分类的结果果,数据表现现为文字表述述的类别例例如,人口按按性别分为男男、女两类顺序数据是只能能归于某一有有序类别的非非数字型数据据,如考试成成绩分为优、良良、及格、不不及格等数值型数据是按按数字尺度测测量的观测值值,其结果为为具体数值。

      分类和顺序数据据统称为定性性数据或品质质数据;数值值型数据可称称为定量数据据或数量数据据2、 截面数据据和时间序列列数据横截面数据:在在同一时刻或或几乎同一时时点所收集到到的数据如如:多个企业业当年利润总总额、实缴税税收、税负水水平等时间序列数据::在若干个连连续时点内所所收集到的数数据如:22000年--2005年年每年福建省省地方税收收收入等区分数据类型十十分重要,因因为对不同类类型的数据应应用不同的统统计方法来处处理比如::对分类数据据我们通常计计算出各组频频数或频率,计计算其众数和和异众比率,进进行列联表分分析和检验等等;对于顺序序数据可以计计算其中位数数和四分位差差,计算等级级相关系数;;对于数值型型数据可以用用更多的统计计方法进行分分析,计算各各种统计量、进进行参数估计计和检验等对对于横截面数数据可以计算算集中度和离离散度、进行行聚类和主成成分分析等;;对于时间序序列数据可以以计算时间趋趋势,建立预预测模型进行行预测等二)数据预处处理的基本步步骤1、数据收集数据收集是一切切统计工作的的基础,搜集集数据的方法法有多种,可可以采用统计计报表、典型型调查、重点点调查或抽样样调查1)统计报表表制度指按照国家统一一规定的各项项要求,自下下而上地定期期向国家和主主管部门报送送基本统计资资料的一种报报告制度。

      优点:能保证统统计资料的全全面性和连续续性,能保证证统计资料的的统一性和及及时性,能满满足各级部门门对统计资料料的需要缺点:统计报表表过多会增加加基层负担,有有可能由于虚虚报瞒报而影影响统计资料料质量如:月度税收会会统报表等2)普查指国家为详尽了了解某项重要要的国情国力力而专门组织织的一次性全全面调查优点:可以为抽抽样调查提供供抽样框,可可以收集统计计报表所不能能提供的反映映重大国情国国力的基本统统计信息缺点:由于需要要大量的人力力、物力和财财力,不宜经经常进行如:经济普查、税税源普查等3)重点调查查为了解总体基本本情况,在调调查对象中只只选择一部分分重点单位进进行调查的一一种非全面调调查组织方式式优点:能以较少少的投入和较较快的速度取取得总体基本本情况及变动动趋势的资料料缺点:只适用于于客观存在着着重点单位的的情况如:重点税源监监控等4)典型调查查在对调查对象有有一定了解的的基础上,有有意识地选择择少数典型单单位进行调查查的一种非全全面调查组织织方式优点:一定条件件下能估计总总体指标数值值,可以补充充全面调查的的不足,可以以用来研究新新生事物缺点:不能确定定推断的把握握程度,无法法计算和控制制推断误差。

      如:税源典型性性个案分析5)抽样调查查按照随机原则从从调查对象中中抽取一部分分样本单位进进行调查,再再用样本资料料推断把握总总体的数量特特征的一种非非全面调查组组织方式优点:按随机原原则抽取样本本单位,目的的是推断总体体的数量特征征,抽样误差差可以事先计计算并控制能能用较少的人人力、物力和和时间达到全全面调查的目目的,调查资资料的准确性性较高、受人人为干扰的可可能性较小应用较广,为统统计调查的发发展方向2、数据整理::数据整理是指将将统计调查得得到的原始资资料进行科学学的分组和汇汇总形成综合合统计资料的的工作过程1)数据审核核:从完整性性和准确性两两方面审核数数据2)数据筛选选:当数据中中的错误不能能予以纠正,或或者有些数据据不符合调查查的要求而又又无法弥补时时,需要对数数据进行筛选选3)缺失数据据处理:在样样本数据中,可可能出现部分分数据点缺失失或个别数据据点异常波动动的情况,几几种处理不完完备数据集的的方法:(3.1)删除除元组(3.2)数据据补齐——平均值填填充、众数填填充3.3)回归归——基于完整整的数据集,建建立回归方程程模型,将已已知属性值带带入方程来求求未知属性值值4)数据排序序:指按一定定顺序将数据据排列,以便便研究者通过过浏览数据发发现一些明显显的特征或趋趋势。

      也对进进一步数据重重新归类或分分组提供方便便5)数据分组组:数据分组是是根据统计研研究需要,将将原始数据按按照某种标准准划分成不同组组别,分组后后的数据称为为分组数据其其目的在于观观察数据的特特征5.1)几个个基本概念频数:落在各类类别中的数据据个数组距:一个组上上下限间的差差组中值:每一组组中上下限值值的中间值开开口组组中值值=上(下)限限+(-)邻邻组组距/22极差:一组数据据最大值和最最小值之间的的差,也称全全距众数:一组数据据中出现次数数最多的变量量值,用于测测度分类数据据的集中趋势势中位数:指一组组数据排序后后处于中间位位置上的变量量设一组数据为,按按从小到大排排序后为,则则中位数为::平均数:是集中中趋势的主要要测度值A、简单平均数数B、加权平均数数,其中,即样样本量C、几何平均数数(5.2)常用用分组方法———组距分组组将变量值的一个个区间作为一一组,适合于于连续变量和和变量值较多多的情况,分分组区间需要要遵循“不重不漏”的原则,可可采用等距分分组,也可采采用不等距分分组分组步骤:确定组数:根据据 Sturrges 提提出的经验公公式得组数KK为:,n为样本数计算组距:组距距=极差/分分组数确定组限,编制制频数分布表表。

      三、统计推断的的基本原理介介绍(一)几个基本本概念1、概率与概率率分布(1)概率:随随机试验或观观察中,某种种事件或结果果(随机事件件)出现的可可能性, 称称为概率基本性质: 非负性 00≤P(A)≤1,即事件件发生的概率率介于0和11之间正则性 P((Ω)=1,即即所有事件发发生的概率之之和恒为12)概率分布布:如果有某某种形式能够够表现出随机机变量的取值值及其概率,则则称这种形式式为随机变量量的概率分布布 连续型随机机变量的概率率分布 ,其中 为密度函数数2、 集中度和和离散度(1)样本均值值:为样本中各各观测值的平平均数为样本观测值值,为频数n为自由度,为为样本数据--12)离散度指指标(2.1)样本本方差:,为样本观测值,为频数2.2)样本本标准差s::为样本方差差的平方根2.3)离散散系数:为一组数据据的标准差与与其相应平均均数的比注意:方差和标标准差均是反反映数据分散散程度的绝对对值,而离散散系数是测度度数据离散程程度的相对统统计量,消除除量纲的影响响,可直接用用于不同样本本间离散程度度的比较2.4)偏斜斜度:反映以平均均值为中心的的不对称程度度,正偏斜度度表示不对称称部分的分布布更趋向正值值,负偏斜度度表示不对称称部分的分布布更趋向负值值。

      在EXCCEL中用SSKEW()函函数求值2.5)峰度度表述分布的的尖端程度,其其中代表正态态分布的为常常峰态正峰峰值表示相对对尖锐的分布布,负峰值表表示相对平坦坦的分布在在EXCELL中用KURRT()函数数求值3、抽样与抽样样分布(1)抽样(1.1)定义义抽样即从总体中中按一定原则则抽取样本优优点:以样本本特征推断总总体,简单,方方便主要的的抽样方法有有:简单随机机抽样,分层层抽样,整群群抽样、系统统抽样,多阶阶段抽样1.2)抽样样平均误差指指每一个可能能样本的估计计值与总体指指标值之间离离差的平均数数,即样本估估计量的标准准差抽样误差是由于于抽样的随机机性引起的样样本结果与总总体真值之间间的误差抽抽样误差可以以控制但不可可避免1.3)影响响抽样误差的的因素:A、总体各单位位的差异程度度(即标准差差的大小)::标准差越大大,抽样误差差越大;B、样本单位数数的多少:样样本单位数越越大,抽样误误差越小;C、抽样方法::不重复抽样样的抽样误差差比重复抽样样的抽样误差差小;D、抽样组织方方式:简单随随机抽样的误误差最大。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.