
关于海南岛近年旅游情况的相关分析.doc
22页《数据分析》课程设计题B:关于海南岛近年旅游情况的相关分析姓名:_学号:_学号:_学号:-年级:2008级 学院:信息科学技术学院系别:应用数学系专业:信息与计算科学指导教师: 完成日期:2011年 11月 10日摘 要海南涌现出一批旅游景点创造和打破了中国世界纪录协会多项世界纪录、中 国纪录,获得多项世界之最、中国之最特别是海南岛变为国际旅游岛之后,更 迎来的新的发展机遇本文对海南岛2000——2009年的相关情况进行了基本分 析,并作出了预测模型主要用灰色系统理论对海南岛的旅游总人数,旅游外国 人数及外汇收入进行了拟合和预测,并进行了相关分析为进一步研究海南岛的 旅游发展情况提供基本参考通过对此情况的分析,我们得到了海南岛的旅游情况的起伏情况,并对•之做 了相关分析关键词:基本分析灰色理论相关预测1 引言 (4)1. 1海南岛旅游情况介绍 (4)L2研究目的 (4)2 问题分析 (4)3 符号说明 (4)4 模型假设 (5)5 线性模型 (5)5. 1总旅游人数分析 (5)5. 2外国旅游人数分析 (6)5. 3夕卜汇收入分析 (7)6 二次抛物线分析 (8)7 灰色理论模型 (10)7. 1灰色理论模型理论分析 (10)7. 2总旅游人数分析 (12)7. 3外国旅游人数分析 (14)7. 4外汇收入分析 (15)8 模型总结 (17)9 模型评价 (17)10参考文献 (19)11 附录 (20)1引言1.1海南岛旅游情况介绍海南省位于中国最南端,北以琼州海峡与广东省划界,西临北部湾与越南民 主共和国相对,东濒南海与台湾省相望,东南和南边在南海中与菲律宾、文莱和 马来西亚为邻。
海南省的行政区域包括海南岛和西沙群岛、中沙群岛、南沙群岛 的岛礁及其海域有热带海洋动物园,南山文化旅游区,云龙湾,尖峰岭,白石 岭,西玳瑁岛,大小洞天,七仙岭温泉旅游区等众多国际旅游名区1.2研究目的海南岛成为国际旅游岛以来,给海南岛的发展带来了新的机遇,参考以前的 旅游数据可以为海南岛以后的旅游情况作出参考和分析同时,在新的社会形势 下,我们有必要更加全面的认识到海南岛的各种优势,为海南岛在国际上的声誉 作出更加客观的评价2问题分析本文从中国统计年鉴表上找到了海南岛关于旅游的近十年的相关数据,我们 可以采用统计学的知识对此数据进行分析与预测考虑到数据的不可确定性和社 会的随机影响性,我们可■用灰色理论的知识进行考虑3符号说明t时间序列修正时间序列X旅游总人数xl旅游的外国人数y外汇收入凡线性回归的的拟合常数A线性回归的的拟合的一次项系数F方差分析统计量r2可决系数P显著性概率—2方差估计值勺随机无穷小量P灰色理论拟合系数1q灰色理论拟合系数2Y灰色理论中构造矩阵一B灰色理论中构造矩阵二0灰色理论中预测系数4模型假设在国内政治稳定,经济持续健康发展的前提下,考虑到旅游业本身的特点,以 及海南省的特殊地理位置,在影响旅游人数和收入的众多因素中,假定旅游价格, 外汇汇率,旅游者的消费水平以及在此基础上游客停留的平均时间是相对稳定不 变的,可以认为海南省的独特风光是影响其收入和人数的主要因素。
结合考虑到社会的紧急危机和不可知性因素,对统计数据会造成相对的滞 后,此过程有一定的周期性5线性模型我们用统计学的集中方法对海南省2000年以来的旅游数据惊醒分析,并对 以后的发展情况进行预测5. 1总旅游人数分析我们用tl = [1 23456789 10]代表2000到2009年的时间,xl表示来自外国的旅游人数,x表示旅游的总人数,夕表示外汇收入则来自外 国的旅游人数预测模型为X: = ■ + + 8i可彳导到如下结果(程序见附录1)Rcsiducil Caso Order PlotCase NunXMr(散点图和回归图)图2 (残差效果图)图11.13465.1532bint =-14.704616.97382.60057.7060stats =0.730421.67090.0016 101.0971所以& = 1.1346,4 = 5. 1532O &的置信区间为[・14.7046,16.9738];0置信 区间为[2.6005,7.7060]可决系数尸=0. 7304 ,方差分析统计量"=21.6709, 显著性概率p = 0. 0016,方差估计值序=101.0971从图中我们只到有两个数据有异常,第八个数据置信区间不包含零点,第十 个数据残差离零点比较远。
5.2外国旅游人数分析同理,我们构造旅游总人数X的预测模型x; = . + 陞L + 与图3 (散点图和Pl归图)Residual C^ise Order PlotCase Numbc<图4 (残差效果图)32.47403.1773bint =11.7871 53.1610-0.1567 6.5113 stats =0.3764 4.8296 0.0592 172.4512人 — A A所以 A) = 32.4740” = 3.1737属的置信区间为[11.7871,53.1610];女置信区间为[-0.1567,6.5113] o nl决系数广=0.3764,方差分析统计量F = 4.8296,显著性概率〃 =0. 0592,方差估计值序=172.4512由此,我们发现虽然残差分析效果比较好,但是可决系数与显著性概率却与 线性关系相差甚远,此拟合效果不好5. 3外汇收入分析用同样的方法处理外汇收入,外汇收入的预测模型为350Residual Case OtcJer Plot15010O50-50-100-150Case Number图6 (残差效果图)图5 (散点图和回归图)b =21.5115273152bint =-62.8822 105.905313.7139 40.9164stats =1.0e+003 *0.0007 0.0214 0.0000 2.8701所以龙=21.5115,4 = 27.3152。
龙的置信区间为[・62.8822,105.9053]诲 置信区间为[13.7139,40.9164]可决系数户=0.7,方差分析统计量万=21.4 , 显著性概率夕=0. 000 ,方差估计值希=2870. 1 o综合考虑以上结果,线性拟合结果较差但是有以上数据我们可以确定 xl,x,y的相互关系密切6二次抛物线分析考虑到妇,X,*的这种相关特性,由数据我们发现从2000年到2008的数 据变化呈现出一致性,而2009年的数据下降,从经济的正常发展角度来说,这 有违常理,我们不妨采用一种逼近的统计量来代替原始数据,而且三个变量可以 归一化〃 =* 妇XP的取值为25.4134. 2634. 1040. 5543. 8770. 84154.59208.85226. 58247.19在此模型中,为简化计算,我们均采用〃作为预测量我们选用二次抛物线p = a + bt\ + ctl2作为发展预测曲线,用最小平方法的标准方程组为:Z + 次N< Z H + 力 tl~ +《ZZ p - + 力Z," + cZ将坐标原点”(,)平移到0),标准方程组可化为 p = na + c M2< 服=也如2Z t\ P = *1 + *1解方程组切得参数的值,得到表达式夕=3. 2958M2 - 8. 4659M + 29. 2988比较结果如图7所示图7此模型我们对原始数据进行了修改,考虑到实际情况,我们应采用不确定方 法进行分析。
7灰色理论模型7. 1灰色理论模型理论分析系统是指相互依赖的两个以上要素所构成的具有特定功能的有机整体,更加 其信息的清晰程度可分为白色、灰色和黑色系统白色系统是指信息完全清楚的 系统,黑色系统是指信息全部未知的系统,灰色系统是指借予白色和黑色系统之 间的系统灰色系统理论是我国著名学者邓聚龙教授在1982年创立的一门新兴 横断学科,着重研究概率统计、模糊数学所不能解决的“小样本、贫信息、不确 定”问题其特点是“少数据建模二作为一门科学方法,灰色系统理论为解决 不确定半复杂问题开辟了新的道路灰色系统理论认为,任何随机过程都是在一定幅度范围和一定时区变化的灰 色量,并把随机过程看成灰色过程尽管客观系统表象复杂,数据离乱,但它总 是有整体功能的,因此必然蕴涵某种内在规律,关键在于如何选择适当的方式去 挖掘它和利用它灰色系统通过对原始数据的整理来寻求其变化规律,这成为数 的生成灰色系统中常用的生成方式有三类:累加生成、累减生成和均值生成 灰色系统理论所涉及的主要工作之一是用离散数列建立微分方程型的动态模型, 又称灰色模型GreyModle,记为GM)GM是灰色系统理论的核心,灰色预测、 灰色线性规划与灰色控制等一系列处理灰色系统的方法均是在此基础上发展起 来的。
灰色预测模型GM (1,1)灰色系统建模方法采用以区间及区间运算为代表的灰数处理,是-•种简便实 用的方法,口前主要用于灰色预测和决策灰色预测方法较多,其中灰色数列预 测模型是对时间序列变量的预测GM(1,1)模型是最常用的一•种灰色模型,由一 个单变量的一阶微分方程构成其建模步骤如下:设工()=(/)(1),寸)(2),・・誓)(〃))为原始数据1.对原始数列做一次累加生成和均值生成 由一次累加生成,得:/)=3⑴(l),x ⑴⑵,•••,/)(〃))由一次均值生成,得z ⑴=(z(,)(D,z(1)(2),...,z(,)(n))其中k尤⑴ Q) 二 x(o)(i) z ⑴Q)= a ⑴)+ 尤⑴侬-1))/2 A=2,3,・・・,m i=l则有我)(幻+衣⑴(幻=0其中a,b为参数,上式为GM (1,1)模型2 ..构造矩阵/0)(2)舟)(3)...舟)(〃)构造矩阵y = bo-z⑴⑵「*)⑶]・ C7 =;: 如-z ⑴(〃)1式中上述方程组中,Y和B为已知量,e为待定参数确定参数a、b由于变量只有a、b两个,方程却由n-1个,且n-l>2,故方程组无解, 故用最小二乘法(OLS)得到最小二乘解。
当\bt 明工0时,o = (bt b)-1 bty此时抨)is⑴=bdt ,且为方程 舟")+以"")=”的解,也成为影子方程4.解白化方程式白化方程的解也称周期响应函数,为x(1)(r)= x(1)(0)--建+〃a ] aa(0X 伙+ 1)则GM (14)灰色微分方程的时间响应序列为_ak be a +- a取妙(0)=妙⑴,则有j)⑴ M eCl-akH a△⑴5 .还原,得模型计算值A⑴x (k + \) = x (k + l)-x (k)6.对模型进行检验根据灰色系统理论,一般使用三种检验方式来对灰色模型进行精度检验。












