
2007高教社杯全国大学生数学建模竞赛题目.doc
5页2007 高教社杯全国大学生数学建模竞赛题目(请先阅读 “对论文格式的统一要求”)A 题:中国人口增长预测题:中国人口增长预测中国是一个人口大国,人口问题始终是制约我国发展的关键因素之一根据已有数据,运用数学建模的方法,对中国人口做出分析和预测是一个重要问题近年来中国的人口发展出现了一些新的特点,例如,老龄化进程加速、出生人口性别比持续升高,以及乡村人口城镇化等因素,这些都影响着中国人口的增长2007 年初发布的《国家人口发展战略研究报告》(附录 1) 还做出了进一步的分析关于中国人口问题已有多方面的研究,并积累了大量数据资料附录 2 就是从《中国人口统计年鉴》上收集到的部分数据试从中国的实际情况和人口增长的上述特点出发,参考附录 2中的相关数据(也可以搜索相关文献和补充新的数据),建立中国人口增长的数学模型,并由此对中国人口增长的中短期和长期趋势做出预测;特别要指出你们模型中的优点与不足之处附录 1 《国家人口发展战略研究报告》附录 2 人口数据(《中国人口统计年鉴》中的部分数据)及其说明2007 高教社杯全国大学生数学建模竞赛 A 题评阅要点模型的建立必须考虑我国近年来人口发展的总趋势。
例如,老龄化进程加速、出生人口性别比持续升高、乡村人口城镇化等因素以下几点供阅卷参考 1.分析数据(据此做出合理的假设): 对于一个地区或一类人群而言: 人口的自然增长率 = 出生率-死亡率;而出生率 = 育龄妇女的生育率 × 育龄妇女在总人口中所占的比例 利用附录 2 中数据对上述相关参数进行分析,可以看到: (1) 生育率:城镇和农村育龄妇女的生育率有下降趋势,但农村总体数据偏高,因此有必要将城镇人口和农村人口(或比例)分离开来考虑; (2) 出生人口的男女性别比:通常应当是 105 : 100 左右,但数据分析表明远超过了这个比例,且农村出生人口的性别比例又超过城市这影响到未来育龄妇女在总人口中的比例以及出生率因此有必要将男女性别比的因素考虑进去 (3) 死亡率:不同年龄段的死亡率都是不同的:0——3 岁孩子死亡率较高,3——50 岁死亡率较低的幼青壮年期,50 岁以上的人死亡率不断升高可以把 3——50 岁年龄段人口的死亡率看成是接近于零 (4) 人口的年龄分布:从某一年(比如 2005 年)分年龄段的人口数量分析,并结合死亡率的观察,可以看出在过去 50 年的人口出生的变化情况,也可以看出中国人口未来的老龄化趋向。
(5) 在《中国人口统计年鉴》 (附录 2)中的人口数据都是按市、镇和乡(或县)给出的但按“报告”(附录 1) ,市和镇放在一起,称为“城 镇”,而乡单列,称为“乡村”或“农村”本题“城镇化”也可以这样理解这时就需要对“城镇”的每个要用到数据进行加工,即按附录 2 最右边给出的每年人 口的抽样调查数据进行换算 (6) 附录 2 中给出的数据都是抽样数据,因此都是相对的如需要用到每年各类人口的总数据,可在政府网站上查到比如,在政府公布的《中国人口现状》 中就有 2005 年的详细数据从中也可以看出,附录 2 中给出的2005 年人口数据就是大约 1%的抽样调查数据从网上及文献中还可以查到更多数据,这里不一一列出 (7) 在本题的数据说明中曾指出“个别数据有异常,原文如此,可酌情处理 ”实际上,这些异常数据在个别年份才会出现,如果把他们从总体上进行 拟合,对整个模型的建立应该是没有很大影响的而且一些异常通过查阅其他资料也可得到纠正附录 2 中最大的异常是关于 2003 年育龄妇女的生育率数据,这 里按原《年鉴》中说法以千分比计,实际应该是百分比,相差十倍(在该附录最后几行给出的总生育率中已把它们恢复正常) 。
正如一开始及下面所强调的,本题的 重点是要根据我国近年来人口发展的总趋势和特点来建立模型,因此,必须从总体上来把握数据 (8) 如果有学生考虑人口分布的地区和产业等差别,也是可以的,但需要自己补充相关数据 2.建立模型 (1) 基本假设:从中国人口增长的特点出发,可以提出如下假设作为建立模型的依据:老龄化进程加速;农村育龄妇女的生育率明显高于城镇;出生人口的男女性别比持续升高;农村人口不断城镇化根据这些假设,区分模型中的状态变量和参数 (2) 状态变量的设置:根据上述假设和数据分析,可以把城镇人口与农村人口,及男女性别区分开来另一方面,注意到育龄妇女的生育率是决定人口增长的主要因素,可以对人口的年龄分布按不同年龄段进行简化,以减少状态变量 (3) 老龄化的影响:数据分析表明,在每一类人(比如城镇妇女)中,老年人口在该类总人口中的比例逐年上升,而青壮年和幼年人口比例逐年下降可以通过对人口矩阵的迭代,或用其他模型方法,找出他们上升或下降的一般规律 (4) 农村人口以一定规律转化为城镇人口 (5) 人口增长有迟滞效应在附录 1 中提到“由于 20 世纪 80 年代至90 年代第三次出生人口高峰的影响”,导致在 2005-2020 年出生人口 数量会“出现一个小高峰”,这就是迟滞效应。
如果在模型中适当引进迟滞项,就可预测到这种“小高峰”现象当然,此时的初值应当是一个近几十年来的人口变 化函数这个函数可以从网上搜索到,也可以用 1(4)提示的方法找出当然,这可能有一定难度,不一定作为必须要考虑的要求如果有同学考虑到这种迟滞效 应,应该说是有创意的 (6) 由上述 (1) 至 (4),即可建立起关于中国人口增长的数学模型它可以是微分方程组或差分方程组的初值问题如果还考虑到(5) ,则会是迟滞微分方程组方程组中出现的各个参数和用到的初值可以通过附录 2 中给出的数据,并参考上面 1(6)的说明,来确定 3.模型的求解和预测 用适当的数值方法求解所得的数学模型,即可得到今后几十年的预测结果可以把这些结果与附录 1 (《国家人口发展战略研究报告》) 或其他文献中的结果进行对照分析如出现较大差异,则应找出原因,予以改进,或提出自己的看法 4.关于文献与模型的“自我评价” (1) 本问题提供的文献(附录 1)是要求重点阅读的此外,还应列出自己查阅过并引用的比较可靠和权威的文献,包括论文、著作和数据,都要注明出处如果是网上的,则应列出网址 (2) 在评阅学生对自己模型的优点与不足的评价时,一定要注意是否实事求是。
