陕西省各高校分数预测 模型.pdf
26页1 装 订 线 “工大出版社杯”第十六届西北工业大学数学 建模竞赛暨全国大学生数学建模竞赛选拔赛题目 B 题 密封号 2016 年 5 月 3 日 剪 切 线 密封号 2016 年 5 月 3 日 计算机 学院 第 38 队 队员 1 队员 2 队员 3 姓名 阮俊鹏 卢鹏宇 潘紫霓 班级 10011505 14011503 HC001502 2 装 订 线 摘 要 本文针对高考估分、志愿填报的实际问题,综合运用线性回归理论和层次分析法,建立了 线性回归模型、录取概率模型、层次分析模型三个数学模型,较好地解决了题目所提出的问 题. 对于问题(1),建立一元和二元线性回归模型,结合问题的实际情况,分别根据年份,往年一 本线分数与录取人数,以及它们的不同二元结合,可得到不同的结果,进行对比后认为年份与 一本线二元线性回归所得结果准确度最高.最后根据不同学校的具体情况,进行修正. 对于问题(2),建立录取概率模型,由往年每所学校平均分数线与最低分数线的平均差值, 再利用问题(1)中预测的 2015 年平均分数线,估得 2015 年最低分数线,并根据录取概率模型, 得到该生被问题(1)预测得到平均录取线的高校录取的概率. 对于问题(3),利用层次分析法,考虑学校,专业,学校所在地区和考生分数这四个因素以及 不同学校在这四个方面的优劣,由此建立准则层判断矩阵,对待选的六所高校与四个因素分 别列出判断矩阵并编程求解. 在文末,就模型的优缺点进行了评价,并提出了可以进一步改进优化的方向. 关键词 高考 志愿填报 录取概率 线性回归 层次分析 3 一、一、问题重述问题重述 高考的志愿填报经常有因考生定位不准确,志愿高校间没有拉开差距,而导致落选或 者错报志愿的事情发生. 考生填报志愿最关键的工作就是准确评估自己被志愿高校录取的可能性.评估工作 包括:根据志愿高校以往几年的最高录取线,平均录取线和最低录取线等已有数据,结合 考虑其他各种可能影响因素,预测该校当年的最高录取线,平均录取线和最低录取线;根 据志愿高校在陕西的预测录取线和考生总分,陕西省高考划线,预测能被志愿高校录取的 概率.如果倾向于报某个专业,还需进一步预测该专业的录取线. 假定陕西某理工科考生2015年考试成绩为630分,倾向于在本省上大学,对机械,汽 车,飞机模型感兴趣.现给出2010-2013年陕西省的部分学校信息,根据这些信息,通过数 学建模来完成以下问题: (1)根据往年数据,考虑可能的影响因素,建立一个数学模型,以预测陕西省几个高校 理工科2015年一本招生的平均录取线. (2)建立一个基于已有数据和预测数据的概率评估模型,评估该生被问题(1)预测得 到平均录取线的高校录取的概率. 4 (3)基于已有的录取分数预测模型和概率评估模型,将报考范围扩大到全国,根据该 生的分数和爱好,制定一个报考方案,对六个志愿高校进行合理排序,以保证该生不落榜 的前提下选到心仪的高校. 二、二、问题分析问题分析 本文研究的是高考考志愿填报中录取线及录取概率预测问题. 对于问题(1),需要根据往年数据,考虑可能影响因素,建立数学模型,预测陕西省几个 高校理工科一本招生的平均录取线.根据分析,年份,一本线分数,录取人数都可能成为平 均录取线的影响因素.因此建立一元与二元线性回归模型,分别得到 2010-2014 年以上 三个因素和往年平均录取线的数学关系.进行对比后,认为根据年份与一本线为自变量构 造的二元线性回归模型预测得到的 2015 年平均录取线准确度最高. 由于数据有限,若建立的回归方程是三元以上,误差太大没有参考价值. 另外,由于每间学校的具体情况各有差异,平均录取线的影响因素也不尽相同,因此 最后再根据不同学校的具体情况,综合考虑其他因素,对结果进行修正. 对于问题(2),建立一个基于已有数据和预测数据的录取概率模型,利用(1)中的模型 预测得到 2015 年的最低分数线,再利用问题(1)的结果,得到每所学校 2015 年预测的最 5 低分数线、平均分数线分别与一本线的差值,利用录取概率模型,评估该生被问题(1)预 测得到平均录取线的高校录取的概率. 对于问题(3),考生的报考排序要考虑很多因素,其中主要考虑学校,专业,学校所在地 区和考生分数这四个因素.要同时考虑不同学校在这四个方面的优劣,做出决策,符合层 次分析法的模型,因此对四个因素建立准则层判断矩阵,并对待选的六所高校与四个因素 分别列出判断矩阵并编程求解. 三、三、模型假设模型假设 (1) 问题附件中所给的数据都是准确可靠的. (2) 从相关学校官网获得的各种数据都能真实反映实际情况. (3) 录取人数与招生人数相同. (4) 该考生报考钱就已得知所在省份的一本分数线. (5) 考生最倾向于就读省内大学,若要在省外读大学,则倾向于北上广等一线 城市. 四、四、符号说明符号说明 6 𝑒𝑚 表示估计的最低录取线和一本线的差值. 𝑒𝑎 表示估计的平均录取分和一本线的差值. 𝑝 表示被录取的概率. 𝑒 表示考生实际分数和一本线的差值. 𝑡 表示年份. ℎ 表示各所高校往年的一本线. 𝑛 表示录取人数. 𝑝1 表示北京理工大学. 𝑝2 表示天津大学. 𝑝3 表示东南大学. 𝑝4 表示中山大学. 𝑝5 表示西安交通大学. 𝑝6 表示西北工业大学. 𝑅 表示代表拟合优度, 𝐹 表示显著性 𝑧 表示预测平均分数线 7 五、五、模型的建立模型的建立求解求解与检验与检验修正修正 5.15.1 问题问题(1)(1) 每年各所大学在具体省份的高考平均录取线,与年份、一本线、录取人数都有一定 的关系.因此,在分析某校 2015 年平均录取线的时候,不能只看这一绝对指标的大小,而 是应该联系该学校往年的一本线、录取人数和年份变化来分析. 5.1.1 建立一元线性回归模型 设回归变量为𝑦,代表因变量.用𝑧代表 2015 年对应学校的平均分数线,建立一元线 性回归模型,得到如下的一元线性回归方程: 𝑧 = 𝑙0+ 𝑙1𝑦 + 𝜀. 其中𝑙表示 𝑦对𝑧的回归系数,𝜀表示随机误差,且服从正态分布𝑁(0,𝜎2). 借助 SPSS 软件,利用最小二乘法可以得到𝑙 ̂,则𝑧与回归变量 𝑦的近似表达式为 𝑧 ̂ = 𝑙0+ 𝑙1𝑦 + 𝑓. 其中𝑓是 𝑧与其拟合值𝑧 ̂之间的离差,称为残差,把求得的𝑙 ̂𝑘数值代入上式,即可得到所需 𝑧值. 8 下面根据题目附表与从各目标院校官网得到的的相关数据,分别令年份𝑡,各所高校 往年的一本线ℎ、录取人数𝑛分别代入成为自变量𝑦,用𝑅代表拟合优度,𝐹表示显著性,所 得𝑧值如下表所示: 9 下面以西北工业大学为例给出图表: 𝑡 ℎ 𝑛 𝑧 𝑅 𝐹 𝑧 𝑅 𝐹 𝑧 𝑅 𝐹 西安交通大学 631. 4 0.41 7 0.48 5 629.74 0.69 5 0.19 3 631.78 1 0.64 8 0.55 1 西北大学 564. 2 0.57 1 0.31 5 562.4 0.86 6 0.05 7 591.8 0.93 1 0.23 8 西北工业大学 627. 8 0.19 3 0.75 6 619.48 1 0.25 4 0.68 619.92 1 0.16 5 0.79 1 长安大学 596. 2 0.37 0.54 579.55 6 0.40 4 0.5 584.00 6 0.00 4 0.99 5 西安电子科技大 学 597. 5 0.42 6 0.47 4 594.71 3 0.75 4 0.14 1 605.56 8 0.01 0.98 7 陕西师范大学 580. 5 0.21 5 0.78 5 561.83 0.42 1 0.57 9 562.34 5 0.50 1 0.49 9 西北农林科技大 学 545 0.52 1 0.36 8 541.89 1 0.84 3 0.07 3 557.97 4 0.12 8 0.87 2 西北政法大学 494. 2 0.45 0.44 7 487.85 4 0.77 5 0.12 3 511.26 8 0.89 8 0.10 2 西安理工大学 547. 5 0.34 9 0.56 5 540.50 5 0.72 5 0.16 6 588.78 0.74 2 0.25 8 西安建筑科技大 学 559. 8 0.20 5 0.74 1 550.07 7 0.61 6 0.26 9 564.45 5 0.39 1 0.60 9 西安科技大学 501. 4 0.77 1 0.12 7 503.82 0.96 9 0.00 7 511.61 9 0.83 4 0.16 6 西安邮电大学 510. 1 0.76 9 0.12 9 512.26 9 0.95 6 0.01 1 526.87 6 0.80 6 0.19 4 西安工业大学 451. 5 0.99 2 0.00 8 488.93 3 0.99 9 0.00 1 522.84 8 0.64 3 0.55 6 10 11 5.1.2 建立二元线性回归模型 设回归变量为𝑦𝑘(𝑙 = 1,2),分代表两个因变量.用𝑧代表 2015 年对应学校的平均分 数线,建立二元线性回归模型,得到如下的二元线性回归方程: 𝑧𝑘= 𝑙0+ 𝑙1𝑦1+𝑙2𝑦2+ 𝜀. 其中𝑙𝑘表示 𝑦𝑘(𝑙 = 1,2)对𝑧的回归系数,𝜀表示随机误差,且服从正态分布𝑁(0,𝜎2). 其中𝑙表示 𝑦对𝑧的回归系数,𝜀表示随即误差,且服从正态分布𝑁(0,𝜎2). 借助 SPSS 软件,利用最小二乘法可以得到𝑙 ̂𝑘,则𝑧与回归变量 𝑦𝑘的近似表达式 为: 𝑧 ̂ = 𝑙 ̂0+ 𝑙̂1𝑦𝑘+ 𝑙̂2𝑦2+ 𝑓. 12 其中𝑓是 𝑧与其拟合值𝑧 ̂之间的离差,称为残差,把求得的𝑙 ̂𝑘数值代入上式,即可得到所需 𝑧值. 下面根据题目附表与从各目标院校官网得到的的相关数据,分别使自变量𝑦𝑘(𝑙 = 1,2)代表年份𝑡和各所高校往年的一本线ℎ,录取人数𝑛和各所高校往年的一本线ℎ,各所高 校往年的一本线ℎ和录取人数𝑛,用𝑅代表拟合优度,𝐹表示显著性,所得𝑧值如下表所示: 自变量 𝑡,ℎ 𝑛,ℎ 𝑛,𝑡 𝑧 𝑅 𝐹 𝑧 𝑅 𝐹 𝑧 𝑅 𝐹 西安交通大学 635.29 6 0.83 7 0.3 619.26 1 0 652.77 7 1 0 西北大学 569.57 4 0.98 5 0.03 612.44 1 0 604.44 1 0 西北工业大学 634.24 9 0.98 8 0.02 4 619.56 4 0.25 6 0.93 4 623.34 5 0.47 6 0.77 3 长安大学 603.80 3 0.83 1 0.31 594.77 3 0.40 6 0.83 5 601.70 7 0.51 1 0.73 9 西安电子科技大 学 602.29 7 0.94 5 0.10 8 598.44 3 0.78 6 0.38 3 601.00 7 0.50 8 0.74 2 陕西师范大学 585.89 5 0.99 9 0.03 7 521.68 8 0.99 9 0.04 5 408.16 9 0.98 0.19 8 西北农林科技大 学 553.27 5 0.99 9 0.00 2 550.27 8 0.96 8 0.25 3 548.13 0.74 7 0.66 5 西北政法大学 508.65 3 0.95 6 0.08 7 460.53 8 0.90 8 0.41 9 512.51 4 0.89 9 0.43 8 西安理工大学 559.09 1 0.99 6 0.00 8 577.60 8 0.75 1 0.66 1 604.58 5 0.79 7 0。

中级消防设施操作员监控26道线下抽考题.pdf
人教精通版(2024)新教材四年级英语上册Unit 4 Lesson 1 教学课件.pptx
区域研究与区域规划课件-ppt101页.ppt
2024-2025学年初中七年级上学期数学第一次月考卷及答案(北师大版).pdf
指伸屈肌腱断裂.ppt
幼儿园月后勤工作总结ppt.pptx
共享单车动态定价机制-深度研究.pptx
(完整word)混凝土结构设计原理期末试题库及其参考答案.doc
中考英语二轮复习专题讲与练: 宾语从句(含详解).doc
主动脉夹层的围手术期护理课件.ppt
2020年高考语文学科北京卷《阅卷纵横》.doc
国有土地使用权挂牌出让须知.doc


