数学建模识别未知类属的鸢尾花.docx
7页大连海事大学2014年数学建模竞赛丙组题目识别未知类属的莺尾花姓名学号学院专业班级管婕2220142950信息科学技术学院通信工程2014-2倪子琳2220144080信息科学技术学院通信工程2014-32014-11-23摘要一、 题目:识别未知类属的莺尾花二、 探究问题:从花瓣长、花瓣宽、花萼长、花萼宽中分析判断未知类属的莺尾花三、 简要探究过程:本文针对莺尾花识别问题,首先对三类莺尾花的观测样本各测量数 据进行分析,发现其中两个变量Z间具有线性关系,然后根据这两个相关变量与花的 种类的相关性求出线性冋归方程,建立冋归模型,并用此模型分析识别测试样本的类 属四、 主要结果:1•花瓣长与花萼长之间具有线性关系2. 根据回归方程经计算判断出了测试样本的类别五、 自我评价:优点:2.定性定塑分析,准确可靠2. 变量容易测量和观察缺点::L.观测样本少,可能出现偶然性2.需要带入三个线性冋归方程计算,不直观,较为麻烦六、 推广: 利用生物特征判断生物类别一. 问题的重述加拿大加斯帕半岛上的三种不同莺尾属的花朵,分別是刚毛,变色和弗吉尼亚这三种花 朵的花瓣长、花瓣宽、花萼长、花萼宽的数据有所不同,根据观测样本中的数据设计一个数 学算法来识别测试样本中莺尾花的类属。
二模型假设1.测试样本中不存在变异植株,每一株花朵都符合自然生长和遗传规律2.测量的数据均准确可靠3.允许在误差范围内进行模型的建立4.四组数据中只有两组之间具有线性关系5.每一类属的花朵中具有线性关系的两组数据是同两组三. 变量说明X: pl Y: SIx: pl的平均值y: SI的平均值Xi:第i个样本处的花瓣长Yv:变色莺尾花的花萼长 y$:刚毛莺尾花的花萼长 yc:弗吉尼亚莺尾花的花萼长四. 模型的建立与求解1 2 3 4 5 6 7 8 9 10 11 12 13 14 15••♦••刚毛pi f-附毛pw 岳側 t—变色pi f-变色州•变刨 变色制 • ■•弗吉兄亚pl —•-弗吉兄亚si • ■■弗吉尼亚5W一、分析首先绘制题目所给的三类莺尾花的各15株观测样本的测量值的折线图,根据折线图可以 发现三种类型莺尾花的PI PwSI Sw的变化趋势都相同对各变量之间画散点图,发现: 技性(si)变色的PI与SI成线性相关线性(si)弗吉尼亚的PI与SI成线性■ 0—妖性(sl)刚毛的PI与SI成线性相关因此可以利用PI与SI的线性关系建立冋归模型,求岀线性回归方程二、建模用线性回归方程求变量SI与变量Sw之问的线性关系:变色XYplpwsisw1703247142643245一 15369314915455234013565284615657284513763334716849243310966294613105227391411502035101259304215136022401014612947141556293613方差40. 214. 323. 63・56平均数59. 7327. 842. 513. 3设pl的测量值为x, SI的测量值为y,第i个样本的测量值为xi,样本PI的平均值为疋,样 本SI的平均值为歹一 — n 一一E(兀一切3一y) Z兀xmyb= = ” 一 r 91 a -2 (兀一 斤一,”,=I /=, (n=15)a= y — bx得到变色的pi与si之间的线性关系为:yv二0. 6781x + 1. 9598弗古尼亚 刖毛XYXYplpwsiswplpwsiswr i633360255435142258275119493014237130592147321324632956184631152L 565305822503614267630662154391747492545174634143873296318503415296725581844291421 10723961254931151L li65325120543715212642753194834162136830552148301411457255020433011115582851245840122方差47・21229. 96・116・11120・53平均数64. 6_ 2955. 8_ 2149. 333142同理根据上文所述方法可以得到变色和弗吉尼亚:刚毛:ys= 0. 0704x + 10. 725弗吉尼亚:yc= 0. 7176x + 9. 4406三、 求解根据4.1所求的三个关系式:刚毛:ys= 0. 0704x + 10. 725变色:yv= 0. 6781x + 1. 9598弗吉尼亚:yc=0. 7176x + 9. 4406解答过程;1•将每朵莺尾花的P1值带入上述求出的线性方程中,求出按此关系求出的的S1 值。
2. 求出按照关系式求出的si值与实际值的差3. 比较三个差的绝对值的大小4. 取绝对值最小的差所属的类别即最后结果四、 结果具体数据如图所示:2345678910112 3plP*si63234444301360344564285664315552411555254058273961265663345648311651 34 1578 45 6879 38 6450 32 12y = 0. 6781 x y = 0. 0704xSV刚毛1315.1602213. 82261614.9492215. 23061815. 2306114. 38581314. 5971214. 80821415. 01942415.1602214.1042214. 31542416. 21622016. 2866214.245+ 1.9598+ 10.725差-28. 8398 0. 8226-30. 051 -40. 7694 79・ 7694-0. 6142-25. 403 -24.1918 -40. 9806 -40. 8398-1.8958・0・6846 -51. 7838 -47. 71342. 245差弗吉尼亚差44.68010. 680154.649410. 649431.796218. 796241.01528. 01542.6458-2. 354252. 49667. 496645.3582-10. 641855. 367-0. 63345.3582-9. 641855. 3670. 36737. 22122. 22146. 755831.755839.2553-0.744748. 90868. 908641.28962. 289651.061412. 061443.3239 -12. 676153. 2142-2・ 785844.6801-11.319954. 6494・1.350634.508618. 50B643. 885427.885436. 542921.542946. 038231.038254.8516-13.14B465. 4134-2. 586655.5297-8. 470366.1312.13135.864823. 864845. 320633.3206匝匝IE匝 匝匝 论 尼尼 尼尼 尼尼 结色毛色吉吉毛色色古吉毛毛吉吉毛 变刚变弗弗別变变弗弗刖刖弗弗刚男吉尼亚 y = 0. 7176x + 9. 4406五、分析与检验分析:1、 这个结果说明我们可以通过线性回归方程这个数学模型来进行定性定量的计算,根据 计算结果分析得到最终的结论,达到了我们探究莺尾花类别。
2、 线性回归方程可以应用在对生物的简单分类上,根据一些明显可测量的特征数据进行 计算,运用范围较为广泛3、 此次探究依据的模型是稳定、可靠的检验:根据题目所给的三类莺尾花的各15株观测样本的测量值的折线图,可以发这三种 类属的莺尾花的四个数据的数值范围有明显的区分刚毛的si数值儿乎都在20以内,变色的si数值在30到50之间,弗吉尼亚的数 值在50以上据此我们可以粗略的判断测试样本的类属与用线性规划模型得出的结论大 致相同由此可知:此模型可行五、 模型的评价与推广评价:此模型帮我们解决了如何用数学方法判断莺尾花类属的问题,使此类问题变得更加具体 化据此我们可以知道在判断生物类别上可以利用可观察易测量的参数来进行定量计算,得 出结果但此模型需要进行大塑数据的整理,比较麻烦,这点还需要改进,我们认为这点可 能会在使用的处理软件上有所突破推广:1、利用生物特征判断生物类别2、 根据人们的需要预测物流需求3、六、 参考文献1.2010年全国大学牛数学建模优秀论文(A题)P http://wenku. baidu. com/view/2c4d472a4b73f242336c5f37.html 时间:2014. 11.23百度文库2. 2010年全国大学生数学建模C题优秀论文http://wenku. baidu. com/view/27dal202b52acfc789ebc925. html 时间:2014.11.23郭学军 周凯《数学建模竞赛教程》73-96页 浙江 大学出版社七、 附录1、 求解线性回归方程时可以用Excel软件在做散点图时直接算岀。
2、 绘制散点图时,为了节约空间只放了符合要求的图,未达到要求的图。





