基于模式识别上的葡萄酒品质实验证明.docx
21页基于模式识别上的葡萄酒品质实验证明葡萄酒的品质是一个很主观的评判•国内还没看到针对酒的品质具体盘化定义.相 反的•国外令研究机构特别针对衙萄酒的±产过程做了人a研究•将匍萄酒生产过程中 的彫响W索以及酒的品质做了虽化定义本文实验采用米尼奧大^(Univcrsityof M inho, Guimard供的Wine Quality数据集作为学习样本(该数据集由UCI机器学习网站收录). 分别研究KNN算法以及使用KNN结合K-Mcans算法提高KNN算法速度的模式识别应 用.该数卅集是基于Portuguese "Vitilio VerdeM提供的赧酒琴数,分为红衙萄酒和白匍 萄洒两类数州由于其他专利等因索,输入输出数州中仅仅提供了必要的化学物理输入 参数和酒的感肖品质输出数据,并没仃提供其他-些酒的品质.商标或价恪等们息该数据集提供输入输出参数倍息.如表3-1所示:表3・1数据集字段信息.»A»出)Tabic 3-1 Fields of DataSet (include input and output fickls)输入参数.基于物理化学测试付息1fixed acidity (非挥发性酸)2vulatilc acidity (挥发性酸)3citric acid (柠粽酸)斗rcsidual sugar (天然残留轲份)5chbrides (氯)6free sulfur dioxidc (游离二氧化硫)7total sulfur dioxide (总 二氧化硫)8Density (密度)9pH (酸碱度)10sulphates (硫酸盐)11Alcohol (酒耕含呈)输出参数(基于感肖数据)1quality (分值从0到10, 10最高)Wine-Quality数抑;集分为Red Wine和White Wine两种.其数卅情况如表3・2所刁J表3-2数据集数金Table 3-2 # of imUanccs of two datasets# of InstancesRed Wine1599White Wine4898两种葡萄酒每项数据届性的统计分析情况如表3・3所示:表3・3葡萄酒厨性统计分析情况Table 3-3 The physicochemic al data statistics per wine typeAttribute (units)Red wineWhite wineMinMaxMeanMinMaxMeanfixed addity ( 发性酸)4.615.98 33.814.26.9 |volatile addity (挥发性酸)0.11.60.50.11.10.3citricaad (柠棣酸)010.301.70.3 |residual sugar(/<然残ffl Wf 份)0.915.52.50.665.86.4 |chlorides(氯)1 0.010.610.080.010.350.05 |fre e sulfur dioxide (游离 氧化fife)17214228935 |total sulfurdioxide (总:氧化硫)6289469440138 |Density(密度)0.9901.0040.9960.9871.0390.994 1pH (酸碱度)2.743 32.73.83.1sulphates(硫酸盐)0.320.70.21.10.5 |AlcohoK酒精含童)8.414.910.4814.210.4 |3.2实验运行环境1) 锁件环境本次实验所运行的便件坏境为AMD Phenom™ II N620 Diel-Corc Processor 2.8 GHz,内存 1G。
2) 软件环境软件环境为 Windows 7 Ultimate, Visual Studio 20 10, .Net Framework 4.0o本次实验使用Visual Studb 2010.使用C#4.0实现KNN和K-Means算法.3.3 KNN预测实验中的KNN实现过程如图3-1所示:i.KHIb l 外需IM ■UR 号所仆 TrainingStt中畋粼的孙离2.山这K个点决匸 谀爪测敢粼的用测图3-1 KNN实脸步骤Fig 3- 1 KNN Steps in the experiment(1) 加载样本数州・同时需要对数据进行规范化处理.如果仃连续数抑;・或者某个 数据项何太多不重复的值.则需要对数据进行离敬化处理2) 加载需预测的数抑;・同样,也需要对数据进行规范化处理.和离散化处理⑶设置K(4)使用KNN计算预测值.根据KNN算法定义•包括以卜步骤:a. 计算需预测数州与所/J' Training Set中数抑;的距离b. 找出K个距离加短的点c. 由这K个点决定该预测数据的预测值是多少,由这K个点投票表决,G这K个点中哪个结果出现的次数最多,那就是他的预测值-如图3・2所示.本次实验中.先加载数据.包括加载样本数据和需预测的数据•加 载过程中相应的也会对数据进行规范化和离散化处理。
KNN*K-Mwns^:*ttJ^free "it doddetotal Mur doxaedenatyPH*08alcohol0 140M507tM22.00989 站 9293280 567MT7239350 60629921259S0 137724550898..015384S15384G 10 333C28163014...0215547703180..049412S2B4875...0.3S22M7244C9..0ZW5BC83B323...0215384615384...0197183098S91...0.169G11307420...0.506810572G87...0.40S44881&897...019161G7664G7...0215384615384 .0 225352112G7€.0.190812720848D 582232011747..a.iMTDoaui?0 U97005M802...02153846153340 14084507W22.0 0989 珈 29328 .05675477239350 6062992125360 137724550ftM...015384615334G0 伽 140M507,.0.120141342756..0 567547723935...0.6G62S9212598..013772455D89S...0153M615334GJ0197183098591...0.187279151943...0464757709251...0.440944881889..0077844311377...0153846153848 J0 1971830985910 053003533568 ・0 3325991185420 5118110236220083832335 血…0246151846153011&7W5K380 0424028268550494126284875..0.43818897S3T70 1437125748&0 ..01692307692300 225352112676...0.^39222614840..0 567547723935...0.480314960529..02B143712574B...0 32307^923076 .0197183098551...120B4 關 565371.・・0428W69B9T210.425196850391.01257485029W...0123Q7S923078 J:0225352112676.0 33922261484C* .0 567SI77239350.4M31436D62S0281437125743...0 3230763230760211367B05W30187Z731519430310572W72240 66 ⑷ 73228340113772455089 ・0 2307K23076901126 花05338 …O.rei272C^BO50 538179148311..0.4G34438iaB97...073G526&46107...0.107692307&92J图3・2 KNN实脸加栽数据截图Fig 3・2 Screens hot of loading data in KNN experiment然后设置KNN中的K参数为3最后执行运篦.得到所Equality的预测值(最后一列quaUty就是这批匍萄酒的质屋 预测值)•同时这里还得到木次执行KNN运算时间:73546.875,单位是毫秒。
为了方便 对比和数抑;的粘确性.后而的KNN和K-Means实验的对比数卅均是.连续运行三次. 取平均值得到的运算时间.如图3-3所示.叼 KNN • K-Mccns®2H^KNN ofil} (Swears + KNN | KMN ♦ K-Means AlIotold sulf J dioxided€rot>016961130742005€7547723M5...0G0625S2125&e...04^126284875...03622X724409...050阳 0572跑04094488 刚 70.2155477C3130...03307CS€G1417...C.09893^929328...0582232C11747...0.1SO31272O842...0.098939929328…0567547723555...0606253212556 …01201412427560 567^^7229250G0G2的0.187279151943...0箱47577仞251…0443U4e81ft£S …0.0530)3533558...0 332599118泌2 …0511811G23622...0.C42432S2G355...0 49^112€284 375...0483128976377 …0.339222614340...0567S47723335...04803U96062S...n ^-x>ajcgoqt->in AXTGCO£C7SacoholajphatsB0.1377245S3892..0・15?£4615?阿・・12153B4615384..)19160.149761377;0.077ft-0.08 必0.14270231437125748..0・32孔7殆23076..n i i-JA-JCQiimcill02O958O8S3323。

卡西欧5800p使用说明书资料.ppt
锂金属电池界面稳定化-全面剖析.docx
SG3525斩控式单相交流调压电路设计要点.doc
话剧《枕头人》剧本.docx
重视家风建设全面从严治党治家应成为领导干部必修课PPT模板.pptx
黄渤海区拖网渔具综合调查分析.docx
2024年一级造价工程师考试《建设工程技术与计量(交通运输工程)-公路篇》真题及答案.docx
【课件】Unit+3+Reading+and+Thinking公开课课件人教版(2019)必修第一册.pptx
嵌入式软件开发流程566841551.doc
生命密码PPT课件.ppt
爱与责任-师德之魂.ppt
制冷空调装置自动控制技术讲义.ppt


