好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

聚类分析实验指导书.docx

8页
  • 卖家[上传人]:鲁**
  • 文档编号:434091983
  • 上传时间:2023-03-01
  • 文档格式:DOCX
  • 文档大小:200.91KB
  • / 8 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • ^《数据挖掘》实验报告院 (部): 管理工程学院专 业:信息管理与信息系统实验项目: 班 级:信管112姓 名: 学 号:02聚类分析实验指导书实验目的:1熟悉R语言的相关对象与函数的用法2掌握利用R进行聚类分析的基本步骤实验内容:说明:本实验采用iris数据集,下面中的数据集如无上下文说明,即是指irisiris以鸢尾花的特征作为数据来源,数据集包含150个数据集,分为3类,每类50个数据, 每个数据包含4个属性,是在数据挖掘、数据分类中非常常用的测试集、训练集四个属性分别为:花萼长度、花萼宽带、花瓣长度、花瓣宽度三类分别为:setosa, versicolor, virginica(山鸢尾、变色鸢尾和维吉尼亚鸢尾)1对数据集进行初步的统计与分析(1) 数据集的维度-dim> dirr. )[1] 1E0 S(2) 数据集中的列名-names> (Iris)[1] "Sepal.LEngtri" "Sepal .Widt?irr "Petal. Lengt?irr rrPetal. WidtArr[5] "Species^(3)数据集的内部结构-str(4)数据集的属性-attributes(5) 查看数据集的前五条数据情况>12S13 二:,]Sepal. Lezigt?!Sepal .'Widtn Petal.LengtnPetal .WidtiiSpeeies15.13 . S1.40.2setosa4.93.01.40.2setosa34.73.21.30.2setosa44 .-63.11.50.2setosa■55.03 M1.40.2setosa>1(6) 查看数据集中属性前10行数据> i-is"Sepal.Lerctn^J[1] 5.1 4.7 4.6 5.0 4.6 5.0(7 )显示数据集中每个变量的分布情况-summary> suimaiy (iris)■Sepal .Length.WidthPetal. LenathPetal ,Widt-hSpeciesMin.=4.300Min-:2.000Mir.1.0D0Min.0„10Dsetosa :501st Qu .:5.1001st Qu.:2.3001st Qu -1.6001st Qu .0.30Dversicolor-: 50Median:5.800Median:3.000Median4.350Median1-30Dvirginica : 50Meazi:5.843Mean;3.057Mean3 . 758Mean1» 1993rd Qu.= ■6.4003rd Qu.:3.3003rd 01 ・5.1D03rd Q口.1.80Di-fax.:7.900Max・:1・ ^00Max.6.900Max.2» SOD(8) 数据集列Species中各个值出现频次> tatle (iristopecies)setosa versicolor virginica50 50 SO(9) 根据列Species画出饼图-pie(10) 算出列的所有值的方差-var> var (Sepal. Lerct?:)[1] D.6556335(11) 算出列iris$和iris$的协方差-cov> cov (z.rz.3S5epaL . Le^ct?firi3iFetaL.Le^ct?i)[1] 2.27431S(12) 算出列iris$和iris$的相关系数-cor> cor (z.rz.3tBepaL. Lerctrir z.2sz.3tPetal. Lerctr:J [1] 0.5717535(13)画出列iris$分布柱状图a□1Histogram of iris$Sepal.Length56iri s$ Sep a I. Length(15)画出列iris$和iris$的散点图回国叵]食一s费舄M4.5 5.0 5.5 6.0 6.5 7.0 7.5 B.Oiris^Sepal.L^ngth!_l寸(16)绘出矩阵各列的散布图-plot2使用knn包进行Kmean聚类分析(1)将数据集进行备份newiris<-iris,将列newiris$Species置为空newiris$Species<-NULL,将此数据集作为测试数据集> r2ewiri3=iris> mewiSpecies=NULL(2)在数据集newiris上运行Kmean聚类分析,将聚类结果保存在kc中。

      在kmean函数中,将需要生成聚类数设置为3 (kmean (newiris, 3))Sepal. Ler.gr.iiSepal.Petal.LengthPeCd.l.Widr.tL15.00-60003H:?0OOD1 ."162003LW6 浏32€.E5OOO33-073fiS45.7^31052-07105335.901^32,7403874.393S^B1H39871> (ktz = kma a ns sr S)- JK-means clusterxno- with 3 clTjJtezs nE sizes 50. 38. 62Clojtcr rasm二:IClustrrinij sector:[1] 11111111[37J 11111111[73J 33333233|[109]| 2222233 2[1^5]| 2 2 3 2 2 31111111111111111111111111332333333333333333333333333333332 22323232233222223 21111111113333333333232222 3 2Wirhiri cluster a™ al sq^iares &y aluater s [1] 15.15100 23.E7947 39.E2097(fce^Heen_3S / total_55 = S8.§ %)Available canz'-OBenca:[1] ^clinscez* ,,-senteTa11 p,cot9 2,r[5] .wiLtiinssr, rrtecwean.33H, "size"[9] •*ifaultH,^wi&hxnsa11n,lEerB,(3) 创建一个连续表,在三个聚类中分别统计各种花出现的次数-table> table (iris£Spaciesf kcjcluster)12 3setosa 50 0 Dversicolar 0 2 43virginic a 0 3-6 14> I(4) 根据最后的聚类结果画出散点图,数据为结果集中的列〃〃和〃〃,颜色为用1,2,3表示的缺省颜色> plot 'c [ 己二.Ler;Gt?;ri. "Sepal .Widt^") ' f co2.=kc"cL.;5te^。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.