数据挖掘考试题
10页1、数据挖掘考试题一 选择题1. 当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离 ( )A. 分类 B. 聚类 C. 关联分析 D. 主成分分析2. ( ) 将两个簇的邻近度定义为不同簇的所有点对邻近度的平均值,它是一种凝聚层次聚类技术。( 单链 )( 全链 ) C. 组平均方法3. 数据挖掘的经典案例“啤酒与尿布试验”最主要是应用了 ( ) 数据挖掘方法。A 分类 B 预测 C 关联规则分析D 聚类4. 关于K均值和DBSCANJ比较,以下说法不正确的是()均值丢弃被它识别为噪声的对象,而DBSCAN-般聚类所有对象。均值使用簇的基于原型的概念,DBSCA牌用基于密度的概念。均值很难处理非球形的簇和不同大小的簇,DBSCANT以处理不同大小和不同形状的簇均值可以发现不是明显分离的簇,即便簇有重叠也可以发现,但是DBSCA2合并有重叠的簇5. 下列关于 Ward s Method 说法错误的是: ( )A. 对噪声点和离群点敏感度比较小B. 擅长处理球状的簇C.对于Ward方法,两个簇的邻近度定义为两个簇合并时导致的平方误差D.当两个点之间的邻近度取它
2、们之间距离的平方时,Ward方法与组平均非常相似6. 下列关于层次聚类存在的问题说法正确的是: ( )A. 具有全局优化目标函数B.Group Average 擅长处理球状的簇C. 可以处理不同大小簇的能力D.Max对噪声点和离群点很敏感7. 下列关于凝聚层次聚类的说法中,说法错误的事: ( )A. 一旦两个簇合并,该操作就不能撤销B. 算法的终止条件是仅剩下一个簇C.空间复杂度为O m2D.具有全局优化目标函数8.规则牛奶,尿布一啤酒的支持度和置信度分别为:()TID项集1面包,牛奶2回包,尿布,啤酒,鸡蛋 3牛奶,尿布,啤酒,可乐4回包,牛奶,尿布,啤酒5回包,牛奶,尿布,可乐下列()是属于分裂层次聚类的方法。Average11I2I3I4I51000,900,100.650.200.901.000.700.600.500.100.701.000400.300.650.600.401000.800200.500.300.801.0010.对下图数据进行凝聚聚类操作,簇间相似度使用 MAX十算,第二步是哪两个簇合并:()11I2I3I4I5A.在3和1,2合并 B.3 和4,5合并
3、C.2,3 和4,5合并D. 2,3和4,5形成簇和3合并二.填空题:1 .属性包括的四种类型:、。2 . 是两个簇的邻近度定义为不同簇的所有点对邻近度的平均值。3 .基本凝聚层次聚类算法空间复杂度 ,时间复杂度,如果某个簇到其他所 有簇的距离存放在一个有序表或堆中,层次聚类所需要的时间复杂度将为 。4 .聚类中,定义簇间的相似度的方法有(写出四个):、。5 .层次聚类技术是第二类重要的聚类方法。两种层次聚类的基本方 法:、。6 .组平均是一种界于 和 之间的折中方法。7 .相似度矩阵可以用相识度表布还可以用 表不。8 .全链在处理大小不同的簇时,可能使 破裂,并且偏好 。9 .单链技术擅长于处理 ,但对 和 很敏感。10 .聚类分析可以看做是一种 的分类。(有监督、无监督)三.判断题1 .从点作为个体簇开始,每一步合并两个最接近的簇,这是一种分裂的层次聚类方法。()2 .数据挖掘的目标不在于数据采集策略,而在于对已经存在的数据进行模式的发掘。()3 .在聚类分析当中,簇内的相似性越大,簇间的差别越大,聚类的效果就越差。()4 .当两个点之间的邻近度取它们之间距离的平方时,Ward方法
4、与组平均非常相似。()5 . DBSCAN相对抗噪声的,并且能够处理任意形状和大小的簇。()6 .属性的性质不必与用来度量他的值的性质相同。()7 .全链对噪声点和离群点很敏感。()8 .对于非对称的属性,只有非零值才是重要的。()9 . K均值可以很好的处理不同密度的数据。()10 .单链技术擅长处理椭圆形状的簇。()四.综合题1 .何为层次聚类它用哪两种图表示2 .两种层次聚类的基本方法两种方法的定义3 .分别写出Min、Max和组平均的优缺点4 .写出基本凝聚层次聚类的算法5 .由下图已给出的距离矩阵,将Max用于6个点样本数据集,画出层次聚类的树 状图P1P2P3P4P5P6P1P2P3P4P5P6考试题+答案一选择题1. 当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离 ( B)A. 分类 B. 聚类 C. 关联分析 D. 主成分分析2. ( C) 将两个簇的邻近度定义为不同簇的所有点对邻近度的平均值, 它是一种凝聚层次聚类技术。( 单链 )( 全链 ) C. 组平均方法3. 数据挖掘的经典案例“啤酒与尿布试验”最主要是应用了 ( C )
《数据挖掘考试题》由会员枫**分享,可在线阅读,更多相关《数据挖掘考试题》请在金锄头文库上搜索。
宁波关于成立医药技术研发公司可行性报告
语文教师个人工作计划2
【精编】苏教版小学三年级数学上册期末复习资料(八)
学者型教师的专业素养1
“迎国庆、庆仲秋”文艺晚会主持台词
新坐标高三地理人教版一轮复习课后限时集训:31 森林与湿地资源的开发、保护 Word版含解析
黄花菜深加工项目商业计划书写作参考
2023年内蒙古乌兰察布市凉城县永兴镇社区工作人员考试模拟题含答案
底板大体积砼施工技术交底
小面汤Word参考
胆囊炎病历模版
乡镇环保年度个人工作总结模板.doc
六大类食物的功能
吉林大学21春《隧道工程》在线作业一满分答案28
《项链》教案(人教版一年级上册)
贷款质押分析
甘肃某砼搅拌站安全验收评价
苏科版八年级下册物理--第七章-从粒子到宇宙-练习题(无答案)
创意设计师的工作职责范文(四篇).doc
山东专升本计算机复习资料
2024-02-26 19页
2023-03-09 4页
2024-01-19 10页
2023-01-09 29页
2024-01-30 26页
2023-05-11 6页
2022-12-31 4页
2022-11-29 3页
2023-09-22 5页
2022-12-15 34页