好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

基于改进遗传算法K―means聚类方法.docx

5页
  • 卖家[上传人]:m****
  • 文档编号:555692251
  • 上传时间:2023-10-29
  • 文档格式:DOCX
  • 文档大小:23.69KB
  • / 5 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 鉴于改良遗传算法K―means聚类方法鉴于改良遗传算法的 K―means聚类方法纲要:K-means算法是聚类剖析区分方法中的一种常用方法,也是当前在数据剖析方法中最有应用远景的方法之一但K-mean算法对初始聚类中心十分敏感,这对办理学生成绩等数据而言,会致使聚类结果极为不稳固为此,提出鉴于改良遗传算法的 K-means聚类算法该算法利用遗传算法解决初始聚类中心,提升聚类结果的稳固性,但存在前期过早收敛和后期收敛过慢的弊端将改良遗传K-means聚类算法应用于高职高专的学生考试成绩剖析中,能够很好地解决传统遗传聚类算法对聚类结果的不稳固性问题,并经过聚类结果对学生考试成绩进行分类评论,利用所获取的数据聚类结果指导教课,从而提升教课质量重点词:聚类; K-means算法;遗传算法0 前言K-means算法是一种应用特别宽泛的聚类剖析方法,具有简短、高效、可伸缩性强等长处,一般用簇内数据对象的均值表示K-means算法每个簇的中心 [1]但传统K-means算法存在诸多不足之处比如,传统 K-means算法对初始聚类中心敏感、算法需要指定参数 K的值、输入的不一样 K值随目标准则函数进行不一样次数的迭代、聚类结果颠簸大、简单陷/入局部最优[2]。

      遗传算法拥有很强的鲁棒性和适应性,在解决大空间、多峰值、非线性、全局寻优能力等问题上拥有优势,但也存在着先期过早收敛和后期收敛过慢的弊端鉴于改良遗传算法的K-means算法能够有效解决算法对初始值K的依靠性,自动生成类K;同时严格选用初始中心点,加大各中心点之间的距离,防止初始聚类中心会选到一个类上,必定程度上战胜了算法堕入局部最优状态 [3-6]本文鉴于改良遗传算法进行学生成绩的K-means聚类剖析,将学生的考试成绩依照不一样科目分红不一样的类簇,利用改良遗传算法解决初始聚类中心问题,从而在整体上概括剖析该门课程所拥有的特色属性,以及每门课程之间的联系性和差别性,以提升算法效率和正确性并且,经过选择运算、交错运算和变异运算来加速算法的收敛性1.1传统K-means聚类算法传统K-means算法随机选择聚类中心,其核心思想为:给出n个数据点,找出 k个聚类中心,利用欧氏距离式计算每个数据点与近来聚类中心的距离平方和最小值,依照近来原则把各数据点分到各个簇,利用式( 1)计算每簇中数据对象的均值,采纳目标准则函数( 2)进行迭代运算,直到簇心的挪动距离小于某个给定的值传统K-means算法描绘以下:输入:n个数据集 D,数据聚类个数 k。

      输出:平方偏差准则最小的k个簇的会合详细步骤以下:①从数据集D中,输入聚类个数k和包含n个数据对象的数据库;②随机选择k个对象作为初始聚类中心;③依据簇中它们与聚类中心的相像度,将每个对象区分到相像的簇;④重复①-③;⑤更新簇的均匀值,依据每个簇中对象的均匀值,从头区分相应的对象;⑥计算目标准则函数;⑦直到每个目标准则函数不再发生变化,即方差评论函数开始收敛为止传统K-means算法区分方法是依据初始聚类中心来确立数据的初始化[7]但是k个初始聚类中心确实定对聚类结果影响很大,因为步骤②是随机选择k个对象作为初始聚类中心的每次迭代使簇中节余的对象依据与簇中心的相像度从头区分到相像的簇每次达成迭代运算,就会算出新的聚类中心,以及偏差平方和准则函数(2)的值若再进行一次迭代后,偏差平方和准则函数的值不发生改变,说明算法已经收敛在迭代过程中,函数(2)渐渐减少,直到为最少值为止图1显示了K-means算法的迭代过程传统K-means算法对初始聚类中心很敏感,选用不一样的初始聚类中心,会获取不一样聚类的结果,并且往常得不到全局最优解所以,怎样找到一组较优的初始中心点,从而获得较好的聚类结果并除去聚类结果的颠簸性值得研究 [8]。

      传统K-means算法存在的主要问题以下:(1)不可估量聚类个数 K,一般需早先指定早先不可以确立给定的数据集最合适分为几个类型有的算法依据类的自动归并和分裂获取较为合理的 K值;有的依照方差剖析理论,混淆统计量来确立最正确 K值,并应用模糊区分来考证最佳分类数的正确性;有的则联合全协方差矩阵RPCL算法,逐渐删除只包含少许训练数据的类可是以前的这些改良基本没有详细应用到学生考试成绩系统中2)算法过多依靠于初始值并常常堕入局部极小解不一样的初始值可能造成算法聚类结果的不稳固 K-means算法常采纳偏差平方和准则函数作为聚类准则函数聚类准则函数常常存在好多个局部极小值,但只有一个是全局最小因为每次确立的初始聚类中心都会偏离非凸函数曲面的全局最优解的搜寻范围,使用迭代运算,聚类准则函数只好达到局部最小,而不可以获取全局最小所以,很多算法利用遗传算法进行初始化,之内部目标函数作为评论指标,但鉴于遗传的K-means算法(GA-K均值算法)存在先期过早收敛尔后期收敛过慢的弊端1.3鉴于改良遗传算法的 K-means聚类算法思想本文提出了一种鉴于改良遗传算法的 K-means算法,该算法联合K-means算法的高效性和局部搜寻能力,以及改良遗传算法的全局优化能力,能够达到较好的聚类结果。

      1.3.1染色体编码选择因为聚本数目大、数高,本文采纳将各聚的中心坐d染色体,其在聚中心的数目 K,其度K*d,{m1,m2,⋯,mk},此中Xi=[mj1,mj2,⋯,mj3]由此推,每条染色体,随机从m个象中K个象作初始的簇中心坐染色体如2所示1.3.2适度函数区分集体中个体良莠程度的准是适度函数的大小本算法采纳公式( 3)表示适度函数,越小,聚果越好,个体越良;适度函数越大,聚果越差,个体越劣。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.