kernel-k-means.ppt
10页Kernel k-means &&Spectral Clustering李翔2014/4/11Kernel K-means——核聚类 主要思想是通过一个非线性映射,将输入空间中的数据点映射到高维特征空间中,并选取合适的核函数代替非线性映射的内积,在特征空间中进行聚类映射到高维空间:为了突出不同样本类别之间的特征差异,使得样本在 核空间中变得线性可分(或近似线性可分)特征空间中进行聚类:类似k-means假设输入空间的 ,k=1,2,……,l,被某种非线性映射φ映射到某一特征空间H,得到 ,则输入空间的点积形式,在特征空间中就可以表示为:所有样本可以组成一个核函数矩阵Ki,j =常用核函数:Ø 多项式核函数 ,d为整数,自定义参数Ø高斯核函数 ,β>0是自定义参数 Ø两层神经网络sigmod 核函数 K(x,y) = ,其中b,c是自定义参数 核聚类流程核聚类流程1、确定k个初始聚类中心2、将每个样本进行归类,分配到对应的类中去3、重新计算样本中心,再进行迭代,一直到收敛为止核聚类的优点:1、将样本映射到高维空间,使得样本间的微小差别增大,便于分类。
2、使得原样本线性不分的情况下变得线性可分(近似线性可分) 收敛判断函数:其中C是类别个数,Ni是第i个的样本个数, 核聚类实例:核聚类实例:Spectral Clustering像素点之间的相似度的表示:X(i)表示空间信息,F(i)是基于密度,颜色,纹理特征的信息Spectral Clustering。





