节点文献

学习非唯一的最佳聚类数

Learning a family of intrinsic cluster numbers

  • 推荐 CAJ下载
  • PDF下载
  • 不支持迅雷等下载工具,请取消加速工具后下载。

【作者】 郑欣林学訚

【Author】 ZHENG Xin,LIN Xueyin(Department of Computer Science and Technology,Tsinghua University,Beijing 100084,China)

【机构】 清华大学计算机科学与技术系清华大学计算机科学与技术系 北京100084北京100084

【摘要】 确定“最佳聚类数”一直是聚类算法面临的一个难题。为了确定一族合理的聚类数而不是单个聚类数,提出了一种基于谱分析的算法,并能处理较为复杂的数据集。该算法构建了数据点之间的相似度图,在不同的分析粒度下,用图上的“随机游走”来传播相似度,采用了一个新的评判标准,“广义特征差”来寻找聚类数族。实验结果表明该算法在聚类数不唯一的情况下能够有效地确定聚类数,并且和其他几种算法相比具有较优的计算复杂度。

【Abstract】 A family of intrinsic cluster numbers,rather than a single cluster number,is determined,using a spectral analysis-based algorithm.The algorithm works not only on simple data sets,but also on more complicated ones.The algorithm constructs an affinity graph which is then modified by a multi-granularity analysis and a random walk on the graph.A generalized eigengap is defined to determine the cluster number family.Tests show that the algorithm is more effective than previous algorithms and is less complex.

【基金】 国家“九七三”基础研究基金项目(2002CB312101)
  • 【文献出处】 清华大学学报(自然科学版) ,Journal of Tsinghua University(Science and Technology) , 编辑部邮箱 ,2006年07期
  • 【分类号】TP18
  • 【被引频次】14
  • 【下载频次】202
节点文献中: 

本文链接的文献网络图示:

本文的引文网络