节点文献

基于连接的频繁集聚类算法

Algorithm of frequent item sets clustering based on link

  • 推荐 CAJ下载
  • PDF下载
  • 不支持迅雷等下载工具,请取消加速工具后下载。

【作者】 王波钱晓棠张斌张明卫

【Author】 WANG Bo QIAN Xiao-Tang ZHANG Bin ZHANG Ming-wei (College of Information Science & Engineering,Northeastern University,Shenyang 110004)

【机构】 东北大学信息科学与工程学院东北大学信息科学与工程学院 沈阳110004沈阳110004

【摘要】 针对大型事务数据库中频繁集的多属性聚类问题,提出一种高效的频繁集聚类算法。以往聚类算法采用基于距离的计算方法,由于受到属性数据的制约,在频繁集挖掘中具有一定的限制。在属性聚类基础上,基于连接对频繁集进行聚类。在算法中先找出数据点的邻居和计算相似度,构造邻居矩阵;然后计算连接数目,确定邻居数目矩阵;最后通过设置判定函数和阈值确定聚类数。通过实验证明,算法能够不仅能有效地完成频繁集的多属性聚类问题,而且还可以进一步发现频繁集在某一层次的相关性。

【Abstract】 An efficient frequent item sets clustering algorithm is proposed for multiattribute clustering in large business database.However some previous algorithms compute based on distance.Because algorithms are restricted by attribute values,they are limited in frequent item sets mining.Based on attribute clustering,frequent item sets are clustered by link.The algorithm first finds neighbor and computes similarity,building neighbor matrix.Then,it computes number of link,creating neighbor number matrix.Finally,number of clustering is confirmed by function and threshold.The experiment has proved that the algorithm can not only effectively implement multiattribute clustering for frequent item sets,but also find association on a level.

【关键词】 聚类频繁集相似度矩阵邻居连接
【Key words】 clusteringfrequent item setsimilarity matrixneighborlink
【基金】 国家科技部“十五”攻关项目(2004BA721A05)
  • 【文献出处】 辽宁工程技术大学学报 ,Journal of Liaoning Technical University , 编辑部邮箱 ,2005年S2期
  • 【分类号】TP311.13
  • 【被引频次】1
  • 【下载频次】41
节点文献中: 

本文链接的文献网络图示:

本文的引文网络