节点文献

混合属性数据聚类融合算法

Cluster ensemble method for databases with mixed numeric and categorical values

  • 推荐 CAJ下载
  • PDF下载
  • 不支持迅雷等下载工具,请取消加速工具后下载。

【作者】 赵宇李兵李秀刘文煌任守榘

【Author】 ZHAO Yu,LI Bing,LI Xiu,LIU Wenhuang,REN Shouju(National CIMS Engineering Research Center,Department of Automation,Tsinghua University,Beijing 100084,China)

【机构】 清华大学自动化系国家CIMS工程研究中心清华大学自动化系国家CIMS工程研究中心 北京100084北京100084

【摘要】 混合属性数据集是现实世界特别是商业金融数据库中最普遍的数据集类型,但适用于这类数据集的聚类算法极少。该文根据聚类融合的方法体系,针对混合属性数据集的特点,提出了基于聚类融合的混合属性特征聚类算法(CEM C),建立了算法框架,列出了算法目标函数和算法主要步骤,并分析了算法复杂度。该算法可以有效处理混合属性海量数据集。用真实数据集验证了算法,并将此算法应用于实际的客户关系管理数据分析中,得到了较好效果。

【Abstract】 Real-world intelligent databases always have mixed numeric and categorical values which are difficult to cluster.An ensemble-based mixed attribute cluster model was developed for mixed numeric and categorical databases based on the cluster ensemble method.The objective function and the methodology are described in the paper.The method has excellent scalability.Experimental results on real datasets show that the clustering accuracy is better than existing mixed numeric and categorical data clustering algorithms.

【基金】 国家自然科学基金资助项目(70202008)
  • 【文献出处】 清华大学学报(自然科学版) ,Journal of Tsinghua University(Science and Technology) , 编辑部邮箱 ,2006年10期
  • 【分类号】TP18
  • 【被引频次】32
  • 【下载频次】569
节点文献中: 

本文链接的文献网络图示:

本文的引文网络