节点文献

基于广义信息距离的直接聚类算法

A Direct Clustering Algorithm Based on Generalized Information Distance

  • 推荐 CAJ下载
  • PDF下载
  • 不支持迅雷等下载工具,请取消加速工具后下载。

【作者】 丁世飞史忠植靳奉祥夏士雄

【Author】 Ding Shifei1,2,Shi Zhongzhi2,Jin Fengxiang3,and Xia Shixiong1 1(College of Computer Science and Technology,China University of Mining and Technology,Xuzhou 221008)2(Key Laboratory of Intelligent Information Processing,Institute of Computing Technology,Chinese Academy of Sciences,Beijing 100080)3(College of Geoinformation Science and Engineering,Shandong University of Science and Technology,Qingdao 266510)

【机构】 中国矿业大学计算机科学与技术学院中国科学院计算技术研究所智能信息处理重点实验室山东科技大学地球信息科学与工程学院中国矿业大学计算机科学与技术学院 徐州221008中国科学院计算技术研究所智能信息处理重点实验室北京100080北京100080青岛266510徐州221008

【摘要】 提出了基于广义信息距离的直接聚类算法.基于信息理论给出了离散量的基本概念,讨论并证明了离散量的一个基本不等式,进而给出了离散增量的概念.在分析距离测度的基础上,提出了广义信息距离(GID)、改进的广义信息距离(IGID),建立了基于GID,IGID的直接聚类算法,并对土地肥力数据资料进行了聚类分析.结果表明,建立的算法与传统的聚类算法相比,算法原理简便、对数据本身的维数与分布要求不高,且具有较好的聚类效果.

【Abstract】 In this paper a novel direct clustering algorithm based on generalized information distance(GID)is put forward.Firstly,based on information theory,a basic concept of measure of diversity is given and an inequality about measure of diversity is proved.Based on this inequality,a concept of increment of diversity is discussed and a defined.Secondly,by analyzing distance measure,two new concepts of generalized information distance(GID)and improved generalized information distance(IGID)are proposed,and a new direct clustering algorithm based on GID and IGID is designed.Finally this algorithm is applied to soil fertility data processing,and compared with hierarchical clustering algorithm(HCA).The results of simulation application show that the algorithm presented here is feasible and effective.Because of simplicity of algorithm and robustness.It provides a new research approach for studies of pattern recognition theory.

【基金】 国家自然科学基金项目(60435010,90604017,40574001,50674086);国家“九七三”重点基础研究发展规划基金项目(2003CB317004);国家“八六三”高技术研究发展计划基金项目(2006AA01Z128);高等学校博士学科点专项科研基金项目(20060290508);北京市自然科学基金项目(4052025)
  • 【文献出处】 计算机研究与发展 ,Journal of Computer Research and Development , 编辑部邮箱 ,2007年04期
  • 【分类号】TP301.6
  • 【被引频次】18
  • 【下载频次】541
节点文献中: