节点文献

统计显著性标记的聚类分析算法与网络实现

ALGORITHM AND IMPLEMENTATION OF A CLUSTER ANALYSIS WITH STATISTIC SIGNIFICANCE

  • 推荐 CAJ下载
  • PDF下载
  • 不支持迅雷等下载工具,请取消加速工具后下载。

【作者】 张文军冯永军古德祥

【Author】 Zhang Wenjun Feng Yongjun Gu Dexiang (Research Institute of Entomology and State Key Laboratory for Biological Control, Zhongshan University, Guangzhou 510275)

【机构】 中山大学昆虫学研究所与生物防治国家重点实验室中山大学昆虫学研究所与生物防治国家重点实验室 广州 510275广州 510275广州 510275

【摘要】 聚类分析方法应用广泛,但过程及结果缺乏可靠的统计学检验,数学上不严格.另外,用于聚类分析的数据分布类型复杂多样,往往无法确定,而经典统计检验方法设定了各种统计前提和假设,应用依据不足.鉴于此,本研究用随机化方法对分类进行统计显著性检验,建立了具有统计显著性标记的聚类分析算法,用于对若干个样品进行有显著性标记的聚类分析. 该算法包括数据加权与规范化,计算距离测度,系统聚类,及随机化统计检验等过程.在该算法中,有14种距离测度、5种系统聚类方法、3种数据规范化方法及指标加权与否可供选择.随机化检验不需统计前提和假设,适用于各种统计问题.算法用Java语言网络化实现, 包含6个类和一个HTML文件.可通过网络在多种Java兼容的浏览器上实现算法共享. 以水稻田无脊椎动物多样性的调查数据,对该算法进行了对比分析,给出了选择距离测度的一些原则.

【Abstract】 Algorithms of cluster analysis are not always statistically tested. An algorithm of cluster analysis with statistic significance test to classification was developed in this paper. It was made of four parts, i.e., data weighting and standardization, calculation of distance measures, hierarchical clustering, and randomization statistic test. Fourteen distance measures and five methods of hierarchical clustering were provided in the algorithm to be choosed. The algorithm was implemented as the network program with Java language, which made of 6 Java classes and a HTML file and can be loaded and run on Java-enabled web browsers. The algorithm was tested with investigation data of rice invertebrate diversity. Principles for choosing distance measures was explained.

【基金】 国家自然科学基金“农田有害生物可持续管理的生物多样性计算方法及软件”(30170184);教育部留学回国人员科研基金“农田有害生物管理的生物多样性定量算法及计算软件研制”(2000).
  • 【文献出处】 数值计算与计算机应用 ,Journal of Numerical Methods and Computer Applications , 编辑部邮箱 ,2005年03期
  • 【分类号】O213;
  • 【被引频次】6
  • 【下载频次】303
节点文献中: 

本文链接的文献网络图示:

本文的引文网络