聚类是无监督的学习算法,它将数据集依照某种聚类准则,分成不同的类,其目标是使得类内的对象尽可能的相似,类间的距离尽可能的远离。在聚类分析的结果中,聚类算法是否适合给定的数据集,得到的聚类结果能否反映数据集固有的结构,这就需要对聚类结果进行评价。
传统的聚类有效性评价方法大多是针对低维数据的聚类结果,并且取得了很好的效果,但针对高维的动态心电波形数据,由于其存在曲线的特性,传统有效性评价方法存在一定局限性。本文通过对动态心电波形生物背景以及有效性评价方法的分析,研究动态心电波形聚类结果的有效性分析,提出了适用于心电波形聚类分析效果的内部评价方法和相对评价方法。
本文通过分析动态心电波形的特点,提出了改进的FOM方法(Figure of Merit)用于心电波形聚类效果的内部评价。FOM方法是经典的内部评价方法,但该方法反映的是在欧式距离下的类内差异,并不适合对动态心电波形聚类结果进行评价。Hausdorff距离是一种极大极小距离,不需要建立点之间的一一对应关系,只是计算两个点集之间的相似程度。本文在FOM方法的基础上,通过对心电波形分段加权求和,计算Hausdorff距离,提出了一种改进的有效性...
【英文摘要】
Clustering is an unsupervised learning algorithm. It divided the data set into different classes by certain criteria. The goal is to make the objects within the class as similar as possible, and make the differences among classes as far as possible. In cluster analysis, is the clustering algorithm suitable for a given data set? Can the clustering results reflect the inherent structure? These questions introduced the evaluation of clustering results.
Validity methods of traditional clustering are mostly ...