节点文献

智能融合数据挖掘方法及其应用

【作者】 王天真

【导师】 汤天浩; 文成林;

【作者基本信息】 上海海事大学 , 电力电子与电力传动, 2006, 博士

【摘要】 随着计算机技术的迅速发展以及数据库管理系统的广泛应用,使得人们积累的数据远远超过人们分析和理解数据的能力。激增的数据背后隐藏着许多重要的信息,人们希望能够对其进行更深层次的分析,以便更好地应用数据和提供决策支持。数据挖掘技术为了解决“数据爆炸但知识贫乏”的问题便应运而生。成为目前具有挑战意义的研究热点之一。数据挖掘是从数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程,其中聚类、主元分析和趋势分析是三个重要的环节。 聚类分析是数据挖掘的重要方法之一。本文深入分析了聚类分析中的一些传统方法,提出了三种聚类分析算法:复合聚类分析算法;基于动态数据窗口的自组织竞争神经网络聚类分析方法;基于动态数据窗口的融合聚类分析算法。将这三种方法进行分析比较,应用在故障检测当中。仿真实验验证了算法的有效性。 主元分析方法是统计学中的重要方法之一,在处理数据挖掘中高维数据问题上有很大的突破。本文针对主元分析方法对于不同量纲和分布“均匀”的数据很难选取主元,或者选取的主元没有代表性的问题,提出一种相对主元分析方法,该方法可以克服数据的量纲问题和分布“均匀”问题,选出的相对主元具有代表性,可以很好的解决数据挖掘中的高维数据压缩问题以及复杂系统的故障检测问题。而且基于相对主元的故障检测模型不受模型采样数目的限制。仿真结果验证了方法的有效性。 由于预测神经网络可以通过学习任意逼近非线性映射,被用于构建非线性系统模型。但现在神经网络时序预测模型只能进行一维预测,对于多属性事物的预测还未探究。本文提出一种基于并行递归神经网络的多维预测模型,这种模型能够记忆历史信息,实现实时动态建模、在线参数修正和多维并行预测,并用多维空间中的线性函数和非线性函数验证了该预测模型的有效性。 针对复杂系统的数据,单一的数据挖掘算法很难实现数据挖掘,或者是得出的“知识”有局限性。本文结合前面所介绍的基于动态数据窗口的聚类分析方法,相对主元方法和并行递归神经网络的多维预测模型,提出一种基于智能融合的数据挖掘方法监控系统。该方法可以实现监控系统的虚警消除,参数压缩(多变量降维),故障监测

【Abstract】 With prompt development of computer technology and wild application of data base and its management, the amount of data being collected in databases today far exceeds our ability to analyze data and understand its meaning without the use of automated analysis techniques. There is much important information in the astronomical data. The data was expected to be more deeply analyzed to apply the data and provide decision making supports. Data mining is a kind of new technology that is evolving to provide automated analysis solutions. In modern times, data mining becomes one of hot topic in information technology field.Data mining is an information extraction activity whose goal is to discover hidden facts contained in databases. Clustering, principal component analysis (PCA) and trend analysis are three important parts in data mining process.Clustering analysis is an important approach of data mining. This dissertation firstly went deep into discussing some traditional clustering algorithms, then proposed a new integrated clustering analysis algorithm, a clustering analysis algorithm based on DDW and ANN and a fusion clustering analysis algorithm based on DDW. Furthermore, this dissertation compared and analyzed these methods, and applied these algorithms for data mining. The simulation demonstrated the effectiveness and practicability of these algorithms proposed.The classical PCA was one of the most important methods in statistic method. PAC could be used to compress data from multi-dimensions data. But when the data is Rotundity Scatter, the representative Principal Components could not be selected. This dissertation proposed a relative principal component analysis (RPCA) algorithm. The Relative Principal Components selected by RPCA are more representative, and their significance of geometry is more notable. The successful fault detection demonstrated the effectiveness of RPCA method.

  • 【分类号】TP18;TP311.13
  • 【被引频次】31
  • 【下载频次】2103
  • 攻读期成果
节点文献中: 

本文链接的文献网络图示:

本文的引文网络