节点文献

在属性级别上处理噪声数据的数据清洗算法

Noisy-data-disposing Algorithm of Data Clean on the Attribute Level

  • 推荐 CAJ下载
  • PDF下载
  • 不支持迅雷等下载工具,请取消加速工具后下载。

【作者】 王石李玉忱刘乃丽王素青

【Author】 WANG Shi, LI Yuchen, LIU Naili, WANG Suqing (School of Computer Science and Technology, Shandong University, Jinan 250061)

【机构】 山东大学计算机科学与技术学院山东大学计算机科学与技术学院 济南250061济南250061济南250061

【摘要】 噪声数据的处理是数据清洗的一个重要环节。文章提出一个基于聚类分析的在属性级别上处理噪声数据的算法。该算法通过聚类分析确认噪声数据产生噪声的具体属性,同时统计噪声在属性上的分布规律,这些统计数据可以在下一步的工作中进一步提高数据质量。

【Abstract】 The dispose of the noisy data is an important part in data cleaning. This paper presents a clustering-based method to dispose noisy data on the level of attribute. This method finds the attribute that makes noise by clustering analysis. Meanwhile, it gets the noise trend in the attributes and this information can be used subsequently to improve the quality of the data.

【关键词】 数据清洗聚类噪声数据数据质量
【Key words】 Data cleanClusteringNoisy dataData quality
  • 【文献出处】 计算机工程 ,Computer Engineering , 编辑部邮箱 ,2005年09期
  • 【分类号】TP311.13
  • 【被引频次】40
  • 【下载频次】591
节点文献中: 

本文链接的文献网络图示:

本文的引文网络