节点文献

一种提高相似重复记录检测精度的方法

A METHOD OF IMPROVING APPROXIMATELY DUPLCATED RECORDS DETECTION PRECISION

  • 推荐 CAJ下载
  • PDF下载
  • 不支持迅雷等下载工具,请取消加速工具后下载。

【作者】 陈伟王昊朱文明

【Author】 Chen Wei Wang Hao Zhu Wenming (Nanjing Audit Institute,Nanjing Jiangsu 210029,China)

【机构】 南京审计学院南京审计学院 江苏南京210029江苏南京210029

【摘要】 如何消除数据源中的相似重复记录是数据清理研究中的一个重要问题。为了提高相似重复记录的检测精度,在相似重复记录检测算法的基础上,采用等级法为记录各字段指定合适的权重,从而提高了相似重复记录的检测精度。最后,以一个实例验证了该方法的效果。

【Abstract】 How to clean approximately duplicated records in data source is an important problem in data cleaning.To improve the detecting precision,based on method of approximately duplicated records cleaning,each field of record is appointed a proper weight through using rank-based weights method in the process of approximately duplicated records detecting.Finally,the validity of this method is proved by an example.

【基金】 江苏省高校自然科学研究计划资助项目(05KJB520054);国家863计划资助项目(2003AA1Z2330);国家自然科学基金项目(70371015)。
  • 【文献出处】 计算机应用与软件 ,Computer Applications and Software , 编辑部邮箱 ,2006年10期
  • 【分类号】TP274.4
  • 【被引频次】21
  • 【下载频次】215
节点文献中: 

本文链接的文献网络图示:

本文的引文网络