节点文献

基于FP-Tree的最大频繁项目集挖掘及更新算法

An Algorithm and Its Updating Algorithm Based on FP-Tree for Mining Maximum Frequent Itemsets

  • 推荐 CAJ下载
  • PDF下载
  • 不支持迅雷等下载工具,请取消加速工具后下载。

【作者】 宋余庆朱玉全孙志挥陈耿

【Author】 SONG Yu-Qing1, ZHU Yu-Quan1,2+, SUN Zhi-Hui1, CHEN Geng1 1(Department of Computer Science and Engineering, Southeast University, Nanjing 210096, China) 2(College of Computer and Information Engineering, Hohai University, Changzhou 213022, China)

【机构】 东南大学计算机科学与工程系东南大学计算机科学与工程系 江苏南京210096江苏南京210096河海大学计算机及信息工程学院江苏常州213022江苏南京210096

【摘要】 挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,之前的很多研究都是采用Apriori类的候选项目集生成-检验方法.然而,候选项目集产生的代价是很高的,尤其是在存在大量强模式和/或长模式的时候.提出了一种快速的基于频繁模式树(FP-tree)的最大频繁项目集挖掘DMFIA(discover maximum frequent itemsets algorithm)及其更新算法UMFIA(update maximum frequent itemsets algorithm).算法UMFIA将充分利用以前的挖掘结果来减少在更新的数据库中发现新的最大频繁项目集的费用.

【Abstract】 Mining maximum frequent itemsets is a key problem in many data mining application. Most of the previous studies adopt an Apriori-like candidate set generation-and-test approach. However, candidate set generation is still costly, especially when there exist prolific patterns and/or long patterns. In this paper, a fast algorithm DMFIA (discover maximum frequent itemsets algorithm) and its updating algorithm UMFIA (update maximum frequent itemsets algorithm) based on frequent pattern tree (FP-tree) for mining maximum frequent itemsets is proposed. The algorithm UMFIA makes use of previous mining result to cut down the cost of finding new maximum frequent itemsets in an updated database.

【基金】 国家自然科学基金;国家科技型中小企业技术创新基金~~
  • 【文献出处】 软件学报 ,Journal of Software , 编辑部邮箱 ,2003年09期
  • 【分类号】TP311.13
  • 【被引频次】399
  • 【下载频次】1560
节点文献中: 

本文链接的文献网络图示:

本文的引文网络