节点文献
Chopper:一个高效的有序标号树频繁结构的挖掘算法
Chopper:An Efficient Algorithm for Tree Mining
【机构】 复旦大学计算机与信息技术系;
【摘要】 <正>1引言在数据集中挖掘频繁模式是数据挖掘研究的关键环节之一。在过去,很多的努力都集中在原子数据的挖掘上。然而,现实世界中许多实体之间总会保持着千丝万缕的关系。如何获得这些关系的频繁模式,
【Abstract】 With the development of internet,frequent pattern mining generalizes to more complex patterns like tree mining and graph mining.Such application arises in complex domains like bioinformatics,Web mining,etc. Based or.the concept of"frequent sequences first,frequent structures later",we present a novel algorithm,named Chopper,to discover frequent structures from labeled ordered trees.We compare its performance with TreeMinerV based on Apriori.The result shows that our algorithm can do the job better especially when the tree size is large and the support is small.
【Key words】 Data mining;
Semi-structured data;
Labeled ordered tree;
【基金】 国家自然科学基金重点项目(编号69933010);国家863高科技项目(编号2002AA4Z3430)
- 【会议录名称】 第二十届全国数据库学术会议论文集(研究报告篇)
- 【会议名称】第二十届全国数据库学术会议
- 【会议时间】2003-10-10
- 【会议地点】中国湖南长沙
- 【分类号】TP311.13
- 【主办单位】中国计算机学会数据库专业委员会