节点文献
基于TF/IDF相似度的标签聚类方法
TF-IDF Similarity Based Method for Tag Clustering
【Author】 HAN Min,TANG Changjie~+,DUAN Lei,LI Chuan,GONG Jie School of Computer Science,Sichuan University,Chengdu 610065,China
【机构】 四川大学计算机学院;
【摘要】 社会标签系统是Web2.0中提出的新概念,旨在更好地表达用户的兴趣和意愿。标签聚类是社会标签数据挖掘中一个非常重要的研究课题。标签相似度的计算是标签聚类的关键技术。主要工作包括:(1)提出一种基于TF/IDF的标签相似度计算方法和基于该相似度的聚类算法;(2)分析了影响标签相似度的条件;(3)通过详实的实验表明,与已有方法相比,新方法具有更好的准确性。
【Abstract】 As a new concept of Web2.0,Social Tagging System aims at expressing users’ interests clearly and specifically.Tag clustering is an important research topic in Social Tagging System mining.Evaluation similarity among social tags is the key technique in tag clustering.The main contributions include:(1) introducing a new method to calculate the tag similarity based on TF/IDF,and proposing a clustering algorithm based on the new method;(2) analyzing the conditions that influence tag similarity;(3) conducting extensive experiments to demonstrate that proposed method is more efficient compared with some methods proposed before.
【Key words】 Tag clustering; Similarity; Social Tagging System; TF/IDF;
- 【会议录名称】 第26届中国数据库学术会议论文集(A辑)
- 【会议名称】第26届中国数据库学术会议
- 【会议时间】2009-10-15
- 【会议地点】中国江西南昌
- 【分类号】TP311.13
- 【主办单位】中国计算机学会数据库专业委员会