节点文献

基于TF/IDF相似度的标签聚类方法

TF-IDF Similarity Based Method for Tag Clustering

  • 推荐 CAJ下载
  • PDF下载
  • 不支持迅雷等下载工具,请取消加速工具后下载。

【作者】 韩敏唐常杰段磊李川巩杰

【Author】 HAN Min,TANG Changjie~+,DUAN Lei,LI Chuan,GONG Jie School of Computer Science,Sichuan University,Chengdu 610065,China

【机构】 四川大学计算机学院

【摘要】 社会标签系统是Web2.0中提出的新概念,旨在更好地表达用户的兴趣和意愿。标签聚类是社会标签数据挖掘中一个非常重要的研究课题。标签相似度的计算是标签聚类的关键技术。主要工作包括:(1)提出一种基于TF/IDF的标签相似度计算方法和基于该相似度的聚类算法;(2)分析了影响标签相似度的条件;(3)通过详实的实验表明,与已有方法相比,新方法具有更好的准确性。

【Abstract】 As a new concept of Web2.0,Social Tagging System aims at expressing users’ interests clearly and specifically.Tag clustering is an important research topic in Social Tagging System mining.Evaluation similarity among social tags is the key technique in tag clustering.The main contributions include:(1) introducing a new method to calculate the tag similarity based on TF/IDF,and proposing a clustering algorithm based on the new method;(2) analyzing the conditions that influence tag similarity;(3) conducting extensive experiments to demonstrate that proposed method is more efficient compared with some methods proposed before.

【关键词】 标签聚类相似度社会标签系统TF/IDF
【Key words】 Tag clusteringSimilaritySocial Tagging SystemTF/IDF
【基金】 国家自然科学基金No.6077316;国家“十一五”科技支撑计划 No.2006BAI05A01~~
  • 【会议录名称】 第26届中国数据库学术会议论文集(A辑)
  • 【会议名称】第26届中国数据库学术会议
  • 【会议时间】2009-10-15
  • 【会议地点】中国江西南昌
  • 【分类号】TP311.13
  • 【主办单位】中国计算机学会数据库专业委员会
节点文献中: 

本文链接的文献网络图示:

本文的引文网络