节点文献

路径聚类:在Web站点中的知识发现

PATH CLUSTERING: DISCOVERING THE KNOWLEDGE IN THE WEB SITE

  • 推荐 CAJ下载
  • PDF下载
  • 不支持迅雷等下载工具,请取消加速工具后下载。

【作者】 王实高文李锦涛谢辉

【Author】 WANG Shi, GAO Wen, LI Jin Tao, and XIE Hui (Institute of Computing Technology, Chinese Academy of Sciences, Beijing 100080)

【机构】 中国科学院计算技术研究所!北京100080

【摘要】 用户对 Web站点的访问代表了用户对 Web站点上页面的访问兴趣 .这种兴趣程度可以通过用户对 Web站点上页面的浏览顺序表现出来 .在对 Web站点的访问日志进行事务识别后 ,可以根据群体用户对 Web站点的访问顺序进行聚类 ,即路径聚类 ,那么最终每一个聚类集就反映出该聚类集中的全体用户具有相似的访问兴趣 .为了得到这种根据用户访问兴趣而对用户集的划分 ,提出了 K- paths路径聚类方法 .在这种方法中 ,根据用户的访问兴趣定义了新的相似性测量手段和聚类中心 ,实验的结果是成功的

【Abstract】 When users access a Web site, the access of the users represents the interest of users in the Web pages of the Web site. Each user’s interest can be manifested by the sequence of each user access. After processing the Log in the Web site and identifying each user access transaction, the access paths of all the users can be clustered. This is called path clustering. Each cluster can then represent the similar access interest of the users in the cluster. Presented in this paper is a new clustering approach: K paths to partition the users’ access according to the interest of the users. In this approach, according to the requirement of the clustering, the new method is defined to measure similarity and to get the center of a cluster. The experiment shows that this approach is successful.

【关键词】 Web数据挖掘聚类
【Key words】 Web miningclustering
【基金】 国家“八六三”高技术研究发展计划基金资助!(86 3-30 6 -JD0 6 -0 3-4 )
  • 【文献出处】 计算机研究与发展 ,Journal of Computer Research and Development , 编辑部邮箱 ,2001年04期
  • 【分类号】TP18
  • 【被引频次】207
  • 【下载频次】680
节点文献中: 

本文链接的文献网络图示:

本文的引文网络