节点文献

基于关键资源的网站自动分类系统

A website categorization system based on key resource

  • 推荐 CAJ下载
  • PDF下载
  • 不支持迅雷等下载工具,请取消加速工具后下载。

【作者】 付德宇代成琴仲玮

【Author】 FU De-yu,DAI CHENG-qin,ZHONG Wei(Network and Information Center,Harbin Institute of Technology,Harbin 150001,China)

【机构】 哈尔滨工业大学网络与信息中心哈尔滨工业大学网络与信息中心 黑龙江哈尔滨150001黑龙江哈尔滨150001

【摘要】 针对网站表示难题,引入关键资源的概念,对网站关键资源进行了分析,设计了一个主页优先的网站关键资源获取方法,给出了一个改进的TF-IDF公式用于计算特征的权重,并研究了关键资源特征抽取的方法,最后提出了基于关键资源的网站分类系统的模型.

【Abstract】 The concept of key resource was proposed for website representation.First an analysis on the key resource of a website is given.Then a method that acquires the key resource of a website and an improved TF-IDF formula for calculating the feature are presented and the method of the feature extraction of the key resource is also presented.Lastly,a website categorization model based on key resource is described.

  • 【文献出处】 哈尔滨工业大学学报 ,Journal of Harbin Institute of Technology , 编辑部邮箱 ,2006年01期
  • 【分类号】TP393.092
  • 【被引频次】8
  • 【下载频次】168
节点文献中: