节点文献

基于DOM的Web信息抽取规则的构造与实现

Rules Construction and Implementation in DOM-based Web Information Extraction

  • 推荐 CAJ下载
  • PDF下载
  • 不支持迅雷等下载工具,请取消加速工具后下载。

【作者】 杨敬伟杨文柱高悦

【Author】 YANG Jing-wei1,YANG Wen-zhu2,GAO Yue3 (1.Department of Science and Technology,Hebei University,Baoding 071002,China; 2.College of Mathematics and Computer,Hebei University,Baoding 071002,China;3.China Academy of Telecommunication Research of the Ministry of Information Industry,Beijing 100037,China)

【机构】 河北大学科技处河北大学数学与计算机学院信息产业部电信研究院 河北保定071002河北保定071002北京100037

【摘要】 为了实现对Web信息的查询、重构和再利用,人们采用了Web信息抽取技术.本文主要讨论基于DOM的Web信息抽取,研究如何构造抽取规则,才能提高信息抽取的准确度、提高抽取规则的适应能力,并给出了抽取规则的生成过程.

【Abstract】 Web information extraction techniques were applied to Web information query,reconstruction and reuse.In this paper,we mainly discussed DOM-based Web information extraction,studied how to construct extraction rules to improve precision ratio of extraction and adaptation of extraction rules,and the rules’ generation procedure is also presented.

【关键词】 DOMWeb信息抽取抽取规则
【Key words】 DOMWeb information extractionextraction rule
  • 【文献出处】 河北大学学报(自然科学版) ,Journal of Hebei University(Natural Science Edition) , 编辑部邮箱 ,2007年02期
  • 【分类号】TP311.10
  • 【被引频次】19
  • 【下载频次】447
节点文献中: 

本文链接的文献网络图示:

本文的引文网络