节点文献

Web信息抽取技术的研究

  • 推荐 CAJ下载
  • PDF下载
  • 不支持迅雷等下载工具,请取消加速工具后下载。

【摘要】 目前,Web上80%的信息来源于后台数据库,用户为了将后台数据库中的信息发布出来,可以直接以HTML格式进行发布,也可以转化为XML格式进行发布。信息抽取技术最早是由G.Wiederhold在《Mediatorsin the Architecture of Future Information Systems》一文中提出的,在随后的几年里,人们研究出了许多基于信息抽取技术的异构信息集成系统,根据这些原型系统所采用的信息抽取原理和方式,我们将这些原型系统所使用的信息抽取器划分为三类:·手工构造信息抽取器。·机器学习方式的信息抽取器。·可视化、交互式的信息抽取器。信息抽取技术应该具有如下特点:·简

  • 【分类号】TP393.09
  • 【被引频次】4
  • 【下载频次】153
节点文献中: 

本文链接的文献网络图示:

本文的引文网络