节点文献
Web信息抽取技术的研究
【摘要】 目前,Web上80%的信息来源于后台数据库,用户为了将后台数据库中的信息发布出来,可以直接以HTML格式进行发布,也可以转化为XML格式进行发布。信息抽取技术最早是由G.Wiederhold在《Mediatorsin the Architecture of Future Information Systems》一文中提出的,在随后的几年里,人们研究出了许多基于信息抽取技术的异构信息集成系统,根据这些原型系统所采用的信息抽取原理和方式,我们将这些原型系统所使用的信息抽取器划分为三类:·手工构造信息抽取器。·机器学习方式的信息抽取器。·可视化、交互式的信息抽取器。信息抽取技术应该具有如下特点:·简
- 【文献出处】 信息技术教育 , 编辑部邮箱 ,2004年10期
- 【分类号】TP393.09
- 【被引频次】4
- 【下载频次】153