节点文献

基于Internet的军事演习信息抽取系统

Sham Battle Information Extraction System Based on Internet

  • 推荐 CAJ下载
  • PDF下载
  • 不支持迅雷等下载工具,请取消加速工具后下载。

【作者】 李跃进赵晶林鸿飞

【Author】 Li Yuejin Zhao Jing Lin Hongfei (Department of Computer,Dalian University of Technology,Dalian 116024)

【机构】 大连理工大学计算机系大连理工大学计算机系 大连116024大连116024

【摘要】 论文论述了Web文档的信息抽取的基本方法,设计并实现了一个基于Internet上的军事演习信息抽取系统—SBIES。在系统中引入了分装器的机器学习算法来获取网页抽取规则,采用基于最大熵模型的组块分析方法进行部分语法分析,利用模式匹配的方法实现信息的自动抽取,以数据库与XML相结合的方式组织信息库,并实现信息的Web表示和查询。系统测试结果表明,它具有较高的抽取召回率和抽准确率。

【Abstract】 Information Extraction plays an important role in knowledge acquisition and information service.This paper discusses briefly the key techniques for information extraction,and it designs and implements a Sham Battle Information Extraction System(SBIES).It constructs automatically wrappers by machine learning algorithms,applies Maximum Entropy model to conduct Chinese chunk parsing and makes use of a sets of extraction patterns to extract specific information and relationships from relevant HTML documents.Moreover,it also combines the XML expression with the organization of database,so it realizes the presentation and query of information extracted based on Web.It shows higher recall and precision by testing SBIES.

【基金】 国家自然科学基金资助项目(编号:60373095)
  • 【文献出处】 计算机工程与应用 ,Computer Engineering and Applications , 编辑部邮箱 ,2006年14期
  • 【分类号】TP319
  • 【被引频次】10
  • 【下载频次】198
节点文献中: 

本文链接的文献网络图示:

本文的引文网络