节点文献

XML文档语义检索方法研究

Research on XML semantic retrieval

  • 推荐 CAJ下载
  • PDF下载
  • 不支持迅雷等下载工具,请取消加速工具后下载。

【作者】 莫正波宋玲吕强邓薇

【Author】 MO Zhengbo;SONG Ling;LV Qiang;DENG Wei;School of Science,Qingdao Technological University;School of Computer Science and Technology,Shandong Jianzhu University;Department of Power Grid Maintenance Training,State Grid of China Technology College;Basic Courses Department,Shandong University of Science and Technolagy;

【机构】 青岛理工大学理学院山东建筑大学计算机科学与技术学院国网技术学院电网检修培训部山东科技大学基础课部

【摘要】 由于半结构文档如XML越来越广泛的应用,在数据库和信息检索领域,对半结构XML数据相似度的研究也变得尤为重要。给定XML文档集D和用户查询q,XML检索即是从D中查找出符合q的XML文档。为了有效地进行XML信息检索,提出了一种新的计算用户查询与XML文档之间相似度的算法。该算法分为三步:基于WordNet对用户查询q进行同义词扩展得到q’;将q’和D中的每一篇XML文档都进行数字签名,并通过签名之间的匹配对D进行有效过滤,除去大量不符合用户查询的文档,得到一个文档子集D’,D’í D;对q’与D’中的文档进行精确匹配得到检索结果。

【Abstract】 With more and more application of semi-structure data, the research of XML document similarity becomes essential in the database and information retrieval communities. Given set of XML documents D and the user query q, XML retrieval is to find out the XML documents from the D which satisfies q. In order to search efficiently, a new approach is presented to calculate similarity between two XML documents. The approach is divided into three steps. The user’s query q is expanded to q’ by including the synonyms of q based on WordNet. q’ and each XML document in D are allocated to digital signatures. After eliminating the irrelevant documents in D according to the signatures matching, a subset D’ of D is got. Precise matching between q and D’is presented and final results are got.

【基金】 国家自然科学基金(No.61170052);山东省高等教育学会“十二五”高等教育科学研究课题(No.YBKT2011063);济南科技发展计划(No.200906004)
  • 【文献出处】 计算机工程与应用 ,Computer Engineering and Applications , 编辑部邮箱 ,2013年11期
  • 【分类号】TP391.3
  • 【被引频次】6
  • 【下载频次】91
节点文献中: 

本文链接的文献网络图示:

本文的引文网络