节点文献

XML模式匹配:整体连接算法TurboStack

XML Pattern Matching:Holistic Twig Join Algorithm TurboStack

  • 推荐 CAJ下载
  • PDF下载
  • 不支持迅雷等下载工具,请取消加速工具后下载。

【作者】 郭少松包小源陈薇王腾蛟雷凯杨冬青

【Author】 Guo Shaosong~(1,2),Bao Xiaoyuan~2,Chen Wei~(1,2),Wang Tengjiao~(1,2),Lei Kai~3,and Yang Dongqing~(1,2) 1(Key Laboratory of High Confidence Software Technologies(Ministry of Education)) 2(School of EECS,Peking University,Beijing 100871) 3(The Shenzhen Key Lab for Cloud Computing Technology and Applications(SPCCTA),Peking University Shenzhen Graduate School)

【机构】 高可信软件技术教育部重点实验室北京大学信息科学技术学院深圳市云计算关键技术与应用重点实验室(SPCCTA),北京大学深圳研究生院

【摘要】 含谓词的XPath查询为小枝查询(twig query),它是XQuery最基本的查询模式.小枝查询算法有两大类:小枝分解和整体小枝连接,其中TwigStack系列算法处理小枝查询的效率是最优的,但其缺点在于不支持Twig Query中含"OR"以及通配符"*"的查询;在大型商业数据库管理系统中,TurboXPath是DB2用于处理小枝查询的基本算法,它对XPath的支持较全面,但由于TurboXPath是针对XML数据流查询处理设计的,因而对数据库中Native存储的XML数据的查询处理效率较低;针对已有方法的不足,设计了一种纯XML存储方式,以DDE编码为基础,提出了TurboStack算法,并通过大量实验验证了该方法的有效性.

【Abstract】 The XPath with predicates is called Twig Query,which is the basic query model of XQuery.There are two kinds of Twig Query algorithms,namely twig split and holistic twig join. Among all the algorithms,the TwigStack algorithm in the series has the best efficiency,but it can’t support the XPath with "OR" or wildcard " * ".In the big commercial database management systems, the TurboXPath algorithm is adopted by DB2 for processing Twig Query.Its support for XPath is more comprehensive,but it is developed in view of XML stream so its efficiency in processing XML data with native storage model in database is low.In view of these disadvantages,we design a kind of native xml storage and propose TurboStack algorithm based on DDE labeling scheme.It proves that this algorithm is efficient according to a lot of experiments.

【关键词】 XMLTwigStackTurboXPathTurboStack查询处理
【Key words】 XMLTwigStackTurboXPathTurboStackquery process
【基金】 国家“八六三”高技术研究发展计划基金项目(2012AA011002,2011AA010706);“核高基”国家科技重大专项基金项目(2010ZX01042-002-002-02,2010ZX01042-001-003-05);国家自然科学基金项目(60973002,61170003,61073018);深港创新圈项目(JSE201007160004A);深圳市科技发展资金项目(ZYA201106080025A)
  • 【会议录名称】 第29届中国数据库学术会议论文集(B辑)(NDBC2012)
  • 【会议名称】第29届中国数据库学术会议(NDBC2012)
  • 【会议时间】2012-10-12
  • 【会议地点】中国安徽合肥
  • 【分类号】TP311.11
  • 【主办单位】中国计算机学会(China Computer Federation)
节点文献中: 

本文链接的文献网络图示:

本文的引文网络