中国优秀硕士学位论文全文数据库
  关闭
基于编辑图的XML相似性研究  
   在线阅读 整本下载 分章下载 分页下载本系统暂不支持迅雷或FlashGet等下载工具
【英文题名】 Research of XML Similarity Based Edit Graph
【作者】 李卓;
【导师】 徐沛娟;
【学位授予单位】 吉林大学;
【学科专业名称】 软件工程
【学位年度】 2011
【论文级别】 硕士
【网络出版投稿人】 吉林大学;李卓
【网络出版投稿时间】 2011-08-05
【关键词】 XML; 相似性; 编辑图; 拆分;
【英文关键词】 XML; XML similarity; Edit graph; Split;
【中文摘要】 随着网络上的数据量逐日剧增,HTML的缺陷逐渐明显,传统的Web技术已不能满足Internet发展的需求。半结构化语言XML的出现,攻克了这一难题。XML语言,具有超强的扩展性和易读性,能够有效的解释数据,在数据发布和数据交换等应用领域里发挥着越来越重要的作用。数据挖掘和数据库等数据处理领域需要对XML进行支持。而XML文档相似性研究,则是文档聚类、数据挖掘和信息检索的基础,成为当前的研究热点。 本文的研究目标是研究XML文档相似性算法。目前已经发表了很多XML相似性算法,可以分为三类:基于编辑距离(ED)的方法,基于信息检索(IR)的方法,采用不同技术来比较XML的其它方法。基于ED的方法是将XML文档转换成XML文档树,然后利用动态规划技术,找到树结构的编辑距离。其中大多数算法的目的都是为了实现文档和文档的比较。它们针对数据中心的XML,并且通常有精细的粒度。它们主要用于对XML文档结构相似度有精确要求的应用,例如数据集成、以及XML分类/聚类应用。ED算法有产生编辑脚本的特点,通过相似度值所对应的编辑脚本,可以描述树的转换过程。现今已有的算法中,编辑图算法由于快速有效等特点,成为研究编辑距离算...
【英文摘要】 With the rapid development of accordingly the data, HTML defects increasingly obvious, the traditional web technology can't satisfy the needs of internet, the semi-structured XML solve this problem. XML has strong expansibility and readability, It can effectively describe all kinds of data, and play more and more important role in data representation and data exchange. So, KDD and the database must support to XML. The similarity between XML documents is the foundation of document clustering、KDD and informat...
【更新日期】 2011-08-30

【相同导师文献】

导师:徐沛娟    导师单位:吉林大学    学位授予单位:吉林大学
[1] 王丹.基于ASP.NET技术的图书管理系统的设计与实现[D]. 吉林大学,2018
[2] 张丛阳.基于JEEPLUS框架的公文流转与审批系统的设计与实现[D]. 吉林大学,2018
[3] 费奕繁.基于显著性检测和边缘决策的多尺度遥感图像融合算法[D]. 吉林大学,2019
[4] 叶发杰.基于卷积神经网络的遥感图像融合算法[D]. 吉林大学,2019
[5] 贺菁.基于Java的旅游信息管理系统的设计与实现[D]. 吉林大学,2017
[6] 赵明.基于LabWindows/CVI的自动化测试系统软件设计与实现[D]. 吉林大学,2016
[7] 曹铭书.阜新地区人工影响天气作业指挥系统的设计与实现[D]. 吉林大学,2016
[8] 吴超.西乌珠穆沁供电分局一体化用电营销管理信息系统的设计与实现[D]. 吉林大学,2016
[9] 关世华.基于SOA架构的内蒙古锡盟人社局人事管理信息系统的设计与实现[D]. 吉林大学,2016
[10] 郑轶骏.基于ASP.NET的会展客户资源管理系统的设计与实现[D]. 吉林大学,2016

xxx
【读者推荐文章】中国期刊全文数据库 中国重要报纸全文数据库 中国博士学位论文全文数据库 中国优秀硕士学位论文全文数据库 中国重要会议论文全文数据库
【相似文献】
中国期刊全文数据库
中国优秀硕士学位论文全文数据库
中国博士学位论文全文数据库
中国重要会议论文全文数据库
中国重要报纸全文数据库
中国学术期刊网络出版总库
点击下列相关研究机构和相关文献作者,可以直接查到这些机构和作者被《中国知识资源总库》收录的其它文献,使您全面了解该机构和该作者的研究动态和历史。
【文献分类导航】从导航的最底层可以看到与本文研究领域相同的文献,从上层导航可以浏览更多相关领域的文献。

工业技术
  自动化技术、计算机技术
   计算技术、计算机技术
    计算机软件
     程序设计、软件工程
      程序设计
       数据库理论与系统
  
 
  CNKI系列数据库编辑出版及版权所有:中国学术期刊(光盘版)电子杂志社
中国知网技术服务及网站系统软件版权所有:清华同方知网(北京)技术有限公司
其它数据库版权所有:各数据库编辑出版单位(见各库版权信息)
京ICP证040431号    互联网出版许可证 新出网证(京)字008号