节点文献
基于覆盖关系的Deep Web数据源排名
The Ranking of Deep Web Data Sources Based on Estimation of Coverage Relationship
【Author】 Yu Wei~(1,2),Li Shijun~(1,2),Hong Hui~1,and Tian Jianwei~1 1(School of Computer Science,Wuhan University,Wuhan 430072) 2(State Key Laboratory of Software Engineering,Wuhan University,Wuhan 430072)
【机构】 武汉大学计算机学院; 武汉大学软件工程国家重点实验室;
【摘要】 Deep Web是隐藏在Web数据库中的结构数据,只能通过查询接口访问.目前大部分针对排名的研究都只停留在对Deep Web接口特征的分析上.利用抽样理论知识,将在Deep Web中进行的每一次检索行为看做是一次抽样,检索的结果是抽样结果.通过选择合适的抽样方法,使抽样所反映出来的部分数据覆盖关系能够从一定程度上反映整个Deep Web的数据覆盖关系.进而通过对覆盖关系的估计,确定覆盖程度,并按其进行排名.
【Abstract】 Deep Web is the structured data hidden in Web databases,which can only be accessed by query interfaces.So far the present studies are limited in most rankings of deep analysis of the characteristics of the Web interface.In this paper,sampling theoretical knowledge is used,taking each search action conducted in deep Web as a sampling and the search result as the sampling result.By choosing the appropriate sampling methods,the sample reflecting the part of the data coverage relationship reflects the deep Web data coverage relations to a certain extent.What’s more,by estimating coverage relationship, coverage grade and ranked data sources can be obtained.
【Key words】 Deep Web; coverage relationship; sampling method; data source ranking;
- 【会议录名称】 第二十四届中国数据库学术会议论文集(研究报告篇)
- 【会议名称】第二十四届中国数据库学术会议
- 【会议时间】2007-10-20
- 【会议地点】中国海南海口
- 【分类号】TP311.13
- 【主办单位】中国计算机学会数据库专业委员会