节点文献
基于实体分类的数据库模式匹配方法
An Approach to Database Schema Matching Based on Entity Classification
【Author】 YU Bo TANG Shi-Wei ZHANG Peng TONG Yun-Hai (School of Electronics Engineering and Computer Science,Peking University,Beijing 100871)
【机构】 北京大学信息科学技术学院;
【摘要】 模式匹配在诸如数据集成、数据仓库、信息共享和计算机网络交换等许多应用领域起到了关键作用。目前,自动模式匹配方法也不能解决复杂模式情况下的匹配问题。本文提出一种基于关系模式领域中的实体分类的数据库模式匹配方法。该方法通过朴素贝叶斯学习将实体分为不同的类(子模式),然后以同样的类来匹配子模式之间的模式元素。本方法在复杂模式条件下可有效提高匹配效率,减少匹配工作量,节省人力资源。
【Abstract】 Schema matching plays a key role in many application domains,such as data integration,data warehouse, and information share and exchange on computer network.Currently,approaches of automatic schema matching cannot solve matching issue under the circumstance of complex schema well.This paper introduces an approach based on entity classification in the domain of relation schema.It divides entities into different categories (sub-schema) using Na(i|¨)ve Bayes Learning,and then matches schema elements between the sub-schemas with the same category.It can effectively improve matching results,reduce the number of element-to-element comparisons and save user efforts under the circumstance of complex schema.
【Key words】 Schema matching; Entity; Sub-schema; Naive bayes learning; Data warehouse;
- 【会议录名称】 第二十一届中国数据库学术会议论文集(技术报告篇)
- 【会议名称】第二十一届中国数据库学术会议
- 【会议时间】2004-10-14
- 【会议地点】中国福建厦门
- 【分类号】TP311.13
- 【主办单位】中国计算机学会数据库专业委员会