节点文献

分布式应用系统中的ETL开发方法学研究

Research on ETL Development Methodology in Distributed Application System

  • 推荐 CAJ下载
  • PDF下载
  • 不支持迅雷等下载工具,请取消加速工具后下载。

【作者】 张晓明林小竹

【机构】 北京石油化工学院信息工程学院

【摘要】 <正>1引言当前,数据仓库的构建与应用研究日趋广泛,从数据的质量获取方面,最为关注的是ETL(Extraction,Cleaning,Transformation,and Loading)技术。ETL技术包括数据抽取、数据清洗、数据转换和数据装载四个子过程,这些子过程可能单独存在,

【Abstract】 An ETL(data extraction,cleaning,transformation and loading)development framework is constructed to meet the need of data quality in distributed system.The framework is composed of three parts of process model,development methodology and component description.A kind of network mapping diagram is designed for the methodology model with development method,technique,template and component XML-based method is described for the data extraction sub-process model with XML Schema structure.For the XML-based ETL component description, five facets of Header,Deployment,Form,Function and Implementation are designed with a detailed statement of case study on data cleaning component description.The methodology and XML-based component description will be helpful for the development and management of ETL process.

【Key words】 XMLComponentETLMethodologyFrameworkModel
【基金】 北京市教委科技发展计划面上项目(KM200510017006)
  • 【会议录名称】 第二十二届中国数据库学术会议论文集(技术报告篇)
  • 【会议名称】第二十二届中国数据库学术会议
  • 【会议时间】2005-08-19
  • 【会议地点】中国内蒙古呼和浩特
  • 【分类号】TP311.13
  • 【主办单位】中国计算机学会数据库专业委员会
节点文献中: 

本文链接的文献网络图示:

本文的引文网络