中国学术期刊网络出版总库
  关闭
海量多维数据的存储与查询研究  
   推荐 CAJ下载 PDF下载
【英文篇名】 Research on storage and query of large-scale multidimensional data
【下载频次】 ★★★★★
【作者】 宋爱波; 万雨桐; 贡欢; 薛荧荧;
【英文作者】 SONG Aibo; WAN Yutong; GONG Huan; XUE Yingying; School of Computer Science and Engineering; Southeast University;
【作者单位】 东南大学计算机科学与工程学院;
【文献出处】 计算机工程与应用 , Computer Engineering and Applications, 编辑部邮箱 2016年 13期  
期刊荣誉:中文核心期刊要目总览  ASPT来源刊  中国期刊方阵  CJFD收录刊
【中文关键词】 海量多维数据; Hadoop; 数据索引; 聚集查询;
【英文关键词】 large-scale multidimensional data; Hadoop; data index; aggregation query;
【摘要】 基于数据仓库的OLAP系统是当前海量多维数据分析的主要工具。随着信息技术的发展,海量多维数据的规模急剧增长,结构日益复杂,OLAP系统的性能严重下降,已经无法满足人们的数据分析需求。基于分布式计算系统Hadoop给出了新的海量多维数据的存储方法和查询方法。设计了HDFS上的列存储文件格式HCFile,基于HCFile给出了海量多维数据存储方案,该方案能够提高聚集计算效率,并有很好的可扩展性。同时,利用多维数据的层次性语义特征,设计了维层次索引,并给出了利用维层次索引和Map Reduce进行聚集计算的方法。通过和Hive的对比实验,表明了数据存储方案和查询方法能够有效提高海量多维数据分析的性能。
【英文摘要】 The OLAP(Online Analytical Processing) system built on warehouse is the most popular tool to analyze large-scale multidimensional data. With the development of information technology, data volume grows rapidly and data structure becomes more and more complicated, so the performance of OLAP system has dropped severely, failing to meet daily data analysis needs. This paper proposes new methods to store large-scale multidimensional data and perform aggregation query with Hadoop, a parallel computing system. Th...
【基金】 国家自然科学基金(No.61370207,No.61572128); 国家电网公司总部科技项目
【更新日期】 2016-07-22
【分类号】 TP311.13
【正文快照】 1引言在数据仓库中,多维数据主要采用星形模式或雪花模式来存储,其多维结构被划分为事实表和维表,事实表用于存储度量值和各维的外键,维表用于存储度量值的详细属性信息。星形模式以事实表为中心,通过维表外键连接多张维表。雪花模式是在星形模式的基础上,将维表规范化,把数据?

xxx
【读者推荐文章】中国期刊全文数据库 中国优秀硕士学位论文全文数据库
【相似文献】
中国期刊全文数据库
中国优秀硕士学位论文全文数据库
中国博士学位论文全文数据库
中国重要会议论文全文数据库
中国重要报纸全文数据库
中国学术期刊网络出版总库
点击下列相关研究机构和相关文献作者,可以直接查到这些机构和作者被《中国知识资源总库》收录的其它文献,使您全面了解该机构和该作者的研究动态和历史。
【文献分类导航】从导航的最底层可以看到与本文研究领域相同的文献,从上层导航可以浏览更多相关领域的文献。

工业技术
  自动化技术、计算机技术
   计算技术、计算机技术
    计算机软件
     程序设计、软件工程
      程序设计
       数据库理论与系统
  
 
  CNKI系列数据库编辑出版及版权所有:中国学术期刊(光盘版)电子杂志社
中国知网技术服务及网站系统软件版权所有:清华同方知网(北京)技术有限公司
其它数据库版权所有:各数据库编辑出版单位(见各库版权信息)
京ICP证040431号    互联网出版许可证 新出网证(京)字008号