中国学术期刊网络出版总库
  关闭
一种基于MapReduce的并行聚类模型  
   推荐 CAJ下载 PDF下载
【英文篇名】 A Parallel Clustering Model Based on MapReduce
【下载频次】 ★★★★★
【作者】 顾瑞春; 王静宇;
【英文作者】 GU Rui-chun; WANG Jing-yu; Key Laboratory of Integrated Exploitation of Bayan Obo Multi-Metal Resources; IMUST; Information Center;
【作者单位】 内蒙古科技大学内蒙古白云鄂博矿多金属资源综合利用重点实验室; 内蒙古科技大学信息办与网络中心;
【文献出处】 计算机与现代化 , Computer and Modernization, 编辑部邮箱 2014年 01期  
期刊荣誉:ASPT来源刊  CJFD收录刊
【中文关键词】 数据挖掘; 算法; 云计算; MapReduce; Hadoop;
【英文关键词】 data mining; algorithm; cloud computing; MapReduce; Hadoop;
【摘要】 在对海量数据进行聚类的过程中,传统的串行模式局限性越来越明显,难以在有效时间内得出满意结果的问题,本文提出一种基于Hadoop平台下MapReduce框架的并行聚类模型。理论和实验结果证明该模型具有接近线速的加速比,针对海量数据具有较高效率。
【英文摘要】 During the clustering for big scale data,the traditional serial model has limitations,can not obtain a satisfied results within significant intervals. This paper proposes a concurrent clustering model based on MapReduce architechture under the Hadoop platform. The experiment result shows this model has a perfect linear speedup,and it outperforms the traditional clusting model,especially in dealing with massive data set.
【基金】 内蒙古科技大学创新基金资助项目(2011NCL054); 内蒙古科技大学教学改革研究项目(JY2011027)
【更新日期】 2014-04-29
【分类号】 TP311.13
【正文快照】 0引言数据挖掘是从海量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程。随着网络技术的不断发展和各种应用爆炸式增长,随之产生的数据量也急速膨胀,使用传统的单机存储和串行数据挖掘算法已经无法在有效时间内发现重要信息,而云计算具有海量的存储能力?

xxx
【读者推荐文章】中国期刊全文数据库 中国重要报纸全文数据库 中国重要会议论文全文数据库
【相似文献】
中国期刊全文数据库
中国优秀硕士学位论文全文数据库
中国博士学位论文全文数据库
中国重要会议论文全文数据库
中国重要报纸全文数据库
中国学术期刊网络出版总库
点击下列相关研究机构和相关文献作者,可以直接查到这些机构和作者被《中国知识资源总库》收录的其它文献,使您全面了解该机构和该作者的研究动态和历史。
【文献分类导航】从导航的最底层可以看到与本文研究领域相同的文献,从上层导航可以浏览更多相关领域的文献。

工业技术
  自动化技术、计算机技术
   计算技术、计算机技术
    计算机软件
     程序设计、软件工程
      程序设计
       数据库理论与系统
  
 
  CNKI系列数据库编辑出版及版权所有:中国学术期刊(光盘版)电子杂志社
中国知网技术服务及网站系统软件版权所有:清华同方知网(北京)技术有限公司
其它数据库版权所有:各数据库编辑出版单位(见各库版权信息)
京ICP证040431号    互联网出版许可证 新出网证(京)字008号