节点文献

PSL:针对大规模数据应用的并行Slope One算法

PSL:Parallel Slope One Algorithm for Large-scale Application

  • 推荐 CAJ下载
  • PDF下载
  • 不支持迅雷等下载工具,请取消加速工具后下载。

【作者】 周敏周继鹏丁光华

【Author】 ZHOU Min,ZHOU Ji-peng,DING Guang-hua(Jinan University,Guangzhou 510632,P.R.China)

【机构】 暨南大学

【摘要】 提出并行Slope One算法PSL,并展示了它的Map-Reduce计算模型实现。PSL有效地克服了(1)原Slope One算法空间复杂度过高,单机无法存储其中间文件的缺点;(2)计算代价高,通常只能使用在小规模数据上的不足。并且此算法:(1)能够进行增量计算,实现准实时的用户推荐,(2)可以运行在成本低廉的集群上,不仅具有学术意义,更具商业价值。采用了Net-flix Prize真实数据进行实验,结果表明,PSL可以应用在真实的大规模数据之上,并且具有良好的容错性和伸缩性。

【Abstract】 PSL,a parallel Slope One algorithm,is proposed and presented our implementation on Map-Reduce computing model.PSL effectively overcomes(1) High space complexity of the original Slope One algorithm,where intermediate files can’t be stored on a single machine;(2) High computing overhead,usually only used in small-scale dataset.Meanwhile,this algorithm(1) can do incremental computing,achieve a quasi-real-time user recommendation,(2) can run on low-end clusters,which means it’s not only academic significant,but also commercial valuable.We use Netflix Prize,a real-world dataset,for our experiments.Results show that,PSL can be applied to real-world,large-scale data applications,and achieves a good fault-tolerance and scalability.

【关键词】 Slope OneMap-Reduce并行
【Key words】 Slope One Map-Reduce parallel
  • 【文献出处】 科学技术与工程 ,Science Technology and Engineering , 编辑部邮箱 ,2010年03期
  • 【分类号】TP301.6
  • 【被引频次】18
  • 【下载频次】217
节点文献中: 

本文链接的文献网络图示:

本文的引文网络