中国学术期刊网络出版总库
  关闭
互联网广告点击率预估模型中特征提取方法的研究与实现  
   推荐 CAJ下载 PDF下载
【英文篇名】 Research and implementation of feature extraction methods on Internet CTR prediction model
【下载频次】 ★★★★★
【作者】 田嫦丽; 张珣; 潘博; 杨超; 许彦茹;
【英文作者】 Tian Changli; Zhang Xun; Pan Bo; Yang Chao; Xu Yanru; School of Computer & Information Engineering; Beijing Technology & Business University;
【作者单位】 北京工商大学计算机与信息工程学院;
【文献出处】 计算机应用研究 , Application Research of Computers, 编辑部邮箱 2017年 02期  
期刊荣誉:中文核心期刊要目总览  ASPT来源刊  中国期刊方阵  CJFD收录刊
【中文关键词】 CTR预估; 特征提取; 互联网广告; Hadoop大数据平台; GBDT;
【英文关键词】 CTR prediction; feature extraction; Internet advertising; Hadoop big data platform; GBDT;
【摘要】 互联网广告是一个具有上千亿元规模的市场,广告的点击率(CTR)是互联网广告投放效果的重要指标。在广告点击率预估模型中,特征提取是关键因素,特征的好坏直接影响到最终模型的效果。针对如何提高广告点击率预估效率问题,在Hadoop大数据平台环境中,提出了基于梯度提升决策树(gradient boost decision tree,GBDT)模型的多维特征提取方法。该方法利用原始数据构建多维基础特征库,并将基础特征库中除ID类特征以外的其余特征输入GBDT模型进行特征刷选,得到高层特征,进一步进行分类。该方法的使用不仅减少了特征提取的人工成本和时间成本,也在很大程度上提升了模型的精度。
【英文摘要】 Internet advertising is a hundreds of billions of dollars of market. CTR( click-through-rate) is an important indicator of the effectiveness of Internet advertising. In the CTR prediction model,features are used to be a key factor to the success or failure of many machine learning projects and the characteristics of the feature will directly affect the final model. In order to make the Internet advertisement CTR prediction model can be more accurate,this paper put forward a GBDT-based multidimensional featu...
【基金】 北京市自然科学基金重点项目B类(KZ201410011014);北京市自然科学基金青年项目(9164025); 2015年研究生科研能力提升计划资助项目; 国家教育部人文社会科学研究青年基金资助项目(15YJCZH224)
【更新日期】 2017-03-22
【分类号】 TP311.13
【正文快照】 0引言互联网广告点击率(click through rate,CTR)是指在给定网页和用户的情况下,估计所投放的广告被点击次数占展示总次数的比例[1]。随着新一代信息技术的飞速发展,大数据平台技术已成为技术发展的重要支撑之一。近年来,互联网、物联网、云计算、三网融合等IT与通信技术迅猛发

xxx
【读者推荐文章】中国期刊全文数据库 中国博士学位论文全文数据库 中国优秀硕士学位论文全文数据库
【相似文献】
中国期刊全文数据库
中国优秀硕士学位论文全文数据库
中国博士学位论文全文数据库
中国重要会议论文全文数据库
中国重要报纸全文数据库
中国学术期刊网络出版总库
点击下列相关研究机构和相关文献作者,可以直接查到这些机构和作者被《中国知识资源总库》收录的其它文献,使您全面了解该机构和该作者的研究动态和历史。
【文献分类导航】从导航的最底层可以看到与本文研究领域相同的文献,从上层导航可以浏览更多相关领域的文献。

工业技术
  自动化技术、计算机技术
   计算技术、计算机技术
    计算机软件
     程序设计、软件工程
      程序设计
       数据库理论与系统
  
 
  CNKI系列数据库编辑出版及版权所有:中国学术期刊(光盘版)电子杂志社
中国知网技术服务及网站系统软件版权所有:清华同方知网(北京)技术有限公司
其它数据库版权所有:各数据库编辑出版单位(见各库版权信息)
京ICP证040431号    互联网出版许可证 新出网证(京)字008号