节点文献

基于检索历史上下文的个性化查询重构技术研究

Personalized Query Reformulation based on Context in User Search History

  • 推荐 CAJ下载
  • PDF下载
  • 不支持迅雷等下载工具,请取消加速工具后下载。

【作者】 宋巍张宇刘挺李生

【Author】 SONG Wei,ZHANG Yu,LIU Ting,LI Sheng Information Retrieval Lab,Harbin Institute of Technology,Harbin,150001

【机构】 哈尔滨工业大学信息检索研究室

【摘要】 基于检索历史隐式地学习用户偏好是个性化检索研究的热点,而根据用户检索历史重构新的查询输入是其中主要的研究内容。已有的研究在利用检索历史进行查询重构时,通常不区分检索历史中的内容是否与当前查询相关,而是将全部检索历史视为整体,因而使重构后的查询含有较多噪声。本文基于相关词语在上下文中大量共现的特征,将用户历史检索结果的网页摘要作为上下文语境,结合用户点击,选择检索历史中与当前查询共现程度最高的词语重构查询模型。对初始检索结果重排序的实验表明,该方法可以有效地选择相关词语,减少噪声。用p@5和NDCG两种指标评价,比最好的基准系统分别相对提高12.8%和7.2%,比初始排序结果相对提高26.0%和11.4%。

【Abstract】 Learning user preference implicitly is a hot research topic for personalized search and query model reformulation based on user search history is a key problem.Existing work consider the search history as a whole without distinguishing whether it is relevant to current query.Much noisy may be brought in due to that.In this paper,we assumed the relevant terms pretend to co-occurrence in context,viewed each past snippet as a context and modeled user clicks to select the terms most relevant to the whole query to reformulate query model for search results reranking.The experiment results show that the algorithm can select relevant terms and reduce noisy.With the evaluating metric p@5 and NDCG,the system achieves a relative improvement by 12.8%and 7.2%respectively against the best baseline system,26.0%and 11.4%compared to the original ranking.

【基金】 国家自然科学基金重点项目,60736044;国家自然科学基金面上项目,60675034863;计划探索类专题项目,2008AA01Z144
  • 【会议录名称】 第五届全国信息检索学术会议论文集
  • 【会议名称】第五届全国信息检索学术会议
  • 【会议时间】2009-11-14
  • 【会议地点】中国上海
  • 【分类号】TP391.3
  • 【主办单位】中国中文信息学会信息检索与内容安全专业委员会
节点文献中: 

本文链接的文献网络图示:

本文的引文网络