中国学术期刊网络出版总库
  关闭
基于POS-CBOW语言模型的相似词分析  
   推荐 CAJ下载 PDF下载
【英文篇名】 Similar words analysis based on POS-CBOW language model
【下载频次】 ★★★★★
【作者】 阮冬茹; 潘洪岩; 高凯;
【英文作者】 RUAN Dongru; PAN Hongyan; GAO Kai; School of Information Science and Engineering; Hebei University of Science and Technology;
【作者单位】 河北科技大学信息科学与工程学院;
【文献出处】 河北科技大学学报 , Journal of Hebei University of Science and Technology, 编辑部邮箱 2015年 05期  
期刊荣誉:中文核心期刊要目总览  ASPT来源刊  CJFD收录刊
【中文关键词】 自然语言处理; 语言模型; 词向量; 相似词; POS-CBOW;
【英文关键词】 natural language processing; language model; word vector; similar words; POS-CBOW;
【摘要】 相似词分析是自然语言处理领域的研究热点之一,在文本分类、机器翻译和信息推荐等领域中具有重要的研究价值和应用意义。针对新浪微博短文本的特点,给出一种带词性的连续词袋模型(POS-CBOW)。该模型在连续词袋模型的基础上加入过滤层和词性标注层,对空间词向量进行优化和词性标注,通过空间词向量的余弦相似度和词性相似度来判别词向量的相似性,并利用统计分析模型筛选出最优相似词集合。实验表明,基于POS-CBOW语言模型的相似词分析算法优于传统CBOW语言模型。
【英文摘要】 Similar words analysis is one of the important aspects in the field of natural language processing,and it has important research and application values in text classification,machine translation and information recommendation.Focusing on the features of Sina Weibo's short text,this paper presents a language model named as POS-CBOW,which is a kind of continuous bag-of-words language model with the filtering layer and part-of-speech tagging layer.The proposed approach can adjust the word vectors' similarity a...
【基金】 河北省社会科学发展研究课题资助项目(2015030344)
【更新日期】 2015-11-03
【分类号】 TP391.1
【正文快照】 相似词分析是近些年自然语言处理领域的研究热点之一,在文本分类、机器翻译以及信息推荐等领域中有着广泛应用。目前相似词的分析大都需要人为干预为主的方法,借助人工标注词典来设定词的相似性。但是随着社交网络中网络新词的不断涌现,基于人工标注的方法已无法完成庞大的标注

xxx
【读者推荐文章】中国期刊全文数据库 中国博士学位论文全文数据库 中国优秀硕士学位论文全文数据库 中国重要会议论文全文数据库
【相似文献】
中国期刊全文数据库
中国优秀硕士学位论文全文数据库
中国博士学位论文全文数据库
中国重要会议论文全文数据库
中国重要报纸全文数据库
中国学术期刊网络出版总库
点击下列相关研究机构和相关文献作者,可以直接查到这些机构和作者被《中国知识资源总库》收录的其它文献,使您全面了解该机构和该作者的研究动态和历史。
【文献分类导航】从导航的最底层可以看到与本文研究领域相同的文献,从上层导航可以浏览更多相关领域的文献。

工业技术
  自动化技术、计算机技术
   计算技术、计算机技术
    计算机的应用
     信息处理(信息加工)
      文字信息处理
  
 
  CNKI系列数据库编辑出版及版权所有:中国学术期刊(光盘版)电子杂志社
中国知网技术服务及网站系统软件版权所有:清华同方知网(北京)技术有限公司
其它数据库版权所有:各数据库编辑出版单位(见各库版权信息)
京ICP证040431号    互联网出版许可证 新出网证(京)字008号