节点文献

一种基于WordNet的短文本语义相似性算法

An Algorithm for Semantic Similarity of Short Text Based on WordNet

  • 推荐 CAJ下载
  • PDF下载
  • 不支持迅雷等下载工具,请取消加速工具后下载。

【作者】 翟延冬王康平张东娜黄岚周春光

【Author】 ZHAI Yan-dong1,WANG Kang-ping1,2,ZHANG Dong-na1,HUNAG Lan1,2,ZHOU Chun-guang1,2(1.College of Computer Science and Technology,Jilin University,Changchun,Jilin 130012,China;2.Key Laboratory of Symbolic Computation and Knowledge Engineering of Ministry of Education,Jilin University,Changchun,Jilin130012,China)

【机构】 吉林大学计算机科学与技术学院吉林大学符号计算与知识工程教育部重点实验室

【摘要】 短文本语义相似性计算在文献检索、信息抽取、文本挖掘等方面应用日益广泛.本文提出了一种短文本语义相似性计算算法ST-CW.此算法使用WordNet和Brown文集来计算文本中的概念相似性,在此基础上提出了一个新的方法综合考虑概念、句法等信息来计算短文本的语义相似性.在R&B及Miller数据集上进行实验,实验结果验证了算法的有效性.

【Abstract】 The algorithm for semantic similarity of short text is used widely in document retrieval,information extraction and text mining.An algorithm for semantic similarity of short text named ST-CW is presented.The algorithm calculates semantic similarity of concept based on WordNet and The Brown Corpus,and then a formula is presented which refers to both concept similarity and syntactic information in short text.The evaluations are conducted on R&B and Miller dataset.

【基金】 国家自然科学基金项目资助(No.61175023,No.60903097)
  • 【文献出处】 电子学报 ,Acta Electronica Sinica , 编辑部邮箱 ,2012年03期
  • 【分类号】TP391.1
  • 【被引频次】88
  • 【下载频次】1149
节点文献中: 

本文链接的文献网络图示:

本文的引文网络