节点文献
基于话题模型的科技文献话题发现和趋势分析
Topic Discovery and Trend Analysis in Scientific Literature Based on Topic Model
【Author】 He Liang,Li Fang School of Electronic Information and Electrical Engineering,Shanghai Jiao Tong University,Shanghai 200240
【机构】 上海交通大学计算机科学与工程系中德语言技术联合实验室;
【摘要】 自动挖掘科技文献话题,总结研究领域的发展趋势及最新研究动态,能给科技工作者的研究工作提供帮助。本文提出一种话题发现和趋势分析的方法,该方法首先利用LDA话题模型抽取科技文献的话题,然后计算话题的强度和影响力,最后研究话题的趋势变化。本文提出了可以针对任何文集的话题强度和影响力的计算方法,对热门和冷门话题以及影响力高和影响力低的话题分别进行了趋势分析。对ACL论文集进行实验,结果显示了计算语言学领域的一些发展状况且验证了话题强度和影响力的计算方法是可行的。
【Abstract】 Automatically extracting effective information from scientific literature and sum up the research trends and shifts, which can provide a great convenience for scientists.In this paper,we use LDA model to generate topics from the scientific literature;then calculate the strength and impact of the topic;finally,find the trends of topics.The method is suitable for any documents to calculate topic strength and topic impact The trends of hot topics,cold topics,high impact topics and low impact topics are analyzed.The experiments on ACL anthology have shown the trend of computational linguistics and also proved the proposed calculating method
- 【会议录名称】 中国计算语言学研究前沿进展(2009-2011)
- 【会议名称】第十一届全国计算语言学学术会议
- 【会议时间】2011-08-20
- 【会议地点】中国河南洛阳
- 【分类号】TP391.1
- 【主办单位】中国中文信息学会