【英文题名】
Research of Disambiguation of Internet People Information Technology
【作者】
马二磊 ;
【导师】
刘远超 ;
【学位授予单位】
哈尔滨工业大学 ;
【学科专业名称】
计算机科学与技术
【学位年度】
2010
【论文级别】
硕士
【网络出版投稿人】
哈尔滨工业大学
【网络出版投稿时间】
2011-03-08
【关键词】
排歧 ;
社会网络 ;
领域分类 ;
社会属性 ;
特征库 ;
【英文关键词】
Disambiguation ;
Social Network ;
Area classification ;
Social attributes ;
Features Library ;
【中文摘要】
随着Internet及其相关技术的飞速发展,WWW已成为最大的信息集散地。无论对企业还是个人,Web逐渐成为最主要的信息来源。然而由于网站数量过多以及由此带来的信息泛滥,使得有用信息的获取越来越困难,搜索引擎只能提供信息的查找范围,而具体的内容还要靠详细搜查。在人物信息查询的时候,返回的信息比较庞大,还有太多的重复,并且信息准确度不高。为此,建立人物信息排歧系统,目的在于使用户更快、更方便的得到所需信息,并且最终结果简单、精炼、美观。
本文利用不同的人物处于不同的领域这个特性,将人物文档信息分为文娱、行政、军事、科教、体育、医疗、经济等七个类别,避免了不同领域人物之间的信息处理,提高了系统的效率,并且根据这种方法进行预分类,召回率很高,确保了不同领域人物信息不会进行交叉,从而减少了在后续的处理中不同领域人物信息聚为一类的错误。
本文实现了利用社会网络和上下文信息进行结合的人物排歧处理。单用社会网络或者是上下文信息都不能很好的进行人物信息排歧,用社会网络会出现通篇只有一个人名或者其社会网络非常小等情况,不能很好的进行聚类处理,用上下文信息,文档中的上下文有时不能很好的说明人物特性,处理效果不是很...
【英文摘要】
With the development of Internet and its relative technology, the WWW has become the largest information area. For the enterprise or the individual, web becomes the main information source gradually. However, because of too many web sites and the information overflow resulting from this, it is more and more difficult to obtain useful information. When searching for person information, you will gain huge information and too much duplication, and the accuracy is not high. So, the person information extraction...
【更新日期】
2011-04-29
【相同导师文献】
导师:刘远超 导师单位:哈尔滨工业大学 学位授予单位:哈尔滨工业大学
[1] 陈仲安.面向新闻文本的评论生成技术研究 [D]. 哈尔滨工业大学,2023
[2] 李浩.基于神经网络的新闻评论条件生成技术 [D]. 哈尔滨工业大学,2023
[3] 李晓辰.风格和情感控制的中国古诗生成 [D]. 哈尔滨工业大学,2022
[4] 韩迦为.基于细颗粒度情感分析的作文评分以及评语自动生成系统 [D]. 哈尔滨工业大学,2022
[5] 王晓伟.基于维度分组的多样化用户评论生成研究 [D]. 哈尔滨工业大学,2022
[6] Haidi Said Abdelhamid Ahmed Mansour.使用机器学习模型预测COVID-19推文的情绪 [D]. 哈尔滨工业大学,2022
[7] 贾子航.社交媒体中属性级情感分析研究 [D]. 哈尔滨工业大学,2022
[8] 张博彦.新闻评论中的隐式情感分析技术研究 [D]. 哈尔滨工业大学,2021
[9] 刘瑶瑶.建议挖掘及生成关键技术研究 [D]. 哈尔滨工业大学,2021
[10] 张义策.结合观点评价词的属性级情感分析研究 [D]. 哈尔滨工业大学,2020
【相似文献】
中国期刊全文数据库
中国优秀硕士学位论文全文数据库
中国博士学位论文全文数据库
中国重要会议论文全文数据库
中国重要报纸全文数据库
中国学术期刊网络出版总库
点击下列相关研究机构和相关文献作者,可以直接查到这些机构和作者被《中国知识资源总库》收录的其它文献,使您全面了解该机构和该作者的研究动态和历史。
【文献分类导航】从导航的最底层可以看到与本文研究领域相同的文献,从上层导航可以浏览更多相关领域的文献。