节点文献
基于向量空间模型的科技文献自动分类研究
Research on Vector Space Model-based Automatic Classification of Sci-tech Document
【摘要】 提出一种基于向量空间模型的科技文献自动分类方法。首先构建分类代表文本,计算单文本与分类代表文本之间的相似度;然后利用训练集计算出分类归属度,以判断某一文本分类的可能性,实现科技文献的自动分类。以3个学科的文献为例,验证该方法的可用性。
【Abstract】 The paper gives an automatic classification method of sci-tech document basing on vector space model. Firstly it constructs classification representative text and computes degree of similarity between single text and classification representative text; then it uses training set to calculate membership degree of classification, so as to estimate possibility of text classification and realize automatic classification of sci-tech document. The paper takes document of three disciplines for example to verify usability of this method.
【关键词】 向量空间模型;
科技文献;
自动分类;
【Key words】 vector space model; sci-tech document; automatic classification;
【Key words】 vector space model; sci-tech document; automatic classification;
【基金】 国家自然科学基金委—中国科学院联合资助项目“合成生物学发展战略研究”(项目编号:Y23BI21021)成果之一
- 【文献出处】 情报探索 ,Information Research , 编辑部邮箱 ,2013年12期
- 【分类号】TP391.1
- 【被引频次】5
- 【下载频次】146