【英文题名】
Study on Text Classification Algorithms Based on SVMs
【作者】
秦玉平 ;
【导师】
王秀坤 ;
【学位授予单位】
大连理工大学 ;
【学科专业名称】
计算机应用技术
【学位年度】
2008
【论文级别】
博士
【网络出版投稿人】
大连理工大学
【网络出版投稿时间】
2009-03-19
【关键词】
支持向量机 ;
文本分类 ;
兼类分类 ;
增量学习 ;
超球 ;
【英文关键词】
Support Vector Machines ;
Text Categorization ;
Multi-Label Classification ;
Incremental Learning ;
Hyper Sphere ;
【中文摘要】
支持向量机作为一种基于统计学习理论的新型机器学习方法,较好地解决了非线性、高维数、局部极小点等实际问题,是机器学习领域新的研究热点。文本分类是基于内容的自动信息管理的核心技术。文本向量稀疏性大、维数高、特征之间具有较大的相关性,支持向量机对于特征相关性和稀疏性不敏感,处理高维数问题具有较大的优势,因此,支持向量机在文本分类中具有很大的应用潜力。但是,由于文本分类具有类别和样本数目多等特点,因此,支持向量机用于文本分类时仍有许多尚未完全解决的问题。例如,增量学习、兼类分类、训练和分类速度较慢等。本文主要针对支持向量机在文本分类等实际应用中存在的一些问题进行深入研究,主要工作如下:
1.对支持向量机兼类分类算法进行了研究。针对规模较小、类别数较多的兼类样本集,提出了一种基于l-a-r方法的兼类分类算法。该算法用l-a-r方法训练模糊子分类器,对待分类样本,通过子分类器得到其对应的隶属度向量,依据隶属度向量判定其所属类别。针对规模较大、类别数较少的兼类样本集,提出了一种基于l-a-l方法的兼类分类算法。该算法用l-a-l方法训练模糊子分类器,对于待分类样本,通过子分类器得到其对应隶属度矩阵,依据隶...
【英文摘要】
Support vector machines (SVMs), as a new machine learning method based on statistical learning theory, have attracted more and more attention and became a hot issue in the field of machine learning, because they can well resolve such practical problems as nonlinearity, high dimension and local minima. Text categorization is a key technique in content-based automatic information management. Text vectors are high dimensional and extremely sparse, and have numbers of relevant features. SVMs are particula...
【更新日期】
2009-04-08
【相同导师文献】
导师:王秀坤 导师单位:大连理工大学 学位授予单位:大连理工大学
[1] 朱秋如.新疆职业大学教学设备管理系统的设计与实现 [D]. 大连理工大学,2018
[2] 董烨.新疆兵团医院健康体检管理系统的设计与实现 [D]. 大连理工大学,2018
[3] 方静.乌鲁木齐银行网上招聘考试系统的设计与实现 [D]. 大连理工大学,2018
[4] 魏婷.新医大二附院中医药科研管理系统设计与实现 [D]. 大连理工大学,2018
[5] 刘洋.国网营口供电公司客户管理系统的设计与实现 [D]. 大连理工大学,2018
[6] 薛坤宇.高校在线备课及课堂互动系统设计与实现 [D]. 大连理工大学,2018
[7] 王泓程.辽阳市电网数据采集与监测系统的设计与实现 [D]. 大连理工大学,2018
[8] 俞超飞.腾讯公司手机设备管理系统设计与实现 [D]. 大连理工大学,2016
[9] 姜冰.雷达调试车间计划执行系统的设计与实现 [D]. 大连理工大学,2016
[10] 阎静辉.集装箱码头无线终端操作系统的设计与实现 [D]. 大连理工大学,2016
【相似文献】
中国期刊全文数据库
中国优秀硕士学位论文全文数据库
中国博士学位论文全文数据库
中国重要会议论文全文数据库
中国重要报纸全文数据库
中国学术期刊网络出版总库
点击下列相关研究机构和相关文献作者,可以直接查到这些机构和作者被《中国知识资源总库》收录的其它文献,使您全面了解该机构和该作者的研究动态和历史。
【文献分类导航】从导航的最底层可以看到与本文研究领域相同的文献,从上层导航可以浏览更多相关领域的文献。