【英文题名】
Research on Several Key Problems of Ensemble Learning Algorithms
【作者】
王清 ;
【导师】
张亮 ;
【学位授予单位】
复旦大学 ;
【学科专业名称】
计算机软件与理论
【学位年度】
2011
【论文级别】
博士
【网络出版投稿人】
复旦大学
【网络出版投稿时间】
2011-10-21
【关键词】
集成学习 ;
多任务学习 ;
决策树 ;
朴素贝叶斯 ;
随机化 ;
广义逆矩阵 ;
【英文关键词】
ensemble learning ;
multi-task learning ;
decision tree ;
na(i|¨)ve bayes ;
randomization ;
generalized inverse ;
【中文摘要】
分类是机器学习和数据挖掘中的一项重要任务,在现实生活中有着广泛的应用。例如,根据邮件的标题和内容判断其是否为垃圾邮件,根据病人的各项检测指标判断其是否患有某种疾病等。目前已经提出了许多分类学习算法,如决策树、贝叶斯网络、人工神经网络、支持向量机等。
集成学习通过训练若干有差异的学习器,并将它们的预测结果进行合成。相对于单个学习器,集成学习算法在大多数情况下可以显著提高学习系统的泛化能力,因此对集成学习理论和算法的研究一直是机器学习领域的一个重点和热点。
为了构造一个强的集成学习系统,现在一般认为,集成中各个体学习器应该具有较高的精度并且个体之间具有较高的差异度。目前已经提出了许多集成方法,如Bagging、AdaBoost、Random Subspace、Random Forest等。虽然这些算法获得了广泛的关注,并在许多现实的应用中取得了良好的效果,但是仍然存在许多关键问题需要改进和完善,其中包括:Bagging算法只适用于不稳定的分类器;AdaBoost算法容易过拟合有噪声的训练数据因而健壮性较差,同时不支持并行化;Random Subspace仅适用于含有大量冗余特征的数据;对于一些特定...
【英文摘要】
Classification is one of the most important tasks in machine learning and data mining, and is widely used in real world applications. For example, it can be used to judge whether an email is junky or not according to its title and content; to judge whether a patient is positive or not according to his or her clinical measurements, etc. Many classification algorithms have been proposed, such as decision tree, bayesian network, neural network, support vector machine, etc.
Ensemble learning algorithms trai...
【更新日期】
2012-02-24
【相同导师文献】
导师:张亮 导师单位:复旦大学 学位授予单位:复旦大学
[1] 汤瀑.物联网服务组合与验证的研究 [D]. 复旦大学,2013
[2] 王龙.基于WSDL扩展的Web服务组合研究与实现 [D]. 复旦大学,2013
[3] 吴海双.IaaS云计算环境中基于SLA的资源动态管理研究 [D]. 复旦大学,2013
[4] 周征奇.一种基于本体的复杂场景业务流程运行时不确定性处理方法 [D]. 复旦大学,2012
[5] 李欣刚.基于Jbpm的问卷驱动工作流配置管理技术 [D]. 复旦大学,2012
[6] 李杰辉.基于云计算技术的化合物相似性分析系统 [D]. 复旦大学,2012
[7] 陈彦光.以数据为中心的工作流工程化研究 [D]. 复旦大学,2012
[8] 刘伟.基于WSDL的Web服务可替换性验证研究 [D]. 复旦大学,2012
[9] 刘光熠.关于不确定性数据置信度算法的研究 [D]. 复旦大学,2010
[10] 李鹏.电子商务中非可信主体间的交易撮合 [D]. 复旦大学,2011
【相似文献】
中国期刊全文数据库
中国优秀硕士学位论文全文数据库
中国博士学位论文全文数据库
中国重要会议论文全文数据库
中国重要报纸全文数据库
中国学术期刊网络出版总库
点击下列相关研究机构和相关文献作者,可以直接查到这些机构和作者被《中国知识资源总库》收录的其它文献,使您全面了解该机构和该作者的研究动态和历史。
【文献分类导航】从导航的最底层可以看到与本文研究领域相同的文献,从上层导航可以浏览更多相关领域的文献。