中国优秀硕士学位论文全文数据库
  关闭
决策树分类优化算法的研究  
   在线阅读 整本下载 分章下载 分页下载本系统暂不支持迅雷或FlashGet等下载工具
【英文题名】 The Research on the Algorithms of Optimizing Decision Tree Classification
【作者】 吴绪玲;
【导师】 邓平;
【学位授予单位】 西南交通大学;
【学科专业名称】 计算机应用技术
【学位年度】 2010
【论文级别】 硕士
【网络出版投稿人】 西南交通大学
【网络出版投稿时间】 2011-12-06
【关键词】 数据挖掘; ID3算法; 决策树; 多值偏向; 信息增益; 信息熵;
【英文关键词】 Data Mining; ID3 algorithm; Decision tree; Multi-value bias; Information gain; Information entropy;
【中文摘要】 数据挖掘就是从大量的、不完全的、有噪声的数据中,提取出有效的和潜在规律性信息的过程。数据挖掘的任务就是从数据集中发现模式,它融合了数据库、人工智能,、机器学习、统计学等多个领域的理论和知识。在数据挖掘中,分类和预测是被广泛研究的技术,并且已经广泛地应用于许多领域,对未来商业和人们的生活也将产生深远的影响。决策树方法自20世纪60年代以来,在分类、预测、规则提取等领域有着广泛的应用,其中以Quilan于1986年提出的ID3算法最为著名。本文主要研究决策树ID3算法及其改进。 本文深入研究了ID3算法的理论基础及构建决策树的过程等知识。Quinlan提出的ID3算法虽然很经典,但也有美中不足之处。第一,算法中使用了对数计算,而且计算过程复杂;第二,取值较多的属性被选择的机率比较大,即多值偏向问题。为了解决ID3的这些问题,本文引入了泰勒公式和麦克劳林公式,对原ID3算法进行化简,不仅属性信息增益的计算步骤减少,而且使信息熵的计算公式本身变得十分简洁;对于ID3算法偏向于选取有较多取值的属性的缺点,用一个与属性取值个数相关的函数对简化后的属性信息增益进行修正。通过以上两个方面的优化,新算法在构建决策树的速...
【英文摘要】 Data Mining is a process which extracts effective、potential、regular knowledge and information from the large、incomplete、noisy data. Finding patterns is the task of Data Mining from data sets. Data Mining combines with theory and technology of data warehouse, artificial intelligence, machine learning, statistics and other fields. Classification and prediction technology of Data Mining is widely researched and used in many fields. Consequently, it will produce far-reaching impact on future commercial and peop...
【更新日期】 2012-02-23

【相同导师文献】

导师:邓平    导师单位:西南交通大学    学位授予单位:西南交通大学
[1] 薛红.基于UWB/IMU的井下无轨胶轮车定位算法研究[D]. 西南交通大学,2023
[2] 王鹏辉.基于UWB/IMU融合的隧道行人定位系统设计[D]. 西南交通大学,2023
[3] 曾海涛.基于惯导/里程计/道路匹配融合的胶轮车组合定位技术研究[D]. 西南交通大学,2023
[4] 刘羽翀.基于MEMS/BLE的智能手机室内定位系统设计[D]. 西南交通大学,2023
[5] 卢新泥.基于UWB的隧道环境无轨胶轮车定位技术研究[D]. 西南交通大学,2023
[6] 张振宇.基于机器学习的LOS/NLOS传播路径识别技术研究[D]. 西南交通大学,2022
[7] 张轩铭.蓝牙与惯导融合室内定位算法研究[D]. 西南交通大学,2022
[8] 焦旸.NLOS环境下基于散射体识别的高性能定位算法研究[D]. 西南交通大学,2022
[9] 秦杰.基于智能优化技术的最优化定位算法研究[D]. 西南交通大学,2022
[10] 吴明辉.基于人体运动姿态识别的行人室内惯性导航算法研究[D]. 西南交通大学,2022

xxx
【读者推荐文章】中国期刊全文数据库 中国重要报纸全文数据库 中国博士学位论文全文数据库 中国优秀硕士学位论文全文数据库 中国重要会议论文全文数据库
【相似文献】
中国期刊全文数据库
中国优秀硕士学位论文全文数据库
中国博士学位论文全文数据库
中国重要会议论文全文数据库
中国重要报纸全文数据库
中国学术期刊网络出版总库
点击下列相关研究机构和相关文献作者,可以直接查到这些机构和作者被《中国知识资源总库》收录的其它文献,使您全面了解该机构和该作者的研究动态和历史。
【文献分类导航】从导航的最底层可以看到与本文研究领域相同的文献,从上层导航可以浏览更多相关领域的文献。

工业技术
  自动化技术、计算机技术
   计算技术、计算机技术
    一般性问题
     理论、方法
      算法理论
  
 
  CNKI系列数据库编辑出版及版权所有:中国学术期刊(光盘版)电子杂志社
中国知网技术服务及网站系统软件版权所有:清华同方知网(北京)技术有限公司
其它数据库版权所有:各数据库编辑出版单位(见各库版权信息)
京ICP证040431号    互联网出版许可证 新出网证(京)字008号