节点文献

基因表达数据分析的随机森林方法及算法改进

  • 推荐 CAJ下载
  • PDF下载
  • 不支持迅雷等下载工具,请取消加速工具后下载。

【作者】 武晓岩方庆伟

【机构】 哈尔滨医科大学卫生统计学教研室

【摘要】 <正>对基因表达数据分析的一个重要任务是对样品进行判别分类,即根据已知的基因表达数据建立判别模型,对未知样本进行判别与分类,并希望用较少的基因数目获得较好的分类效果,这对临床诊断、治疗以及对功能基因的研究都有重要的意义。目前有多种基因表达数据的分类方法,如神经网络、支持向量机、自组织作图等,效果各异。最近,应用组合分类器的方法得到了人们重视,即将多个单一分类器的预测模型进行组合,产生一个新的分类器,然后利用它对未知数据进行分类。许多研究表明,组合分类器比单一分类器的分类效果好,随机森林(Random forest)就是一种利用多个分类树对数据进行判别与分类的方法,它可以应用于变量个数远大于样本个数的数据,并且不会产生过拟合现象,在对数据进行分类的同

  • 【会议录名称】 黑龙江省第十次统计科学讨论会论文集
  • 【会议名称】黑龙江省统计学会第七次会员代表大会暨第十次全省统计科学讨论会
  • 【会议时间】2008-02-01
  • 【会议地点】中国黑龙江哈尔滨
  • 【分类号】TP301.6
  • 【主办单位】黑龙江省统计学会
节点文献中: 

本文链接的文献网络图示:

本文的引文网络