中国优秀硕士学位论文全文数据库
  关闭
基因表达数据挖掘方法研究  
   在线阅读 整本下载 分章下载 分页下载本系统暂不支持迅雷或FlashGet等下载工具
【英文题名】 Study of Data Mining Methods for Gene Express Analysis
【作者】 谷耀军;
【导师】 何东健; 张阳;
【学位授予单位】 西北农林科技大学;
【学科专业名称】 计算机应用技术
【学位年度】 2008
【论文级别】 硕士
【网络出版投稿人】 西北农林科技大学
【网络出版投稿时间】 2008-10-27
【关键词】 基因表达数据; 数据挖掘; 特征选择; 支持向量机; SVM法线算法;
【英文关键词】 gene expression profiles; data mining; feature selection; support vector machine; SVM normal algorithm;
【中文摘要】 DNA芯片技术近年来得到蓬勃发展,每天都有大量的DNA序列数据涌现。海量的生物信息数据库中隐藏着与生理学和医药学有关的重要信息,因此,采用有效的手段从海量生物信息数据库中找出影响样本类别的特征基因,实现致病基因的准确识别,对疾病的诊断和治疗有重要的意义。 针对基因表达数据量大、维数高、样本少、非线性,导致分类器计算复杂度高、计算时间长,最终分类效果并不理想的问题,论文以Leukemia、Colon和Prostate 3种常见病例基因表达数据为研究对象,重点研究基于支持向量机的基因表达数据分类方法,SVM法线、信息增益和χ~2统计3种特征基因选择算法;并根据独立测试和10-折交叉验证结果对分类器性能进行评价。为快速准确地诊断、识别基因表达数据类别提供技术依据。主要工作和结论如下: (1)针对分类分析中分类器的选取,通过比较支持向量机和k最近邻域、决策树、贝叶斯、人工神经网络特点与原理,以3种基因表达谱数据集为实验对象,比较了5种分类算法的分类效果。实验结果表明,SVM算法的准确率高于其他算法,并且SVM分类器中的线性核表现更为突出,线性SVM在3个数据集上的独立测试分类准确率分别...
【英文摘要】 DNA chip technology has been booming recently, plenty of DNA sequence data have emerged every day. Some important information of physiology and medicine has been hidden in massive databases of biological information, therefore, adopting the effective means to find out the feature gene which affects classification from the massive databases of biological information, realizing the diagnose that pathopoiesia gene could be distinguished accurately, that will be beneficial to the disease and treats. ...
【更新日期】 2008-11-11

xxx
【读者推荐文章】中国期刊全文数据库 中国博士学位论文全文数据库 中国优秀硕士学位论文全文数据库 中国重要会议论文全文数据库
【相似文献】
中国期刊全文数据库
中国优秀硕士学位论文全文数据库
中国博士学位论文全文数据库
中国重要会议论文全文数据库
中国重要报纸全文数据库
中国学术期刊网络出版总库
点击下列相关研究机构和相关文献作者,可以直接查到这些机构和作者被《中国知识资源总库》收录的其它文献,使您全面了解该机构和该作者的研究动态和历史。
【文献分类导航】从导航的最底层可以看到与本文研究领域相同的文献,从上层导航可以浏览更多相关领域的文献。

生物科学
  分子生物学
   分子遗传学
  
 
  CNKI系列数据库编辑出版及版权所有:中国学术期刊(光盘版)电子杂志社
中国知网技术服务及网站系统软件版权所有:清华同方知网(北京)技术有限公司
其它数据库版权所有:各数据库编辑出版单位(见各库版权信息)
京ICP证040431号    互联网出版许可证 新出网证(京)字008号