|
中国学术期刊网络出版总库
关闭
基于本体的Web生物信息抽取方法研究
 
推荐
CAJ下载
PDF下载
【英文篇名】
Research on Web Biological Information Extraction Method Based on Ontology
【下载频次】
★★★
【作者】
何源
;
【英文作者】
HE Yuan(School of Information Science and Technology
;
HNAU
;
Changsha 410128
;
China)
;
【作者单位】
湖南农业大学信息科学技术学院
;
【文献出处】
计算机与现代化
,
Computer and Modernization
,
编辑部邮箱
2013年 05期
期刊荣誉:ASPT来源刊 CJFD收录刊
【中文关键词】
本体
;
Web
;
信息抽取
;
【英文关键词】
and data retrieval
;
this paper proposes a Web information extraction framework based on ontology.Firstly
;
the framework obtains the Web page which is converted into a well-formed HTML document
;
secondly
;
the document is turned into the DOM tree by making use of the HTML parser
;
then
;
the extraction rules is achieved on the basis of the users' interest data block which is obtained according to the XPath expression.Finally
;
the data is extracted through the OntPMatch algorithm
;
and is stored in RDF data format.The pa...
;
【摘要】
针对传统的基于关键词的搜索与数据检索存在的弊端,本文提出基于本体的Web信息抽取框架。该框架首先获取Web页面,将其转换为格式良好的HTML文档,然后利用HTML解析器将该文档转化为DOM树,再根据XPath表达式获取用户感兴趣的数据块,由此生成抽取规则,最后通过OntPMatch算法实现数据的抽取,并以RDF数据格式储存信息。本文以棉花信息为研究对象加以实证研究,实现Web生物信息数据抽取原型系统,为方便用户发现有价值的Web生物信息资源提供一个有效的工具。
【英文摘要】
Aiming at the malpractice in traditional search field based on
【基金】
湖南农业大学青年科学基金资助项目(11QN23); 湖南省科技厅科技计划项目(2011NK3060)
【更新日期】
2013-07-19
【分类号】
TP311.52
【正文快照】
0引言中国是一个农业大国,农业信息资源乃至生物信息资源与国民经济的发展有着越来越密切的关联,因此,提供准确而全面的生物信息检索对经济可持续发展具有十分重要的意义。随着Internet和生物信息的迅速发展,Web已经成为目前规模最大、内容最丰富的信息源,但由于Web数据缺乏语?
xxx
【相似文献】
中国期刊全文数据库
中国优秀硕士学位论文全文数据库
中国博士学位论文全文数据库
中国重要会议论文全文数据库
中国重要报纸全文数据库
中国学术期刊网络出版总库
点击下列相关研究机构和相关文献作者,可以直接查到这些机构和作者被《中国知识资源总库》收录的其它文献,使您全面了解该机构和该作者的研究动态和历史。
【文献分类导航】
从导航的最底层可以看到与本文研究领域相同的文献,从上层导航可以浏览更多相关领域的文献。
工业技术
自动化技术、计算机技术
计算技术、计算机技术
计算机软件
程序设计、软件工程
软件工程
软件开发
CNKI系列数据库编辑出版及版权所有:中国学术期刊(光盘版)电子杂志社
中国知网技术服务及网站系统软件版权所有:清华同方知网(北京)技术有限公司
其它数据库版权所有:各数据库编辑出版单位(见各库版权信息)
京ICP证040431号
互联网出版许可证 新出网证(京)字008号
参考文献
引证文献
共引文献
同被引文献
二级参考文献
二级引证文献
读者推荐文章
相似文献
相关研究机构
相关文献作者
文献分类导航