节点文献
Web内容挖掘技术研究
Research on Web Content Mining
【摘要】 简要介绍了Web挖掘的概念、分类以及其功能,阐述了Web挖掘与传统数据挖掘以及Web信息检索之间的关系。给出了Web内容挖掘的不同分类方法、文本以及多媒体文本数据挖掘的定义、分类与应用。重点分析了Web文本挖掘的方法,包括文本的特征表示与抽取、文本的分类与聚类等,讨论了多媒体文本分类挖掘方法。
【Abstract】 This paper briefly introduces the conception of web mining,including the taxonomy and function,and discusses the relationship between information mining and retrieval on the web,and the difference between web mining and data mining.Then definition and classifications and applications of web text data mining are given,including a taxonomy of content mining.The method of text mining on web are discussed in detail,including text categorization and text clustering,etc.It discusses multimedia text data categorization and its alteration
【关键词】 Web挖掘;
Web内容挖掘;
文本的分类;
文本聚类;
多媒体文本挖掘;
【Key words】 Web Mining; Web Content Mining; Text Categorization; Text Clustering; Multimedia Text Mining;
【Key words】 Web Mining; Web Content Mining; Text Categorization; Text Clustering; Multimedia Text Mining;
【基金】 国家自然科学基金重大项目(79990580);国家"973"重点基础研究发展项目(G1998030414)
- 【文献出处】 计算机应用研究 ,Application Research of Computers , 编辑部邮箱 ,2003年11期
- 【分类号】TP393.09
- 【被引频次】85
- 【下载频次】1040