节点文献

一种基于统计信息的无字典中文文本特征提取算法

A No-Dictionary Algorithm Based on Statistical Information for Chinese Text Characters

  • 推荐 CAJ下载
  • PDF下载
  • 不支持迅雷等下载工具,请取消加速工具后下载。

【作者】 齐攀陈晓云

【机构】 兰州大学信息科学与工程学院

【摘要】 <正>1引言当前,无论是文本挖掘技术还是搜索引擎技术,它们的处理基本上都遵循同一个前提,就是将待处理文本特征化,即用能表达文本基本含义的文本特征集合或向量来代表原文本。

【Abstract】 Considering some faults of current Chinese words syncopation based dictionary.we present an algorithm for Chinese text characters,which is based on concerned statistical information,not on dictionary.Through describing and analyzing it,you will find out,in some ways,the algorithm is better than dictionary-based ones.

【基金】 甘肃省自然科学基金资助(项目号:25021-A25-014-G).
  • 【会议录名称】 第二十届全国数据库学术会议论文集(技术报告篇)
  • 【会议名称】第二十届全国数据库学术会议
  • 【会议时间】2003-10-10
  • 【会议地点】中国湖南长沙
  • 【分类号】TP391.1
  • 【主办单位】中国计算机学会数据库专业委员会
节点文献中: 

本文链接的文献网络图示:

本文的引文网络