节点文献
中文分词技术的研究及在Nutch中的实现
【摘要】 研究了中文分词技术的原理,比较了现有分词器的速度和准确性。通过研究开源搜索引擎Nutch的架构和工作流程,分析了源代码,在Nutch加入JE中文分词器,实现了Nutch的本土化。
【基金】 河北省科技支撑计划项目资助(10213557)
- 【文献出处】 科技信息 ,Science & Technology Information , 编辑部邮箱 ,2011年19期
- 【分类号】TP391.1
- 【被引频次】7
- 【下载频次】137