节点文献
一种不良文本识别特征选择方法
Feature selection for illegitimate contents recognition
【摘要】 针对不良文本的特殊性,提出一种两步特征选择方法。首先对训练文本用有限自动机识别其中的特殊词作为特征加入特征集,同时将原文还原为不含特殊词的文本。对还原后文本用"组合特征选择方法"选择特征加入特征集。实验结果表明利用两步特征选择方法能有效提高非法文本识别精度。
【Abstract】 To describe a two-steps fearture selection method.Firstly,recognise all the special words from the training texts by fi-nite accepter and add it to the final feature set,recover the original text as well.Then select features from the processed texts and add them to the feature set by the way o’fconbination feature selection method’.The experiment result shows that it can im-prove the precision of the illegitimate contents recognition
【关键词】 特殊词;
有限自动机;
特征选择;
不良文本识别;
【Key words】 special words; finite accepter; feature selection; illegitimate contents recognition;
【Key words】 special words; finite accepter; feature selection; illegitimate contents recognition;
【基金】 国家自然科学基金(No.60475022)~~
- 【文献出处】 计算机工程与应用 ,Computer Engineering and Applications , 编辑部邮箱 ,2010年02期
- 【分类号】TP391.1
- 【被引频次】1
- 【下载频次】165