节点文献

中文文档与源代码间关联关系提取方法的研究

Retrieval Method for Traceability Links between Source Code and Chinese Documentation

  • 推荐 CAJ下载
  • PDF下载
  • 不支持迅雷等下载工具,请取消加速工具后下载。

【作者】 韩晓东王晓博刘超

【Author】 Han Xiao-dong Wang Xiao-bo Liu Chao School of Computer Science and Engineering,BeiHang University,Beijing,100191,China

【机构】 北京航空航天大学计算机学院

【摘要】 软件包括软件文档和源程序代码,发现和维护软件文档与源代码间的关联关系,对程序理解、软件维护、需求跟踪等许多软件工程活动提供很大的帮助。本文提出了一种提取中文软件文档与源代码间的关联关系的方法,根据中文软件文档和源代码的特征,在潜在语义索引模型的基础上使用了三种策略:引入项目数据词典辅助中文分词和中英文的翻译、将文档按类型分层以实现反馈、调整代码中的特征项的权值。实验结果表明,三种策略可以在提取阀值C相同的情况下,提高查全率10%~30%;在查全率不变的情况下提高查准率5%~20%。

【Abstract】 Software includes software documentation and source code.So the discovery and maintenance of the relationship between software documentation and source code give great help to program comprehension,software maintenance,requirements traceability and many other activities.In this paper,we propose a retrieval method for traceability links between source code and Chinese documentation,according to several features of Chinese software documents and source code.Based on the latent semantic indexing model,we use three strategies to improve:hierarchical enhancement,identifiers classifying,data dictionary.Experimental results show that the three strategies could increase the recall by 10% to 30% under the same extracted threshold and the precision by 5% to 20% under the same recall.

【基金】 国家高技术研究发展计划(863计划),课题编号:2007AA010302;自然基金项目(90718018)
  • 【会议录名称】 全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(下册)
  • 【会议名称】全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议
  • 【会议时间】2009-07-17
  • 【会议地点】中国广西南宁
  • 【分类号】TP311.52
  • 【主办单位】中国仪器仪表学会(CIS)、中国系统仿真学会(CSSS)、中国仪器仪表学会微型计算机应用学会(CACIS)、中国系统仿真学会复杂系统建模与仿真计算专业委员会筹备处(CSSC)
节点文献中: 

本文链接的文献网络图示:

本文的引文网络