首页> 中文会议>第十一届全国软件与应用学术会议(NASAC2012) >基于LDA的软件中文文档与代码间关联关系的提取方法研究

基于LDA的软件中文文档与代码间关联关系的提取方法研究

摘要

软件文档及其程序代码之间的关联性或可追踪性分析是软件分析、理解的重要基础.本文探讨了软件的中文文档和程序代码中蕴含的主题及其相关性.针对软件文档的章节结构和词汇空间,以及程序代码结构、标识符命名空间、注释风格等方面的特点,在LDA模型的基础上提出了一种基于主题词的软件中文文档与代码间关联关系的分析方法.该方法依据词汇的香农信息提取文本段的主题词.实验结果表明,主题词分析方法与LSI模型分析方法相比在查全率和查准率上均有2%到10%的提高.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号