首页> 中文期刊> 《计算机工程》 >基于语言模型和特征分类的抄袭判定

基于语言模型和特征分类的抄袭判定

         

摘要

信息时代作者版权的保护问题已受到越来越多的关注.针对部分小说存在的文本大面积相似问题,提出基于语言模型和特征分类的方法.统计文本二元~六元的语言模型并且绘制拓扑图,通过计算重合概率和词性比来分析词语的重合程度和语法信息,在此基础上利用主成分分析和随机森林的方法,进行分类判别.机器学习的结果表明,该方法能够有效地鉴别小说是否存在抄袭现象.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号