首页> 中文会议>中国中文信息学会二十五周年学术会议 >基于改进型Dotplotting的文本分割模型

基于改进型Dotplotting的文本分割模型

摘要

Dotplotting是文本分割领域的著名算法,本文在对Dotplotting算法改进的基础上,提出了MMS模型.原始的Dotplotting算法仅考虑了语义段落间相似度来进行分割,而MMS模型综合考虑语义段落内部相似度和语义段落间相似度两方面信息,认为段内相似度越大,段间相似度越小,则分割越理想.其他因素如语义段落长度和句子距离对相似度的影响也加入分割模型,来提高分割的准确率.实验结果表明,与原始Doplotting模型和Dotplotting框架下的其他模型相比,MMS模型取得了更好的Pk值评价性能.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号