首页> 中国专利> 一种同主题文本集合中多文本摘要获取方法

一种同主题文本集合中多文本摘要获取方法

摘要

本发明涉及一种同主题文本集合中多文本摘要获取方法,首先通过对文本进行预处理,包括分词,停用词处理,特征选择,降维等;下一步,利用处理之后的特征词构造空间向量模型,生成距离矩阵;然后在聚类方法中加入样本密度排序的方法,以中心向量为圆心,用向量空间中特征值距离的平均值为半径构造圆,根据圆内排序好的文本内容相似度生成的样本密度来自动确定初始聚类中心,从而自动发现文档集合中的潜在对应的子主题集合的数量;生成对应的子主题集之后,方法对已聚类的子主题文本进行有监督的训练,对句子进行评分,标记,从不同的子主题中抽取中心句作为多文本的摘要,最后,方法输出摘要的内容;提高了多文本摘要的质量。

著录项

  • 公开/公告号CN108595411A

    专利类型发明专利

  • 公开/公告日2018-09-28

    原文格式PDF

  • 申请/专利权人 南京邮电大学;

    申请/专利号CN201810223876.0

  • 申请日2018-03-19

  • 分类号

  • 代理机构南京经纬专利商标代理有限公司;

  • 代理人田凌涛

  • 地址 210023 江苏省南京市栖霞区文苑路9号

  • 入库时间 2023-06-19 06:35:45

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-10-26

    实质审查的生效 IPC(主分类):G06F17/27 申请日:20180319

    实质审查的生效

  • 2018-09-28

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号