首页> 中文会议>中国中文信息学会二十五周年学术会议 >基于网络化数据挖掘策略的中文多文档自动文摘研究

基于网络化数据挖掘策略的中文多文档自动文摘研究

页面导航

摘要
著录项
相似文献
相关主题

摘要

多文档自动文摘是近期自然语言处理领域的一项热点研究课题.文中提出了一种基于网络化数据挖掘策略的中文多文档自动文摘方法,该方法的特色在于生成的摘要具有全面而简洁的特性,其内容能同时获得主题覆盖和冗余之间的平衡.考虑到同一主题的文档集合其潜在子主题的分布往往符合段落密度特性,提出了以段落为中心的研究方法,利用网络模型来表达段落并模拟段落间的语义相关性联系,利用网络化数据挖掘策略来自适应地划分段落语义网络中的各抱团结构并依此识别文档集合中的各潜在子主题,通过对子主题中心句子单元的抽取及排列生成最终的摘要.此外,一种基于句子向量相似度的方法被用来自动评价生成摘要的覆盖度和冗余度,通过与几种典型的多文档摘要方法的实验比较及对自动评价和人工评价结果的统计相关性分析验证了该方法的可行性和有效性.

著录项

来源
《中国中文信息学会二十五周年学术会议》|2006年|361-372|共12页
会议地点北京
作者
胡珀; 何婷婷; 张勇;
展开▼
作者单位

中国中文信息学会;

展开▼
会议组织
正文语种
原文格式 PDF
中图分类自动化作文摘;
关键词
多文档自动文摘; 网络化数据挖掘; 子主题识别;

相似文献

中文文献
外文文献
专利

1. 基于主题模型与冗余控制的中文多文档自动文摘技术研究 [J] . 袁龙云 ,张琳 . 现代计算机（专业版） . 2017,第014期
2. 基于主题模型与冗余控制的中文多文档自动文摘技术研究 [J] . 袁龙云 ,张琳 . 现代计算机：上半月版 . 2017,第005期
3. 基于Siamese LSTM的中文多文档自动文摘模型 [J] . 龚永罡 ,王嘉欣 ,廉小亲 . 计算机应用与软件 . 2021,第003期
4. 基于文本聚类的多文档自动文摘研究 [J] . 郭庆琳 ,吴克河 ,吴慧芳 . 计算机研究与发展 . 2007,第0z2期
5. 基于遗传算法的中文多文档自动摘要方法研究 [J] . 段雪莹 ,王阳 . 科技信息 . 2010,第035期
6. 面向冗余度控制的中文多文档自动文摘 [C] . Wang Hongling ,王红玲 ,Huang Chaochao . 第十一届全国计算语言学学术会议 . 2011
7. 基于云模型的中文面向查询多文档自动文摘研究 [A] . 陈劲光 . 2011

基于网络化数据挖掘策略的中文多文档自动文摘研究

摘要

著录项

相似文献

相关主题

期刊订阅