首页> 中文学位 >中文领域术语自动获取方法的研究
【6h】

中文领域术语自动获取方法的研究

代理获取

目录

文摘

英文文摘

声明

第一章 绪论

第二章 术语学及术语的相关概念

第三章 特定领域文本选取的研究

第四章 基于贝叶斯推理的领域术语获取方法研究

第五章 总结与展望

致 谢

参考文献

硕士期间发表的学术论文

展开▼

摘要

中文术语自动抽取是中文信息处理中的一项基础性研究课题,在很多领域都有很重要的作用。如在语言学中的自然语言生成、计算词典编撰学、句法分析、语料库语言学研究等,在自然语言处理领域中的机器翻译、信息检索、文本分类、文本摘要、领域本体等领域中都有广泛地应用,特别是针对领域语料而言,术语抽取的作用显得更加重要。
   目前,国内有许多学者致力于中文术语的自动提取,也提出了一些有效的方法,但是,总体技术水平还不成熟;又因为中文文字具有粘合性的特点,字与字之间不像英文那样用空格隔开,处理过程比英文复杂的多,所以国外的术语提取方法对于中文术语提取也不太适用。因此,自行研制适合于中文的领域术语自动提取方法,对中文信息处理来说具有十分重要的意义。本文正是在这种背景下,对中文领域术语提取进行了比较深入的研究,提出了一种术语自动提取的方法。本文的主要研究工作包括以下几个方面:
   第一:总结了术语的各种表现特征,分析了各种术语自动获取方法的特点,并对比分析国内外在术语自动抽取领域的研究成果。
   第二:在分析空间向量模型和词频的基础上提出了一种改进的TFIDP方法,并以此方法进行领域文本的选取,该方法能够从混合文本中选出某一领域的文本,通过实验证明了该方法的有效性。
   第三:在分析常用的领域术语提取方法和贝叶斯推理的基础上,将贝叶斯推理引入到领域术语提取中,然后研究了贝叶斯推理过程中所用到的计算公式,最后给出了基于贝叶斯推理的领域术语获取过程,并设计了该方法的核心模块。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号