首页> 中文学位 >网络PDF中文学术文献的识别与检索——基于学术文献文体特征的研究
【6h】

网络PDF中文学术文献的识别与检索——基于学术文献文体特征的研究

代理获取

目录

文摘

英文文摘

论文说明:图表目录、注释表

第1章 绪论

1.1 研究背景

1.2 研究目的和意义

1.3 研究方法

1.4 文章基本内容

第2章 文献综述

2.1 网络学术文献研究

2.2 文体特征研究

2.3 本章小结

第3章 学术文献文体特征的设定

3.1 学术文献文体特征分析

3.2 学术文献的文体特征获取与设定

3.3 本章小结

第4章 实验系统改进与设计

4.1 实验系统设计思想与目标

4.2 实验系统总体结构与模块功能

4.3 本章小结

第5章 实验效果分析与评价

5.1 实验系统评价指标

5.2 实验系统测试方法

5.3 实验系统检索效果讨论

5.4 本章小结

第6章 总结与展望

6.1 研究结论

6.2 未来研究方向

参考文献

后记

展开▼

摘要

在日益扩大的数字信息环境下,网络学术资源迅猛增长,其中以PDF为载体格式的学术文献具有很高的利用价值。如何有效、便捷地对网上无序分布的PDF学术文献进行组织、保存和开发利用是一个急需解决的重要问题,而学术文献的自动识别是达成这一目的的关键环节。学术文献的文体特征有助于从网络众多信息中快速、高效地识别和过滤出有价值的学术信息。本文主要探讨了学术文献的文体特征,并尝试将其用于PDF格式网络中文学术文献的自动识别。本文首先总结了网络学术文献的检索与利用状况,介绍了文体特征及其研究和应用情况;然后从文体学的角度详细说明了学术文献的文体及其文体特征,并通过构建一个小型语料库,运用语料库文体学的文体分析理论,总结出中文学术文献的文体特征。在前述理论基础上,设计和改进了一个基于学术文献文体特征的PDF文件检索系统,将学术文献文体特征的过滤、排除功能应用于网络搜索引擎。实验测试显示,该PDF文件检索系统在Google检索结果页面基础上,能有效地提高中文学术文献检索的相对查准率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号