网络PDF中文学术文献的识别与检索——基于学术文献文体特征的研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

在日益扩大的数字信息环境下,网络学术资源迅猛增长,其中以PDF为载体格式的学术文献具有很高的利用价值。如何有效、便捷地对网上无序分布的PDF学术文献进行组织、保存和开发利用是一个急需解决的重要问题,而学术文献的自动识别是达成这一目的的关键环节。学术文献的文体特征有助于从网络众多信息中快速、高效地识别和过滤出有价值的学术信息。本文主要探讨了学术文献的文体特征,并尝试将其用于PDF格式网络中文学术文献的自动识别。本文首先总结了网络学术文献的检索与利用状况,介绍了文体特征及其研究和应用情况;然后从文体学的角度详细说明了学术文献的文体及其文体特征,并通过构建一个小型语料库,运用语料库文体学的文体分析理论,总结出中文学术文献的文体特征。在前述理论基础上,设计和改进了一个基于学术文献文体特征的PDF文件检索系统,将学术文献文体特征的过滤、排除功能应用于网络搜索引擎。实验测试显示,该PDF文件检索系统在Google检索结果页面基础上,能有效地提高中文学术文献检索的相对查准率。

著录项

作者
冯文炬;
展开▼
作者单位

中山大学;

展开▼
授予单位中山大学;
学科情报学
授予学位硕士
导师姓名邹永利;
年度 2010
页码
总页数
原文格式 PDF
正文语种中文
中图分类计算机情报检索系统;
关键词
网络搜索引擎; 中文; 学术文献; 自动识别; 文件检索系统; 文体特征; 语料库; 数字信息环境; 文体学; 相对查准率; 检索与利用; 学术资源; 学术信息; 文献检索; 实验测试; 利用价值; 理论基础; 开发利用; 检索结果; 过滤;

相似文献

中文文献
外文文献
专利

1. 文体特征与网络中文学术文献的自动识别——学术文献文体与新闻报道文体的比较研究 [J] . 邹永利 ,颜秀飞 . 情报学报 . 2012,第002期
2. 学术文献的文体特征及其检索意义——计算机科学文献与相关新闻报道文体的比较研究 [J] . 邹永利 ,冯静娴 ,郑荟 . 中国图书馆学报 . 2014,第002期
3. 标点符号在网络中文学术文献识别与检索中的作用 [J] . 邹永利 ,王皓 . 情报学报 . 2018,第001期
4. 文体特征在网络学术文献检索中的意义与应用 [J] . 邹永利 ,何侃 ,徐健 . 情报理论与实践 . 2008,第004期
5. 基于机器视觉的PDF学术文献结构识别 [J] . 于丰畅 ,陆伟 . 情报学报 . 2019,第004期
6. 基于引文的中文学术文献自动标引方法研究 [C] . LIU Wei ,刘伟 ,WANG Xing . 2012年全国知识组织与知识链接学术交流会 . 2012
7. 网络学术文献文体特征的获取与检索研究 [A] . 颜秀飞 . 2010

网络PDF中文学术文献的识别与检索——基于学术文献文体特征的研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅