首页> 中国专利> 学术资料搜索方法和装置

学术资料搜索方法和装置

摘要

本发明公开了一种学术资料搜索方法和装置,其中,学术资料搜索方法包括以下步骤:接收用户的搜索请求;根据搜索请求查询学术资料数据库;从学术资料数据库中获取符合搜索请求的学术资料;以及在结果显示页面中展现学术资料。本发明实施例的学术资料搜索方法和装置,通过接收用户的搜索请求,并根据搜索请求查询学术资料数据库,以及从学术资料数据库中获取符合搜索请求的学术资料,并在结果显示页面中展现学术资料,为用户提供了统一的检索入口,缩短了检索路径,为用户快速便捷地提供所需的学术资料,提升用户使用体验。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-01-25

    授权

    授权

  • 2016-04-13

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20151203

    实质审查的生效

  • 2016-03-16

    公开

    公开

说明书

技术领域

本发明涉及互联网技术领域,尤其涉及一种学术资料搜索方法和装置。

背景技术

目前,学生、学者、科研工作者等在学习或创作过程中,往往需要查阅大量的专业资 料来完成相应的知识储备。其中,专业资料主要来源于图书馆的馆藏资源及已购数据库。 以检索一篇论文为例,用户首先输入论文的题目作为关键字在搜索引擎中检索该论文所属 的图书馆,在确定对应的图书馆后,进入该图书馆的检索页面,用户再次输入论文题目进 行检索,最后获取该论文的详细资料。

但是,上述方法用户获取图书馆资源的途径十分繁琐,检索路径长,导致用户检索体 验变差。

发明内容

本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明的一个 目的在于提出一种学术资料搜索方法,该方法能够缩短检索路径,为用户快速便捷地提供 所需的学术资料,提升用户使用体验。

本发明的第二个目的在于提出一种学术资料搜索装置。

为了实现上述目的,本发明第一方面实施例提出了一种学术资料搜索方法,包括:接 收用户的搜索请求;根据所述搜索请求查询学术资料数据库;从所述学术资料数据库中获 取符合所述搜索请求的学术资料;以及在结果显示页面中展现所述学术资料。

本发明实施例的学术资料搜索方法,通过接收用户的搜索请求,并根据搜索请求查询 学术资料数据库,以及从学术资料数据库中获取符合搜索请求的学术资料,并在结果显示 页面中展现学术资料,为用户提供了统一的检索入口,缩短了检索路径,为用户快速便捷 地提供所需的学术资料,提升用户使用体验。

本发明第二方面实施例提出了一种学术资料搜索装置,包括:接收模块,用于接收用 户的搜索请求;查询模块,用于根据所述搜索请求查询学术资料数据库;获取模块,用于 从所述学术资料数据库中获取符合所述搜索请求的学术资料;以及展现模块,用于在结果 显示页面中展现所述学术资料。

本发明实施例的学术资料搜索装置,通过接收用户的搜索请求,并根据搜索请求查询 学术资料数据库,以及从学术资料数据库中获取符合搜索请求的学术资料,并在结果显示 页面中展现学术资料,为用户提供了统一的检索入口,缩短了检索路径,为用户快速便捷 地提供所需的学术资料,提升用户使用体验。

附图说明

图1是根据本发明一个实施例的学术资料搜索方法的流程图。

图2是根据本发明一个实施例的结果显示页面效果示意图一。

图3是根据本发明一个实施例的结果显示页面效果示意图二。

图4是根据本发明一个实施例的学术资料搜索装置的结构示意图一。

图5是根据本发明一个实施例的学术资料搜索装置的结构示意图二。

具体实施方式

下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同 或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描 述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。

下面参考附图描述本发明实施例的学术资料搜索方法和装置。

图1是根据本发明一个实施例的学术资料搜索方法的流程图。

如图1所示,学术资料搜索方法可包括:

S1、接收用户的搜索请求。

具体地,搜索引擎可接收用户输入的搜索请求。其中,搜索请求可以是学术资料的题 目,也可以是学术资料相关的关键词,例如“机器学习”等。应当理解的是,用户输入的 搜索请求也可以为英文等搜索引擎支持的语言。

S2、根据搜索请求查询学术资料数据库。

在接收到用户输入的搜索请求之后,可根据该搜索请求查询学术资料数据库。其中, 学术资料数据库主要是通过从网络中提取的高校图书馆数据和元数据,再基于高校图书馆 数据和元数据建立而成的。

S3、从学术资料数据库中获取符合搜索请求的学术资料。

举例来说,用户输入的搜索请求为“机器学习”,则可基于关键词“机器学习”搜索 学术资料数据库,然后从学术资料数据库中获取与“机器学习”相关的学术资料。

S4、在结果显示页面中展现学术资料。

在获取到学术资料之后,可通过结果显示页面对获取到的学术资料进行展现。具体地, 可获取用户的属性信息,然后可根据属性信息对学术资料进行排序并展现。其中,用户的 属性信息可包括IP地址等。举例来说,用户在输入搜索请求时,即可获取用户的IP地址, 再通过预先采集的高校的IP地址段,可确定用户所属的高校,如北京大学。在确定用户是 北京大学的用户之后,如图2所示,可优先向该用户展现属于北大图书馆中的学术资料。 同时,还可在侧边栏展示北大图书馆中学术资料的分类信息,如电子资源、纸质资源以及 全部免费的资源等,还可按照时间或领域等对学术资料进行分类。应当注意的是,在用户 选中“电子资源”或“纸质资源”或“全部免费”之后,可展现该类别对应的学术资料, 其中上述学术资料为北大图书馆的学术资料。另外,在结果显示页面中展现学术资料时, 还可判断学术资料是否具有免费下载的权限,可优先展现具有免费下载权限的学术资料。 如图3中所示,可显示学术资料的多个渠道如维普、万方、知网等,且均已被北大图书馆 购买,可以直接点击进入免费下载页面进行下载。

下面详细说明一下,基于高校图书馆数据和元数据建立学术资料数据库的过程。

具体地,可将高校图书馆数据和元数据进行匹配。如果高校图书馆数据和元数据匹配 成功,则可为元数据设置与高校图书馆对应的标识,并将元数据添加至学术资料数据库中。

更具体地,建立学术资料数据库可分为三个步骤:

第一步:首先可对高校图书馆数据和元数据进行预处理和离线数据挖掘。其中,预处 理可包括格式校验、错误字段删除、数据过滤等等。离线数据挖掘可分为词语挖掘和词义 挖掘。词语挖掘可包括学术资料曾用名挖掘、学术资料名称的简写与全称变换、同义词变 换等等。词义挖掘主要通过语义特征获取语义相关的数据等。

第二步:可对处理后的高校图书馆数据和元数据进行归一化。具体来说,可先建立归 一化表达式,然后根据归一化表达式对处理后的高校图书馆数据和元数据进行归一化。举 例来说,高校图书馆数据和元数据均对应具有学术资料名称,可预先建立好学术资料名称 的归一化表达式,然后将不同的学术资料名称根据归一化表达式进行统一,例如单词顺序 不一致,将单词顺序调整一致等。

第三步:可计算归一化后的高校图书馆数据和元数据的相似度,然后根据相似度对高 校图书馆数据和元数据进行匹配。

具体地,可基于映射归约MapReduce对高校图书馆数据和元数据进行大批量的聚类处 理。如果高校图书馆数据和元数据的相似度大于预设阈值,则可确定高校图书馆数据和元 数据匹配。如果高校图书馆数据和元数据的相似度小于预设阈值,则可确定高校图书馆数 据和元数据不匹配。

在匹配成功之后,可为元数据设置与高校图书馆对应的标识,并将元数据添加至学术 资料数据库中。举例来说,假设一个元数据与一个高校图书馆数据的名称一致,且均刊登 在同一期刊上,则可确定该元数据和该高校图书馆数据匹配。如果高校图书馆数据属于北 大图书馆,则可为该元数据设置与北大图书馆对应的标识,然后将该元数据添加至学术资 料数据库中,以此建立学术资料数据库。应当理解的是,一个元数据可对应多个高校图书 馆标识,也就是说对于同一个学术资料,可以为多个高校图书馆共用。如果是北大的用户 查询该学术资料,则可通过北大图书馆展现给该用户;如果是清华的用户查询该学术资料, 则可通过清华图书馆展现给该用户。

本发明实施例的学术资料搜索方法,通过接收用户的搜索请求,并根据搜索请求查询 学术资料数据库,以及从学术资料数据库中获取符合搜索请求的学术资料,并在结果显示 页面中展现学术资料,为用户提供了统一的检索入口,缩短了检索路径,为用户快速便捷 地提供所需的学术资料,提升用户使用体验。

为实现上述目的,本发明还提出一种学术资料搜索装置。

图4是根据本发明一个实施例的学术资料搜索装置的结构示意图一。

如图4所示,学术资料搜索装置可包括:接收模块110、查询模块120、获取模块130 和展现模块140。

接收模块110用于接收用户的搜索请求。具体地,接收模块110可接收用户输入的搜 索请求。其中,搜索请求可以是学术资料的题目,也可以是学术资料相关的关键词,例如 “机器学习”等。应当理解的是,用户输入的搜索请求也可以为英文等搜索引擎支持的语 言。

查询模块120用于根据搜索请求查询学术资料数据库。在接收到用户输入的搜索请求 之后,查询模块120可根据该搜索请求查询学术资料数据库。其中,学术资料数据库主要 是通过从网络中提取的高校图书馆数据和元数据,再基于高校图书馆数据和元数据建立而 成的。

获取模块130用于从学术资料数据库中获取符合搜索请求的学术资料。举例来说,用 户输入的搜索请求为“机器学习”,则可基于关键词“机器学习”搜索学术资料数据库, 然后从学术资料数据库中获取与“机器学习”相关的学术资料。

展现模块140用于在结果显示页面中展现学术资料。

在获取到学术资料之后,展现模块140可通过结果显示页面对获取到的学术资料进行 展现。具体地,可获取用户的属性信息,然后可根据属性信息对学术资料进行排序并展现。 其中,用户的属性信息可包括IP地址等。举例来说,用户在输入搜索请求时,即可获取用 户的IP地址,再通过预先采集的高校的IP地址段,可确定用户所属的高校,如北京大学。 在确定用户是北京大学的用户之后,如图2所示,可优先向该用户展现属于北大图书馆中 的学术资料。同时,还可在侧边栏展示北大图书馆中学术资料的分类信息,如电子资源、 纸质资源以及全部免费的资源等,还可按照时间或领域等对学术资料进行分类。应当注意 的是,在用户选中“电子资源”或“纸质资源”或“全部免费”之后,可展现该类别对应 的学术资料,其中上述学术资料为北大图书馆的学术资料。另外,在结果显示页面中展现 学术资料时,还可判断学术资料是否具有免费下载的权限,可优先展现具有免费下载权限 的学术资料。如图3中所示,可显示学术资料的多个渠道如维普、万方、知网等,且均已 被北大图书馆购买,可以直接点击进入免费下载页面进行下载。

此外,如图5所示,学术资料搜索装置还可包括建立模块150。

建立模块150可用于在根据搜索请求查询学术资料数据库之前,基于高校图书馆数据 和元数据建立学术资料数据库。

具体地,建立模块150可包括匹配单元151和添加单元152。

匹配单元151可将高校图书馆数据和元数据进行匹配。如果高校图书馆数据和元数据 匹配成功,则添加单元152可为元数据设置与高校图书馆对应的标识,并将元数据添加至 学术资料数据库中。

更具体地,匹配单元151首先可对高校图书馆数据和元数据进行预处理和离线数据挖 掘。其中,预处理可包括格式校验、错误字段删除、数据过滤等等。离线数据挖掘可分为 词语挖掘和词义挖掘。词语挖掘可包括学术资料曾用名挖掘、学术资料名称的简写与全称 变换、同义词变换等等。词义挖掘主要通过语义特征获取语义相关的数据等。

然后匹配单元151可对处理后的高校图书馆数据和元数据进行归一化。具体来说,可 先建立归一化表达式,然后根据归一化表达式对处理后的高校图书馆数据和元数据进行归 一化。举例来说,高校图书馆数据和元数据均对应具有学术资料名称,可预先建立好学术 资料名称的归一化表达式,然后将不同的学术资料名称根据归一化表达式进行统一,例如 单词顺序不一致,将单词顺序调整一致等。

最后,匹配单元151可计算归一化后的高校图书馆数据和元数据的相似度,然后根据 相似度对高校图书馆数据和元数据进行匹配。具体地,可基于映射归约MapReduce对高校 图书馆数据和元数据进行大批量的聚类处理。如果高校图书馆数据和元数据的相似度大于 预设阈值,则可确定高校图书馆数据和元数据匹配。如果高校图书馆数据和元数据的相似 度小于预设阈值,则可确定高校图书馆数据和元数据不匹配。

在匹配成功之后,添加单元152可为元数据设置与高校图书馆对应的标识,并将元数 据添加至学术资料数据库中。举例来说,假设一个元数据与一个高校图书馆数据的名称一 致,且均刊登在同一期刊上,则可确定该元数据和该高校图书馆数据匹配。如果高校图书 馆数据属于北大图书馆,则可为该元数据设置与北大图书馆对应的标识,然后将该元数据 添加至学术资料数据库中,以此建立学术资料数据库。应当理解的是,一个元数据可对应 多个高校图书馆标识,也就是说对于同一个学术资料,可以为多个高校图书馆共用。如果 是北大的用户查询该学术资料,则可通过北大图书馆展现给该用户;如果是清华的用户查 询该学术资料,则可通过清华图书馆展现给该用户。

本发明实施例的学术资料搜索装置,通过接收用户的搜索请求,并根据搜索请求查询 学术资料数据库,以及从学术资料数据库中获取符合搜索请求的学术资料,并在结果显示 页面中展现学术资料,为用户提供了统一的检索入口,缩短了检索路径,为用户快速便捷 地提供所需的学术资料,提升用户使用体验。

在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、 “宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、 “水平”、“顶”、“底”“内”、“外”、“顺时针”、“逆时针”、“轴向”、“径 向”、“周向”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便 于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以 特定的方位构造和操作,因此不能理解为对本发明的限制。

此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要 性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以 明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个, 例如两个,三个等,除非另有明确具体的限定。

在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固 定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可 以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以 是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的 普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。

在本发明中,除非另有明确的规定和限定,第一特征在第二特征“上”或“下”可以 是第一和第二特征直接接触,或第一和第二特征通过中间媒介间接接触。而且,第一特征 在第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方,或 仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下 面”可以是第一特征在第二特征正下方或斜下方,或仅仅表示第一特征水平高度小于第二 特征。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具 体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材 料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意 性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特 点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下, 本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特 征进行结合和组合。

尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的, 不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例 进行变化、修改、替换和变型。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号