公开/公告号CN113220867A
专利类型发明专利
公开/公告日2021-08-06
原文格式PDF
申请/专利权人 湖南通远网络股份有限公司;
申请/专利号CN202110493846.3
发明设计人 夏峰;
申请日2021-05-07
分类号G06F16/335(20190101);G06F16/332(20190101);G06F16/953(20190101);G06F21/32(20130101);G06F21/62(20130101);
代理机构44367 深圳市创富知识产权代理有限公司;
代理人齐兴
地址 410000 湖南省长沙市芙蓉区荷花园街道万家丽路一段176号旺德府大厦1401房
入库时间 2023-06-19 12:07:15
技术领域
本发明属于文件检索领域,具体是一种基于人工智能的全平台文献自动检索系统。
背景技术
公开号为CN1871605的专利公开了一种检索装置,其基于包含在作为来自用户的问题形式的检索请求的问题中的关键字来检索相关的文献。所述检索装置提取与所述关键字相关并且包含在所述检索到的文献中的描述作为第一概要。概要提取单元从形成由文献检索结果指示的文献的原始文献数据中提取对应于与由问题类型确定单元确定的所述问题的问题类型相匹配的回答的描述作为第二概要。所述原始文献数据被包括在存储于原始文献数据库中并且形成每一篇作为检索目标的文献的原始文献数据中。接口在显示装置上显示所述文献检索结果以及所述提取的第二概要的列表。所述文献检索结果包括所述提取的第一概要的列表。
但是,其针对文献检索,没有结合用户习惯,也不够智能化判定文献的相关程度,无法做到足够精细化筛选;基于此,现提供一种解决方案。
发明内容
本发明的目的在于提供一种基于人工智能的全平台文献自动检索系统。
本发明的目的可以通过以下技术方案实现:
一种基于人工智能的全平台文献自动检索系统,包括需求录入单元、需求分析单元、验证单元、登录单元、处理器、显示单元、数据检索单元、检索回验单元、探寻单元、留存库和测验分析单元;
其中,所述需求录入单元用于用户录入目标信息,目标信息包括文献领域和目标简介;所述文献领域具体为对应所需文献的所属领域,目标简介即为对应所需文献的简要描述;
所述登陆单元用于采集用户的登陆信息,登陆信息包括用户账号、密钥、指纹、人脸信息;所述登陆单元用于将登陆信息传输到验证单元,所述验证单元用于对登录信息进行随机验证,并根据验证结果产生允通信号;
所述验证单元用于将允通信号传输到需求分析单元;
所述需求分析单元只有在接收到验证单元传输的允通信号时才会进行工作,接收需求录入单元传输的目标信息;所述需求分析单元用于对目标信息进行简化处理,得到关键信息和文献领域组成的简后信息;
所述需求分析单元用于将简后信息传输到处理器,所述处理器接收需求分析单元传输的简后信息并将其传输到数据检索单元,所述数据检索单元用于结合探寻单元在互联网中进行检索相关操作,得到终选文献;
所述数据检索单元用于将所有的终选文献传输到检索回验单元,用户通过检索回验单元对终选文献进行选取,将用户选中的终选文献标记为标的文献;
所述检索回验单元用于将标的文献传输到处理器,所述处理器用于将标的文献传输到显示单元进行显示。
进一步地,随机验证具体步骤为:
步骤一:获取到登陆信息,和上传登陆信息的时间点;
步骤二:以月日时分的形式获取到时间点,按照月日时分的顺序获取到时间点的数值,得到时间组,将其标记为Ti,i=1...8;
步骤三:之后利用公式计算随机选值,具体的计算公式如下:
步骤四:获取到随机选值个位上的数值,将其标记定位特定值,
当特定值为0时,对密钥、指纹、人脸信息均进行验证;
当特定值为奇数时,对密钥和指纹一起进行验证;
当特定值为偶数时,对密钥和人脸信息一起进行验证;
步骤五:按照步骤四的原理对相应登陆信息进行身份确认,当核准正确之后,产生允通信号。
进一步地,简化处理具体的步骤为:
S1:获取到目标信息内的目标简介;
S2:对目标简介进行分词处理,得到若干个分词后组成的词、字,将其标记为独立单项;
S3:之后获取到每个独立单项的次数,去除表征单项;表征单项为用户预设的无效词语,即为语气词、无实意的词语;
S4:之后得到去除表征单项后的独立单项,将其标记为Dj,j=1...m;将对应的出现次数,将其标记为迭代数Hj,j=1...m;Hj和Dj一一对应;
S5:根据迭代数Hj从大到小的顺序进行排序,当次数相同的独立单项的个数超过X1个时,X1为预设数值;此时将出现在该独立单项前的所有独立单项标记为关键信息;
S6:得到关键信息和文献领域,融合形成简后信息。
进一步地,检索相关操作具体步骤为:
S01:获取到简后信息;
S02:之后首先进行初选,根据简后信息内的文献领域获取到同领域的所有文献,将其标记为一选文献;
S03:之后获取到所有一选文献的发表时间,获取到最早发表到最晚发表的文献之间的时间跨度;
S04:将时间跨度除以X2,X2为预设值,具体可取值为10或者其它数值;
S05:将时间跨度分为X2个时间阶段;
S06:任选一时间阶段;
S07:获取对应时间阶段内的所有一选文献,根据一选文献的引用次数进行从大到小排序;
S08:取得排名前二,最后两名以及位于正中间的两名;
S09:得到对应该时间阶段的二选文献;
S010:任选下一时间阶段,重复步骤S07-S010,直到对所有的时间阶段处理完毕;
S011:得到所有的二选文献,组成二选文献组;
S012:之后对二选文献组进行相关度判定,得到终选文献。
进一步地,步骤S08中的排名位于正中间判定方式为:
将一选文献的数量除以二,若能整除,则获取对应该中值排名的一选文献和位于其前一位的一选文献;
若无法整除,则取该值前后各一位的一选文献。
进一步地,步骤S012中的相关度判定具体规则如下:
S0121:获取到所有的二选文献;同时获取到简后信息内的关键信息;
S0122:获取到所有的关键信息在所有二选文献内出现的次数,将其标记为命中次数;
S0123:之后获取到关键信息在所有二选文献内的出现的个数占关键信息总个数的比例,将其标记为全系占比;
S0124:根据公式计算所有二选文献的有效值,具体计算公式为:
有效值=0.43*全系占比+0.57*命中次数;
式中,0.43和0.57为权值,因为不同因素对最终结果影响不同,故引入权值予以体现;
S0125:按照有效值从大到小进行排序,将排名处于前百分之二十的二选文献标记为终选文献。
进一步地,所述处理器还用于将用户身份及其对应的标的文献和检索时间融合形成检索记录通过数据检索单元传输到留存库;所述留存库接收数据检索单元传输的检索记录并进行实时存储。
进一步地,所述验证单元还用于获取用户的身份信息将其传输到测验分析单元;所述测验分析单元用于对留存库内的检索记录进行惯性分析,惯性分析具体步骤为:
SS1:获取到用户身份信息,及其对应的标的文献;
SS2:获取到文献作者、文献来源,文献来源即为对应文献的发布平台;
SS3:将文献作者和文献来源标记为热门信息;
SS4:将热门信息通过留存库返回到数据检索单元;
SS5:后续数据检索单元在检索同类的文献领域时,会优先将热门信息对应的二选文献,当其排名处于前百分之四十时标记为终选文献,并按顺序排出靠后的其他文献;
SS6:得到新的终选文献。
本发明的有益效果:
本发明通过需求录入单元用于用户录入目标信息,目标信息包括文献领域和目标简介;之后借助登陆单元用于采集用户的登陆信息,并借助验证单元用于对登录信息进行随机验证,并根据验证结果产生允通信号;
之后需求分析单元在接收到验证单元传输的允通信号时进行工作,接收需求录入单元传输的目标信息;并对目标信息进行简化处理,得到关键信息和文献领域组成的简后信息;之后借助数据检索单元,结合探寻单元在互联网中进行检索相关操作,得到终选文献;
再之后会借助用户通过检索回验单元对终选文献进行选取,将用户选中的终选文献标记为标的文献;并记住用户的选择,提取相关特性,作为下一次检索的优先权;本发明简单有效,易于实用。
附图说明
为了便于本领域技术人员理解,下面结合附图对本发明作进一步的说明。
图1为本发明的系统框图。
具体实施方式
如图1所示,一种基于人工智能的全平台文献自动检索系统,包括需求录入单元、需求分析单元、验证单元、登录单元、处理器、显示单元、数据检索单元、检索回验单元、探寻单元、留存库和测验分析单元;
其中,所述需求录入单元用于用户录入目标信息,目标信息包括文献领域和目标简介;所述文献领域具体为对应所需文献的所属领域,目标简介即为对应所需文献的简要描述;
所述登陆单元用于采集用户的登陆信息,登陆信息包括用户账号、密钥、指纹、人脸信息;所述登陆单元用于将登陆信息传输到验证单元,所述验证单元用于对登录信息进行随机验证,具体随机验证步骤为:
步骤一:获取到登陆信息,和上传登陆信息的时间点;
步骤二:以月日时分的形式获取到时间点,按照月日时分的顺序获取到时间点的数值,得到时间组,将其标记为Ti,i=1...8;
步骤三:之后利用公式计算随机选值,具体的计算公式如下:
步骤四:获取到随机选值个位上的数值,将其标记定位特定值,
当特定值为0时,对密钥、指纹、人脸信息均进行验证;
当特定值为奇数时,对密钥和指纹一起进行验证;
当特定值为偶数时,对密钥和人脸信息一起进行验证;
步骤五:按照步骤四的原理对相应登陆信息进行身份确认,当核准正确之后,产生允通信号;
所述验证单元用于将允通信号传输到需求分析单元;
所述需求分析单元只有在接收到验证单元传输的允通信号时才会进行工作,接收需求录入单元传输的目标信息;所述需求分析单元用于对目标信息进行简化处理,具体简化处理的步骤为:
S1:获取到目标信息内的目标简介;
S2:对目标简介进行分词处理,得到若干个分词后组成的词、字,将其标记为独立单项;
S3:之后获取到每个独立单项的次数,去除表征单项;表征单项为用户预设的无效词语,即为语气词、无实意的词语;
S4:之后得到去除表征单项后的独立单项,将其标记为Dj,j=1...m;将对应的出现次数,将其标记为迭代数Hj,j=1...m;Hj和Dj一一对应;
S5:根据迭代数Hj从大到小的顺序进行排序,当次数相同的独立单项的个数超过X1个时,X1为预设数值;此时将出现在该独立单项前的所有独立单项标记为关键信息;
S6:得到关键信息和文献领域,融合形成简后信息;
所述需求分析单元用于将简后信息传输到处理器,所述处理器接收需求分析单元传输的简后信息并将其传输到数据检索单元,所述数据检索单元用于结合探寻单元在互联网中进行检索相关操作,具体检索相关操作步骤为:
S01:获取到简后信息;
S02:之后首先进行初选,根据简后信息内的文献领域获取到同领域的所有文献,将其标记为一选文献;
S03:之后获取到所有一选文献的发表时间,获取到最早发表到最晚发表的文献之间的时间跨度;
S04:将时间跨度除以X2,X2为预设值,具体可取值为10或者其它数值;
S05:将时间跨度分为X2个时间阶段;
S06:任选一时间阶段;
S07:获取对应时间阶段内的所有一选文献,根据一选文献的引用次数进行从大到小排序;
S08:取得排名前二,最后两名以及位于正中间的两名,正中间判定方式为:
将一选文献的数量除以二,若能整除,则获取对应该中值排名的一选文献和位于其前一位的一选文献;
若无法整除,则取该值前后各一位的一选文献;
S09:得到对应该时间阶段的二选文献;
S010:任选下一时间阶段,重复步骤S07-S010,直到对所有的时间阶段处理完毕;
S011:得到所有的二选文献,组成二选文献组;
S012:之后对二选文献组进行相关度判定,具体相关度判定规则如下:
S0121:获取到所有的二选文献;同时获取到简后信息内的关键信息;
S0122:获取到所有的关键信息在所有二选文献内出现的次数,将其标记为命中次数;
S0123:之后获取到关键信息在所有二选文献内的出现的个数占关键信息总个数的比例,将其标记为全系占比;
S0124:根据公式计算所有二选文献的有效值,具体计算公式为:
有效值=0.43*全系占比+0.57*命中次数;
式中,0.43和0.57为权值,因为不同因素对最终结果影响不同,故引入权值予以体现;
S0125:按照有效值从大到小进行排序,将排名处于前百分之二十的二选文献标记为终选文献;
所述数据检索单元用于将所有的终选文献传输到检索回验单元,用户通过检索回验单元对终选文献进行选取,将用户选中的终选文献标记为标的文献;
所述检索回验单元用于将标的文献传输到处理器,所述处理器用于将标的文献传输到显示单元进行显示;
所述处理器还用于将用户身份及其对应的标的文献和检索时间融合形成检索记录通过数据检索单元传输到留存库;所述留存库接收数据检索单元传输的检索记录并进行实时存储;
所述验证单元还用于获取用户的身份信息将其传输到测验分析单元;所述测验分析单元用于对留存库内的检索记录进行惯性分析,惯性分析具体步骤为:
SS1:获取到用户身份信息,及其对应的标的文献;
SS2:获取到文献作者、文献来源,文献来源即为对应文献的发布平台;
SS3:将文献作者和文献来源标记为热门信息;
SS4:将热门信息通过留存库返回到数据检索单元;
SS5:后续数据检索单元在检索同类的文献领域时,会优先将热门信息对应的二选文献,当其排名处于前百分之四十时标记为终选文献,并按顺序排出靠后的其他文献;
SS6:得到新的终选文献。
本发明通过需求录入单元用于用户录入目标信息,目标信息包括文献领域和目标简介;之后借助登陆单元用于采集用户的登陆信息,并借助验证单元用于对登录信息进行随机验证,并根据验证结果产生允通信号;
之后需求分析单元在接收到验证单元传输的允通信号时进行工作,接收需求录入单元传输的目标信息;并对目标信息进行简化处理,得到关键信息和文献领域组成的简后信息;之后借助数据检索单元,结合探寻单元在互联网中进行检索相关操作,得到终选文献;
再之后会借助用户通过检索回验单元对终选文献进行选取,将用户选中的终选文献标记为标的文献;并记住用户的选择,提取相关特性,作为下一次检索的优先权;本发明简单有效,易于实用。
以上内容仅仅是对本发明结构所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。
机译: 自动化音乐创作和生成系统,自动化音乐创作和生成过程,自动化音乐创作和生成,玩具乐器,音乐伴奏和音乐创作玩具乐器,自动化创作玩具乐器系统和音乐生成,电子信息处理和显示系统,企业基于互联网的一流音乐创作和生成系统,用于自动生成和传送数字复合音乐的网络系统,用于音乐环境的基于独立音乐的音乐创作和表演系统人工智能,基于音乐的自主创作过程音乐的生成和表演人工智能,自主分析仪器系统,用于建立自动音乐创作和生成引擎的网络,几何方法音乐理论系统操作参数映射,以自动方式构成和生成数字音乐的方法,参数转换
机译: 一种基于指针的对象获取方法,用于对计算机系统的信息进行有形处理,该方法基于一种自然语言,并且该机器人或机器人的人工智能系统对该计算机系统的接收信号作出反应,该计算机系统具有相应的关联机器人或机器人的人工智能,该机器人或机器人的人工智能计算机系统的相应思想得到证实
机译: 文献检索装置,文献检索方法,程序以及文献检索系统