首页> 中国专利> 应用于搜索引擎中的搜索时间范围确定方法及装置

应用于搜索引擎中的搜索时间范围确定方法及装置

摘要

本发明公开了一种应用于搜索引擎中的搜索时间范围确定方法及装置,其中方法包括接收用户输入的信息并初始化搜索时间范围;识别所述接收的信息中符合预定的时间格式的时间信息,所述预定的时间格式包括时间格式一和/或时间格式二;采用所述识别出的符合预定的时间格式的时间信息对所述初始化的搜索时间范围做调整,得到最终的搜索时间范围,本发明实施例不需要用户按照固定的格式输入时间,也不需要用户从时间选择框中选择时间,用户只需要按照正常的时间表达方式输入含时间信息的搜索词即可,因此可以提高用户的体验度。

著录项

  • 公开/公告号CN104424327A

    专利类型发明专利

  • 公开/公告日2015-03-18

    原文格式PDF

  • 申请/专利权人 重庆新媒农信科技有限公司;

    申请/专利号CN201310410046.6

  • 发明设计人 王忻;

    申请日2013-09-10

  • 分类号G06F17/30(20060101);

  • 代理机构11129 北京海虹嘉诚知识产权代理有限公司;

  • 代理人谢殿武

  • 地址 401121 重庆市北部新区高新园黄山大道5号水星科技大厦南翼写字楼1楼3号

  • 入库时间 2023-12-17 04:19:09

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-06-30

    专利权的转移 IPC(主分类):G06F17/30 登记生效日:20200610 变更前: 变更后: 申请日:20130910

    专利申请权、专利权的转移

  • 2018-09-14

    授权

    授权

  • 2015-04-15

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20130910

    实质审查的生效

  • 2015-03-18

    公开

    公开

说明书

技术领域

本发明涉及搜索技术,尤其涉及一种应用于搜索引擎中的搜索时间范围确定方法及装置。

背景技术

在诸如新闻网站、购物网站、旅游网站、机票网站、交易平台等的搜索引擎中,时间作为一次查询的关键范围参数,其准确性直接关系到是否能够准确的定位数据结果集,因此对于时间参数,传统的方式中往往要求用户在时间信息框中按照提供的固定格式输入,例如“XX年XX月XX日”,但是,这样会限制用户的输入习惯,增加了用户使用复杂度,或者在网页上提供时间选择框,要求用户从时间选择框中选择日期,但是用户完成日期的选择往往需要多次的操作,这样增加了用户操作的复杂度。

发明内容

有鉴于此,本发明提供了一种应用于搜索引擎中的搜索时间范围确定方法及装置,可以自动识别出用户输入的信息中含有的时间信息,以此确定需要搜索的时间范围,提高用户体验度。

本发明提供了一种应用于搜索引擎中的搜索时间范围确定方法,包括

识别所述接收的信息中符合预定的时间格式的时间信息,所述预定的时间格式包括时间格式一和/或时间格式二;所述时间格式一至少包括第一部分和第三部分,其中第一部分为:今、昨、明、前、近、上、后和大后中任一,第三部分为:日、天、月、周、年、号、星期和礼拜中任一,所述时间格式二包括第四部分和第五部分,其中第四部分为数字,第五部分为:月、日、年和号中任一;

采用所述识别出的符合预定的时间格式的时间信息对所述初始化的搜索时间范围做调整,得到最终的搜索时间范围。

优选的,所述时间格式一还可以包括第二部分,且第二部分为数字。

优选的,当预定的时间格式包括时间格式一时,所述采用识别出的符合预定的时间格式的时间信息对初始化的搜索时间范围做调整具体为:采用识别出的符合预定的时间格式的时间信息对初始化的搜索时间范围做时间偏移。

优选的,当预定的时间格式包括时间格式二时,所述采用识别出的符合预定的时间格式的时间信息对初始化的搜索时间范围做调整具体为:采用识别出的符合预定的时间格式的时间信息对初始化的搜索时间范围做时间要素替换。

优选的,当预定的时间格式包括时间格式一和时间格式二时,所述采用识别出的符合预定的时间格式的时间信息对初始化的搜索时间范围做调整具体为:

判断所述接收的信息中是否含有符合时间格式一/时间格式二的时间信息;

若是,则对初始化的搜索时间范围做时间偏移/时间要素替换;

若否,再判断所述接收的信息中是否含有符合时间格式二/时间格式一的时间信息;

若是,则对初始化的搜索时间范围做时间要素替换/时间偏移。

优选的,所述对初始化的搜索时间范围做时间偏移,可以包括:

确定所述识别到的符合时间格式一的时间信息中各部分对应的时间偏移参数,所述时间偏移参数以天为单位;

将确定的各部分对应的时间偏移参数的乘积作为最终的时间偏移量;

采用所述最终的时间偏移量对所述初始化的搜索时间范围作偏移。

优选的,所述今、昨、明、前、近、上、后和大后对应的时间偏移参数可以分别为:0、-1、1、-1或-2、-1、-1、1或2、3;所述日、天、月、周、年、号、星期和礼拜对应的时间偏移参数可以分别为:1、1、30、7、365、1、7、7。

优选的,所述对初始化的搜索时间范围做时间要素替换,可以包括如下任一项或多项:采用识别到的年信息替换初始化的搜索时间范围中的年信息,采用识别到的月信息替换初始化的搜索时间范围中的月信息和采用识别到的日或号信息替换初始化的搜索时间范围中的日信息。

本发明还提供了一种应用于搜索引擎中的搜索时间范围确定装置,包括

接收和初始化模块,用于接收用户输入的信息,并初始化搜索时间范围;

识别模块,用于识别所述接收的信息中符合预定的时间格式的时间信息,所述预定的时间格式包括时间格式一和/或时间格式二;所述时间格式一至少包括第一部分和第三部分,其中第一部分为:今、昨、明、前、近、上、后和大后中任一,第三部分为:日、天、月、周、年、号、星期和礼拜中任一,所述时间格式二包括第四部分和第五部分,其中第四部分为数字,第五部分为:月、日、年和号中任一;

处理模块,用于采用所述识别模块识别到的符合预定的时间格式的时间信息对所述接收和初始化模块初始化的搜索时间范围做调整,得到最终的搜索时间范围。

优选的,所述时间格式一还可以包括第二部分,且第二部分为数字。

本发明的有益效果:

本发明实施例,对于用户输入的信息,识别其中与时间格式一或时间格式二匹配的时间信息,并根据该识别到的时间信息对初始化的时间范围做调整,此种方式,不需要用户按照固定的格式在时间信息框中输入时间,也不需要用户从时间选择框中选择时间,用户只需要按照正常的时间表达方式输入含时间信息的信息即可以,例如直接输入“今天西瓜的价格”即可,因此可以提高用户的体验度;另外,时间格式一或时间格式二的具体形式是对现有的时间表述形式的总结而提出的,因此按照时间格式一或时间格式二进行识别,具有识别面广、识别准确度高等特点。

附图说明

下面结合附图和实施例对本发明作进一步描述:

图1是本发明提供的应用于搜索引擎中的搜索时间范围确定方法的第一实施例的流程示意图。

图2是本发明提供的应用于搜索引擎中的搜索时间范围确定方法的第二实施例的流程示意图。

图3是本发明提供的应用于搜索引擎中的搜索时间范围确定方法的第三实施例的流程示意图。

图4是本发明提供的应用于搜索引擎中的搜索时间范围确定方法的第四实施例的流程示意图。

图5是本发明提供的应用于搜索引擎中的搜索时间范围确定装置的实施例的结构示意图。

图6是第一处理单元的实施例的结构示意图。

图7是第二处理单元的实施例的结构示意图。

图8是第三处理单元的实施例的结构示意图。

具体实施方式

请参考图1,是本发明提供的应用于搜索引擎中的搜索时间范围确定方法的第一实施例的流程示意图,其包括:

步骤S11、接收用户输入的信息,并初始化搜索时间范围。

步骤S12、识别步骤S11中接收的信息中符合预定的时间格式的时间信息。

其中,预定的时间格式包括时间格式一和/或时间格式二;所述时间格式一至少包括第一部分和第三部分,其中第一部分为:今、昨、明、前、近、上、后和大后中任一,第三部分为:日、天、月、周、年、号、星期和礼拜中任一,所述时间格式二包括第四部分和第五部分,其中第四部分为数字,第五部分为:月、日、年和号中任一。

步骤S13、采用步骤S12识别到的符合预定的时间格式的时间信息对初始化的搜索时间范围做调整,得到最终的搜索时间范围。

本实施例提出的时间格式一和时间格式二是对时间的常见表达形式的总结而提出的,常见的时间表达形式例如可以是:“2013年8月12日”、“8月12日”、“12号”、“八月十二日”、“明天”、“今天”、“今日”、“明日”、“后天”、“前天”、“近一周”、“近一个星期”、“上个礼拜”、“上个月”、“下个月”、“近一个月”、“前3天”、“上1个星期”和“前三天”等等。

其中,时间格式一包括三部分,其中第一部分主要为:今、昨、明、前、近、上、后和大后中任一,第二部分主要为数字,第三部分主要为:日、天、月、周、年、号、星期和礼拜中任一,其中第二部分可以缺省,例如:有些时间的表达式为“前三天”,此时三部分均有,而有些时间的表达式为“前天”,此时缺少第二部分,但这是允许的。

其中,时间格式二主要由第四部分和第五部分组成,其中第四部分为数字,第五部分为:月、日、年和号中任一,其常见的表现形式为诸如“02年”、“25号”、“8月”、“13日”,等等。

本实施例,对于用户输入的信息,识别其中与时间格式一或时间格式二匹配的时间信息,并根据该识别到的时间信息对初始化的搜索时间范围做偏移或者做时间要素的替换,以此确定最终的搜索时间范围,此种方式,不需要用户按照固定的格式在时间信息框中输入时间,也不需要用户从时间选择框中选择时间,用户只需要按照正常的时间表达方式输入含时间信息的搜索词即可以,例如直接输入“近一周鸡蛋的价格”即可,因此可以降低用户的操作复杂度,提高用户的体验度,同时也可以使得相应的网页搜索界面更简洁。

请参考图2,是本发明提供的应用于搜索引擎中的搜索时间范围确定方法的第二实施例的流程示意图,其包括:

步骤S21、接收用户输入的信息,并初始化搜索时间范围。

其中,用户输入的信息可以是诸如“2013年6月5日白菜的价格,今天西瓜的价格,明天的优惠活动,上个星期的新闻,近三天的工作有哪些,近一年的房屋交易情况”等含有时间信息的搜索式。

其中,初始化搜索时间范围时,可以将今天初始化搜索时间范围,例如:当今天为2013年8月12日时,则初始化时间范围为:start(开始)=2013年8月12日00:00:00,end(结束)=2013年8月12日23:59:59。

步骤S22、识别步骤S21中接收的信息中符合时间格式一的时间信息。

步骤S23、确定识别到的符合时间格式一的时间信息中各部分对应的时间偏移参数。

步骤S24、将确定的各部分对应的时间偏移参数相乘作为最终的时间偏移量。

步骤S25、采用最终的时间偏移量对所述初始化的时间搜索范围作偏移。

其中,时间格式一中每部分的关键词对应时间偏移参数,时间偏移参数以天为单位,将关键词与时间偏移参数采用时间偏移参数映射表的形式进行存储,其中时间偏移参数映射表可以如表一所示。

表一:

在表一中,“-”号表示向后(过去)偏移,“+”号表示向前(未来)偏移。例如“-1”表示向后偏移一天,即昨天,“+1”表示向前偏移一天,即明天,“中间无任何数字”是指缺少第二部分时对应的偏移值,例如在“前天”中“前”对应的偏移值为“-2”,而“前三天”中“前”对应的偏移值为“-1”。

其中,当确定了各部分对应的时间偏移参数之后,本实施例将各部分相乘的结果作为最终的时间偏移量,例如:“今天”中第一部分和第三部分分别对应的时间偏移参数为“0”和“1”,则“今天”对应的最终的时间偏移量为0*1=0,又例如“近10天”中第一部分“近”对应的时间偏移参数为“-1”,中间连续的数字作为一个整体,其对应的时间偏移参数为“10”,第三部分“天”对应的时间偏移参数为1,因此“近10天”对应的时间偏移量为“-1*10*1=-10”。

下面再列举一些常见的时间表达方式对应的时间偏移量,例如:

“前三天”     =-1*3*1

“昨天”       =-1*1

“上一个星期” =-1*1*1*7

“明天”       =1*1

“近一个月”      =-1*1*1*30

“近十天”     =-1*10*1

“前2天”      =-1*2*1

其中,最终的时间偏移量确定之后,采用该时间偏移量对初始化的时间搜索范围按天做时间偏移,此处可以对初始化的时间搜索范围中的起始时间(start)做时间偏移,或者可以对起始时间(start)和结束时间(end)均做时间偏移。

例如,初始化时间范围为:start(开始)=2013年8月12日00:00:00,end(结束)=2013年8月12日23:59:59。用户输入的信息为“前天的西瓜价格”。则从用户输入的信息中识别到的时间信息为“前天”,而“前天”对应的时间偏移量为“-2”,因此将start和end均向后偏移两天,得到最终的时间搜索范围为:start(开始)=2013年8月10日00:00:00,end(结束)=2013年8月10日23:59:59。又例如,用户输入的信息为“近三天鸡蛋的价格”,由于“近三天”对应的时间偏移量为-3,因此将start向后偏移三天,得到最终的时间搜索范围为:start(开始)=2013年8月9日00:00:00,end(结束)=2013年8月12日23:59:59。

对于类似“上个月”或“近三个月”这种含关键词“月”的时间表达方式,如果将今天初始化为时间范围进行偏移,可能准确度不高,这时可以考虑将本月初始化为时间搜索范围,以增加准确性。例如:初始化时间搜索范围为start(开始)=2013年8月01日00:00:00,end(结束)=2013年8月30日23:59:59。若用户输入的信息为“上个月XXX”,则由时间信息“上个月”确定时间偏移量为-30,利用-30对开始时间和结束时间均做偏移,得到最终的时间搜索范围为:start(开始)=2013年7月01日00:00:00,end(结束)=2013年7月30日23:59:59。若用户输入的为“近三个月XXX”,则由时间信息“近三个月”确定时间偏移量为-90,利用-90对开始时间做偏移,得到最终的时间搜索范围为:start(开始)=2013年5月01日00:00:00,end(结束)=2013年8月30日23:59:59。

另外,对于诸如“去年”、“近三年”,这类含关键词“年”的时间信息,可以考虑将本年度初始化为时间搜索范围,以增加确定的最终搜索时间范围的准确性。

本实施例,对于符合“时间格式一”的时间信息,通过查找各部分对应的时间偏移参数,并由各部分的时间偏移参数最终确定时间偏移量,再由该最终确定的时间偏移量对初始化的搜索时间范围做偏移,从而可以快速、准确的得到的搜索时间范围,再结合用户输入的其它关键词进行搜索,可以提高搜索结果的准确度,提高用户满意度。

请参考图3,是本发明提供的应用于搜索引擎中的搜索时间范围确定方法的第三实施例的流程示意图,其包括:

步骤S31、接收用户输入的信息,并初始化搜索时间范围。

其中,步骤S31与图2中的步骤S21相同,在此不赘述。

步骤S32、识别步骤S31中接收的信息中符合时间格式二的时间信息。

步骤S33、采用识别的符合时间格式二的时间信息对初始化的搜索时间范的年份、月份和/或日期做时间要素替换,得到最终的搜索时间范围。

其中,步骤S32可能识别到多个符合时间格式二的时间信息,例如:用户输入的是“2013年4月5日黄金的价格”,在该信息中包含了三个符合时间格式二的时间信息,分别是“2013年”、“4月”和“5日”,这些均需要分别全部识别。

其中,步骤S33中对初始化的搜索时间范围做时间要素替换是指年信息的替换、月信息的替换和/或日(号)信息替换,具体的,步骤S33包括采用识别到的年信息替换初始化的搜索时间范围中的年信息,采用识别到的月信息替换初始化的搜索时间范围中的月信息和采用识别到的日或号信息替换初始化的搜索时间范围中的日信息中的至少一项或多项。

例如:初始化搜索时间范围为:start(开始)=2013年8月12日00:00:00,end(结束)=2013年8月12日23:59:59。用户输入的是“2013年4月5日黄金的价格”,由于在该信息中包含了三个符合时间格式二的时间信息,分别是“2013年”、“4月”和“5日”,则初始化的搜索时间范围做年信息、月信息和日信息的替换后得到的搜索时间范围为:start(开始)=2013年4月5日00:00:00,end(结束)=2013年4月5日23:59:59。

下面再列举一些时间信息对应的调整方式:

“2013年6月5日”=将Start和end时间(修改年为2013,修改月为6修改日为5)

“6月5日”=将Start和end时间(修改月为6修改日为5)

“6月12号”=将Start和end时间(修改月为6修改日为12)

“12日”=将Start和end时间(修改日为12)

“六月五日”=将Start和end时间(修改月为6修改日为5)

“六月5日”=将Start和end时间(修改月为6修改日为5)

“3月十号”=将Start和end时间(修改月为3修改日为10)

“二零一二年七月二日”=将Start和end时间(修改年为2012修改月为7修改日为2)

本实施例,对于用户输入信息中含有的年信息、月信息和/或日信息,将其采用时间格式二识别出来,然后直接替换时间搜索范围内相应的年信息、月信息和/或日信息,确定最终的搜索时间范围。

请参考图4,是本发明提供的应用于搜索引擎中的搜索时间范围确定方法的第四实施例的流程示意图,其包括:

步骤S41、接收用户输入的信息,并初始化搜索时间范围。

步骤S42、判断接收的信息中是否有时间格式匹配时间格式一;若是,执行步骤S43,否则执行步骤S44。

步骤S43、按照图2述及的方式,确定最终的搜索时间范围,结束流程。

步骤S44、判断接收的信息中是否有时间信息匹配时间格式二;若是,执行步骤S45,否则结束流程。

步骤S45、按照图3述及的方式,确定最终的搜索时间范围,结束流程。

在实际应用中,对于用户输入的信息,不仅可以采用图2或图3的方式确定最终的搜索时间范围,还可以综合运用两种方式,即当一种方式不能识别时,还可以尝试运用另一种。S44和S42的先后顺序没有绝对限制,也可以先采用S44判断接收的信息中是否有时间信息匹配时间格式二,若否再执行步骤S42判断接收的信息中是否有时间格式匹配时间格式一。

请参考图5,是本发明提供的应用于搜索引擎中的搜索时间范围确定装置的实施例的结构示意图,其包括:

接收和初始化模块1,用于接收用户输入的信息,并初始化搜索时间范围。

其中,用户输入的信息可以是诸如“2013年6月5日白菜的价格,今天西瓜的价格,明天的优惠活动,上个星期的新闻,近三天的工作有哪些,近一年的房屋交易情况”等含有时间信息的搜索式。

其中,初始化搜索时间范围时,可以将今天初始化搜索时间范围,例如:当今天为2013年8月12日时,则初始化时间范围为:start(开始)=2013年8月12日00:00:00,end(结束)=2013年8月12日23:59:59。

识别模块2,用于识别中接收的信息中符合预定的时间格式的时间信息,预定的时间格式包括时间格式一和/或时间格式二。

其中,时间格式一包括三部分,其中第一部分主要为:今、昨、明、前、近、上、后和大后中任一,第二部分主要为数字,第三部分主要为:日、天、月、周、年、号、星期和礼拜中任一,其中第二部分可以缺省,例如:有些时间的表达式为“前三天”,此时三部分均有,而有些时间的表达式为“前天”,此时缺少第二部分,但这是允许的。

其中,时间格式一中每部分的关键词对应时间偏移参数,时间偏移参数以天为单位,将关键词与时间偏移参数采用时间偏移参数映射表的形式进行存储,其中时间偏移参数映射表可以如前面的表一所示。

其中,时间格式二主要由第四部分和第五部分组成,其中第一部分为数字,第二部分为:月、日、年和号中任一,其常见的表现形式为诸如“02年”、“25号”、“8月”、“13日”,等等。

处理模块3,用于采用所述识别出的符合预定的时间格式的时间信息对所述初始化的搜索时间范围做调整,得到最终的搜索时间范围。

处理模块3包括第一处理单元31、第二处理单元32和第三处理单元33。

第一处理单元31,用于当预定的时间格式包括时间格式一时,采用识别出的符合预定的时间格式的时间信息对初始化的搜索时间范围做时间偏移。

第二处理单元32,用于当预定的时间格式包括时间格式二时,采用识别出的符合预定的时间格式的时间信息对初始化的搜索时间范围做时间要素替换。

第三处理单元33,用于当预定的时间格式包括时间格式一和时间格式二时,判断所述接收的信息中是否含有符合时间格式一/时间格式二的时间信息;若是,则对初始化的搜索时间范围做时间偏移/时间要素替换;若否,再判断所述接收的信息中是否含有符合时间格式二/时间格式一的时间信息;若是,则对初始化的搜索时间范围做时间要素替换/时间偏移。

如图6所示,第一处理单元31在一种实施方式中包括:

确定子单元311,用于确定所述识别到的符合时间格式一的时间信息中各部分对应的时间偏移参数。

相乘子单元312,用于将所述确定单元31确定的各部分对应的时间偏移参数的乘积作为最终的时间偏移量。

第一偏移子单元313,用于采用所述最终的时间偏移量对所述初始化的搜索时间范围作偏移。

如图7所示,第二处理单元32在其一种实施方式中,主要包括:

年信息替换子单元321,用于采用识别到的年信息替换初始化的搜索时间范围中的年信息。

月信息替换子单元322,用于采用识别到的月信息替换初始化的搜索时间范围中的月信息。

日信息替换子单元323,用于采用识别到的日或号信息替换初始化的搜索时间范围中的日信息。

如图8所示,第三处理单元33在其一种实施方式中,主要包括:

判断子单元333,用于判断接收的信息中是否含有符合时间格式一/时间格式二的时间信息;若是,则调用第二偏移子单元331/信息替换子单元332对初始化的搜索时间范围做时间偏移/时间要素替换;若否,再判断接收的信息中是否含有符合时间格式二/时间格式一的时间信息;若是,则调用信息替换子单元332/第二偏移子单元331对初始化的搜索时间范围做时间要素替换/时间偏移

第二偏移子单元331具体用于:确定所述识别到的符合时间格式一的时间信息中各部分对应的时间偏移参数,所述时间偏移参数以天为单位;将确定的各部分对应的时间偏移参数的乘积作为最终的时间偏移量;采用所述最终的时间偏移量对所述初始化的搜索时间范围作偏移。

信息替换子单元332具体用于:采用识别到的年信息替换初始化的搜索时间范围中的年信息,采用识别到的月信息替换初始化的搜索时间范围中的月信息和采用识别到的日或号信息替换初始化的搜索时间范围中的日信息。

本发明实施例,对于用户输入的信息,识别其中与预定的时间格式匹配的时间信息,并根据该识别到的时间信息对初始化的搜索时间范围做偏移或者做时间要素的替换,以此确定最终的搜索时间范围,此种方式,不需要用户按照固定的格式在时间信息框中输入时间,也不需要用户从时间选择框中选择时间,用户只需要按照正常的时间表达方式输入含时间信息的信息即可以,例如直接输入“近一周鸡蛋的价格”即可,因此可以降低用户的操作复杂度,提高用户的体验度,同时也可以使得相应的网页搜索界面更简洁。

最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号