首页> 中国专利> 信息提供系统、信息提供方法、以及知识数据的数据结构

信息提供系统、信息提供方法、以及知识数据的数据结构

摘要

本发明可以使用户对所需要的知识数据的信息获取变得容易。信息提供系统(1)存储与应答内容相对应的询问字符串,存储设定有同义词的同义词词典,所述同义词由被定义为彼此含义近似的多个词组成,接收由用户操作的用户终端(100)输入的输入字符串,基于同义词词典对输入字符串所包括的词进行转换而作为搜索字符串,确定与该搜索字符串相关联的询问字符串,将所确定的询问字符串发送到用户终端(100)。

著录项

  • 公开/公告号CN112955882A

    专利类型发明专利

  • 公开/公告日2021-06-11

    原文格式PDF

  • 申请/专利权人 环球娱乐株式会社;

    申请/专利号CN201980071378.1

  • 发明设计人 逸见拓生;佐藤淳一;

    申请日2019-10-23

  • 分类号G06F16/90(20060101);G06F16/903(20060101);

  • 代理机构11400 北京商专永信知识产权代理事务所(普通合伙);

  • 代理人黄谦;杨阳

  • 地址 日本国东京都

  • 入库时间 2023-06-19 11:21:00

说明书

技术领域

本发明涉及信息提供系统、信息提供方法、以及知识数据的数据结构。

背景技术

近年来,关于针对来自用户的询问搜索最佳答案并进行应答的系统的研究正在盛行。此外,与这样的系统的开发相关联地,有关用于对从用户输入的询问的句法和含义进行分析、或者搜索针对询问的答案的自然语言处理技术和人工智能技术的研究也在进行中。

例如,已经提出了一种对询问进行应答并输出被评估为最佳的回答候选的询问应答系统(参照专利文献1)。该询问应答系统的构成如下:搜索针对询问的回答候选,针对询问和回答候选的各种组合,使用学习功能计算出表示各回答案候选是针对该询问的正确回答的程度的分数,根据计算出的分数,输出是针对询问的正确回答的可能性最高的回答候选。

此外,公开了一种请求内容识别系统,该请求内容识别系统对用自然语言记述了来自用户的请求而得到的输入句进行分析,判别该输入句的请求内容是否符合事先定义的请求内容,由此,识别/输出输入句的请求内容(参照专利文献2)。

现有技术文献

专利文献

专利文献1:日本特开2013-171550号公报

专利文献2:日本专利第5099367号说明书

发明内容

发明要解决的问题

在上述以往的系统中,用户通常进行这样的操作:搜索针对自身所需要的请求内容的询问内容,从搜索结果中选择被认为与请求内容相对应的询问内容。然而,在上述以往的系统中,存在以下问题:在最初的询问内容的搜索中没有被认为与请求内容相对应的询问内容的情况下,需要重复进行搜索,直到与请求内容相对应的询问内容表示为搜索结果。

因此,本发明的目的在于提供可以使用户对所需要的知识数据的信息获取变得容易的信息提供系统、信息提供方法、以及知识数据的数据结构。

用于解决问题的手段

本发明的信息提供系统的特征在于,具有:

知识数据存储部,存储与应答内容相对应的询问字符串;

同义词存储部,存储设定有同义词的同义词词典,所述同义词由被定义为彼此含义近似的多个词组成;

接收部,接收由用户操作的用户终端输入的输入字符串;

搜索部,基于所述同义词词典对所述输入字符串所包括的词进行转换而作为搜索字符串,确定与所述搜索字符串相关联的所述询问字符串;以及

发送部,将所述确定的询问字符串发送到所述用户终端。

根据上述结构,由于将用户输入的输入字符串通过同义词词典进行转换而作为搜索字符串,并且,确定相关联的询问字符串,因而也可以确定包括在通常的搜索中所确定的同义词的询问字符串,可以获取用户需要的回答内容的可能性提高。因此,可以使用户对所需要的知识数据的信息获取变得容易。

此外,在本发明的信息提供系统中,也可以是,

在所述同义词词典中,所述同义词中的某一个被设定为代表词,

所述知识数据存储部将所述询问字符串与标准化字符串相对应地存储,所述标准化字符串是基于所述同义词词典将所述询问字符串所包括的词转换为代表词而得到的字符串,

所述搜索部基于所述同义词词典将所述输入字符串所包括的词转换为代表词而作为搜索字符串,

使用所述搜索字符串选出所述标准化字符串,并且确定与所述选出的标准化字符串相对应的所述询问字符串。

根据上述结构,通过将用户输入的输入字符串基于同义词词典转换为代表词而得到的搜索字符串来搜索知识数据存储部。由于将询问字符串基于同义词词典转换为代表词而得到的标准化字符串与询问字符串相对应地存储在知识数据存储部内,因而只要是登记在同义词词典中的词,就作为搜索结果而命中,而不用花费事先用统一的词登记询问字符串的劳力。由此,作为用户需要的应答内容的候选,与使用用户输入的输入字符串进行直接搜索相比,可以提高将更多的询问字符串的信息提供给用户的可能性,能够使用户对所需要的知识数据的信息获取变得容易。

此外,在本发明的信息提供系统中,也可以是,

每当所述用户进行操作时,所述用户终端确定所述输入字符串并将所确定的输入字符串发送到所述接收部,

每当接收来自所述发送部的所述询问字符串时,可选择地提示该询问字符串。

由此,每当用户进行操作时,用户终端实时可选择地提示询问字符串,因而可以减少每当更新输入字符串时进行搜索并选择询问字符串这样的麻烦。

此外,在本发明的信息提供系统中,其特征在于,所述知识数据存储部将构成所述同义词的多个词各自的输入转换用字符串与所述代表词相对应地进行存储。

根据上述结构,通过将输入转换用字符串存储在同义词词典中,仅通过指定同义词的一部分的读音假名或字母作为输入字符串,就可以提高可以获取用户需要的应答内容的可能性。

本发明的信息提供控制方法,其由具有存储部的计算机执行,其特征在于,包括:

存储与应答内容相对应的询问字符串;

存储设定有同义词的同义词词典,所述同义词由被定义为彼此含义近似的多个词组成;

接收由用户操作的用户终端输入的输入字符串;

基于所述同义词词典对所述输入字符串所包括的词进行转换而作为搜索字符串,确定与所述搜索字符串相关联的所述询问字符串;以及

将所述确定的询问字符串发送到所述用户终端。

根据上述结构,由于将用户输入的输入字符串通过同义词词典进行转换而作为搜索字符串,并且,确定相关联的询问字符串,因而也可以确定包括在通常的搜索中所确定的同义词的询问字符串,可以获取用户需要的回答内容的可能性提高。因此,可以使用户对所需要的知识数据的信息获取变得容易。

本发明的知识数据的数据结构,其在具有可访问同义词存储部的控制部的计算机中使用,并且,存储在所述计算机具有的存储部内,所述同义词存储部存储设定有同义词的同义词词典,所述同义词由被定义为彼此含义近似的多个词组成,所述知识数据的数据结构的特征在于,

所述数据结构包括使询问字符串和应答内容相对应的结构,

所述数据结构使所述控制部针对由用户操作的用户终端输入的输入字符串,生成基于所述同义词词典对所述输入字符串所包括的词进行转换而得到的搜索字符串,确定与所述搜索字符串相关联的所述询问字符串。

根据上述结构,由于将用户输入的输入字符串通过同义词词典进行转换而作为搜索字符串,并且,确定相关联的询问字符串,因而也可以确定包括在通常的搜索中所确定的同义词的询问字符串,可以获取用户需要的回答内容的可能性提高。因此,可以使用户对所需要的知识数据的信息获取变得容易。

发明的效果

可以使用户对所需要的知识数据的信息获取变得容易。

附图说明

图1是示出信息提供系统的概略结构的说明图。

图2是示出信息提供系统的电气结构的框图。

图3是信息提供系统的功能框图。

图4是知识数据表的说明图。

图5是同义词词典数据表的说明图。

图6是建议数据表的说明图。

图7是建议数据登记处理的流程图。

图8是询问应答处理的流程图。

图9是示出用户终端中的输入画面的变形例的说明图。

图10是询问应答请求处理的流程图。

图11是示出同义词词典数据表的变形例的说明图。

图12是示出用户终端中的输入画面的变形例的说明图。

具体实施方式

以下,参照附图对本发明的信息提供系统进行说明。

如图1所示,本实施方式的信息提供系统1具有信息提供服务器200,该信息提供服务器200经由包括互联网的网络700从用户终端100可进行数据通信地连接。另外,本实施方式的信息提供系统1由信息提供服务器200构成,但不限于此。以下说明的信息提供服务器200的各功能也可以在信息提供系统1中分散设置在多个服务器中。即,信息提供服务器200的各功能也可以是信息提供系统的构成要素中的某一个所具备的功能。以下,对用作信息提供系统1的信息提供服务器200进行说明。

在用户终端100中安装有用于访问信息提供系统1提供的服务的WEB浏览器。即,用户经由WEB浏览器访问信息提供系统1。另外,在本实施方式中例示的用户终端100是所谓的智能电话,但是也可以是便携式和固定式计算机中的任一种。作为便携式用户终端100,可以例示出:便携式计算机、膝上型计算机、平板型个人计算机、可穿戴型个人计算机、PDA(Personal Data Assistant,个人数据助理)等便携式信息设备。

用户在通过用户终端100中执行的WEB浏览器所显示的信息提供系统1的WEB站点的输入区域1010中,例如,使用键盘或触摸面板输入字符串。然后,用户使用例如鼠标或触摸面板来指定同一WEB站点的搜索按钮1011。结果,由用户输入的输入字符串作为请求被发送到信息提供服务器200。

另外,在本实施方式中,为了从用户终端100发送输入字符串,操作搜索按钮1011,但不限于此。例如,也可以在每当改变输入到输入区域1010的文本时,通过后台将输入区域1010内的该文本作为输入字符串发送到信息提供系统1。

在此,由用户输入的输入字符串通常是文章(输入句)的形式,例如,包括关于提供与该WEB页面有关的WEB站点的公司的产品的询问等,并且,通过自然语言来表达。以下,有时将来自用户的输入表达为“输入句”。另外,输入字符串也可以不是文章的形式,而是指包含词或文章的一部分等的各种输入字符串。

信息提供服务器200在接收到来自用户终端100的输入字符串时,决定与该输入字符串相对应的询问字符串,并且将其经由网络700发送到用户终端100。用户终端100显示将来自信息提供服务器200的询问字符串显示在搜索结果区域1012中的画面。结果区域1012中显示的询问字符串是去往WEB站点的URL的链接,该WEB站点表示与该询问字符串相对应的应答内容,用户可以通过指定询问字符串来识别与询问字符串相对应的应答内容。

另外,优选的是,每当改变输入到输入区域1010的文本时,在通过后台将输入区域1010内的该文本作为输入字符串发送到信息提供系统1的情况下,实时可选择地提示与输入区域1010内的文本相对应的询问字符串,而不伴随画面迁移。

这样,信息提供服务器200构成为能够访问应答内容与询问字符串相对应的知识数据。即,构成为能够将用于访问与所确定的询问字符串相对应的应答内容的信息提供给用户终端100。

更具体地,信息提供服务器200具有:知识数据库300、同义词词典数据库400、以及建议数据库500。作为知识数据存储部的知识数据库300存储应答内容与询问字符串相对应的知识数据。信息提供服务器200在将用于访问与所确定的询问字符串相对应的应答内容的信息发送到用户终端100时,参照知识数据库300。例如,在用户指定了“我想知道价格”的询问字符串的情况下,信息提供服务器200参照知识数据库300,将与该询问字符串相对应的“价格为XX”的应答内容提供给用户。

作为同义词存储部的同义词词典数据库400存储同义词词典,在该同义词词典中设定有由被定义为彼此含义近似的多个词组成的同义词。例如,作为被定义为彼此含义近似的多个词的一个同义词的数据,具有表示“金额”(cost)、“价格”(fee)、“费用”(amount)、“价钱”(price)的信息。同义词词典数据库400存储多个这样的同义词。

另外,在存储在同义词词典数据库400中的同义词词典中,也可以将同义中的任一个设定为代表词。即,代表词是表示设定为同义词的彼此含义近似的多个词中的一个的信息。这样,同义词词典数据库400存储同义词中的一个词被设定为代表词的同义词词典。即,存储在同义词词典数据库400中的1个数据是包括同义词的信息和表示这些同义词中的一个词是代表词的信息的数据。例如,同义词词典数据库400具有表示同义词是“金额”(cost)、“价格”(fee)、“费用”(amount)、“价钱”(price)的信息,并且,具有表示将其中的“金额”(cost)设定为代表词的信息。信息提供服务器200在将询问字符串转换为标准化字符串时参照同义词词典数据库400。此外,在将来自用户的输入字符串转换为搜索字符串时,信息提供服务器200参照同义词词典数据库400。

另外,在使用汉字作为同义词的情况下,也可以将该读音假名作为同义词登记在同义词词典数据库400中。通常,在使用汉字的语言的情况下,在输入文本时,例如通过字母的组合来指定“读音假名”,并且,将其转换为汉字来确定输入。通过登记同义词的读音假名,即使在“读音假名”的状态下确定了输入的情况下或者将其转换为汉字之前,也能够将来自用户的输入字符串转换为搜索字符串。

建议数据库500将询问字符串和标准化字符串相对应地存储。标准化字符串是将询问字符串包括的词基于同义词词典数据库400的同义词词典转换为代表词的字符串。以下,标准化表示针对字符串中包括的词,将登记在同义词词典数据库400中的同义词中包括的词转换为被设定为该同义词的代表词。例如,在询问字符串包括“价格”、“费用”、“价钱”的情况下,在登记到建议数据库500中时通过标准化将它们全部转换为“金额”来登记。即,在询问字符串是“我想知道价格”的情况下,标准化字符串成为“我想知道金额”。

另外,存储在建议数据库500中的“询问字符串”不限于“询问字符串”本身,只要是表示是存储在知识数据库300中的任何数据的信息即可。例如,在通过唯一密钥(uniquekey)确定登记于知识数据库300中的询问字符串的情况下,只要在建议数据库500中使该唯一密钥与标准化字符串相对应即可。此外,可以在建议数据库500中登记“询问字符串”和“标准化字符串”的“读音假名”。

此外,存储在建议数据库500中的询问字符串与标准化字符串之间的对应关系也可以存储在知识数据库300中。即,知识数据库300也可以存储与应答内容相对应的询问字符串,并且,将该询问字符串与基于同义词词典将该询问字符串包括的词转换为代表词而得到的标准化字符串相对应地存储。

包括这些数据库300、400、500的信息提供服务器200接收由用户操作的用户终端100输入的输入字符串,基于同义词词典对输入字符串包括的词进行转换而作为搜索字符串,确定与搜索字符串相关联的询问字符串,将所确定的询问字符串发送到用户终端100。

如图1所示,在本实施方式中,信息提供服务器200构成为,接收从用户终端100输入的输入字符串,基于同义词词典数据库400的同义词词典进行转换而作为搜索字符串,使用搜索字符串选出建议服务器500的标准化字符串,确定与所选出的标准化字符串相对应的询问字符串,将其发送到用户终端100。

这样,基于同义词词典数据库400将用户输入的输入字符串标准化为搜索字符串,通过该搜索字符串搜索建议数据库500。由于将询问字符串进行标准化而得到的标准化字符串与询问字符串相对应地存储在建议数据库500内,因而只要是登记在同义词词典数据库400中的词,就会作为搜索结果命中,而不用花费预先将询问字符串以统一的词进行登记的劳力。由此,作为用户需要的应答内容的候选,与使用用户输入的输入字符串直接搜索知识数据相比,可以提高将更多的询问字符串的信息提供给用户的可能性,能够使用户对所需要的知识数据的信息获取变得容易。

另外,不限于这样的结构,例如,也可以采用这样的结构:针对来自用户终端100的输入字符串,基于同义词词典,生成与输入字符串相对应的一个以上的搜索字符串,通过该一个以上的搜索字符串,搜索作为知识数据存储部的知识数据库300。这样,由于将用户输入的输入字符串通过同义词词典转换为搜索字符串,并且,确定相关联的询问字符串,因而在通常的搜索中也可以确定包括所确定的同义词的询问字符串,提高了可以获取用户需要的应答内容的可能性。

即,知识数据的数据结构在具有可访问同义词数据库400的控制部的计算机中使用,并且,存储在该计算机具有的存储部内,该同义词数据库400存储设定有同义词的同义词词典,该同义词由被定义为彼此含义近似的多个词组成。然后,知识数据的数据结构包括使询问字符串和应答内容相对应的结构,使控制部针对由用户操作的用户终端输入的输入字符串,生成基于所述同义词词典对该输入字符串包括的词进行转换而得到的搜索字符串,并且,确定与所述搜索字符串相关联的所述询问字符串。

此外,登记在建议数据库500中的信息提供用搜索数据的数据结构构成为包括这样的结构:将询问字符串与标准化字符串相对应,该标准化字符串是根据同义词中的一个被设定为代表词的同义词词典数据库400将询问字符串包括的词转换为代表词而得到的字符串。该信息提供用搜索数据通过具有这样的数据结构而实现以下处理:在信息提供服务器200中进行搜索,并且,基于该搜索结果确定询问字符串,其中,在该搜索中,基于同义词词典数据库400将从用户操作的用户终端100输入的输入字符串转换为代表词而得到的搜索字符串作为搜索密钥,并且,将建议数据库500的标准化字符串作为搜索对象。

这样,数据结构包括将在同义词词典数据库400中进行了标准化的标准化字符串与询问字符串相对应的结构,并且,基于该数据结构,实现了将从用户输入的输入字符串进行了标准化的搜索字符串作为搜索密钥,并且,将该数据结构的标准化字符串作为搜索对象的搜索处理,以及询问字符串的确定处理。由此,作为用户需要的应答内容的候选,与使用用户输入的输入字符串直接搜索知识数据相比,可以提高将更多的询问字符串的信息提供给用户的可能性,能够使用户对所需要的知识数据的信息获取变得容易。

这里,在信息提供系统1作为能够由未确定的用户利用的信息提供系统来提供的情况下,作为用户,设想了对提供WEB站点的企业或组织(的商品、服务等)进行询问等的普通用户,用户终端100通常是能够连接到互联网等的用户所拥有的PC(个人计算机)等。此外,也可以将信息提供系统1用作在限定的范围内利用的系统(例如,企业内知识共享系统),在这种情况下,用户成为具有针对信息提供系统1的合法访问权限的特定用户。

此外,进行上述的数据库构建、数据追加等管理的是信息提供系统1的系统管理员。在信息提供系统1被用作受理关于企业或组织的商品和服务等的询问的系统的情况下,通常,该企业或组织的负责人成为系统管理员。此外,也有代理店或受托公司代替该企业或组织成为系统管理员的情况。

在图1中,采用用户通过使用键盘等在WEB站点的输入区域内输入字符串来将询问等提供给信息提供系统1的结构,然而作为信息提供系统1,也可以通过任何方法/途径来输入字符串。例如,在用户通过语音发出询问的情况下,可以对该语音施加语音识别处理并转换为字符串,并且,将该转换后的字符串提供给信息提供系统1。此外,还可以将所打印的询问事项等通过OCR(Optical Character Recognition,光学字符识别)转换为字符串,将该转换后的字符串提供给信息提供系统1。

另外,本实施方式的信息提供服务器200还具有WEB服务器的功能,该WEB服务器动作成,通过在用户终端100或未图示的系统管理员的终端中执行的WEB浏览器和http等的协议来进行数据收发,并且,在该WEB浏览器显示预定的WEB页面。此外,尽管信息提供服务器200在这里示出为一台计算机,但是也可以构成为通过多台计算机分散执行相同的功能。在这种情况下,通过这些多个计算机(服务器)构建信息提供系统1。

如图2所示,用户终端100在壳体内包括:CPU 2101、ROM 2102、RAM 2103、闪存2104、操作按钮2108、电源开关2109、总线2110、网络I/F 2111、相机2112、摄像元件I/F2113、麦克风2114、扬声器2115、声音输入/输出I/F 2116、显示器I/F 2117、传感器控制器2118、近距离通信电路2119、近距离通信电路2119的天线2119a。

此外,信息提供服务器200是具备CPU 1101、ROM 1102、RAM 1103、硬盘驱动器等的存储装置1104、网络I/F 1111的所谓的计算机。

CPU(Central Processing Unit,中央处理单元)2101用作用户终端100中的控制器的主要结构,控制整个用户终端100的动作。CPU 1101用作信息提供服务器200中的控制部的主要结构,控制整个信息提供服务器200的动作。即,CPU 1101用作控制整个信息提供系统1的动作的控制器。ROM(Read Only Memory,只读存储器)2102存储IPL(InitialProgram Loader,初始程序加载器)等的用于驱动CPU 2101的程序。

RAM(Random Access Memory,随机存取存储器)2103/RAM 1103用作CPU 2101/CPU1101的工作区。操作按钮2108是在初始设定用户终端100的情况下等操作的按钮。电源开关2109是用于切换用户终端100的电源的接通/断开的开关。

作为存储器的闪存2104是存储WEB浏览器等的程序、通信用程序、图像数据、以及声音数据等各种数据的计算机可读取的非瞬态记录介质。存储装置1104是存储上述各种数据库的计算机可读取的非瞬态记录介质。信息提供服务器200针对来自用户终端100的WEB浏览器等的应用程序的请求,适当地参照存储装置1104的数据库并返回应答。

例如,存储装置1104存储包括作为控制器的CPU 1101执行的程序的各种程序和各种程序使用的各种数据。换句话说,该程序使信息提供服务器200执行各种程序所具有的处理,该信息提供服务器200是具备CPU 1101和存储装置1104的计算机。在将信息提供服务器200视为信息提供系统1的情况下,存储装置1104存储包括作为控制器的CPU 1101执行的程序的各种程序和各种程序使用的各种数据。换句话说,该程序使信息提供服务器200执行各种程序所具有的处理,该信息提供服务器200是具备CPU 1101和存储装置1104的信息提供系统1。这样,信息提供系统1的处理、动作可以代替为程序、信息提供方法。

另外,存储在闪存2104和存储装置1104中的数据和程序既可以在工厂出厂阶段中预先存储,也可以从未图示的服务器等通过通信手段下载并存储。通信手段既可以是互联网和有线电视等的可双向通信的传送路径,也可以是仅沿一方向发送信息的广播。另外,存储在闪存2104和存储装置1104中的数据和程序也可以存储在软盘、CD-ROM、DVD-ROM、MO(光磁盘)、闪存等记录介质中,并且,根据需要从记录介质中读出并安装。

网络I/F(Interface,接口)2111/网络I/F 1111是用于利用互联网等通信网络进行数据通信的接口。相机2112是根据CPU 101的控制摄像被摄体而获得图像数据的内置型的摄像装置的一种。摄像元件I/F 2113是控制相机2112的驱动的电路。麦克风2114是输入语音的内置型的集音装置的一种。声音输入/输出I/F 2116是根据CPU 101的控制,在麦克风2114和扬声器2115之间处理声音信号的输入/输出的电路。显示器I/F 2117是根据CPU2101的控制将图像数据发送到显示器2120的电路。显示器2120设置在壳体的前面处。传感器控制器2118是接收来自设置于显示器2120处的触摸面板的输入的电路。近距离通信电路2119是NFC(Near Field Communication,近场通信)(注册商标)、Bluetooth(蓝牙)(注册商标)等的通信电路。总线2110是用于电连接CPU 101等的各构成要素的地址总线、数据总线等。

如图3所示,信息提供系统1具有以下功能。具体地,信息提供系统1具有:同义词词典访问部601、词素分析部602,询问应答部603、以及建议登记部604。

同义词词典访问部601具有在用代表词对字符串进行标准化时访问同义词词典数据库400的功能。词素分析部602具有将字符串划分为最小单位的功能。更具体地,词素分析部602具有对来自用户终端100的输入字符串进行词素分析并提取要转换为代表词的词的功能。关于词素分析,能够使用已知的各种方法。

询问应答部603具有基于来自用户终端100的输入字符串,向用户终端100发送询问字符串和/或表示应答内容的信息的功能。具体地,询问应答部603具有:输入字符串接收部631、输入字符串标准化部632、建议DB搜索部633、知识数据访问部634、以及询问字符串发送部635。

输入字符串接收部631具有接收来自用户终端100的输入字符串的功能,并且,具有将输入字符串发送到输入字符串标准化部632的功能。输入字符串标准化部632具有将来自输入字符串接收部631的输入字符串发送到词素分析部602并从词素分析部602接收词素分析结果的功能,具有从该词素分析结果中提取应转换为代表词的词的功能,具有将该词发送到同义词词典访问部601并从同义词词典访问部601接收转换后的代表词的功能,具有基于接收到的代表词生成转换了输入字符串后的搜索字符串的功能,以及具有将该搜索字符串发送到建议DB搜索部633的功能。建议DB搜索部633具有执行将搜索字符串作为搜索关密钥字并将建议数据库500的标准化字符串作为搜索对象的搜索的功能,并且,具有将确定询问字符串的搜索结果发送到知识数据访问部634的功能。知识数据访问部634具有从搜索结果参照知识数据库300并确定询问字符串和/或表示应答内容的信息的功能,并且,具有将确定的询问字符串和/或表示应答内容的信息发送到询问字符串发送部635的功能。询问字符串发送部635具有将询问字符串和/或表示应答内容的信息发送到用户终端100的功能。

建议登记部604具有将询问字符串和标准化字符串与建议数据库500相对应地进行登记的功能。具体地,建议登记部604具有:登记字符串接收部641、登记字符串标准化部642、以及建议数据登记部643。登记字符串接收部641具有接收来自未图示的管理员的管理终端的登记字符串的功能。这里,登记字符串是在知识数据库300中登记的询问字符串。另外,在知识数据库300中,在询问字符串与唯一密钥相对应时,登记字符串接收部641从管理终端接收唯一密钥,并基于唯一密钥从知识数据库300接收询问字符串。即,登记字符串接收部641也可以具有访问知识数据库300的功能。登记字符串标准化部642具有将接收到的询问字符串发送到词素分析部602并从词素分析部602接收词素分析结果的功能,具有从该词素分析结果中提取应转换为代表词的词的功能,具有将该词发送到同义词词典访问部601并从同义词词典访问部601接收转换后的代表词的功能,具有基于接收到的代表词生成转换了询问字符串后的标准化字符串的功能,以及具有将该标准化字符串发送到建议数据登记部643的功能。建议数据登记部643具有从登记字符串标准化部642接收标准化字符串的功能,并且,具有将标准化字符串与询问字符串或表示询问字符串的唯一密钥相对应并登记在建议数据库500中的功能。

在本实施方式中,假设信息提供服务器200具有这些功能来说明处理和动作,但是也可以将功能分散到信息提供系统1的构成要素。此外,信息提供系统1的上述功能也可以作为另一系统的附加模块来动作。

对存储在信息提供服务器200中的知识数据库300、同义词词典数据库400、以及建议数据库500的数据表的一例进行说明。

如图4所示,知识数据表具有知识ID栏、询问栏、以及应答栏。知识ID栏存储有用于识别各询问的唯一密钥。询问栏存储有用于提示给用户的询问字符串。应答栏存储有显示与询问字符串相对应的应答的WEB站点的URL。另外,也可以在应答栏直接存储针对询问字符串的应答内容。

如图5所示,同义词词典数据表具有代表词栏和同义词栏。代表词栏存储有同义词组中的一个。同义词栏与代表词相对应地存储有包括该代表词的同义词组。另外,同义词组也可以不包括代表词。在对字符串进行标准化时参照同义词词典数据表。

例如,在“金额”、“价格”、“费用”、“价钱”的同义词组中,作为代表词设定了“金额”。即,在将包括这些同义词的询问字符串标准化并转换为标准化字符串的情况下,或者,在将包括这些同义词的输入字符串标准化并转换为搜索字符串的情况下,所有这些同义词都被转换为“金额”。

如图6所示,建议数据表具有知识ID栏、询问栏、检索对象栏。知识ID栏存储有用于识别各询问的唯一密钥。询问栏存储有用于提示给用户的询问字符串。搜索对象栏存储有将对应的询问字符串标准化而得到的标准化字符串。

例如,在询问字符串为“我想知道价格”的情况下,参照同义词数据库400的同义词数据表(参照图5),与其对应的标准化字符串被标准化为“价格”是代表词的“金额”而成为“我想知道金额”的字符串。此外,在询问字符串是“我想知道价钱的修改时期”的情况下,与其对应的标准化字符串被标准化为“价钱”是代表词的“金额”并且被转换成“修改”是代表词的“变更”而成为“我想知道金额的变更时期”的字符串。这里,“时期”已经是代表词,因而不会转换。

接下来,对由信息提供服务器1的CPU 1101执行的程序进行说明。

对由信息提供服务器1的CPU 1101执行的建议数据登记处理进行说明。

如图7所示,首先,CPU 1101判定是否已接收到登记字符串(S10)。在未接收到登记字符串的情况下(S10:否),CPU 1101重复执行步骤S10,等待接收登记字符串。在接收到登记字符串的情况下(S10:是),CPU 1101对接收到的登记字符串进行词素分析处理(S11)。然后,CPU 1101确定登记字符串中的成为进行标准化的对象的词(S12)。例如,CPU 1101通过词素分析来确定各词素的词性的种类,将被确定为普通名词和さ变名词的词素作为标准化的对象。

然后,CPU 1101从同义词词典数据库400的同义词栏中搜索作为标准化对象的词素(S13)。然后,CPU 1101将作为标准化对象的词素转换为对应的代表词(S14)。另外,尽管未图示,但是在作为标准化对象的词素未包括在同义词栏中的情况下,CPU 1101将处理转移到步骤S15,而不进行转换。

然后,CPU 1101判定接收到的登记字符串中的作为标准化对象的词素的转换是否全部完成(S15)。在转换未全部完成的情况下(S15:否),CPU 1101将处理转移到步骤S13。在转换全部完成的情况下(S15:是),CPU 1101将转换完成的登记字符串作为标准化字符串登记在建议数据库500中(S16),结束本例程。

另外,本例程也可以在知识数据库300的构建或更新时自动执行。例如,也可以在未图示的知识数据库300的构建处理或更新处理结束之后,针对知识数据库300包括的全部询问字符串或更新后的询问字符串,自动地执行本例程。

接下来,对由信息提供服务器1的CPU 1101执行的问答应答处理进行说明。

如图8所示,首先,CPU 1101判定是否接收到输入字符串(S20)。在未接收到输入字符串的情况下(S20:否),CPU 1101重复执行步骤S20,等待输入字符串的接收。在接收到输入字符串的情况下(S20:是),CPU 1101对接收到的输入字符串进行词素分析处理(S21)。然后,CPU 1101确定输入字符串中的成为进行标准化的对象的词(S22)。例如,CPU 1101通过词素分析确定各词素的词性的种类,将被确定为普通名词和さ变名词的词素作为标准化的对象。

然后,CPU 1101从同义词词典数据库400的同义词栏中搜索作为标准化对象的词素(S23)。然后,CPU 1101将作为标准化对象的词素转换为对应的代表词(S24)。例如,在输入字符串是“费用”的情况下,输入字符串被转换为包括“费用”的同义词组的代表词即“金额”。另外,尽管未图示,但是在作为标准化的对象的词素未包括在同义词栏中的情况下,CPU 1101将处理转移到步骤S15,而不进行转换。

然后,CPU 1101判定接收到的输入字符串中的作为标准化对象的词素的转换是否全部完成(S25)。在转换未全部完成的情况下(S25:否),CPU 1101将处理转移到步骤S23。在转换全部完成的情况下(S25:是),CPU 1101将完成转换的词作为搜索字符串,搜索建议数据库500的搜索对象(S26)。另外,尽管未图示,但是在作为标准化对象的词素未包括在同义词栏中的情况下,CPU 1101使用作为标准化对象的词素的原样的字符串来搜索建议数据库500。

另外,在本实施方式的情况下,在存在多个转换后的词的情况下,使用这些词进行AND(“与”)搜索,但不限于此,也可以进行OR(“或”)搜索。

然后,CPU 1101从作为搜索结果而符合的标准化字符串中确定询问字符串(S27),并且,从知识数据库300中获取与该询问字符串相对应的知识数据(S28)。然后,CPU 1101将所获取的知识数据发送到用户终端100(S29),结束本例程。另外,尽管未图示,但是在没有作为搜索结果而符合的标准化字符串的情况下,CPU 1101将表示没有符合的知识数据的信息发送到用户终端100。

以上,说明了本发明的实施方式,但只不过是例示了具体例,并不是特别限定本发明,各装置等的具体结构可以适当地设计和变更。此外,本发明的实施方式中所记载的效果只不过列举了从本发明产生的最优选的效果,本发明的效果不限于在本发明的实施方式中所记载的效果。

(变形例1)

在上述的实施方式中,如图1所示,通过指定搜索按钮1011来确定输入字符串,但是在本变形例中,每当用户更新输入字符串时,确定输入字符串。

具体地,如图9所示,在显示于用户终端100处的输入画面上设置有输入区域1020。每当用户将输入字符串输入在输入区域1020中时,与输入字符串相对应的知识数据的询问字符串作为建议关键词,可选择地提示在显示于输入区域1020的下方的建议关键词区域1021。建议关键词区域1021被显示而不需要从输入画面进行画面迁移。

接下来,对由用户终端100的CPU 2101执行的询问问答请求处理进行说明。另外,用户终端100执行的询问应答请求处理的程序通过用户终端100经由浏览器访问信息提供系统1提供的WEB站点来下载。更具体地,询问应答请求处理的程序是在WEB站点的html处直接或间接地安装的脚本。

如图10所示,首先,CPU 2101判定是否更新了输入区域1020的输入字符串(S30)。在未更新输入区域1020的情况下(S30:否),CPU 2101重复执行步骤S30并等待输入区域102中的输入字符串的更新。在更新了输入区域1020的情况下(S30:是),向信息提供服务器200发送用于请求询问应答处理的请求(S31)。

然后,CPU 2101判定是否已接收到来自信息提供服务器200的包括知识数据的应答(S32)。在未接收到应答的情况下(S32:否),CPU 2101重复执行步骤S32并等待应答的接收。另外,尽管未图示,但是在应答的等待中更新了输入区域1020的输入字符串的情况下,CPU 2101将处理转移到步骤S31,忽略等待中的响应。

在接收到响应的情况下(S32:是),CPU 2101基于包括在响应中的知识数据,将包括去往表示应答内容的URL的链接的询问字符串构成为建议关键词(S33),显示在建议关键词区域1021中(S34)。

然后,CPU 2101判定是否指定了所显示的建议关键词(S35)。在未指定建议关键词的情况下(S35:否),CPU 2101将处理转移到步骤S30。在指定了建议关键词的情况下(S35:是),CPU 2101将画面迁移到该建议关键词所表示的应答内容的URL(S36),结束本例程。

这样,每当用户进行操作时,用户终端100确定输入字符串并将所确定的输入字符串发送到信息提供服务器200,每当接收到来自信息提供服务器200的询问字符串时,可选择地提示该询问字符串。即,用户终端100通过从信息提供服务器200提供的程序,实现这样的处理:每当用户进行操作时,确定输入字符串并将所确定的输入字符串发送到信息提供服务器200,每当接收到来自信息提供服务器200的询问字符串时,可选择地提示该询问字符串。换句话说,信息提供系统1具有用户终端100和信息提供服务器200,并且,执行这样的处理:每当用户进行操作时,确定输入字符串并将所确定的输入字符串发送到信息提供服务器200,每当接收到来自信息提供服务器200的询问字符串时,可选择地提示该询问字符串。

这样,由于每当用户进行操作时,用户终端100实时可选择地提示询问字符串,因而可以减少每当更新输入字符串时进行搜索并选择询问字符串的麻烦。

(变形例2)

在上述的实施方式中,如图1所示,通过指定搜索按钮1011来确定输入字符串,而在本变形例中构成为,构成同义词的多个词各自的输入转换用字符串与代表词相对应地存储在同义词词典数据库400中。另外,本变形例具有上述的变形例1的结构,但不限于此。

这里,输入转换用字符串是指,在同义词为汉字的情况下输入文本时由字母的组合指定的“读音假名”或用于指定该“读音假名”的字母的组合。通过将这样的输入转换用字符串存储在同义词词典中,仅通过指定同义词的一部分的读音假名或字母作为输入字符串,就可以提高可以获取用户需要的应答内容的可能性。

例如,如图11所示,除了同义词之外,在本变形例的同义词词典数据库400的同义词词典数据表中还登记有读音假名。另外,在本实施例中,将输入转换用字符串登记为构成同义词的多个词,但不限于此。

由此,如图12所示,在用户在输入区域1020中输入“リョウ”的时间点,“リョウ”作为输入字符串被发送到信息提供服务器200。信息提供服务器200参照同义词词典数据表(参照图11),选出同义词栏的“リョウキン”和“リョウリ”,将与它们各自对应的代表词的“金额”和“膳食”作为搜索字符串来搜索建议数据库500,将与所选出的标准化字符串相对应的询问字符串发送到用户终端100。由此,在建议关键词区域1021中,显示包括作为搜索对象的“金额”和“膳食”的询问字符串。

此外,如图12所示,在用户在输入区域1020中输入“リョウリ”的时间点,“リョウ”作为输入字符串被发送到信息提供服务器200。信息提供服务器200参照同义词词典数据表(参照图11),选出同义词栏的“リョウリ”,将与其对应的代表词的“膳食”作为搜索字符串来搜索建议数据库500,将与所选出的标准化字符串相对应的询问字符串发送到用户终端100。由此,在建议关键词区域1021中显示包括作为搜索对象的“膳食”的询问字符串。例如,在建议数据库500中,作为询问字符串登记有“我想知道推荐的菜单”,作为与其相对应的标准化字符串登记有“我想知道推荐的膳食”,搜索标准化字符串的“我想知道推荐的膳食”,将与其相对应的询问字符串的“我想知道推荐的菜单”发送到用户终端100。

在上述的详细说明中,以特征部分为中心进行了说明,以便可以更容易地理解本发明。本发明不限于上述的详细说明中所记载的实施方式,也可以应用于其他实施方式,其应用范围是多样的。此外,在本说明书中使用的用语和语法用于准确地说明本发明,而不是用于限制本发明的解释。此外,本领域技术人员被认为从本说明书中记载的发明的概念容易地推想出本发明的概念中包括的其他结构、系统、方法等。因此,权利要求书的记载必须视为在不脱离本发明的技术构思的范围内包括均等的结构。此外,摘要的目的是使专利局和一般公共机构、不精通专利、法律用语或专门用语的属于本技术领域的技术人员等可以通过简单的调查快速地判定本申请的技术内容及其本质。因此,摘要并非旨在限定应通过权利要求书的记载来评估的发明的范围。另外,为了充分理解本发明的目的和本发明的特殊效果,需要的是在充分参考已经公开的文献等的情况下进行解释。

上述的详细说明包括由计算机执行的处理。以上的说明和表达是为了使本领域技术人员最有效地理解而记载的。在本说明书中,用于导出1的结果的各处理应理解为没有自相矛盾的处理。此外,在各处理中,进行电或磁信号的收发、记录等。在各处理中的处理中,这样的信号由位、值、符号、文字、用语、数字等表现,但是需要注意,它们仅是为了便于说明而使用。此外,各处理中的处理有时以与人的行共同的表达来记载,但是本说明书中说明的处理原则上由各种装置执行。此外,为了进行各处理所要求的其他结构从以上说明是显而易见的。

附图标记说明

1 信息提供系统

100 用户终端

200 信息提供服务器

300 知识数据库

400 同义词词典数据库

500 建议数据库

700 网络

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号