首页> 中国专利> 推理装置、推理方法和推理程序

推理装置、推理方法和推理程序

页面导航

摘要
著录项
说明书
相似文献

摘要

推理装置(10)具有图结合部(14)，该图结合部(14)使用从知识库(11a)提供的知识信息以及从规则数据库(12a)提供的推理规则，以前向链方式结合动态变化的外部信息中的属于彼此不同的域的信息即图，由此生成统合图，其中，所述知识信息包含与人的状态有关的信息和与人的行动有关的信息。

著录项

公开/公告号CN112740238A

专利类型发明专利
公开/公告日2021-04-30

原文格式PDF
申请/专利权人三菱电机株式会社;
展开▼

申请/专利号CN201880097661.7
发明设计人田口进也;濑户祐介;
展开▼

申请日2018-09-28
分类号G06N5/04(20060101);
代理机构11127 北京三友知识产权代理有限公司;
代理人马建军;邓毅
地址日本东京都
入库时间 2023-06-19 10:46:31

说明书

技术领域

本发明涉及推理装置、推理方法和推理程序。

背景技术

近年来，伴随着深度学习技术的发展和第三次AI(Artificial Intelligence：人工智能)的流行，智能扬声器等活用人工智能的用户界面正在普及。作为实现活用人工智能的用户界面的主要方法，存在以下2种方法。第1方法是手动设计用户界面的方法(例如参照专利文献1和2)。第2方法是在用户界面中利用机器学习的方法(例如参照非专利文献1和2)。

作为第1方法的例子，专利文献1记载有如下技术：通过状态图来设计利用包含语音对话的多个沟通模式的多模式界面。此外，作为第1方法的例子，专利文献2记载有如下技术：利用状态图记述语音对话等的动作序列，高速地执行动作序列。

作为第2方法的例子，非专利文献1记载有如下技术：在神经网络追加存储器构造，对对话数据进行End-To-End有训练学习。此外，作为第2方法的例子，非专利文献2记载有如下技术：对利用知识库的对话数据进行End-To-End强化学习。

现有技术文献

专利文献

专利文献1：日本特许第6022111号公报

专利文献2：国际公开第2018/083729号

非专利文献

非专利文献1：S.Sukhbaatar等3人、“End-To-End Memory Networks”、NIPS 2015

非专利文献2：B.Dhingra等6人、“Towards End-to-End Reinforcement Learningof Dialogue Agents for Information Access”、Proceedings of the 55th AnnualMeeting of the Association for Computational Linguistics 2017

发明内容

发明要解决的课题

但是，使用上述任何技术，在各种状况下，都很难实现使人觉得“聪明”的智慧对话。在以下的表1中，作为对话例D1和D2而示出使人(以下也称作“用户”)觉得“聪明”的基于人工智能代理(以下也称作“AG”)的智慧对话的例子。

【表1】

如对话例D2那样，为了使AG自动进行“附近有凉面餐厅。”这样的聪明的讲话，需要“信息统合”和“推理”这2个要素技术。

“信息统合”是对分别属于彼此不同的多个域的信息进行统合的要素技术。分别属于彼此不同的多个域的信息例如是天气、人的操作历史、导航(简称作“导航”)信息、人的喜好和与人的行动有关的知识等。人例如是驾驶员。与人的行动有关的知识例如是“热时吃凉的食物”这样的与人的行动有关的信息。

“推理”例如是演绎推理的要素技术。以下的(D3)～(D5)是演绎推理的例子。

(D3)“用户降低了空调机的设定温度是说，用户感觉热。”

(D4)“用户感觉热是说，用户感觉想吃凉的食物。”

(D5)“用户感觉想吃凉的食物是说，由于附近有凉面店，因此应该向用户推荐该店。”

在如对话例D1和D2那样可利用的信息动态变化的环境下，很难如上述第1方法那样，列举全部状态并手动设计对话序列。

同样，在可利用的信息动态变化的环境下，收集网罗到全部情况的对话数据的成本非常高，或者在现实中是不可能的。因此，在上述第2方法中，很难对对话数据进行End-To-End有训练学习。

此外，在可利用的信息动态变化的环境下，在上述第2方法中，为了对对话数据进行End-To-End强化学习，需要用于高效地收集学习数据的对话模拟器。但是，很难生成能够应对全部状况的对话模拟器。

本发明正是为了解决上述现有技术的课题而完成的，其目的在于，提供能够根据分别属于多个域的信息导出适合于用户的推理结果的推理装置、推理方法和推理程序。

用于解决课题的手段

本发明的一个方式的推理装置的特征在于，所述推理装置具有信息结合部，该信息结合部使用从知识库提供的知识信息以及从规则数据库提供的推理规则，以前向链方式结合动态变化的外部信息中的属于彼此不同的域的信息，由此生成统合信息，其中，所述知识信息包含与人的状态有关的信息和与人的行动有关的信息。

本发明的另一个方式的推理方法的特征在于，所述推理方法具有以下步骤：取得从知识库提供的知识信息以及从规则数据库提供的推理规则，其中，所述知识信息包含与人的状态有关的信息和与人的行动有关的信息；以及使用所述知识信息和所述推理规则，以前向链方式结合动态变化的外部信息中的属于彼此不同的域的信息，由此生成统合信息。

发明效果

根据本发明，在分别属于多个域的信息动态变化的环境下，也能够根据分别属于多个域的信息导出适合于用户的推理结果。

附图说明

图1是概略地示出本发明的实施方式1的推理装置的结构的功能框图。

图2是示出实施方式1的推理装置的硬件结构的例子的图。

图3是示出实施方式1的推理装置的硬件结构的另一个例子的图。

图4是示出实施方式1的推理装置的动作的流程图。

图5是使用有向图示出RDF表现的例子的图。

图6是以表形式(表3)示出实施方式1中的知识库的例子的图。

图7是以表形式(表4)示出实施方式1的推理装置的动态信息取得部生成的数据的例子的图。

图8的(a)和(b)是示出实施方式1的推理装置的图结合部使用规则数据库中存储的推理规则即前向链规则生成有向图的状况的图。

图9是示出针对表现表3(图6)和表4(图7)所示的知识库的图依次应用推理规则即前向链规则而得到的图的例子的图。

图10的(a)～(c)是示出演绎推理、归纳推理和假设推理作为图的图。

图11是以表形式(表5)示出实施方式1的推理装置的图检索部检索图而取得的数据的例子的图。

图12是示出包含由实施方式1的推理装置的图检索部检索到的节点的重要度和检索结果的统合图(与图11对应的统合图)的例子的图。

图13是以表形式(表6)示出用于通过实施方式1的推理装置理解用户的意图的动作例的图。

图14是示出包含通过实施方式1的推理装置的动作而取得的重要度的统合图(与图13对应的统合图)的例子的图。

图15是以表形式(表7)示出用于通过实施方式1的推理装置理解用户的注意力的动作例的图。

图16是示出包含通过实施方式1的推理装置的动作而取得的重要度的统合图(与图15对应的统合图)的例子的图。

图17是概略地示出本发明的实施方式2的推理装置的结构的功能框图。

图18的(a)和(b)是示出由实施方式2的推理装置的信息输出部输出的信息的例子的图。

图19是以表形式(表8)示出实施方式2的推理装置的图分析部的动作例的图。

图20是概略地示出本发明的实施方式3的推理装置的结构的功能框图。

图21是示出实施方式3的推理装置的图路径分析部的动作例的图。

图22的(a)和(b)是示出实施方式3的推理装置的图路径分析部的另一个动作例的图。

图23的(a)～(c)是示出实施方式3的推理装置的图路径分析部的又一个动作例的图。

具体实施方式

下面，参照附图对本发明的实施方式的推理装置、推理方法和推理程序进行说明。以下的实施方式只不过是例子，能够在本发明的范围内进行各种变更。

《1》实施方式1

《1-1》结构

实施方式1的推理装置利用使用图的方法对属于彼此不同的多个域的信息进行统合，制作作为统合后的信息的统合图。此外，实施方式1的推理装置能够具有根据作为统合后的信息的统合图导出推理结果的结构。这里，图是具有顶点(即节点)和边(即edge)作为结构要素的图形。导出推理结果的方法例如是不需要学习数据的图分析方法。图主要被分类成有向图和无向图。有向图由顶点和具有方向的边(即箭头)构成。无向图由顶点和不具有方向的边构成。无向图等效于由顶点和在双向上具有方向的边构成的双向图。实施方式1中的有向图例如如后述的图5、图8的(a)和(b)等所示。

图1是概略地示出实施方式1的推理装置10的结构的功能框图。推理装置10是能够实施实施方式1的推理方法的装置。如图1所示，推理装置10具有作为信息结合部的图结合部14。此外，推理装置10也可以具有保存知识库11a的知识库部11、保存规则数据库12a的规则数据库部12、动态信息取得部13、作为信息结合部的图结合部14、作为信息分析部的图分析部15、作为信息检索部的图检索部16以及信息输出部17。

知识库部11是保存由知识信息构成的知识库11a的存储装置。知识库部11是推理装置10的一部分。但是，知识库部11也可以设置于以能够通信的方式与推理装置10连接的外部装置。

规则数据库部12是保存用于结合(即连结)多个图的多个规则(以下也称作“推理规则”)的存储装置。规则数据库部12是推理装置10的一部分。但是，规则数据库部12也可以设置于以能够通信的方式与推理装置10连接的外部装置。

动态信息取得部13取得动态变化的外部信息。动态信息取得部13取得时时刻刻动态变化的信息，将取得的信息转换成预定形式的信息并输出。外部信息从外部装置、由外部装置执行的应用等取得。外部信息例如从应用41、用户界面42、GPS(Global PositioningSystem：全球定位系统)43、摄像机44、互联网45、外部数据库46、传感器47等取得。应用41是在计算机、便携信息终端等装置中进行动作的软件。

图结合部14根据从知识库11a提供的知识信息、从规则数据库12a提供的推理规则以及由动态信息取得部13取得的外部信息，动态地结合图(以下也称作“含义图”或“数据构造”或“知识图”)，由此生成统合信息而成的统合图。

图分析部15对由图结合部14生成的统合图进行分析，计算作为该统合图的结构要素的节点的重要度。各节点的重要度例如是在统合图上无限地随机游走而成为稳定状态时的到达各节点的概率，即针对各节点的到达概率。

图检索部16使用由图分析部15计算出的重要度，从由图分析部15分析后的统合图中检索期望的信息。期望的信息例如是由图分析部15分析后的统合图中的特定的信息模式。

信息输出部17将由图检索部16检索到的期望的信息输出到用户界面51。

用户界面51例如是输出语音的作为语音输出装置的扬声器、显示影像的作为影像输出装置的显示器等。用户界面51通过语音、影像等对用户提供由图检索部16检索到的期望的信息。

图2是示出实施方式1的推理装置10的硬件结构的例子的图。在图2的例子中，推理装置10具有处理电路61、作为存储装置的硬盘驱动器(HDD)62、输入接口装置63和输出接口装置64。处理电路61例如是能够实现图1所示的动态信息取得部13、图结合部14、图分析部15、图检索部16和信息输出部17的功能的半导体集成电路。输入接口装置63例如是与外部设备、由外部设备执行的软件等进行通信的电路。输出接口装置64例如是与外部设备、由外部设备执行的软件等进行通信的电路。

处理电路61例如是专用的硬件。处理电路61例如可以是单一电路、复合电路、执行程序的处理器、执行并行程序的处理器、ASIC(Application Specific IntegratedCircuit：专用集成电路)、FPGA(Field-Programmable Gate Array：现场可编程门阵列)或对它们进行组合而得到的部件。

图3是示出实施方式1的推理装置10的硬件结构的另一个例子的图。在图3中，对与图2所示的结构要素相同或对应的结构要素标注与图2所示的标号相同的标号。在图3的例子中，推理装置10具有作为信息处理部的处理器即CPU(Central Processing Unit：中央处理单元)71、存储程序的作为存储装置的存储器72、作为存储装置的HDD62、输入接口装置63以及输出接口装置64。存储器72能够存储实施方式1的推理程序。CPU71通过执行存储器72中存储的推理程序，能够实现图1所示的动态信息取得部13、图结合部14、图分析部15、图检索部16和信息输出部17的功能。

CPU71也可以具有1次高速缓冲存储器和2次高速缓冲存储器等多个高速缓冲存储器。此外，HDD62、存储器72等中存储的程序使计算机执行推理装置10进行的处理的顺序或方法。存储器72例如是RAM(Random Access Memory：随机存取存储器)、ROM(Read OnlyMemory：只读存储器)、闪存、EPROM(Erasable Programmable Read Only Memory：可擦除可编程只读存储器)、EEPROM(Electrically Erasable Programmable Read-Only Memory：电可擦除可编程只读存储器)等非易失性或易失性半导体存储器。

在图2和图3中，在学习数据的保存中能够使用HDD62。另外，学习数据也可以存储于使用DVD(Digital Versatile Disc：数字多功能盘)等光盘的光学式存储装置、半导体存储器、外部的存储装置等。

另外，推理装置10也可以利用专用的硬件实现其功能的一部分，利用软件或固件实现功能的另一部分。例如，也可以利用作为专用的硬件的处理电路实现动态信息取得部13的功能，利用执行存储器中存储的程序的处理器即CPU实现动态信息取得部13以外的结构的功能。

《1-2》动作

《1-2-1》动作的概要

图4是示出实施方式1的推理装置10的动作的流程图。推理装置10的动作包含阶段Ph1的动作即事前准备和阶段Ph2的动作即推理的执行。

阶段Ph1包含步骤S101的处理即知识库11a的准备以及步骤S102的处理即规则数据库12a的准备。阶段Ph1的处理的整体或一部分也可以由推理装置10以外的装置来进行。

阶段Ph2包含步骤S103的处理即动态信息的取得、步骤S104的处理即图的结合、步骤S105的处理即统合图的分析、步骤S106的处理即统合图的检索以及步骤S107的处理即信息的输出。步骤S104的处理即图的结合使用事前准备的知识库11a和规则数据库12a来执行。

《1-2-2》步骤S101：知识库11a的准备

首先，生成知识库11a，该知识库11a保存为了使推理装置10进行动作而使用的各种知识信息。知识库11a存储于知识库部11。

作为知识库11a保存的信息的形式例如是RDF(Resource DescriptionFramework：资源描述框架)。RDF是用于表现互联网上的信息(资源)的标准化的框架。在RDF中，使用由主语、谓语和宾语构成的三元组即3个项目的组来表现数据。

此外，RDFS(RDF Schema)是用于表现资源的标准化的词汇定义。在表2所示的例Y1中，使用由RDFS定义的“rdfs：subClassOf”这样的谓语，用1个三元组表现拉面类(主语)是食物类(宾语)。这里，“拉面类”意味着属于拉面的物品。此外，“食物类”意味着属于食物的物品。

【表2】

图5是使用有向图示出RDF表现的例Y1的图。如图5所示，在RDF表现中，主语和宾语表现为顶点即节点，谓语表现为边即edge。在RDF表现中，由主语、谓语和宾语构成的三元组表现为包含作为主语的节点、作为宾语的节点、作为谓语的箭头即从主语朝向宾语的边即箭头的有向图。

在本申请中，例如，由主语A0、谓语B0和宾语C0构成的三元组如以下那样使用括号来记述。

(A0、B0、C0)

作为知识库11a保存的知识信息例如是设备信息、常识(即共识)信息、一般的知识信息、这些信息的本体论等。作为知识库11a保存的知识信息能够包含设备信息、常识信息、一般的知识信息、这些信息的本体论等中的2种以上。

“设备信息”是与设备有关的信息。设备信息例如是设备的属性、设备的名字、设备的种类、设备的设定项目、设备的设定项目的数值范围、设备的利用限制、设备的使用次数、设备的使用方法等。设备的属性例如能够包含空调类、风扇类、音乐播放器类等。

“常识信息”是与人的一般常识有关的信息。常识信息例如是人的价值观、人的想法、人的行动、人的状态等。常识信息包含与人的状态有关的信息和与人的行动有关的信息。与人的状态有关的信息包含与人的物理状态有关的信息和与人的心理状态有关的信息。与人的状态有关的信息例如能够包含人感觉热、人感觉冷、人困惑、人在笑等信息。与人的行动有关的信息例如能够包含驾驶、吃、睡觉、搜索、去特定的场所等信息。

以下示出知识库11a的常识信息的例F1。

F1＝(热、then、吃凉的食物)

常识信息的例F1利用(主语、谓语、宾语)这1个三元组表现“人如果热、则吃凉的食物。”这样的知识。例F1的三元组中的“then”(谓语)被定义成意味着“在人处于(主语)的状态的情况下，接下来采取的行动是(宾语)的行动”。因此，例F1的三元组表示“在人处于“热”(主语)这样的状态的情况下，人接下来采取的行动是“吃凉的食物”(宾语)的行动”。

以下示出知识库11a的常识信息的例F2a和F2b。

F2a＝(吃凉的食物、slot、凉的食物类)

F2b＝(吃凉的食物、subAct、吃)

常识信息的例F2a和F2b利用包含(主语、谓语、宾语)的2个三元组表现“‘吃凉的食物’这样的行动的对象是‘凉的食物类’，作为上位概念的行动是‘吃’”这样的知识。例F2a中的“slot”(谓语)被定义成意味着“作为(主语)的行动对象的物体是(宾语)的物体”。例F2b中的“subAct”(谓语)被定义成意味着“(主语)的上位概念的行动是(宾语)的行动”。

另外，被使用的常识信息也可以是按照地域、性别和作为推理对象的应用的每个域而不同的信息。即，推理装置10可以根据作为对象的人或领域，将推理装置10使用的知识库11a的常识信息切换成多种常识信息中的任意一种常识信息。

“一般的知识信息”是与普遍的事实有关的信息。“一般的知识信息”能够包含与工程、物理、科学、生物、医学、食品、地理、宗教、经济、政治、历史、有名人物等有关的信息。

以下示出知识库11a的一般的知识信息的例G1。

G1＝(冰淇淋、rdfs：subClassOf、凉的食物类)

一般的知识信息的例G1中的“rdfs：subClassOf”(谓语)被定义成意味着“(主语)的物品是(宾语)的物品的子类”。例G1利用(主语、谓语、宾语)这1个三元组表现“冰淇淋(主语)是凉的食物(宾语)的子类”这样的知识。

以下示出知识库11a的一般的知识信息的例G2。

G2＝(草莓冰淇淋、instanceOf、冰淇淋类)

一般的知识信息的例G2中的“instanceOf”(谓语)被定义成意味着“(主语)的物品是(宾语)的实例”。例G2利用(主语、谓语、宾语)这1个三元组表现“草莓冰淇淋(主语)是冰淇淋类(宾语)的实例(实际形式)”这样的知识。

所述本体论是作为对象的域的词汇、词汇与词汇的关系、类、属性、制约条件等。

本体论例如是以下列出的信息。

■谓语“slot”意味着“作为(主语)的行动对象的物体是(宾语)”。

■谓语“slot”可取的主语是与行动有关的词汇。

■谓语“slot”可取的宾语是与目标的类有关的词汇。

图6是以表形式(表3)示出实施方式1中的知识库11a的例子的图。

《1-2-3》步骤S102：规则数据库12a的准备

接着，准备为了使推理装置10进行动作而使用的1个以上的推理规则作为规则数据库12a。规则数据库12a存储于规则数据库部12。准备的推理规则用于通过对分别属于彼此不同的多个域的信息进行结合而将多个信息统合为1个信息、以及根据从传感器等取得的外部信息生成新的假设等。

例如也可以利用与人的状态有关的信息和与人的行动有关的信息，以对分别属于彼此不同的多个域的信息进行结合。例如，也可以将以下的推理规则的例W1和W2保存于规则数据库12a。

推理规则的例W1是“如果车外的气温为30度以上，则车外和驾驶员的状态为热”。推理规则的例W1具有对由温度传感器取得的车外的气温信息和与人的状态有关的信息进行结合的作用。

推理规则的例W2是“在当前时刻为7时或12时或17时的情况下，当前时刻与“吃”这样的动作相关联”。推理规则的例W2具有对由时钟取得的当前时刻即时间信息和与人的行动有关的信息进行结合的作用。

此外，推理规则也可以利用从外部输入的信息生成新的假设。例如，在能够利用麦克风收集人讲话的语音的情况下，也可以保存以下的推理规则的例W3～W5作为规则数据库12a。

推理规则的例W3是“在人说了‘吃饱了’的情况下，该人之前在餐厅吃了什么”。

推理规则的例W4是“在人说了‘吃饱了’的情况下，该人之前在车里吃了什么”。

推理规则的例W5是“在人说了‘吃饱了’的情况下，该人之前在家里吃了什么”。

《1-2-4》步骤S103：动态信息的取得

动态信息取得部13取得时时刻刻动态变化的信息，将取得的信息转换成与知识库11a相同形式的信息并输出。

动态信息取得部13取得信息的时机例如是每隔一定时间。动态信息取得部13取得信息的时机也可以是其他时机。动态信息取得部13取得信息的时机例如也可以是动态信息取得部13接受由用户输入的信息取得命令紧后。此外，动态信息取得部13取得信息的时机也可以是特定的时刻。特定的时刻例如是成为白天的12时时、车辆进入特定的市区时等。此外，动态信息取得部13取得信息的时机也可以是在取得信息的位置处成为特定的时刻时、或在取得信息的位置处存在特定的事件时等那样，每当同时满足多个条件时。

动态信息取得部13取得的信息例如是传感器信息、应用信息、用户的个人信息、用户的命令信息和其他信息等。动态信息取得部13取得的信息也称作外部信息。

传感器信息例如是由触摸面板、麦克风等用户界面42得到的用户操作的信息或讲话的信息。此外，传感器信息也可以是由摄像机44或各种传感器得到的针对外界或人的传感结果。各种传感器例如是温度计、湿度计等。此外，传感器信息也可以是由GPS43等得到的位置信息。

以车为例时，传感器信息例如是由设置于车内的可视光摄像机或红外线摄像机得到的信息。传感器信息例如也可以是表示检测到驾驶员的面部和眼睛的位置的结果的信息。此外，摄像机44也可以是设置于车内的多个摄像机。或者，传感器信息也可以是由设置于车内的麦克风取得的、表示驾驶员或同乘者说的语音的语音信息。此外，传感器信息也可以是由活体传感器或感压传感器等取得的信息。活体传感器能够包含运动传感器、血压传感器、心电图传感器、心率传感器等。

例如，在动态信息取得部13从温度传感器和湿度传感器取得“车外的温度为35度”和“车外的湿度为90％”这样的信息的情况下，动态信息取得部13将这些信息转换成由(主语、谓语、宾语)构成的以下的三元组的例J1和J2。

J1＝(车外的状态、temperature、35度)

J2＝(车外的状态、humidity、90％)

此外，在动态信息取得部13取得“当前为12时”这样的信息作为从时钟得到的当前时刻的信息的情况下，动态信息取得部13将这些信息转换成由(主语、谓语、宾语)构成的以下的三元组的例J3。

J3＝(当前时刻、is、12时)

动态信息取得部13取得的应用信息例如包含在用户的环境下进行动作的应用取得的信息、应用的利用状况、应用的利用历史、通过应用进行显示中的画面、通过应用进行显示中的选择项显示等。

动态信息取得部13通过汽车导航系统的应用来取得附近的店的信息，在“发现了位于附近的‘冰淇淋店#6’这样的名称的店”的情况下，动态信息取得部13将该信息转换成由(主语、谓语、宾语)构成的以下的三元组的例J4。

J4＝(附近的店、has、冰淇淋店#6)

动态信息取得部13取得的用户命令信息例如是用户明示或非明示地对包含推理装置10的推理系统命令的内容等。

例如，在“用户通过按钮操作而启动空调并降低温度”的情况下，动态信息取得部13将该信息转换成由(主语、谓语、宾语)构成的以下的三元组的例J5。

J5＝(最近的命令、is、降低温度)

动态信息取得部13取得的用户的个人信息是用户的名字、用户的家庭、用户的兴趣等。

动态信息取得部13例如将“驾驶员的名字是东京太郎，驾驶员喜欢所有拉面”这样的信息转换成由(主语、谓语、宾语)构成的以下的2个三元组的例J6和J7。

J6＝(驾驶员、name、东京太郎)

J7＝(驾驶员、like、拉面类)

动态信息取得部13取得的外部信息例如包含从互联网45得到的天气、新闻、地理信息等。此外，动态信息取得部13取得的外部信息也可以包含外部数据库46中保存的国家、自治体、企业、个人等提供的信息等。

图7是以表形式(表4)示出实施方式1的推理装置10的动态信息取得部13生成的数据的例子的图。表4的例子包含车内的状态、汽车导航的信息、当前时刻、命令信息、驾驶员的信息。

《1-2-5》步骤S104：图的结合

接着，图结合部14例如针对知识库11a和动态信息取得部13的输出，通过前向链(Forward Chaining)依次应用作为规则数据库12a保存的推理规则，对多个图进行结合，最终生成由结合后的多个图构成的1个统合图。构成统合图的多个图例如是有向图。

在使用图表现规则数据库12a中的推理规则的应用时，如下所述。

“在对象的图中发现了特定的信息模式的情况下，在图中追加/变更/删除节点或边”。

使用所述推理规则的例W1和W2对图的结合的具体例进行说明。下面，“？x”表示任意的变量。

作为推理规则的例W1，在使用图表现“如果车外的气温为30度以上，则车外和驾驶员的状态为热”时，如下所述。

“在对象的图中发现三元组(车外的状态、temperature、？x)的信息模式且满足条件‘？x≥30’的情况下，在图中新追加

三元组(车外的状态、status、热)、

三元组(驾驶员、status、热)”。

图8的(a)和(b)是示出实施方式1的推理装置10的图结合部14使用规则数据库12a中存储的推理规则即前向链规则生成有向图的状况的图。

作为推理规则的例W2，在利用图表现“在当前时刻为7时或12时或17时的情况下，当前时刻与‘吃’这样的动作相关联”时，如下所述。

“在对象的图中发现三元组(当前时刻、is、？x)的信息模式且满足条件‘？x＝7时’或‘？x＝12时’或‘？x＝17时’的情况下，在图中新追加

三元组(当前时刻、relate、吃)”。

例如，针对示出图6所示的表3和图7所示的表4的图，在通过前向链依次应用推理规则的例W1和W2时，得到图9所示的图。图9的图是例示。

如上所述，图结合部14能够根据从传感器得到的信息或分别属于彼此不同的多个域的信息，生成图9所示的统合后的1个图。即，图结合部14通过前向链依次应用规则，由此，对分别属于彼此不同的多个域的信息进行结合，从而能够生成统合后的信息。此外，统合后的信息能够表现为统合图。

此外，特别地，图结合部14例如能够利用与人的状态有关的信息和与人的行动有关的信息，以对分别属于彼此不同的多个域的信息进行结合。与人的状态有关的信息例如是“热”、“冷”、“饿”等。与人的行动有关的信息例如是“降低温度”、“提高温度”、“吃凉的食物”等。

例如，通过应用推理规则的例W1，能够对“车外的状态”这样的传感器的域的信息和“凉面”这样的食品的域的信息进行结合，即，能够对分别属于彼此不同的多个域的信息进行结合。

具体而言，能够根据由(主语、谓语、宾语)构成的三元组K1～K4，使用有向图对“车外的信息”和“凉面”进行结合。

K1＝(车外的状态、status、热)

K2＝(热、then、吃凉的食物)

K3＝(吃凉的食物、slot、凉的食物类)

K4＝(凉面、instanceOf、凉的食物类)

《1-2-6》步骤S105：图的分析

接着，图分析部15穿过边来追溯通过图结合部14中的图的结合而生成的统合图(例如图9)的节点，由此执行概率性推理，计算各节点的重要度作为推理的结果。图分析部15通过追溯统合图上的节点，执行演绎推理(deduction)、归纳推理(induction)和假设推理(abduction)。图10的(a)～(c)是示出演绎推理、归纳推理和假设推理作为图的图。

例如，如图10的(a)所示的图那样，在存在三元组(A0、x、B0)和三元组(B0、y、C0)的情况下，通过追溯图，能够从节点A0演绎推理节点C0。

具体而言，在存在三元组(苏格拉底、is、人)和三元组(人、is、死亡)的情况下，从节点“苏格拉底”推理节点“死亡”，能够得到“苏格拉底死亡”作为结论。

此外，例如，如图10的(b)所示的图那样，在存在三元组(A0、x、B0)、三元组(A0、x、B2)、三元组(B0、y、C0)、三元组(B2、y、C0)、三元组(B3、y、C0)的情况下，从节点A0经由节点B0或B2追溯到节点C0，最后，从节点C0反向追溯到节点B3，由此，能够从节点A0归纳推理节点B3。

具体而言，研究图中包含有

三元组(太郎、喜欢、酱油拉面)、

三元组(太郎、喜欢、豚骨拉面)、

三元组(酱油拉面、rdfs：subClassOf、拉面类)、

三元组(豚骨拉面、rdfs：subClassOf、拉面类)、

三元组(味噌拉面、rdfs：subClassOf、拉面类)的情况。该情况下，节点“太郎”和节点“味噌拉面”在图中没有直接连接。但是，节点“太郎”喜欢节点“酱油拉面”和节点“豚骨拉面”，因此，喜欢意味着所有拉面的“拉面类”。这样，节点“太郎”也喜欢节点“味噌拉面”。即，能够进行这种归纳推理。

此外，例如，如图10的(c)所示的图那样，在引起三元组(A0、x、B0)这样的事项的情况下，通过追溯三元组(B0、y、C0)和三元组(B0、y、C2)的图，能够从节点A0推理节点C0或节点C2的假设。

具体而言，在存在

三元组(花子、12时的行动、吃午饭)这样的事项、

三元组(吃午饭、下一个行动、午睡)、

三元组(吃午饭、下一个行动、散步)的情况下，

能够推理假设“花子的下一个行动是午睡”和假设“花子的下一个行动是散步”这样的2个假设(即不知道哪个是正确的)。这种推理也称作假设推理。

图结合部14生成的图(例如图9)是各节点复杂地结合的巡回图。因此，在图结合部14生成的统合图(例如图9)中，无法如图10的(a)～(c)那样仅简单地追溯统合图就能够将推理的结论确定为一个。因此，例如，计算在图结合部14计算出的统合图(例如图9)上无限地随机游走而成为稳定状态时的、到达各节点的概率即到达概率。该概率能够解释为该“节点是推理结论的概率”，因此，该概率被定义成各节点的重要度。此外，在统合图上随机游走等效于概率地执行演绎推理、归纳推理和假设推理。

接着，对示出图分析部15的具体计算方法的步骤S105a、S105b、S105c即图4所示的步骤S105的内容进行说明。

《步骤S105a：图的转换和迁移矩阵的生成》

图分析部15适当地对输入到图分析部15的统合图进行转换，生成随机游走用的节点间的迁移矩阵。

首先，根据输入到图分析部15的图L1中包含的各三元组的动词的种类，新生成图L2。由图分析部15生成的图L2也称作“推理图”。在推理图的生成中，例如应用以下的转换模式TP1、转换模式TP2、转换模式TP3中的任意一方。

在“转换模式TP1”中，直接利用输入的图L1即有向图作为推理图L2。

在“转换模式TP2”中，将输入的图L1即有向图转换成无向图即双向图，由此生成推理图L2。

在“转换模式TP3”中，将输入的图L1即有向图转换成逆向的有向图，由此生成推理图L2。

接着，生成推理图L2的相邻矩阵，求出利用1对该矩阵的各列的合计值进行归一化而成的节点间的迁移矩阵P。当设节点数为N(N为正整数)时，节点间的迁移矩阵P是大小为(N×N)的矩阵。

这里，迁移矩阵P的元素P(i、j)表示在统合图上的随机游走中从第j个节点迁移到第i个节点的迁移概率。例如，在将某个节点A5设为主语且与节点A5连接的节点为4个节点A6～A9的情况下，将从节点A5分别迁移到节点A6～A9的迁移概率设定成均等值0.25。但是，从节点A5分别迁移到节点A6～A9的迁移概率不需要是均等值。设定的迁移概率也可以是彼此不同的值。

在如转换模式TP2所示通过将输入的图L1即有向图转换成无向图来生成推理图L2的情况下，得到以下的效果。

例如，在(热、then、吃凉的食物)这样的三元组中，如果“热”，则能够推理出“吃凉的食物”，相反，如果“吃凉的食物”，则逆向追溯图，也能够推理出“热”。此外，如图10的(b)所示的归纳推理的例子那样，通过从节点C0向节点B3即逆向追溯图，能够得到推理结论。

例如，在(j、x、i)这样的三元组中，迁移矩阵P的元素P(i、j)和元素P(j、i)的迁移概率的初始设定如下所述。

P(i、j)＝α(0<α≤1)

P(j、i)＝0

但是，在按照转换模式TP2将有向图即图L1转换成无向图即图L2的情况下，在转换后的图L2的三元组中，迁移矩阵P的元素P(i、j)和元素P(j、i)的迁移概率的初始设定例如如下所述。

P(i、j)＝P(j、i)＝α(0<α≤1)

或者，迁移概率具有偏差，如下设定。

P(i、j)＝α(0<α≤1)

P(j、i)＝β(0<β≤1)

这里，α和β彼此不相等。由此，在后述的随机游走的处理中，能够在节点i与节点j之间自由往来。

接着，在如转换模式TP3所示通过将输入的图L1即有向图转换成逆向的有向图来生成推理图L2的情况下，得到以下的效果。

例如，在存在三元组(太郎、喜欢、拉面)和三元组(太郎、讨厌、榴莲)的情况下，考虑推理太郎喜欢的东西的任务。

假设在推理中直接利用上述三元组(太郎、喜欢、拉面)和三元组(太郎、讨厌、榴莲)时，在后述的步骤S105c即重要度计算步骤中，“拉面”和“榴莲”的重要度可能成为相同程度。因此，在“讨厌”这样的动词中，使有向图成为逆向。由此，在后述的重要度计算步骤中在推理图中随机游走时，能够降低经由“榴莲”的概率。由此，具有降低“榴莲”的重要度的效果。

接着，下面叙述如转换模式TP3所示将输入的图L1即有向图转换成逆向的有向图的方法。

具体而言，

在(j、x、i)这样的三元组中，迁移概率的初始设定如下所述。

P(i、j)＝α(0<α≤1)

P(j、i)＝0

此外，在转换成逆向的有向图时，迁移概率的初始设定如下所述。

P(i、j)＝0

P(j、i)＝α(0<α≤1)

《步骤S105b：观测节点的设定》

图分析部15将从外部取得的信息或由传感器检测到的信息等作为推理起点的重要节点设定成“观测节点”。

接着，图分析部15制作将观测节点的权重设定成0以上而将除此以外的节点设为0的N维的观测向量v。v是概率分布，总和为1。

例如，作为观测节点，在设为“车外的状态”、“附近的店”、“最近的命令”、“驾驶员”的情况下，将与这些节点相当的观测向量v的元素分别设定成0.25(＝1/4)。将与除此以外的节点相当的观测向量v的元素设定成0。

在后述处理中，从观测节点起再次开始随机游走，由此，具有越接近观测节点的节点则重要度越高的效果。

《步骤S105c：重要度的计算》

接着，图分析部15利用迁移矩阵P和观测向量v，求出推理图(图L2)中包含的各节点的重要度。即，图分析部15根据观测向量v的概率决定随机游走的开始点，通过迁移矩阵P求出在推理图上随机游走而到达各节点的概率，将其设为各节点的重要度。

具体的计算例例如如下所述。首先，如以下的式(1)那样定义推理矩阵M即

【数式1】

【数式2】

M＝αP+(1-α)v1

这里，α表示满足0＜α≤1的预定的常数。

【数式3】

表示N×N的迁移矩阵，还表记为迁移矩阵P。

【数式4】

表示N×1的大小的观测向量，还表记为观测向量v。

【数式5】

表示全部元素为1的1×N的大小的向量，还表记为向量1

式(1)右边的第1项表示根据迁移矩阵P在统合图上随机游走。式(1)右边的第2项表示在随机游走的中途以(1-α)的概率从观测节点再次开始随机游走。

接着，将N维的重要度向量设为x

【数式6】

通过以下的式(2)求出该重要度向量。

【数式7】

式(2)表示反复进行随机游走而使重要度向量x

在式(2)中的重要度向量x

非专利文献3：L.Page等3人、“The PageRank Citation Ranking：Bringing Orderto the Web”、Technical Report.Stanford InfoLab.、1999

此外，也可以根据式(1)和式(2)，通过以下的式(3)计算成本函数CF1即

【数式8】

CF1

求出使该成本函数的值最小化的、总和为1的重要度向量x

【数式9】

在式(3)中，

【数式10】

表示N×N的单位矩阵，还表记为单位矩阵E。此外，向量v表示N×1的大小的观测向量。

《1-2-7》步骤S106：图的检索

图检索部16利用重要度向量x

以表1所示的对话例D1和D2为例进行说明。这里，图检索部16从统合图中提取主语、谓语、宾语分别满足

(？action、slot、？slotClass)且

(？slotValue、instanceOf、？slotClass)

的信息模式。这里，从“？”开始的字符串是变量，放入任意的字符串。

例如，在表3和表4的例子中，

“满足三元组(吃凉的食物、slot、凉的食物类)和三元组(凉面、instanceOf、凉的食物类)”或“满足三元组(降低温度、slot、空调类)和三元组(空调#1、instanceOf、空调类)”相当于检索对象的信息模式。

图11是以表形式(表5)示出实施方式1的推理装置10的图检索部16检索统合图而取得的数据的例子的图。即，图11示出针对图检索结果，首先利用“？action”的重要度进行排序，接着利用“？slotValue”的重要度进行排序的结果。

图12是示出包含由实施方式1的推理装置10的图检索部16检索到的节点的重要度和检索结果的统合图(与图11对应的统合图)的例子的图。在图12中，括号内表示重要度。被标注阴影的四边形表示观测节点，被标注阴影的圆形表示重要度高的节点。

在该例子中，在最上位得到

{slotValue：‘凉面’、slotClass：‘凉的食物类’、action：‘吃凉的食物’}。

由此，车载代理得到用于向用户推荐“吃凉面吗？”的信息。

在图11的例子中，在最上位的检索结果中得到

{‘slotClass’：‘凉的食物类’、‘action’：‘吃凉的食物’、‘slotValue’：‘凉面’}。

其理由是，如果最上位的检索结果利用

“驾驶员喜欢拉面即(驾驶员、like、拉面类)”、

“附近的店有拉面店Ra和冰淇淋店Ic。”、

“当前时刻为12时，与吃的行动相关联。”、

“车内的气温35度，因此状态为热。因此，人吃凉的食物或降低温度。”，则通过随机游走来追溯统合图，由此能够取得多阶段的推理。此外，这是由于，“‘吃凉的食物’或‘凉面’”的节点的重要度高(即成为推理结论的可能性高)。

《1-2-8》步骤S107：信息的输出

最后，信息输出部17利用图检索部16的输出，以适当的形式向显示器或扬声器等用户界面51输出信息。例如在表1的对话例D1和D2中，信息输出部17通过语音合成，输出“附近有凉面的餐厅。”等语音。

《1-2-9》用于理解用户意图的动作例

在用于理解用户意图的任务中，也能够使用实施方式1的推理装置10。例如，考虑如下任务：推理装置10从用户仅受理“降低”这样的命令，理解该命令的意图。该情况下，在知识库11a中包含有“降低音量”和“降低温度”这2个内容，因此，推理装置10举出这2个项目，作为从用户给出的命令的意图的候选。但是，如果利用实施方式1的推理装置10，则能够根据在知识库11a中与用户的命令有关的节点的重要度，适当地选择与状况对应的1个候选。

图13是以表形式(表6)示出在推理装置10生成的统合图中将“车外的状态”、“附近的店”、“当前时刻”、“驾驶员”、“降低”的观测向量的比率(即观测向量值)分别设定成0.2来计算重要度的结果的图。图14是示出表6所示的推理结果的统合图的图。

其结果是，选择“空调#1”的“降低温度”作为第1候选。通过在观测节点中增加“降低”，“降低温度”的重要度增大。由此，“降低空调的温度”的重要度高于“吃凉面”的重要度，成为最上位。

《1-2-10》用于理解用户的注意力(注意或关注)的动作例

实施方式1的推理装置10还能够利用用户的注意力(注意或关注)来执行推理。考虑如下任务：在由用户输入的“最近的命令”是“提高音量”，进而从用户受理了“降低”这样的命令的情况下，理解用户的命令的意图。该情况下，根据上下文，用户最近关注过音乐播放器，因此，用户的意图是“降低音量”的可能性高。推理装置10通过适当地调整观测向量的比率，能够适当地求出用户的意图。

首先，在知识库11a中，设定成

(‘最近的命令’、‘is’、‘提高音量’)

接着，设定表示观测向量的比率的观测向量值。

将“车外的状态”、“附近的店”、“当前时刻”、“驾驶员”各自的观测向量值设为1，

将“降低”的观测向量值设为10，

将“最近的命令”的观测向量值设为3，

将其他观测向量值设为0。

这里，“降低”和“最近的命令”是从用户直接受理的命令，因此，提高观测节点值即权重。

图15是以表形式(表7)示出通过这种设定计算各节点的重要度而得到的例子的图。图16是示出表示表7的结果的统合图的图。

如图15所示，在最上位的检索结果中提取“音乐播放器#5”和“降低音量”。这是由于，“降低”是“降低音量”或“降低温度”中的任意一方，根据最近的命令即“提高音量”，根据利用操作了音乐播放器这样的事实的推理，“音乐播放器#5”和“降低音量”的重要度变高。

《1-3》效果

如以上说明的那样，根据实施方式1的推理装置10和推理方法，得到以下效果。

首先，推理装置10通过动态地结合分别属于彼此不同的多个域的信息，能够生成统合后的信息。通过利用前向链的规则结合气温或人的行动、器件、导航的信息等不同域的图，生成统合图，能够在推理中利用该统合图。

此外，推理装置10不需要大量的学习数据就能够执行推理。即，不需要大量的学习数据就能够计算各节点的重要度。

此外，推理装置10能够使推理过程可视化，因此，在能够设计和提出推理内容时，在知识库11a、推理规则、观测节点的生成中，能够手动地设计值。此外，通过根据系统状况适当地切换应用规则集或观测节点，能够对应答内容进行变更。进而，如图12、图14、图16所示，推理结果能够实现基于统合图显示的可视化。

《1-4》针对其他领域的应用

在上述说明中，叙述了在驾驶中人工智能进行语音对话的例子，但是，推理装置10不仅在车或语音对话中是有效的，在车、家、工厂、广域安全等存在各种形式/时间轴的数据且动态变化的环境中的用户界面、计划制定、行动预测中也是有效的。

例如，人工智能还能够利用设置于家中的监视摄像机或传感器、设置于空调或冰箱等家电产品的摄像机预测居住者的下一个行动，自动地录制电视，烧开水，在出门时指出忘记带伞等。

《2》实施方式2

《2-1》结构

在实施方式1的推理装置10和推理方法中，将从外部取得的信息、由传感器检测到的信息等设为作为推理起点的重要节点即“观测节点”，根据观测节点求出观测向量，根据求出的观测向量计算推理结果。与此相对，在实施方式2的推理装置和推理方法中，根据用户的操作历史对观测向量进行更新，根据更新后的观测向量计算重要度向量，由此计算自适应于各个用户的推理结果。

图17是概略地示出实施方式2的推理装置20的结构的功能框图。在图17中，对与图1所示的结构要素相同或对应的结构要素标注与图1所示的标号相同的标号。实施方式2的推理装置20与实施方式1的推理装置10的不同之处在于，具有操作历史保存部28这点以及图分析部25根据用户的操作历史进行处理这点。

《2-2》动作

推理装置20反复进行推理。下面，对第1次推理和从第2次起的推理进行说明。

《第1次推理》

首先，在步骤S201中，计算重要度。与实施方式1的情况的动作同样，图分析部25计算各节点的重要度，信息输出部17向用户提示其结果。另外，在第1次推理中计算重要度向量x

在接下来的步骤S202中，提示选择项。信息输出部17利用重要度向量提示选择项。例如，如图18的(a)所示，信息输出部17在应用的显示器中显示上位3个推理结果。在显示器中，按照推理的重要度从高到低的顺序从上方起依次并列显示选择项OP1、选择项OP2、选择项OP3这3个选择项按钮。此外，还显示“其他”的按钮，该“其他”的按钮能够显示其他下位的重要度的选择项。显示方法能够由用户自由选择。

选择项OP1、选择项OP2、选择项OP3分别对应于节点OP1、节点OP2、节点OP3。

在接下来的步骤S203中保存操作历史。操作历史保存部28时时刻刻地保存经由动态信息取得部13取得的用户的操作历史。操作历史保存部28保存的数据也可以是与用户选择出的节点名有关的信息。或者，操作历史保存部28保存的数据也可以是表示用户选择出的节点与其他节点的顺序或相对重要度的信息。

这里，对表示节点的相对重要度的信息进行说明。例如，在图18的(a)所示的例子中，研究用户选择了选择项OP3的情况。该情况下，该用户能够判断为选择项OP3的重要度比选择项OP1和选择项OP2高。因此，操作历史保存部28保存包含信息“选择项OP3(节点OP3)的重要度＞选择项OP1(节点OP1)的重要度”和信息“选择项OP3(节点OP3)的重要度＞选择项OP2(节点OP2)的重要度”的信息作为操作历史。

在接下来的步骤S204中，对观测向量进行更新。图分析部25利用操作历史，求出更新后的观测向量v[n]。观测向量v[n]的更新方法在后面叙述。这里，v[n]表示通过第n次(n为正整数)的推理而计算出的观测向量。

《从第2次起的推理》

首先，在步骤S201中，计算重要度。图分析部25在第n次推理中，利用过去求出的第1次～第(n-1)次的观测向量v[1]～v[n-1]即

【数式11】

v[1]～v[n-1]

求出统合图中包含的各节点的重要度向量x

【数式12】

这里，向量x

图分析部25按照式(1)或式(3)求出重要度向量。此时，图分析部25也可以仅使用观测向量v[n-1]。或者，图分析部25也可以使用观测向量v[1]～v[n-1]的线性和作为观测向量。即，图分析部25也可以将β[i](i为正整数)设为预定的常数，在第n次推理中使用通过以下的式(4)

【数式13】

求出的观测向量

【数式14】

如后所述，在观测向量中保持有操作历史的信息，因此，图分析部25能够计算满足条件“选择项OP3(节点OP3)的重要度>选择项OP1(节点OP1)的重要度”和条件“选择项OP3(节点OP3)的重要度>选择项OP2(节点OP2)的重要度”的重要度向量x

在接下来的步骤S202中，提示选择项。信息输出部17利用重要度向量，再次向用户提示选择项。此时，在显示器中显示反映了上次的用户的选择结果的选择项。例如，如图18的(b)所示，在最上方的位置显示上次用户选择出的选择项OP3，接着，依次显示选择项OP1、选择项OP2。

接着，执行步骤S203、S204。它们是与第1次推理中的处理相同的处理。

推理装置20反复进行步骤S201～S204的处理，每当得到用户的操作历史时，计算重要度，对观测向量进行更新，时时地返回与用户对应的推理结果。下面，叙述观测向量v的更新方法的2个具体例。

《观测向量v的更新方法的例(U1)》

图19是示出为了说明实施方式2的推理装置20的图分析部25求出观测向量v[n]的方法而使用的表8的图。使用图19，叙述图分析部25求出观测向量v[n]的方法。在该例子中，例如，每当进行推理时，对能够动态取得的数据进行变更。

在第1次推理中，在作为对象的图中包含

(香草冰淇淋、instanceOf、冰淇淋类)

(酱油拉面、instanceOf、拉面类)

的三元组。

在第2次推理中，在作为对象的图中包含

(草莓冰淇淋、instanceOf、冰淇淋类)

(豚骨拉面、instanceOf、拉面类)

的三元组。

首先，在开始推理前，针对初始的观测向量v的值的比率，如图19所示，将与冰淇淋类有关的观测向量的比率设定成1，将拉面类的比率设定成1，将其他比率设定成0。另外，观测向量v的值适当地进行归一化，使得观测向量v的总和成为1。

接着，对如下情况进行说明：在第1次推理中，图分析部25计算重要度，信息输出部17向用户提示“酱油拉面”和“香草冰淇淋”作为选择项，用户选择了“酱油拉面”。此时，图分析部25例如使选择出的“酱油拉面”及其抽象的上位概念“拉面类”的观测向量v的比率增加1。其结果是，在第1次推理结束时，冰淇淋类的观测向量v的比率为1，拉面类的比率为2，酱油拉面的比率为1，其他比率为0。

即，在该时点，对拉面类的观测节点赋予最大的权重，在从下次起的推理中，拉面类和作为拉面类的实例的节点的重要度变高。即，观测向量v保持“用户喜欢所有拉面(拉面类)”这样的信息。

在第2次推理中，在图分析部25计算出重要度的情况下，不存在上次选择出的“酱油拉面”的节点，但是，对拉面类的观测节点赋予最大的权重，因此，例如如下所述，图分析部25计算出的重要度的比率对与拉面有关的节点赋予较大的权重。例如，冰淇淋类的重要度向量的比率为2，拉面类的比率为3，豚骨拉面的比率为2，草莓冰淇淋的比率为1，其他比率为0。

信息输出部17使用该重要度的信息，按照豚骨拉面、草莓冰淇淋的顺序提示信息。这里，研究用户选择了“豚骨拉面”的情况。此时，图分析部15例如使选择出的“豚骨拉面”及其上位概念“拉面类”的观测向量v的比率分别增加1。其结果是，在第2次推理结束时，观测向量v的比率如下所述。冰淇淋类的比率为1，拉面类的比率为3，酱油拉面的比率为1，豚骨拉面的比率为1，其他比率为0。

其结果是，对拉面类赋予最大的权重。观测向量v意味着，与更大的可靠度一起保持“用户喜欢所有拉面(拉面类)”这样的信息。

这样，推理装置20利用用户的选择结果对观测向量进行更新，由此，能够在观测向量中保持用户的兴趣或癖好的信息。由此，在从第2次起的推理中，能够计算与用户的兴趣或癖好对应的推理结果。

特别地，如上述例子所示，根据用户的选择结果反复进行观测向量的更新，由此，不是酱油拉面或豚骨拉面等具体实例，而是针对拉面类或冰淇淋类这样的上位概念(上层本体论)，观测向量的权重变强。由此，能够利用上位概念而不是具体事项保持用户的兴趣或癖好。由此，在取得的信息动态变化而追加新的事项的节点的情况下，上位概念的节点也始终存在于图中，由此，能够进行自适应于用户的推理。

另一方面，用户喜欢某个特定的事项这样的事例也能够利用观测向量的更新来表现。例如，在用户始终仅选择“酱油拉面”的情况下，仅观测向量的“酱油拉面”的权重变强。由此，作为具体事项的“酱油拉面”的节点的重要度始终变高。

《观测向量v的更新方法的例(U2)》

图分析部25也可以通过使后述的成本函数CF2最小化，对观测向量进行更新。下面叙述动作例。将重要度向量设为x

这里，在第1次推理中，假设得到“x

这里，例如，在图18的(a)的例子中，说明用户选择了选择项OP3的情况。该情况下，对于该用户来说，能够判断为选择项OP3的重要度比选择项OP1和选择项OP2高，因此，操作历史保存部保存条件“选择项OP3的重要度＞选择项OP1的重要度”和条件“选择项OP3的重要度＞选择项OP2的重要度”的节点的信息作为操作历史Hist。

接着，图分析部25根据操作历史Hist的信息，求出满足条件“选择项OP3的重要度＞选择项OP1的重要度”和条件“选择项OP3的重要度＞选择项OP2的重要度”即“x

具体而言，图分析部25同时求出使利用以下的式(5)计算的成本CF2最小化的新的观测向量v和重要度向量x

【数式15】

式(5)右边的第1项与式(3)右边相同。式(5)右边的第2项和第3项是用于保证“x

【数式16】

是在u＜0的情况下为0且在u≥0的情况下取正值的任意函数，还表记为函数H

例如，函数H

【数式17】

在式(6)中，函数H

此外，向量v和向量x的元素为非负值，向量v的元素的总和为1，向量x的元素的总和为1。这样求出的观测向量v满足条件“x

《2-3》效果

如以上说明的那样，根据实施方式2的推理装置20或推理方法，保存用户的操作历史，根据操作历史对观测向量进行更新，根据观测向量计算下一个推理结果，由此，能够实现符合用户的兴趣的语音对话等自适应的用户界面的应答。

此外，在观测向量的更新中，不仅对个别的事项而且对上位概念(上层本体论)赋予权重，由此，能够以抽象化的概念级别学习用户的兴趣或癖好。

关于上述以外的方面，实施方式2与实施方式1相同。

《3》实施方式3

《3-1》结构

在使用实施方式1的推理装置10和推理方法的情况下，用户有时希望得知推理结果的理由，即推荐了推荐对象的理由。例如，在表1所示的对话例中，在包含推理装置10的人工智能代理说出“附近有凉面的餐厅”时，有时用户反复询问“为什么推荐凉面？”这样的推荐理由。此时，人工智能代理被要求向用户说明推荐对象是“凉面”的理由。在实施方式3中，说明具有对用户说明推荐理由的功能的推理装置30和用于执行这种功能的推理方法。

图20是概略地示出实施方式3的推理装置30的结构的功能框图。在图20中，对与图1所示的结构要素相同或对应的结构要素标注与图1所示的标号相同的标号。实施方式3的推理装置30与实施方式1的推理装置10的不同之处在于，具有图路径分析部38这点以及图分析部35和图检索部36进行的处理这点。

《3-2》动作

在最初的步骤S301中，与实施方式1同样，图分析部35求出取得的统合图中的各节点的重要度，向用户提示与各节点的重要度对应的多个选择项。例如研究如下情况：如表1的对话例那样，信息输出部17将“车外的状态”设为观测节点，推荐了“凉面”的节点。

在接下来的步骤S302中，图路径分析部38取得统合图，在统合图中的节点中设定推理开始节点和推理结束节点。图路径分析部38计算连接推理开始节点和推理结束节点的图上的路径中的、路径上的节点的重要度的合计最大的路径。但是，要计算的路径是相同节点仅通过1次的路径。

图21是示出实施方式3的推理装置30的图路径分析部38的动作例的图。在图21中，例如，在推理开始节点设定作为观测节点之一的“车外的状态”。在推理结束节点设定作为推荐内容的“凉面”。

接着，图路径分析部38计算从推理开始节点“车外的状态”到推理结束节点“凉面”为止的图上的路径中的、节点的重要度的合计最大的路径(图21中虚线的箭头所示的路径)。

具体而言，图路径分析部38取得依次连接“车外的状态”、“热”、“吃凉的食物”、“凉的食物”、“凉面”的各节点的路径。该路径是连接推理开始节点和推理结束节点的路径中的、重要度合计最大(值19)的路径。这里，在路径的列举中，例如可以利用使用非专利文献4记载的ZDD(Zero-suppressed Decision Diagram：零压缩二元决策图)的图列举方法。

非专利文献4：Jun Kawahara等3人、“Frontier-based Search for EnumeratingAll Constrained Subgraphs with Compressed Representation”、TCS TechnicalReport、Division of Computer Science、Report Series A、2014年9月30日

在接下来的步骤S303中，信息输出部17利用最佳路径的信息输出推理理由。例如，信息输出部17根据具有按照“车外的状态”、“热”、“吃凉的食物”、“凉的食物”、“凉面”的顺序排列的节点的统合图上的路径信息，生成“这是由于，车外的状态较热，你想吃凉的食物，即推理该凉的食物是凉面”这样的文章。

根据以上的处理，针对用户的“为什么推荐凉面？”这样的问题，推理装置30能够输出“这是由于，车外的状态较热，你想吃凉的食物，即，推理出该凉的食物是凉面”。

此外，在存在多个推理开始节点的情况下，也可以计算多个最佳路径和推理理由。例如，在“车外的状态”、“附近的店”、“最近的命令”、“驾驶员”这4个是观测节点的情况下，也可以将它们分别设定成推理开始节点，计算4个最佳路径和4个推理理由。

《3-3》变形例1

图22的(a)是示出实施方式3的变形例1的推理装置的图路径分析部的另一个动作例的图。

在图21的例子中，图路径分析部38求出连接推理开始节点和推理结束节点的路径中的、重要度的合计最大的路径，将该路径设为最佳路径，根据该最佳路径生成推理理由。但是，图路径分析部38的动作不限于图21所示的动作。图分析动作部38也可以根据连接推理开始节点和推理结束节点的路径上的节点的个数即节点合计数来决定最佳路径，根据该最佳路径生成推理理由。例如，图分析动作部38也可以求出连接推理开始节点和推理结束节点的路径中的、节点合计数最小的路径，将该路径设为最佳路径。此外，在存在节点合计数最小的多个路径的情况下，图分析动作部38也可以求出这多个路径中的、要经由的节点的重要度的合计最大的路径，将其设为最佳路径。

在图22的(a)中，连接推理开始节点S和推理结束节点G的路径是以下3个路径。

(路径P11)：连接节点S、N1、N2、N3、G的路径

(路径P12)：连接节点S、N4、G的路径

(路径P13)：连接节点S、N5、G的路径

在路径P11中，要经由的节点的个数为5个，要经由的节点的重要度的合计为14。

在路径P12中，要经由的节点的个数为3个，要经由的节点的重要度的合计为7。

在路径P13中，要经由的节点的个数为3个，要经由的节点的重要度的合计为3。

此时，图分析动作部38求出连接推理开始节点S和推理结束节点G的路径P11、P12、P13中的要经由的节点数的合计最小的路径P12、P13，在存在合计最小的多个路径的情况下，采用它们中的、重要度的合计最大的路径P12作为最佳路径，利用最佳路径生成推理理由。这里，路径P12相当于最佳路径。利用路径P12生成推理理由，由此，具有能够生成简化的的推理理由的效果。

另一方面，连接推理开始节点S和推理结束节点G的路径P11、P12、P13中的重要度的合计最大的路径是路径P11。当利用路径P11生成推理理由时，文章较长，有时人难以理解。在图22的(a)所示的变形例1中，在这种情况下，能够生成适当的推理理由。

《3-4》变形例2

图22的(b)是示出实施方式3的变形例2的推理装置的图路径分析部的另一个动作例的图。

有时事先已判明在推理理由的生成中必须利用的节点。图路径分析部38指定决定最佳路径要经由的节点即在推理理由的生成中必须利用的节点作为必须的推理经由节点，由此，也可以生成推理理由。

在图22的(b)所示的例子中，图路径分析部38将S指定为推理开始节点，将G指定为推理结束节点，将N5指定为必须的推理经由节点。图路径分析部38计算连接推理开始节点S和推理结束节点G且通过必须的推理经由节点N5的图上的路径作为最佳路径。在图22的(b)的例子中，通过必须的推理经由节点N5的路径P13即路径P131或P132相当于最佳路径。

在图22的(b)的例子中，存在通过必须的推理经由节点N5的多个路径，因此，图路径分析部38在推理理由的生成中利用多个路径中的任意一方即路径P131、P132中的任意一方。该情况下，图路径分析部38例如能够使用图22的(a)中说明的推理理由的生成方法。

在图22的(b)中，连接推理开始节点S和推理结束节点G且通过必须的推理经由节点N5的路径是以下2个路径。

(路径P131)：连接节点S、N5、N6、G的路径

(路径P132)：连接节点S、N5、N7、G的路径

在路径P131中，要经由的节点的个数为4个，要经由的节点的重要度的合计为4。

在路径P132中，要经由的节点的个数为4个，要经由的节点的重要度的合计为5。

此时，图分析动作部38求出连接推理开始节点S和推理结束节点G的路径P131、P132中的要经由的节点数的合计最小的路径P131、P132，在存在合计最小的多个路径的情况下，采用它们中的、重要度的合计最大的路径P132作为最佳路径，利用最佳路径生成推理理由。这里，路径P132相当于最佳路径。利用路径P132生成推理理由，由此，具有能够生成简化的推理理由的效果。

《3-5》变形例3

图路径分析部38也可以利用规则节点生成推理理由，将被应用的推理规则的信息包含在推理理由中。

图23的(a)～(c)是示出实施方式3的变形例3的推理装置的图路径分析部38的又一个动作例的图。图23的(a)是应用推理规则之前的图，在该图中仅存在节点A、B、C、S。这里，将节点S假设为观测节点。

在接下来的步骤S301a中，图路径分析部38应用推理规则，生成统合图。此时，图结合部14在统合图中追加表示各推理规则的前提条件和推理规则新生成的节点的信息的规则节点。图23的(b)示出通过图结合部14应用以下2个推理规则rule1、rule2而得到的统合图的例子。

rule1：如果存在节点A和节点B，则三元组(X、prop1、Y)成立。

rule2：如果存在节点C和节点X，则三元组(X、prop2、Z)成立。

这里，“prop1”和“prop2”意味着property1和property2即属性1和属性2。“prop1”和“prop2”例如是like，但是，也可以是其他的property。

在“prop1”和“prop2”是like的情况下，

rule1：如果存在节点A和节点B，则三元组(X、like、Y)成立。即，X喜欢的是Y成立。

rule2：如果存在节点C和节点X，则三元组(X、like、Z)成立。即，X喜欢的是Z成立。

如图23的(b)所示，例如，图结合部14生成规则节点rule1和rule2，将其追加到统合图中。这里，例如，三元组(A、前提、rule1)示出“A是rule1的前提理由”。此外，三元组(rule1、生成、X)示出“通过rule1新生成节点X”。

在接下来的步骤S302a中，图路径分析部38将规则节点指定为必须的推理经由节点，求出最佳路径。

例如，在图23的(b)的统合图中，

针对“为什么生成Z？”这样的用户的问题，图路径分析部38能够如下生成理由。

在图23的(c)的统合图中，图路径分析部38将观测节点S设定成推理开始节点，将rule1和rule2设定成必须的推理经由节点，将Z设定成推理结束节点，计算重要度的合计最大的路径。另外，在将rule1和rule2指定成必须的推理经由节点的情况下，作为从推理开始节点S经由必须的推理经由节点到推理结束节点Z为止的路径而存在多个路径时的处理能够设为与使用图22的(b)说明的变形例2时的处理。

其结果是，例如，图路径分析部38计算连接节点S、B、rule1、Y、X、rule2、Z的路径。在图23的(c)中，利用虚线80的箭头表示该路径。

在接下来的步骤S303中，信息输出部17利用最佳路径的信息，输出推理理由。例如，利用路径上的节点信息，如下所述，依次生成推理理由。这样，能够计算“应用哪个规则生成Z”。

在图23的(c)的例子中，生成的推理理由是以下理由。

■推理开始节点S的要素存在节点B。

■节点B是节点rule1的前提。

■节点rule1生成节点Y。

■节点Y是节点X的prop1。

■节点X是节点rule2的前提。

■节点rule2生成推理结束节点Z。

《3-6》效果

如以上说明的那样，根据实施方式3的推理装置30或推理方法，能够以在视觉上容易理解其理由的方式并且逻辑性地提示针对用户的“为什么这样？”这样的对人工智能的问题的回答。

关于上述以外的方面，实施方式3与实施方式1或2相同。此外，实施方式1～3的结构要素能够彼此适当地组合。

标号说明

10、20、30：推理装置；11：知识库部；11a：知识库；12：规则数据库部；12a：规则数据库；13：动态信息取得部；14：图结合部(信息结合部)；15、25、35：图分析部(信息分析部)；16、36：图检索部(信息检索部)；17：信息输出部；28：操作历史保存部；38：图路径分析部；41：应用；42：用户界面；43：GPS；44：摄像机；45：互联网；46：外部数据库；47：传感器；51：用户界面。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 推理装置、推理方法和推理程序 [P] . 中国专利： CN112740238A . 2021-04-30
2. 学习装置、推理装置、学习模型的生成方法及推理方法 [P] . 中国专利： CN112640037A . 2021-04-09
3. ECONOMIC REASONING ANALYSIS METHOD, ECONOMIC REASONING ANALYSIS DEVICE, ECONOMIC REASONING ANALYSIS VOTING SYSTEM, ECONOMIC REASONING ANALYSIS PROGRAM, STORAGE MEDIUM STORED WITH ECONOMIC REASONING ANALYSIS PROGRAM, AND REASONING METHOD QUANTUM-COMPUTATIONALLY MERGING LEGAL REASONING ANALYSIS METHOD AND ECONOMIC REASONING ANALYSIS METHOD IN DECISION MAKING [P] . 日本专利： JP2005122248A . 2005-05-12

机译：经济推理分析方法，经济推理分析设备，经济推理分析投票系统，经济推理分析程序，存储有经济推理分析程序的存储介质以及推理方法定量计算，融合法律推理分析方法和决策中的经济推理分析方法
4. Learning data generator, learning data generation method, learning data generation program, learning device, learning method, learning program, inference device, inference method, inference program, learning system, and inference system [P] . 日本专利： JP6775697B1 . 2020-10-28

机译：学习数据生成器，学习数据生成方法，学习数据生成程序，学习设备，学习方法，学习程序，推理设备，推理方法，推理程序，学习系统和推理系统
5. Inference system, inference device, inference method and inference program [P] . JP2021081786A . 2021-05-27

机译：推理系统，推理设备，推理方法和推理程序