首页> 中国专利> 协同过滤系统以及协同过滤方法

协同过滤系统以及协同过滤方法

摘要

一种协调过滤系统以及协调过滤方法。当不存在对项目(X)和项目(Z)的双方均进行了评价的用户的评价值时,信息处理中心(10a)的运算处理部(30)的间接相似度计算部(32)使用项目(Y)的评价值来间接地计算项目(X)与项目(Z)的相似度,该项目(Y)为,存在对项目(X)和项目(Y)的双方均进行了评价的用户的评价值、且存在对项目(Y)和项目(Z)的双方均进行了评价的用户的评价值的项目。预测评价值计算部(33)使用间接相似度计算部(32)计算出的项目(X)与项目(Z)的相似度,和对项目(X)以及项目(Z)的评价值,来计算对项目(X)和项目(Z)中的某一个未进行评价的用户的预测评价值。由此,能够计算出不能直接计算的、项目(X)和项目(Z)的预测评价值。由此,能够扩大可通过协同过滤而对评价值进行预测的项目的范围。

著录项

  • 公开/公告号CN102640141A

    专利类型发明专利

  • 公开/公告日2012-08-15

    原文格式PDF

  • 申请/专利权人 丰田自动车株式会社;

    申请/专利号CN200980162673.4

  • 申请日2009-12-18

  • 分类号G06F17/30;

  • 代理机构北京金信立方知识产权代理有限公司;

  • 代理人黄威

  • 地址 日本爱知县

  • 入库时间 2023-12-18 06:20:22

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2015-05-13

    授权

    授权

  • 2012-10-03

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20091218

    实质审查的生效

  • 2012-08-15

    公开

    公开

说明书

技术领域

本发明涉及协同过滤系统以及协同过滤方法,尤其涉及使用了多个用户各 自对项目的评价值的协调过滤系统以及协调过滤方法。

背景技术

目前提出了一种如下的协同过滤的方法,即,对于大量的用户预先积存与 其爱好相关的信息,并使用与某用户爱好相似的其他用户的信息,来对该用户 的爱好进行预测。协同过滤被用于进行推荐和个性化设置。例如,在专利文献 1中公开了一种如下的信息推荐方法,即,当任意的用户实际已对任意的条目 进行了投票时,将对该条目的评价值代入条目-用户矩阵中的对应的单元中, 并且向与该条目相似的其他条目的单元中也模拟地代入评价值。专利文献1中 的信息推荐方法,对由于不存在评价值而无法进行推荐的条目也能够进行推 荐。

在先技术文献

专利文献

专利文献1:日本特开2005-202540号公报

发明内容

发明所要解决的课题

有时汽车导航系统会考虑到用户的爱好而应用上述这种协同过滤来实施 对店铺和设施等项目的推荐。例如,有时汽车导航系统根据用户过去驾车访问 过的餐馆的履历、和访问过该餐馆的其他用户对餐馆的访问履历,来实施对可 能适合该用户的爱好的、该用户尚未访问过的餐馆进行推荐的服务。在这种情 况下,汽车导航系统有可能只推荐用户的行动范围周边的项目。

即,作为汽车导航系统所推荐的项目,设想有餐馆、酒店以及小卖店等, 但这些均为与位置相关的项目。在协同过滤中,当计算项目间的相似度时,需 要多个对项目的双方均进行了评价的用户。但是,在与位置相关的项目中,由 于当项目彼此间在距离上相隔较远时,对双方均进行了评价的用户会比较少, 因此相似度的计算较为困难。其结果为,由于可计算相似度的项目成为了彼此 距离较近的项目,因此汽车导航系统能够推荐的项目也有可能仅为用户的行动 范围周边的项目。

此外,还存在对项目附上评价分的用户较少,从而协同过滤不工作的可能 性。即,作为附上对项目的评价值的方法,考虑到了用户通过网站来写入评价 分的方法、和用户在访问了作为项目的店铺和设施等之后通过汽车导航系统而 输入评价分的方法等。但是可以预想到,由于上述的任意一种方法均需要花费 用户的劳力和时间,因此难以收集用户的评价值。

本发明是考虑了这种情况而完成的,其目的在于,提供一种能够进一步扩 大可通过协同过滤而对评价值进行预测的项目的范围的协同过滤系统以及协 同过滤方法。此外,本发明的目的还在于,提供能够通过个数更少的用户的评 价值来实施通过协同过滤而进行的预测的协同过滤系统以及协同过滤方法。

用于解决课题的方法

本发明为一种协同过滤系统,其使用了多个用户各自对项目的评价值,其 中,所述协同过滤系统具备:相似度计算单元,当不存在对第一项目以及第二 项目的双方均进行了评价的、至少一个用户的评价值时,所述相似度计算单元 使用第三项目的评价值来计算第一项目与第二项目的相似度,其中,所述第三 项目为,存在对第一项目以及第三项目的双方均进行了评价的至少一个用户的 评价值、且存在对第二项目以及第三项目的双方均进行了评价的至少一个用户 的评价值的项目;预测评价值计算单元,其使用由相似度计算单元计算出的第 一项目与第二项目的相似度、和对第一项目以及第二项目的评价值,来计算对 第一项目以及第二项目中的某一个项目未进行评价的用户的预测评价值。

当不存在对第一项目以及第二项目的双方均进行了评价的、用户的评价值 时,即,由于第一项目与第二项目之间的距离较远等原因,有时会无法直接计 算出第一项目与第二项目的相似度。此时,相似度计算单元根据第三项目的评 价值来计算第一项目与第二项目的相似度,其中,所述第三项目为,存在对第 一项目以及第三项目的双方均进行了评价的至少一个用户的评价值、且存在对 第二项目以及第三项目的双方均进行了评价的至少一个用户的评价值的项目。 即,相似度计算单元使用能够分别直接计算出与第一项目以及与第二项目的相 似度的第三项目,来间接地对第一项目与第二项目的相似度进行计算。由此, 能够对无法直接计算的、第一项目与第二项目的相似度进行计算。

此外,预测评价值计算单元使用由相似度计算单元计算出的第一项目与第 二项目的相似度、和对第一项目以及第二项目的评价值,来计算对第一项目以 及第二项目中的某一个项目未进行评价的用户的预测评价值。由此,能够对无 法直接计算的、第一项目以及第二项目的预测评价值进行计算。因此,能够进 一步扩大能够通过协同过滤而进行的对评价值的预测的项目的范围。

此时,优选为,当对于第三项目的个数为N个、且1≤i≤N的第i个第三 项目而言,作为皮尔逊的积差相关系数的、第一项目与第三项目的相似度用s (C1,C3i)来表示,且作为皮尔逊的积差相关系数的、第二项目与第三项目 的相似度用s(C2,C3i)来表示时,相似度计算单元通过下述式(1)来计算 作为第一项目与第二项目的相似度的s(C1,C2),

数学式1

s(C1,C2)=(Σi=1N1+s(C1,C3i)2*1+s(C2,C3i)2N)×2-1...(1).

根据该结构,能够根据用皮尔逊的积差相关系数来表示的、第一项目与第 三项目的相似度、和第二项目与第三项目的相似度,来定量地计算第一项目与 第二项目的相似度。

此外,本发明为一种协同过滤系统,其使用了多个用户各自对项目的评价 值,其中,所述协同过滤系统具备预测评价值计算单元,对于利用过特定项目、 且对特定项目未进行评价的一个用户,所述预测评价值计算单元使用一个用户 对特定项目的利用频度、和利用过特定项目且对特定项目进行了评价的其他用 户对特定项目的利用频度以及对特定项目的评价值,来计算一个用户对特定项 目的预测评价值。

或者,优选为,在上述系统过滤系统中,对于利用过特定项目且对特定项 目未进行评价的一个用户,预测评价值计算单元使用一个用户对特定项目的利 用频度、和利用过特定项目且对特定项目进行了评价的其他用户对特定项目的 利用频度以及对特定项目的评价值,来计算一个用户对特定项目的预测评价 值。

有时会存在利用过特定的项目且对特定的项目未进行评价的一个用户。此 时,预测评价值计算单元使用该一个用户对特定项目的利用频度、和利用过特 定项目且对特定项目进行了评价的其他用户对特定项目的利用频度以及对特 定项目的评价值。可以认为,用户各自对项目的利用频度和对该项目的评价值 是相关的。因此,即使不存在该一个用户本身的评价值,预测评价值计算单元 也能够使用该一个用户对特定项目的利用频度、和利用过特定项目且对特定项 目进行了评价的其他用户对特定项目的利用频度以及评价值,来计算一个用户 对特定项目的预测评价值。因此,能够通过个数更少的用户的评价值来实施通 过协同过滤而进行的预测。

此时,优选为,预测评价值计算单元使用一个用户对特定项目的利用频度、 和其他用户对特定项目的利用频度以及对特定项目的评价值,来计算一个用户 对特定项目的预测评价值,其中,所述其他用户对特定项目的利用频度为,特 定项目的利用频度与一个用户对特定项目的利用频度之间存在预定的阈值以 内的差异。

当项目的利用频度存在预定的阈值以内的差异时,可以推断为评价值也近 似。因此,预测评价值计算单元通过使用一个用户对特定项目的利用频度、和 对特定项目的利用频度与一个用户对特定项目的利用频度之间存在预定的阈 值以内的差异的、其他用户对特定项目的利用频度以及对特定项目的评价值, 来计算一个用户对特定项目的预测评价值,从而能够高精度地对预测评价值进 行计算。

此外,优选为,预测评价值计算单元使用一个用户对特定项目的利用频度、 和其他用户对特定项目的利用频度以及对特定项目的评价值,来计算一个用户 对特定项目的预测评价值,其中,所述其他用户对所述特定项目的利用频度为, 所述特定项目所属的类别内的非特定多数的项目的利用频度与一个用户对非 特定多数的项目的利用频度之间存在预定的阈值以内的差异。

当特定项目所属的类别内的非特定多数的项目的利用频度存在预定的阈 值以内的差异时,可以推断为对特定项目的评价值也近似。因此,预测评价值 计算单元通过使用一个用户对特定项目的利用频度、和对特定项目所属的类别 内的非特定多数的项目的利用频度与一个用户对非特定多数的项目的利用频 度之间存在预定的阈值以内的差异的、其他用户对特定项目的利用频度以及对 特定项目的评价值,来计算一个用户对特定项目的预测评价值,从而能够进一 步高精度地对预测评价值进行计算。

此外,优选为,预测评价值计算单元使用一个用户对特定项目的利用频度, 和多个其他用户各自对特定项目的利用频度中的每一个利用频度的、对特定项 目的评价值的中央值以及平均值中的某一个值,来计算一个用户对特定项目的 预测评价值。

可以推断为,多个其他用户各自对特定项目的利用频度中的每一个利用频 度的、对特定项目的评价值的中央值或平均值,高精度地表示了利用频度与评 价值的相关关系。因此,预测评价值计算单元通过使用一个用户对特定项目的 利用频度,和多个其他用户各自对特定项目的利用频度中的每一个利用频度 的、对特定项目的评价值的中央值以及平均值中的某一个值,来计算一个用户 对特定项目的预测评价值,从而能够进一步高精度地对预测评价值进行计算。

此外,优选为,预测评价值计算单元根据利用过特定项目且对特定项目进 行了评价的其他用户对特定项目的利用频度、以及对特定项目的评价值,来导 出对特定项目的评价值相对于特定项目的利用频度的函数,并使用一个用户对 特定项目的利用频度和函数,来计算一个用户对特定项目的预测评价值。

可以推断为,根据利用过特定项目且对特定项目进行了评价的其他用户对 特定项目的利用频度、以及对特定项目的评价值而导出的、对特定项目的评价 值相对于特定项目的利用频度的函数,高精度地表示了利用频度与评价值的相 关关系。而且,即使得到的利用频度与评价值是离散的值,也能够通过该函数 来进行插值。因此,预测评价值计算单元通过根据利用过特定项目且对特定项 目进行了评价的其他用户对特定项目的利用频度、以及对特定项目的评价值, 来导出对特定项目的评价值相对于特定项目的利用频度的函数,并使用一个用 户对特定项目的利用频度和函数,来计算一个用户对特定项目的预测评价值, 从而能够进一步高精度地对预测评价值进行计算。此外,即使其他用户的利用 频度与一个用户的利用频度是离散的值,也能够通过函数的插值来计算预测评 价值。

另一方面,本发明为一种协同过滤方法,其使用了多个用户各自对项目的 评价值,其中,所述协同过滤方法包括:相似度计算工序,在所述相似度计算 工序中,当不存在对第一项目以及第二项目的双方均进行了评价的至少一个用 户的评价值时,使用第三项目的评价值来计算第一项目与第二项目的相似度, 其中,所述第三项目为,存在对第一项目以及第三项目的双方均进行了评价的 至少一个用户的评价值、且存在对第二项目以及第三项目的双方均进行了评价 的至少一个用户的评价值的项目;预测评价值计算工序,在所述预测评价值计 算工序中,使用在相似度计算工序中计算出的第一项目与第二项目的相似度、 和对第一项目以及第二项目的评价值,来计算对第一项目以及第二项目中的某 一个项目未进行评价的用户的预测评价值。

此时,优选为,在相似度计算工序中,当对于第三项目的个数为N个、且 1≤i≤N的第i个第三项目而言,作为皮尔逊的积差相关系数的、第一项目与 第三项目的相似度用s(C1,C3i)来表示,且作为皮尔逊的积差相关系数的、 第二项目与第三项目的相似度用s(C2,C3i)来表示时,通过下述式(2)来 计算作为第一项目与第二项目的相似度的s(C1,C2),

数学式2

s(C1,C2)=(Σi=1N1+s(C1,C3i)2*1+s(C2,C3i)2N)×2-1...(2)

此外,本发明为一种协同过滤方法,其使用了多个用户各自对项目的评价 值,其中,所述协同过滤方法包括预测评价值计算工序,在所述预测评价值计 算工序中,对于利用过特定项目且对特定项目未进行评价的一个用户,使用一 个用户对特定项目的利用频度、和利用过特定项目且对特定项目进行了评价的 其他用户对特定项目的利用频度以及对特定项目的评价值,来计算一个用户对 特定项目的预测评价值。

或者,优选为,上述协同过滤方法中,在预测评价值计算工序中,对于利 用过特定项目且对特定项目未进行评价的一个用户,使用一个用户对特定项目 的利用频度、和利用过特定项目且对特定项目进行了评价的其他用户对特定项 目的利用频度以及对特定项目的评价值,来计算一个用户对特定项目的预测评 价值。

此时,优选为,在预测评价值计算工序中,使用一个用户对特定项目的利 用频度、和其他用户对特定项目的利用频度以及对特定项目的评价值,来计算 一个用户对特定项目的预测评价值,其中,所述其他用户对特定项目的利用频 度为,特定项目的利用频度与一个用户对特定项目的利用频度之间存在预定的 阈值以内的差异。

此外,优选为,在预测评价值计算工序中,使用一个用户对特定项目的利 用频度、和其他用户对特定项目的利用频度以及对特定项目的评价值,来计算 一个用户对特定项目的预测评价值,其中,所述其他用户对特定项目的利用频 度为,特定项目所属的类别内的非特定多数的项目的利用频度,与一个用户对 非特定多数的项目的利用频度之间存在预定的阈值以内的差异。

此外,优选为,在预测评价值计算工序中,使用一个用户对特定项目的利 用频度,和多个其他用户各自对特定项目的利用频度中的每一个利用频度的、 对特定项目的评价值的中央值以及平均值中的某一个值,来计算一个用户对特 定项目的预测评价值。

此外,优选为,在预测评价值计算工序中,根据利用过特定项目且对特定 项目进行了评价的其他用户对特定项目的利用频度、以及对特定项目的评价 值,来导出对特定项目的评价值相对于特定项目的利用频度的函数,并使用一 个用户对特定项目的利用频度和函数,来计算一个用户对特定项目的预测评价 值。

发明效果

根据本发明的协同过滤系统以及协同过滤方法,能够进一步扩大可通过协 同过滤而对评价值进行预测的项目的范围。此外,根据本发明的协同过滤系统 以及协同过滤方法,能够根据个数更少的用户的评价值来实施通过协同过滤而 进行的预测。

附图说明

图1为表示第一实施方式所涉及的协同过滤系统的结构的框图。

图2为表示第一实施方式所涉及的协同过滤系统的动作的流程图。

图3为表示彼此无法直接计算相似度的项目的图。

图4为表示间接地计算相似度的方法的图。

图5为表示对间接地计算出的项目的评价的图。

图6为表示第二实施方式所涉及的协同过滤系统的结构的框图。

图7为表示第二实施方式所涉及的协同过滤系统的动作的流程图。

图8为表示参考对该类别的访问频度与对象用户相等且对该项目的访问频 度与对象用户相等的用户的评价值,从而对对象用户的评价值进行预测的方法 的图。

具体实施方式

接下来,参照附图对本发明的实施方式所涉及的协同过滤系统进行说明。

如图1所示,本发明的第一实施方式中的协同过滤系统由向被搭载在多台 车辆上的各个车辆用导航装置40提供信息的信息处理中心10a构成。信息处 理中心10a能够连接到包含食客检索网站51在内的互联网50上,食客检索网 站51用于提供关于用户喜欢的与饮食相关的店铺以及设施的信息。信息处理 中心10a为,用于实施通过协同过滤来对各个用户的爱好进行预测、并通过车 辆用导航装置40来对用户推荐该用户未访问过的餐馆、酒店以及小卖店等项 目的设施。

信息处理中心10a具备用户评价值存储装置21a、位置信息数据库22以及 运算处理装置30。用户评价值存储装置21a为,对每个项目均存储和管理有多 个用户各自对项目的评价值的数据库。存储在用户评价值存储装置21a中的每 个用户的评价值,是通过将用户输入至车辆用导航装置40中的信息从车辆用 导航装置40发送至信息处理中心10a从而取得的。此外,存储在用户评价值 存储装置21a中的每个用户的评价值,是通过从互联网50上的各种网站上收 集与已注册的用户相关的信息从而取得的。

位置信息数据库22为,将驾驶车辆的用户有可能访问的与餐馆、酒店以 及小卖店等的项目相关的信息与项目的POI(位置信息Position Of  Information)关联起来并进行存储和管理的数据库。

运算处理装置30为,根据存储在用户评价值存储装置21a以及位置信息 数据库22中的信息,并通过协同过滤,来预测作为对象的用户对未访问过的 项目的评价值的装置。运算处理装置30具有直接相似度计算部31、间接相似 度计算部32以及预测评价值计算部33。

直接相似度计算部31为,使用皮尔逊(pearson)的积差相关系数等,并 根据用户对两个项目各自的评价值,来对两个项目之间的相似度进行计算的部 件。间接相似度计算部32为,当无法直接计算出两个项目之间的相似度时, 使用能够直接计算出与各个项目的相似度的其他的项目来间接地对两个项目 之间的相似度进行计算的部件。预测评价值计算部33为,根据由直接相似度 计算部31以及间接相似度计算部32计算出的两个项目之间的相似度,而预测 作为对象的用户对未访问过的项目附上怎样的评价值的部件。

接下来,对本实施方式的协同过滤系统的动作进行说明。如图2所示,信 息处理中心10a的用户评价值存储装置21a根据从车辆用导航装置40被发送 至信息处理中心10a的信息、以及来自互联网50上的网站上的信息,来取得 各个用户对各个项目的评价值(S11)。当从网站上取得用户的评价值时,例如 通过取得对互联网50上的餐馆等进行评价的网站的日志,从而能够取得用户 的评价值。

此处,当在用户评价值存储装置21a的存储区中存在附有评价值的项目数 为实施协同过滤时所需要的阈值以下的用户时(S12),则再次取得该用户的评 价值(S11)。当在用户评价值存储装置21a的存储区中不存在附有评价值的项 目数为实施协同过滤时所需要的阈值以下的用户时(S12),运算处理装置30 的直接相似度计算部31以用户对所收集的项目的各自的评价值为基础来计算 项目之间的相似度(S13)。

当存在对两个项目的双方均附上了评价值的用户时,通过皮尔逊的积差相 关系数而能够直接计算两个项目的相似度。此时,设定为,对项目X和项目Y 这两个项目的双方均附上了评价值的用户有n个人。将第i个用户对项目X、 项目Y的评价值分别设为rX(i)、rY(i)。此时,直接相似度计算部31 通过下式(3),来计算项目X与项目Y的相似度s(X,Y)。

数学式3

s(X,Y)=Σi=1n(rX(i)-rX)*(rY(i)-rY)Σi=1n(rX(i)-rX)2Σi=1n(rY(i)-rY)2...(3)

由直接相似度计算部31计算出的相似度被保存在预测评价值计算部33的 存储区域中(S14)。当相似度已被计算出的比例为预定的阈值以下时(S15), 间接相似度计算部32对未能直接计算出的相似度中的、能够间接地求取的相 似度进行计算(S16)。如图3所示,对于项目X以及项目Z而言,由于不存在 对项目X、项目Z的双方均进行了评价的用户的评价值,因此不能直接计算相 似度。

当具有如图4中所示的项目Y这种,存在对项目X和项目Y的双方均进行 了评价的用户的评价值、且存在对项目Y和项目Z的双方均进行了评价的用户 的评价值的项目时,能够分别计算项目X与项目Y之间的相似度、以及项目Y 与项目Z之间的相似度。因此,间接相似度计算部32利用项目Y的评价值, 间接地对项目X与项目Z之间的相似度进行计算。在此,通过将项目Y的个数 并不限定为一个,而是利用多个项目Y,从而使相似度的计算精度提高。

将通过上式(3)而求得的、项目X与项目Y之间的相似度设为s(X,Y), 并将项目Y与项目Z之间的相似度设为s(Y,Z)。当存在对项目X和项目Y 的双方均进行了评价的用户的评价值、且存在对项目Y和项目Z的双方均进行 了评价的用户的评价值的项目Y的个数为N个时,间接相似度计算部32通过 下式(4)来计算项目X与项目Z的相似度s(X,Z)。

数学式4

s(X,Z)=(Σi=1N1+s(X,Yi)2*1+s(Yi,Z)2N)×2-1...(4)

当相似度已被计算出的比例超过了预定的阈值时(S15),预测评价值计算 部33根据由上述的工序S11至S16计算出的相似度与评价值,并通过现有的 协同过滤的方法来预测用户对未进行评价的项目的评价值(S17)。例如,如图 5所示,能够对未对项目Z进行评价的用户A的评价值进行预测。

如上文所述,当不存在对项目X和项目Z的双方均进行了评价的用户的评 价值时,即,有时由于项目X与项目Z之间的距离较大,因而无法直接计算出 项目X与项目Z的相似度。本实施方式中,在这种情况下,信息处理中心10a 的运算处理部30的间接相似度计算部32将使用项目Y的评价值来计算项目X 与项目Z的相似度,其中,所述项目Y为,存在对项目X和项目Y的双方均进 行了评价的用户的评价值、且存在对项目Y和项目Z的双方均进行了评价的用 户的评价值的项目。即,间接相似度计算部32使用能够分别直接计算出与项 目X和与项目Z的相似度的项目Y,来间接地对项目X与项目Z的相似度进行 计算。由此,能够计算出无法直接计算的项目X与项目Z的相似度。

此外,预测评价值计算部33使用由间接相似度计算部32计算出的项目X 与项目Z的相似度、和对项目X以及项目Z的评价值,来计算对项目X和项目 Z中的某一个项目未进行评价的用户的预测评价值。由此,能够对不能直接计 算的项目X和项目Z的预测评价值进行计算。因此,能够进一步扩大可由协同 过滤对评价值进行预测的项目的范围。进而,扩大了可推荐的项目的范围。

此外,在本实施方式中,能够根据由皮尔逊的积差相关系数来表示的、项 目X与项目Y的相似度、和项目Y与项目Z的相似度,而定量地对项目X与项 目Z的相似度进行计算。

以下,对本发明的第二实施方式进行说明。如图6所示,本实施方式中的 信息处理中心10b具备用户评价值存储装置21b。在用户评价值存储装置21b 中,除与上述第一实施方式同样地存储并管理了每个用户对项目的评价值以 外,还存储并管理了每个用户对项目的访问履历(日期和时间、位置)。与访 问履历相关的信息是从各个用户的车辆用导航装置40或者便携式终端等被发 送至信息处理中心10b的。

本实施方式中的信息处理中心10b的运算处理装置30具备未输入评价值 预测部34、相似度计算部35以及预测评价值计算部36。未输入评价值预测部 34为,实施对用户未输入评价值且存在访问履历的项目的评价值的预测的部 件。相似度计算部35为,与上述第一实施方式中的直接相似度计算部31以及 间接相似度计算部32同样地,直接或间接地求取项目之间的相似度的部件。 预测评价值计算部36为,与上述第一实施方式中的预测评价值计算部33同样 地,根据由直接相似度计算部31以及间接相似度计算部32计算出的两个项目 之间的相似度,来预测作为对象的用户对未访问过的项目会附上怎样的评价值 的部件。

以下,对本实施方式中的协同过滤系统的动作进行说明。信息处理中心10b 的用户评价值存储装置21b,以与上述第一实施方式同样的方式而收集作为对 象的用户对项目的访问履历和评价值(S21)。

当存在具有用户的访问履历、且未输入评价值的项目时(S22),运算处理 装置30的未输入评价值预测部34将参考被存储在用户评价值存储装置21b中 的信息,将包含该项目的类别的访问频度作为cat=“C”而进行计算(S23)。 例如,当设定为用户A访问过、但未输入评价值的项目为餐馆X时,则餐馆X 所属的类别中,“餐饮设施”、“游戏设施”以及“采购设施”等成为该类别。 未输入评价值预测部34例如计算用户A对“餐饮设施”等的访问频度。

此外,未输入评价值预测部34参考被存储在用户评价值存储装置21b中 的信息,将对该项目的访问频度作为rep=“R”而进行计算(S24)。例如,当 用户A访问过、但未输入评价值的项目为餐馆X时,计算出用户A对餐馆的访 问频度。

未输入评价值预测部34按照类别的访问频度而对评价值相对于项目的访 问频度的相关关系进行确定(S25)。如图8所示,当设为用户A对餐馆X所属 的类别“餐饮设施”的访问频度为每周两次时,未输入评价值预测部34对每 周利用两次“餐饮设施”的其他的用户各自对餐馆X的利用频度和评价值进行 统计。此时,未输入评价值预测部34通过对餐馆X的每个利用频度实施统计 处理,并求取评价值的中央值或平均值等,从而能够对评价值相对于项目的访 问频度的相关关系进行确定。此外,未输入评价值预测部34通过求取餐馆X 的、评价值相对于利用频度的函数的近似值,从而能够对评价值相对于项目的 访问频度的关系进行确定。

另外,虽然在本实施方式中,对确定了评价值相对于类别和项目的访问频 度的相关关系的示例进行了说明,但除此之外,通过对评价值相对于如下信息 的关系进行确定,从而也提高了评价值的预测精度,所述信息为,对类别和项 目进行了访问的季节和时间段的共性等大量的信息。例如,也可以求取评价值 相对于如下的信息的相关关系等,即,类别和项目是否加入到了用户的车辆用 导航装置40和便携式终端的书签中、以及网站上的浏览情况。

未输入评价值预测部34利用在工序S25中所确定的、评价值相对于类别 和项目的访问频度的相关关系,从而参考对类别的访问频度与对象用户相等 (cat=“C”)、且对项目的访问频度与对象用户相等(rep=“R”)的用户的 评价值(S26)。例如,对类别“餐饮设施”的访问频度与用户A同为每周两次、 对餐馆X的访问频度与用户A同为每月一次的用户的评价值为“2.5”。因此, 未输入评价值预测部34能够将用户A对餐馆X的评价值预测为2.5。另外,对 类别的访问频度与对项目的访问频度无需完全一致,只要其差异在预定的阈值 范围内即可视为相等。

未输入评价值预测部34将在S26中预测出的预测评价值代入到存储区域 中(S27)。未输入评价值预测部34根据预测评价值而实施一般的协同过滤处 理(S28)。另外,在工序S22中,当不存在具有用户的访问履历、且未输入评 价值的项目时,未输入评价值预测部34将被存储在用户评价值存储装置21b 中的评价值代入到存储区域中(S29)。

有时会存在如上文所述这种利用过餐馆X且对餐馆X未进行评价的用户A。 在本实施方式中,在这种情况下,信息处理中心10b的运算处理部30的未输 入评价值预测部34,将使用该用户A对餐馆X的利用频度、和利用过餐馆X 且对餐馆X进行了评价的其他用户对餐馆X的利用频度以及对餐馆X的评价值。 可以认为,用户各自对餐馆X的利用频度与对该餐馆X的评价值是相关的。因 此,即使不存在用户A本身的评价值,未输入评价值预测部34也能够使用用 户A对餐馆X的利用频度、和利用过餐馆X且对餐馆X进行了评价的其他用户 对餐馆X的利用频度以及评价值,而计算用户A对餐馆X的预测评价值。因此, 能够利用更少个数的用户的评价值来实施由协同过滤进行的预测。

尤其是,当对餐馆X的利用频度存在预定的阈值以内的差异时,能够推断 为评价值也近似。因此,未输入评价值预测部34通过使用用户A对餐馆X的 利用频度、和对餐馆X的利用频度与用户A对餐馆X的利用频度之间存在预定 的阈值以内的差异的、其他用户对餐馆X的利用频度以及对餐馆X的评价值, 来计算用户A对餐馆X的预测评价值,从而能够高精度地对预测评价值进行计 算。

当餐馆X所属的类别“餐饮设施”内的非特定多数的项目的利用频度存在 预定的阈值以内的差异时,能够推断为对餐馆X的评价值也近似。因此,未输 入评价值预测部34通过使用用户A对餐馆X的利用频度、和对餐馆X所属的 类别“餐饮设施”内的非特定多数的项目的利用频度与用户A对非特定多数的 项目的利用频度之间存在预定的阈值以内的差异的、其他用户对餐馆X的利用 频度以及对餐馆X的评价值,来计算用户A对餐馆X的预测评价值,从而能够 进一步高精度地对预测评价值进行计算。

可以推断为,多个其他用户各自对餐馆X的利用频度中的每一个利用频度 的、对餐馆X的评价值的中央值或平均值,高精度地表示了利用频度与评价值 的相关关系。因此,未输入评价值预测部34通过使用用户A对餐馆X的利用 频度,和多个其他用户各自对餐馆X的利用频度中的每一个利用频度的、对餐 馆X的评价值的中央值以及平均值中的某一个值,来计算用户A对餐馆X的预 测评价值,从而能够进一步高精度地对预测评价值进行计算。

此外,可以推断为,根据利用过餐馆X且对餐馆X进行了评价的其他用户 对餐馆X的利用频度、以及对餐馆X的评价值而导出的、对餐馆X的评价值相 对于餐馆X的利用频度的函数,高精度地表示了利用频度与评价值的相关关系。 而且,即使得到的利用频度与评价值是离散的值,也能够通过该函数来进行插 值。因此,未输入评价值预测部34通过根据利用过餐馆X且对餐馆X进行了 评价的其他用户对餐馆X的利用频度、以及对餐馆X的评价值,来导出对餐馆 X的评价值相对于餐馆X的利用频度的函数,并使用用户A对特定项目的利用 频度和函数,来计算用户A对餐馆X的预测评价值,从而能够进一步高精度地 对预测评价值进行计算。此外,即使其他用户的利用频度与用户A的利用频度 是离散的值,也能够通过函数的插值来计算预测评价值。

以上,虽然对本发明的实施方式进行了说明,但是本发明并不限定于上述 实施方式,而可以进行各种改变。例如,在上述实施方式中,主要对项目为与 位置相关的店铺和设施等、且通过车辆用导航装置40而对搭乘在车辆上的用 户进行推荐的方式进行了说明。但是,对其他难以获得评价值的项目的评价值 进行预测的方式也包含在本发明的范围内,且发挥该效果。

产业上的可利用性

本发明能够提供可进一步扩大能够通过协同过滤而对评价值进行预测的 项目的范围的协同过滤系统以及协同过滤方法。此外,本发明能够提供可根据 更少个数的用户的评价值来实施通过协同过滤而进行的预测的协同过滤系统 以及协同过滤方法。

符号说明

10a、10b信息处理中心

21a、21b用户评价值存储装置

22位置信息数据库

30运算处理装置

31直接相似度计算部

32间接相似度计算部

33预测评价值计算部

34未输入评价值预测部

35相似度计算部

36预测评价值计算部

40车辆用导航装置

50互联网

51食客检索网站

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号