首页> 中国专利> 一种基于学习生成网络相似度的网络学习群组划分方法

一种基于学习生成网络相似度的网络学习群组划分方法

摘要

本发明公开了一种基于学习生成网络相似度的网络学习群组划分方法,包括以下步骤:1)建立用户知识点关联网络,再计算用户学习序列中第i+1个知识点与前i个知识点的时序相关度;2)构建用户学习生成网络;3)获取学习生成网络

著录项

  • 公开/公告号CN108628967A

    专利类型发明专利

  • 公开/公告日2018-10-09

    原文格式PDF

  • 申请/专利权人 西安交通大学;

    申请/专利号CN201810369026.1

  • 申请日2018-04-23

  • 分类号

  • 代理机构西安通大专利代理有限责任公司;

  • 代理人徐文权

  • 地址 710049 陕西省西安市碑林区咸宁西路28号

  • 入库时间 2023-06-19 06:43:16

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-07-28

    授权

    授权

  • 2018-11-02

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20180423

    实质审查的生效

  • 2018-10-09

    公开

    公开

说明书

技术领域

本发明涉及一种网络学习用户的群组划分方法,具体涉及一种基于学习生成网络相似度的网络学习群组划分方法。

背景技术

大部分推荐系统主要关注单个用户的推荐,然而在许多日常活动中需要为多个用户形成的群组进行推荐。近年来,组推荐系统(Group recommendation system)逐渐成为推荐系统领域的研究热点之一,如何融合群组成员偏好以满足成员的偏好需求进行群组划分是组推荐的主要任务。

具体而言,群组划分是指将用户分配至不同的组合,使得每个组合内的用户在某些方面有着相同的特征。王中卿提出一种隐含因子图模型,利用各种隐含与显式的社交与文本信息对用户的群组进行识别,并对用户群组识别模型进行学习与预测;Chen L采用学习者的选课信息、学习兴趣、知识水平,量化用户特征,使用遗传算法划分群组;张晖基于用户基本信息、业务兴趣相似度、业务顺序相似度,构建基于用户综合相似度的模糊聚类模型,从而进行用户分群;Boratto L浏尝试多种特征,构建多种群组模型,进而找出最佳建模策略;金涛提出使用局部敏感哈希技术(Locality Sensitive Hash,即LSH)以达到群组快速生成的目的;谭昶提出典型用户群组(Typical User Group,TUG)的概念,通过比较候选新增典型用户对典型用户群组的贡献度,逐一扩大典型用户群组规模,最终达到较高的推荐项目覆盖率和评分准确度;Zhang C提出了一种群体推荐的用户聚类算法,采用奇异值分解算法提取了主要用户特征,通过减少用户特征向量的维数简化了计算;Young-Duk Seo提出了一种向上均衡聚合方法(upward leveling aggregation method)用于解决群组推荐中的成员偏好差异。

由上述文献可看出,在群组划分时用户特征选择是一个重要的方面,往往需要结合用户的静态和动态特征以建立最佳的群组模型。尤其随着时间的推移,用户的兴趣偏好会发生变化,群组也随之动态变化。在学习领域,学习群组通常是指具有相类似学习兴趣的用户,比如,访问了相同学习资源的用户,因此用户对学习资源的显示评分及对资源访问的隐式属性(学习时长、学习频次)等特征常被用于计算用户的相似度。然后,已有特征往往缺乏用户认知的考虑,无法完整刻画用户整个学习过程,这从一定程度上影响了群组划分的准确性。比如,学习了两个相同知识点或者访问了相同学习资源的用户,如果各自学习时间间隔相差非常远,根据艾宾浩斯提出的遗忘曲线,则基本上可以忽略其相似性。因此,如何体现用户的学习过程及认知特征是群组划分时应该解决的一个重要问题。

发明内容

本发明的目的在于克服上述现有技术的缺点,提供了一种基于学习生成网络相似度的网络学习群组划分方法,该划分方法考虑用户学习过程及认知特征实现网络学习群组划分。

为达到上述目的,本发明所述的基于学习生成网络相似度的网络学习群组划分方法包括以下步骤:

1)根据用户信息、知识点信息及用户的网络学习日志构建用户知识点关联网络,再利用随机游走的方法计算用户知识点关联网络中各节点之间的相似度;同时,获取用户学习知识点之间的学习顺序相关性及学习时间相关性,再根据用户学习知识点之间的学习顺序相关性及学习时间相关性依次计算用户学习序列中第i+1个知识点与前i个知识点的时序相关度,其中,1≤i≤n,n为用户学习知识点的序列长度;

2)根据用户知识点关联网络中各节点之间的相似度及用户学习序列中第i+1个知识点和前i个知识点的时序相关度构建用户学习生成网络;

3)获取用户学习生成网络中任一两节点之间的路径,将两个用户ux、uy学习生成网络中任意两个知识点之间相同路径占总路径的比例作为学习生成网络在这两知识点之间的相似度,然后统计学习生成网络在所有知识点对之间的相似度并求均值,然后将求均值的结果作为学习生成网络之间的内容相似度

4)计算各用户学习生成网络的节点数、边数、节点平均度、节点平均强度、网络中环的数量及网络中环的平均大小,并从节点数、边数、节点平均度、节点平均强度、网络中环的数量及网络中环平均大小的角度出发计算用户学习生成网络之间的结构相似度

5)使用内容相似度与结构相似度加权求均值的结果作为用户学习生成网络的总体相似性,再将用户学习生成网络的总体相似性采用基于相似度的CURE层次聚类算法对用户学习生成网络进行聚类,实现基于学习生成网络相似度的网络学习群组划分。

步骤1)中构建用户知识点关联网络的具体操作为:利用用户信息、知识点信息以及用户的网络学习日志获取用户-用户之间的关系、知识点-知识点之间的关系及用户-知识点之间的关系,再根据用户-用户之间的关系、知识点-知识点之间的关系及用户-知识点之间的关系计算用户-用户、知识点-知识点及用户-知识点之间的边权重,然后根据用户-用户、知识点-知识点及用户-知识点之间的边权重构建用户知识点关联网络。

步骤2)的具体操作为:根据用户知识点关联网络中各节点之间的相似度及用户学习序列中第i+1个知识点和前i个知识点的时序相关度依次计算用户学习序列中第i+1个知识点和前i个知识点的匹配度,根据计算得到的匹配度构建用户学习生成网络。

构建用户-用户之间的关系,计算用户-用户之间的边权重的具体操作为:用户-用户之间的关系Eu由两个用户ux、uy之间属性的相似性来度量,其中,两个用户ux、uy之间属性包括入学时间、学历级用户专业,设用户-用户之间的边权重为由用户属性的相似性与用户属性的权重imp(k)计算得到,即

其中,表示用户ux、uy之间入学时间的相似度,表示用户ux、uy之间学历的相似度,表示用户ux、uy之间专业的相似度,Δbatch表示用户ux、uy之间入学的学期差别。

构建知识点-知识点之间的关系,计算知识点-知识点之间的边权重的具体过程为:

知识点-知识点之间的关系Es为知识点si与sj之间属性的关系,其中,知识点si与sj之间的属性包括知识点si与sj之间的章节关系、知识点si与sj之间学习的先后序关系,设知识点si与sj之间的边权重为其中,

其中,表示知识点si与sj是否处于同一章节,表示知识点si与sj是否有学习先后序关系,为1或者0。

构建用户-知识点之间的关系,计算用户-知识点之间的边权重的具体操作为:

用户学习-知识点之间关系从用户的网络学习日志中获取,当用户学习过该知识点,则生成一条连接用户与该知识点的边,则用户-知识点之间的边权重为:

其中,为用户ux第m次学习知识点si的时长,为知识点si的固有时长。

步骤1)中利用随机游走的方法计算用户知识点关联网络中各节点之间的相似度的具体操作为:

设权重矩阵A:

其中,wij表示节点与节点之间的权重边,cij表示节点i与节点j之间是否连接,其中,1表示连接,0表示不连接;

设用户知识点关联网络的对角矩阵D:

设用户知识点关联网络对称拉普拉斯矩阵L=D-A及广义逆矩阵L+,其中,

L+=(L-eeT/n)-1+eeT/n(6)

其中,e为单位矩阵,e=[1]n×1

则节点i与节点j之间的相似距离disij为:

其中,为L+中第i行第j列的元素;

当disij值越大,则表示节点i与节点j之间的相似性越小,将disij作为节点i与节点j之间的相似度。

步骤1)中,知识点之间的时序相关性表示知识点之间的学习顺序相关性及学习时间相关性,当用户学习生成网络中已有i个节点,当新增第i+1个节点时,则有

其中,γ和δ为归一化系数,第i+1个节点与第k个节点的时序相关性seci+1,k由学习顺序相关性和学习时间相关性取调和平均数得到,Ti+i-Tk表示用户学习知识点i+1与知识点k的时间差,γ的取值与和当前节点构成依赖关系的前序节点个数有关,设定γ=4,δ=7*24h。

第i+1个知识点与第k个知识点的匹配度为:

其中,a及β为权重系数。

步骤3)中学习生成网络之间的内容相似度为:

其中,N为PLGN所属课程的总知识点数,在知识点i与知识点j上的相似度,表示上知识点i与知识点j之间的路径数量,表示在知识点i与知识点j之间相同路径的数量,zeroScore表示当两个PLGN在知识点i与知识点j之间不存在路径时的得分。

本发明具有以下有益效果:

本发明所述的基于学习生成网络相似度的网络学习群组划分方法在具体操作时,通过用户信息、知识点信息及用户的网络学习日志构建用户的知识点关联网络,以考虑用户学习过程及认知特征,再利用用户知识点关联网络中各节点之间的相似度及用户学习序列中第i+1个知识点和前i个知识点的时序相关度构建用户学习生成网络,进而从内容相似度及结构相似度两个方面进行学习生成网络的相似度度量,并以此实现网络学习群组划分,为进行更加符合组用户偏好的学习资源推荐提供基础。

附图说明

图1为本发明的流程图;

图2a为学习知识点较多、发散地、跳跃地学习知识点的学习群组示意图;

图2b为学习知识点较少、按顺序学习知识点的学习群组示意图。

具体实施方式

下面结合附图对本发明做进一步详细描述:

参考图1,本发明所述的基于学习生成网络相似度的网络学习群组划分方法包括以下步骤:

1)根据用户信息、知识点信息及用户的网络学习日志构建用户知识点关联网络,再利用随机游走的方法计算用户知识点关联网络中各节点之间的相似度;同时,获取用户学习知识点之间的学习顺序相关性及学习时间相关性,再根据用户学习知识点之间的学习顺序相关性及学习时间相关性依次计算用户学习序列中第i+1个知识点与前i个知识点的时序相关度,其中,1≤i≤n,n为用户学习知识点的序列长度;

2)根据用户知识点关联网络中各节点之间的相似度及用户学习序列中第i+1个知识点和前i个知识点的时序相关度构建用户学习生成网络;

3)获取用户学习生成网络中任一两节点之间的路径,将两个用户ux、uy学习生成网络中任意两个知识点之间相同路径占总路径的比例作为学习生成网络在这两知识点之间的相似度,然后统计学习生成网络在所有知识点对之间的相似度并求均值,然后将求均值的结果作为学习生成网络之间的内容相似度

4)计算各用户学习生成网络的节点数、边数、节点平均度、节点平均强度、网络中环的数量及网络中环的平均大小,并从节点数、边数、节点平均度、节点平均强度、网络中环的数量及网络中环平均大小的角度出发计算用户学习生成网络之间的结构相似度

5)使用内容相似度与结构相似度加权求和的结果作为用户学习生成网络的总体相似性,再将用户学习生成网络的总体相似性采用基于相似度的CURE层次聚类算法对用户学习生成网络进行聚类,实现基于学习生成网络相似度的网络学习群组划分。

步骤1)中构建用户知识点关联网络的具体操作为:利用用户信息、知识点信息以及用户的网络学习日志获取用户-用户之间的关系、知识点-知识点之间的关系及用户-知识点之间的关系,再根据用户-用户之间的关系、知识点-知识点之间的关系及用户-知识点之间的关系计算用户-用户、知识点-知识点及用户-知识点之间的边权重,然后根据用户-用户、知识点-知识点及用户-知识点之间的边权重构建用户知识点关联网络。

步骤1)中构建用户-用户之间的关系,计算用户-用户之间的边权重的具体操作为:用户-用户之间的关系Eu由两个用户ux、uy之间属性的相似性来度量,其中,两个用户ux、uy之间属性包括入学时间、学历级用户专业,设用户-用户之间的边权重为由用户属性的相似性与用户属性的权重imp(k)计算得到,即

其中,表示用户ux、uy之间入学时间的相似度,表示用户ux、uy之间学历的相似度,表示用户ux、uy之间专业的相似度,Δbatch表示用户ux、uy之间入学的学期差别,本发明中imp(1)=0.25,imp(2)=0.25,imp(3)=0.5。

步骤1)中构建知识点-知识点之间的关系,计算知识点-知识点之间的边权重的具体过程为:

知识点-知识点之间的关系Es为知识点si与sj之间属性的关系,其中,知识点si与sj之间的属性包括知识点si与sj之间的章节关系、知识点si与sj之间学习的先后序关系,设知识点si与sj之间的边权重为其中,

其中,表示知识点si与sj是否处于同一章节,表示知识点si与sj是否有学习先后序关系,为1或者0。

步骤1)中构建用户-知识点之间的关系,计算用户-知识点之间的边权重的具体操作为:

用户学习-知识点之间关系从用户的网络学习日志中获取,当用户学习过该知识点,则生成一条连接用户与该知识点的边,则用户-知识点之间的边权重为:

其中,为用户ux第m次学习知识点si的时长,为知识点si的固有时长。

步骤1)中利用随机游走的方法计算用户知识点关联网络中各节点之间的相似度的具体操作为:

设权重矩阵A:

其中,wij表示节点与节点之间的权重边,cij表示节点i与节点j之间是否连接,其中,1表示连接,0表示不连接;

设用户知识点关联网络的对角矩阵D:

设用户知识点关联网络对称拉普拉斯矩阵L=D-A及广义逆矩阵L+,其中,

L+=(L-eeT/n)-1+eeT/n(6)

其中,e为单位矩阵,e=[1]n×1

则节点i与节点j之间的相似距离disij为:

其中,为L+中第i行第j列的元素;

当disij值越大,则表示节点i与节点j之间的相似性越小,将disij作为节点i与节点j之间的相似度。

步骤1)中,知识点学习顺序相关性取决于用户学习知识点的先后序差异。例如,用户的学习序列为“s3-s2-s4-s1-s5”,那么用户学习知识点s1、s3的顺序差为3,学习s1、s5的顺序差为1。从用户学习顺序的角度考虑,知识点s1与知识点s3的相关性较小,而与知识点s5的相关性较大。

知识点学习时间相关性取决于指用户学习知识点的时间上差异。例如,用户在10h前学了知识点s3,在8h前学了知识点s2,在2h前学了知识点s4,那么知识点s3、s2之间的学习时间差为2h,知识点s2、s4之间的学习时间差为6h。从用户学习时间的角度考虑,知识点s2与知识点s3的相关性较大,而与知识点s4的相关性较小。

当用户学习生成网络中已有i个节点,当新增第i+1个节点时,则有

其中,γ和δ为归一化系数,第i+1个节点与第k个节点的时序相关性seci+1,k由学习顺序相关性和学习时间相关性取调和平均数得到,Ti+i-Tk表示用户学习知识点i+1与知识点k的时间差,γ的取值与和当前节点构成依赖关系的前序节点个数有关,设定γ=4,δ=7*24h。

步骤2)的具体操作为:根据用户知识点关联网络中各节点之间的相似度及用户学习序列中第i+1个知识点和前i个知识点的时序相关度依次计算用户学习序列中第i+1个知识点和前i个知识点的匹配度,根据计算得到的匹配度构建用户学习生成网络。

其中,第i+1个知识点与第k个知识点的匹配度为:

其中,α及β为权重系数,本发明中α及β均为0.5。

使用匹配度可以综合考虑知识点之间的相似性和用户学习时序上的相似性,值越小,说明添加边(k,i+1)越合理,因此可以求出所有的值并排序,从而确定当加入第i+1个节点时,应在用户学习生成网络中添加哪一条或哪几条边。

k的选取需要考虑到知识点学习的依赖关系的时效性,当用户学习两个知识点的时间距离大于一定的阈值后,则可以认为用户学习后一个知识点不存在对前一个知识点的学习依赖,表1为用户学习生成网络的构建算法。

表1

步骤3)中,图2a和图2b表示两类不同的群组,图2a代表学习知识点较多、发散地、跳跃地学习知识点,图2b表示学习知识点较少、按顺序学习知识点。可以看出,从图的结构和学习的内容上都有所差异,因此本发明提出同时考虑PLGN结构的相似度和内容的相似度来进行学习群组的划分。

本发明采用的相似性指标的具体组成为:

本发明统计用户学习生成网络图中任何两点之间的路径,将两张用户学习生成网络中任意两个知识点相同路径的数量和比例作为这两个用户学习生成网络在这两点之间的相似度,统计用户学习生成网络在所有知识点对之间的相似度,并求均值作为之间的内容相似性

在任意知识点对i、j之间的相似性存在三种情况:

a)若在知识点对i、j之间均存在路径,则可根据图核理论计算其相似度;

b)若在知识点对i、j之间存在路径,而在知识点对i、j之间不存在路径,则说明在知识点对i、j之间完全不相似,其相似性值为0;

c)若在知识点对i、j之间均不存在路径,则给定一个不超过1的值,作为在知识点对i、j之间的相似性。

则学习生成网络之间的内容相似度为:

其中,N为PLGN所属课程的总知识点数,在知识点i与知识点j上的相似度,表示上知识点i与知识点j之间的路径数量,表示在知识点i与知识点j之间相同路径的数量,zeroScore表示当两个PLGN在知识点i与知识点j之间不存在路径时的得分,zeroScore等于0.001。

用户学习生成网络的结构相似性体现在节点数、边数、平均出入度、最大出度、最大入度、平均节点强度-权重和、最大节点强度及子图数目等方面,对于按顺序学习知识点的用户来说,其学习网络往往呈现为平稳的链式结构;对于学习无规律、跳跃性较大的用户来说,其学习网络中会出现较多的树状和网状结构。

本发明计算用户学习生成网络的节点数、边数、节点平均度、节点平均强度、网络中环的数量和网络中环的平均大小,并从这6个角度出发计算用户学习生成网络之间的结构相似度。

用户学习生成网络的结构相似性为:

其中,表示在属性ki上相似性的值,表示属性ki的权重,ki表示衡量相似性的6个角度;为的节点数量差异,由的节点数量差进行归一化后得出;为边数量差异;为节点平均度差异;为节点平均强度差异;为环的数量差异;为环的平均大小差异;norm(value)为归一化函数;本发明中impver=impedg=0.1,impdeg=impstr=imprnd=imprSize=0.2。

另外,用户学习生成网络的总体相似性可以从用户学习生成网络的内容相似性和结构相似性的角度来衡量,用户学习生成网络的总体相似性为:

其中,α和β为权值,本发明中a=0.7,β=0.3。

步骤5)中,采用基于相似度的CURE层次聚类算法对用户学习生成网络进行聚类,根据聚类结果得到网络学习用户的群组划分,其中,聚类原理为:将每个用户学习生成网络各作为一簇,每次合并距离最近的两簇,直至剩余簇的数量满足聚类目标,最终得到的簇集合{Clusteri}即为聚类结果,其中,表2为用户学习生成网络的聚类算法。

表2

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号