首页> 中国专利> 基于工作会话单元的推荐方法、系统、计算机和存储介质

基于工作会话单元的推荐方法、系统、计算机和存储介质

摘要

本申请涉及基于工作会话单元的推荐方法,其中,该基于工作会话单元的推荐方法包括:工作会话分组步骤,将待处理的工作会话分组为多个连续的工作会话单元;会话概要获取步骤,获取所述工作会话单元中的会话词语并计算每一会话词语的特征值,根据所述每一会话词语的特征值获取所述工作会话单元的概要信息;工作会话单元推荐步骤,根据所述概要信息计算工作会话单元与用户的匹配得分,以根据所述匹配得分推荐至工作会话单元用户。通过本申请,减小企业通讯客户端用户处理工作会话的时间成本,提高工作效率。

著录项

  • 公开/公告号CN113204638A

    专利类型发明专利

  • 公开/公告日2021-08-03

    原文格式PDF

  • 申请/专利权人 上海明略人工智能(集团)有限公司;

    申请/专利号CN202110443464.X

  • 发明设计人 王毅君;徐凯波;

    申请日2021-04-23

  • 分类号G06F16/34(20190101);G06F40/35(20200101);

  • 代理机构37256 青岛清泰联信知识产权代理有限公司;

  • 代理人赵燕

  • 地址 200030 上海市徐汇区云锦路701号29、30、31、32层

  • 入库时间 2023-06-19 12:05:39

说明书

技术领域

本申请涉及计算机技术领域,特别是涉及基于工作会话单元的推荐方法、系统、计算机设备和计算机可读存储介质。

背景技术

团队领导(team leader)为每一个团队成员指引方向、下达任务、提供指导,以实现设定的目标。在日常工作场景中,企业的团队领导与团队成员之间会通过企业通讯客户端产生大量工作会话。这样的工作会话基本特点在于会话数量繁多且上下文片段分散。基于此,企业通讯客户端的用户,无论是团队领导还是团队成员,在处理上述大量工作会话时,都会耗费大量的时间精力。

推荐系统是利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程。个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。现有的推荐系统常常应用于新闻推荐、商品推荐等。

目前,应用于企业通讯客户端,针对上述工作会话信息过载的问题,尚未提出有效的解决方案。

发明内容

本申请实施例提供了一种基于工作会话单元的推荐方法、系统、计算机设备和计算机可读存储介质,通过基于工作会话单元的推荐方式,减小企业通讯客户端用户处理工作会话的时间成本,提高工作效率。

第一方面,本申请实施例提供了一种基于工作会话单元的推荐方法,包括:

工作会话分组步骤,将待处理的工作会话分组为多个连续的工作会话单元,每一所述工作会话单元包括一组工作会话;

会话概要获取步骤,获取所述工作会话单元中的会话词语并计算每一会话词语的特征值,根据所述每一会话词语的特征值获取所述工作会话单元的概要信息;

工作会话单元推荐步骤,根据所述概要信息计算工作会话单元与用户的匹配得分,以根据所述匹配得分推荐至工作会话单元用户。

在其中一些实施例中,所述会话概要获取步骤进一步包括:

会话预处理步骤,对每一工作会话单元的文本内容进行分词处理,并过滤辅助词及敏感词,得到每一工作会话单元中的多个会话词语;具体的,所述辅助词包括“啊”、“的”、“什么”等无意义的词语;敏感词包括但不限于禁止词、侵权词、不雅词、政治性、煽动性的词语等。

会话特征获取步骤,计算每一所述会话词语的特征值,根据所述特征值的数值大小提取每一工作会话单元中一第一预设数量的会话词语及其特征值作为工作会话单元的概要信息,具体的,所述概要信息表示为key-value特征,其中,key用于表示关键词为会话词语、value用于表示关键词的特征值;可选的,所述特征值基于TF-IDF计算,相应的,得到的特征值可表示为tfidf值。

在其中一些实施例中,所述工作会话单元推荐步骤进一步包括:

用户特征获取步骤,根据所述概要信息中特征值的数值大小提取所述用户参与的一第二预设数量的工作会话中一第三预设数量的会话词语作为所述用户的标签特征;

会话匹配得分获取步骤,计算所述标签特征中每一会话词语在每一所述工作会话单元中的特征值的和,作为所述用户与所述工作会话单元的匹配得分;

用户会话推荐步骤,根据所述匹配得分获取至少一工作会话单元推荐至用户。

在其中一些实施例中,所述工作会话单元以卡片的形式显示。

第二方面,本申请实施例提供了一种基于工作会话单元的推荐系统,包括:

工作会话分组模块,将待处理的工作会话分组为多个连续的工作会话单元,每一所述工作会话单元包括一组工作会话;

会话概要获取模块,获取所述工作会话单元中的会话词语并计算每一会话词语的特征值,根据所述每一会话词语的特征值获取所述工作会话单元的概要信息;

工作会话单元推荐模块,根据所述概要信息计算工作会话单元与用户的匹配得分,以根据所述匹配得分推荐至工作会话单元用户。

在其中一些实施例中,所述会话概要获取模块进一步包括:

会话预处理模块,对每一工作会话单元的文本内容进行分词处理,并过滤辅助词及敏感词,得到每一工作会话单元中的多个会话词语;具体的,所述辅助词包括“啊”、“的”、“什么”等无意义的词语;敏感词包括但不限于禁止词、侵权词、不雅词、政治性、煽动性的词语等。

会话特征获取模块,计算每一所述会话词语的特征值,根据所述特征值的数值大小提取每一工作会话单元中一第一预设数量的会话词语及其特征值作为工作会话单元的概要信息,具体的,所述概要信息表示为key-value特征,其中,key用于表示关键词为会话词语、value用于表示关键词的特征值;可选的,所述特征值基于TF-IDF计算,TF-IDF(termfrequency–inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术。相应的,得到的特征值可表示为tfidf值。

在其中一些实施例中,所述工作会话单元推荐模块进一步包括:

用户特征获取模块,根据所述概要信息中特征值的数值大小提取所述用户参与的一第二预设数量的工作会话中一第三预设数量的会话词语作为所述用户的标签特征;

会话匹配得分获取模块,计算所述标签特征中每一会话词语在每一所述工作会话单元中的特征值的和,作为所述用户与所述工作会话单元的匹配得分;

用户会话推荐模块,根据所述匹配得分获取至少一工作会话单元推荐至用户。

在其中一些实施例中,所述工作会话单元以卡片的形式显示。

第三方面,本申请实施例提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述的基于工作会话单元的推荐方法。

第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述第一方面所述的基于工作会话单元的推荐方法。

相比于相关技术,本申请实施例提供的基于工作会话单元的推荐方法、系统、计算机设备和计算机可读存储介质,涉及一种推荐算法,具体的,本申请通过基于工作会话单元的推荐实现企业通讯客户端的冷启动,减小企业通讯客户端用户处理工作会话的时间成本,提高工作效率;无需用户与工作会话单元的交互数据即可实现推荐,适用范围广。

本申请的一个或多个实施例的细节在以下附图和描述中提出,以使本申请的其他特征、目的和优点更加简明易懂。

附图说明

此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:

图1是根据本申请实施例的基于工作会话单元的推荐方法的流程图;

图2是根据本申请实施例的基于工作会话单元的推荐方法的结构框图;

图3是根据本申请优选实施例的基于工作会话单元的推荐方法的流程图。

附图说明:

1、工作会话分组模块;2、会话概要获取模块;3、工作会话单元推荐模块;

201、会话预处理模块;202、会话特征获取模块;

301、用户特征获取模块;302、会话匹配得分获取模块;

303、用户会话推荐模块。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行描述和说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本申请提供的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。

显而易见地,下面描述中的附图仅仅是本申请的一些示例或实施例,对于本领域的普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图将本申请应用于其他类似情景。此外,还可以理解的是,虽然这种开发过程中所作出的努力可能是复杂并且冗长的,然而对于与本申请公开的内容相关的本领域的普通技术人员而言,在本申请揭露的技术内容的基础上进行的一些设计,制造或者生产等变更只是常规的技术手段,不应当理解为本申请公开的内容不充分。

在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是,本申请所描述的实施例在不冲突的情况下,可以与其它实施例相结合。

除非另作定义,本申请所涉及的技术术语或者科学术语应当为本申请所属技术领域内具有一般技能的人士所理解的通常意义。本申请所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制,可表示单数或复数。本申请所涉及的术语“包括”、“包含”、“具有”以及它们任何变形,意图在于覆盖不排他的包含;例如包含了一系列步骤或模块(单元)的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可以还包括没有列出的步骤或单元,或可以还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。本申请所涉及的“连接”、“相连”、“耦接”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电气的连接,不管是直接的还是间接的。本申请所涉及的“多个”是指两个或两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。本申请所涉及的术语“第一”、“第二”、“第三”等仅仅是区别类似的对象,不代表针对对象的特定排序。

工作会话单元的推荐目标人群为企业通讯客户端的群聊中的参与成员,通常一个群聊中的成员并不多,因此很难收集到足够的员工与工作会话单元的互动数据(例如点击、点赞、留言等行为),也就是说每一次推荐都面临冷启动问题。基于此,本申请实施例的主要目的在于,如何利用用户信息以及工作会话单元的标签特征进行匹配得分计算,按照匹配得分从高到低为员工推荐其关注的工作会话单元,解决工作会话单元的冷启动问题。

首先,本实施例提供了一种基于工作会话单元的推荐方法。图1是根据本申请实施例的基于工作会话单元的推荐方法的流程图,如图1所示,该流程包括如下步骤:

工作会话分组步骤S1,将待处理的工作会话分组为多个连续的工作会话单元,每一工作会话单元包括一组工作会话;可选的,分组可以根据工作会话产生的时间或会话的主题进行。

会话概要获取步骤S2,获取工作会话单元中的会话词语并计算每一会话词语的特征值,根据每一会话词语的特征值获取工作会话单元的概要信息;

工作会话单元推荐步骤S3,根据概要信息计算工作会话单元与用户的匹配得分,以根据匹配得分推荐至工作会话单元用户,具体的,工作会话单元以卡片的形式显示。

基于上述步骤,本申请实施例将工作会话划分为若干连续的单元,每一个单元包含一组工作会话,而后将工作会话单元进行摘要概括推荐给用户。采用本实施例的技术方案,在实际工作中,对于团队员工,能够帮助一线员工节省大量用于处理工作会话的时间;对于团队领导,能帮助其快速查看下属员工参与项目的最新进展,查看外部客户是否有在会话中有投诉情况等等。基于此,本实施例有效减小企业通讯客户端用户处理工作会话的时间成本,提高工作效率。

在其中一些实施例中,会话概要获取步骤S2进一步包括:

会话预处理步骤S201,对每一工作会话单元的文本内容进行分词处理,并过滤辅助词及敏感词,得到每一工作会话单元中的多个会话词语;具体的,辅助词包括“啊”、“的”、“什么”等无意义的词语;敏感词包括但不限于禁止词、侵权词、不雅词、政治性、煽动性的词语等。

会话特征获取步骤S202,计算每一会话词语的特征值,根据特征值的数值大小提取每一工作会话单元中一第一预设数量的会话词语及其特征值作为工作会话单元的概要信息,具体的,概要信息表示为key-value特征,其中,key用于表示关键词为会话词语、value用于表示关键词的特征值;可选的,特征值基于TF-IDF计算,相应的,得到的特征值可表示为tfidf值,该特征值不限于利用TF-IDF计算,也可以基于其他加权计算法获得。

基于上述步骤,本实施例提取工作会话单元的概要信息作为工作会话单元的标签特征,以便于匹配工作会话单元与用户。

在其中一些实施例中,工作会话单元推荐步骤S3进一步包括:

用户特征获取步骤S301,根据概要信息中特征值的数值大小提取用户参与的一第二预设数量的工作会话中一第三预设数量的会话词语作为用户的标签特征;

会话匹配得分获取步骤S302,计算标签特征中每一会话词语在每一工作会话单元中的特征值的和,作为用户与工作会话单元的匹配得分;

用户会话推荐步骤S303,根据匹配得分获取至少一工作会话单元推荐至用户。可选的,可根据匹配得分降序将多个工作会话单元推荐给用户,亦可将匹配得分最高的工作会话单元推荐给用户,进一步的,亦可通过设置一匹配得分阈值,基于该匹配得分阈值将高于该匹配得分阈值的多个工作会话单元推荐给用户。

基于上述步骤,本实施例无需收集用户(团队领导、团队成员)与工作会话单元的互动数据(例如点击、点赞、留言等行为),即可实现用户与工作会话单元之间的匹配,从而推荐其相关的工作会话单元,有效解决了推荐的冷启动问题。

下面通过优选实施例对本申请实施例进行描述和说明。

图3是根据本申请优选实施例的基于工作会话单元的推荐方法的流程图,如图3所示,该基于工作会话单元的推荐方法包括如下步骤:

步骤S401,将工作会话划分为若干连续的工作会话单元,每一个工作会话单元包含一组工作会话;

步骤S402,对每一个的工作会话单元unit的内容进行分词,并去除“啊”、“的”、“什么”等等没有实际意义的辅助性词语。

步骤S403,计算工作会话单元unit中每一个会话词语的tfidf值,该tfidf值表示为tfidf(词语),提取tfidf值最大的若干个词语(例如10个)及其tfidf值作为该工作会话单元的key-value特征,具体表达式如下所示。

feature(unit)={"词语

步骤S404,对于待推荐的员工user,得到该员工user最近参与的若干个(例如10个)工作会话中tfidf值最大的10个词语作为该员工的标签特征,具体表达式如下所示。

feature(user)={词语

步骤S405,对于每一个工作会话单元unit,计算员工特征中的每一个词语在该工作会话单元unit中的tfidf值之和,作为该员工与工作会话单元的匹配得分,具体表达式如下所示:

步骤S406,取匹配得分最高的若干个工作会话单元unit推荐给员工。

基于上述步骤,本实施例通过tfidf值为员工和工作会话单元自动打标签,根据标签进行相似度匹配,按照相似性从高到低为员工推荐其关注的工作会话单元,不需要员工与工作会话单元的交互数据,能够有效解决推荐的冷启动问题;基于推荐的工作会话单元unit处理工作会话,有效降低员工的时间成本,提高员工处理工作会话的效率。

需要说明的是,在上述流程中或者附图的流程图中示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。

本实施例还提供了一种基于工作会话单元的推荐系统,该系统用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”、“单元”、“子单元”等可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的系统较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。

图2是根据本申请实施例的基于工作会话单元的推荐系统的结构框图,如图2所示,该系统包括:

工作会话分组模块1,将待处理的工作会话分组为多个连续的工作会话单元,每一工作会话单元包括一组工作会话;可选的,分组可以根据工作会话产生的时间或会话的主题进行。

会话概要获取模块2,获取工作会话单元中的会话词语并计算每一会话词语的特征值,根据每一会话词语的特征值获取工作会话单元的概要信息;其中,会话概要获取模块2进一步包括:会话预处理模块201,对每一工作会话单元的文本内容进行分词处理,并过滤辅助词及敏感词,得到每一工作会话单元中的多个会话词语;具体的,辅助词包括“啊”、“的”、“什么”等无意义的词语;敏感词包括但不限于禁止词、侵权词、不雅词、政治性、煽动性的词语等。会话特征获取模块202,计算每一会话词语的特征值,根据特征值的数值大小提取每一工作会话单元中一第一预设数量的会话词语及其特征值作为工作会话单元的概要信息,具体的,概要信息表示为key-value特征,其中,key用于表示关键词为会话词语、value用于表示关键词的特征值;可选的,特征值基于TF-IDF计算,相应的,得到的特征值可表示为tfidf值,该特征值不限于利用TF-IDF计算,也可以基于其他加权计算法获得。基于上述模块,本实施例提取工作会话单元的概要信息作为工作会话单元的标签特征,以便于匹配工作会话单元与用户。

工作会话单元推荐模块3,根据概要信息计算工作会话单元与用户的匹配得分,以根据匹配得分推荐至工作会话单元用户。其中,工作会话单元推荐模块3进一步包括:用户特征获取模块301,根据概要信息中特征值的数值大小提取用户参与的一第二预设数量的工作会话中一第三预设数量的会话词语作为用户的标签特征;会话匹配得分获取模块302,计算标签特征中每一会话词语在每一工作会话单元中的特征值的和,作为用户与工作会话单元的匹配得分;用户会话推荐模块303,根据匹配得分获取至少一工作会话单元推荐至用户。可选的,可根据匹配得分降序将多个工作会话单元推荐给用户,亦可将匹配得分最高的工作会话单元推荐给用户,进一步的,亦可通过设置一匹配得分阈值,基于该匹配得分阈值将高于该匹配得分阈值的多个工作会话单元推荐给用户。可选的,工作会话单元以卡片的形式显示。基于上述模块,本实施例无需收集用户(团队领导、团队成员)与工作会话单元的互动数据(例如点击、点赞、留言等行为),即可实现用户与工作会话单元之间的匹配,从而推荐其相关的工作会话单元,有效解决了推荐的冷启动问题。

总之,基于上述模块,本申请实施例将工作会话划分为若干连续的单元,每一个单元包含一组工作会话,而后将工作会话单元进行摘要概括推荐给用户。采用本实施例的技术方案,在实际工作中,对于团队员工,能够帮助一线员工节省大量用于处理工作会话的时间;对于团队领导,能帮助其快速查看下属员工参与项目的最新进展,查看外部客户是否有在会话中有投诉情况等等。基于此,本实施例有效减小企业通讯客户端用户处理工作会话的时间成本,提高工作效率。

需要说明的是,上述各个模块可以是功能模块也可以是程序模块,既可以通过软件来实现,也可以通过硬件来实现。对于通过硬件来实现的模块而言,上述各个模块可以位于同一处理器中;或者上述各个模块还可以按照任意组合的形式分别位于不同的处理器中。

另外,结合图1描述的本申请实施例基于工作会话单元的推荐方法可以由计算机设备来实现。计算机设备可以包括处理器以及存储有计算机程序指令的存储器。具体地,上述处理器可以包括中央处理器(CPU),或者特定集成电路(Application SpecificIntegrated Circuit,简称为ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。

其中,存储器可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器可包括硬盘驱动器(Hard Disk Drive,简称为HDD)、软盘驱动器、固态驱动器(SolidState Drive,简称为SSD)、闪存、光盘、磁光盘、磁带或通用串行总线(Universal SerialBus,简称为USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器可在数据处理装置的内部或外部。在特定实施例中,存储器是非易失性(Non-Volatile)存储器。在特定实施例中,存储器包括只读存储器(Read-Only Memory,简称为ROM)和随机存取存储器(Random AccessMemory,简称为RAM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(ProgrammableRead-Only Memory,简称为PROM)、可擦除PROM(Erasable ProgrammableRead-Only Memory,简称为EPROM)、电可擦除PROM(Electrically Erasable ProgrammableRead-Only Memory,简称为EEPROM)、电可改写ROM(Electrically Alterable Read-OnlyMemory,简称为EAROM)或闪存(FLASH)或者两个或更多个以上这些的组合。在合适的情况下,该RAM可以是静态随机存取存储器(Static Random-Access Memory,简称为SRAM)或动态随机存取存储器(Dynamic Random Access Memory,简称为DRAM),其中,DRAM可以是快速页模式动态随机存取存储器(Fast Page Mode Dynamic Random Access Memory,简称为FPMDRAM)、扩展数据输出动态随机存取存储器(Extended Date Out Dynamic RandomAccess Memory,简称为EDODRAM)、同步动态随机存取内存(Synchronous Dynamic Random-Access Memory,简称SDRAM)等。

存储器可以用来存储或者缓存需要处理和/或通信使用的各种数据文件,以及处理器所执行的可能的计算机程序指令。

处理器通过读取并执行存储器中存储的计算机程序指令,以实现上述实施例中的任意一种基于工作会话单元的推荐方法。

另外,结合上述实施例中的基于工作会话单元的推荐方法,本申请实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种基于工作会话单元的推荐方法。

以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号