首页> 中文学位 >基于词嵌入的个性化新闻推荐算法研究
【6h】

基于词嵌入的个性化新闻推荐算法研究

代理获取

目录

摘要

1.1研究背景

1.2研究目的及意义

1.3研究内容和技术路线

第2章文献综述

2.1.1推荐系统研究现状

2.1.2文本特征表示研究现状

2.2推荐系统相关理论

2.2.1推荐系统定义

2.2.2推荐系统相关算法

2.2.3推荐系统评价指标

第3章基于词嵌入技术的神经协同过滤推荐算法

3.1词嵌入模型

3.1.1神经网络语言模型

3.1.2 Word2Vec词嵌入模型

3.1.3 FastText词嵌入模型

3.1.4 Doc2Vec词嵌入模型

3.2神经协同过滤模型

3.3基于词嵌入的神经协同过滤算法研究

3.3.1基于词嵌入的神经协同过滤算法框架

3.3.2基于词嵌入的个性化新闻推荐算法构建

第4章基于词嵌入的新闻个性化推荐算法的对比实验研究

4.1描述性统计分析与数据筛选

4.1.1用户-新闻数据描述性统计分析

4.1.2数据筛选

4.2实验评价标准

4.3文本数据处理

4.4基于隐语义模型的个性化新闻推荐研究

4.5基于神经协同过滤模型的个性化新闻推荐研究

4.6基于词嵌入神经协同过滤模型的个性化新闻推荐研究

4.6.1基于Word2Vec词嵌入的个性化新闻推荐研究

4.6.2基于FastText词嵌入的个性化新闻推荐研究

4.6.3基于Doc2Vec词嵌入的个性化新闻推荐研究

4.7实验结果对比分析

5.1本文总结

5.2未来工作

参考文献

致谢

声明

展开▼

摘要

互联网技术的发展,越来越多的人将阅读的方式转变为网上阅读。新闻推荐作为一种新闻过滤和用户定位的手段,可以根据用户历史的阅读习惯为用户推荐其可能感兴趣的新闻话题,帮助用户在大数据时代下,准确的获得有效信息,节省大量的阅读成本,有效的解决了大数据带来的信息过载问题。而目前对于信息过载条件下的推荐系统研究主要集中在电子商务领域,对于新闻的个性化推荐研究较少,但新闻作为日常生活必不可缺的一部分,更新迭代速度快,信息量大,用户很难及时的捕获到自己感兴趣的信息。因此,针对新闻进行个性化推荐具有重要意义。 协同过滤模型是经典的推荐算法模型,取得了较好的成果,且随着统计学的发展,神经网络的出现将神经网络与协同过滤相结合的神经协同过滤模型又进一步提升了推荐系统精度,然而,这两种模型均存在着一定的局限性,例如都是通过用户和项目的交互记录来提取用户的行为特征,没有充分利用可用的额外信息,限制了推荐准确度的提升,且对于稀疏数据较为敏感。因此,本文将结合文本挖掘技术与神经协同过滤模型在新闻推荐领域的应用进行研究。首先对目前主流的推荐算法和文本特征表示的相关原理进行详细的分析和介绍,并总结了各个方法的优缺点。在此基础上,结合词嵌入技术,对神经协同过滤进行改进,本文的具体工作如下: (1)本文首先对国内外推荐算法和词向量的研究现状进行文献梳理总结,并针对推荐系统中常用的推荐算法的相关原理及优缺点进行详细分析,为后面针对推荐算法的进一步研究提供理论参考。 (2)对神经协同过滤算法进行改进,针对模型只利用用户和新闻交互信息的不足,将词嵌入技术引入模型,提取新闻特征,在用户和新闻交互信息的基础上,融合新闻标题、新闻内容信息作为模型的输入特征,从而提升模型精度。 (3)针对目前主流的词嵌入技术如单词级别的词嵌入模型Word2Vec、字符级别的词嵌入模型FastText、段落级别的词嵌入模型Doc2Vec三种方法在中文新闻个性化推荐中的效果进行对比分析研究,并分析各自的优缺点。 最后,本文将文中优化后的推荐算法与传统的隐语义模型和神经协同过滤模型的推荐效果进行对比研究,实验结果表明本文优化后的算法,能够在一定程度上提升推荐准确度,有效的完成新闻推荐任务。

著录项

  • 作者

    李鲁君;

  • 作者单位

    上海师范大学;

  • 授予单位 上海师范大学;
  • 学科 应用统计
  • 授予学位 硕士
  • 导师姓名 吴鑑洪;
  • 年度 2019
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类
  • 关键词

    嵌入; 个性化; 新闻;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号