基于Spark大数据处理的协同过滤推荐系统研究与实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

现代社会信息越来越庞杂，人们生活在一个信息过载的时代，通过某种方式为用户过滤掉无用信息是研究者不断追求的目标。推荐系统就是用来满足用户需求或者服务的系统，它能够满足用户个性化的需求，在用户获取和查询信息中占据着重要的地位。但是推荐系统在发展过程中，也存在一系列的难题需要解决，例如业务调整频繁，系统响应速度慢，推荐结果准确度低下以及海量数据的处理与分析时较慢等问题。为了解决以上问题，需要对推荐系统不断的研究改进。一个良好的个性化推荐系统一方面需要拥有较好的扩展性，能够随着业务需求的不断变化对系统进行调整和更新；另一方面还需要采用大数据处理相关技术来解决推荐过程的效率问题。目前Hadoop及Spark分布式处理平台是解决大数据处理的重要方案，通过分布式的计算与处理实现对海量数据的管理与分析，本文的研究正是基于这些方案。
　　推荐系统现在面临的主要问题是数据的稀疏性，它也是导致推荐系统结果不准确的重要原因。随着数据量的不断增加，对于数据的处理过程也变得更为复杂。为了更加有效地解决以上问题，本文设计并完成了一种基于Spark框架的推荐系统。在文中对本系统的总体结构和具体算法进行了介绍，并对不同算法的优势和缺点进行了分析，最终选择了基于用户偏好实现个性化推荐的方法。论文首先描述了课题研究的背景及国内外研究现状，并分析了论文的主要内容；随后分析了协同过滤算法的相关情况和Spark大数据处理框架的相关技术；课题分别从相似度传递和语义分析算法两方面来改善推荐效果；为了做到“实时”推荐，提升推荐速度，采用了Spark大数据处理技术；在分析设计相关算法之后，本文的系统设计从系统总体框架、推荐引擎总体框架和推荐引擎设计三个部分予以分析设计实现；为了证明推荐算法的有效性，文中进行了大量的试验和测试。最后实现了一个利用本文算法的电影网站。
　　实验表明，本文的协同过滤推荐算法具有良好的推荐效果，由于采用了Spark大数据处理框架，速度优势明显，此外本课题的推荐引擎在电影网站的应用取得了一定的成功，该研究具有一定的理论价值及现实意义。

著录项

作者
王娜;
展开▼
作者单位

兰州大学;

展开▼
授予单位兰州大学;
学科计算机技术
授予学位硕士
导师姓名张瑞生,者建武;
年度 2017
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP393.09;
关键词
Spark框架; 大数据处理; 协同过滤算法; 语义分析; 数据清洗; 推荐系统;

相似文献

中文文献
外文文献
专利

1. 基于Spark大数据处理的电影推荐系统设计与实现 [J] . 朱炳旭 ,叶传奇 ,王君洋 . 无线互联科技 . 2021,第011期
2. 基于Spark MLlib协同过滤算法的美食推荐系统研究 [J] . 徐林 . 吉林大学学报（信息科学版） . 2019,第002期
3. 基于协同过滤算法的音乐推荐系统的研究与实现 [J] . 张淼 ,刘东旭 . 电子世界 . 2020,第010期
4. 基于Python的用户协同过滤推荐系统的研究与实现 [J] . 秦育华 . 电脑知识与技术 . 2020,第031期
5. 一种基于Spark大数据处理平台的查询方法 [J] . 张海峰 ,魏可欣 . 南京邮电大学学报（自然科学版） . 2021,第004期
6. 基于Spark的医疗大数据处理模型研究与设计 [C] . GE Xiao-wei ,葛晓伟 ,LI Yu-shen . 中华医学会第二十四次全国医学信息学术会议 . 2018
7. 基于Spark的混合协同过滤推荐系统的研究与实现 [A] . 陈孝通 . 2017

基于Spark大数据处理的协同过滤推荐系统研究与实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅