首页> 中文学位 >多标签学习和层次分析法在用户标签建设中的应用——基于某移动互联网的用户数据
【6h】

多标签学习和层次分析法在用户标签建设中的应用——基于某移动互联网的用户数据

代理获取

目录

声明

摘要

第一章 引言

1.1 研究背景

1.2 论文主要内容及创新点

1.2.1 论文主要内容

1.2.2 创新点

第二章 文献综述

2.1 概述

2.2 数据挖掘

2.2.1 数据挖掘概述

2.2.2 分类模型

2.2.3 聚类模型

2.3 多标签学习

2.3.1 多标签学习概述

2.3.2 多标签分类和标签排序

2.3.3 模型选择和评价

2.3.4 多标签维度规约

2.3.5 标签相关性分析

2.4 多目标决策

2.4.1 多目标决策的发展脉络

2.4.2 多目标决策的基本要素

2.4.3 多目标决策方法

第三章 业务背景

3.1 应用商店

3.2 用户标签

3.2.1 应用场景

3.2.2 APP标签内容

3.2.3 用户标签的实现机制

3.2.4 用户标签的业务评价指标

第四章 实证研究

4.1 实验设计

4.2 数据准备

4.3 数据探索

4.3.1 用户分群探索

4.3.2 标签数据探索

4.4 多标签学习建模

4.4.1 数据准备

4.4.2 特征选择

4.4.3 多标签学习建模

4.5 基于层次分析法的模型选择

4.5.1 构建决策层级结构

4.5.2 标准化和同向化处理

4.5.3 建立对比决策矩阵

4.5.4 层次单排序

4.5.5 一致性检验

4.5.6 层次总排序

4.5.7 结论

第五章 总结与展望

致谢

参考文献

个人简历

展开▼

摘要

近几年,随着移动互联网的兴起,很多互联网公司积累了海量数据,并以这些数据建立了用户标签。用户标签可以描述用户属性和用户行为,对于决策支持、运营分析、内容推荐必不可少。由于用户标签在移动互联网中具有重要地位,也吸引了很多学者和专家进行相关研究。
  当前移动互联网的用户标签主要基于现状的,即根据用户的属性和行为信息判断用户当前具有的标签,例如用户当前对“健身”感兴趣,就会赋予用户“健身”标签。这种标签虽然能在一定程度上反映用户的当前属性和行为,但是无法预测用户未来的属性和行为,所以不能满足基于预测的标签需求。
  为了改进基于现状的用户标签无法预测用户未来属性和行为的问题,本文研究的是基于预测的用户标签,即根据用户的属性和历史行为预测用户未来会具有的标签,例如通过规则或模型预测用户未来会对“美术”感兴趣,就会赋予用户“美术”标签。
  目前建立用户标签的方法主要是两种:基于规则的方法和基于模型的方法。当前基于预测的用户标签大多是基于规则的,即通过人工来观察相关数据,定义相应的规则,例如通过人工查看数据,设定一个阈值,如果用户点击“健身”内容的次数超过该阈值,那么会赋予该用户“健身”标签。但是,基于规则的方法效率很低,而且受人为因素干扰较大,所以实际效果通常较差。基于模型的方法通常具有效率高、准确率高的优点,但是,由于一个用户可能会具有多个标签,而传统的分类模型只能最多赋予用户一个标签,所以应用传统的分类模型无法直接应用于用户标签,这也是大部分预测性质的用户标签是基于规则建立的主要原因。
  多标签学习模型能够针对同一个用户输出多个标签,解决用户和用户标签存在一对多关系的问题。但是,多标签学习在模型的选择和评价上存在一定困难:由于多标签学习模型与传统分类模型有较大区别,所以在模型评价中与传统的分类模型评价也有所不同。因此,如何选取合适的评价模型是多标签学习研究领域中的一大重要问题。
  针对以上内容,本文的研究将围绕以下两个研究点进行:
  (1)针对用户标签的场景,本文选用多标签学习模型建立用户标签,用户标签是预测性质的,即基于用户属性和用户历史数据预测用户未来的行为。
  (2)本文基于实际业务和多标签学习的特性,选择了一些可以应用于多标签学习的指标,并采用综合考虑多个评价指标的思路,通过引入多目标决策中的层次分析法(AHP),为模型选择提供依据。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号