首页> 中文学位 >基于网络搜索数据的房价预测分析——以重庆市房价为例
【6h】

基于网络搜索数据的房价预测分析——以重庆市房价为例

代理获取

目录

1 绪 论

1.1研究背景

1.2研究内容及意义

1.2.1 研究内容

1.2.2 研究意义

1.3文献综述

1.3.1 网络搜索指数文献综述

1.3.2 房地产指数预测文献综述

1.3.3 网络搜索指数在房地产价格指数相关关系文献综述

1.4研究框架

1.5可能的创新与不足

1.5.1 可能的创新

1.5.2 本文的不足

2 网络搜索数据的获取和关键词处理

2.1网络搜索数据的获取

2.1.1 网络搜索平台的选择

2.1.2 网络搜索指数的获取

2.2关键词处理

2.2.1 关键词的初步获取

2.2.2 关键词的筛选

3 基于网络搜索数据的模型构造

3.1最小二乘回归模型

3.2机器学习回归

3.2.1 随机森林回归

3.2.2 梯度提升回归树

3.2.3 极端随机森林回归

3.2.4 BP神经网络回归

3.3模型比较标准

4 基于重庆市新建住宅价格指数实证分析

4.1数据来源及描述性统计

4.1.1 数据来源

4.2模型拟合效果分析

4.2.1 最小二乘回归模型结果分析

4.2.2 机器学习回归结果分析

4.2.3 模型拟合效果比较

5 结论与展望

5.1研究结论

5.2改进方向

5.3研究展望

参考文献

附录

A. 学位论文数据集

致谢

声明

展开▼

摘要

随着互联网的发展,搜索引擎成为了人们获取知识的重要渠道。网民在搜索引擎上留下的“搜索”痕迹形成了网络搜索数据,搜索引擎积累的搜索数据为人们的研究提供了重要的信息资源。基于此,通过对网络搜索数据进行数据挖掘,可以有效地捕捉到消费者的购买意向、投资者在投资前的关注重点,进而对该商品交易环节的价格水平进行预测。房地产一直是全社会的关注重点,房价波动关系到国计民生,房价的有效预测有利于居民的合理投资,便于政府提出宏观调控政策,维护社会经济的稳定。重庆市地处西南经济中心,人口聚集度高,是国民关注的重点城市,其房价直接影响经济发展和人民幸福。本文将使用每月公布的重庆市新建住宅价格指数来衡量重庆市每月房价,利用网络搜索指数来对重庆市新建住宅价格指数进行预测。  传统的房价指数预测研究方法是按经验筛选宏观经济指标建立预测模型。由于国家统计局一年才发布一次宏观经济指标,故宏观经济指标明显滞后,而且经验筛选变量存在一定的主观性。网络搜索数据时效性强,避免了传统方法的滞后性,运用数据挖掘筛选变量来预测房价,克服了传统方法主观的劣势。本文通过五个步骤进行研究。第一,利用python在360新闻、凤凰资讯、新华网等新闻网站上爬取关于“重庆房价”的相关新闻文本作为初始语料库;第二,在初始语料库的基础上利用NLPIR系统对初始语料提取关键词,经过去重步骤,初步得到与房价密切相关的影响因素即初始关键词;第三,通过时差相关分析法和随机森林平均精度下降法筛选出22个最终关键词;第四,通过百度指数平台获取最终关键词对应的百度指数,经过处理得到月度百度指数;第五,利用最终关键词的月度百度指数和统计局发布的重庆市新建住宅价格指数进行建模,建模过程中采用了传统的计量模型最小二乘回归和机器学习回归模型。  本研究主要结论:(1)根据时差相关分析法对关键词进行筛选发现与重庆市新建住宅价格指数关系最为密切的是“公租房”,由此可见,随着房价的上涨,居民的居住压力增大,公租房的关注度越来越高。(2)经过随机森林平均精度下降研究发现,对预测重庆市新建住宅价格指数贡献最大的关键词是“恋爱”,关键词“结婚”在其后,在中国住房是婚恋的刚需,也是驱动住房销售的重要动力。(3)与传统的最小二乘回归相比,机器学习中的梯度提升回归在对重庆市新建住宅价格指数的预测上表现最为稳定和精确。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号