首页> 中文学位 >大数据背景下利用网络爬虫编制消费价格指数——以食品类为例
【6h】

大数据背景下利用网络爬虫编制消费价格指数——以食品类为例

代理获取

目录

声明

1 绪论

1.1 研究背景

1.2 研究意义

1.3研究内容

1.4研究思路

1.5创新点

2 文献综述

2.1国内外关于大数据的研究综述

2.2国内外网络爬虫研究现状

2.3国内外结合大数据来编制CPI研究

3 网络爬虫的基本问题分析

3.1 网络爬虫概述

3.2 Scrapy框架

3.3爬虫的局限性

4 居民消费者价格指数的计算

4.1 我国 CPI 的指数体系构成

4.2基本分类指数的编制方法

4.3基本分类指数方法存在的问题

4.4改进的基本分类价格指数的编制

5 实证分析

5.1数据来源

5.2数据特征

5.3消费者价格指数(CPI)计算

6 总结与展望

6.1 总结

6.2展望

参考文献

附录

致谢

展开▼

摘要

随着信息科技、网络技术的高速发展,大数据的这一股浪潮以一种锐不可当之势向我们汹涌扑来。在这种数据就是黄金的时代,人们的思维方式发生了翻天赋地的变化,谁能够将数据利用好,谁就走在了时代的前面。以往我国的统计调查人员都是以人工采价的方式来获得数据,不仅成本非常高、时效性非常差、数据内容比较单一、有数据获取的误差等等。但现如今,大数据成了统计数据一个极其重要的来源,已经逐步得到了统计部门的重视,我国统计工作人员几年前就已经开始尝试从网络上进行人工采价,但是以一种与电商平台合作的方式或者以爬虫的方式获取数据来计算CPI,还处于摸索阶段。本文就是探索利用网络爬虫的方式获取大数据来计算CPI。
  本文首先介绍了论文的研究背景、研究意义以及创新点。其次介绍支持论文撰写的文献综述,随后介绍一般网络爬虫的基本原理,并指出使用Scrapy框架能快速、高效的定制一个爬虫。以往主流计算CPI的方式主要是Carli指数、Dutot指数、Jevons指数,但它们有一些弊端,最主要没有考虑到给代表规格品的权重问题。
  本文结合所爬取的数据,设计出一个适合爬虫数据的指数计算模型,得到了食品类指数在15天内波动并不是很剧烈,在95-105之间上下浮动,选取的代表规格品中,计算食品类指数时,粮食类指数占的比重很大,它的变动很大程度影响着食品类指数的变化。
  论文最后指出,之后需要在爬虫技术上有所突破,获取更多的数据,使得论文更加的充实。其次在指数计算的代表规格品上选取更多的规格品的数据来编制消费者价格指数。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号