首页> 中国专利> 一种基于园区大数据的精准招商平台

一种基于园区大数据的精准招商平台

摘要

本发明公开了一种基于园区大数据的精准招商平台,包括:数据层,包括为精准招商所需要的工商数据、信用数据、知识产权数据、年报数据、司法数据及年报数据;平台层,采用大数据平台分析数据层内的数据信息,输出适用于精准招商的企业综合评估模型、企业投资概率模型、企业投资偏好模型及企业异动模型;画像层,利用画像系统分析平台层输出结果生成画像,其中所述画像包括基本信息、科技创新、国际竞争力、人才、可持续发展及经营能力;专题层,对平台层和画像层进行整合,构建生成主题中心库;应用层,基于主题中心库的主题信息数据实现数据的功能性模块应用,所述功能性模块包括数据可视化模块、企业分析模块、精准招商模块及政策匹配化模块。

著录项

  • 公开/公告号CN112700170A

    专利类型发明专利

  • 公开/公告日2021-04-23

    原文格式PDF

  • 申请/专利权人 科技谷(厦门)信息技术有限公司;

    申请/专利号CN202110056883.8

  • 发明设计人 吴炎泉;

    申请日2021-01-15

  • 分类号G06Q10/06(20120101);G06Q30/02(20120101);G06Q50/16(20120101);G06F16/951(20190101);G06F16/904(20190101);G06F16/182(20190101);

  • 代理机构35224 厦门致群财富专利代理事务所(普通合伙);

  • 代理人刘兆庆;邓贵琴

  • 地址 361000 福建省厦门市湖里区安岭二路88号A栋404室

  • 入库时间 2023-06-19 10:43:23

说明书

技术领域

本发明涉及大数据技术领域,具体涉及一种基于园区大数据的精准招商平台。

背景技术

随着云计算、大数据、“互联网+”等新兴技术的出现和普及,云服务与大数据建设已经成为园区的智能监管政务工程,建设成效则直接影响了园区的综合竞争力。

园区大数据招商平台建设支撑园区精准招商的发展战略目标实现,建成为国内先进、具示范引领的园区招商平台,真正实现具有国际影响力的中国大数据产业生态圈,形成互联、高效、低碳、可运营、可升级、可体验、可复制的园区信息化建设模式。现有招商平台存在精准招商难,信息获取渠道少、成本高、效率低,目标企业投资意愿难判断,目标经营企业情况难了解;找客户难,耗费大量时间寻找客户线索,招商效率低下等问题。

发明内容

本发明提出一种基于园区大数据的精准招商平台,提升和创新产业,完善产业链,提升园区招商服务水平,提高核心竞争力,创造更多就业机会;为入驻企业提升市场竞争力,提高园区信息化水平,提高企业办公效率,降低企业运营成本。

为实现上述目的,本发明采用以下技术方案:

一种基于园区大数据的精准招商平台,包括:

数据层,包括为精准招商所需要的工商数据、信用数据、知识产权数据、年报数据、司法数据及年报数据;

平台层,采用大数据平台分析数据层内的数据信息,输出适用于精准招商的企业综合评估模型、企业投资概率模型、企业投资偏好模型及企业异动模型;

画像层,利用画像系统分析平台层输出结果生成画像,其中所述画像包括基本信息、科技创新、国际竞争力、人才、可持续发展及经营能力;

专题层,对平台层和画像层进行整合,构建生成主题中心库;

应用层,基于主题中心库的主题信息数据实现数据的功能性模块应用,所述功能性模块包括数据可视化模块、企业分析模块、精准招商模块及政策匹配化模块。

优选地,所述大数据平台包括数据集成模块、数据存储模块、数据计算模块、数据引擎模块及数据分析模块。

优选地,所述数据集成模块包括Sqoop子模块、Flume子模块、Storm子模块及Streaming子模块;所述数据存储模块包括Redis子模块、MySQL子模块、HDFS子模块及HBase子模块;所述数据计算模块包括Hive子模块、Spark子模块、YARN或TEZ子模块及Kylin子模块;所述数据引擎模块包括ElasticSearch子模块、Titan子模块、NLP子模块、Spark-Engine子模块;所述数据分析模块包括sparkml子模块、TensorFlow子模块、Mahout子模块及R或python子模块。

优选地,所述数据层的数据来源包括融合园区内部数据、第三方企业信息接口的数据、网络爬取数据及政务系统数据。

优选地,所述网络爬取数据的步骤包括:

A1、通过检测管理模块定义爬虫任务;

A2、调度模块读取爬虫任务,并从ZooKeeper模块和Redis模块获取爬虫资源;

A3、调度模块处理爬虫任务和爬虫资源,分解任务下达至爬虫引擎定向爬取各大网站的信息数据;

A4、数据通过持久化手段进入HBase数据库;

A5、数据层从HBase数据库爬取特定数据,基于web分析模块对不同维度的数据进行可视化分析。

优选地,所述画像系统包括标签数据处理模块、标签数据挖掘打标签模块、标签建设模块、画像建设模块、画像分析模块及开放平台模块。

优选地,所述主题中心库包括园区主题、企业主题、招商主题及政策主题。

优选地,所述数据可视化模块包括园区概览和产业视图;所述企业分析模块包括企业画像、综合评估、投资分析及人脉分析;所述精准招商模块包括进度监控、智能推荐、精准招商及内部稳商;所述政策匹配化模块包括覆盖分析和效果分析。

采用上述技术方案后,本发明与背景技术相比,具有如下优点:

1、本发明提供一种基于园区大数据的精准招商平台,提升和创新产业,完善产业链,提升园区招商服务水平,提高核心竞争力,创造更多就业机会;为入驻企业提升市场竞争力,提高园区信息化水平,提高企业办公效率,降低企业运营成本。

2、本发明提供一种基于园区大数据的精准招商平台,通过大数据平台处理数据层的数据,提升工作效率,降低时间成本和人工成本。

附图说明

图1为本发明结构框图;

图2为本发明画像系统框图;

图3为本发明网络爬取数据流程示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

在本发明中需要说明的是,术语“上”“下”“左”“右”“竖直”“水平”“内”“外”等均为基于附图所示的方位或位置关系,仅仅是为了便于描述本发明和简化描述,而不是指示或暗示本发明的装置或元件必须具有特定的方位,因此不能理解为对本发明的限制。

实施例

配合图1至图3所示,本发明公开了一种基于园区大数据的精准招商平台,包括:

数据层,包括为精准招商所需要的工商数据、信用数据、知识产权数据、年报数据、司法数据及年报数据;

平台层,采用大数据平台分析数据层内的数据信息,输出适用于精准招商的企业综合评估模型、企业投资概率模型、企业投资偏好模型及企业异动模型;

画像层,利用画像系统分析平台层输出结果生成画像,其中画像包括基本信息、科技创新、国际竞争力、人才、可持续发展及经营能力;

专题层,对平台层和画像层进行整合,构建生成主题中心库;

应用层,基于主题中心库的主题信息数据实现数据的功能性模块应用,功能性模块包括数据可视化模块、企业分析模块、精准招商模块及政策匹配化模块。

大数据平台包括数据集成模块、数据存储模块、数据计算模块、数据引擎模块及数据分析模块。

数据集成模块包括Sqoop子模块、Flume子模块、Storm子模块及Streaming子模块;数据存储模块包括Redis子模块、MySQL子模块、HDFS子模块及HBase子模块;数据计算模块包括Hive子模块、Spark子模块、YARN或TEZ子模块及Kylin子模块;数据引擎模块包括ElasticSearch子模块、Titan子模块、NLP子模块、Spark-Engine子模块;数据分析模块包括sparkml子模块、TensorFlow子模块、Mahout子模块及R或python子模块。

大数据处理平台为数据运算提供离线计算能力、准实时计算能力及实时计算三种运算能力,和全文检索引擎、图数据库引擎及算法执行引擎三种数据引擎。

数据层的数据来源包括融合园区内部数据、第三方企业信息接口的数据、网络爬取数据及政务系统数据。

网络爬取数据的步骤包括:

A1、通过检测管理模块定义爬虫任务;

A2、调度模块读取爬虫任务,并从ZooKeeper模块和Redis模块获取爬虫资源;

A3、调度模块处理爬虫任务和爬虫资源,分解任务下达至爬虫引擎定向爬取各大网站的信息数据;

A4、数据通过持久化手段进入HBase数据库;

A5、数据层从HBase数据库爬取特定数据,基于web分析模块对不同维度的数据进行可视化分析。

爬虫引擎包括爬虫下载模块、爬虫数据解析模块、爬虫数据存储模块及爬虫分布式队列资源模块。

爬虫下载模块:爬虫启动时,从队列资源中获取到并转换为url后调用的模块,根据url模拟浏览器浏览行为爬取url对应的页面,下载并解析,底层使用phantomjs无头浏览器和httpclient,并且该模块有代理防屏蔽功能。

爬虫数据解析模块:当页面数据下载完成后,需要对html页面进行数据解析,生成业务需要的格式画数据集。不同的业务,需要编写不同数据解析处理器,因此,对业务进行扩展,该部分模块随之会变大。

爬虫数据存储模块:在数据解析格式化后,需要把格式化后的数据持久化,供业务分析使用。由于,现在数据持久化方式各种各样,因此,根据不同持久化需求,实现该模块持久化相应代码,能做到存储格式化数据到不同的数据仓库。

爬虫分布式队列资源模块:爬虫启动的时候使用该模块,并生成队列资源到redis中,供集群爬虫消费;该队列资源原始存储在数据库中,启用时,分页排序查询数据库,分批次放入redis中(消费完毕,再次放入)。为防止数据重复写入,每次放入的时候,对资源加锁,只有单个线程能操作资源。

画像系统包括标签数据处理模块、标签数据挖掘打标签模块、标签建设模块、画像建设模块、画像分析模块及开放平台模块。

画像建设模块用于整个标签体系的建设管理,包括资源管理子模块、调度管理子模块、消息推送子模块、日志跟踪子模块及画像管理子模块。支持灵活的标签层级管理配置、数据存储与显示可视化配置、数据写入作业管控等,为后续的查询、分析以及数据输出做好充分的准备。

画像分析模块包括多维查询子模块、画像详细子模块、群体分析子模块、报表分析子模块及API服务子模块。各功能页面与标签管理中的元数据配置紧密关联,通过不同的配置组合渲染出多样界面效果。部分页面展示内容又可以结合实际的业务数据情况进行个性化定制。

主题中心库包括园区主题、企业主题、招商主题及政策主题。

园区主题:用于对园区画像所有标签数据的全息展示。可针对多种不同维度的可视化视图进行操作分析;

企业主题:画像系统的标签,组合查询出某一类的企业群体的信息,对查询出的企业群体进行详细分析;

招商主题:展示各招商项目完成进度,对各招商项目进行监控;定制化爬取外部企业数据,基于爬取的外部企业数据标签,组合搜索招商目标企业。

政策主题:分析政策与企业的匹配度,将园区内企业与政策进行匹配,筛选出扶持目标企业;将园区外企业与政策进行匹配,筛选出招商目标企业。

数据可视化模块包括园区概览和产业视图;企业分析模块包括企业画像、综合评估、投资分析及人脉分析;精准招商模块包括进度监控、智能推荐、精准招商及内部稳商;政策匹配化模块包括覆盖分析和效果分析。

以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号