公开/公告号CN112700170A
专利类型发明专利
公开/公告日2021-04-23
原文格式PDF
申请/专利权人 科技谷(厦门)信息技术有限公司;
申请/专利号CN202110056883.8
发明设计人 吴炎泉;
申请日2021-01-15
分类号G06Q10/06(20120101);G06Q30/02(20120101);G06Q50/16(20120101);G06F16/951(20190101);G06F16/904(20190101);G06F16/182(20190101);
代理机构35224 厦门致群财富专利代理事务所(普通合伙);
代理人刘兆庆;邓贵琴
地址 361000 福建省厦门市湖里区安岭二路88号A栋404室
入库时间 2023-06-19 10:43:23
技术领域
本发明涉及大数据技术领域,具体涉及一种基于园区大数据的精准招商平台。
背景技术
随着云计算、大数据、“互联网+”等新兴技术的出现和普及,云服务与大数据建设已经成为园区的智能监管政务工程,建设成效则直接影响了园区的综合竞争力。
园区大数据招商平台建设支撑园区精准招商的发展战略目标实现,建成为国内先进、具示范引领的园区招商平台,真正实现具有国际影响力的中国大数据产业生态圈,形成互联、高效、低碳、可运营、可升级、可体验、可复制的园区信息化建设模式。现有招商平台存在精准招商难,信息获取渠道少、成本高、效率低,目标企业投资意愿难判断,目标经营企业情况难了解;找客户难,耗费大量时间寻找客户线索,招商效率低下等问题。
发明内容
本发明提出一种基于园区大数据的精准招商平台,提升和创新产业,完善产业链,提升园区招商服务水平,提高核心竞争力,创造更多就业机会;为入驻企业提升市场竞争力,提高园区信息化水平,提高企业办公效率,降低企业运营成本。
为实现上述目的,本发明采用以下技术方案:
一种基于园区大数据的精准招商平台,包括:
数据层,包括为精准招商所需要的工商数据、信用数据、知识产权数据、年报数据、司法数据及年报数据;
平台层,采用大数据平台分析数据层内的数据信息,输出适用于精准招商的企业综合评估模型、企业投资概率模型、企业投资偏好模型及企业异动模型;
画像层,利用画像系统分析平台层输出结果生成画像,其中所述画像包括基本信息、科技创新、国际竞争力、人才、可持续发展及经营能力;
专题层,对平台层和画像层进行整合,构建生成主题中心库;
应用层,基于主题中心库的主题信息数据实现数据的功能性模块应用,所述功能性模块包括数据可视化模块、企业分析模块、精准招商模块及政策匹配化模块。
优选地,所述大数据平台包括数据集成模块、数据存储模块、数据计算模块、数据引擎模块及数据分析模块。
优选地,所述数据集成模块包括Sqoop子模块、Flume子模块、Storm子模块及Streaming子模块;所述数据存储模块包括Redis子模块、MySQL子模块、HDFS子模块及HBase子模块;所述数据计算模块包括Hive子模块、Spark子模块、YARN或TEZ子模块及Kylin子模块;所述数据引擎模块包括ElasticSearch子模块、Titan子模块、NLP子模块、Spark-Engine子模块;所述数据分析模块包括sparkml子模块、TensorFlow子模块、Mahout子模块及R或python子模块。
优选地,所述数据层的数据来源包括融合园区内部数据、第三方企业信息接口的数据、网络爬取数据及政务系统数据。
优选地,所述网络爬取数据的步骤包括:
A1、通过检测管理模块定义爬虫任务;
A2、调度模块读取爬虫任务,并从ZooKeeper模块和Redis模块获取爬虫资源;
A3、调度模块处理爬虫任务和爬虫资源,分解任务下达至爬虫引擎定向爬取各大网站的信息数据;
A4、数据通过持久化手段进入HBase数据库;
A5、数据层从HBase数据库爬取特定数据,基于web分析模块对不同维度的数据进行可视化分析。
优选地,所述画像系统包括标签数据处理模块、标签数据挖掘打标签模块、标签建设模块、画像建设模块、画像分析模块及开放平台模块。
优选地,所述主题中心库包括园区主题、企业主题、招商主题及政策主题。
优选地,所述数据可视化模块包括园区概览和产业视图;所述企业分析模块包括企业画像、综合评估、投资分析及人脉分析;所述精准招商模块包括进度监控、智能推荐、精准招商及内部稳商;所述政策匹配化模块包括覆盖分析和效果分析。
采用上述技术方案后,本发明与背景技术相比,具有如下优点:
1、本发明提供一种基于园区大数据的精准招商平台,提升和创新产业,完善产业链,提升园区招商服务水平,提高核心竞争力,创造更多就业机会;为入驻企业提升市场竞争力,提高园区信息化水平,提高企业办公效率,降低企业运营成本。
2、本发明提供一种基于园区大数据的精准招商平台,通过大数据平台处理数据层的数据,提升工作效率,降低时间成本和人工成本。
附图说明
图1为本发明结构框图;
图2为本发明画像系统框图;
图3为本发明网络爬取数据流程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在本发明中需要说明的是,术语“上”“下”“左”“右”“竖直”“水平”“内”“外”等均为基于附图所示的方位或位置关系,仅仅是为了便于描述本发明和简化描述,而不是指示或暗示本发明的装置或元件必须具有特定的方位,因此不能理解为对本发明的限制。
实施例
配合图1至图3所示,本发明公开了一种基于园区大数据的精准招商平台,包括:
数据层,包括为精准招商所需要的工商数据、信用数据、知识产权数据、年报数据、司法数据及年报数据;
平台层,采用大数据平台分析数据层内的数据信息,输出适用于精准招商的企业综合评估模型、企业投资概率模型、企业投资偏好模型及企业异动模型;
画像层,利用画像系统分析平台层输出结果生成画像,其中画像包括基本信息、科技创新、国际竞争力、人才、可持续发展及经营能力;
专题层,对平台层和画像层进行整合,构建生成主题中心库;
应用层,基于主题中心库的主题信息数据实现数据的功能性模块应用,功能性模块包括数据可视化模块、企业分析模块、精准招商模块及政策匹配化模块。
大数据平台包括数据集成模块、数据存储模块、数据计算模块、数据引擎模块及数据分析模块。
数据集成模块包括Sqoop子模块、Flume子模块、Storm子模块及Streaming子模块;数据存储模块包括Redis子模块、MySQL子模块、HDFS子模块及HBase子模块;数据计算模块包括Hive子模块、Spark子模块、YARN或TEZ子模块及Kylin子模块;数据引擎模块包括ElasticSearch子模块、Titan子模块、NLP子模块、Spark-Engine子模块;数据分析模块包括sparkml子模块、TensorFlow子模块、Mahout子模块及R或python子模块。
大数据处理平台为数据运算提供离线计算能力、准实时计算能力及实时计算三种运算能力,和全文检索引擎、图数据库引擎及算法执行引擎三种数据引擎。
数据层的数据来源包括融合园区内部数据、第三方企业信息接口的数据、网络爬取数据及政务系统数据。
网络爬取数据的步骤包括:
A1、通过检测管理模块定义爬虫任务;
A2、调度模块读取爬虫任务,并从ZooKeeper模块和Redis模块获取爬虫资源;
A3、调度模块处理爬虫任务和爬虫资源,分解任务下达至爬虫引擎定向爬取各大网站的信息数据;
A4、数据通过持久化手段进入HBase数据库;
A5、数据层从HBase数据库爬取特定数据,基于web分析模块对不同维度的数据进行可视化分析。
爬虫引擎包括爬虫下载模块、爬虫数据解析模块、爬虫数据存储模块及爬虫分布式队列资源模块。
爬虫下载模块:爬虫启动时,从队列资源中获取到并转换为url后调用的模块,根据url模拟浏览器浏览行为爬取url对应的页面,下载并解析,底层使用phantomjs无头浏览器和httpclient,并且该模块有代理防屏蔽功能。
爬虫数据解析模块:当页面数据下载完成后,需要对html页面进行数据解析,生成业务需要的格式画数据集。不同的业务,需要编写不同数据解析处理器,因此,对业务进行扩展,该部分模块随之会变大。
爬虫数据存储模块:在数据解析格式化后,需要把格式化后的数据持久化,供业务分析使用。由于,现在数据持久化方式各种各样,因此,根据不同持久化需求,实现该模块持久化相应代码,能做到存储格式化数据到不同的数据仓库。
爬虫分布式队列资源模块:爬虫启动的时候使用该模块,并生成队列资源到redis中,供集群爬虫消费;该队列资源原始存储在数据库中,启用时,分页排序查询数据库,分批次放入redis中(消费完毕,再次放入)。为防止数据重复写入,每次放入的时候,对资源加锁,只有单个线程能操作资源。
画像系统包括标签数据处理模块、标签数据挖掘打标签模块、标签建设模块、画像建设模块、画像分析模块及开放平台模块。
画像建设模块用于整个标签体系的建设管理,包括资源管理子模块、调度管理子模块、消息推送子模块、日志跟踪子模块及画像管理子模块。支持灵活的标签层级管理配置、数据存储与显示可视化配置、数据写入作业管控等,为后续的查询、分析以及数据输出做好充分的准备。
画像分析模块包括多维查询子模块、画像详细子模块、群体分析子模块、报表分析子模块及API服务子模块。各功能页面与标签管理中的元数据配置紧密关联,通过不同的配置组合渲染出多样界面效果。部分页面展示内容又可以结合实际的业务数据情况进行个性化定制。
主题中心库包括园区主题、企业主题、招商主题及政策主题。
园区主题:用于对园区画像所有标签数据的全息展示。可针对多种不同维度的可视化视图进行操作分析;
企业主题:画像系统的标签,组合查询出某一类的企业群体的信息,对查询出的企业群体进行详细分析;
招商主题:展示各招商项目完成进度,对各招商项目进行监控;定制化爬取外部企业数据,基于爬取的外部企业数据标签,组合搜索招商目标企业。
政策主题:分析政策与企业的匹配度,将园区内企业与政策进行匹配,筛选出扶持目标企业;将园区外企业与政策进行匹配,筛选出招商目标企业。
数据可视化模块包括园区概览和产业视图;企业分析模块包括企业画像、综合评估、投资分析及人脉分析;精准招商模块包括进度监控、智能推荐、精准招商及内部稳商;政策匹配化模块包括覆盖分析和效果分析。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。
机译: 面向园区的物联网大数据管理和应用平台
机译: 用于提供基于人工智能的基于人工智能和处理复杂生物信号的大数据的复杂生物信号的大数据的集成和处理的平台
机译: 基于移动互联网的精准营销平台