首页> 中国专利> 一种建立中小微企业大数据服务平台的方法

一种建立中小微企业大数据服务平台的方法

摘要

本发明涉及一种建立中小微企业大数据服务平台的方法,包括以下步骤:步骤一:采集企业数据,并通过数据聚合形成专题数据库;步骤二:根据企业自身数据情况,结合步骤一中形成的专题数据库,对目标企业建立标签体系;步骤三:建立企业产业链分析平台。

著录项

  • 公开/公告号CN112837199A

    专利类型发明专利

  • 公开/公告日2021-05-25

    原文格式PDF

  • 申请/专利权人 重庆数联铭信科技有限公司;

    申请/专利号CN202110210402.4

  • 申请日2021-02-25

  • 分类号G06Q50/26(20120101);G06F16/27(20190101);G06F16/28(20190101);G06N3/08(20060101);

  • 代理机构50232 重庆启恒腾元专利代理事务所(普通合伙);

  • 代理人万建

  • 地址 401121 重庆市两江新区大竹林街道华山南路16号9号楼

  • 入库时间 2023-06-19 11:05:16

说明书

技术领域

本发明涉及企业服务平台技术领域,特别是涉及一种建立中小微企业大数据服务平台的方法。

背景技术

当前政府部门尚未运用大数据等手段归集分散的企业公共信用信息,缺乏数据的支撑,无法充分掌握区域内重点产业链上中小微企业注册、经营、退出、信用风险的变化以及区域内企业金融活动范围及融资情况,因此,亟需通过搭建云平台归集区域内企业公共信用信息以及通过云平台融资企业的注册、授信、违约等情况,实时追踪掌握区域内全量企业的产业链关联方分布变化、经营活动区域变化、金融需求变化,以便于政府及有关部门制定以信用大数据为基础的中小微企业发展产业支持政策、信贷扶持政策提供决策依据。

发明内容

针对上述现有技术的不足,本专利申请所要解决的技术问题是如何提供一种建立中小微企业大数据服务平台的方法,实现直观、便捷、高效的企业服务平台。

为了解决上述技术问题,本发明采用了如下的技术方案:

一种建立中小微企业大数据服务平台的方法,包括以下步骤:

步骤一:采集企业数据,并通过数据聚合形成专题数据库;

步骤二:根据企业自身数据情况,结合步骤一中形成的专题数据库,对目标企业建立标签体系;

步骤三:建立企业产业链分析平台。

进一步的,步骤一中,企业数据的采集基于政府公共信用信息和市场信用信息,其中,支持多种索引,包括全局索引、局部索引、高维索引以及全文索引。

进一步的,步骤一中,进行数据聚合时,基于Spark计算引擎技术从各消息源中抽取数据聚合为目标模型,Spark计算引擎结合分布式内存和列式存储提供交互式数据处理能力,Spark计算引擎提出RDD的概念,所有的统计分析任务是由对RDD的若干基本操作组成。RDD驻留在内存中,后续的任务直接读取内存中的数据,Spark计算引擎将分析任务编译成一个由RDD组成的有向无环图,根据数据之间的依赖性把相邻的任务合并。

进一步的,步骤一中,Spark计算引擎同时支持跨内存/闪存介质的分布式混合列式存储,通过将数据装载入分析型数据库的分布式内存列式存储中,支持对海量数据的交互式数据分析。

进一步的,步骤二中,建立企业标签体系包括以下步骤:

S1:对通过数据聚合得到的最大属性集进行特征属性构造;

S2:将相关训练集放入分类器中训练;

S3:进行标签化展示。

进一步的,在企业标签体系建立过程中可以对特征属性也可进行无监督学习计算分类标签,可用于快速检索,作为标签化展示的补充。

进一步的,步骤s2中,进行训练时,通过以下方式进行:

A1:引入训练集合及数据;

由训练人员按照不同主题、不同规则、不同来源的数据进行定义,指定训练的数据集合、范围与数据体量,完成标签训练的初始化数据配置;

A2:标签训练与标签比对;

根据算法与模型生成相关标签,并与人工标签进行比对,训练过程干预标签的增加或者减少,通过机器学习的方式进行特征的识别与持续的效果提升。同时,制定相关确定性规则以生成相应的标签;

A3:循环训练;

通过a2方法进行多主题、多维度、多来源数据的循环训练,并允许调整规则与相应的算法参数;

A4:效果检验;

通过引入新的数据来检验标签生成的实际效果。

进一步的,步骤三中,建立建立企业产业链分析平台时,基于知识图谱的技术,从主体所在的产业链关联关系的角度进行的分析,通过频繁子图发现技术手段,发现演变子图结构,并映射至对应的分析维度,对分析维度进行扩充,从新的视角实现对产业链动态演变的识别与跟踪。

综上,本发明具有产业链多级穿透的应用,从产业链企业工商数据、司法信息等信息出发,通过逐级深度挖掘,地域分布趋势、地域风险率趋势、关联方产权分布、关联方分类分布、关联方交易分布、管理层分布、关联方诉讼分布、诉讼分类、行业分布趋势、行业风险率趋势等,基于两大理论(U形发展/股权原理)分析企业及关联方的产业链分布及风险走势,验证区域内产业链变化趋势的实时跟踪。

附图说明

图1为本发明所述的一种建立中小微企业大数据服务平台的方法的流程图。

具体实施方式

下面结合附图对本发明作进一步的详细说明。在本发明的描述中,需要理解的是,方位词如″上、下″和″顶、底″等所指示的方位或位置关系通常是基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,在未作相反说明的情况下,这些方位词并不指示和暗示所指的装置或元件必须具有特定的方位或者以特定的方位构造和操作,因此不能理解为对本发明保护范围的限制;方位词″内、外″是指相对于各部件本身的轮廓的内外。

如图1所示,一种建立中小微企业大数据服务平台的方法,包括以下步骤:

步骤一:采集企业数据,并通过数据聚合形成专题数据库;

步骤二:根据企业自身数据情况,结合步骤一中形成的专题数据库,对目标企业建立标签体系;

步骤三:建立企业产业链分析平台。

进一步的,步骤一中,企业数据的采集基于政府公共信用信息和市场信用信息,其中,支持多种索引,包括全局索引、局部索引、高维索引以及全文索引。

进一步的,步骤一中,进行数据聚合时,基于Spark计算引擎技术从各消息源中抽取数据聚合为目标模型,Spark计算引擎结合分布式内存和列式存储提供交互式数据处理能力,Spark计算引擎提出RDD的概念,所有的统计分析任务是由对RDD的若干基本操作组成。RDD驻留在内存中,后续的任务直接读取内存中的数据,Spark计算引擎将分析任务编译成一个由RDD组成的有向无环图,根据数据之间的依赖性把相邻的任务合并。

进一步的,步骤一中,Spark计算引擎同时支持跨内存/闪存介质的分布式混合列式存储,通过将数据装载入分析型数据库的分布式内存列式存储中,支持对海量数据的交互式数据分析。

进一步的,步骤二中,建立企业标签体系包括以下步骤:

S1:对通过数据聚合得到的最大属性集进行特征属性构造;

S2:将相关训练集放入分类器中训练;

S3:进行标签化展示。

进一步的,在企业标签体系建立过程中可以对特征属性也可进行无监督学习计算分类标签,可用于快速检索,作为标签化展示的补充。

进一步的,步骤s2中,进行训练时,通过以下方式进行:

A1:引入训练集合及数据;

由训练人员按照不同主题、不同规则、不同来源的数据进行定义,指定训练的数据集合、范围与数据体量,完成标签训练的初始化数据配置;

A2:标签训练与标签比对;

根据算法与模型生成相关标签,并与人工标签进行比对,训练过程干预标签的增加或者减少,通过机器学习的方式进行特征的识别与持续的效果提升。同时,制定相关确定性规则以生成相应的标签;

A3:循环训练;

通过a2方法进行多主题、多维度、多来源数据的循环训练,并允许调整规则与相应的算法参数;

A4:效果检验;

通过引入新的数据来检验标签生成的实际效果。

进一步的,步骤三中,建立建立企业产业链分析平台时,基于知识图谱的技术,从主体所在的产业链关联关系的角度进行的分析,通过频繁子图发现技术手段,发现演变子图结构,并映射至对应的分析维度,对分析维度进行扩充,从新的视角实现对产业链动态演变的识别与跟踪。

本发明具有以下优点,能够实现产业链多级穿透的应用,从产业链企业工商数据、司法信息等信息出发,通过逐级深度挖掘,地域分布趋势、地域风险率趋势、关联方产权分布、关联方分类分布、关联方交易分布、管理层分布、关联方诉讼分布、诉讼分类、行业分布趋势、行业风险率趋势等,基于两大理论(U形发展/股权原理)分析企业及关联方的产业链分布及风险走势,验证区域内产业链变化趋势的实时跟踪

最后应说明的是:本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等统计数的范围之内,则本发明也意图包含这些改动和变型。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号