首页> 中国专利> 一种基于机器学习的社会信用风险评估系统

一种基于机器学习的社会信用风险评估系统

摘要

本发明提供一种基于机器学习的社会信用风险评估系统,包括:样本数据模块用于获取个人社会信用样本数据,其中样本数据包括个人基本信息以及个人信用信息;模型训练模块用户将训练样本数据作为训练集输入到风险评估模型中进行模型训练,生成训练好的风险评估模型;输入模块用于获取目标个人的基本信息作为目标测试数据;评估模块用于调用模型训练模块中训练好的风险评估模型,将目标测试数据输入到该训练好的风险评估模型中,获取由风险评估模型输出的风险评估结果。本发明能够基于机器学习自动训练准确度高的风险评估模型用作目标对象的风险评估,为对目标对象的个人社会信用风险评估提供参考依据。

著录项

  • 公开/公告号CN112396310A

    专利类型发明专利

  • 公开/公告日2021-02-23

    原文格式PDF

  • 申请/专利权人 上海京滴信用管理有限公司;

    申请/专利号CN202011262949.0

  • 发明设计人 欧泽超;王元聪;

    申请日2020-11-12

  • 分类号G06Q10/06(20120101);G06K9/62(20060101);G06N3/08(20060101);G06N20/00(20190101);

  • 代理机构11530 北京高航知识产权代理有限公司;

  • 代理人乔浩刚

  • 地址 200333 上海市普陀区金沙江路980号7层701室

  • 入库时间 2023-06-19 09:58:59

说明书

技术领域

本发明涉及机器学习技术领域,特别是一种基于机器学习的社会信用风险评估系统。

背景技术

目前,针对个人社会信用的评估,通常是根据该目标个人的具体守信行为记录或者失信行为记录作为依据,通过主观的方式评定该目标个人的信用评级;但是针对无任何守信行为记录或者失信行为记录的目标对象,则失去了信用评级的依据,无法满足现代社会信用信息查询或者评估的需要。

发明内容

针对上述问题,本发明旨在提供一种基于机器学习的社会信用风险评估系统。

本发明的目的采用以下技术方案来实现:

提供一种基于机器学习的社会信用风险评估系统,包括:

样本数据模块,用于获取个人社会信用样本数据,其中样本数据包括个人基本信息以及个人信用信息;

统计模块,用于当样本数据模块中个人社会信用样本数据的数量大于设定的阈值时,获取本数据模块中的个人社会信用样本数据作为训练样本数据;

模型训练模块,用户将训练样本数据作为训练集输入到风险评估模型中进行模型训练,生成训练好的风险评估模型;

输入模块,用于获取目标个人的基本信息作为目标测试数据;

评估模块,用于调用模型训练模块中训练好的风险评估模型,将目标测试数据输入到该训练好的风险评估模型中,获取由风险评估模型输出的风险评估结果。

本发明的有益效果为:本发明风险评估系统,对获取的个人社会信用数据进行管理形成样本库,并且根据样本数据训练风险评估模型,并采用风险评估模型对目标对象进行风险评估,能够基于机器学习自动训练准确度高的风险评估模型用作目标对象的风险评估,为对目标对象的个人社会信用风险评估提供参考依据。

附图说明

利用附图对本发明作进一步说明,但附图中的实施例不构成对本发明的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。

图1为本发明的框架结构图。

附图标记:

样本数据模块100、统计模块200、模型训练模块300、输入模块400、评估模块500

具体实施方式

结合以下应用场景对本发明作进一步描述。

参见图1,其示出一种基于机器学习的社会信用风险评估系统,包括:

样本数据模块100,用于获取个人社会信用样本数据,其中样本数据包括个人基本信息以及个人信用信息;

统计模块200,用于当样本数据模块100中个人社会信用样本数据的数量大于设定的阈值时,获取本数据模块中的个人社会信用样本数据作为训练样本数据;

模型训练模块300,用户将训练样本数据作为训练集输入到风险评估模型中进行模型训练,生成训练好的风险评估模型;

输入模块400,用于获取目标个人的基本信息作为目标测试数据;

评估模块500,用于调用模型训练模块300中训练好的风险评估模型,将目标测试数据输入到该训练好的风险评估模型中,获取由风险评估模型输出的风险评估结果。

其中,个人基本信息包括:年龄、婚姻状况、籍贯、居住地、工作单位、历史守信事件、历史失信事件等;个人信用信息包括:信用评级等。

上述实施方式中,通过样本数据模块100对获取的个人社会信用数据进行管理形成样本库,通过模型训练模块300根据样本数据训练风险评估模型,评估模块500采用风险评估模型对目标对象进行风险评估,能够基于机器学习自动训练准确度高的风险评估模型用作目标对象的风险评估,为对目标对象的个人社会信用风险评估提供参考依据。

一种实施方式中,样本数据模块100还包括:

外接单元,用于从个人社会信用查询平台数据库中导入个人社会信用样本数据;和/或

录入单元,用于录入个人社会信用样本数据。

其中个人社会信用样本数据可以通过从外部公开的个人社会信用查询平台的数据库(或其他的个人社会信用数据开源数据库等)导入到本发明风险评估系统中,同时也可以在本发明风险评估系统中构建内部的数据库,通过录入的方式将个人社会信用样本数据录入到系统中。

一种实施方式中,统计模块200还包括:

对样本数据模块100中的个人社会信用样本数据进行数据清洗,消除个人社会信用样本数据中的无效数据,并将个人社会信用样本数据转变为符合训练样本数据的格式。

其中,针对从开源数据库中道路的人社会信用样本数据,由于导入的数据量可能十分庞大,容易存在错误的数据或者无用的数据,因此本发明系统设置统计模块200还用于对导入的人社会信用样本数据进行数据清洗等预处理,使得人社会信用样本数据变换成统一的训练样本数据格式,方便系统后续的调用和管理。

其中,样本数据中,包含的个人基本信息可以是类别属性的数据形式,如是否结婚、居住地所在地、历史失信事件类别等;也可以是数值属性的数据形式,如年龄、历史守信时间数量等。该数据格式能够满足风险评估模型训练的需要。

一种实施方式中,模型训练模块300能够采用现有的模型训练方法对风险评估模型进行训练。

另外,为了提高风险评估模型的性能,本发明还提出一种改进的模型训练技术方案,在一种实施方式中,模型训练模块300包括:

确定风险评估模型中采用的BP神经网络模型的拓扑结构,并将统计模块200获取训练样本数据作为训练集;

对粒子群进行初始化设置,包括:设定初始迭代次数t=0,、设定种群大小N、设定搜索空间维度d,设定训练最大迭代次数T,设定惯性权重ω的上下边界阈值,设定粒子的初始位置x

初始化每个粒子的最优历史位置x

其中粒子的优选值Q

式中,Q

其中当t=0时,x

迭代过程:更新当前迭代轮数t=t+1;

对每个粒子的位置和速度进行更新,其中采用的更新函数为:

v

x

式中,v

分别计算位置更新后每个粒子的优选值Q

判断当前迭代次数是否到达设定的最大迭代次数T,若否,则重复上述迭代过程进行新一轮的迭代;若是,则结束迭代过程,将当前种群最优位置p

上述实施方式中,提出了一种风险评估模型的训练技术方案,该方案中,在基于BP神经网络的模型训练技术方案中,特别对粒子的更新规则进行了改进,通过加入种群反面位置作为粒子在每一轮迭代过程中的影响因素以及提出了一种改进的控制因子设置方法,能够有助于刺激粒子打破局部最优解导致的束缚,提高了模型在训练过程中寻找最优解的性能。

一种实施方式中,输入模块400包括:

根据用户输入的目标个人信息从开源数据库中获取与该目标个人对应的基本信息,并将获取的目标个人基本信息作为目标测试数据。

在一种场景中,用户通过输入模块400输入目标个人的名字或者身份ID信息,根据该目标个人的姓名或者ID信息从内部数据库或者开源数据库中获取与该目标个人相应的基本信息,其中基本信息包括年龄、婚姻状况、籍贯、居住地、工作单位、历史守信事件、历史失信事件等;个人信用信息包括:信用评级等;并根据以上信息生成目标测试数据,其中目标测试数据符合风险评估模型输入数据的格式,上述每一项基本信息作为输入数据的一个特征参数。

一种实施方式中,评估模块500还包括:

显示风险评估结果。评估模块500输出风险评估模型输出的风险评估结果,其中风险评估结果包括评估的信用等级。

上述实施方式中,本发明风险评估系统能够自适应地从根据个人社会信用样本数据进行风险评估模型训练,并将最终训练好的风险评估模型对目标对象进行信用等级评估,能够有效地针对目标对象的基本情况,获取客观性强的信用评估结果,为有关部门或者用户针对目标对象的信用评级提供依据,同时也能够满足基于个人社会信用风险评估的各种需要。

需要说明的是,在本发明各个实施例中的各功能单元/模块可以集成在一个处理单元/模块中,也可以是各个单元/模块单独物理存在,也可以是两个或两个以上单元/模块集成在一个单元/模块中。上述集成的单元/模块既可以采用硬件的形式实现,也可以采用软件功能单元/模块的形式实现。

通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解应当理解,可以以硬件、软件、固件、中间件、代码或其任何恰当组合来实现这里描述的实施例。对于硬件实现,处理器可以在一个或多个下列单元中实现:专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、处理器、控制器、微控制器、微处理器、设计用于实现这里所描述功能的其他电子单元或其组合。对于软件实现,实施例的部分或全部流程可以通过计算机程序来指令相关的硬件来完成。实现时,可以将上述程序存储在计算机可读介质中或作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是计算机能够存取的任何可用介质。计算机可读介质可以包括但不限于RAM、ROM、EEPROM、CD-ROM或其他光盘存储、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质。

最后应当说明的是,以上实施例仅用以说明本发明的技术方案,而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细地说明,本领域的普通技术人员应当分析,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的实质和范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号