首页> 中国专利> 基于企业财资大数据的银行贷后风险预测方法和系统

基于企业财资大数据的银行贷后风险预测方法和系统

摘要

本发明公开了一种基于企业财资大数据的银行贷后风险预测方法和系统。本发明步骤如下:1、将第三方服务平台连接企业和银行,获得企业财资大数据的采集;同时银行和企业能够直接在第三方服务平台上传数据进行动态更新;2、数据处理;3、建模与预测,构建现金流预测模型,对可预测数据进行预测,具体采用岭回归模型对可预测数据累积同比增长率进行预测;4、将可预测的还款来源数据、不可预测的还款来源数据按照规则汇总形成未来某时间点的最大还款额度,即模拟还款账户金额,通过不断循环计算出当前至还款日之间的模拟还款账户金额分布。5、通过红绿灯显示企业的预警结果。本发明有助于银行更加低成本、高效率、高质量监控企业贷后风险。

著录项

  • 公开/公告号CN113327160A

    专利类型发明专利

  • 公开/公告日2021-08-31

    原文格式PDF

  • 申请/专利权人 浙江保融科技股份有限公司;

    申请/专利号CN202110495236.7

  • 发明设计人 包恩伟;葛佳飞;张一鸣;方汉林;

    申请日2021-05-07

  • 分类号G06Q40/02(20120101);G06N3/02(20060101);

  • 代理机构33240 杭州君度专利代理事务所(特殊普通合伙);

  • 代理人朱月芬

  • 地址 310013 浙江省杭州市余杭区仓前街道文一西路1500号3幢236室

  • 入库时间 2023-06-19 12:24:27

说明书

技术领域

本发明涉及金融和大数据领域,属于银行对公信用贷贷后风险预 测领域,具体涉及一种基于企业财资大数据的银行贷后风险预测方法 和系统。

背景技术

在银行业,对公信用贷贷后风险预测主要是通过定期线下追踪调 查借款人的执行借款合同情况、财务状况、经营情况,以及监测贷款 资金的用途等等,并结合银行自身的风控模型来进行预测。进一步分 析发现现有的银行对公贷后风险预测存在着以下两个问题:一、预测 用的数据比较局限。银行拥有的主要是企业经营相关、借款合同履行、 外部政府数据等粗颗粒度信息,以及从自身银行走的企业日常交易流 水,但是缺乏企业与多个银行的日常交易流水等实时数据,而这类来 自多银行的实时数据颗粒度更细且更全面,更能反映企业的还款能力; 二、人力成本投入大。银行需要投入大量人力定期检查企业的经营状 况、资信情况、贷款使用情况、借款合同履行情况和偿债能力变化情 况。

第三方技术供应商提供的银行对公信用贷贷后风险管理解决方 案主要集中在两方面:一方面是集成催收跟踪系统、呼叫中心、短信 平台等模块进行智能催收。上海言通推出的言小信AI贷后管理系统 从传统贷后呼叫向AI智能呼叫转型,实现一键呼叫/接听、快速检索 案件、催收统计等,其从优化催收方面来推动银行贷后管理高效,但 是没有大力提高贷后风险预测的能力,且没有涉及银行贷后风险监控 的真正痛点“更加动态、真实了解企业贷后风险”;另一方面是整合 更多外部数据进行风险预测。北京海致星图通过爬取政务等外部数据 来扩充银行贷后风险预测的数据源,并以知识图谱作为底层技术打造 风控模型来挖掘银行贷后风险,但是其数据来源仅限于银行现有数据 和能爬取的外部数据这类粗颗粒度数据,不能基于颗粒度更细的动态 实时现金流数据来预测风险,而且只是站在银行角度,没有站在让银 行、企业双赢的高度预测和发现信用贷贷后风险。

发明内容

本发明的目的是提供一种基于企业财资大数据的商业银行贷后 风险预测方法和系统,解决现有预测技术无法动态实时预测对公信用 贷贷后风险的问题。

为解决上述技术问题,本发明提供一种基于企业财资大数据的商 业银行贷后风险预测方法,具体技术方案如下:

步骤1、数据采集:

将第三方服务平台连接企业和银行,获得企业财资大数据的采集; 同时银行和企业能够直接在第三方服务平台上传数据进行动态更新;

步骤2、数据处理:

对采集到的数据进行数据清洗、数据转化,并将处理后的数据划 分为可预测数据和不可预测数据;

可预测数据包括主营收入、税、社保、工资、房租、水电费、排 污费这类刚性支出;不可预测数据包括:银行存款、可交易性金融资 产、商票、抵质押物评估价值、股东个人资产;

步骤3、建模与预测:

构建现金流预测模型,对可预测数据进行预测,具体采用岭回归 模型对可预测数据累积同比增长率进行预测;

步骤4、得出模拟还款账户金额分布:

将可预测的还款来源数据、不可预测的还款来源数据按照规则汇 总形成未来某时间点的最大还款额度,即模拟还款账户金额,通过不 断循环计算出当前至还款日之间的模拟还款账户金额分布;

步骤5、显示红绿灯:

以红绿灯显示企业的预警结果,包括第一类预警、第二类预警和 综合预警;红灯表示存在危机,黄灯表示继续观望,绿灯表示安全。

所述的第三方服务平台为数智化中小企业助贷服务平台,是本公 司研发的用于服务企业、链接企业和银行的数字化平台。

所述的第一类预警是对可预测还款来源中的单项指标预警;

所述的第二类预警是对模拟还款账户金额进行预警;

所述的综合预警基于第一类预警和第二类预警综合判断得出,一 家企业某次的综合判断就是看这个综合预警结果。

本发明还提供了一种基于企业实时现金流数据的商业银行贷后 风险预测系统,包括以下几个模块:

数据导入模块:用于导入需要采集的数据,实现数据的动态更新。

数据处理模块:用于对导入的数据进行处理直至生成可用于建模 的数据。

建模分析模块:结合移动平均、指数平滑、岭回归、ARIMA算法 建立现金流预测模型,从数据处理模块得出的数据集中筛选出可预测 数据,并对其进行预测。然后将预测值和不可预测数据按规则汇总得 出模拟还款账户,通过计算第一类预警结果、第二类预警结果,最终 得出企业的综合预警结果。

查询结果模块:用于查询企业的历史风险预警情况。

本发明有益效果如下:

本发明依托于数智化中小企业助贷服务平台,通过连接企业和银 行,获得颗粒度更细的企业财资大数据,通过处理、分析这些动态数 据,能够及时预测企业的还贷风险并给予预警,预警结果以银企共赢 为目的,供银行、企业双向跟踪使用。

相比银行传统依赖季报或年报,通过季度或半年度回访等形式进 行贷后风险防控,这种方法有助于银行降低监测成本,将滞后的季度 风险跟踪优化为几乎实时的风险预警,在响应政府号召推进普惠金融 服务中小企业的同时,提前了解企业的还贷风险减少坏账损失。并且 这种方法也有助于企业及时掌控自身风险,深入认识自身经营健康状 况,进而获得更多更优惠的银行贷款。更重要的是,它将银行和企业 实时链接到一起,共同维护企业信用状况和还贷能力,从而达到降低 风险、实现共赢的目的。

附图说明

图1为本发明方法流程图;

图2为本发明系统图。

具体实施方式

为使本发明的技术方案和优点更加清楚明白,以下结合简单实施 例,并参考附图对本发明的应用进行更加详细的描述,但不构成对本 发明的限制。

图1为本发明实施例所提供的一种基于企业实时现金流数据的 商业银行贷后风险预测方法流程图,技术方案如下:

步骤1、数据采集

通过数智化中小企业助贷服务平台连接企业和银行,银行和企业 直接上传数据;数智化中小企业助贷服务平台通过直接对接银行、企 业或者第三方的数据系统来实现数据的动态更新。

通过数智化中小企业助贷服务平台采集历史还款来源数据和宏 观经济数据;

所述的数智化中小企业助贷服务平台是本公司研发的用于服务 企业、链接企业和银行的数字化平台;用于获取还款来源数据和宏观 经济数据;

还款来源数据分为收入类和支出类。按转化为现金的置信度从高 到低排序,还款来源收入类数据包含三类:第一还款来源、第二还款 来源、第三还款来源。第一还款来源有银行存款、主营收入等,第二 还款来源有商票、其他抵质押物等,第三还款来源有股东借款等;还 款来源支出类数据包括必须的刚性支出,刚性支出包括税、社保、工 资、房租、水电费、排污费。

步骤2、数据处理

从历史还款来源数据中抽取出有价值的数据,并将抽取的数据划 分为可预测数据和不可预测数据;

所述的处理包括数据清洗、数据转化,具体如下:

首先对采集到的历史还款来源数据进行清洗。

所述的数据清洗主要包括无效值、缺失值和异常值的处理。其中: (1)无效值可能是由采集过程造成的,或者由于系统设置错误造成, 对于前者造成的无效数据一般会采用删除的处理,后者造成的无效数 据往往通过调整系统正确设置即可。例如:采集到的企业A还款来源 数据中出现时间格式错误,经查明是系统设置错误导致,通过系统调 整处理时间格式正常,时间这一无效数据变成了有效数据。(2)缺失 值是指在采集数据过程中因为种种原因没有能够获取到相关信息,造 成数据不全。对于缺失值的处理方法有很多,根据业务需要,可以采 用不同的方法。优选的,对于单元缺失数据(一条样本数据全都缺失) 进行直接删除的处理,对于项目缺失数据(一条样本记录了部分数据, 个别数据缺失)则进行人工插补法的处理。例如,因为突发情况影响, 出现了刚性支出的减免优惠政策,故2020年3月1日企业A当天没 有数据记录,属于单元缺失数据,因此将该日期的样本整条删除;随着突发情况的控制好转,企业A在2020年6月12日当天有主营收入、 刚性支出(包括税、社保、工资、房租、水电费、排污费)、商票、 抵质押物数据等,但是缺少银行存款数据,属于项目缺失数据,考虑 到企业银行存款短期内变化小的先验认识,采用人工插补法,将已有 的最新银行存款数据填入。(3)异常值也就是离群点,当异常值存在 时,会严重影响数据分析的结果,使平均值明显偏高或者偏低等等。 异常值的检测和处理也有较多常用方法,优选的,选用箱线图进行异 常值检测,异常值的处理则根据异常值是、否为错误数据,分别采用删除、保留的方法。例如:企业A是一家非医药医疗相关行业,在 2020年第二季度的银行存款是历史最低,而且通过箱线图检测,该 最低值在近十年表现为异常点,通过行情了解和突发情况感知,分析 得出在这个季度该数据表现正常,而非错误数据,故保留这个异常值。

接着进行数据转化,数据转化是将一种表现形式变为另一种表现 形式,主要包括数据的代数运算、数据的标准化等。其中,(1)数据 的代数运算,通过对数据进行相应的计算转换,使数据转变为更适合 分析的形式,也可以构建新的变量。例如:企业A的每日流水可以看 到每天的主营收入,记为DMI,在分析主营收入时一般会比较每个月 (记为MMI)或者每个季度的主营收入(记为SMI)情况,因此,可 以通过数据转化分别生成月度和季度数据这类更适合分析的形式。

步骤3、建模与预测

结合移动平均、岭回归、ARIMA等算法建立可预测数据的预测模 型,对其进行预测。可预测数据包括主营收入,以及税、社保、工资、 房租、水电费、排污费这类刚性支出等。大致流程如下:

步骤(1):选择分解模型。将原时间序列预测模型分解为趋势、 季节和不规则变动的乘法模型。

步骤(2):构建岭回归趋势模型。

在时间序列中,趋势通常采用以时间为自变量的线性回归、指数 方程或者高阶方程进行预测。但这种方法未能反映现金流时间序列变 动背后的环境因素,同时新加入平台的企业数据量较少,这些都影响 了预测的效果。

为了解决这个问题,一方面补充额外的信息来反映外部环境状况, 这里我们选择使用GDP年度增长率、M2年度增长率、房价年度涨幅、 CPI年度涨幅4个指标。另一方面用同行业总体增长率作为因变量, 用行业数据代替单家企业数据来解决单家企业存在时间短数据量少 的问题。

以GDP年度增长率、M2年度增长率、房价年度涨幅、CPI年度涨 幅为自变量,以同行业累计同比增长率为因变量建立岭回归模型。

步骤(3):趋势模型求解。用交叉验证法找到岭回归模型的最佳 参数,求解岭回归模型。

步骤(4):同行业累计同比增长率预测。将GDP年度增长率、M2 年度增长率、房价年度涨幅、CPI年度涨幅的最新预测值代入模型, 求得同行业累计同比增长率。(预测数据通过平台按顺序获取国家统 计局、IMF、Wordbank预测信息,如果未能获取到预测值则采用移动 平均法进行预测。)

步骤(5):采用指数平滑法预测单家企业增长率与行业增长率的 比值,根据步骤(4)的结果预测目标企业水电费增长率。

步骤(6):基于历史数据,将累计同比增长率预测值转化为对本 期的预测值。

步骤(7):构造新序列。在原时间序列中分离趋势项和季节项, 形成新的时间序列。分离方法为原时间序列除以对应时间的本期预测 值和季节指数。

上述的季节指数采用如下方法获得:以月度频率为例,计算所有 月的平均值Y0,计算所有1月的平均值Y1,所有2月的平均值Y2... 如果Y1/Y0,Y2/Y0...都属于(0.9,1.1),认为同年每个月之间的差 异不大,也就是没有明显的季节性。如果Y1/Y0大于1,说明每年1月份的数值经常高于当年平均水平,那么把每年1月的数值除以 (Y1/Y0),作为修正后的每年1月数值,称Y1/Y0为1月的季节指数。 其他月的季节指数同样计算。

步骤(8):对步骤(7)产生的序列进行平稳性检验,若未通过,说 明序列非平稳,需要进行差分运算再进行步骤(8)的平稳性检验,一 般最多进行2次差分就能得到平稳序列;若通过平稳性检验,说明序 列是平稳的,继续下一步骤。

步骤(9):对平稳序列进行白噪声检验,若通过,说明序列是白 噪声的,序列值之间不存在显著的相关关系,这类平稳白噪声数据受 突发事件影响大,难以预测,直接跳到步骤(14);若未通过,说明序 列是平稳非白噪声的,继续下一步骤。

步骤(10):计算自相关系数(记为ACF)、偏自相关系数(记为PACF)的值,进行阶数估计和模型选择。

步骤(11):估计模型中所有参数的值。

步骤(12):模型检验,包括模型的显著性检验和模型参数的显著 性检验。若未通过,则退回到步骤(10)进行模型的重新筛选。若通过, 说明模型有效,继续进行下一步骤。

步骤(13):模型优化,当得出多个模型时,选择按照AIC和BIC 都小的,作为平稳非白噪声序列的最佳模型,预测下一期水电费。

步骤(14):对于平稳非白噪声数据,将季节指数与步骤(6)、(13) 得出的预测值相乘,得出时间序列的最终预测。

步骤4、得出模拟还款账户金额分布

将合适的可预测还款来源数据代入最佳预测模型,计算出未来某 时间点这些还款来源的预测值,然后将还款来源预测值、不可预测还 款来源数据按照规则汇总形成未来某时间点的最大还款额度,即模拟 还款账户金额,通过不断循环前述过程计算出当前至还款日之间的模 拟还款账户分布,即:横轴为时间点,纵轴为模拟还款账户额度。

所述的合适的可预测还款来源数据指的是模型中作为自变量的 那些滞后的可预测还款来源数据项。

所述的规则是指计算模拟还款账户额度的计算公式,主要基于以 下几点考虑得出:

·不同还款来源类型的变现能力、可靠度不同,即每个还款来 源对应的权重会有差异;

·还银行信贷资金的优先级仅次于刚性支出,故模拟还款账户 公式围绕“可还款资产-刚性支出”展开;

所述的可还款资产指的是目前拥有的资产(即:采集到的不可预 测数据)按照设定的折扣加权后再加上到未来某时间点期间的主营收 入预测值的总和,其中不可预测数据可以包括:银行存款、可交易性 金融资产、剩余可用授信额度、信用证、商票、抵质押物预测价值、 股东个人资产、股东借款能力,假设这些最新数据为向量X

所述的刚性支出包括税、社保、工资、房租、水电费、排污费六 项,假设这六项历史数据在未来时间点t的预测模型分别为Pay

因此,模拟还款账户在t时刻金额的计算公式如下:

然后不断循环,求出还款到期日前不同时间点的模拟还款账户金 额,即:模拟还款账户金额分布,并以图的形式展现。

步骤5、显示红绿灯

以红绿灯显示企业的预警结果,包括第一类预警、第二类预警和 综合预警。红灯表示存在危机,黄灯表示可以继续观望,绿灯表示安 全。

所述的第一类预警是对可预测还款来源中的单项指标预警,主要 通过单项指标预测值变动率与设定阈值的比较得出。具体包括:

假设:Income(t)为未来t时刻的主营收入预测值,Pay

主营收入变动率:

税的变动率:

社保的变动率:

工资的变动率:

房租的变动率:

水电费的变动率:

排污费的变动率:

当主营收入变动率

当主营收入变动率

当主营收入变动率

税、社保、工资、房租、水电费、排污费这六项刚性支出通过变 动率与同时间段主营收入变动率的大小比较来判断红绿灯的规则相 似,以房租为例:

所述的第二类预警是对模拟还款账户金额进行预警,主要通过损 失函数来实现。具体包括:

首先假设:M

当S

所述的综合预警就是基于第一类预警和第二类预警综合判断得 出。具体判断规则如下:

当第二类预警为红灯时,综合预警显示红灯,说明企业的还款能 力严重不足,很可能还不起贷款,需要进行提醒或者深入调查。

当第二类预警为黄灯时:若第一类预警中主营收入单项指标为红 灯,综合预警显示红灯,说明企业的还款能力严重不足,很可能还不 起贷款,需要进行提醒或者深入调查;否则,综合预警显示黄灯,说 明企业经营有些问题,但不至于还不清贷款,可以列入继续观望的名 单中。

当第二类预警为绿灯时:若第一类预警中主营收入单项指标为红 灯或者六项刚性指标中有3项及以上为红灯时,综合预警显示黄灯, 说明企业经营有些问题,但偿债能力尚可,可以列入继续观望的名单 中;否则,综合预警显示绿灯,说明企业安全,企业经营和偿债能力 都好。

请参考图2,图2为本发明实施例所提供的一种基于企业实时现 金流数据的商业银行贷后风险预测系统模块,涉及:

数据导入模块,主要包括:

自动更新数据单元,一键导入或者自动导入历史还款来源数据, 这类数据可以通过系统连接实现自动更新,也可以在不确定是否导入 最新数据的情况下按一键导入实现数据自动更新,并会显示数据更新 时间;

手动更新数据单元,对于需要手动上传的数据,银行或者企业按 照模板上传即可,也会显示数据更新时间。

数据处理模块,主要包括:

数据清洗单元,将所有历史数据(包括可预测数据和不可预测数 据)进行无效值、缺失值和异常值的处理,以保证数据的可靠性和完 整性。

数据转化单元,主要包括代数运算和标准化,其中代数运算主要 看分析的时间间隔,比如实时动态的数据需要转化成日、月或者季度 值;将数据清洗和代数运算结束后形成的数据集1进行保存,然后对 数据集1进行最小最大值方法的标准化处理形成数据集2并进行保存。

建模分析模块,主要包括:

数据筛选单元,从处理后的数据集1、数据集2中分别筛选出可 预测还款来源数据,例如:主营收入、税、社保、工资、房租、水电 费和排污费等,将筛选后的数据集分别命名为时间序列数据集、神经 网络数据集。

分析单元,主要显示此次分析的预警结果,包括第一类预警、第 二类预警和综合预警。此外,每次新的结果出来后也会主动提醒银行 和企业。

查询结果模块,主要包括:

单次结果查询单元,按照分析的时间查询某次分析结果,含综合 预警结果,是安全企业、继续观望、给予提醒或者深入调查,后面接 着是两个细项,包括第一类预警结果和第二类预警结果。

企业独家查询单元,以图表形式呈现某家企业的历史分析结果, 例如,横轴表示分析时间,纵轴表示综合预警结果的灯颜色,来呈现 历次整体判断结果。

银行独家查询单元,选择贷款银行后,会直接罗列该银行每家企 业客户最新的综合预警结果,并在边上加“了解详情”的按钮。

实施例1:

以企业A为例,首先通过数智化中小企业助贷服务平台采集历史 还款来源数据、宏观经济数据以及银行融资数据,企业A于10月28 日融入资金760万元,期限1年,12月31日余额441万元,现对其 还款能力进行预测,对过程中可能的风险进行跟进。

该企业的还款来源数据包括第一还款来源的银行存款和主营收 入等,第二还款来源的电子设备和实控人房屋等;还款来源支出类数 据——刚性支出,刚性支出包括税、社保、工资、房租、水电费。

步骤2、数据处理;

从历史还款来源数据中抽取出有价值的数据,计算刚性支出,并 将抽取的数据划分为可预测数据以及不可预测数据,可预测数据包括 主营收入、刚性支出,其中公司电子设备和实控人房屋830万元。

步骤3、建模与预测;

根据预测模型预测企业A下一年度1-12月主营收入分别为 172.69万元、178.02万元、372.30万元、489.02万元、278.01万 元、485.92万元、650.47万元、363.23万元、581.48万元、481.52 万元、864.12万元、2095.05万元(Income(i));刚性支出分别为194.30 万元、374.06万元、175.71万元、167.40万元、249.57万元、253.63 万元、281.69万元、278.34万元、272.34万元、295.73万元、283.53 万元、503.56万元(Pay(i))。

步骤4、得出模拟还款账户金额分布;

步骤5、显示红绿灯;

以红绿灯显示企业的预警结果,包括第一类预警、第二类预警和 综合预警。红灯表示存在危机,黄灯表示可以继续观望,绿灯表示安 全。

所述的第一类预警是对可预测还款来源中的单项指标预警,主要 通过单项指标预测值变动率与设定阈值的比较得出。具体包括:

假设:Income(t)为未来t时刻的主营收入预测值,Pay

主营收入变动率:13.24%、68.74%、40.50%、137.14%、2.35%、 37.61%、72.72%、147.95%、24.06%、92.34%、23.28%、90.01%,5 月黄灯,其他绿灯。

税的变动率:14.18%、681.84%、233.32%、-5.77%、124.30%、 143.02%、12.27%、221.77%、-644.07%、89.27%、-4571.94%、100.15%, 1、8、12月黄灯,2、3、5、6月红灯,4、7、9、10、11月绿灯。

社保工资的变动率:46.16%、8.45%、30.41%、37.46%、85.81%、 53.72%、67.66%、83.77%、59.04%、74.51%、65.89%、115.08%,1、 5、6、9、11、12月黄灯,2、3、4、7、8、10月绿灯。

房租水电费的变动率:12.71%、-35.04%、1214.64%、255.95%、 -64.74%、153.92%、-60.69%、80.25%、17.89%、85.62%、-62.40%、 154.30%,1、2、5、7、9、10、11月绿灯,3、4、6月红灯,8、12 月黄灯。

税、社保工资、房租水电费这六项刚性支出通过变动率与同时间 段主营收入变动率的大小比较来判断红绿灯的规则相似,以房租为例:

所述的第二类预警是对模拟还款账户金额进行预警,主要通过损 失函数来实现。具体包括:

首先假设:M

目前企业A银行欠款760万元,1-12月的模拟还款账户金额分 别为1000.2、804.16、1000.75、1322.37、1350.81、1583.1、1951.88、 2036.77、2345.91、2531.7、3112.29、4703.78万元。

S

当第二类预警为绿灯时:若第一类预警中主营收入单项指标为红 灯或者六项刚性指标中有3项及以上为红灯时,综合预警显示黄灯, 说明企业经营有些问题,但偿债能力尚可,可以列入继续观望的名单 中;否则,综合预警显示绿灯,说明企业安全,企业经营和偿债能力 都好。

综上,1-12月,第二类预警为绿灯,除6月税收和房租水电费 为红灯,综合为黄灯,需要给予适当关注外,总体还款能力较强。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号