首页> 中国专利> 一种证券融资融券和资管目标客户的挖掘方法

一种证券融资融券和资管目标客户的挖掘方法

摘要

本发明公开了一种证券融资融券和资管目标客户的挖掘方法,分析数据库中交易数据;对证券融资融券目标客户和资管目标客户分别构建训练集和测试集;对证券融资融券目标客户和资管目标客户分别构造因变量因子、基本因子和总衍生因子;利用随机森林算法分别对证券融资融券目标客户和资管目标客户建立预测模型;分别对证券融资融券目标客户和资管目标客户进行测试并分析测试结果。本发明从数据库中抽取并分析用户相关属性,建立随机森林模型,克服了传统预测方式的效率低下,成功率不高的问题,提高了模型预测的准确度,能够有效的挖掘出融资融券业务和资管目标客户,提高了精准销售的准确性和营销效率。

著录项

  • 公开/公告号CN105761112A

    专利类型发明专利

  • 公开/公告日2016-07-13

    原文格式PDF

  • 申请/专利权人 国元证券股份有限公司;

    申请/专利号CN201610100067.1

  • 申请日2016-02-23

  • 分类号G06Q30/02;G06Q40/04;

  • 代理机构合肥市浩智运专利代理事务所(普通合伙);

  • 代理人王林

  • 地址 230000 安徽省合肥市蜀山区梅山路18号

  • 入库时间 2023-06-19 00:06:42

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-02-28

    未缴年费专利权终止 IPC(主分类):G06F17/30 专利号:ZL2016101000671 申请日:20160223 授权公告日:20170308

    专利权的终止

  • 2017-03-08

    授权

    授权

  • 2016-08-10

    实质审查的生效 IPC(主分类):G06Q30/02 申请日:20160223

    实质审查的生效

  • 2016-07-13

    公开

    公开

说明书

技术领域

本发明涉及一种用于证券分析的统计建模方法,尤其涉及的是一种证券融资融券和资管 目标客户的挖掘方法。

背景技术

近年来,国内融资融券业务发展迅猛、各类资管产品的种类和数量飞速增长,各个证券 公司都希望通过推广融资融券业务和增加资管产品的销售来提高公司的盈利能力。融资融券 业务是指证券公司向客户出借资金供其买入证券或出具证券供其卖出证券的业务。由融资融 券业务产生的证券交易称为融资融券交易。融资融券交易分为融资交易和融券交易两类,客 户向证券公司借资金买证券叫融资交易,客户向证券公司卖出为融券交易。资管产品是获得 监管机构批准的公募基金管理公司或证券公司,向特定客户募集资金或者接受特定客户财产 委托担任资产管理人,由托管机构担任资产托管人,为资产委托人的利益,运用委托财产进 行投资的一种标准化金融产品。

如何能够有效挖掘出券商的存量客户中有意向开通融资融券业务和购买资管产品的潜在 客户已经成为了众多证券公司营销的主要目标之一。市场竞争激烈,应当尽量降低客户流失 率。目前,大多数证券公司仍然采用硬性的标准来对客户进行筛选、宣传和营销,即当前已 满足开通融资融券业务和购买资管产品资质要求的客户成为营销和推广的主要目标,这种方 式不仅耗费较多人力物力,而且成功率不高。因此,使用新的技术方法和模型去对潜在客户 进行分析和预测进而有针对性地营销有着重要的意义:节省营销成本,提升营销效率,满足 客户的需求。

发明内容

本发明的目的在于克服现有技术的不足,提供了一种证券融资融券和资管目标客户的挖 掘方法,能够有针对性的找出真正具有意向开通或者购买的客户。

本发明是通过以下技术方案实现的,本发明包括以下步骤:

(1)分析数据库中交易数据;

(2)对证券融资融券目标客户和资管目标客户分别构建训练集和测试集;

(3)对证券融资融券目标客户和资管目标客户分别构造因变量因子、基本因子和总衍生 因子;

(4)利用随机森林算法分别对证券融资融券目标客户和资管目标客户建立预测模型;

(5)分别对证券融资融券目标客户和资管目标客户进行测试并分析测试结果。

作为本发明的优选方式之一,所述步骤(1)中,交易数据包括综合状况、客户信息、客 户服务、含信用信息的交割明细流水、资金明细流水及委托明细流水。

所述证券融资融券目标客户建立预测模型的方法包括以下步骤:

(401)选取T1日之后已开通双融的客户,然后选取T2日满足开通双融条件但一直未开 通的客户,将选取的全部客户混合后再随机分成两类,分别作为训练集和测试集:

(402)将客户是否开通融资融券业务设定为因变量Y,开通则Y=1,未开通则Y=0;

(403)将所述基本因子和所述总衍生因子之和加上额外一个属性变量因子设为自变量X;

(404)利用随机森林算法建立预测模型;

(405)用训练集和测试集分别对预测模型进行测试,并计算建模指标,所述建模指标包 括精度和非平衡度。

所述额外一个属性变量因子为风险特征,所述风险特征为客户是否购买过资管产品,购 买过为1,未购买为0;

所述精度为预测正确的因变量Y=1的开通双融客户数与预测因变量Y=1的客户数的比例;

所述非平衡度为真正开通双融的客户数与总客户数之比。

所述基本因子包括平均持仓时间、换手率、日均资金余额占比、资金存取倍数、双向交 易天数;

所述总衍生因子为所述基本因子与所述基本因子的衍生因子之和;

所述基本因子的衍生因子包括准备开通双融日前三个时间段的所述基本因子的均值和T2日前三个时间段的所述基本因子的均值;

所述准备开通双融日为已开通双融业务客户的开通双融业务日前第A0个交易日;

所述前三个时间段包括前A1个交易日,前A1~A2个交易日以及前A2~A3个交易日,A3>A2>A1

所述平均持仓时间=股票市值/股票成交金额;

所述换手率=成交金额/账户资产;

所述日均资金余额占比=账户金额/账户资产;

所述资金存取倍数=资金存取额/账户资产;

所述双向交易天数=存在双向交易的总天数。

所述资管目标客户建立预测模型的方法包括以下步骤:

(411)选取已经购买过资管产品的全部客户,然后选取T2日前历史资产峰值大于一定阈 值的客户,将选取的全部客户混合后再随机分成两类,分别作为训练集和测试集;

(412)将客户是否购买过资管产品设为因变量Y,购买过则Y=1,未购买则Y=0;

(413)将所述基本因子和所述衍生因子的之和加上额外两个属性变量因子设为自变量X;

(414)利用随机森林算法建立预测模型。

(415)用训练集和测试集分别对模型进行测试,并计算建模指标,包括精度和非平衡度。

所述额外两个属性变量因子为风险特征和基金特征;

所述风险特征为客户是否开通双融业务,开通即为1,未开通为0;

所述基金特征为客户是否购买设定证券公司之外的基金产品,购买过为1,未购买为0;

所述精度为预测正确的因变量Y=1的购买资管产品客户数与预测因变量Y=1的潜在客户 数之比;

所述非平衡度为真正购买资管产品客户数的客户数与总客户数之比。

所述基本因子包括为平均持仓时间、换手率、日均资金余额占比、资金存取倍数、双向 交易天数;

所述总衍生因子为所述基本因子与所述基本因子的衍生因子之和;

所述基本因子的衍生因子包括准备购买日前三个时间段的所述基本因子的均值和T2日前 三个时间段的所述基本因子的均值;

所述准备购买日为已购买资管产品客户的购买日前第A00个交易日;

所述前三个时间段包括前A1个交易日,前A1~A2个交易日以及前A2~A3个交易日,A3>A2>A1

所述随机森林算法是利用多棵决策树对样本进行训练并预测,随机森林算法中,当输入 新测试样本时,每一棵树均给出一个预测结果,将所有t棵树得出预测结果为0或1的数量 分别相加,其中预测结果为1的概率为p1,预测结果为0的概率p0,若p1>p0,则给出预测 结果:该客户是潜在开通双融业务的客户,或者是潜在购买资管产品的客户。

本发明相比现有技术具有以下优点:本发明从数据库中抽取分析用户相关属性,建立随 机森林模型,克服了传统预测方式的效率低下,成功率不高的问题,提高了模型预测的准确 度,能够有效的挖掘出融资融券业务和资管目标客户,提高了精准销售的准确性和营销效率。

附图说明

图1是本发明的流程图。

具体实施方式

下面对本发明的实施例作详细说明,本实施例在以本发明技术方案为前提下进行实施, 给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。

如图1所示,本实施例的建模语言为R和Python。

本实施例包括以下步骤:(1)分析数据库中交易数据;交易数据包括综合状况、客户信 息、客户服务、含信用信息的交割明细流水、资金明细流水及委托明细流水。

满足资管产品购买条件的客户,同样可能满足开通融资融券账户的条件,因此该客户可 能同时是融资融券和资管产品的目标客户。

(2)对证券融资融券目标客户和资管目标客户分别构建训练集和测试集;

(3)对证券融资融券目标客户和资管目标客户分别构造因变量因子、基本因子和总衍生 因子;

(4)利用随机森林算法分别对证券融资融券目标客户和资管目标客户建立预测模型;

(5)分别对证券融资融券目标客户和资管目标客户进行测试并分析测试结果。

所述证券融资融券目标客户建立预测模型的方法包括以下步骤:

(401)选取T1日之后已开通双融的客户,然后选取T2日满足开通双融条件但一直未开 通的客户,将选取的全部客户混合后再随机分成两类,分别作为训练集和测试集:

(402)将客户是否开通融资融券业务设定为因变量Y,开通则Y=1,未开通则Y=0,如 果最后模型算出某一个客户对应的Y=1,则判断为目标客户,如果为Y=0则模型判断为不是 目标客户;

(403)将所述基本因子和所述总衍生因子之和加上额外一个属性变量因子设为自变量X;

(404)利用随机森林算法建立预测模型;

(405)用训练集和测试集分别对预测模型进行测试,并计算建模指标,所述建模指标包 括精度和非平衡度。

所述额外一个属性变量因子为风险特征,所述风险特征为客户是否购买过资管产品,购 买过为1,未购买为0;

所述精度为预测正确的因变量Y=1的开通双融客户数与预测因变量Y=1的客户数的比例;

所述非平衡度为真正开通双融的客户数与总客户数之比。

所述基本因子包括平均持仓时间、换手率、日均资金余额占比、资金存取倍数、双向交 易天数;

所述总衍生因子为所述基本因子与所述基本因子的衍生因子之和;

所述基本因子的衍生因子包括准备开通双融日前三个时间段的所述基本因子的均值和T2日前三个时间段的所述基本因子的均值;

所述基本因子的衍生因子包括准备开通双融日前三个时间段的所述基本因子的均值和T2日前三个时间段的所述基本因子的均值;

所述准备开通双融日为已开通双融业务客户的开通双融业务日前第40个交易日;

所述前三个时间段包括前20个交易日,前20~60个交易日以及前60~120个交易日。

本实施例中T1取2013年3月30日,T2取2016年1月5日,并可根据需要改变T1和T2以使得预测结果更准确、更具有时效性。在选取了2013年3月30日之后开通融资融券的客 户后,为了方便进行建模处理,故将其开通日期对齐。

本实施例中,证券融资融券目标客户的平均持仓时间=股票市值/股票成交金额;

所述换手率=成交金额/账户资产;

所述日均资金余额占比=账户金额/账户资产;

所述资金存取倍数=资金存取额/账户资产;

所述双向交易天数=存在双向交易的总天数。

本实施例中通过基本因子、账户种类和时间段相结合的方法,可以在任意时间点构造多 个总衍生因子,其中五大基本因子的解释如下:

本实施例中将上述5个基本因子与三个时间段进行乘积,则共有5*3=15个衍生因子,同 时将原来5个基本因子也作为衍生因子,一共得到20个总衍生因子作为备选自变量。

本实施例中随机森林的算法是通过R语言中的随机森林程序包实现的,随机森林算法可 以给出模型自变量的重要程度,重要程度是反应自变量对因变量分类的影响程度。本实施例 证券融资融券预测模型在非平衡度为23.4%的测试样本集合上预测精度达到84%。并用某券商 的一家营业部的历史数据进行检验,该营业部客户样本非平衡度为35.8%,模型预测精确度 达到了92%。

本实施例的资管目标客户建立预测模型的方法包括以下步骤:

(411)选取已经购买过资管产品的全部客户,然后选取T2日前历史资产峰值大于一定阈 值的客户,将选取的全部客户混合后再随机分成两类,分别作为训练集和测试集;

(412)将客户是否购买过资管产品设为因变量Y,购买过则Y=1,未购买则Y=0;

(413)将所述基本因子和所述衍生因子的之和加上额外两个属性变量因子设为自变量X;

(414)利用随机森林算法建立预测模型。

(415)用训练集和测试集分别对模型进行测试,并计算建模指标,包括精度和非平衡度。

所述额外两个属性变量因子为风险特征和基金特征;

所述风险特征为客户是否开通双融业务,开通即为1,未开通为0;

所述基金特征为客户是否购买设定证券公司之外的基金产品,购买过为1,未购买为0;

所述精度为预测正确的因变量Y=1的购买资管产品客户数与预测因变量Y=1的潜在客户 数之比;

所述非平衡度为真正购买资管产品客户数的客户数与总客户数之比。

所述基本因子包括为平均持仓时间、换手率、日均资金余额占比、资金存取倍数、双向 交易天数;

所述总衍生因子为所述基本因子与所述基本因子的衍生因子之和;

所述基本因子的衍生因子包括准备购买日前三个时间段的所述基本因子的均值和T2日前 三个时间段的所述基本因子的均值;

所述准备购买日为已购买资管产品客户的购买日前第10个交易日;

所述前三个时间段包括前20个交易日,前20~60个交易日以及前60~120个交易日。

本实施例资管目标客户预测模型在非平衡度为6.62%的测试样本集合上预测精度达到 83.45%。此外,对于训练集和测试集的所有客户,利用交叉验证的方法多次建立随机森林模 型,同样用某券商另一家营业部的历史数据进行检验,该营业部客户样本非平衡度为3.46%, 模型预测精确度达到了92.7%。

随机森林算法中,当输入新测试样本时,每一棵树均给出一个预测结果,将所有t棵树 得出预测结果为0或1的数量分别相加,其中预测结果为1的概率为p1,预测结果为0的概 率p0,若p1>p0,则给出预测结果:该客户是潜在开通双融业务的客户,或者是潜在购买资 管产品的客户。

相对其他传统统计学和数据挖掘方法,随机森林算法能有效地处理大数据集,容噪性较 好且算法健壮。由于证券行业的数据具有海量且随时间递增的特点,因此,随机森林算法十 分适用于证券行业的各种应用。目前,绝大多数证券公司都仍在使用传统方式进行潜在客户 挖掘。很多证券公司的融资融券部仍然采用传统的方法,如按资产条件筛选、电话回访、面 对面沟通和问卷调查等方式对去发掘潜有意向开通融资融券业务的客户。无论是从精度还是 效率方面,本发明的方法相对于传统的潜在客户挖掘方法都有着明显的优势,并且是证券行 业中在这一方面的领跑者,将新的科学技术方法用到了证券潜在目标客户挖掘方面,一定程 度上为行业带来了新的科学方法和技术进步。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原 则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号