首页> 中国专利> 一种针对大宗商品内幕交易行为的自适应检测方法与系统

一种针对大宗商品内幕交易行为的自适应检测方法与系统

摘要

本发明公开了一种针对大宗商品内幕交易行为的自适应检测方法与系统,该系统提取出交易用户的历史交易行为数据,使用多个交易指标进行刻画,通过时间序列异常检测方法识别交易指标当中的异常子序列来判断异常的时间区间。在在进行时间序列异常检测时,将时间序列划分为待检测集合和已检测集合,在迭代过程中每次选取最有可能发生内幕交易的时间区间,然后自适应地将时间序列划分为需要检测的时间区间并进行检测,通过自监督学习的方法衡量每个时间区间的交易行为的相似性,对检测的时间区间给出异常程度。基于此内幕交易行为的自适应检测方法与系统,帮助监管部门更好地对市场进行监管,维护交易市场的稳定和公平。

著录项

  • 公开/公告号CN114897610A

    专利类型发明专利

  • 公开/公告日2022-08-12

    原文格式PDF

  • 申请/专利权人 东南大学;

    申请/专利号CN202210512595.3

  • 发明设计人 蒋嶷川;陶汉思;狄凯;

    申请日2022-05-12

  • 分类号G06Q40/04(2012.01);G06Q40/06(2012.01);G06K9/62(2022.01);

  • 代理机构南京众联专利代理有限公司 32206;

  • 代理人周蔚然

  • 地址 210096 江苏省南京市玄武区四牌楼2号

  • 入库时间 2023-06-19 16:22:17

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-08-30

    实质审查的生效 IPC(主分类):G06Q40/04 专利申请号:2022105125953 申请日:20220512

    实质审查的生效

说明书

技术领域

本发明属于大宗商品电子商务监管技术领域,具体涉及一种针对大宗商品内幕交易行为的自适应检测方法与系统。

背景技术

伴随着信息技术的发展,大宗商品电子交易市场的发展日益迅速。它通过电子交易系统为生产者,销售者以及大宗商品交易提供相关的电子交易,融资,结算,交收和价格预测等一体化服务,促进了大宗商品交易市场的商品流通。在大宗商品电子的交易过程中,有存在内幕交易风险的可能。例如某些金融机构或者监管部门的工作人员因地位或者职务上的便利而能够知悉普通外部投资者无法知道的内幕信息,通过内幕信息它们能够为自己或者他人进行相应的交易行为从而来谋取利益。而由于交易行为众多,内幕交易行为隐藏在其中,因此通过系统算法帮助监管人员挖掘出可能发生内幕交易行为的时间区间是十分重要的。

当内幕交易行为发生时,由于内幕信息仅仅对某些商品产生价格上的影响,因此内幕交易人员为了谋求利益,会依据该内幕信息对某些特定的商品进行买卖,来为自己谋取额外的利益。这种买卖行为区别于其正常的买卖行为,通常会在短时间内对某种特定的商品投入大量的资金,从而获得比平常更高的收益。因此系统基于交易用户的交易数据分析其是否存在异常交易行为模式,来判断是否为内幕交易行为。所以将交易行为转化为多个交易指标,再识别指标当中的异常子序列来判断异常的时间区间。

时间序列异常检是指从时间序列中找出某些连续子序列区别于其他大部分子序列,对应到内幕交易行为检测方法与系统中,异常的子序列代表了发生内幕交易行为的区间,大部分子序列代表了发生正常交易行为的区间。使用自监督学习的方法通过衡量不同子序列之间的相似程度,判断是否某些子序列与其他子序列不同,识别出可能的异常序列。由于要将内幕交易发生的时间区间只占所有交易发生的时间区间的一部分,所以系统将监管的时间区间划分成若干个子区间,而如果划分较小的时间区间,由于交易行为众多,数据规模大时,需要耗费大量的时间进行检测。而如果划分为较大的时间区间,虽然能够较快地检测出可能发生的内幕交易行为时间区间,但由于给出的时间区间大,监管人员需要耗费大量的时间来排查该时间区间内的交易行为,因此削减了监管效果。

发明内容

为解决上述问题,本发明公开了一种针对大宗商品内幕交易行为的自适应检测方法与系统,能够根据交易时间区间的长度调整检测的时间区间,从而通过交易指标的计算和异常子序列的发现给出内幕交易检测的结果,帮助监管人员更好地监管内幕交易行为。

为达到上述目的,本发明的技术方案如下:

一种针对大宗商品内幕交易行为的自适应检测方法与系统,具体技术方案如下:

系统初始化后,对于给定的监管范围,从数据库取出需要监管的交易人员在需要监管的时间区间中的交易行为数据,加入到待检测集合S当中。然后从待检测集合当中,选取异常程度最大情况下,最短的时间区间。从而保证每次检测尽可能选择有可能发生内幕交易行为的时间区间,而选择尽可能短的时间区间能够保证更快地给出有可能发生内幕交易的时间区间。在选择出检测的时间区间后,会将该时间区间分成N个时间区间,由于需要保证分割后的时间区间长度为整数,因此取分割后的区间长度为

系统通过分析时间区间内的交易行为数据,可以得到多种交易指标,系统使用了资金投入增加率,投资资金集中度,交易频率和投资回报率四种指标来代表该时间区间内的交易行为的交易特征。它们分别对应了当内幕交易行为发生时,内幕交易人员可能投入大量的资金,将大量资金集中于某一种商品,频繁的交易以获得大量的收益行为。由于内幕交易过程可能横跨分割的时间区间,因此使用序列异常检测方法用于内幕交易场景下的异常检测。通过自监督学习的方法,计算子序列与其他相似子序列的k-distance来横量子序列的异常值。

由于交易用户的交易行为模式中,内幕交易行为模式与正常的交易行为模式不同,而交易指标构成的序列与正常指标所构成的序列越不相则,则该子序列异常值越大。在得到每个子序列的异常值后。会对每个子序列判断是否满足区间长度要求,如果满足则将子序列加入到已检测集合当中,否则将子序列加入到待检测集合当中并标记异常程度。通过不断迭代地选取待检测集合当中,异常程度最大情况下最短的时间序列,直到迭代的过程中超出运行时间限制或待检测集合为空,终止检测方法。系统返回已检测集合能够将最有可能发生内幕交易行为的区间展示给监管部门。

本发明的有益效果为:

(1)提升内幕交易行为检测的效果根据大宗商品交易模式,系统考虑交易用的交易行为数据中内幕交易行为与正常交易行为的不同,对多种交易指标进行交易行为的刻画,帮助后续使用异常时间序列检测方法,解决以往只考虑单一指标进行建模的问题。

(2)减少检测方法所需要的时间系统通过自适应调整内幕交易检测过程中的时间区间,将最有可能发生内幕交易行为的时间区间先检测出来,解决以往直接使用目标时间区间划分长度而导致在大规模交易场景下检测时间过长的问题。

(3)维护大宗商品交易市场的公平性和稳定性在大宗商品交易市场中,由于内幕交易行为使得某些人获得了非法的利益,相比于无法获得内幕信息的普通投资者是不公平的,损害了普通股投资者在交易市场进一步交易的信心,影响了交易市场的正常发展。而内幕交易行为的自适应检测方法与系统,能帮助监管部门更好地打击内幕交易行为。

附图说明

图1是本发明的主要原理图。

图2是以交易用户在时间区间内对一种价格波动商品进行交易行为的示意图。

具体实施方式

下面结合附图和具体实施方式,进一步阐明本发明,应理解下述具体实施方式仅用于说明本发明而不用于限制本发明的范围。

如图所示,本发明所述的一种针对大宗商品内幕交易行为的自适应检测方法与系统,包括以下步骤:

(1)初始阶段系统对监管范围内的大宗商品交易用户的历史交易数据进行提取。对在时间区间[t

(2)系统对待检测集合中的交易行为进行排序,其中异常值δ越大,则处于排序优先级越高。对于异常值相同的交易行为,则区间长度t

(3)系统对划分后的时间内的交易行为转化为交易指标。为了内幕交易行为与正常的交易行为的交易特征不同,使用了四种交易指标:资金投入增加率,投资资金集中度,交易频率和投资回报率。

资金投入增加率:它代表一段时间内额外投入的资金价值与原本的资本投入的价值的比值。

分子代表了交易账户a

交易频率:它代表一段时间内在该商品的总交易次数与时间的比值。

分子代表了交易账户a

投资资金集中度:它代表交易账户a

而如果交易账户在以往都采取分散投资的策略,而在某一个时间段变成了集中投资的策略,那说明有可能是由内幕信息致使的内幕交易行为。

投资回报率:它代表一段时间内的净收入与某个时间点投资成本之间的比值。高投资回报率意味着投资能够获得较高的收益。[t

通过上面两项,[t

这项指标代表了交易账户a

在计算完指标后,[t

(4)将步骤(3)中计算的交易指标序列进行异常子序列的检测。使用长度为n的窗口进行移动,便能够得到N-n条子序列,所有的子序列集合可以表示为:

其中

序列的异常程度是由子序列之间是否相似来判断的,因此使用Eros距离衡量连个子序列之间从相似度,设p和q是两个子序列,子序列当中包含了4种交易指标,因此可以表示为n×4的矩阵,即每一行代表了一种指标的时间序列。对协方差矩阵进行奇异值分解(SVD),得到右特征向量矩阵V

其中w是权重向量,采用特征值向量的平均值向量归一化得到。在使用距离定义时,对于具有重叠窗口的子序列,通常不比较它们之间的相似性,避免自相似性带来的偏差。对于不同的子序列具有不同的偏移和振幅,在相似程度比较之前首先需要经过标准化。在定义距离公式后,可以定义出子序列p的k近邻距离k-distance(p):1.至少有k个子序列,o′∈SS\{p},使得dist(p,o′)≤dist(p,o)。2.至少有k-1个子序列,o′∈SS\{p},″使得″dist(p,o′)<dist(p,o)。

子序列p的k近邻子序列集合可以表示为N

通过比较子序列p的局部可达密度与周围邻居子序列的举报可达密度,可以定义出子序列p的局部异常因子。

子序列p的局部异常因子越大,说明子序列p的局部可达密度小,而子序列N

(5)将步骤(4)中得到异常值的每个子序列进行判断,如果该子序列的时间区间长度已经满足监管部门的的区间长度要求,则将该子序列及其异常值加入到已检测集合当中。否则说明该子序列还需要进一步的检测,因此重复步骤(2)到步骤(4)。直到待检测集合为空或者检测方法超过了规定的运行时间时,执行步骤(6)。

(6)将已检测集合当中的标注的子序列返回,每个子序列代表了该段时间区间内交易行为的异常程度,值越大则代表越有可能发生内幕交易行为。

需要说明的是,以上内容仅仅说明了本发明的技术思想,不能以此限定本发明的保护范围,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰均落入本发明权利要求书的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号