首页> 中国专利> 一种基于小波去噪生成对抗网络的股票收盘价预测方法

一种基于小波去噪生成对抗网络的股票收盘价预测方法

摘要

本发明公开了一种基于小波去噪生成对抗网络的股票收盘价预测方法,选取股票数据中的收盘价作为数据集,并对数据集进行预处理,将数据集划分为训练集与测试集;构建包括生成器和判别器的股票收盘价预测模型;生成器由门控循环单元构成,用在于生成股票数据;所述判别器由卷积神经网络构成,用于区分真假数据;利用单支重构原理构建生成器目标函数;将以N日为窗口划分的数据记为“真”,将以(N‑1)日为窗口划分的数据输入生成器所得到的结果记为“假”,一起输入判别器中输出真伪的判断结果。本文利用基于小波去噪的生成对抗网络预测未来数据具有较高的精度。

著录项

  • 公开/公告号CN113837490A

    专利类型发明专利

  • 公开/公告日2021-12-24

    原文格式PDF

  • 申请/专利权人 淮阴工学院;

    申请/专利号CN202111220195.7

  • 申请日2021-10-20

  • 分类号G06Q10/04(20120101);G06Q40/04(20120101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构32204 南京苏高专利商标事务所(普通合伙);

  • 代理人柏尚春

  • 地址 223003 江苏省淮安市经济技术开发区枚乘东路1号

  • 入库时间 2023-06-19 13:49:36

说明书

技术领域

本发明属于信息处理领域,涉及一种基于小波去噪生成对抗网络的股票收盘价预测模型。

背景技术

由于深度学习在数据方面具有强大的处理能力,所以在很多领域都取得了巨大的成功,而股市预测是金融领域最受欢迎和最有价值的领域之一。

中国专利CN 107239855A公开了一种基于LSTM模型的股票预测方法和系统,采用了LSTM模型构建股票预测模型适用于周期性强的数据和序列数据,解决长期依赖问题,比传统时间序列模型等更加灵活调参。基于机器学习方法方面,中国专利CN 109360097A公开了一种基于深度学习的股票预测方法,通过先利用复合神经网络中的卷积神经网络学习目标股票和关联股票的交易数据的特征,再将特征输入到复合神经网络中的长短期记忆网络进行处理,得到对股票涨跌的预测,提供了一种基于深度学习和群体智能的股票预测方法,可以准确地预测股票的涨跌。中国专利CN 112163951A公开了提供了一种结合投资者心理情绪与股市历史交易数据相结合的股票预测方法,从而有效缓解了LSTM循环神经网络梯度爆炸梯度弥散的问题,进一步提高股市预测的准确性,中国专利CN 108074007A公开了涉及信息处理领域中的一种人工智能超深度学习的股票预测方法,可将所有与预测有关的因素,以及各种数学模型所产生的预测效果通过超深度学习构建成一个预测平台,并对预测结果进行多次的机器学习从而达到最佳化的预测,同时还可以进行自动的或人为的模糊参数的修正,在股票预测上具有突破性。中国专利CN 113129148A公开了一种融合生成对抗网络与二维注意力机制的股票预测方法,可以产生更为精准、更为理想的股票价格预测结果。

但由于股市的复杂性,上述专利仍然存在预测精度不高的问题,本文提出了一种结合小波去噪的生成对抗网络,它的生成器是由门控神经单元构成,判别器是由卷积神经网络构成,并基于小波去噪的特性构造了新的目标函数,将其应用于生成器中,实验结果表明其具有较高的预测精度。

发明内容

发明目的:针对现有技术中的不足之处,提出了一种基于小波去噪生成对抗网络的股票收盘价预测方法,生成器是由门控循环单元构成,其作用在于生成股票数据;判别器由卷积神经网络构成,作用在于区分真假数据。

技术方案:本发明提供一种基于小波去噪生成对抗网络的股票收盘价预测方法,具体包括以下步骤:

(1)选取股票数据中的收盘价作为数据集,并对数据集进行预处理,将数据集划分为训练集与测试集;

(2)构建包括生成器和判别器的股票收盘价预测模型;所述生成器是由门控循环单元构成,用在于生成股票数据;所述判别器由卷积神经网络构成,用于区分真假数据;

(3)利用单支重构原理构建生成器目标函数;

(4)将以N日为窗口划分的数据记为“真”,将以(N-1)日为窗口划分的数据输入生成器所得到的结果记为“假”,一起输入判别器中输出真伪的判断结果。

进一步地,所述步骤(1)包括以下步骤:

(11)对数据进行量纲处理,即标准化;

(12)对数据进行小波去噪,再对高频系数进行去噪处理,最后单支重构;

(13)滚动划分数据集,并按照8:2划分训练集测试集。

进一步地,步骤(2)所述生成器由三层门控神经单元与三个全连接层组成;第一层为1024个神经元,第二层为512个神经元,第三层为256个神经元,学习率为0.0006,并且每一层都设置Dropout;所述三层全连接网络,输出维度分别设置为128、64、7。

进一步地,步骤(2)所述判别器是由两层卷积神经网络与一个全连接层组成,卷积核与步长均为[2,2],激活函数为LeakyRelu,学习率为0.0006,负数部分线性函数的梯度均为0.01,全连接层输出维度为1,激活函数为sigmoid。

进一步地,步骤(2)所述卷积神经网络是由卷积层、池化层和全连接层构成;所述卷积层主要是通过共享权值来实现对特征的提取,其数学表达式为:

式中σ为激活函数,c为偏置参数,l表示局部感受野的长,m表示局部感受野的宽,w

进一步地,所述步骤(3)实现过程如下:

原始生成对抗网络的目标函数为:

min

式(1)表示最大化判别器D和最小化生成器G,Pdata是样本中采样的真实数据,D(X)是真实数据的概率;Pz在本文中指输入的股票信息;G(z)是z通过生成器生成的数据,D(G(z))表示生成数据是真实数据的概率;式(1)分解为式(2)和式(3):

max

min

式(2)是判别器的目标函数,真实数据标签为1,生成数据标签为0,期望D(X)越来越接近于1,而D(G(z)越来越接近于0,判别器区分真假数据的能力越强;式(3)是生成器的目标函数,期望D(G(z))趋向于1,即生成数据越接近真实数据越好;

构建出以下目标函数:

min

其中,abs为绝对值,Aj表示输入数据第j列;

利用生成器的原始目标函数式(3)结合式(4),最终生成器目标函数为:

L

有益效果:与现有技术相比,本发明的有益效果:本发明提出的股票收盘价预测模型,生成器是由门控神经单元构成,判别器是由卷积神经网络构成,最后基于小波去噪的特性构造了新的目标函数,将其应用于生成器中,具有良好的预测效果,具有一定的研究价值。

附图说明

图1为本发明的流程图;

图2为小波分解示意图。

具体实施方式

下面结合附图对本发明作进一步详细说明。

本发明提供一种基于小波去噪生成对抗网络的股票收盘价预测方法,如图1所示,具体包括如下步骤:

步骤1:选取股票数据中的收盘价作为数据集,并对数据集进行预处理,将数据集划分为训练集与测试集。

获取中国平安银行的股票数据,共采集了2000年1月4日到2021年1月22日共5461个日股票数据,选取股票数据中的收盘价作为实验数据,并对实验数据进行标准化。对数据进行小波去噪,如图2所示;再对高频系数进行去噪,最后再将各分量进行单支重构。选取6日和7日为窗口滚动划分数据集,依此方式滚动划分数据集,且按照80%的比例划分训练集与测试集;

步骤2:构建包括生成器和判别器的股票收盘价预测模型;其中生成器是由门控循环单元构成,用在于生成股票数据;判别器由卷积神经网络构成,用于区分真假数据。

生成器是由三层门控神经单元与三个全连接层组成,共计六层。第一层为1024个神经元,第二层为512个神经元,第三层为256个神经元,学习率为0.0006,并且每一层都设置Dropout防止过拟合。接下来的三层全连接网络,输出维度分别设置为128、64、7。最后将形状为6*7的输入数据与形状为1*7的生成数据行拼接,拼接为7*7的矩阵,作为生成器的最终输出。

判别器是由两层卷积神经网络与一个全连接层组成,卷积核与步长均为[2,2],激活函数为LeakyRelu,学习率为0.0006,负数部分线性函数的梯度均为0.01,全连接层输出维度为1,激活函数为sigmoid。

门控神经单元是由Kyunghyun Cho等人引入。门控神经单元与LSTM类似,但是门控神经单元比LSTM少了输出门,它们仅由更新门和重置门组成。门控神经单元与LSTM都能够捕获数据中的序列信息,但是由于门控神经单元由较少的参数组成,所以训练时间较短。经过许多学者验证,门控神经单元在小型数据集上比LSTM表现更好。本文涉及数据属于小型数据集,因此选用门控神经单元作为生成器。

卷积神经网络主要借鉴于生物的神经系统,各个神经元之间局部连接,实现对输入特征的提取。卷积神经网络是由卷积层、池化层和全连接层构成。其中卷积层主要是通过共享权值来实现对特征的提取,其数学表达式为:

式中σ为激活函数,c为偏置参数,l表示局部感受野的长,m表示局部感受野的宽,w

步骤3:基于单支重构原理构建生成器目标函数。

在生成对抗网络中,目标函数的设计至关重要。原始GAN的目标函数为:

min

式(1)表示最大化判别器D和最小化生成器G,Pdata是样本中采样的真实数据,D(X)是真实数据的概率;Pz在本文中指输入的股票信息;G(z)是z通过生成器生成的数据,D(G(z))表示生成数据是真实数据的概率。式(1)可以分解为式(2)和式(3):

max

式(2)是判别器的目标函数,真实数据标签为1,生成数据标签为0,期望D(X)越来越接近于1,而D(G(z)越来越接近于0,让判别器有“明辨是非”的能力。

min

式(3)是生成器的目标函数,我们期望D(G(z))趋向于1,即生成数据越接近真实数据越好。生成器在训练时,判别器是需要固定的,反之亦然,交替进行。此时出现博弈,因为判别器希望能够判别出生成数据,而生成器又在不断地优化网络,使得生成的数据越来越逼真。

构建出以下目标函数:

min

其中,abs为绝对值,Aj表示输入数据第j列。

利用生成器的原始目标函数式(3)结合式(4),最终生成器目标函数为:

L

步骤4:将以N日为窗口划分的数据记为“真”,将以(N-1)日为窗口划分的数据输入生成器所得到的结果记为“假”,一起输入判别器中输出真伪的判断结果。

本发明将7日为窗口划分的数据7*7矩阵记为“真”,将6日为窗口划分的数据6*7矩阵输入生成器中,生成1*7的矩阵;与生成器输入的6*7矩阵进行行拼接,得到7*7矩阵,此矩阵记为“假”,将“假”7*7矩阵与“真”7*7矩阵输入判别器,输出真伪的判断结果。

采用python作为算法的实现语言,选取中国平安银行(股票代码为000001)的股票数据,该数据来自tushare财经数据接口工具包,其中采集了2000年1月4日到2021年1月22日共5461个日股票数据,选取股票数据中的收盘价作为实验数据。具体模型参数设置如表1所示。

表1模型参数设置

一共设计3个对比试验,分别是GRU、GAN与WD-GAN,从MAE、RMSE、R2-score三个评价指标进行比较,实验结果如表2所示。

表2不同方法评价指标的对比

从评价指标上来分析,整体效果从差到好依次是GRU、GAN、WD-GAN。表1中,MAE、RMSE反映的是预测值与真实值之间的误差情况,值越小表示效果越好,R2-score反映的是预测值与真实值之间的接近程度,值越接近于1,效果越好。由于评价指标的数量级较小,为方便观察,将所有数值均乘以10

上述实施方式只为说明本发明的技术构思及特点,其目的在于让熟悉此项技术的人能够了解本发明的内容并据以实施,并不能以此限制本发明的保护范围。凡根据本发明精神实质所做的等效变换或修饰,都应涵盖在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号