首页> 中国专利> 一种化工原料价格和采购量预测方法、装置及相关设备

一种化工原料价格和采购量预测方法、装置及相关设备

摘要

本发明公开了一种化工原料价格和采购量预测方法、装置及相关设备,包括对原料期货价格进行预测、对长短期采购比例进行计算和根据预测的原料期货价格和所述长短期采购比例进行滚动式预测原料采购量,本发明实施例通过对大量的有关化工原料数据进行训练,得出模型,并对化工原料的期货价格进行预测,由于机器学习训练出来的模型是站在大数据的基础上,比人工预测更加精准且方便快捷,之后通过有关化工原料数据中的历史化工原料长短期采购比例和采购成本确定未来一段时间长短期采购比例,并结合两者对化工原料的现货采购量进行预测,整体方案均是在前一机器学习模型中预测出来的化工原料期货价格的基础上进行的,因而化工原料的现货采购量预测会更加的精准。

著录项

  • 公开/公告号CN113222247A

    专利类型发明专利

  • 公开/公告日2021-08-06

    原文格式PDF

  • 申请/专利权人 润联软件系统(深圳)有限公司;

    申请/专利号CN202110510944.3

  • 发明设计人 吴凌宇;王鹤;王国勋;

    申请日2021-05-11

  • 分类号G06Q10/04(20120101);G06Q30/02(20120101);G06F16/35(20190101);G06F40/289(20200101);G06N3/04(20060101);G06N3/08(20060101);G06N20/00(20190101);

  • 代理机构44242 深圳市精英专利事务所;

  • 代理人李翔宇

  • 地址 518000 广东省深圳市福田区梅林街道梅都社区中康路136号深圳新一代产业园2栋801

  • 入库时间 2023-06-19 12:07:15

说明书

技术领域

本发明涉及机器学习技术领域,尤其涉及一种化工原料价格和采购量预测方法、装置及相关设备。

背景技术

由于受到宏观经济环境、供求关系和生产成本等诸多因素的影响,部分化工原料的价格波动往往较为频繁,波动幅度较大,无明显规律,大大加大了企业在采购时对价格预测的难度,使得采购部门很难制定出合适的采购政策,从而最小化企业的采购成本。

一般的化工原料采购分为合约采购和现货采购两种方式。合约采购是在年初指定未来一段时间的采购合约量,之后逐月发货。优点是合约采购量较大,通常能获得一定的折扣,缺点是无法根据市场的行情酌情调整采购的数量;现货采购根据市场行情和订单数能够及时调整采购的数量,但是大多数时候价格相比合约采购较高。因此公司需要权衡合约采购折扣和市场行情波动,确定合适的长短期(合约采购/现货采购)比例。

目前行业上对于化工原料采购所采取的方法更多的是采购部门根据历史经验,以及当前的经济形势的判断进行预测,无法对各个因素进行充分的考虑。因此构建先进准确的化工原料采购系统至关重要,可以供给采购部门作为一定的参考,为科学决策提供一定的依据。

发明内容

本发明的目的是提供一种化工原料价格和采购量预测方法、装置及相关设备,旨在解决现有技术中无法准确的对化工原料进行价格预测的问题。

第一方面,本发明实施例提供了一种化工原料的期货价格预测方法,其包括:

对化工原料原始数据样本中的仓单数据和龙虎榜数据进行独热编码,同时对所述化工原料原始数据样本中的其他数据进行归一化编码,得到第一编码数据;

通过Box-Cox变换对所述第一编码数据进行处理,得到预处理后的第二编码数据;

对所述第二编码数据进行分类,得到包含宏观因子、供需因子、舆情因子和技术因子的化工原料特征库;

依次通过栈式自动编码器和主成分分析方法对所述第二编码数据进行特征提取,得到高级特征;

将所述高级特征依次通过时间卷积网络、第一全连接层和防过拟合层得到特征数据;

将所述特征数据输入双向长短时记忆循环神经网络中进行处理得到特征向量,并将所述特征向量输入第二全连接层进行预测,得出预测的化工原料期货价格。

第二方面,本发明实施例提供了一种化工原料采购量的预测方法,其包括:

对化工原料原始数据样本中的仓单数据和龙虎榜数据进行独热编码,同时对所述化工原料原始数据样本中的其他数据进行归一化编码,得到第一编码数据;

通过Box-Cox变换对所述第一编码数据进行处理,得到预处理后的第二编码数据;

对所述第二编码数据进行分类,得到包含宏观因子、供需因子、舆情因子和技术因子的化工原料特征库;

依次通过栈式自动编码器和主成分分析方法对所述第二编码数据进行特征提取,得到高级特征;

将所述高级特征依次通过时间卷积网络、第一全连接层和防过拟合层得到特征数据;

将所述特征数据输入双向长短时记忆循环神经网络中进行处理得到特征向量,并将所述特征向量输入第二全连接层进行预测,得出预测的化工原料期货价格;

对长短期采购比例进行计算;

根据预测的化工原料期货价格和所述长短期采购比例进行化工原料采购量的滚动式预测。

第三方面,本发明实施例提供了一种化工原料的期货价格预测装置,包括:

第一编码单元,用于对化工原料原始数据样本中的仓单数据和龙虎榜数据进行独热编码,同时对所述化工原料原始数据样本中的其他数据进行归一化编码,得到第一编码数据;

第二编码单元,用于通过Box-Cox变换对所述第一编码数据进行处理,得到预处理后的第二编码数据;

分类单元,用于对所述第二编码数据进行分类,得到包含宏观因子、供需因子、舆情因子和技术因子的化工原料特征库;

高级特征提取单元,用于依次通过栈式自动编码器和主成分分析方法对所述第二编码数据进行特征提取,得到高级特征;

时间卷积处理单元,用于将所述高级特征依次通过时间卷积网络、第一全连接层和防过拟合层得到特征数据;

预测单元,用于将所述特征数据输入双向长短时记忆循环神经网络中进行处理得到特征向量,并将所述特征向量输入第二全连接层进行预测,得出预测的化工原料期货价格。

第四方面,本发明实施例又提供了一种计算机设备,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现第一方面所述的化工原料的期货价格预测方法。

本发明实施例通过对大量的有关化工原料数据进行训练,得出模型,并对化工原料的期货价格进行预测,由于机器学习训练出来的模型是站在大数据的基础上,比人工预测更加精准且方便快捷,之后通过有关化工原料数据中的历史化工原料长短期采购比例和采购成本确定未来一段时间长短期采购比例,并结合两者对化工原料的现货采购量进行预测,整体方案均是在前一机器学习模型中预测出来的化工原料期货价格的基础上进行的,因而化工原料的现货采购量预测会更加的精准,可以供给采购部门作为一定的参考,为科学决策提供一定的依据。

附图说明

为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的化工原料的期货价格预测方法的流程示意图;

图2为本发明实施例提供的化工原料的期货价格预测方法中步骤S101的子流程示意图;

图3为本发明实施例提供的化工原料的期货价格预测方法中步骤S105之前的子流程示意图;

图4为本发明实施例提供的化工原料采购量的预测方法的流程示意图;

图5为本发明实施例提供的化工原料采购量的预测方法中步骤S107的子流程示意图;

图6为本发明实施例提供的化工原料采购量的预测方法中步骤S108的子流程示意图;

图7为本发明实施例提供的化工原料的期货价格预测装置的示意性框图;

图8为本发明实施例提供的计算机设备的示意性框图;

图9为本发明实施例提供的化工原料的期货价格预测方法的另一流程示意图;

图10为本发明实施例提供的化工原料采购量的预测方法中步骤S107的另一子流程示意图;

图11为本发明实施例提供的化工原料采购量的预测方法中步骤S108的另一子流程示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。

还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。

请参阅图1和图9,一种化工原料的期货价格预测方法,包括步骤S101~S105。

S101:对化工原料原始数据样本中的仓单数据和龙虎榜数据进行独热编码,同时对所述化工原料原始数据样本中的其他数据进行归一化编码,得到第一编码数据;

S102:通过Box-Cox变换对所述第一编码数据进行处理,得到预处理后的第二编码数据;

S103:对所述第二编码数据进行分类,得到包含宏观因子、供需因子、舆情因子和技术因子的化工原料特征库;

S104:依次通过栈式自动编码器和主成分分析方法对所述第二编码数据进行特征提取,得到高级特征;

S105:将所述高级特征依次通过时间卷积网络、第一全连接层和防过拟合层得到特征数据;

S106:将所述特征数据输入双向长短时记忆循环神经网络中进行处理得到特征向量,并将所述特征向量输入第二全连接层进行预测,得出预测的化工原料期货价格。

在步骤S101中对对化工原料原始数据样本中的仓单数据和龙虎榜数据进行独热编码,其中龙虎榜数据是交易所会员持仓排名前20的会员名称,不同会员的交易风格不一样,通过龙虎榜当天会员如果排名在前20,数值为1,否则为0。仓单数据是每日排名前20仓库库存数量,可以反映该材料供应情况,如果在全国仓库列表中,某仓库仓储水平位于前20,则值为1,否则为0。

上述独热编码即one-hot编码。

上述其他数据指除了仓单数据和龙虎榜数据之外的化工原料原始数据样本中的数据。

由于不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,故对其他数据进行归一化处理,使结果值映射到[0-1]之间,提升模型的收敛速度和模型的精度,使得不同维度之间的特征在数值上有一定比较性,可以大大提高分类器的准确性,可以防止模型梯度爆炸。

需要理解的,一旦建立线性回归模型,通常都要检测残差的异方差性。如果存在异方差,得到的回归模型是低效并且不稳定的,后面就有可能会得到奇怪的预测结果。

在我们进行数据分析时,遇到的数据往往不是呈正态分布的,而如果数据不是正态性的,那么在部分情况下会带来一些问题。比如某些模型的前提就是要求数据具有正态性(KNN、贝叶斯等),此外数据具有正态性可以在一定程度上提高机器学习的训练效果。

故而在步骤S202中通过Box-Cox变换对所述第一编码数据进行处理。

具体的,Box-Cox变换是Box和Cox在1964年提出的一种广义幂变换方法,是统计建模中常用的一种数据变换,用于连续的响应变量不满足正态分布的情况。Box-Cox变换之后,可以一定程度上减小不可观测的误差和预测变量的相关性。Box-Cox变换的主要特点是引入一个参数,通过数据本身估计该参数进而确定应采取的数据变换形式,Box-Cox变换可以明显地改善数据的正态性、对称性和方差相等性,对许多实际数据都是行之有效的。

在本实施例中,步骤S103中,宏观因子、供需因子、舆情因子和技术因子包括了待预测化工原料有关的各种数据类型(其中大部分为相关历史数据);其中,所述宏观因子包括利率、汇率、美元指数、沪深指数、期货指数和布油价格等;所述供需因子包括仓单数据、交易数据、关联期货数据、龙虎榜和装置开工检修情况等;所述舆情因子包括国内外新闻、地缘政治因素、货币政策和财政政策;所述技术因子包括MACD、MA7、MA10等。

其中,MACD(MovingAverage Convergence and Divergence)是GeralAppel于1979年提出的,利用收盘价的短期(常用为12日)指数移动平均线与长期(常用为26日)指数移动平均线之间的聚合与分离状况,对买进、卖出时机作出研判的技术指标。

MA7和MA10中,MA为移动平均线,是以道·琼斯的“平均成本概念”为理论基础,采用统计学中“移动平均”的原理,将一段时期内的股票价格平均值连成曲线,用来显示股价的历史波动情况,进而反映股价指数未来发展趋势的技术分析方法。它是道氏理论的形象化表述。其中,MA7代表7日移动平均价格,MA10代表10日移动平均价格。

其中,装置开工检修数据主要是数据库的文本数据,通过规则匹配的方式获得每日化工原料装置检修、开工和产能的数据。

对上述四类因子中的不同数据类型采取不同的特征提取方法,其中文本数据需要整理关键信息后与数值信息一起预处理。

为了消除数据的多重共线性,降低数据维度,通过步骤S104对化工原料特征库进行降维和高级特征提取,其中通过栈式自动编码器对化工原料进行处理,可以发现特征之间的潜在关系,充分挖掘特征的信息。

步骤S105中将高级特征依次通过时间卷积网络、第一全连接层和防过拟合层得到特征数据;其中,时间卷积网络具体为TCN,TCN网络主要包括因果卷积、膨胀卷积和残差链接三个部分。因果卷积限制了值只依赖上一层和之前的数据;膨胀卷积层允许间隔采样,能通过较少的层数,就可以获得很大的感受野;残差链接由将输入与通过卷积模块的结果合并,实现跨层的方式传递信息。

步骤S106将所述特征数据输入双向长短时记忆循环神经网络中进行处理得到特征向量,双向长短时记忆循环神经网络由一个向前传导的LSTM模型和向后传导的LSTM模型构成,这个结构提供给输入特征序列的每一个点完整的过去和未来的信息,为网络建立了数据的前后连接,能够更充分地进行学习。

其中LSTM一般指长短期记忆人工神经网络。

通过步骤S106后将获得预测的化工原料期货价格。

由于化工原料的期货价格与其本身的价格息息相关,故,只需对期货价格根据当时的行情进行转换即可得到化工原料其本身的价格。

通过机器学习对化工原料期货价格进行预测,预测精准,比人工预测更加方便快捷。

请参阅图2,在一实施例中,在步骤S101中,所述其他数据包括舆情数据,对所述舆情数据的归一化编码包括:

S201:对所述舆情数据进行分词和去除停用词处理,取出概率最高的前n个词语进行编号,将词语映射为id,对所述词语代表的id都补全成相同长度的id后,通过预训练的词库和embedding转换成词向量矩阵;

S202:通过多个卷积层对所述词向量矩阵按照时间序列方向进行一维卷积,捕获不同尺度的信息;

S203:通过时序最大池化层对经过卷积的所述词向量矩阵进行处理,并将得到的数据进行合并,将合并的数据输入到第三全连接层;

S204:将第三全连接层输出的数据进行归一化处理。

其中,第三全连接层为一个有两个隐层的全连接神经网络,两个隐层之间加入dropout层用于减轻过拟合。

具体的,对所述舆情数据的归一化编码可以理解为将打好标签的舆情数据通过text-CNN训练出情绪提取的网络。

其中text-CNN是利用卷积神经网络对文本进行分类的算法。

情感分析在工业领域有着广泛的应用场景。例如,电商网站根据商品评论数据提取评论标签,调整评论显示顺序;影评网站根据电影评论来评估电影口碑,预测电影是否卖座;外卖网站根据菜品口味、送达时间、菜品丰富度等用户情感指数来改进外卖服务等。

在本实施例中,通过text-CNN对舆情数据进行情绪提取和分类,使得舆情数据可以更大程度的为化工原料特征库提供相关特征数据,方便对模型的优化和精度的提高。

请参阅图3,在一实施例中,步骤S105中所述将所述高级特征依次通过时间卷积网络、第一全连接层和防过拟合层得到特征数据,之前还包括:

S301:将化工原料历史期货数据进行归一化编码得到第三编码数据;

S302:将第三编码数据通过Box-Cox变换后得到第四编码数据;

S303:将第四编码数据通过傅里叶变换转换成长期趋势特征、中期趋势特征和短期趋势特征;

S304:将所述长期趋势特征、中期趋势特征和短期趋势特征拼接到所述高级特征中。

在本实施例中,步骤S301中的化工原料历史期货数据与步骤S103中四类因子中的关联期货数据区别在于,化工原料历史期货数据为其本身作为期货的数据;顾名思义,关联期货数据即与化工原料相关的其他影响化工原料期货价格的期货数据,包括外盘相关期货数据和其他相关期货数据,其中,其他相关期货数据(此处以PTA为例)包括但不限于中证500IC、沪深300IF、上证50IH、原油合约SC、黄金AU、天然橡胶RU和乙二醇EG,外盘相关期货数据包括但不限于NYMEX原油、美元指数期货、IMM-欧元、标普期货、COMEX黄金、IMM-日元、NYMEX天然气和布伦特原油。

其中,500IC、沪深300IF和上证50IH为国内的金融股指期货。

其中,原油合约SC、黄金AU、天然橡胶RU和乙二醇EG为与PTA化学原料期货价格相关的其他期货价格,其中包括原油、黄金、天然橡胶和乙二醇,当然不仅限于这四种。

其他化学原料的其他相关期货数据不一定与上述PTA的其他相关期货数据雷同,可根据现实情况进行取舍。

外盘相关期货数据与上述雷同,这些在百度上均有公开,这里不再赘述。

由于期货价格交替式处于趋势和震荡的状态,当期货处于盘整阶段,则不宜采用趋势模型,相反如果期货处于趋势阶段,则需要使用趋势模型。然而判断开始盘整或者有所突破的起始点始终是个难题。因此在步骤303中,采取傅里叶变化,将化工原料历史期货数据分解成长、中、短期趋势。

具体的,傅里叶变换将历史数据进行分解,根据分解出函数的频率不同,分为长期、中期和短期函数,对应于长期趋势,中期趋势和短期趋势。

具体的,步骤S106中,包括:

将如下公式作为损失函数对化工原料期货价格进行预测:

其中,该式选用了预测的期货价格与真实值之间偏差的均方误差,y

请参阅图4,本发明根据上述化工原料的期货价格预测方法,还公开了化工原料采购量的预测方法,包括:

S101:对化工原料原始数据样本中的仓单数据和龙虎榜数据进行独热编码,同时对所述化工原料原始数据样本中的其他数据进行归一化编码,得到第一编码数据;

S102:通过Box-Cox变换对所述第一编码数据进行处理,得到预处理后的第二编码数据;

S103:对所述第二编码数据进行分类,得到包含宏观因子、供需因子、舆情因子和技术因子的化工原料特征库;

S104:依次通过栈式自动编码器和主成分分析方法对所述第二编码数据进行特征提取,得到高级特征;

S105:将所述高级特征依次通过时间卷积网络、第一全连接层和防过拟合层得到特征数据;

S106:将所述特征数据输入双向长短时记忆循环神经网络中进行处理得到特征向量,并将所述特征向量输入第二全连接层进行预测,得出预测的化工原料期货价格;

S107:对长短期采购比例进行计算;

S108:根据预测的化工原料期货价格和所述长短期采购比例进行化工原料采购量的滚动式预测。

在本实施例中,步骤S101~S106均与化工原料的期货价格预测方法执行的步骤一致。

通过步骤S107可获得长短期采购比例,随后根据预测的化工原料期货价格和所述长短期采购比例进行化工原料采购量的滚动式预测。

请参阅图5和图10,在一实施例中,步骤S107中,包括:

S401:取同一时间段中的所述高级特征、长短期采购比例和采购成本,对所述长短期采购比例进行分类得到不同的长短期采购比例类,并将同一时间段中的所述高级特征、长短期采购比例类和采购成本作为三元组数据集;

S402:将所述高级特征和所述长短期采购比例类作为输入数据输入由支持向量机、随机森林和分布式梯度增强库分类器构成的多分类模型中进行投票,并通过逻辑回归模型对投票结果进行归一化处理,获得预测的长短期采购比例类;

S403:根据预测的长短期采购比例类,取对应的所述三元组数据集中的所述采购成本,通过惩罚权重计算所述采购成本的权重,并取所述采购成本对应的本时间段下所述长短期采购比例,得出采购成本最低时对应的长短期采购比例。

在本实施例中,步骤S401中,对所述长短期采购比例进行分类得到不同的长短期采购比例类。

具体的,对长短期采购比例进行分箱处理,得到若干长短期采购比例类,每个长短期采购比例归属于其中一个长短期采购比例类,故可以看成每个三元组数据集都有对应的一个长短期采购比例类,一个长短期采购比例类对应有若干个三元组数据集,方便之后进行权重计算。

所述分箱具体为Bucketrized。

图10中分箱后长短期采购比例类两端的数值表示为pn和qn。

例如:将历史的长短期采购比例进行分箱分组,根据历史水平将数据分成六组长短期采购比例类,分别记为a

在步骤S402中,为了防止单一方式进行分类的误差,通过使用支持向量机(SVM)、随机森林、分布式梯度增强库(XGBOOST)三种分类器通过投票(Voting)的方式训练多分类模型,最后通过逻辑回归模型(softmax层)进行归一化处理,将各个类别的对应的输出分量归一化,获得预测的长短期采购比例范围(即长短期采购比例类)。

其中投票的时候可以采用Hard Voting Classifier(根据少数服从多数来定最终结果),也可以采用SoftVoting Classifier(将所有模型预测样本为某一类别的概率的平均值作为标准,概率最高的对应的类型为最终的预测结果)。

在步骤S403中,所述根据预测的长短期采购比例类,取对应的所述三元组数据集中的所述采购成本,通过惩罚权重计算所述采购成本的权重,并取所述采购成本对应的本时间段下所述长短期采购比例,得出采购成本最低时对应的长短期采购比例,包括:

按如下公式计算损失函数的值:

按如下公式对采购成本进行权重计算:

对权重w

按如下公式计算长短期采购比例:

其中,y

具体的,以下通过举例对步骤S403进行说明:

通过预测步骤S402可预测出所要计算的长短期采购比例所属的长短期采购比例类,暂时记为a

请参阅图6和图11,在一实施例中,步骤S108中,包括:

S501:将未来一段时间的成品采购订单数量和预测的未来一段时间的化工原料期货价格输入到滚动采购模型中;

S502:根据所述长短期采购比例和合同采购量,将最小化采购费用和约束条件作为限制,预测出未来一段时间的现货采购量;

S503:根据更新的所述数据库重复对化工原料期货价格进行预测和对长短期采购比例进行计算,滚动更新未来一段时间的现货采购量。

在本实施例中,步骤S501中,成品采购订单数量可以从销售部获得,通过成品采购订单数量可以推得制作该成品的化工原料所对应的数量缺口;未来一端时间的化工原料期货价格可从步骤S106获得。

步骤S502中,包括:

按以下公式计算预测的未来n个月的化工原料现货采购总金额:

按以下公式计算未来n个月的化工原料合约采购的总金额:

按以下约束条件和公式计算未来n月的化工原料现货采购量:

x

按以下公式计算未来n个月的化工原料原料现货和合同采购的总金额(即采购费用):

f=C’+C;

其中,f为化工原料采购费用,以能达到最小值的方案为优;C为化工原料合同采购总金额,在年初确定;C

在本实施例中,计算结果的前提条件是最小化采购费用,即f要尽可能的小,使得计算出来的现货采购量具有一定的指导意义。

其中,

x

最后通过每隔一段时间更新的数据对化工原料原始数据样本和化工原料历史期货数据进行更新,并重复以上若干预测步骤,得到最近一段时间所需的现货采购量。

以上的未来一段时间一般为一年(当然,也可以为其他长度的一段时间),即在年初确定好未来一年的合同采购量,并通过S107步骤确定出长短期采购比例,随后通过步骤S101-S106对化工原料期货价格进行预测,并通过步骤S108对化工原料的现货采购量进行滚动式预测,得到这一年中未来几个月的现货采购量,为了使得数据与每个月更加匹配,每个月都会更新相应的数据并对现货采购量进行重新预测,其中一年只确定一次长短期采购比例。

请参阅图7,一种化工原料的期货价格预测装置700,包括:

第一编码单元701,用于对化工原料原始数据样本中的仓单数据和龙虎榜数据进行独热编码,同时对所述化工原料原始数据样本中的其他数据进行归一化编码,得到第一编码数据;

第二编码单元702,用于通过Box-Cox变换对所述第一编码数据进行处理,得到预处理后的第二编码数据;

分类单元703,用于对所述第二编码数据进行分类,得到包含宏观因子、供需因子、舆情因子和技术因子的化工原料特征库;

高级特征提取单元704,用于依次通过栈式自动编码器和主成分分析方法对所述第二编码数据进行特征提取,得到高级特征;

时间卷积处理单元705,用于将所述高级特征依次通过时间卷积网络、第一全连接层和防过拟合层得到特征数据;

预测单元706,用于将所述特征数据输入双向长短时记忆循环神经网络中进行处理得到特征向量,并将所述特征向量输入第二全连接层进行预测,得出预测的化工原料期货价格。

在一实施例中,所述第一编码单元701包括:

矩阵转换单元,用于对所述舆情数据进行分词和去除停用词处理,取出概率最高的前n个词语进行编号,将词语映射为id,对所述词语代表的id都补全成相同长度的id后,通过预训练的词库和embedding转换成词向量矩阵;

卷积单元,用于通过多个卷积层对所述词向量矩阵按照时间序列方向进行一维卷积,捕获不同尺度的信息;

池化单元,用于通过时序最大池化层对经过卷积的所述词向量矩阵进行处理,并将得到的数据进行合并,将合并的数据输入到第三全连接层;

归一化单元,用于将第三全连接层输出的数据进行归一化处理。

在一实施例中,还包括:

第三编码单元,用于将化工原料历史期货数据进行归一化编码得到第三编码数据;

第四编码单元,用于将第三编码数据通过Box-Cox变换后得到第四编码数据;

傅里叶变换单元,用于将第四编码数据通过傅里叶变换转换成长期趋势特征、中期趋势特征和短期趋势特征;

再拼接单元,用于将所述长期趋势特征、中期趋势特征和短期趋势特征拼接到所述高级特征中。

需要说明的是,所属领域的技术人员可以清楚地了解到,上述化工原料采购量预测装置和各单元的具体实现过程,可以参考前述方法实施例中的相应描述,为了描述的方便和简洁,在此不再赘述。

同时,上述化工原料的期货价格预测装置700中各个单元的划分和连接方式仅用于举例说明,在其他实施例中,可将化工原料的期货价格预测装置700按照需要划分为不同的单元,也可将化工原料的期货价格预测装置700中各单元采取不同的连接顺序和方式,以完成上述化工原料的期货价格预测装置700的全部或部分功能。

上述化工原料的期货价格预测装置700可以实现为一种计算机程序的形式,该计算机程序可以在如图8所示的计算机设备上运行。

请参阅图8,图8是本申请实施例提供的一种计算机设备的示意性框图。该计算机设备800可以是台式机电脑或者服务器等计算机设备,也可以是其他设备中的组件或者部件。

参阅图8,该计算机设备800包括通过系统总线801连接的处理器802、存储器和网络接口805,其中,存储器可以包括非易失性存储介质803和内存储器804。

该非易失性存储介质可存储操作系统8031和计算机程序8032。该计算机程序8032被执行时,可使得处理器802执行上述化工原料的期货价格预测方法。

该处理器802用于提供计算和控制能力,以支撑整个计算机设备800的运行。

该内存储器804为非易失性存储介质803中的计算机程序8032的运行提供环境,该计算机程序8032被处理器802执行时,可使得处理器802执行上述化工原料的期货价格预测方法。

该网络接口805用于与其它设备进行网络通信。本领域技术人员可以理解,图中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图8中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。例如,在一些实施例中,计算机设备800可以仅包括存储器及处理器802,在这样的实施例中,存储器及处理器802的结构及功能与图8所示实施例一致,在此不再赘述。

其中,所述处理器802用于运行存储在存储器中的计算机程序8032,以实现上述化工原料的期货价格预测方法。

应当理解,在本申请实施例中,处理器802可以是中央处理单元(CentralProcessing Unit,CPU),该处理器802还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程,是可以通过计算机程序8032来完成,该计算机程序8032可存储于一计算机可读存储介质。该计算机程序8032被该计算机系统中的至少一个处理器802执行,以实现上述方法的实施例的流程步骤。

因此,本申请还提供一种计算机可读存储介质。该计算机可读存储介质可以为非易失性的计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时使处理器执行上述化工原料的期货价格预测方法。

所述计算机可读存储介质可以是前述设备的内部存储单元,例如设备的硬盘或内存。所述计算机可读存储介质也可以是所述设备的外部存储设备,例如所述设备上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述计算机可读存储介质还可以既包括所述设备的内部存储单元也包括外部存储设备。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的设备、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

所述计算机可读存储介质可以是U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的计算机可读存储介质。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的。例如,各个单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。

本申请实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本申请实施例装置中的单元可以根据实际需要进行合并、划分和删减。另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。

该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台电子设备(可以是个人计算机,终端,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号