首页> 中国专利> 时间序列模型参数优化方法、装置、计算机设备

时间序列模型参数优化方法、装置、计算机设备

摘要

本申请涉及一种时间序列模型参数优化方法、装置、计算机设备和存储介质。所述方法包括:获取表征各品类物品销量的训练时序数据集和验证时序数据集;根据训练时序数据集的时序时长和周期性参数的可优化时序时长范围内,确定可优化的周期性参数集;根据评价指标值和验证时序数据集,确定可优化的周期性参数的周期性参数值;根据训练时序数据集确定节日类型的预设效应值优化节假日项参数,得到节假日项参数值;根据时序时长确定时间序列模型支持的变点数量,根据变点数量对趋势项参数进行优化,得到趋势项参数值,确定时间序列模型的最优参数值组,得到优化后的时间序列模型。采用本方法能够提高时间序列模型对不同品类物品销量预测的准确性。

著录项

  • 公开/公告号CN113837783A

    专利类型发明专利

  • 公开/公告日2021-12-24

    原文格式PDF

  • 申请/专利权人 上海顺如丰来技术有限公司;

    申请/专利号CN202010588655.0

  • 申请日2020-06-24

  • 分类号G06Q30/02(20120101);

  • 代理机构44224 广州华进联合专利商标代理有限公司;

  • 代理人聂榕

  • 地址 200081 上海市虹口区东江湾路444号5楼531室甲

  • 入库时间 2023-06-19 13:49:36

说明书

技术领域

本申请涉及产品销量预测技术领域,特别是涉及一种时间序列模型参数优化方法、装置、计算机设备和存储介质。

背景技术

随着信息化、数据化推进,企业的智慧供应运营建设也变得越来越重要。销量预测作为现代供应链管理的“第一道防线”,对于企业的生产、补货、销售计划均等有着深远的影响。如何对销售表现各异、品类繁多的SKU进行分品类的精确销量预测,是企业供应链的运营的重要基石。目前,应用于销量预测的时序类模型中,基于时序的模型广义可加模型的时间序列prophet模型,因其灵活、解释性强、适用场景广等优点,被业界广泛认同、并应用于各种制造业场景中。

当使用Prophet模型进行分品类预测时,需要使用者对于每个品类的模型参数进行逐一设置,且难度高;若忽略产品品类特性、使用统一的模型参数,导致销量预测结果准确性低。

发明内容

基于此,有必要针对上述技术问题,提供一种能够提高对不同品类物品销量预测准确性的时间序列模型参数优化方法、装置、计算机设备和存储介质。

一种时间序列模型参数优化方法,所述方法包括:

获取表征各品类物品销量的训练时序数据集和验证时序数据集;

当所述训练时序数据集的时序时长在时间序列模型中周期性参数的可优化时序时长范围内时,确定可优化的周期性参数集;

根据评价指标值和所述验证时序数据集,确定所述可优化的周期性参数集中各周期性参数的周期性参数值;

确定所述训练时序数据集对应的节日类型;

根据各所述节日类型的预设效应值优化所述时间序列模型中节假日项参数,得到节假日项参数值;

根据所述时序时长确定所述时间序列模型支持的变点数量,根据所述变点数量优化所述时间序列模型中趋势项参数,得到趋势项参数值;

根据所述各周期性参数值、假日参数值和趋势项参数值得到所述各品类标识对应的目标参数值组。

在其中一个实施例中,所述获取表征各品类物品销量的训练时序数据集和验证时序数据集,包括:

获取表征物品销量的时间序列数据样本;

对所述时间序列数据样本按照品类标识进行分类,得到各品类物品销量的时间序列数据样本;

根据各所述品类物品销量的时间序列数据样本的时序时长和预设时序时长范围,确定训练集时长和验证集时长;

根据所述训练集时长和所述验证集时长,从所述时间序列数据样本中确定各所述品类标识对应的训练时序数据集和验证时序数据集。

在其中一个实施例中,在根据各所述品类物品销量的时间序列数据样本的时序时长和预设时序时长范围,确定训练集时长和验证集时长之前,所述方法还包括:

对各所述品类物品销量的时间序列数据样本进行缺失值处理,检测预处理的时间序列数据样本中是否存在异常数据;

当所述处理后的时间序列数据样本中存在异常数据时,对所述异常数据进行平滑处理。

在其中一个实施例中,在所述当所述训练时序数据集的时序时长在时间序列模型中周期性参数的可优化时序时长范围内时,确定可优化的周期性参数集之前,所述方法还包括:

接收周期参数优化指令;

根据所述周期参数优化指令对所述时间序列模型中的周期类型进行优化,确定所述时间序列模型中周期性参数。

在其中一个实施例中,所述预设效应值包括节前效应值和节后效应值;所述根据各所述节日类型的预设效应值优化所述时间序列模型中节假日项参数,得到节假日项参数值,包括:

将所述节前效应值和所述节后效应值赋值给所述时间序列模型中节假日项的虚拟变量,得到节假日项参数值。

在其中一个实施例中,所述根据所述时序时长确定所述趋势项支持的变点数量,根据所述变点数量确定优化后的趋势项参数值,包括:

根据所述时序时长确定所述趋势项所支持的变点数量;

根据所述变点数量对所述训练时序数据集进行分段,得到时序数据段集;

计算所述时序数据段集中各时序数据段的增长率值,根据各所述增长率值确定预测增长率满值,将所述预测增长率值作为趋势项参数值。

在其中一个实施例中,所述方法还包括:

从服务器中获取用于预测物品销量的时间序列数据;

将所述时间序列数据输入到优化后的时间序列模型,对所述时间序列数据按照品类标识进行分类,得到各所述品类标识的物品在给定时间段内的销量预测值。

一种时间序列模型参数优化装置,所述装置包括:

获取模块,用于获取各品类标识对应的训练时序数据集和验证时序数据集;

判断模块,用于当所述训练时序数据集的时序时长在时间序列模型中周期性参数的可优化时序时长范围内时,确定可优化的周期性参数集;

周期参数优化模块,用于周期根据评价指标值和所述验证时序数据集,确定所述可优化的周期性参数集中各周期性参数的周期参数值;

节假日参数优化模块,用于确定所述训练时序数据集对应的节日类型;根据各所述节日类型的预设效应值优化所述时间序列模型中节假日项参数,得到节假日项参数值;

趋势参数优化模块,用于根据所述时序时长确定所述时间序列模型支持的变点数量,根据所述变点数量优化所述时间序列模型中趋势项参数,得到趋势项参数值;

参数组合模块,用于根据所述各周期性参数值、假日参数值和趋势项参数值得到所述各品类标识对应的目标参数值组型。

一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:

获取各品类标识对应的训练时序数据集和验证时序数据集;

当所述训练时序数据集的时序时长在时间序列模型中周期性参数的可优化时序时长范围内时,确定可优化的周期性参数集;

根据评价指标值和所述验证时序数据集,确定所述可优化的周期性参数集中各周期性参数的周期性参数值;

确定所述训练时序数据集对应的节日类型;

根据各所述节日类型的预设效应值优化所述时间序列模型中节假日项参数,得到节假日项参数值;

根据所述时序时长确定所述时间序列模型支持的变点数量,根据所述变点数量优化所述时间序列模型中趋势项参数,得到趋势项参数值;

根据所述各周期性参数值、假日参数值和趋势项参数值得到所述各品类标识对应的目标参数值组。

一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:

获取各品类标识对应的训练时序数据集和验证时序数据集;

当所述训练时序数据集的时序时长在时间序列模型中周期性参数的可优化时序时长范围内时,确定可优化的周期性参数集;

根据评价指标值和所述验证时序数据集,确定所述可优化的周期性参数集中各周期性参数的周期性参数值;

确定所述训练时序数据集对应的节日类型;

根据各所述节日类型的预设效应值优化所述时间序列模型中节假日项参数,得到节假日项参数值;

根据所述时序时长确定所述时间序列模型支持的变点数量,根据所述变点数量优化所述时间序列模型中趋势项参数,得到趋势项参数值;

根据所述各周期性参数值、假日参数值和趋势项参数值得到所述各品类标识对应的目标参数值组。

上述时间序列模型参数方法、装置、计算机设备和存储介质,通过获取表征各品类物品销量的训练时序数据集和验证时序数据集;根据训练时序数据集的时序时长和周期性参数的可优化时序时长范围,确定时间序列模型中可优化的周期性参数集;根据评价指标值和验证时序数据集,确定可优化的周期性参数集中各周期性参数的周期性参数值;根据训练时序数据集对应的节日类型的预设效应值优化时间序列模型中节假日项参数,得到节假日项参数值;根据时序时长确定时间序列模型支持的变点数量,根据变点数量优化时间序列模型中趋势项参数,得到趋势项参数值;得到时间序列模型的最优参数组合,确定最优时间序列模型,通过根据各品类物品销量的训练时序数据集和验证时序数据集对时间序列模型的参数进行优化,实现对各品类的周期性参数、节假日项参数和趋势项进行优化,得到最优参数组合,提高了时间序列模型对不同品类物品销量预测的准确性。

附图说明

图1为一个实施例中时间序列模型参数优化方法的应用环境图;

图2为一个实施例中时间序列模型参数优化方法的流程示意图;

图3为一个实施例中划分训练时序数据集和验证时序数据集方法的流程示意图;

图4为另一个实施例中时间序列模型参数优化方法的流程示意图;

图5为一个实施例中时间序列模型参数优化装置的结构框图;

图6为另一个实施例中时间序列模型参数优化装置的结构框图;

图7为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

本申请提供的时间序列模型参数优化方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。终端102从服务器104中获取表征各品类物品销量的训练时序数据集和验证时序数据集;当训练时序数据集的时序时长在时间序列模型中周期性参数的可优化时序时长范围内时,确定可优化的周期性参数集;根据评价指标值和验证时序数据集,确定可优化的周期性参数集中各周期性参数的周期性参数值;确定训练时序数据集对应的节日类型;根据各节日类型的预设效应值优化时间序列模型中节假日项参数,得到节假日项参数值;根据时序时长确定时间序列模型支持的变点数量,根据变点数量优化时间序列模型中趋势项参数,得到趋势项参数值;根据各周期性参数值、节假日参数值和趋势项参数值得到各品类标识对应的目标参数值组,得到优化后的时间序列模型。其中,终端102可以但不限于是各种个人计算机、笔记本电脑,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中,如图2所示,提供了一种时间序列模型参数优化方法,以该方法应用于图1中的终端为例进行说明,包括以下步骤:

步骤202,获取表征各品类物品销量的训练时序数据集和验证时序数据集。

其中,训练时序数据集是用于训练时间序列模型;验证时序数据集用于对训练好的时间序列模型进行验证。时序数据集中每个时序数据中包括表征物品销售时间的时序和表征物品销售数量的数值。

时间序列模型中包括周期项、节假日项和趋势项;时间序列模型可以是Prophet模型,可以表示为:

y(t)=g(t)+s(t)+11(t)+∈

其中,s(t)为周期项,g(t)为趋势项,h(t)为节假日项,∈是误差项。

具体地,从服务器的数据库中获取表征物品销量的时间序列数据样本,时间序列数据样本中各时间序列数据携带品类标识,将时间序列数据样本输入至时间序列模型中,根据品类标识对时间序列数据样本进行分类,得到各表征各品类物品销量的时间序列数据样本,例如,从数据库中获取物品生产供应链中的时间序列数据样本1,时间序列数据样本中包括A类物品的销量数据、B类物品的销量数据、C类物品的销量数据,根据A类物品、B类物品和C类物品各对应的品类标识对时间序列数据样本1进行分类,得到时间序列数据样本A、时间序列数据样本B和时间序列数据样本C;确定时间序列数据样本的数据颗粒度,根据数据颗粒度确定时间序列数据样本的时长;根据时长确定各品类物品销量的训练时序数据集和验证时序数据集。其中,数据颗粒度包括日度颗粒度、周度颗粒度、月度颗粒度和年度颗粒度。

步骤204,当训练时序数据集的时序时长在时间序列模型中周期性参数的可优化时序时长范围内时,确定可优化的周期性参数集。

其中,时序时长是指以日度为维度来确定训练时序数据集的时序时长;例如,训练时序数据集中包括500个A类物品销量数据,以日度为维度确定500个A类物品销量数据对应的数据点为60个。时序时长还可以周度、月度和年度为维度进行确定,在此不做限定。不同类型的周期的参数对应的时序时长不同,如表1所示,当训练时序数据集的时序时长在(0,21)天范围时,表明训练时序数据集不支持时间序列模型运算,得到优化后的时间序列模型预测的准确性低,支持简单时间序列模型运算,得到物品在7为周期的预测销量值;当训练时序数据集的时序时长在[21,45)天范围时,可对周周期、季节性模式的参数进行优化,不支持月周期,年周期的参数优化;当训练时序数据集的时序时长在[45,400)天范围时,可对周周期、月周期和季节性模式的参数进行优化,不支持年周期的参数优化;当训练时序数据集的时序时长在[400,+)天范围时,可对周周期、月周期、年周期和季节性模式的参数进行优化。周期性参数集中包括周周期、月周期和年周期中至少一种周期性参数。

具体地,终端接收周期参数优化指令,对时间序列模型中的周期类型进行优化;其中,时间序列模型默认周期为年周期、周周期和日周期,根据周期参数优化指令对时间序列模型默认周期进行优化,确定时间序列模型的周期类型为周周期、月周期和年周期,确定时间序列模型中周期性参数;当训练时序数据集的时序时长在时间序列模型中周期性参数的可优化时序时长范围内时,确定可优化的周期性参数集。周期参数优化指令携带的优化周期类型根据预设数据的应用场景确定,例如,在制造业的应用场景中,需根据月度预测销量值可对供应量上的库存数量和销量进行物品合理分配管理,如,月末冲销量,需在时间序列模型中添加月周期。

表1:

步骤206,根据评价指标值和验证时序数据集,确定可优化的周期性参数集中各周期性参数的周期性参数值。

其中,评价指标可包括平均绝对误差(Mean Absolute Error,MAE)、均方误差(Mean Square Error,MSE)、均方根误差(Root Mean Square Error,RMSE)、平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)中任意一种,评价指标根据商品的实际需求来确定。

时间序列数据模型存在周周期、月周期、年周期和季节性模式。时间序列模型中的周期项是否存在周周期、月周期和年周期的周期类型时,可通过布尔参数值“True”和“False”来表示,每种周期类型存在“True”和“False”两种情况,其中True表示存在周期,False表示不存在周期;周期项可存在八种周期性模型,即存在对应的八个周期参数组:{(True,True,True),(False,False,False),(True,True,False),(True,False,True),(True,False,False),(False,True,False),(False,True,True),(False,False,True)};例如,“True,True,True”可代表存在周周期、月周期和年周期,“True,False,False”代表存在周周期,不存在月周期和年周期。季节性模式的对应的参数值为Multiplicative(累乘)和additive(累加)中任意一种。

具体地,根据训练时序数据集按照上述周期参数组进行训练,可得到训练好的周期性模型;通过将验证时序数据集输入到训练好的八种周期模性模型中,得到验证结果;根据评价指标对验证结果进行指标计算,确定周期参数的周期参数值,根据周期参数值确定可优化的周期性参数集中各周期性参数的周期性参数值。例如,周期参数值为True,则获取预先设置好周期类型对应的周期性参数值。可选的周期性模型为:

其中,N表示周期性参数,即傅里叶阶数;P表示周期长度;a

步骤208,确定训练时序数据集对应的节日类型。

其中,时间序列模型中内置了预先设置好的节日类型、节日名称和预设效应值,其中预设效应值包括节前效应值和节后效应值。如表2所示,节日类型包括传统中国节日、西方节日和销售节等;传统中国节日包括元旦、春节、清明节、劳动节、中秋节和国庆节等;西方节日包括情人节、妇女节和圣诞节等;销售节包括6.18促销节、双十一促销节、双十二促销节等,不同的节日存在对应的预设效应值。

表2:

步骤210,根据各节日类型的预设效应值优化时间序列模型中节假日项参数,得到节假日项参数值。

具体地,根据训练时序数据集确定的节日类型中的节日名称,获取节日名称的节前效应值和节后效应值,将节前效应值和节后效应值输入到节假日项模型中,得到节假日项参数值。

步骤212,根据时序时长确定时间序列模型支持的变点数量,根据变点数量优化时间序列模型中趋势项参数,得到趋势项参数值。

步骤214,根据各周期性参数值、节假日参数值和趋势项参数值得到各品类标识对应的目标参数值组。

上述时间序列模型参数优化方法中,通过从服务器中获取表征各品类物品销量的训练时序数据集和验证时序数据集;根据训练时序数据集的时序时长和可优化的周期性参数和可优化时序时长范围,确定各品类物品的训练时序数据集对应可优化周期性参数;基于网格搜索,通过评价指标值和验证时序数据集确定可优化的周期性参数集中各周期性参数的周期性参数值;通过对时间序列模型中内置的节日信息进行配置,对时间序列模型中节假日项参数,得到节假日项参数值;根据时序时长确定时间序列模型支持的变点数量,根据变点数量优化时间序列模型中趋势项参数,得到趋势项参数值;根据优化得到的周期性参数值、节假日项参数值和趋势项参数值确定优化的时间序列模型。通过根据训练时序数据集的时序时长对周期性参数和趋势项参数进行优化,以及通过配置节日信息对节日项参数进行优化,确定节假日项参数值,根据得到参数组合确定优化后的时间序列模型,可同时对不同品类物品销量进行预测,不需手动调节模型参数,提高了模型预测的准确性。

在一个实施例中,如图3所示,提供了一种确定各品类物品销量的训练时序数据集和验证时序数据集方法,以该方法应用于图1中的终端为例进行说明,包括以下步骤:

步骤302,获取表征物品销量的时间序列数据样本。

步骤304,对时间序列数据样本按照品类标识进行分类,得到各品类物品销量的时间序列数据样本。

步骤306,对各品类物品销量的时间序列数据样本进行缺失值处理,检测预处理的时间序列数据样本中是否存在异常数据。

步骤308,当处理后的时间序列数据样本中存在异常数据时,对异常数据进行平滑处理。

具体地,当检测到各品类物品销量的时间序列数据样本中存在缺失值,对缺失项进行补零处理;当处理后的时间序列数据样本中存在数值大于时间序列数据样本均值3倍标准差的数据时,则该数据为异常数据,将该异常数据的数值更新为时间序列数据样本均值3倍标准差的数值。通过对时间序列数据进行预处理,避免数据丢失导致时间序列模型预测的准确性低。

步骤310,根据各品类物品销量的时间序列数据样本的时序时长和预设时序时长范围,确定训练集时长和验证集时长。

步骤312,根据训练集时长和验证集时长,从时间序列数据样本中确定各品类标识对应的训练时序数据集和验证时序数据集。

具体地,根据时间序列数据样本的时长对时间序列数据进行分割,得到用于优化周期参数的训练时序数据集和验证时序数据集。可选地,根据时长对时间序列数据进行分割,得到用于优化周期参数的训练集和验证集包括:根据时长对应的预设总时长区间,确定训练集和验证集的分割比值;根据分割比值对时间序列数据进行分割,得到用于优化周期项参数的训练集和验证集。如表3所示,本方案中的时间序列数据样本的时长T需满足时长大于或等于21天,当时长在[21,45)天预设总时长区间时,以T-7时长对应的时间序列数据样本作为训练时序数据集,以时长后七天对应的时间序列数据样本作为验证时序数据集;当时长在[45,400)天预设总时长区间时,从70%*T时长和(T-30)天中选取值最大的时长对应的时间序列数据样本作为训练时序数据集,以后七天时长对应的时间序列数据样本作为验证时序数据集;当时长在[400,+)天预设总时长区间时,以T-30时长对应的时间序列数据样本作为训练时序数据集,以时长后三十天时长对应的时间序列数据样本作为验证时序数据集。

表3:

本实施例中,通过对从服务器中获取的时间序列数据样本,根据时间序列数据样本携带的品类标识进行分类,得到各品类物品销量的时间序列数据样本,在对表征各品类物品销量的时间序列数据样本划分训练时序数据集和验证时序数据集之前,对数据进行缺失值补零处理和数据平滑处理;根据时间序列数据样本时序时长所在的预设时序时长范围对数据进行划分,得到对应的训练时序数据集和验证时序数据集;能够确定时间序列数据样本的完整性,和提高时间序列模型预测的准确性。

在另一个实施例中,如图4所示,提供了一种时间序列模型参数优化方法,以该方法应用于图1中的终端为例进行说明,包括以下步骤:

步骤402,获取表征各品类物品销量的训练时序数据集和验证时序数据集。

步骤404,接收周期参数优化指令。

具体地,周期参数优化指令用于对时间序列模型中的内置周期类型进行优化。例如,时间序列周期模型中的内置周期类型包括年周期、周周期和日周期;日周期适用于预测一天内的波动情况,例如,车站10点人多,18点人少等情况;在实际制造业需求,日内周期预测获取的数据量小,数据利用率低;以应对“月末冲销量”的情况,对时间周期序列模型中的日周期进行优化,增加月周期类型,删除日周期。

步骤406,根据周期参数优化指令对时间序列模型中的周期类型进行优化,确定时间序列模型中周期性参数。

步骤408,当训练时序数据集的时序时长在时间序列模型中周期性参数的可优化时序时长范围内时,确定可优化的周期性参数集。

步骤410,根据评价指标值和验证时序数据集,确定可优化的周期性参数集中各周期性参数的周期性参数值。

步骤412,确定训练时序数据集对应的节日类型。

步骤414,将节日类型的节前效应值和节后效应值赋值给时间序列模型中节假日项的虚拟变量,得到节假日项参数值。

步骤416,根据时序时长确定趋势项所支持的变点数量;根据变点数量对训练时序数据集进行分段,得到时序数据段集。

步骤418,计算时序数据段集中各时序数据段的增长率值,根据各增长率值确定预测增长率值,将预测增长率值作为趋势项参数值。

具体地,以天为颗粒度,确定训练时序数据集的时序时长;根据时序时长确定对应的预设时序时长范围,以预设训练时序数据集天数为周期,确定趋势项可支持的变点数量;根据得到的变量点数对进行分段,得到时序数据段集。如表4所示,当时序时长在(0,21)天范围内时,以预设训练时序数据集天数3为一个周期,确定趋势项可支持的变点数量为时序时长除3得到的整数值;当时序时长在[21,100)天范围内时,以预设训练时序数据集天数5为一个周期,确定趋势项可支持的变点数量为时序时长除5得到的整数值;当时序时长在[100,200)天范围内时,趋势项可支持的变点数量为25;当时序时长在[200,+inf)天范围内时,以预设训练时序数据集天数7为周期,确定趋势项可支持的变点数量为时序时长除7得到的整数值。

表4:

例如,时序时长为270天,在[200,+inf)天范围内时,以预设训练时序数据集天数7为周期,确定趋势项可支持的变点数量为30,将训练时序数据集划分为30个时序数据段,计算每一段的斜率值,即增长率值;根据增长率值服从拉普拉斯分布,得到在给定时间段内的预测增长率值,即趋势项参数值。

步骤420,根据各周期性参数值、节假日参数值和趋势项参数值得到各品类标识对应的目标参数值组。

可选地,在一个实施例中,从服务器中获取用于预测物品销量的时间序列数据;将时间序列数据输入到优化后的时间序列模型,对时间序列数据按照品类标识进行分类,得到各品类标识的物品在给定时间段内的销量预测值。可选地,从服务器的数据库中获取用于预测物品销量的时间序列数据;其中,时间序列数据中包括“01”、“02”、“03”三种品类标识的物品的销量数据,将时间序列数据输入至优化后的时间序列模型中,按照品类标识对时间序列数据进行区分,得到三种品类标识对应的时间序列数据和确定对应的参数值组,通过优化后的时间序列模型预测在给定时间段内的各品类标识对应的物品的预测销量,不需要人工进行参数调节,根据预测销量可对供应链上各节点的进行合理分配,提高资源的合理分配,以及提高了时间序列模型的通用性。

上述时间模型参数优化方法中,在对时间序列模型参数进行优化之前,根据预测场景触发生成周期参数优化指令对时间序列模型进行优化,确定预测场景对应的周期类型;根据训练时序数据集的时序时长确定可优化的周期性参数集,根据表征各品类物品销量的训练时序数据集、验证时序数据集和评价指标值确定可优化的周期性参数集中各周期性参数的周期性参数值;通过对时间序列模型中内置的节日信息进行配置,对时间序列模型中节假日项参数,得到节假日项参数值;根据时序时长确定时间序列模型支持的变点数量,根据变点数量对训练时序数据集划分,得到时序数据段集,基于各时序数据段的增长率值服从拉普拉斯分布,确定预测预测增长率值,得到趋势项参数值;根据优化得到的周期性参数值、节假日项参数值和趋势项参数值确定优化的时间序列模型。通过对周期性参数、节假日项参数和趋势项参数进行优化,可提高时间序列模型预测的准确性和模型通用性。

应该理解的是,虽然图2-4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-4中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中,如图5所示,提供了一种时间序列模型参数优化装置,包括:获取模块502、判断模块504、周期参数优化模块506、节假日参数优化模块508、趋势参数优化模块510和参数组合模块512,其中:

获取模块502,用于获取表征各品类物品销量的训练时序数据集和验证时序数据集。

判断模块504,用于当训练时序数据集的时序时长在时间序列模型中周期性参数的可优化时序时长范围内时,确定可优化的周期性参数集。

周期参数优化模块506,用于周期根据评价指标值和验证时序数据集,确定可优化的周期性参数集中各周期性参数的周期参数值。

节假日参数优化模块508,用于确定训练时序数据集对应的节日类型;根据各节日类型的预设效应值优化时间序列模型中节假日项参数,得到节假日项参数值,预设效应值包括节前效应值和节后效应值。

趋势参数优化模块510,用于根据时序时长确定时间序列模型支持的变点数量,根据变点数量优化时间序列模型中趋势项参数,得到趋势项参数值。

参数组合模块512,用于根据各周期性参数值、假日参数值和趋势项参数值得到各品类标识对应的目标参数值组。

上述时间序列模型参数优化装置中,通过从服务器中获取表征各品类物品销量的训练时序数据集和验证时序数据集;根据训练时序数据集的时序时长和可优化的周期性参数和可优化时序时长范围,确定各品类物品的训练时序数据集对应可优化周期性参数;基于网格搜索,通过评价指标值和验证时序数据集确定可优化的周期性参数集中各周期性参数的周期性参数值;通过对时间序列模型中内置的节日信息进行配置,对时间序列模型中节假日项参数,得到节假日项参数值;根据时序时长确定时间序列模型支持的变点数量,根据变点数量优化时间序列模型中趋势项参数,得到趋势项参数值;根据优化得到的周期性参数值、节假日项参数值和趋势项参数值确定优化的时间序列模型。通过根据训练时序数据集的时序时长对周期性参数和趋势项参数进行优化,以及通过配置节日信息对节日项参数进行优化,确定节假日项参数值,根据得到参数组合确定优化后的时间序列模型,可同时对不同品类物品销量进行预测,不需手动调节模型参数,提高了模型预测的准确性。

在另一个实施例中,如图6所示,提供了一种时间序列模型参数优化装置,除包括:获取模块502、判断模块504、周期参数优化模块506、节假日参数优化模块508、趋势参数优化模块510和参数组合模块512之外,还包括:其中:

在一个实施例中,获取模块502还用于获取表征物品销量的时间序列数据样本。

分类模块514,用于对时间序列数据样本按照品类标识进行分类,得到各品类物品销量的时间序列数据样本。

确定模块516,用于根据各品类物品销量的时间序列数据样本的时序时长和预设时序时长范围,确定训练集时长和验证集时长;根据训练集时长和验证集时长,从时间序列数据样本中确定各品类标识对应的训练时序数据集和验证时序数据集。

预处理模块518,用于对各品类物品销量的时间序列数据样本进行缺失值处理,检测预处理的时间序列数据样本中是否存在异常数据;当处理后的时间序列数据样本中存在异常数据时,对异常数据进行平滑处理。

在一个实施例中,周期参数优化模块506还用于接收周期参数优化指令;根据周期参数优化指令对时间序列模型中的周期类型进行优化,确定时间序列模型中周期性参数。

在一个实施例中,节假日参数优化模块508还用于将节前效应值和节后效应值赋值给时间序列模型中节假日项的虚拟变量,得到节假日项参数值。

在一个实施例中,趋势参数优化模块510还用于根据时序时长确定趋势项所支持的变点数量;根据变点数量对训练时序数据集进行分段,得到时序数据段集;计算时序数据段集中各时序数据段的增长率值,根据各增长率值确定预测增长率值,将预测增长率值作为趋势项参数值。

预测模块520,用于从服务器中获取用于预测物品销量的时间序列数据;将时间序列数据输入到优化后的时间序列模型,对时间序列数据按照品类标识进行分类,得到各品类标识的物品在给定时间段内的销量预测值。

在一个实施例中,通过对从服务器中获取的时间序列数据样本,根据时间序列数据样本携带的品类标识进行分类,得到各品类物品销量的时间序列数据样本,在对表征各品类物品销量的时间序列数据样本划分训练时序数据集和验证时序数据集之前,对数据进行缺失值补零处理和数据平滑处理;根据时间序列数据样本时序时长所在的预设时序时长范围对数据进行划分,得到对应的训练时序数据集和验证时序数据集。

根据训练时序数据集的时序时长和可优化的周期性参数和可优化时序时长范围,确定各品类物品的训练时序数据集对应可优化周期性参数;基于网格搜索,通过评价指标值和验证时序数据集确定可优化的周期性参数集中各周期性参数的周期性参数值;通过对时间序列模型中内置的节日信息进行配置,对时间序列模型中节假日项参数,得到节假日项参数值;根据时序时长确定时间序列模型支持的变点数量,根据变点数量优化时间序列模型中趋势项参数,得到趋势项参数值;根据优化得到的周期性参数值、节假日项参数值和趋势项参数值确定优化的时间序列模型。

关于时间序列模型参数优化装置的具体限定可以参见上文中对于时间序列模型参数优化方法的限定,在此不再赘述。上述时间序列模型参数优化装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种时间序列模型参数优化方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:

获取表征各品类物品销量的训练时序数据集和验证时序数据集;

当训练时序数据集的时序时长在时间序列模型中周期性参数的可优化时序时长范围内时,确定可优化的周期性参数集;

根据评价指标值和验证时序数据集,确定可优化的周期性参数集中各周期性参数的周期性参数值;

确定训练时序数据集对应的节日类型;

根据各节日类型的预设效应值优化时间序列模型中节假日项参数,得到节假日项参数值;

根据时序时长确定时间序列模型支持的变点数量,根据变点数量优化时间序列模型中趋势项参数,得到趋势项参数值;

根据各周期性参数值、节假日参数值和趋势项参数值得到各品类标识对应的目标参数值组。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:

获取表征物品销量的时间序列数据样本;

对时间序列数据样本按照品类标识进行分类,得到各品类物品销量的时间序列数据样本;

根据各品类物品销量的时间序列数据样本的时序时长和预设时序时长范围,确定训练集时长和验证集时长;

根据训练集时长和验证集时长,从时间序列数据样本中确定各品类标识对应的训练时序数据集和验证时序数据集。

在一个实施例中,处理器执行计算机程序时还实现以下步骤;

对各品类物品销量的时间序列数据样本进行缺失值处理,检测预处理的时间序列数据样本中是否存在异常数据;

当处理后的时间序列数据样本中存在异常数据时,对异常数据进行平滑处理。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:

接收周期参数优化指令;

根据周期参数优化指令对时间序列模型中的周期类型进行优化,确定时间序列模型中周期性参数。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:

将节前效应值和节后效应值赋值给时间序列模型中节假日项的虚拟变量,得到节假日项参数值。

在一个实施例中,处理器执行计算机程序时还实现以下步骤;

根据时序时长确定趋势项所支持的变点数量;

根据变点数量对训练时序数据集进行分段,得到时序数据段集;

计算时序数据段集中各时序数据段的增长率值,根据各增长率值确定预测增长率满值,将预测增长率值作为趋势项参数值。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:

从服务器中获取用于预测物品销量的时间序列数据;

将时间序列数据输入到优化后的时间序列模型,对时间序列数据按照品类标识进行分类,得到各品类标识的物品在给定时间段内的销量预测值。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:

获取表征各品类物品销量的训练时序数据集和验证时序数据集;

当训练时序数据集的时序时长在时间序列模型中周期性参数的可优化时序时长范围内时,确定可优化的周期性参数集;

根据评价指标值和验证时序数据集,确定可优化的周期性参数集中各周期性参数的周期性参数值;

确定训练时序数据集对应的节日类型;

根据各节日类型的预设效应值优化时间序列模型中节假日项参数,得到节假日项参数值;

根据时序时长确定时间序列模型支持的变点数量,根据变点数量优化时间序列模型中趋势项参数,得到趋势项参数值;

根据各周期性参数值、节假日参数值和趋势项参数值得到各品类标识对应的目标参数值组。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

获取表征物品销量的时间序列数据样本;

对时间序列数据样本按照品类标识进行分类,得到各品类物品销量的时间序列数据样本;

根据各品类物品销量的时间序列数据样本的时序时长和预设时序时长范围,确定训练集时长和验证集时长;

根据训练集时长和验证集时长,从时间序列数据样本中确定各品类标识对应的训练时序数据集和验证时序数据集。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

对各品类物品销量的时间序列数据样本进行缺失值处理,检测预处理的时间序列数据样本中是否存在异常数据;

当处理后的时间序列数据样本中存在异常数据时,对异常数据进行平滑处理。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

接收周期参数优化指令;

根据周期参数优化指令对时间序列模型中的周期类型进行优化,确定时间序列模型中周期性参数。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

将节前效应值和节后效应值赋值给时间序列模型中节假日项的虚拟变量,得到节假日项参数值。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

根据时序时长确定趋势项所支持的变点数量;

根据变点数量对训练时序数据集进行分段,得到时序数据段集;

计算时序数据段集中各时序数据段的增长率值,根据各增长率值确定预测增长率满值,将预测增长率值作为趋势项参数值。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

从服务器中获取用于预测物品销量的时间序列数据;

将时间序列数据输入到优化后的时间序列模型,对时间序列数据按照品类标识进行分类,得到各品类标识的物品在给定时间段内的销量预测值。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号