首页> 中国专利> 基于多数据源的目标对象预测方法及其相关设备

基于多数据源的目标对象预测方法及其相关设备

页面导航

摘要
著录项
说明书
相似文献

摘要

本申请属于人工智能领域，涉及基于多数据源的目标对象预测方法及其相关设备，该方法包括:确定待预测的目标因子；从多个数据源获取与目标因子相关的历史数据并分别输入预设的预测模型，输出目标因子的多个预测值，并根据预测值得到目标因子的第一整体预测值；将与目标因子相关的历史数据合并后输入预设的预测模型中，输出目标因子的第二整体预测值；若第一整体预测值的偏差值超出第二整体预测值的偏差值，根据二者对目标因子的多个预测值进行修正，得到目标预测值。本申请还涉及区块链技术，所述多数据源的历史数据存储于区块链中。本申请方案可以对目标对象实现有效的预测，且预测稳定性高。

著录项

公开/公告号CN112182118A

专利类型发明专利
公开/公告日2021-01-05

原文格式PDF
申请/专利权人中国平安人寿保险股份有限公司;
展开▼

申请/专利号CN202011052081.1
发明设计人陈远波;
展开▼

申请日2020-09-29
分类号G06F16/28(20190101);G06Q30/02(20120101);
代理机构44385 深圳市世联合知识产权代理有限公司;
代理人汪琳琳
地址 518000 广东省深圳市福田区益田路5033号平安金融中心14、15、16、37、41、44、45、46层
入库时间 2023-06-19 09:27:35

说明书

技术领域

本申请涉及人工智能技术领域，尤其涉及基于多数据源的目标对象预测方法、装置、计算机设备及存储介质。

背景技术

在大数据背景下，往往存在基于历史数据对指定的目标对象进行预测的情形，现有基于历史数据进行预测时一般通过单一的数据源进行局部的预测，此类预测受限于数据源的数据范围，并不能真正实现客观且有效的预测，导致预测准确性较低，且预测效果不稳定。如何实现对目标对象的准确且稳定的预测成为亟待解决的问题。

发明内容

本申请实施例的目的在于提出一种基于多数据源的目标对象预测方法、装置、计算机设备及存储介质，以解决现有技术中对目标对象进行预测时准确性较低，且预测效果不稳定的问题。

为了解决上述技术问题，本申请实施例提供一种基于多数据源的目标对象预测方法，采用了如下所述的技术申请实施例：

一种基于多数据源的目标对象预测方法，包括下述步骤：

接收目标对象预测指令，根据所述目标对象预测指令确定待预测的目标因子；

根据所述目标对象预测指令从多个数据源获取与所述目标因子相关的历史数据，将从所述多个数据源获取的历史数据分别输入至预设的预测模型中，输出所述目标因子的多个预测值，并根据各所述预测值计算得到所述目标因子的第一整体预测值；

将所述多个数据源中与所述目标因子相关的历史数据进行合并，将合并数据输入至所述预设的预测模型中，输出所述目标因子的第二整体预测值；

判断所述第一整体预测值的偏差值是否超出所述第二整体预测值的偏差值，若是则根据所述第一整体预测值和所述第二整体预测值对所述目标因子的多个预测值进行修正，得到所述目标因子的目标预测值，并根据所述目标预测值输出所述目标对象的预测结果。

为了解决上述技术问题，本申请实施例还提供一种基于多数据源的目标对象预测装置，采用了如下所述的技术申请实施例：

一种基于多数据源的目标对象预测装置，包括：

目标因子确定模块，用于接收目标对象预测指令，根据所述目标对象预测指令确定待预测的目标因子；

第一预测模块，用于根据所述目标对象预测指令从多个数据源获取与所述目标因子相关的历史数据，将从所述多个数据源获取的历史数据分别输入至预设的预测模型中，输出所述目标因子的多个预测值，并根据各所述预测值计算得到所述目标因子的第一整体预测值；

第二预测模块，用于将所述多个数据源中与所述目标因子相关的历史数据进行合并，将合并数据输入至所述预设的预测模型中，输出所述目标因子的第二整体预测值；

判断处理模块，用于判断所述第一整体预测值的偏差值是否超出所述第二整体预测值的偏差值，若是则根据所述第一整体预测值和所述第二整体预测值对所述目标因子的多个预测值进行修正，得到所述目标因子的目标预测值，并根据所述目标预测值输出所述目标对象的预测结果。

为了解决上述技术问题，本申请实施例还提供一种计算机设备，采用了如下所述的技术申请实施例：

一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机可读指令，所述处理器执行所述计算机可读指令时实现如上所述的基于多数据源的目标对象预测方法的步骤。

为了解决上述技术问题，本申请实施例还提供一种计算机可读存储介质，采用了如下所述的技术申请实施例：

一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机可读指令，所述计算机可读指令被处理器执行时实现如上所述的基于多数据源的目标对象预测方法的步骤。

与现有技术相比，本申请实施例提供的基于多数据源的目标对象预测方法、装置、计算机设备及存储介质主要有以下有益效果：

本申请充分利用大数据，利用历史数据进行基于多数据源的模型预测分析，针对多个目标因子进行局部和整体的预测，并基于整体的预测值对局部的预测值进行修正，得到基于多数据源的预测结果，可以对目标对象实现有效的预测，且预测稳定性高。

附图说明

为了更清楚地说明本申请中的申请实施例，下面将对本申请实施例描述中所需要使用的附图作一个简单介绍，下面描述中的附图对应于本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请可以应用于其中的示例性系统架构图；

图2是根据本申请的基于多数据源的目标对象预测方法的一个实施例的流程图；

图3是根据本申请的基于多数据源的目标对象预测装置的一个实施例的结构示意图；

图4是根据本申请的计算机设备的一个实施例的结构示意图。

具体实施方式

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同；本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本申请；本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形，意图在于覆盖不排他的包含。本申请说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象，而不是用于描述特定顺序。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

为了使本技术领域的人员更好地理解本申请申请实施例，下面将结合附图，对本申请实施例中的技术申请实施例进行清楚、完整地描述。

如图1所示，系统架构100可以包括终端设备101、102、103，网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互，以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用，例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。

终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备，包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving PictureExpertsGroup Audio Layer III，动态影像专家压缩标准音频层面3)、MP4(MovingPictureExperts Group Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。

服务器105可以是提供各种服务的服务器，例如对终端设备101、102、103上显示的页面提供支持的后台服务器。

需要说明的是，本申请实施例所提供的基于多数据源的目标对象预测方法一般由服务器执行，相应地，基于多数据源的目标对象预测装置一般设置于服务器中。

应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。

继续参考图2，其示出了根据本申请的基于多数据源的目标对象预测方法的一个实施例的流程图。所述的基于多数据源的目标对象预测方法包括以下步骤：

S201,接收目标对象预测指令，根据所述目标对象预测指令确定待预测的目标因子；

S202,根据所述目标对象预测指令从多个数据源获取与所述目标因子相关的历史数据，将从所述多个数据源获取的历史数据分别输入至预设的预测模型中，输出所述目标因子的多个预测值，并根据各所述预测值计算得到所述目标因子的第一整体预测值；

S203,将所述多个数据源中与所述目标因子相关的历史数据进行合并，将合并数据输入至所述预设的预测模型中，输出所述目标因子的第二整体预测值；

S204,判断所述第一整体预测值的偏差值是否超出所述第二整体预测值的偏差值，若是则根据所述第一整体预测值和所述第二整体预测值对所述目标因子的多个预测值进行修正，得到所述目标因子的目标预测值，并根据所述目标预测值输出所述目标对象的预测结果。

下面对上述步骤进行展开说明。

对于步骤S201，在具体实施例中可以根据所述目标对象预测指令确定多个目标因子，针对每个目标因子执行后续步骤S202至S204可得到各目标因子的目标预测值，在步骤S204中可以根据多个目标因子的目标预测值，输出所述目标对象的综合的预测结果。

下述实施例中，除非特别说明，均以根据所述目标对象预测指令确定一个目标因子为例对本申请提供的方案进行解释说明，但不对目标因子的个数构成限定，意味着下述实施例的方案可以针对多个目标因子依次进行执行。

所述目标对象预测指令可以由用户从终端实时发起，也可以是后台系统根据预设的预测周期自动触发目标对象预测指令，比如按月对目标对象进行预测，则按照周期性的预设时间节点在每个月固定时间触发目标对象预测指令。

在本申请实施例中，目标对象可为产品或机构，比如在保险公司有不同的保险产品，基于不同的保险类型有不同的机构(公司)，可以对产品的销售预测，或者对机构的经营状况、所需人力等的预测，销售、经营状况、所需人力等为被预测的目标对象的预测纬度，每个预测纬度可以对应有相关的待预测的目标因子(或称指标)。以本申请实施例提供的方法应用于公司决策为例，公司决策需要以最快的方式感知公司经营状况及人员动向，其中公司的经营状况包含NBEV(New Business Embedded Value)，是指在充分考虑总体风险的情况下，适用业务对应的资产未来产生的收益中可以分配给股东的利益的现值，以对保险业务经济价值的评估为例，NBEV就是保险业务能产生的未来收益的现值总和，包括新业务内含价值，即新销售业务所创造的价值；公司的人员动向包含新增人力和脱落人力等；此时进行公司决策时需要对公司经营状况及人员动向这类的目标对象的目标因子进行预测，比如在经营状况预测纬度中的NBEV这一待预测的目标因子。本申请实施例的对象预测指令中包含有目标对象的相关信息，因此根据目标对象预测指令可以确定带预测的目标对象，并由此进一步确定预测纬度以及对应的待预测的目标因子。

对于步骤S202，具体的，同一个目标因子可从多个数据源中获取多份历史数据，该多份历史数据相互独立，同样的以本申请实施例提供的方法应用于公司决策为例，公司有多个机构(子公司或办事机构)，这些机构之间往往存在业务交叉，但是经营数据和人员数据又互相独立，即存在多个经营和人员相关的数据源，这些数据源互相独立，可以体现对应的机构经营状况及人员动向，因此可以从每个数据源获取一份历史数据，每一份历史数据输入到预设的预测模型中后，可以对应地得到目标因子的一个预测值，即每一个目标因子通过多份历史数据可以得到多个预测值，步骤S202中目标因子的预测值不是目标因子的最终预测值，因为此处目标因子的预测值是基于单数据源获得的，目标因子的最终预测值为步骤S204中所述的目标预测值，应用于公司决策时，以NBEV为目标因子为例，与NBEV相关的历史数据具体为历史按月份得到的NBEV数据，基于预设的历史时间段内的NBEV数据和预测模型直接对未来的某个时间段内的NBEV进行预测，得到NBEV的目标预测值可用于分析公司的经营状态，以据此及时作出反馈预警。

在一些实施例中，所述方法包括多个预设的预测模型。相应的，所述将从所述多个数据源获取的历史数据分别输入至预设的预测模型中，输出所述目标因子的多个预测值包括：将从各所述数据源获取的历史数据分别输入至各所述预设的预测模型中，得到多组准预测值，从各组准预测值中筛选出偏差值最小的准预测值作为所述目标因子的预测值，得到所述目标因子的多个预测值。

其中，每个预设的预测模型采用不同的算法，在本申请实施例中，具体可包括移动平均趋势剔除法、ARIMA(Autoregressive Integrated Moving Average model，差分整合移动平均自回归模型)、ETS(ETS为Error,Trend,Seasonality,分别表示指数模型中的误差项、趋势项、季节项，ETS也可以理解为ExponenTial Smoothing模型)和LSTM(Long Short-Term Memory，长短期记忆网络)等，基于每个算法构建一个具体的预测模型，这些预测模型均属于时间序列模型，将步骤S202从每个数据库获取一份历史数据输入不同的预测模型可得到目标因子的多个准预测值，即基于每个数据库获得的历史数据可得到目标因子的一组准预测值，这些准预测值是各个时间序列模型预测值的最优值，依据各个模型预测的最小偏差原理，对各个准预测值进行偏差分析，将偏差值最小的准预测值作为最终值，即为步骤202中所述目标因子的预测值。比如以NBEV为例，分别用移动平均趋势剔除法、ARIMA、ETS和LSTM等算法预测NBEV，从中挑选出最优模型的预测值作为最优解，最优模型是历史预测精度最高的模型。

在一些实施例中，所述偏差值通过所述目标因子的历史值和历史预测值来确定，由此进行偏差分析，具体可通过当前时间节点往前的指定历史时间段(比如前3个月)和历史同期的历史值和历史预测值的偏差进行计算获得，比如进行平均加权，以NBEV为例，如：获取2020年8月NBEV的预测值的偏差值，其中2019年8月、前三月2020年5-7月的NBEV的值都可以预测，同时此4个月的真实值(由历史数据获得)也是已知的，则2019年8月的预测值的偏差通过下式求得：

偏差A＝(2019年8月预测值-2019年8月真实值)/(2019年8月真实值)

2020年5-7月的NBEV的预测值的偏差值同样通过这种方式求得，则2020年8月NBEV的预测值得偏差值通过下式求得：

偏差B＝0.25×2019年8月偏差值+0.25×2020年5月偏差值+0.25×2020年6月偏差值+0.25×2020年7月偏差值。

后续步骤中进行偏差分析时可采用此种方式，当然，也可以采用更多的月份，或者对不同的月份赋予不同的权重来求取偏差值，在此不做限定。

本申请实施例采用的预设的预测模型可以分为专家模型和大数据模型，专家模型可采用移动平均趋势剔除法、ARIMA、ETS等算法，大数据模型可采用LSTM、逻辑回归、xgboost等算法；由于专家模型会结合历史经验进行预测，而大数据模型通过大数据自学习进行预测，将两者结合可以提高预测的精度。本申请实施例采用的移动平均趋势剔除法、ARIMA、ETS、LSTM、逻辑回归和xgboost等算法为现有的算法，基于这些算法构建预测模型的过程在此不作展开。

在一些实施例中，在所述将所述多个数据源中与所述目标因子相关的历史数据进行合并生成合并数据之前，所述方法还包括：获取与所述目标因子相关的至少一个中间因子，根据所述目标对象预测指令从多个数据源获取与所述中间因子相关的历史数据，按照所述数据源的不同将获取的历史数据分别输入至所述预设的预测模型中，输出各所述中间因子的预测值，根据各所述中间因子的预测值计算得到所述目标因子的间接预测值；对所述目标因子的预测值、间接预测值分别进行偏差分析，若所述目标因子的间接预测值的偏差值较小，则将所述目标因子的预测值修正为所述间接预测值。

具体的，在本实施例中将所述目标因子的预测值修正为所述间接预测值时，后续步骤S203和S204的执行过程将基于目标因子的间接预测值进行，相当于步骤S202中目标因子的预测值被重新赋值。

本申请实施例中的目标因子和中间因子满足一定的等式关系，且目标因子和中间因子均可通过预测模型进行预测，对于目标因子而言，可以直接通过预测模型得到一个预测值，同时通过预测中间因子，结合目标因子和中间因子的等式关系来得到预测模型的另一个预测值，将两个预测值中偏差最小的作为前述步骤S202的目标因子的预测值，其中直接和间接得到的两个预测值均基于单数据源获得。

进一步地，本申请实施例步骤S202中根据各预测值计算得到第一整体预测值是针对所述目标因子计算其整体预测值，具体将所述目标因子根据不同数据源的历史数据得到预测值进行求和得到目标因子的第一整体预测值，比如有两个目标因子A和B，目标因子A对应有数据源D1、D2、D3，目标因子B对应有数据源D4、D5、D6，这些数据源对应不同的机构或产品，则通过预测模型和数据源D1、D2、D3将得到目标因子A的三个预测值A1、A2、A3，通过预测模型和数据源D4、D5、D6将得到目标因子B的三个预测值，则A1、A2、A3，B1、B2、B3之和即为目标因子B的第一整体预测值。

对于步骤S203，将多个数据源中与所述目标因子相关的历史数据进行合并是指针对所述目标因子从多个数据源中获取与所述目标因子相关的数据进行合并，比如目标因子A对应有数据源D1、D2、D3，则从数据源D1、D2、D3中分别获取与目标因子A相关的历史数据进行合并，生成与目标因子A对应的合并数据。本步骤S203的预设的预测模型与步骤S202中预设的预测模型相同，同样的，也可以采用多个预测模型，从每个预测模型输出的准预测值中筛选出偏差最小的准预测值作为目标因子的第二整体预测值，具体的，针对合并数据使用移动平均趋势剔除法、ARIMA、ETS和LSTM等算法构建的时间序列模型预测整体最优解(或称整体指标数值)，然后对各个最优解进行偏差分析获取最小的作为目标因子的第二整体预测值。

上述第一整体预测值和第二整体预测值的区别在于，第一整体预测值是基于局部预测得到整体预测，第二整体预测值则是直接进行整体预测。

对于步骤S204，在本申请实施例中，根据所述目标预测值输出目标对象的预测结果是指当目标因子的目标预测值超出或低于预设值到达到一定值时发起预警。

目标因子的目标预测值即为基于多数据源的预测值，这与基于单数据源得到的预测值是相互独立的，以目标对象为机构为例，步骤S202的目标因子的预测值是各个机构的最优解，步骤S204的目标因子的目标预测值是整体机构(包括所有机构)的最优解，在步骤S204中考虑整体和局部的关系来实现对目标因子的预测值的调整。

具体的，比如机构1利用ARIMA、ETS和LSTM三个算法分别构建的时间序列模型得出目标因子新增新人量分别为a1、a2和a3，然后取偏差率最小的a2；

机构2利用ARIMA、ETS和LSTM三个算法分别构建的时间序列模型得出目标因子新增新人量分别为b1、b2和b3，然后取偏差率最小的b1；

整体机构利用ARIMA、ETS和LSTM三个算法分别构建的时间序列模型得出目标因子新增新人量分别为c1、c2和c3，然后取偏差率最小的c1(第二整体预测值)。

再进一步判断a2+b1(第一整体预测值)的偏差率和c1的偏差率的大小，即可确定是否要根据第一整体预测值和第二整体预测值对所述目标因子的预测值进行修正。

需要说明的是，步骤S204中，当第一整体预测值的偏差值低于第二整体预测值的偏差值时，无需对所述目标因子的预测值进行修正，此时步骤S202得到的预测值或上述根据中间因子得到的预测值即为目标因子的目标预测值。

在一些实施例中，所述根据所述第一整体预测值和所述第二整体预测值对所述目标因子的多个预测值进行修正包括：将所述第二整体预测值与所述第一整体预测值的比值作为修正参数，将所述目标因子的多个预测值乘以所述修正参数，得到所述目标因子的多个预测值的修正值；所述修正值即为所述目标因子的目标预测值。此步骤相当于采用比例缩放方式调整使基于单数据源的预测值与基于多数据源的预测值实现勾稽，以目标对象为机构为例，每个机构对应一个数据源，此步骤可实现整体与各个机构间的勾稽，使得各个机构的目标因子与整体的目标因子之间满足预设的数量关系，即使得各机构的目标因子的预测值的总和等于整体的预测值。

在进一步的实施例中，当目标因子的预测值是根据中间因子的预测值计算得到时，在所述根据所述第一整体预测值和所述第二整体预测值对所述目标因子的多个预测值进行修正之后，所述方法还包括：根据所述目标因子的目标预测值对各所述中间因子的预测值进行逐级下沉修正，得到各所述中间因子的目标预测值。在本实施例中，最终还可根据中间因子的目标预测值进行预警，即在具体的应用场景中，当中间因子和/或目标因子的目标预测值超出或低于预设值到达到一定值时发起预警。其中逐级下沉修正是指中间因子是根据子中间因子的预测值计算得到时，通过修正后的中间因子预测值并结合中间因子和子中间因子的关系式对子中间因子的预测值进行修正。例如，目标因子NBEV可通过下式获得：

NBEV＝人均可出单费用×月末可出单人力(1)；

其中月末可出单人力为中间因子，其可通过下式获得：

月末可出单人力＝上月末人力×(1+增员率-脱落率)(2)；

其中的增员率和/或脱落率为子中间因子，可以通过预测模型来得到增员率和/或脱落率的预测值，基于增员率和/或脱落率的预测值和式(2)可求得中间因子月末可出单人力的预测值，进一步结合式(1)可求得目标因子NBEV的预测值，当目标因子NBEV的预测值因第二整体预测值进行修正时，将逐级对中间因子月末可出单人力、子中间因子增员率和/或脱落率的预测值进行修正，并输出各个因子(目标因子、中间因子、子中间因子等)的目标预测值，以基于目标预测值进行人员动向或经营状况的预警。本申请实施例考虑了多数据源中的多个因子之间的关联，其预测准确度和客观性更高。

本申请提供的基于多数据源的目标对象预测方法充分利用大数据，利用历史数据进行基于多数据源的模型预测分析，针对多个目标因子进行局部和整体的预测，并基于整体的预测值对局部的预测值进行修正，得到基于多数据源的预测结果，可以对目标对象实现有效的预测，且预测稳定性高。当应用在机构的经营状况及人员动向预测时，可以根据各个机构经营状况及人员动向的预测来提供整体和局部的分析和预警。

需要强调的是，为进一步保证信息的私密和安全性，所述多数据源的历史数据还可以存储于一区块链的节点中。

本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

本申请可用于众多通用或专用的计算机系统环境或配置中。例如：个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机可读指令来指令相关的硬件来完成，该计算机可读指令可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)等非易失性存储介质，或随机存储记忆体(Random Access Memory，RAM)等。

应该理解的是，虽然附图的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，其可以以其他的顺序执行。而且，附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，其执行顺序也不必然是依次进行，而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

进一步参考图3，作为对上述图2所示方法的实现，本申请提供了一种基于多数据源的目标对象预测装置的一个实施例，该装置实施例与图2所示的方法实施例相对应，该装置具体可以应用于各种电子设备中。

如图3所示，本实施例所述的基于多数据源的目标对象预测装置包括：目标因子确定模块301、第一预测模块302、第二预测模块303以及判断处理模块304。

其中，目标因子确定模块301用于接收目标对象预测指令，根据所述目标对象预测指令确定待预测的目标因子；第一预测模块302用于根据所述目标对象预测指令从多个数据源获取与所述目标因子相关的历史数据，将从所述多个数据源获取的历史数据分别输入至预设的预测模型中，输出所述目标因子的多个预测值，并根据各所述预测值计算得到所述目标因子的第一整体预测值；第二预测模块303用于将所述多个数据源中与所述目标因子相关的历史数据进行合并，将合并数据输入至所述预设的预测模型中，输出所述目标因子的第二整体预测值；判断处理模块304用于判断所述第一整体预测值的偏差值是否超出所述第二整体预测值的偏差值，若是则根据所述第一整体预测值和所述第二整体预测值对所述目标因子的多个预测值进行修正，得到所述目标因子的目标预测值，并根据所述目标预测值输出所述目标对象的预测结果。

在本实施例中，目标因子确定模块301接收的目标对象预测指令可以由用户从终端实时发起，也可以是后台系统根据预设的预测周期自动触发目标对象预测指令，比如按月对目标对象进行预测，则按照周期性的预设时间节点在每个月固定时间触发目标对象预测指令。其中目标对象可为产品或机构，具体可参考上述方法实施例相关内容，在此不作展开。本申请实施例的对象预测指令中包含有目标对象的相关信息，因此根据目标对象预测指令可以确定带预测的目标对象，并由此进一步确定预测纬度以及对应的待预测的目标因子。

进一步的，同一个目标因子可从多个数据源中获取多份历史数据，该多份历史数据相互独立，因此第一预测模块302可以从每个数据源获取一份历史数据，每一份历史数据输入到预设的预测模型中后，可以对应地得到目标因子的一个预测值，即每一个目标因子通过多份历史数据可以得到多个预测值，第一预测模块302得到的目标因子的预测值不是目标因子的最终预测值，因为此处目标因子的预测值是基于单数据源获得的，目标因子的最终预测值为判断处理模块304获得的目标预测值。

在一些实施例中，第一预测模块302采用多个预设的预测模型。相应的，所述第一预测模块302将从所述多个数据源获取的历史数据分别输入至预设的预测模型中，输出所述目标因子的多个预测值时，具体用于：将从各所述数据源获取的历史数据分别输入至各所述预设的预测模型中，得到多组准预测值，从各组准预测值中筛选出偏差值最小的准预测值作为所述目标因子的预测值，得到所述目标因子的多个预测值。其中，每个预设的预测模型采用不同的算法，具体可参考上述方法实施例相关内容，在此不作展开。

在一些实施例中，第一预测模块302、第二预测模块303以及判断处理模块304在进行所述偏差值计算时，可通过所述目标因子的历史值和历史预测值来确定，，具体可参考上述方法实施例相关内容，在此不作展开。

在一些实施例中，在所述第二预测模块303将所述多个数据源中与所述目标因子相关的历史数据进行合并生成合并数据之前，所述第一预测模块302还用于获取与所述目标因子相关的中间因子，根据所述目标对象预测指令从多个数据源获取与所述中间因子相关的历史数据，按照所述数据源的不同将获取的历史数据分别输入至所述预设的预测模型中，输出各所述中间因子的预测值，根据各所述中间因子的预测值计算得到相关的所述目标因子的间接预测值；对所述目标因子的预测值、间接预测值分别进行偏差分析，若所述目标因子的间接预测值的偏差值较小，则将所述目标因子的预测值修正为所述间接预测值。具体的，在所述第一预测模块302将所述目标因子的预测值修正为所述间接预测值时，相当于目标因子的预测值被重新赋值，后续第二预测模块303以及判断处理模块304的执行过程将基于目标因子的间接预测值进行。

本申请实施例中的目标因子和中间因子满足一定的等式关系，且目标因子和中间因子均可通过预测模型进行预测，对于目标因子而言，可以直接通过预测模型得到一个预测值，同时通过预测中间因子，结合目标因子和中间因子的等式关系来得到预测模型的另一个预测值，所述第一预测模块302将两个预测值中偏差最小的作为目标因子的预测值，其中直接和间接得到的两个预测值均基于单数据源获得。

进一步地，本申请实施例第一预测模块302根据所述目标因子各预测值计算得到第一整体预测值是针对所述目标因子计算其整体预测值，具体将所述目标因子根据不同数据源的历史数据得到预测值进行求和得到目标因子的第一整体预测值，具体示例可参考上述方法实施例，在此不再赘述。

在本实施例中，第二预测模块303将多个数据源中与所述目标因子相关的历史数据进行合并是指针对所述目标因子从多个数据源中获取与所述目标因子相关的数据进行合并。第二预测模块303采用的预设的预测模型与第一预测模块302采用的预设的预测模型相同，同样的，也可以采用多个预测模型，从每个预测模型中筛选偏差最小的准预测值作为目标因子的第二整体预测值，具体可参考上述方法实施例，在此不再赘述。

在本申请实施例中，判断处理模块304根据所述目标预测值输出目标对象的预测结果是指当目标因子的目标预测值超出或低于预设值到达到一定值时发起预警。目标因子的目标预测值即为基于多数据源的预测值，这与基于单数据源得到的预测值是相互独立的，具体可参考上述方法实施例，在此不再赘述

需要说明的是，当判断处理模块304判定第一整体预测值的偏差值低于第二整体预测值的偏差值时，无需对所述目标因子的预测值进行修正，此时第一预测模块302得到的预测值或上述根据中间因子得到的预测值即为目标因子的目标预测值。

在一些实施例中，所述判断处理模块304根据所述第一整体预测值和所述第二整体预测值对所述目标因子的多个预测值进行修正时，具体用于将所述第二整体预测值与所述第一整体预测值的比值作为修正参数，将所述目标因子的多个预测值乘以所述修正参数，得到所述目标因子的多个预测值的修正值；所述修正值即为所述目标因子的目标预测值。

在进一步的实施例中，当目标因子的预测值是根据中间因子的预测值计算得到时，在所述判断处理模块304根据所述第一整体预测值和所述第二整体预测值对所述目标因子的多个预测值进行修正之后，所述判断处理模块304还用于根据所述目标因子的目标预测值对所述中间因子的预测值进行逐级下沉修正，得到所述中间因子的目标预测值。在本实施例中，最终还可根据中间因子的目标预测值进行预警，即在具体的应用场景中，当中间因子和/或目标因子的目标预测值超出或低于预设值到达到一定值时发起预警。其中逐级下沉修正是指中间因子是根据子中间因子的预测值计算得到时，通过修正后的中间因子预测值并结合中间因子和子中间因子的关系式对子中间因子的预测值进行修正。具体可参考上述方法实施例相关内容，在此不再赘述。本申请实施例考虑了多数据源中的多个因子之间的关联，其预测准确度和客观性更高。

本申请提供的基于多数据源的目标对象预测装置充分利用大数据，利用历史数据进行基于多数据源的模型预测分析，针对多个目标因子进行局部和整体的预测，并基于整体的预测值对局部的预测值进行修正，得到基于多数据源的预测结果，可以对目标对象实现有效的预测，且预测稳定性高。当应用在机构的经营状况及人员动向预测时，可以根据各个机构经营状况及人员动向的预测来提供整体和局部的分析和预警。

为解决上述技术问题，本申请实施例还提供计算机设备。具体请参阅图4，图4为本实施例计算机设备基本结构框图。所述计算机设备4包括通过系统总线相互通信连接存储器41、处理器42、网络接口43，所述存储器41中存储有计算机可读指令，所述处理器42执行所述计算机可读指令时实现上述方法实施例中所述的基于多数据源的目标对象预测方法的步骤，并具有与上述基于多数据源的目标对象预测方法相对应的有益效果，在此不作展开。

需要指出的是，图中仅示出了具有存储器41、处理器42、网络接口43的计算机设备4，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。其中，本技术领域技术人员可以理解，这里的计算机设备是一种能够按照事先设定或存储的指令，自动进行数值计算和/或信息处理的设备，其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程门阵列(Field－Programmable Gate Array，FPGA)、数字处理器(Digital Signal Processor，DSP)、嵌入式设备等。

所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。

在本实施例中，所述存储器41至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中，所述存储器41可以是所述计算机设备4的内部存储单元，例如该计算机设备4的硬盘或内存。在另一些实施例中，所述存储器41也可以是所述计算机设备4的外部存储设备，例如该计算机设备4上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(SecureDigital,SD)卡，闪存卡(Flash Card)等。当然，所述存储器41还可以既包括所述计算机设备4的内部存储单元也包括其外部存储设备。本实施例中，所述存储器41通常用于存储安装于所述计算机设备4的操作系统和各类应用软件，例如对应于上述基于多数据源的目标对象预测方法的计算机可读指令等。此外，所述存储器41还可以用于暂时地存储已经输出或者将要输出的各类数据。

所述处理器42在一些实施例中可以是中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器42通常用于控制所述计算机设备4的总体操作。本实施例中，所述处理器42用于运行所述存储器41中存储的计算机可读指令或者处理数据，例如运行对应于所述基于多数据源的目标对象预测方法的计算机可读指令。

所述网络接口43可包括无线网络接口或有线网络接口，该网络接口43通常用于在所述计算机设备4与其他电子设备之间建立通信连接。

本申请还提供了另一种实施方式，即提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机可读指令，所述计算机可读指令可被至少一个处理器执行，以使所述至少一个处理器执行如上述的基于多数据源的目标对象预测方法的步骤，并具有与上述基于多数据源的目标对象预测方法相对应的有益效果，在此不作展开。

通过以上的实施方式的描述，本领·域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术申请实施例本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本申请各个实施例所述的方法。

显然，以上所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例，附图中给出了本申请的较佳实施例，但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现，相反地，提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明，对于本领域的技术人员来而言，其依然可以对前述各具体实施方式所记载的技术申请实施例进行修改，或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构，直接或间接运用在其他相关的技术领域，均同理在本申请专利保护范围之内。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 基于多数据源的目标对象预测方法及其相关设备 [P] . 中国专利： CN112182118A . 2021-01-05
2. 针对数据偏移的目标对象行为预测方法及其相关设备 [P] . 中国专利： CN112508118A . 2021-03-16
3. Method for predicting target object properties based on machine learning and related devices [P] . KR20210113336A . 2021-09-15

机译：基于机器学习和相关设备预测目标对象属性的方法
4. METHOD FOR PREDICTING ATTRIBUTE OF TARGET OBJECT BASED ON MACHINE LEARNING AND RELATED DEVICE [P] . US2021406687A1 . 2021-12-30

机译：基于机器学习和相关设备预测目标对象属性的方法
5. METHOD FOR TRAINING FACE-BASED DRIVING RISK PREDICTION MODEL, DRIVING RISK PREDICTION METHOD BASED ON FACE, AND RELATED DEVICES [P] . WO2021035983A1 . 2021-03-04

机译：基于面部的驾驶风险预测模型的方法，基于面部的驾驶风险预测方法及相关设备