首页> 中国专利> 基于媒体信息张量监督学习的股票价格波动预测模型及装置

基于媒体信息张量监督学习的股票价格波动预测模型及装置

摘要

本发明提供一种基于媒体信息张量监督学习的股票价格波动预测模型,包括如下步骤:S1、收集市场交易信息、媒体新闻信息、股民情感信息;S2、对收集的信息进行预处理;S3、基于预处理后的信息构建张量;S4、对构造的张量进行张量分解与重构;S5、基于市场交易信息及重构后的张量,利用张量监督学习算法对股价波动进行训练和预测;S6、基本信息可视化,以黑色背景、蓝色字体为主,展示收集到的市场交易信息、媒体新闻信息、股民情感信息;股票价格波动预测结果可视化,展示模型预测出来的结果页面的背景以白色为主,股票价格波动中的上升部分的曲线的颜色为红色,价格下跌部分的曲线的而颜色为蓝色。

著录项

  • 公开/公告号CN113256416A

    专利类型发明专利

  • 公开/公告日2021-08-13

    原文格式PDF

  • 申请/专利权人 西南财经大学;

    申请/专利号CN202110522554.8

  • 发明设计人 李庆;王俊;谭晶桦;蒋李灵;

    申请日2021-05-13

  • 分类号G06Q40/04(20120101);G06Q30/02(20120101);G06N20/00(20190101);

  • 代理机构51219 泰和泰律师事务所;

  • 代理人曾祥坤

  • 地址 611130 四川省成都市温江柳台大道555号腾骧楼2楼(柳林校区)

  • 入库时间 2023-06-19 12:13:22

说明书

技术领域

本发明涉及自然语言处理、量化分析以及人体工程学领域,具体涉及一种基于媒体信息张量监督学习的股票价格波动预测模型及装置。

背景技术

随着信息技术的发展,互联网媒体逐渐成为主流的媒体形式。特别是以博客、微博、社会化新闻、维基百科和网络论坛为主的社会化媒体的兴起,其媒体影响力日益加剧。海量信息和裂变式传播使互联网媒体对股票市场产生了举足轻重的影响。

现有技术中,对股票价格波动进行预测时大都考虑结构化信息,如股票的交易价格等,而忽略非结构化信息,如公司的新闻等,导致股票价格波动预测不精确。这是因为文字往往比数字更能反映出一个人的情感心理。本发明就是基于人们的社会行为心理信息去构建模型。而人们的社会行为心理信息则是从媒体传播的新闻信息中提取。

当结合不同纬度信息预测股票价格波动时,现有技术是将不同维度的信息特征值拼接为一个超级特征向量,然后运用基于向量预测模型去探测反映人们行为心理的互联网媒体信息对股市的影响。但是,由于不同维度的信息是交互影响,并且紧密相关、互为补充,将不同维度的信息之间的关联隔断后直接拼接成一为一个超级特征向量,这样容易出现维度灾难。维度灾难,即在机器学习算法中输入的属性向量长度过长,导致算法性能不再随信息量的增多而提高,反而使算法效果降低。并且在拼接超级特征向量的时候,认为不同维度的信息特征是相互独立的,减弱了不同维度信息特征间的相互作用,甚至是忽略了他们之间的联系。

大量人体工程学研究证明深色文字在白色背景更易于辨识。白光对于人眼的三种颜色视觉感受器产生相同大小的刺激,导致眼球通过拉紧虹膜实现聚焦。在此种眼球聚焦的状态下,白色背景中的深色文字易于辨识。黑色背景则会导致虹膜张开以收集更多的光线,造成浅色文字变得模糊。超过一半成年人的视力都受到散光的影响。散光人群阅读黑色背景中浅色文字的难度明显高于阅读白色背景中的深色文字。原因在于,白色背景使得虹膜部分关闭,降低眼球晶状体的形变;黑色背景导致虹膜张开,晶状体的形变造成模糊的眼球聚焦。黑色背景对眼睛的刺激较小,有利于防止近视。所以如果长期使用屏幕,从健康角度看深色背景更好一点。但是对于需要高度精确辨识的内容(文字和数字,即股价的预测值),则适合采用白色背景。

发明内容

本发明提供一种基于媒体信息张量监督学习的股票价格波动预测模型及装置,基于人们的社会行为心理信息去构建模型,以解决现有的股票价格波动预测精度低的问题。同时相较其他股票预测模型装置,该装置更是加入了视觉相关的人体工程学元素,使得使用者在不同场景有不同的视觉体验。

本发明所要解决的技术问题是通过如下技术方案实现的:

本发明提供一种基于媒体信息张量监督学习的股票价格波动预测模型,包括如下步骤:

S1、收集市场交易信息、媒体新闻信息、股民情感信息;

S2、对收集的信息进行预处理;

S3、基于预处理后的信息构建张量;

S4、对构造的张量进行张量分解与重构;

S5、基于市场交易信息及重构后的张量,利用张量监督学习算法对股价波动进行训练和预测;

S6、基本信息可视化,以黑色背景、蓝色字体为主,展示收集到的市场交易信息、媒体新闻信息、股民情感信息;股票价格波动预测结果可视化,展示模型预测出来的结果页面的背景以白色为主,股票价格波动中的上升部分的曲线的颜色为红色,价格下跌部分的曲线的而颜色为蓝色。

优选的,所述预处理包括对收集的所述媒体新闻信息进行文本处理,对收集的所述股民情感信息进行情感分析。

优选的,所述构建张量的步骤包括:构建市场交易信息维度、媒体新闻信息维度、股民情感信息维度,基于市场交易信息维度、媒体新闻信息维度、股民情感信息维度构建三阶张量。

优选的,所述张量分解方法为Tucker分解,所述重构方法为核张量与因子矩阵相乘。

优选的,所述市场交易信息维度为对市场交易信息组合进行向量化;所述媒体新闻信息维度是将新闻与新闻词库对比,加上对应词的权重,转换为向量;所述股民情感信息维度通过计算公众对单支股票的情感因子和公众对整个市场的情感因子;

张量x

a

a

a

一种基于媒体信息张量监督学习的股票价格波动预测装置,其特征在于:包括:

存储器,用于存储使所述装置能执行权利要求1-5任一项所述的指令;

处理器,至少有一个处理器,用于执行所述存储器中存储的可执行指令;

显示器,基于与可视化相关的人体工程学原理去展示装置收集到的市场信息与模型预测出来的结果。

优选的,所述的基于媒体信息张量监督学习的股票价格波动预测装置的显示器,其特征在于:

S701、展示收集到的市场交易信息、媒体新闻信息、股民情感信息的页面背景以黑色为主,字体颜色为蓝色。黑色背景对眼睛的刺激较小,在进行大量的阅读工作时更有利于防止近视。而蓝色则给人冷静、智慧、深远的感觉;

S702、展示模型预测出来的结果的页面,背景以白色为主,股票价格波动中的上升部分的曲线颜色为红色,价格下跌部分的曲线颜色为蓝色。白色背景有利于眼睛高度精确辨识模型预测的相关结果,红蓝色结合展示的波动曲线更有利于识别出价格的上涨与下跌。其中红色给人幸福、喜气洋洋的感觉,对人的信息产生巨大的鼓舞作用,蓝色则可以让人冷静。

优选的,所述存储器中存储的指令包括以下程序模块:

信息收集模块,收集市场交易信息、媒体新闻信息、股民情感信息;

预处理模块,对收集的信息进行预处理;

张量构建模块,基于预处理后的信息构建张量;

张量处理模块,对构造的张量进行张量分解与重构;

训练和预测模块,基于市场交易信息及重构后的张量,利用张量监督学习算法对股价波动进行训练和预测;

显示模块,执行基本信息和股票价格波动预测结果的可视化处理。

本发明的有益效果在于:(1)从市场交易信息、股民情感信息、媒体新闻信息三个维度属性信息出发,包括定量和定性两方面的信息来源,包括官方新闻信息和社交媒体信息,从而更全面的分析互联网媒体与股票市场的关系;(2)用张量来表示媒体信息空间,从而将不同维度信息之间的相互关系记录下来;(3)张量监督学习算法实现了计算机学习算法从向量到张量的拓展;以达到更好的股票价格预测效果,为股民及投资公司提供决策参考;(4)该装置利用视觉相关的人体工程学原理设计了相关信息展示的形式,能在不同的场景给人不同的生理保护、心理暗示与视觉体验。

附图说明

图1是本发明的预测步骤框图;

图2是本发明的预测模型图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。本发明基于媒体信息,尤其基于媒体信息张量监督学习算法对股票价格波动进行预测模型及装置,为金融市场提供决策。

实施例1

本发明实施例提供一种基于媒体信息张量监督学习的股票价格波动预测(和显示)方法,如图1所示,具体包括:

S1、收集市场交易信息、媒体新闻信息、股民情感信息;

进一步地,市场交易信息来自于公司的基本数据,如股票的交易价格、公司的规模、交易数量等信息,能从数据的角度反应公司目前的运作情况。新闻媒体信息来自于日常股票新闻,包含了公司基本情况的内容,能让投资者获取丰富的信息,全面了解公司的情况,包含消极或者积极的内容,容易影响投资者非理性投资。股民情感信息来自于股票论坛等社交媒体,通过社交媒体中的情感词来捕捉社会情绪。

S2、对收集的信息进行预处理;

可选地,预处理包括对收集的媒体新闻信息进行文本处理,对收集的股民情感信息进行情感分析。

S3、基于预处理后的信息构建张量;

本发明用张量表示不同维度的信息,其中包括市场交易信息、媒体新闻信息、股民情感信息。

其中,市场交易信息维度通过对市场交易信息组合进行向量化。媒体新闻信息维度通过构造新闻词库,新闻词库由新闻中的名词和情感词构成。新闻通过与词库对比,再加上对应词的权重,最后把新闻文本信息转换为向量。股民情感信息维度通过计算两个情感因子来表示股民情感信息,即公众对单支股票的情感因子和公众对整个市场的情感因子。基于市场交易信息维度、媒体新闻信息维度、股民情感信息维度构建三阶张量,以保留不同维度间的关系以及维度间相互作用的潜在信息。

张量χ

a

a

a

填充完整之后的张量χ

S4、对构造的张量进行张量分解与重构;

利用Tucker分解对张量进行分解,首先根据张量不同阶对张量媒体信息空间进行模展开矩阵,以对应阶的长度作为展开矩阵的列,剩余阶的长度之和作为行,张量内部元素值根据此结构平面依次展开,在展开的同时就完成了张量不同阶信息的一次融合。再通过对模展开矩阵的分解,又一次融合不同阶的信息,并得到对应维度信息的因子矩阵。

分解后的张量,需要对其进行再次重构。通过核张量与因子矩阵相乘,让不同维度信息间相互补充,潜在的信息将在重构后的张量中表现出来,作为最终的训练样本,最后把重构完成的张量放入张量监督学习算法中进行模型训练和模型预测。

S5、基于市场交易信息及重构后的张量,利用张量监督学习算法对股价波动进行训练和预测。

具体地,将监督学习算法从向量到张量进行拓展,基于重构的张量对该市场环境下的股价波动进行训练和预测。

S6、基本信息可视化,以黑色背景、蓝色字体为主,展示收集到的市场交易信息、媒体新闻信息、股民情感信息;股票价格波动预测结果可视化,展示模型预测出来的结果页面的背景以白色为主,股票价格波动中的上升部分的曲线的颜色为红色,价格下跌部分的曲线的而颜色为蓝色。

实施例2

本发明另一实施例提供一种基于媒体信息张量监督学习的股票价格波动预测装置,如图2所示,具体包括:

存储器,用于存储使所述装置能执行预测模型所需的任一项所述的指令;

处理器,至少有一个处理器,用于执行所述存储器中存储的可执行指令。

显示器,基于与可视化相关的人体工程学原理去展示装置收集到的市场信息与模型预测出来的结果。

展示收集到的市场交易信息、媒体新闻信息、股民情感信息的页面背景以黑色为主,字体颜色为蓝色。黑色背景对眼睛的刺激较小,在进行大量的阅读工作时更有利于防止近视。而蓝色则给人冷静、智慧、深远的感觉。

展示模型预测出来的结果的页面的背景以白色为主,股票价格波动中的上升部分的曲线的颜色为红色,价格下跌部分的曲线的而颜色为蓝色。白色背景有利于眼睛高度精确辨识模型预测的相关结果,红蓝色结合展示的波动曲线更有利于识别出价格的上涨与下跌。其中红色给人幸福、喜气洋洋的感觉,对人的信息产生巨大的鼓舞作用,蓝色则可以让人冷静。

存储器中存储的指令包括以下程序模块:

信息收集模块,收集市场交易信息、媒体新闻信息、股民情感信息;

预处理模块,对收集的信息进行预处理;

张量构建模块,基于预处理后的信息构建张量;

张量处理模块,对构造的张量进行张量分解与重构;

训练和预测模块,基于市场交易信息及重构后的张量,利用张量监督学习算法对股价波动进行训练和预测;

显示模块,执行基本信息和股票价格波动预测结果的可视化处理。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。另外,本发明所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号