本发明涉及计算机人工智能和金融科学的,特别涉及一种基于情绪数据的股票价格预测方法。
背景技术:
1、股票市场发展至今,大量的研究方法被提出并研究,其中受到广大投资者认可的主要有以下两种投资分析法:基本面分析法和技术面分析法。但是现有的股价分析方法对于股价的趋势判断较为模糊,对使用者有较高的经验要求,且较大程度受限于主观判断影响。
2、深度神经网络的迅速发展推动了其与金融科技行业的融合。计算机应用技术领域专家构建深度学习模型,并让其对股票指标数据进行学习,建立股票价格预测模型。但是现有的模型对于数据的类型使用单一,忽视了金融市场内部错综复杂的相互作用,导致其在价格预测的准确性和稳定性方面仍然难以满足使用需求。
3、综上所述,现有的股票价格预测技术存在着:操作难度高、主观影响大和准确性不足等缺点。
技术实现思路
1、针对现有技术中存在的不足之处,本发明的目的是提供一种基于情绪数据的股票价格预测方法,通过对情绪文本的挖掘对股票价格的涨跌趋势进行预测,为后续股价预测模型的开发与应用提供了新的思路。为了实现根据本发明的上述目的和其他优点,提供了一种基于情绪数据的股票价格预测方法,包括:
2、获取股票文本评价数据;
3、从股票文本评价数据中提取评论表征数据,通过所述评论表征数据构建情绪数据;
4、基于所述情绪数据构建股票价格预测模型,所述股票价格预测模型包括股票价格预测模型与板块共享模型;
5、其中,将属于相同板块的股票文本评价数据输入股票价格预测模型中进行预训练,获得板块共享模型;
6、将评论表征数据输入板块共享模型中进行正式训练;
7、将最新的股票文本评价数据分别输入股票价格预测模型中,对下一个交易周期的股票价格趋势进行预测。
8、优选的,所述股票文本评价数据根据所属股票进行划分,分为股票各自的文本信息,将股票各自的文本信息根据时间的先后顺序进行排序,并按照特定的时间跨度进行划分,分为训练集数据和测试集数据;
9、根据第一个训练集的开始时间和最后一个测试集的结束时间对所有的股票进行初步的筛选,按照预定筛选要求从所有股票中筛选出符合要求的股票组成股票池。
10、优选的,筛选出的股票池中的股票进行交易日检验和缺失值填补,对获取的股票评价的发表内容使用自然语言处理技术进行分词,并使用双向向量嵌入编码将文本信息提取为评论表征,通过评价中的动词计算板块之间的相关性系数。
11、优选的,所述双向向量嵌入编码将文本信息提取为评论表征具体为:
12、分别使用窗口级别的分割方法和句子级别的分割方法将评价文本进行两个层面的分割;对每个分割好的窗口中的动词核心词使用word2vc方法转换为词嵌入向量,作为键嵌入向量,对窗口所归属的句子中排除窗口中已使用的动词核心词以外的词使用word2vc方法转换为词嵌入向量,作为值嵌入向量;
13、所述窗口级别的分割方法和句子级别的分割方法分别具体为:分割对象对固定窗口大小的词组成的序列和完整句子的两种文本分割方法。
14、优选的,所述股票价格预测模型包括数据蒸馏器模块与股票价格趋势分类器模块;
15、所述数据蒸馏器模块具体为:将计算获取的评价双向向量嵌入结果输入蒸馏器模块,得到隐藏市场向量;
16、所述股票价格趋势分类器模块包含个长短期记忆模型层与一个多层感知机模块。
17、优选的,所述将属于相同板块的股票文本评价数据输入股票价格预测模型中进行预训练,获得板块共享模型,具体为:
18、列举股票池中所有股票所属的板块并进行归纳,按照所属板块对股票进行划分整理,依照顺序将所属相同板块的股票指定时间的训练集数据输入股票价格预测模型中进行少量次数的训练,并将训练完的模型参数进行保存,作为该板块该训练时间的共享模型。
19、本发明与现有技术相比,其有益效果是:通过从文本评价数据中提取评论表征构建情绪数据,并依据文本评论构建板块相关性系数,使用深度学习模型对股票价格进行预测,并结合预训练思想训练板块共享模型。该方法能够有效地将不同股票和板块之间的关系融入模型的考量中,从而解决了以往研究中金融市场内部相互关系被忽视的问题。通过对情绪文本的挖掘对股票价格的涨跌趋势进行预测,为后续股价预测模型的开发与应用提供了新的思路。
1.一种基于情绪数据的股票价格预测方法,其特征在于,包括:
2.如权利要求1所述的一种基于情绪数据的股票价格预测方法,其特征在于,所述股票文本评价数据根据所属股票进行划分,分为股票各自的文本信息,将股票各自的文本信息根据时间的先后顺序进行排序,并按照特定的时间跨度进行划分,分为训练集数据和测试集数据;
3.如权利要求2所述的一种基于情绪数据的股票价格预测方法,其特征在于,筛选出的股票池中的股票进行交易日检验和缺失值填补,对获取的股票评价的发表内容使用自然语言处理技术进行分词,并使用双向向量嵌入编码将文本信息提取为评论表征,通过评价中的动词计算板块之间的相关性系数。
4.如权利要求3所述的一种基于情绪数据的股票价格预测方法,其特征在于,所述双向向量嵌入编码将文本信息提取为评论表征具体为:
5.如权利要求1所述的一种基于情绪数据的股票价格预测方法,其特征在于,所述股票价格预测模型包括数据蒸馏器模块与股票价格趋势分类器模块;
6.如权利要求1所述的一种基于情绪数据的股票价格预测方法,其特征在于,所述将属于相同板块的股票文本评价数据输入股票价格预测模型中进行预训练,获得板块共享模型,具体为:
7.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述的方法。
8.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的方法。
