AI圈最新深度学习量化算法！

原创

炼丹笔记 2022-04-27 17:54:04 ©著作权

文章标签 大数据算法 python 机器学习人工智能 文章分类 人工智能

©著作权归作者所有：来自51CTO博客作者炼丹笔记的原创作品，请联系作者获取转载授权，否则将追究法律责任

译者：一元

AI圈最新深度学习量化算法！_机器学习

量化交易和投资决策是复杂的金融任务，依赖于准确的股票选择。

目前深度学习学习的策略使用于股票的问题的方案面临两个重大局限。

他们不直接优化利润方面的投资目标；
将每只股票视为独立于其他股票，忽略了相关股票之间的丰富信号股票价格变动。

本文基于该局限性，将股票预测重新表述为一个学习排序问题，并提出了STHAN-SR，一种用于股票选择的神经超图结构，从而定制一种新的时空注意超图网络结构，

通过联合建模股票相互依赖性及其价格的时间演变，根据利润对股票进行排序。

在三个市场上进行为期六年的实验，我们发现STHAN-SR显著优于最先进的神经股票预测方法。我们通过对STHAN-SR的空间和时间组件进行烧蚀和探索性分析来验证我们的设计选择，并证明其实用性。

AI圈最新深度学习量化算法！_python_02

目前深度学习用于股票投资的策略，存在两大问题：

1. 问题1

并不是直接对投资收益进行优化；

- 之所以出现这种差距，是因为股票预测通常是作为一项分类任务来预测股票走势（价格上涨、下跌或无重大变化）或作为一项回归任务来预测股票价格，而不是选择预期利润最大的股票。

- 但是高的预测性能并不总是导致股票的最有利可图的选择。此类分类和回归优化的目的是为了提高价格变动的准确性或最小化预测股票收益的误差，而不一定是为了直接获得利润。

- 这一差距暗示了优化预测性能和优化股票选择以实现利润最大化之间的差距，并引导我们思考股票选择的新。

AI圈最新深度学习量化算法！_大数据_03

2. 问题2

将股票价格的波动认为是相互独立的，或者利用一个过度简化的股票市场模型，用一个由单个股票之间的成对关系组成的图，但实际上，这与真实的市场函数相反。

股票是相互关联的，在股票之间复杂的高阶关系中存在着丰富的信号；
可用的公司信息可用于识别可能影响其他股票价格的股票之间的联系，例如具有相同CEO或属于相同行业的股票。

如下图所示：最近的C2019冠状病毒疾病爆发，我们观察到，属于旅行和运输等行业的公司股价下跌，而与医疗保健相关股票的股价上涨相反。

AI圈最新深度学习量化算法！_python_04

我们将股票预测表述为一个LTR问题，我们的模型直接针对盈利股票的排名进行优化。基于领域知识，我们将股票之间的高阶相互依存关系建模为使用三种不同类型的股票关系构建的超图。

STHAN-SR：: Spatio Temporal Hypergraph Attention Network，STHAN-SR在利润：回报率、风险调整方面均显著优于最新方法。

AI圈最新深度学习量化算法！_python_05

股票走势预测通常表述为回归和分类问题。传统金融模型侧重于技术分析，只依赖数字特征。

基于有效市场假说的较新模型被归类为基本面分析，并考虑了金融新闻、社交媒体等数字因素以外的股票影响因素。尽管这些模型取得了成功，这些方法的一个局限性是，它们假设股票运动彼此独立，这妨碍了它们学习相关股票研究潜在模式的能力。第二个主要限制是，以前的工作没有直接优化利润最大化，因为它们没有明确选择预期收入最高的顶级股票.

AI圈最新深度学习量化算法！_机器学习_06

一项新的围绕使用基于图形的方法来表示股票之间的成对关系展开，使用元数据，例如：

股票行业数据和公司CEO之间的链接（Sawhney et al.2020a）；
（Kim et al.2019）提出了一种基于注意的图形神经网络用于股票运动预测。

他们表明，并非所有股票都具有同等的相关性，而且通常将大量成对股票关系分解会增加股票图中的噪声，从而降低预测性能。类似地，（Feng等人，2019b）用时间卷积扩充图卷积网络（GCN），并证明用股票间关系扩充时间股价演化方法的实用性。尽管在基于图形的股票运动预测方面取得了这些进步，但现有模型的一个简化之处是，它们假设股票以成对方式相关。以这种方式对本质上更好地表示为超图的股票数据进行分解会导致重要的高阶关系信息丢失。

AI圈最新深度学习量化算法！_算法_07

超图学习由于能够从高阶关系中提取模式（Feng等人，2019c）。最近的工作（Zhang、Zou和Ma 2019）表明，由于信息丢失，将高阶关系分解为一组成对关系的传统方法表现不佳，而最近的方法，如深度超网络嵌入（Tu等人，2018）仅限于固定长度的超边，导致泛化性差。

AI圈最新深度学习量化算法！_算法_08

AI圈最新深度学习量化算法！_机器学习_09

我们将股票预测定义为一个LTR的问题，另：

AI圈最新深度学习量化算法！_python_10

这样对于每一天，我们都有一个排序的列表，排序越高的股票在第天对应的收益率就会越高，我们的目标是希望在每天对应的每个股票的排序预测的愈加准确。

AI圈最新深度学习量化算法！_算法_11

AI圈最新深度学习量化算法！_机器学习_12

1. 股票价格时间演变

历史股价已被证明是未来股票趋势的有力指标（Jeanblanc、Yor和Chesney，2009年），并在金融文献中广泛使用（Li等人，2020年；Kim等人，2019年）。我们使用前T个交易日的历史价格信息作为STHAN-SR的输入特征。

我们计算每只股票的五个时间特征、1天收益率、5、10、20和30天移动平均数，它们代表每日、每周和每月的趋势。

AI圈最新深度学习量化算法！_python_13

2. 时间Attention

AI圈最新深度学习量化算法！_大数据_14

3. Hawkes Attention

Hawkes过程是一个时间点计数过程，它模拟了一段时间内事件到达的序列。每一个事件都“激发”了这一过程，因为随后到达的机会会增加一段时间。

在股票市场中，诸如盈利通知单的发布、危机情况等事件会影响未来价格，并且这种影响会随着时间的推移而衰减。

AI圈最新深度学习量化算法！_人工智能_15

4. 空间股票超图特征抽取

股票超图构建

AI圈最新深度学习量化算法！_算法_16

5. 超图卷积

AI圈最新深度学习量化算法！_大数据_17

6. 超图Attention

7. LTR和网络优化

AI圈最新深度学习量化算法！_python_18

AI圈最新深度学习量化算法！_算法_19

AI圈最新深度学习量化算法！_人工智能_20

本篇文章我们将股票预测转化为一种学习，通过基于领域知识的超图对问题进行排序和建模。我们提出了STHAN-SR，一种用于股票预测的神经超图模型。我们提出了时间霍克斯注意，并用空间超图卷积和注意来补充它，以捕获股票市场中的时空依赖性。STHAN-SR在六年内的三个全球市场的利润显著优于最先进的方法。通过烧蚀和定性实验，我们探讨了STHAN-SR的有效性，并阐述了其在算法交易中的实际适用性。我们提出的模型可以推广到跨不同领域问题的超图时空学习，如流量预测和基于会话的推荐系统。在未来，我们的目标是探索时间演化超图，以捕捉动态市场相关性，并纳入在线新闻和社交媒体等其他数据源。