arxiv.org

在量化金融领域,使用图像处理方法来分析时间序列是一个具有挑战性的方向,但其背后的原理与模型设计可以解释为什么在某些情况下图像比文本更适合处理时间序列数据。

根据论文中的讨论,研究者提出了将时间序列转化为图像的概念,具体通过将时间序列表示为Gramian Angular Summa­tion/Difference Fields (GASF/GADF) 和 Markov Transition Fields (MTF)。通过这种方式,时间序列数据能够被转换成类似图像的表示,使得可以使用计算机视觉中常用的卷积神经网络(CNN)来处理。

论文展示的实验结果表明,使用这些图像表示方法可以有效地提升时间序列的分类和插补效果,尤其是在使用深度学习模型(如Tiled CNN)时,这些方法在多个标准数据集上表现出了与传统时间序列方法竞争的优异性能。

为什么图像优于文本?

  1. 结构化信息的保留: 时间序列数据在转化为图像时,诸如时间间隔、相对变化等信息通过图像中的空间分布得到了保留。例如,GASF通过极坐标系编码时间序列数据,使得时间的变化被自然映射到图像中的空间关系上。
  2. 卷积神经网络的优势: 卷积神经网络(CNN)能够通过局部感知和权重共享的机制,从图像中自动提取多层次的特征。而这种结构对于时间序列数据,尤其是存在复杂模式的时间序列,能够有效捕捉动态的时序特征。
  3. 比对与逆转映射: GASF等方法利用极坐标变换的双射特性,在一定范围内能够精确地从图像恢复原始时间序列,这种结构有助于更精确地学习和预测时间序列中的潜在模式。

因此,虽然时间序列的直觉理解可能让人觉得文本或原始数值更适合处理,但当将这些序列转化为图像后,使用计算机视觉中的先进技术(如CNN)能更有效地提取出时间序列中的模式,尤其是在涉及复杂时间依赖关系时,图像提供的空间结构能够增强模型的学习能力。