オックスフォードマン·クオンティタティブ·ファイナンス研究所の研究者はGraphcoreのIntelligence Processing Unit (知能処理装置、IPU) を使用し、通常他の種類のプロセッサで実行すると計算する中でボトルネックになる可能性がある技法を用い、高度な価格予測モデルのトレーニングを劇的に加速させました。
OMIチームは、IPUのAI向けに設計されたアーキテクチャで、多時間区画予測モデルのトレーニング時間を短縮して、市場価格の動きをより正確に推定し、商業的な優位性をもたらすことができました。このようなモデルは、高速取引のためのアルファ版の開発や値付け戦略で使うことができます。
LOBの秘密
金融市場のBID (買値) / ASK (売値) レベルの記録である指値注文帳 (LOB) は、数百万件の売買注文内にエンコードされたトレーダー心理のリアルタイムビューです。LOBの分析は、価格の動きを予測するのに役立ち、市場参加者にとって大きな価値があります。ですが、こういった洞察は、どちらかと言えば、取引を実行する最適なタイミングを知るものであり、ホットな銘柄を選ぶものではではありません。
人工知能には、手動の分析や従来の演算よりもはるかに複雑かつ正確にLOB上のデータを調査する機能があります。
通常、この領域でAIを応用する取り組みは、特定のBID/ASKセットと、事前定義された将来の瞬間(または時間区画)の市場価格結果の関係を確立しようとする単一時間区画予測に焦点を合わせるものです。
多時間区画予測は、その名の通り、一連の間隔で価格の動きを分析し、各時間区画の結果が次の時間区画に伝わります。累積すれば、はるかに長い期間の予測生成に使用できます。
[多時間区画予測]
ですが、多時間区画予測モデルの有用性は、CPUとGPUのトレーニングの遅さによって妨げられていることが多いです。
OMIの研究者Zihao Zhang博士とStefan Zohren博士は、IPUのアーキテクチャが多時間区画予測で使用される回帰型ニューラルレイヤーにはるかに近い形でマッピングすることを活用し、ボトルネックを回避しました。
そのソリューションで、結果的に、多時間区画モデルをそれまでの技法よりはるかに高速に、高精度に、トレーニングできました。
「興味深いさまざまな最先端ネットワークでベンチマークしました。IPUが一般的なGPUの少なくとも数倍高速であることがわかっています。具体的には、10倍以上だと思います。」とZhang博士は話します。
OMIの最新研究を商業的に応用可能かを、Man Groupの多様なクオンツ投資エンジンであるMan AHLが調べています。
Man AHLのチーフサイエンティストAnthony Ledford博士はこう話します。「IPUがその種の演算をはるかに速い時間で実現できるとわかれば、利用できるようにしてほしいと求められるようになるはずです。」
回帰型の課題
単一時間区画予測は、通常、指値注文帳の売買価格とある時点の結果としての市場価格の関係を確立するために、標準の教師あり学習問題として用いられます。ですが、市場価格に影響を与える要因が多いこと、ノイズに対する有用な信号の比率が比較的低いことから、単一時間区画から長期的予測パスを推測するのは困難です。
多時間区画予測を達成する1つの技法として、エンコーダとデコーダを含む複雑な回帰型ニューラルレイヤーに基づく、Seq2SeqモデルとAttentionモデルを使用した自然言語処理 (NLP) の一般的なアプローチを採用しています。Seq2Seqエンコーダは過去の時系列情報を要約し、デコーダは隠れた状態を将来の既知の入力と組み合わせて予測を生成します。Attentionモデルは長いシーケンスの処理を妨げるSeq2Seqモデルの制限への対処に役立ちます。
[注意機構]
ですが、このようなモデルの回帰型構造は、GPUなどのプロセッサアーキテクチャでの並列処理には役立ちません。最新の電子取引所がLOBデータを生成する速度が速いことを考えると、これは特に問題になります。
注意の再考
完全に接続されたレイヤーでのTransformersの使用を含み、この演算問題に対するソリューションがいくつかあります。
ですが、OMIチームが感じたのは、Seq2SeqとAttentionの組み合わせの回帰型構造が、多時間区画予測の時系列の性質とうまく一致し、過去の情報の要約と次のタイムスタンプへの伝播を可能にするということです。
この取り組みを実用的にするには、高パフォーマンスのコンピュートプラットフォームが必要だったため、IPUの根本的に異なるアーキテクチャを活用して、Graphcoreの技術を用いてテストを始めました。
LOBデータは、同じOMIチームチームが以前開発した1つのDeepLOBを含む、IPUの多数のモデルのトレーニングに使用されました (Zhang et al, 2019)。多時間区画予測の点で、研究者は、DeepLOB-Seq2SeqおよびDeepLOB-Attentionという名前の2つのDeepLOBのバリエーションをテストしました。DeepLOB-Seq2SeqはSeq2Seqモデルを、DeepLOB-AttentionはAttentionモデルを、デコーダとして使用します。
[モデルアーキテクチャ:エンコーダ/デコーダ構造のDeepLOB]
優れたトレーニング
トレーニング時間の点において、DeepLOB-Seq2SeqやDeepLOB-Attentionを含むさまざまなモデルで、Graphcore IPUシステムはGPUの競合品よりも優れていました。
新しいモデルは、K=10などの短時間区画と、K=50、K=100などの最長時間区画のどちらでも、優れた予測精度でした。この場合、Kは「チクタク時間」という取引所でメッセージが受信されるイベントタイムです。これは自然な時間で、流動性の高い株では速く、流動性の低い株では遅くなります。特に、多時間区画モデルDeepLOB-Seq2SeqおよびDeepLOB-Attentionは、広い時間区画での予測で使用した場合に、最高レベルの精度と正確さを達成しました。
モデルタイプと多時間区画パフォーマンスの完全な表は、OMI文書にあります。
予測の次のステップ
Zhang博士とZohren博士は、そのGraphcore IPUを使用した研究で示された原理が、値付け業務でのオンライン学習や強化学習の応用を含む、さまざまな応用につながると信じています。
エンコーダ·デコーダ構造を強化学習フレームワークに応用する可能性もあります。2人の以前の研究文書で考察されている通りです。
「強化学習アルゴリズムは、最適な実行または値付け業務に適用するため多時間区画予測を応用する際に、優れたフレームワークになります。このようなアルゴリズムの演算の複雑さを考えると、IPUを使用した高速化はこの環境でもっと大きくなるかもしれません。」とZohren博士。
現在の2人の研究文書は、ArXivで公開されており、Githubでコードを見ることができます。