クオンツ構築(やり直し編)
🔄 再スタート:戦略をNTスプレッド型に変更
前回までの検証では、2因子モデルによるスコアはICでは一定の傾向が見られたものの、実際の予測精度(AccuracyやAUC)はほぼランダムレベルでした。
そのため今回は、戦略自体を見直し、NTスプレッド(=日経225 − TOPIXの価格差)をターゲットとした戦略に切り替えました。
この戦略では、「スプレッドが縮小するかどうか(リバージョン)」を予測することが目的となるため、逆張り的な動きを捉えることが重要です。
🧪 特徴量の再抽出とICテストの実施
スプレッド差分やZスコア、RSIなどを中心に、合計50種類以上の特徴量を再設計し、IC(Information Coefficient)テストを実施しました。
ICとは「特徴量とターゲットの相関関係」を表す指標で、+0.1以上で有効性あり、−0.1以下なら逆張り効果が期待できると判断されます。
ところが今回、上位特徴量のICスコアはおおむね±0.02前後にとどまり、単体では有効性がやや弱い印象です:
特徴量 | IC |
---|---|
終値のRSIの20日SLOPEのZスコア | +0.022 |
終値のRSIのZスコア変化量 | +0.018 |
日経225のRSI変化のZスコア | +0.009 |
🔁 リバージョン戦略では“逆相関”がむしろ武器になる
今回の戦略は「スプレッドの縮小=戻り」を予測する逆張り型戦略です。
このようなケースでは、ICがマイナス(逆相関)の特徴量がむしろ有効なシグナルになります。
たとえば:
特徴量 | IC | 解釈 |
---|---|---|
スプレッド終値の5日Zスコア | −0.136 | 拡大しすぎたスプレッドの戻りを示唆 |
終値リターン1日分のZスコア | −0.118 | 前日の逆張りシグナル |
日経225終値の5日Zスコア | −0.136 | 過熱した日経225の反動を示唆 |
つまり、通常であれば排除されるような逆相関ファクターが、逆張り戦略では有効なトリガーになります。
✅ モデル構築と評価結果
ICスコアの上位(正相関と逆相関両方)から20種類の特徴量を使用し、再度XGBoostモデルを構築・評価しました:
指標 | 結果 | 評価 |
---|---|---|
Accuracy(正解率) | 0.533 | ⚪ ランダム(0.5)より上 |
AUC(判別性能) | 0.547 | ⚪ 有意水準に近い(>0.55で◎) |
Precision(陽性適合率) | 0.49 | △ 誤検知あり(false positive) |
Entry件数(p>0.7) | 75件 | ⚪ 実運用レベル |
Entry平均確率 | 0.775 | ◎ 高精度ゾーンを学習できている |
結果として、全体的に精度・実運用可能性の両面で改善が見られました。
🔍 特徴量重要度の可視化と今後の展望
XGBoostモデルにおける特徴量重要度(Feature Importance)を可視化した結果、以下のファクターが特に効果的でした:
- スプレッド終値の5日Zスコア
- 終値リターン1日分のZスコア
- 日経225終値の5日Zスコア
これらを軸に、バックテストを進める予定です。
📝 まとめ
- 今回は「スプレッドの縮小=逆張り型戦略」に転換
- ICスコアが小さい中でも、逆相関ファクターは強い武器
- 精度・AUCともに改善、エントリーゾーンの信頼性も上昇