【特徴量の作り方と考え方 】その7:相関・統計系特徴量

クオンツ構築

特徴量の中でも「相関」や「分散」「均値」など、統計的な視点から計算されるものは「統計系特徴量」と呼ばれます。 これらは最も基礎的でありながら、計算のしやすさや観察範囲の5W1H的解析によって、高度な導出も可能にする重要なカテゴリーです。


⭐ 相関系特徴量

複数の指標や値勢が「同じ方向に動くかどうか」を数値化したもので、特に混合するリスクの評価や、ペアトレードの基本挙動の理解にも使われます。

▶ 内部相関スコア

  • 自分の特徴量同士の相関を計算
  • 例:20日間の “RSI” と “MACD” の相関係数(ピアソン相関)
  • 高い場合:ダブルカウントを避けるための特徴量削減に活用

▶ 外部相関

  • 他の働向との相関(例:USDJPY と N225 の進捗関連)
  • ペアトレード成立における「共同構造の価頼性」を調べるために重要

▶ 相関係数の注意点

  • 当然ながら、未来の相関を保証するものではない
  • 範囲をずらすと相関関係が変わる場合もある
  • のちの星分析のような一過性に気をつける

⭐ 統計基礎特徴量

第1価分や分散は、値勢や行動の計算の基礎です。

▶ 平均値、最大値、最小値

  • 転挙点、目次分析、もみ合い範囲などをみる

▶ 分散(標準偏差)

  • 常に不安定な値勢か、悪意のあるノイズかを分別
  • 相対的に高い分散を持つ範囲では、ブレークアウトやボラブレークの先行指標に

▶ 正規化系統計特徴量

  • Zスコア:特徴量を常に方向性と規模で統一する
  • 推移平均と精度を解析する EMA差分 など

⭐ 実際の活用例

  • 特徴量同士の相関を計算して、ICを指標に統計的信頼性を測定
  • 分散を利用したボラ・ボラ指標や、怪しさスコア(スクリータースコア)の計算
  • 外部の指標との相関を追加することで、現状分析をプラスする

⭐ まとめ

相関・統計系特徴量は、パッと見てダイレクトに使うと一過性になりがちですが、時系列解析の迷宫を抜ける「地図」のような存在です。 「その特徴量は他とどれほど関係しているか」「どれくらいのノイズ度か」を数値化することは、すべての特徴量分析の出発点となります。

次回は「フィルター型特徴量」の構築について解説します。

タイトルとURLをコピーしました