特徴量の中でも「相関」や「分散」「均値」など、統計的な視点から計算されるものは「統計系特徴量」と呼ばれます。 これらは最も基礎的でありながら、計算のしやすさや観察範囲の5W1H的解析によって、高度な導出も可能にする重要なカテゴリーです。
⭐ 相関系特徴量
複数の指標や値勢が「同じ方向に動くかどうか」を数値化したもので、特に混合するリスクの評価や、ペアトレードの基本挙動の理解にも使われます。
▶ 内部相関スコア
- 自分の特徴量同士の相関を計算
- 例:20日間の “RSI” と “MACD” の相関係数(ピアソン相関)
- 高い場合:ダブルカウントを避けるための特徴量削減に活用
▶ 外部相関
- 他の働向との相関(例:USDJPY と N225 の進捗関連)
- ペアトレード成立における「共同構造の価頼性」を調べるために重要
▶ 相関係数の注意点
- 当然ながら、未来の相関を保証するものではない
- 範囲をずらすと相関関係が変わる場合もある
- のちの星分析のような一過性に気をつける
⭐ 統計基礎特徴量
第1価分や分散は、値勢や行動の計算の基礎です。
▶ 平均値、最大値、最小値
- 転挙点、目次分析、もみ合い範囲などをみる
▶ 分散(標準偏差)
- 常に不安定な値勢か、悪意のあるノイズかを分別
- 相対的に高い分散を持つ範囲では、ブレークアウトやボラブレークの先行指標に
▶ 正規化系統計特徴量
- Zスコア:特徴量を常に方向性と規模で統一する
- 推移平均と精度を解析する EMA差分 など
⭐ 実際の活用例
- 特徴量同士の相関を計算して、ICを指標に統計的信頼性を測定
- 分散を利用したボラ・ボラ指標や、怪しさスコア(スクリータースコア)の計算
- 外部の指標との相関を追加することで、現状分析をプラスする
⭐ まとめ
相関・統計系特徴量は、パッと見てダイレクトに使うと一過性になりがちですが、時系列解析の迷宫を抜ける「地図」のような存在です。 「その特徴量は他とどれほど関係しているか」「どれくらいのノイズ度か」を数値化することは、すべての特徴量分析の出発点となります。
次回は「フィルター型特徴量」の構築について解説します。